Künstliche Intelligenz (KI) und maschinelles Lernen (ML) sind „Gamechanger“ in der biotechnologischen Arzneimittelentwicklung. Der neue Ansatz der generativen Biologie revolutioniert den Prozess der Entdeckung und Entwicklung von Proteinwirkstoffen, indem er künstliche Intelligenz und maschinelles Lernen mit automatisierten Hochdurchsatzverfahren im Labor vereint. Dadurch hat die generative Biologie das Potenzial, in Zukunft eine erfolgreichere Entwicklung von Arzneimitteln in deutlich kürzerer Zeit zu ermöglichen. Amgens Forschungszentren weltweit setzen bereits auf die Methoden der generativen Biologie und die Bilanz ist bahnbrechend: Amgen benötigt heute 60 Prozent weniger Zeit für die Entwicklung eines Proteinarzneimittelkandidaten bis zur klinischen Prüfung als noch vor fünf Jahren. Ein bedeutender Schritt, um in Zukunft noch mehr Patient:innen mit dringend notwendigen Arzneimitteln zu versorgen.
Arzneimittelentwicklung: Nur ein Kandidat von 5.000 bis 10.000 erfüllt die Zulassungskriterien.
Die Entwicklung von Arzneimitteln bis zur Marktzulassung erstreckt sich über einen Zeitraum von 12 bis 15 Jahren und umfasst mehrere Phasen [1]. In der ersten Phase identifizieren und entwickeln Forscher:innen potenzielle Wirkstoffmoleküle. Bei erfolgreicher Entwicklung durchläuft der Wirkstoffkandidat mehrere Testphasen, in denen seine Wirkung an Tieren sowie an gesunden und kranken Menschen erprobt wird. Nach Abschluss dieser Phasen kann eine Marktzulassung beantragt werden, sofern das Arzneimittel in den Testphasen eine eindeutig positive Wirkung gezeigt hat und geringe Risiken aufweist. Doch nur sehr wenige Testmedikamente überwinden alle Hürden auf diesem Weg: Im Schnitt erfüllt lediglich einer von 5.000 bis 10.000 erforschten Wirkstoffkandidaten die Kriterien für die Zulassung als neues Arzneimittel [2].
Proteinmoleküle: Wirksamkeit durch Schlüssel-Schloss-Prinzip
Proteine und Antikörperkonstrukte bilden einen beträchtlichen Anteil der zugelassenen Biopharmazeutika [3]. Ihr Gerüst setzt sich aus einzelnen Bausteinen zusammen, den Aminosäuren. Die Art und Weise, wie sich die Aminosäureketten zusammenfalten, bestimmt die einzigartige dreidimensionale Struktur, Größe und Funktion des Proteins. Dieser Vorgang wird als Proteinfaltung bezeichnet [4]. Die Wirksamkeit von Proteinarzneimitteln beruht darauf, dass sie an eine komplementäre Zielstruktur binden können. Wie ein Schlüssel im passenden Schloss interagiert es mit der Zielstruktur und kann molekulare Prozesse im Körper sowohl aktivieren als auch blockieren [5].
Wichtiger Meilenstein: Durch KI ist Vorhersage der 3D-Struktur des Proteins möglich.
Im November 2020 erreichten Forschende einen bedeutsamen Durchbruch, der neue Impulse für die konventionelle Arzneimittelentwicklung lieferte: Mittels des Computerprogramms AlphaFold konnte aus der linearen Aminosäuresequenz die dreidimensionale Proteinfaltung vorhergesagt werden – das „Proteinfaltungsproblem“ war nach über 50 Jahren gelöst worden [6, 7, 8]. Lange war es nicht möglich vorherzusagen, wie sich die Aminosäureketten zusammenfalten und die Struktur eines Proteins konnte lediglich mithilfe von Experimenten bestimmt werden. Die Entschlüsselung der Proteinfaltung aus ihrer Aminosäuresequenz stellt in der Medikamentenforschung einen lang ersehnten Meilenstein dar, da die 3D-Struktur des Proteins die Voraussetzung schafft, dass es an der Zielstruktur bindet (Schlüssel-Schloss-Prinzip) und mit dieser interagiert. Mittlerweile gibt es ähnliche Tools wie AlphaFold. Ein Beispiel ist das Modell RoseTTAFold, das vom Institute of Protein Design (IPD) der University of Washington, Seattle, WA, entwickelt wurde. Amgen arbeitet eng mit dem IPD zusammen, um mehr über ML- und KI-gestützte Arzneimittelentwicklung zu lernen [8, 9].
Entwicklung von Proteinwirkstoffen: gestern und heute
Die Anfangsphase der Arzneimittelentwicklung beinhaltet die Entdeckung potenzieller Proteinwirkstoffe und deren biotechnologische Entwicklung. Gewöhnlich wird dabei wie folgt vorgegangen:
- Biotechnolog:innen screenen tausende natürliche Proteine nach einem passenden Wirkstoffkandidaten für ein bestimmtes Targetmolekül [8, 10].
- Nach der Identifizierung eines geeigneten Proteins erfolgt die gentechnische Modifikation des Proteins, um physikalische und chemische Eigenschaften zu optimieren. Beispielsweise wie zähflüssig das Protein ist, wie stabil es bei Raumtemperatur ist oder wo es im Körper vorkommt. Dieses Vorgehen wird als Protein-Engineering bezeichnet [8, 10, 11].
- Im Anschluss werden die modifizierten Proteinkandidaten auf Wirksamkeit, Sicherheit und Effizienz getestet [10].
- Der vollständige Ablauf dieses Prozesses beansprucht im Durchschnitt 24 Monate. Lediglich etwa die Hälfte der Wirkstoffkandidaten erfüllt die Voraussetzungen für den Übergang in die klinische Phase [10].
Es wird deutlich, dass die herkömmliche Suche eines potenziellen Proteinarzneimittels der Suche nach der Nadel im Heuhaufen gleicht. Und auch das anschließende Protein-Engineering ist zeit- und ressourcenintensiv. Womöglich wird viele Monate an einem potenziellen Proteintherapeutikum geforscht, bis sich schließlich herausstellt, dass es als Arzneimittel ungeeignet ist [8].
ML- und KI-basierte Computermodelle und automatisierte Hochdurchsatzverfahren im Labor bringen neuen Schwung in die Entdeckung und Entwicklung von Proteinarzneimitteln. Die neuen Technologien ermöglichen nicht nur eine Beschleunigung der Verfahren, sondern auch eine Steigerung der Erfolgsaussichten der einzelnen Wirkstoffkandidaten.
Der neue Ansatz: generative Biologie
Fast jeder von uns kennt das KI-Modell ChatGPT, das auf Grundlage von Datenpools die Generierung neuer Daten wie Texte und Bilder ermöglicht. Generative Computermodelle können mithilfe von ML und KI neue Daten generieren. Doch anstelle von Textmengen wie bei Programmen wie ChatGPT werden die generativen Computermodelle in der Arzneimittelentwicklung mit Aminosäuresequenzdaten und Daten über Proteinstrukturen und -funktionen trainiert [11]. Mittels der über Jahre gesammelten Informationen können damit molekulare Targets identifiziert werden, Eigenschaften über Wirksamkeit, Sicherheit und Effizienz der Wirkstoffe vorhergesagt werden oder Proteintherapeutika mit geeigneten Strukturen und Eigenschaften neu generiert werden [10, 11]. Die generative Biologie kombiniert generative Computermodelle mit automatisierten Hochdurchsatzverfahren im Labor:
- Potenzielle Proteinarzneimittel werden mithilfe von Computermodellen entworfen und im Anschluss produziert [11].
- Im nächsten Schritt werden diese Proteinkandidaten mithilfe automatisierter Hochdurchsatzverfahren getestet. Diese Methode ermöglicht die Identifikation geeigneter Kandidatenproteine, wobei mehr als 90 Prozent der identifizierten Proteine in die klinische Phase überführt werden [11].
- Die im Labor generierten Daten werden erneut in das generative Computermodell eingespeist. Auf diese Weise werden generative Computermodelle ständig mit neuen Daten trainiert, wodurch ihr Algorithmus kontinuierlich verbessert wird – sie „lernen“ [11].
- Von der Ermittlung oder dem Entwurf eines potenziellen Proteins bis zur Identifikation eines möglichen Proteinwirkstoffs vergehen weniger als neun Monate [10].
Der Kreislauf von Entwurf, Herstellung und Testen bis zum Prozess des Lernens wird als Schleife der generativen Biologie bezeichnet [10]. Je mehr Proteindaten übermittelt werden, desto genauer sind die Vorhersagen über Proteinkandidaten. Die generative Biologie ermöglicht es, frühzeitig Eigenschaften von Proteinen zu prognostizieren, die auf ihre Eignung als Therapeutikum hinweisen. Im Vergleich zur herkömmlichen Entwicklung von Proteinarzneimitteln bietet die generative Biologie eine deutlich höhere Erfolgswahrscheinlichkeit und ist zeit- und ressourcensparend [10, 11].
Amgen nutzt neue Technologien
Amgen nutzt die Möglichkeiten der generativen Biologie und setzt KI- und ML-Methoden bei der Arzneimittelentwicklung ein. Bereits heute kann das Biotech-Unternehmen deutliche Fortschritte in der erfolgreicheren und schnelleren Entwicklung verzeichnen. Amgen reduzierte die Entwicklungszeit deutlich und benötigt nun 60 Prozent weniger Zeit für die Entwicklung eines Proteinwirkstoffkandidaten bis zur klinischen Prüfung als noch vor fünf Jahren [10]. Zugleich können die Amgen-Forschungsteams mit den neuen Technologien besser berechnen, wie sich das Proteinmolekül verhält und ob es ein erfolgversprechender Wirkstoffkandidat ist.
„Wir bei Amgen greifen auf große Datenmengen zurück und können so das Potenzial der innovativen Technologien voll nutzen“, sagt Dr. Stefan Kropff. „Aufgrund der großen Datenmengen können die Computermodelle bessere Vorhersagen über Proteinwirkstoffkandidaten treffen.“
Zudem arbeitet Amgen mit Expert:innen von Hochschulen und Instituten eng zusammen und entwickelt die Technologien fort. So hat Amgen zum Beispiel ein ML-Modell entwickelt, um die Viskosität eines Proteins vorherzusagen. Die Viskosität ist eine wichtige Arzneimitteleigenschaft. Wenn ein Proteinmedikament zu viskos ist, ist eine Injektion oftmals schwierig. Auf diese Weise können einige Proteinkandidaten frühzeitig ausgeschlossen werden [11].
Generative Biologie: Gamechanger mit Entwicklungspotenzial
Die generative Biologie verleiht der Entwicklung von Proteinarzneimitteln neuen Schwung. Zeitintensive Experimente werden zunehmend von effizienten KI- und ML-gestützten Methoden abgelöst. Schon heute hat Amgen bei der biotechnologischen Entwicklung eines Proteinwirkstoffkandidaten bis zur klinischen Phase eine massive Zeitersparnis erreicht: Die Forschungsteams benötigen heute 60 Prozent weniger Zeit als noch vor fünf Jahren. Die kontinuierliche Verbesserung von KI könnte den Einfluss der generativen Biologie auf die Entwicklung von Proteintherapeutika weiter steigern. Dieser Fortschritt ist von großer Bedeutung, um künftig mehr Patient:innen schnelleren Zugang zu innovativen Arzneimitteln zu ermöglichen.
Quellen:
[1] https://www.nature.com/articles/d41586-023-03172-6
[2] https://www.vfa.de/de/arzneimittel-forschung/so-funktioniert-pharmaforschung/so-entsteht-ein-medikament.html
[3] Plattform Life Sciences, 3. September 2023, S.22 „Biotechnologie hat die Gesundheitsversorgung transformiert“ von Dr. Simon Moroney
[4] https://wwwext.amgen.com/stories/2019/09/designing-proteins-from-scratch
[5] https://wwwext.amgen.com/stories/2020/10/a-sea-change-in-drug-design
[6] https://www.nature.com/articles/d41586-020-03348-4
[7] https://web-assets.bcg.com/86/e5/19d29e2246c7935e179db8257dd5/unlocking-the-potential-of-ai-in-drug-discovery-vf.pdf
[8] https://wwwext.amgen.com/stories/2022/06/generative-biology--designing-biologics-with-greater-speed-and-success
[9] The Generative Biology Revolution Podcast: The Protein Structure Prediction Problem: https://wwwext.amgen.com/science/podcasts/generative-biology-revolution
[10] https://www.nature.com/articles/d41586-023-02896-9
[11] https://wwwext.amgen.com/stories/2023/10/how-ai-and-life-sciences-research-are-revolutionizing-protein-drug-development