Die menschliche Gesundheit und die Vielfalt des Lebens hängen von der großen Vielfalt der Proteinstrukturen und -funktionen ab 1. Die erste Proteinstruktur, die mittels Röntgenbeugung bestimmt wurde, war Myoglobin. Dies wurde 1958 von John Kendrew berichtet. Dies führte zu einem viel besseren Verständnis darüber, wie die Proteinstruktur die Funktion beeinflusst, und 1962 zum Nobelpreis für Chemie. Es war offensichtlich, dass die Aminosäuresequenz eines Proteins die Funktion des Proteins beeinflusste. In den folgenden Jahrzehnten wurden nur wenige Proteinstrukturen beschrieben – und diese waren große Neuigkeiten. Einige zukunftsorientierte Wissenschaftler sagten voraus, dass es eines Tages möglich sein würde, die Struktur und Funktion eines Proteins anhand der Aminosäuresequenz vorherzusagen.
Da jedes Jahr nur etwa zehn Proteinstrukturen entschlüsselt werden, würde es Jahrhunderte dauern, die Struktur von über 200 Millionen Proteinen mit Röntgenbeugung und anderen Methoden zu bestimmen. Deshalb entwickelten David Baker, Demis Hassabis und John Jumper vom Howard Hughes Medical Institute und Google DeepMind ein KI-Tool namens AlphaFold2. Es kann die Strukturen fast aller 200 Millionen identifizierten Proteine vorhersagen. Außerdem kann es die Funktionen von Proteinen und Enzymen vorhersagen, die durch von Forschern entworfene Aminosäuresequenzen produziert würden. AlphaFold2 wurde bereits von mehr als zwei Millionen Menschen aus 190 Ländern genutzt.
Die dreidimensionale Struktur der Oberfläche eines Proteins beeinflusst dessen Funktion und Anfälligkeit für Veränderungen, wenn ein verschreibungspflichtiges Medikament oder ein Naturprodukt daran bindet. Daher haben Chemiker der ETH Zürich eine Computerverfahren auf Basis generativer künstlicher Intelligenz (KI) entwickelt, die dabei hilft2. Es kann zur Entwicklung neuer Medikamente verwendet werden. Das De-novo-Medikamentendesign zielt darauf ab, Moleküle mit spezifischen chemischen und pharmakologischen Eigenschaften herzustellen. Der Algorithmus nutzt interaktom-basiertes Deep Learning für die ligand- und strukturbasierte Generierung von medikamentenähnlichen Molekülen. Diese Methode nutzt die einzigartigen Stärken sowohl von graphischen neuronalen Netzen als auch von chemischen Sprachmodellen3.
Eine neue Computeranwendung ermöglicht die Entwicklung neuer Medikamente auf der Grundlage ihrer dreidimensionalen Struktur und derjenigen des therapeutischen Zielproteins.
Chemische Sprachmodelle (CSM) sind Techniken des maschinellen Lernens, die dazu dienen, Molekülstrukturen, die als Sequenzen (z. B. im Simplified Molecular Input Line Entry System oder SMILES) dargestellt werden, zu verarbeiten und daraus zu lernen. CSM kann neue bioaktive Moleküle entwerfen. Transferlernen, auch als Feinabstimmung bekannt, ist eine der häufigsten Anwendungen von CSM im Bereich des Moleküldesigns. Es handelt sich um einen zweistufigen Prozess. Im ersten Schritt wird das CSM anhand eines großen Datensatzes bioaktiver Moleküle vortrainiert.
Diese Anfangsphase konzentriert sich darauf, ein besseres Verständnis der physikalisch-chemischen Gesetze zu entwickeln, die die Bindung und biologische Aktivität bestimmen. Im zweiten Schritt wird das vortrainierte CSM anhand eines kleineren Datensatzes feinabgestimmt, der Moleküle enthält, die speziell das gewünschte Aktivitäts- und Eigenschaftsprofil aufweisen. Dieser Prozess verfeinert die Fähigkeit des CSM, Moleküle mit den gewünschten Eigenschaften zu generieren. Nach dem Training kann es virtuelle Molekülbibliotheken erstellen, die auf die jeweilige Aufgabe zugeschnitten sind.
Jüngste Fortschritte konzentrieren sich auf die Untersuchung molekularer Interaktionsnetzwerke, die als Interaktome bezeichnet werden. Dazu gehören Protein-Protein-Interaktionen, Wechselwirkungen zwischen Wirkstoffen und Wirkstoffen sowie Wechselwirkungen zwischen Wirkstoffen. Die Analyse dieser Interaktome ermöglicht die Vorhersage bisher unbekannter Interaktionen. Dies liefert auch Einblicke in die Topologie des Netzwerks. Es ist wichtig, molekulare Interaktionsnetzwerke mithilfe der Systemwissenschaft zu untersuchen. Ein Netzwerk ist eine ganzheitliche Einheit, die die Analyse langfristiger Beziehungen zwischen verschiedenen Knoten fördert, die durch mehrere Kanten miteinander verbunden sind. Dieser Ansatz ermöglicht eine umfassende Untersuchung der Vernetzung und Abhängigkeiten zwischen den vielen Knoten oder Komponenten im Netzwerk.
Die Wechselwirkungen zwischen Wirkstoffen und Zielmolekülen können mithilfe eines Ansatzes untersucht werden, der ein CSM mit interaktom-basiertem Deep Learning kombiniert. Dieser Ansatz umfasst eine neuronale Netzwerkarchitektur, die aus einem Graph-Transformer-Neuralnetzwerk oder Graph Transformer Neural Network (GTNN) und einem CSM mit Langzeit-Kurzzeitgedächtnis oder Long Short-Term Memory (LSTM) besteht. Das aus diesem Ansatz resultierende Deep-Learning-Modell wird als DRAGONFLY (Drug-target interActome-based GeneratiON oF noveL biologically active molecules oder Generierung neuartiger biologisch aktiver Moleküle auf Basis des Interaktoms von Wirkstoff-Zielmolekülen) bezeichnet. Im Gegensatz zu herkömmlichen CSM, die auf Transferlernen mit einzelnen Molekülen basieren, nutzt diese Methode interaktom-basiertes Deep Learning, wodurch Informationen sowohl von Targets als auch von Liganden über mehrere Knoten hinweg integriert werden können.
DRAGONFLY kann sowohl kleine Molekül-Liganden-Vorlagen als auch dreidimensionale Proteinbindungsstellen verarbeiten. Es arbeitet mit verschiedenen chemischen Alphabeten und erfordert keine Feinabstimmung. Außerdem kann es gewünschte physikalische und chemische Eigenschaften in die Generierung von Ausgabemolekülen einbeziehen. Diese Studie stellt die potenzielle Anwendung von DRAGONFLY für das strukturbasierte De-novo-Design vor. Dies geschah, um Liganden mit gewünschten Bioaktivitätsprofilen zu generieren, die für ein oder mehrere makromolekulare Ziele wichtig sind.
Generative KI kann von Grund auf neue bioaktive Moleküle entwickeln, die an bekannte Bindungsstellen auf der Oberfläche eines Proteins binden sollen. Dieser Prozess stellt auch sicher, dass die Moleküle leicht synthetisiert werden können. Darüber hinaus schlägt der Algorithmus nur Moleküle vor, die mit dem angegebenen Protein an der gewünschten Stelle interagieren und nicht mit anderen Proteinen, die unerwünschte Nebenwirkungen verursachen könnten. Die Softwareingenieure trainierten ein KI-Modell mit Daten über Hunderttausende bekannter Wechselwirkungen zwischen chemischen Molekülen und den entsprechenden dreidimensionalen Proteinstrukturen.
Forscher des Pharmaunternehmens Roche und andere Partner arbeiteten mit dem ETH-Team zusammen, um es zu testen und zu sehen, wozu es in der Lage ist. Sie suchten nach Molekülen, die mit Proteinen der PPAR-Klasse (Peroxisome proliferator-activated receptors) interagieren – Proteinen, die den Zucker- und Fettsäurestoffwechsel im Körper regulieren. Mehrere heute verwendete Diabetes-Medikamente erhöhen die Aktivität von PPARs, wodurch die Zellen mehr Zucker aus dem Blut aufnehmen und der Blutzuckerspiegel sinkt. Generative KI entwarf neue Moleküle, die ebenfalls die Aktivität von PPARs erhöhen. Nachdem die ETH-Forscher diese Moleküle im Labor hergestellt hatten, testeten Kollegen bei Roche ihre biologischen Aktivitäten. Die neuen Substanzen sind stabil und ungiftig.
Künstliche Intelligenz (KI) trägt zur Verbesserung der öffentlichen Gesundheit bei. Sie kann dabei helfen, die Anfälligkeit einer Person für Krankheiten vorherzusagen und Wege zu ihrer Prävention aufzuzeigen. Dennoch treten Krankheiten auf. KI hilft dabei, personalisierte Therapien anzubieten und den Fortschritt des Patienten kontinuierlich zu überwachen. Die ETH Zürich arbeitet mit der EPFL zusammen, um die Swiss AI Initiative ins Leben zu rufen. Das Ziel ist es, die Schweiz zu einem führenden Standort für KI zu machen. Die ETH veröffentlicht Beispiele für relevante Projekte auf ihrer Website.
Anmerkungen
1 The Nobel Prize, Press Release. The Royal Swedish Academy of Sciences. The Nobel Prize in Chemistry 2024.
2 Bergamin, Fabio. ETH Zürich. KI entwirft neue Medikamente anhand von Proteinstrukturen, 2024.
3 Atz K, et al. Prospective de novo drug design with deep interactome learning. Nature Communications, 22. April 2024.















