banner
Heim / Nachricht / Makrozyklisierung linearer Moleküle durch Deep Learning, um die Entdeckung makrozyklischer Arzneimittelkandidaten zu erleichtern
Nachricht

Makrozyklisierung linearer Moleküle durch Deep Learning, um die Entdeckung makrozyklischer Arzneimittelkandidaten zu erleichtern

Jul 07, 2023Jul 07, 2023

Nature Communications Band 14, Artikelnummer: 4552 (2023) Diesen Artikel zitieren

2819 Zugriffe

8 Altmetrisch

Details zu den Metriken

Das Interesse an Makrozyklen als potenzielle Therapeutika hat rapide zugenommen. Die Makrocyclisierung bioaktiver azyklischer Moleküle bietet einen potenziellen Weg zur Herstellung neuartiger chemischer Gerüste, die zur Verbesserung der biologischen Aktivität und der physikalisch-chemischen Eigenschaften dieser Moleküle beitragen können. In dieser Studie schlagen wir eine rechnerische Makrocyclisierungsmethode vor, die auf der Transformer-Architektur (die wir Macformer nennen) basiert. Macformer nutzt Deep Learning und erforscht den riesigen chemischen Raum makrozyklischer Analoga eines bestimmten azyklischen Moleküls, indem er verschiedene Linker hinzufügt, die mit dem azyklischen Molekül kompatibel sind. Macformer kann die impliziten Beziehungen zwischen azyklischen und makrozyklischen Strukturen, die als SMILES-Strings dargestellt werden, effizient lernen und zahlreiche Makrozyklen mit chemischer Vielfalt und struktureller Neuheit erzeugen. In Datenerweiterungsszenarien, bei denen sowohl interne ChEMBL- als auch externe ZINC-Testdatensätze verwendet werden, zeigt Macformer eine hervorragende Leistung und Generalisierbarkeit. Wir demonstrieren den Nutzen von Macformer in Kombination mit molekularen Docking-Simulationen und experimenteller Validierung im Nasslabor, indem wir es auf das zukünftige Design makrozyklischer JAK2-Inhibitoren anwenden.

Makrozyklen, typischerweise definiert als zyklische kleine Moleküle oder Peptide mit Ringstrukturen, die aus 12 oder mehr Atomen bestehen, haben sich als vielversprechende chemische Gerüste im Bereich der Entdeckung neuer Arzneimittel herausgestellt1,2. Aufgrund der unterschiedlichen physikalisch-chemischen Eigenschaften, einschließlich des hohen Molekulargewichts und der zahlreichen Wasserstoffbrückendonoren3, nimmt diese Strukturklasse einen chemischen Bereich ein, der über Lipinskis Fünferregel hinausgeht4. Im Vergleich zu ihren linearen Analoga neigen Makrozyklen dazu, vororganisierte, eingeschränkte Konformationen anzunehmen und ausgedehnte Kontakte mit Zielmolekülen herzustellen. Folglich haben sie das Potenzial, erhöhte Bindungsaffinitäten, verbesserte Selektivitäten oder überlegene pharmakologische Eigenschaften aufzuweisen5,6. Makrozyklen wurden erfolgreich als potenzielle Therapeutika für verschiedene pharmazeutische Ziele eingesetzt, beispielsweise für Kinasen, Proteasen und G-Protein-gekoppelte Rezeptoren. Insbesondere aufgrund ihrer besonderen Merkmale gelten Makrozyklen als privilegierter Chemotyp für die Bekämpfung einiger anspruchsvoller Proteine, die mit herkömmlichen niedermolekularen Arzneimitteln kaum zu bewältigen sind7, und schließen so die Lücke zwischen kleinen Molekülen und großen Biologika. Beispielsweise überwiegen Makrozyklen bei den vermarkteten Inhibitoren des Hepatitis-C-Virus NS3/4A, das über eine flache und dem Lösungsmittel ausgesetzte Furche verfügt, die die Bindung kleiner Moleküle vor Herausforderungen stellt8. Über die Vorteile von Makrozyklen wurde auch bei der Modulation von Protein-Protein-Wechselwirkungen mit großen, flachen und dynamischen Oberflächen berichtet9.

Neben natürlich vorkommenden Makrozyklen sind synthetische Analoga, die auf Prinzipien der medizinischen Chemie basieren, eine weitere wichtige Quelle für makrozyklische Verbindungen10,11. Die makrozyklische Modifikation bekannter azyklischer Wirkstoffe ist eine einfache und wirksame Strategie zur Herstellung neuartiger makrozyklischer Gerüste unter Umgehung von Beschränkungen des geistigen Eigentums und kann gewünschte pharmakologische Eigenschaften erzielen12. Beispielsweise wurde Lorlatinib, ein von der FDA zugelassener makrozyklischer Inhibitor, der auf die anaplastische Lymphomkinase abzielt, vom azyklischen Crizotinib abgeleitet. Lorlatinib zeigte eine verbesserte Kinaseselektivität und eine verstärkte Exposition gegenüber dem Zentralnervensystem13. Dies zeigt, wie die makrozyklische Modifikation bekannter Verbindungen zur Entwicklung neuer und verbesserter Medikamente führen kann. Obwohl mehr als 80 makrozyklische Arzneimittel für den klinischen Einsatz zugelassen sind14, werden Makrozyklen in Medikamentendesignprojekten immer noch nur spärlich genutzt, was teilweise auf ihre schwierige Synthese und den Mangel an effizienten Makrocyclisierungsansätzen zurückzuführen ist15.

Ausgehend von einem biologisch aktiven linearen Molekül als Ausgangspunkt umfasst das berichtete erfolgreiche rationale Design von Makrozyklen im Allgemeinen zwei Schlüsselschritte. Erstens werden makrocyclische Linker hinzugefügt, die mit der linearen Verbindung kompatibel sind, was zur Bildung von Makrocyclen führt. Zweitens wird die Kompatibilität zwischen den Makrozyklen und der Bindungstasche des Ziels bewertet. Für den zweiten Schritt sind die verfügbaren Forschungsmethoden relativ explizit, und viele Simulationsmethoden, die üblicherweise beim Arzneimitteldesign verwendet werden, wie z. B. Konformationsoptimierung und molekulares Docking, können diesen Prozess unterstützen. Wenn wir im ersten Schritt zahlreiche Makrozyklen mit chemischer Vielfalt erzeugen können, indem wir strukturell unterschiedliche Linker hinzufügen, erhöht sich zweifellos die Chance, nach der anschließenden Vorhersage der Zielverbindungsbindung neue makrozyklische Kandidaten zu erhalten. Dennoch wird die Makrocyclisierung linearer Verbindungen im Anfangsstadium in erster Linie durch das empirische Wissen der medizinischen Chemiker vorangetrieben. Während die endgültigen Ergebnisse oft präsentiert werden, werden die detaillierten Verfahren in der wissenschaftlichen Literatur oft nur unzureichend beschrieben. Dieses undurchsichtige und nicht standardisierte Verfahren ist für unerfahrene Forscher schwer zu befolgen, und das empirische Wissen reicht nicht aus, um den riesigen chemischen Raum der makrocyclischen Linker abzudecken.

Obwohl in Veröffentlichungen selten erwähnt, haben Computerwerkzeuge erfolgreiche Anwendungen bei der Erleichterung des Makrocyclisierungsprozesses gezeigt16,17. Wagner et al. 18 und Sindhikara et al. 19 nutzten eine geometrisch eingeschränkte Linker-Datenbanksuche und eine Linker-Verbindungsstrategie, um Makrozyklen aus azyklischen Liganden zu erzeugen. In den Studien wurde zunächst ein Konformer-Ensemble von Linkerfragmenten konstruiert, aus dem die Linker normalerweise durch Anwendung geometrischer Kriterien, z. B. Abstands- und Winkelkompatibilität zwischen den zu verbindenden Atomen, gefiltert wurden, um mithilfe der dreidimensionalen (3D) anfänglichen Makrozyklen zu bilden ) Struktur des acyclischen Liganden. Mithilfe von molekularem Docking, MM/GBSA und/oder Berechnung der Störung freier Energie in Kombination zur Bewertung der Wechselwirkungen mit dem Ziel wurden aus den erzeugten Makrozyklen vielversprechende Kandidaten identifiziert. Diese Methoden können jedoch nur vorgefertigte Linker-Bibliotheken aufzählen, ohne die Möglichkeit, neue strukturell neuartige Linker abzuleiten. Darüber hinaus liefert der Fokus auf die lokale Konformationsanpassung verbundener Atome möglicherweise kein umfassendes Verständnis der gesamten makrozyklischen Struktur. Darüber hinaus sind diese Tools nicht öffentlich verfügbar, was einer breiten Nutzung und Zusammenarbeit entgegensteht. Da die Besorgnis über die Erforschung makrozyklischer Arzneimittelkandidaten sowohl in der Industrie als auch in akademischen Einrichtungen mit bemerkenswerter Geschwindigkeit zugenommen hat, besteht ein dringender Bedarf an der Entwicklung praktischer Rechenwerkzeuge, die die Zyklisierung linearer bioaktiver Moleküle unterstützen.

Künstliche Intelligenz, insbesondere Deep-Learning-Technologie, hat in verschiedenen Phasen des Arzneimittelentwicklungsprozesses großes Potenzial gezeigt, einschließlich der De-novo-Molekülgenerierung, Gerüst-Hopping, Strukturoptimierung und Aktivitätsvorhersage20,21,22,23,24. Allerdings erfordert das Training neuronaler Netze typischerweise große Datenmengen, um eine hohe Präzision und Generalisierungsfähigkeit zu erreichen25. Daher konzentrieren sich aktuelle Anwendungen von Deep Learning im Bereich der Arzneimittelentwicklung hauptsächlich auf arzneimittelähnliche kleine Moleküle. Nach unserem besten Wissen bleibt die Implementierung der Makrocyclisierung für lineare Moleküle durch den Einsatz von Deep-Learning-Algorithmen ein wenig erforschtes Gebiet. Die zugrunde liegenden Gründe sind kompliziert, wobei die relativ geringe Anzahl von Makrozyklen, die für das Modelltraining zur Verfügung stehen und auf ihren langfristig unzureichend genutzten Zustand zurückzuführen sind, wahrscheinlich der relevanteste Grund ist.

Chemische Moleküle können als SMILES-Strings (Simplified Molecular Input Line Entry System)26 dargestellt werden, eine chemische Sprache, die sich natürlich für sequenzbasierte Deep-Learning-Modelle eignet. Verschiedene SMILES-Darstellungen derselben chemischen Struktur wurden als Datenerweiterungsmethode verwendet, um verallgemeinernde Modelle für Systeme mit kleinen Datenmengen zu erhalten27,28,29. Hier schlagen wir ein Transformer-basiertes Modell namens Macformer für die automatisierte Makrocyclisierung vor. Anhand einer linearen Verbindung, die als SMILES-String mit zwei Markierungen für die Cyclisierungsstelle dargestellt wird, möchte Macformer den riesigen chemischen Raum seiner makrozyklischen Analoga erkunden, indem es die Vorteile tiefer generativer Modelle nutzt. Im Gegensatz zu den oben erwähnten rechnerischen Zyklisierungsmethoden geht Macformer das Problem des Entwurfs des makrozyklischen Gerüsts als maschinelle Übersetzungsaufgabe an, indem es SMILES-Sequenzen durchgängig verarbeitet. Durch den Einsatz einer Datenerweiterungsstrategie mit randomisierten SMILES-Strings lernt Macformer effizient die impliziten Zuordnungsbeziehungen zwischen der SMILES-Syntax azyklischer und makrozyklischer Strukturen. Es kann den fehlenden Linker des eingegebenen azyklischen Fragments automatisch ergänzen, um entsprechende makrozyklische Gerüste mit chemischer Vielfalt und struktureller Neuheit zu erzeugen. Wir haben Macformer zur Makrozyklisierung von Fedratinib, einem von der FDA zugelassenen JAK2-Inhibitor, eingesetzt. Da Makrozyklen ohne die Einschränkungen spezifischer Ziele in Macformer abgeleitet wurden, wurden die von Macformer erzeugten makrozyklischen Analoga von Fedratinib molekularen Docking-Berechnungen unterzogen. Basierend auf den Andockpositionen an der ATP-Bindungsstelle von JAK2 und einer Abschätzung der synthetischen Zugänglichkeit wurden schließlich drei Makrozyklen für die Synthese und Prüfung durch In-vitro- und In-vivo-Experimente ausgewählt. Die repräsentative Verbindung 3 weist eine verbesserte Kinaseselektivität und pharmakokinetische Eigenschaften auf als Fedratinib. Bemerkenswert ist, dass es in vivo bei einer niedrigeren Dosis eine vergleichbare In-vivo-Wirksamkeit wie Fedratinib zeigt. Diese Ergebnisse zeigen das große Potenzial von Macformer bei der Entdeckung makrozyklischer Arzneimittelkandidaten.

Ausgehend von einem azyklischen bioaktiven Molekül würde die Probenahme eines breiten chemischen Raums makrozyklischer Linker die Trefferwahrscheinlichkeit makrozyklischer Leitverbindungen effizient verbessern. Die schematische Darstellung des Macformer-Gerüsts ist in Abb. 1 dargestellt. Es handelt sich um ein tiefgreifendes generatives Modell, das darauf ausgelegt ist, vielfältige und neuartige makrozyklische Analoga der gegebenen azyklischen Moleküle zu erzeugen. Aufgrund des Fehlens expliziter Ziele für viele bioaktive Makrozyklen sind die Zielinformationen nicht an Macformer beteiligt.

ein Datenvorverarbeitungsprotokoll zur Generierung azyklisch-makrozyklischer SMILES-Paare für Modelltraining und -bewertung, und das „N_7“-Token gibt die Anzahl der schweren Atome auf dem kürzesten Weg des Linkers an. b Augmentation von azyklisch-makrozyklischen Paaren unter Verwendung randomisierter SMILES in einer an der Substruktur ausgerichteten Weise. c Die Modellnetzwerkarchitektur von Macformer. Die Aufmerksamkeitsschicht mit skalierten Punkten verwendet drei Matrizen als Eingabe: die Matrix Q mit einer Reihe von Abfragen, die Matrix K mit Schlüsseln und die Matrix V mit Werten.

Wir haben 18357 bioaktive Makrozyklen aus der ChEMBL-Datenbank30 gesammelt und die Filterbedingungen lauten, dass die Anzahl der Makroringe mit 12 oder mehr Atomen kleiner als 1 und die Länge der SMILES-Strings kleiner als 200 ist. Um den echten Makrozyklisierungsprozess nachzuahmen, indem jede Kombination durchlaufen wird Aus zwei Einfachbindungen am Makroring und anschließender Linkerfiltration wurden 237.728 einzigartige azyklisch-makrozyklische SMILES-Paare für das Modelltraining und die Bewertung erhalten (weitere Einzelheiten finden Sie im Abschnitt „Datenvorbereitung“ des Methodenteils). Der Datenverarbeitungsvorgang kann als umgekehrter Prozess der Makrozyklisierung betrachtet werden (Abb. 1a), der die Anzahl der für Deep Learning verfügbaren Daten dramatisch erhöhte. Die azyklischen SMILES-Strings, die Dummy-Atome (*) zur Markierung der Cyclisierungsstelle enthalten, stellen die linearen Verbindungen dar, die makrocyclisiert werden sollen, und werden als Quellsequenzen in das neuronale Netzwerk eingespeist. Die makrozyklischen SMILES-Strings sind die Zielsequenzen, die voraussichtlich vom Modell ausgegeben werden. Folglich wird das Makrocyclisierungsproblem als eine auf chemischer Sprache basierende Satzvervollständigungsaufgabe zugeschnitten, bei der die fehlenden Linker der eingegebenen azyklischen Verbindungen hinzugefügt und die intakten makrozyklischen Verbindungen erzeugt werden. Unsere hier vorgeschlagene Methode basiert auf der Transformer-Architektur31, dem modernsten neuronalen Netzwerkmodell für den Umgang mit sequentiellen Daten. Anders als früher beliebte wiederkehrende neuronale Netze, die Daten sequentiell und Token für Token verarbeiten, verwendet Transformer Aufmerksamkeitsmechanismen und Positionseinbettungen für die ganzheitliche Verarbeitung sequenzieller Eingabedaten (Abb. 1c). Der Aufmerksamkeitsmechanismus ermöglicht es dem Modell, Kontextinformationen für Token an jeder Position zu erfassen, was die Identifizierung weitreichender Abhängigkeiten zwischen Token in einer Sequenz ermöglicht. Dies bedeutet, dass alle Token in den azyklischen SMILES-Quellzeichenfolgen, wenn auch mit unterschiedlichen Aufmerksamkeitsgewichten, zur Generierung der makrozyklischen SMILES-Zeichenfolgen in Macformer beitragen. Macformer profitiert von der globalen Informationsmodellierungsmethode über die eingegebenen azyklischen SMILES-Sequenzen und wird voraussichtlich geeignetere makrozyklische Linker ableiten, die mit den gegebenen azyklischen Molekülen kompatibel sind, und neue Makrozyklen erzeugen, die näher am chemischen Raum der bioaktiven Makrozyklen liegen, die als Trainingsdatensatz verwendet werden. Die Details unseres Modells werden im Abschnitt „Macformer“ des Teils „Methoden“ ausführlich beschrieben.

Die kanonische SMILES-Notation, eine für jedes Molekül einzigartige Zeichenfolgendarstellung, wird aufgrund ihrer Einfachheit häufig verwendet. Jüngste Studien haben jedoch gezeigt, dass die Datenerweiterung durch die Verwendung einer Reihe chemisch identischer, aber syntaktisch unterschiedlicher randomisierter SMILES während des Trainings und der Inferenz die Leistung von Deep-Learning-Methoden erheblich verändern kann28,32. Um die Qualität unseres Modells zu verbessern, wurde eine Datenerweiterung sowohl für die Quell- als auch für die Zielsequenzen des Trainingsdatensatzes durchgeführt. Bemerkenswert ist, dass die azyklischen Eingangsgerüste Unterstrukturen der Ausgangsmakrozyklen sind. Wenn wir dieses Vorwissen in Form ausgerichteter SMILES-Strings in das Modell einspeisen, hilft es dem Modell, die Beziehung zwischen Eingabe- und Ausgabesequenzen zu verstehen. Während dieses Prozesses wurden zunächst zufällige SMILES der azyklischen Gerüste erzeugt, indem das Startatom und die Richtung der Molekülgraphenzählung zufällig ausgewählt wurden. Anschließend wurde eine Unterstruktursuche durchgeführt und die Atomzahlen der Makrocyclen entsprechend denen der azyklischen Unterstruktur neu geordnet. Die randomisierten SMILES der Makrozyklen wurden schließlich basierend auf den neuen Atomzahlen erfasst (Abb. 1b). Eine solche an der Unterstruktur ausgerichtete Strategie minimiert die Lücke zwischen den Eingabe- und Ausgabesequenzen und begünstigt, dass das Modell der Schlussfolgerung des makrozyklischen Linkers mehr Aufmerksamkeit schenkt.

Es wurden vier Modelle mit unterschiedlichen Augmentationsstufen (keine, ×2, ×5 und ×10) trainiert. Das nicht erweiterte Szenario enthält nur kanonische SMILES-Zeichenfolgen. Zusätzlich zu einer Kopie der kanonischen SMILES enthalten die n-fach erweiterten Szenarien n−1 chemisch äquivalente, aber randomisierte SMILES. Alle Modelle konvergieren nach 50.000 Schritten sehr gut (ergänzende Abbildung 1). Während des Evaluierungsprozesses des Modells mithilfe von Testdatensätzen wurde jedes Experiment zehnmal mit verschiedenen SMILES-Strings durchgeführt. Dieser Ansatz ermöglicht es uns, die Vorhersagefähigkeit der trainierten Modelle über verschiedene SMILES-Darstellungen hinweg zu bewerten. Der Strahlsuchalgorithmus33 wurde angewendet, um mehrere Kandidatensequenzen aus den Testdatensätzen abzuleiten, und für jede Eingabesequenz wurden die zehn besten Vorhersagen generiert.

Um unser Modell mit zuvor berichteten nicht-Deep-Learning-Rechenansätzen für die automatische Makrozyklisierung zu vergleichen, schlagen wir eine Pipeline zum Aufbau von Makrozyklen aus 3D-Strukturen linearer Verbindungen durch Linker-Datenbanksuche (bezeichnet als MacLS, ergänzende Abbildung 2) vor, die den Arbeiten von Refs folgt . 18,19. Bei MacLS wurden die Linker auf Grundlage der Kompatibilität der Bindungsvektoren zwischen der azyklischen Verbindung und dem Linker ausgewählt. Für ein azyklisches Molekül oder einen Linker ist ein Bindungsvektor die Bindung zwischen dem Atom an der Cyclisierungsstelle und dem Abgangsatom, die nicht in den erzeugten Makrozyklen enthalten ist. Ebenso werden die Zielinformationen in MacLS für einen fairen Vergleich mit Macformer nicht berücksichtigt. Die Linker des ChEMBL-Trainingsdatensatzes wurden verwendet und ein Konformerensemble mit 163.924 Strukturen erstellt. Für interne ChEMBL- und externe ZINC-Testdatensätze wurden die Konformationen der linearen chemischen Strukturen auf zwei Arten erhalten. Der erste Ansatz besteht darin, Konformationen von Grund auf auf der Grundlage der SMILES-Strings der azyklischen Strukturen (als MacLS_self bezeichnet) zu generieren. Der zweite Ansatz beinhaltet das Extrahieren der Konformationen aus den niederenergetischen 3D-Strukturen der entsprechenden Zielmakrozyklen (als MacLS_extra bezeichnet). Die Linker-Datenbank wurde zunächst anhand der Abstands- und Diederwinkelbeschränkungen der Atome auf den Bindungsvektoren gezählt und gefiltert. Durch die Verbindung der verbliebenen Linker mit dem azyklischen Gerüst wurden die makrozyklischen Verbindungen erhalten, geordnet nach den RMSD-Werten (Root-Mean-Square Deviation) zwischen den Atomen der Bindungsvektoren in den azyklischen Fragmenten und denen in den Linkern. Für einen fairen Vergleich wurden die zehn besten Makrozyklen für jede azyklische Struktur in internen ChEMBL- und externen ZINC-Testdatensätzen reserviert.

Bei einem azyklischen Molekül besteht der Zweck von Macformer und MacLS darin, vielfältige und neuartige makrozyklische Analoga zu erzeugen, bevor das Bindungspotenzial gegenüber dem interessierenden Ziel weiter bewertet wird. Für die konkrete Aufgabenstellung waren die Bewertungskriterien in früheren Studien nicht eindeutig angegeben. In dieser Arbeit haben wir die weit verbreiteten Metriken tiefer generativer Modelle angewendet, um die Leistung unserer Methode zu bewerten. Diese Metriken umfassen die Rekonstruktion des Zielmoleküls und die Bewertung der chemischen Gültigkeit, Neuheit und Einzigartigkeit der erzeugten Verbindungen. Die Neuheit der abgeleiteten Linker und das Makrocyclisierungsverhältnis der erzeugten Verbindungen wurden ebenfalls als zusätzliche Metriken berechnet (weitere Einzelheiten finden Sie im Abschnitt Modellbewertungsmetriken des Methodenteils).

Die Leistungen von Macformer und dem Nicht-Deep-Learning-Ansatz MacLS auf dem ChEMBL-Testdatensatz sind in Tabelle 1 zusammengefasst. Im Vergleich zum Basismodell ohne Erweiterung führte die Verstärkung des Trainingsdatensatzes um das Zweifache zu einer besseren Leistung insbesondere in Bezug auf alle Metriken für Wiederfindung (96,09 % vs. 54,85 ​​%), Validität (80,34 % vs. 66,74 %) und Linker-Neuheit (Noveltylinker, 58,91 % vs. 40,56 %). Dies weist darauf hin, dass das mit substrukturorientierten, randomisierten SMILES trainierte Modell nicht nur für die Rekonstruktion makrozyklischer Gerüste, sondern auch für das Erlernen der grundlegenden Syntax der chemischen Sprache von Vorteil ist. Folglich ist das Modell in der Lage, chemisch bedeutsame SMILES-Strings mit struktureller Vielfalt und Neuheit zu erzeugen. Modelle, die mit fünf- oder zehnfachen Datenerweiterungen trainiert wurden, führten jedoch nicht zu einer weiteren signifikanten Verbesserung der Leistung des ChEMBL-Testdatensatzes. Dieses Phänomen steht im Einklang mit der Schlussfolgerung einer früheren Studie, dass ein optimaler Grad an Datenanreicherung für eine bestimmte Lernaufgabe wichtig ist27. Es ist erwähnenswert, dass alle Modelle eine Makrozyklisierungsrate von über 95 % erreichen konnten, was die Fähigkeit von Macformer zur Erzeugung makrozyklischer Verbindungen verdeutlicht. Die Gesamteindeutigkeitswerte liegen unter 66 %, was möglicherweise auf die Redundanz der Zielverbindungen im ChEMBL-Testdatensatz zurückzuführen ist. Unter den 23771 azyklisch-makrozyklischen SMILES-Paaren im Testdatensatz gibt es 10.222 einzigartige Makrozyklen, was zu einer externen Eindeutigkeitsrate von 43 % führt. Dennoch weisen die von Macformer erzeugten makrozyklischen Verbindungen im Vergleich zum ursprünglichen Testdatensatz eine deutlich höhere Einzigartigkeit auf. Die Ergebnisse bestätigen die Fähigkeit von Macformer, vielfältige und bisher nicht gesehene makrozyklische Strukturen zu erzeugen, die über den verfügbaren ChEMBL-Makrozyklusdatensatz hinausgehen.

Zur Bewertung der MacLS-Methode wurden die Konformationen der azyklischen Verbindungen zunächst direkt aus ihren SMILES-Notationen konstruiert. In diesem Szenario generiert MacLS_self nur 17,05 % gültige Makrozyklen. Die sehr geringe Gültigkeit wird hauptsächlich auf die linear ausgedehnten Konformationen der acyclischen Stammverbindungen zurückgeführt, die nicht für die Makrocyclisierung geeignet sind. Bei Verwendung der stärker gefalteten Konformationen, die aus den vorgeformten 3D-Strukturen der Zielmakrozyklen extrahiert wurden, wird die Gültigkeit der von MacLS_extra generierten Makrozyklen erheblich verbessert, was die hohe Abhängigkeit der nicht-tieflernenden Makrocyclisierungsmethode von den gegebenen Konformationen des azyklischen Gerüsts impliziert. Im Vergleich zu Macformer schneidet MacLS in Bezug auf Einzigartigkeit und molekulare Neuheit (Noveltymol) besser ab. Dennoch kann MacLS keine neuen Linker mit struktureller Neuheit ableiten, was zu Neuheitslinker-Werten von 0 % führt. Darüber hinaus rekonstruiert MacLS die Zielmakrozyklen mit sehr geringen Verhältnissen, nur 0 % bzw. 4,16 % für MacLS_self und MacLS_extra. Die Ergebnisse sind nicht überraschend, da MacLS lediglich die mit Bindungsvektoren verbundenen geometrischen Einschränkungen berücksichtigt, bei denen es sich um lokale Informationen handelt, die bei der Rekonstruktion der Zielmakrozyklen kaum hilfreich sind.

Diese Methoden wurden anhand eines zusätzlichen externen Testdatensatzes weiter evaluiert, der 5551 azyklisch-makrozyklische SMILES-Paare enthielt, die aus 486 bioaktiven Makrozyklen in der ZINC-Datenbank extrahiert wurden. Im Vergleich zu denen aus der ChEMBL-Datenbank weisen diese Makrozyklen niedrigere Molekulargewichte und kürzere SMILES-Längen auf (ergänzende Abbildung 3). Wie in Tabelle 2 gezeigt, können die erweiterten Modelle auch eine systematisch verbesserte Leistung für den externen ZINC-Datensatz bieten. Beide mit 5- und 10-fachen Augmentationen trainierten Modelle konnten über 80 % der ursprünglichen makrozyklischen Verbindungen wiederherstellen, über 84 % gültige SMILES-Strings erzeugen und über 99 % Neuheit und Makrozyklisierung erreichen. Diese Ergebnisse zeigen, dass Macformer in Datenerweiterungsszenarien über eine hervorragende Generalisierungsfähigkeit verfügt.

Die Leistung von MacLS beim externen ZINC-Testdatensatz ist ähnlich der beim ChEMBL-Testdatensatz. Grundsätzlich konnte MacLS durch den Trainingsprozess nicht wie Macformer ausreichend Vorwissen erlernen, daher sind die Auswertungsergebnisse von MacLS für die beiden Testdatensätze ähnlich und können theoretisch auf andere Datensätze extrapoliert werden.

Unabhängig von der Ableitung strukturell neuartiger Linker zeigen sowohl Macformer als auch MacLS die Fähigkeit, makrozyklische Verbindungen mit struktureller Neuheit zu erzeugen. Dies wirft die Frage auf, ob es Unterschiede zwischen den chemischen Räumen dieser neuen Verbindungen gibt. Um diese Frage zu untersuchen, haben wir zunächst die strukturelle Ähnlichkeit zwischen generierten neuartigen und Ground-Truth-Zielmakrozyklen mithilfe von Morgan-Fingerabdrücken (2 Bindungsradius) bewertet, die in RDKit v2020.03.3.034 implementiert sind. Für eine bestimmte Zielverbindung wurden die Werte des Tanimoto-Koeffizienten (Tc) mit allen entsprechenden generierten neuen Verbindungen berechnet und gemittelt, um die Endbewertung zu erhalten. Wie in Abb. 2a dargestellt, weist die Mehrzahl der generierten neuen Verbindungen aufgrund der gemeinsamen Unterstrukturen der azyklischen und makrozyklischen Verbindungen durchschnittliche Tc-Werte von mehr als 0,7 auf. Macformer tendiert jedoch dazu, neue Chemikalien mit größerer struktureller Ähnlichkeit zu den makrozyklischen Zielverbindungen zu erzeugen als MacLS_extra.

a Verteilung des durchschnittlichen Tanimoto-Koeffizienten zwischen generierten neuartigen und Ground-Truth-Zielmakrozyklen. ChEMBL, Macformer, ×5, n = 23772; ChEMBL, MacLS_extra, n = 23765; ZINK, Macformer, ×5, n = 5514; ZINC, MacLS_extra, n = 5551. b UMAP-Diagramm der 1024-Bit-Morgan-Fingerabdrücke der Linker im ChEMBL-Trainingsdatensatz (n = 9243 Linker) und der neuartigen Linker, die von Macformer im ChEMBL-Test (n = 9039 Linker) und ZINC generiert wurden (n = 2082 Linker) Datensätze. c Retrospektive Makrozyklisierung eines Checkpoint-Kinase-1-(CHK1)-Inhibitors64 durch Macformer. Die Tc-Werte zwischen den generierten neuen und Zielverbindungen wurden markiert. Quelldaten werden als Quelldatendatei bereitgestellt.

Das obige Ergebnis ist etwas unerwartet, da Macformer auf neuartige Linker schließen kann, die nicht im Trainingsdatensatz vorhanden sind, während MacLS_extra diese Fähigkeit nicht besitzt. Anschließend untersuchten wir den chemischen Raum der neuartigen Linker, indem wir ihre 1024-Bit-Morgan-Fingerabdrücke berechneten. Zusätzlich verwendeten wir den UMAP-Algorithmus (Uniform Manifold Approximation and Projection)35 zur Dimensionsreduzierung. UMAP kann die Ähnlichkeitsbeziehungen zwischen Datenpunkten im ursprünglichen hochdimensionalen Raum besser bewahren als die t-verteilte stochastische Nachbareinbettung36. Wie in Abb. 2b gezeigt, befinden sich die von Macformer in ChEMBL-Test- und ZINC-Datensätzen generierten strukturell neuartigen Linker beide im chemischen Raum, der die Linker aus dem ChEMBL-Trainingsdatensatz umgibt. In der Zwischenzeit kann Macformer neben der Durchführung der Makrocyclisierung gleichzeitig geringfügige Modifikationen an der anfänglichen linearen Unterstruktur vornehmen, um neue Strukturen mit hoher Ähnlichkeit zu den Zielmakrocyclen zu erzeugen (Abb. 2c).

Darüber hinaus haben wir Pipeline Pilot v201737 verwendet, um sieben molekulare Eigenschaften zu berechnen: Molekulargewicht (MW), AlogP, polare Oberfläche (PSA), Anzahl der Wasserstoffbrückenbindungsakzeptoren (NHA), Anzahl der Wasserstoffbrückenbindungsdonoren (NHD), quantitative Schätzungen der Drogenähnlichkeit (QED) und der synthetischen Zugänglichkeit (SA). Sowohl für ChEMBL-Test- als auch für ZINC-Datensätze weisen die von MacLS_extra generierten neuartigen Makrozyklen tendenziell signifikantere statistische Unterschiede zu den Zielen auf als die von Macformer generierten (ergänzende Abbildungen 4 und 5). Die Ergebnisse deuten darauf hin, dass der chemische Raum der durch Macformer erzeugten neuartigen Makrozyklen näher an dem der echten bioaktiven Makrozyklen liegt. Dies kann von der Datenerweiterungsstrategie durch die Verwendung substrukturorientierter, randomisierter SMILES profitieren, die die Strukturinformationen desselben Moleküls aus verschiedenen Blickwinkeln offenlegt und Macformer in die Lage versetzt, die Einschränkungen des makrozyklischen chemischen Raums besser zu verstehen.

Um zu offenbaren, wie Macformer bei dieser speziellen automatischen Makrozyklisierungsaufgabe funktioniert, wurden Aufmerksamkeitsgewichte zwischen Eingabe- und Ausgabesequenzen anhand der Teilstring- bzw. Token-Skala analysiert (ergänzende Abbildung 6). Die Teilzeichenfolgen oder Token in den Eingabesequenzen haben tendenziell den größten Einfluss auf die Generierung derselben Teilzeichenfolgen oder Token in der vorhergesagten Sequenz, die die Reproduktion des azyklischen Startfragments in den generierten Makrozyklen garantieren. Bei der Ableitung des makrozyklischen Linker-Teilstrings zeigte unser Modell eine systematische Vorgehensweise, da die Unterschiede in Bezug auf die Aufmerksamkeitsgewichte zwischen verschiedenen Teilstrings der Quellsequenz nicht signifikant sind. Dies weist darauf hin, dass Macformer in der Lage ist, die latenten Merkmale der eingegebenen azyklischen SMILES-Sequenz zu kombinieren und einen geeigneten Linker in das ursprüngliche lineare Fragment einzubauen. Diese Fähigkeit beruht auf dem Vorwissen, das es über die Beziehung zwischen den azyklischen Fragmenten und ihren entsprechenden makrozyklischen Linkern im Trainingsdatensatz gewonnen hat.

In den letzten Jahren haben Makrozyklen aufgrund ihres Potenzials als Kinaseinhibitoren große Aufmerksamkeit erlangt. Für prospektive Evaluierungszwecke wurde Macformer eingesetzt, um makrozyklische Janus-Kinase-2-Inhibitoren (JAK2) zu entwickeln. JAK2 gehört zu den intrazellulären Nicht-Rezeptor-Protein-Tyrosin-Kinasen der JAK-Familie und ist ein wichtiges Ziel für die Behandlung von myeloproliferativen Neoplasien und rheumatoider Arthritis38,39. In Kombination aus molekularer Docking-Simulation und medizinisch-chemischer Analyse haben William et al. entwarf den makrozyklischen JAK2-Inhibitor Pacritinib40. Dieser Inhibitor wurde von der stark patentierten Phenylaminopyrimidin-Struktur abgeleitet und wurde zur Behandlung von Myelofibrose zugelassen41.

In unserer Studie wurde die azyklische Ausgangsstruktur von Fedratinib abgeleitet, einem niedermolekularen JAK2-Inhibitor, der für die Therapie von Myelofibrose zugelassen ist42. Es wird berichtet, dass Fedratinib für JAK2 im Vergleich zu anderen JAK-Kinasen hoch selektiv ist, sein selektives Profil gegenüber dem breiteren Kinom ist jedoch enttäuschend43,44. Die Off-Target-Effekte auf andere Kinasen können unerwünschte Nebenwirkungen hervorrufen. Wir hoffen, dass durch die Makrocyclisierung proprietäre Gerüste mit verbesserter Kinaseselektivität und anderen Eigenschaften erhalten werden. Die Makrocyclisierungsverbindungspunkte wurden an den beiden terminalen Phenylringen festgelegt. In der Zwischenzeit wurde die Tert-Butylsulfonamid-Einheit, die zu ungünstigen Kontakten mit Asp99445 führen kann, entfernt, um die Synthesemöglichkeit der erzeugten Makrozyklen zu verbessern. Um die Vielfalt der makrozyklischen Linker zu maximieren, wurden der SMILES-Sequenz Token vorangestellt, die die Anzahl der Schweratome auf dem kürzesten Weg der Linker im Bereich von drei bis neun darstellen. Um die Vielfalt der vorhergesagten Makrozyklen zu erhöhen, wurde jede SMILES-Quellsequenz um das Zehnfache erweitert. Durch die Schlussfolgerung von Macformer mit einer Strahlgröße von 10 wurden schließlich 700 ausgegebene SMILES-Sequenzen erhalten, die 281 einzigartige neuartige makrozyklische Moleküle umfassten (Abb. 3).

Die Makrocyclisierungsverbindungspunkte, die zur eindeutigen Identifizierung mit Sternchen (*) gekennzeichnet sind, liegen bewusst an den beiden terminalen Phenylringen von Fedratinib. Um die Vielfalt der vorhergesagten Makrozyklen zu erhöhen, werden am Anfang der SMILES-Sequenz Token eingefügt, die die Anzahl der Schweratome auf dem kürzesten Weg der Linker (N_x) im Bereich von drei bis neun angeben. Anschließend wird jede Quell-SMILES-Sequenz um das Zehnfache erweitert. In den mutmaßlichen Andockpositionen der makrozyklischen JAK2-Inhibitoren sind die kritischen Wasserstoffbrücken als schwarze Striche hervorgehoben.

Die traditionelle MacLS-Methode wurde auch auf ihr Potenzial bei der Makrozyklisierung von Fedratinib hin untersucht und die 300 besten makrozyklischen Analoga wurden basierend auf der kristallographischen bioaktiven Konformation von Fedratinib im Komplex mit der JAK2-Kinasedomäne (PDB-Code 6VNE) reserviert45. Unter Verwendung des GlideSP-Protokolls von Maestro v10.146 wurden die mit beiden Methoden erzeugten Makrozyklen jeweils an die ATP-Bindungsstelle von JAK2 angedockt. Als Bewertungsmaßstab dienten die Docking-Scores, je niedriger (negativer), desto besser. Ein Vergleich der Docking-Scores (ergänzende Abbildung 7) zeigt, dass die von Macformer erzeugten Makrozyklen niedrigere Werte aufweisen als die von MacLS, was bedeutet, dass Macformer mit größerer Wahrscheinlichkeit aktive makrozyklische JAK2-Inhibitoren erzeugt. Wir können dieses Phänomen aus zwei Aspekten erklären. Einerseits berücksichtigt die MacLS-Methode ohne Deep Learning lediglich die Anpassung geometrischer Parameter im Zusammenhang mit der Bildung neuer makrozyklischer chemischer Bindungen, um die bioaktive Ausrichtung der linearen Verbindung aufrechtzuerhalten. Während der gesamten Strukturoptimierung oder der zielinduzierten Bindung der makrozyklischen Verbindungen können sich die Konformationen vieler azyklischer Substrukturen jedoch geringfügig ändern und von der aktiven abweichen. Andererseits konnte Macformer die vollständigen Strukturinformationen der azyklischen und makrozyklischen Verbindungen durch globale Modellierung auf SMILES-Sequenzen mit Transformer-Architektur erfassen und Linker ableiten, die zu den gegebenen azyklischen Molekülen passen. Die allgemeine Kompatibilität der azyklischen Ausgangsverbindungen mit den Linkern kann dazu beitragen, die aktiven Konformationen der azyklischen Substrukturen zu bewahren und die Bindung der Makrozyklen an das Ziel zu erleichtern.

In der prospektiven Fallstudie konzentrieren sich unsere Bemühungen hauptsächlich auf die Einführung makrozyklischer Linker, daher wurden die erzeugten Verbindungen mit zusätzlichen Substituentengruppen am Ausgangsfragment und solche, die einem Gerüst-Hopping unterliegen, ignoriert. Die letztendlich in Frage kommenden 218 von Macformer erzeugten makrozyklischen Verbindungen wurden für weitere eingehende Untersuchungen reserviert. Nach einer visuellen Inspektion der Andockpositionen und einer auf Erfahrungen basierenden Abschätzung der synthetischen Zugänglichkeit wurden schließlich drei Verbindungen für die Synthese und Bewertung ihrer Wirksamkeit gegen JAK2 ausgewählt. Wie in Abb. 3 gezeigt, zeigt die anfängliche azyklische Einheit eine ähnliche Bindungshaltung wie Fedratinib, und die Makrocyclisierung behält die kritischen Wasserstoffbrückenbindungswechselwirkungen zwischen den Verbindungen 1–3 und dem Rest Leu932 in der Gelenkregion bei. Trotz der strukturellen Neuheit der drei ausgewählten Verbindungen sind ihre eingeführten Linker in vielen Makrozyklen des ChEMBL-Trainingsdatensatzes zu sehen. Konkret sind die Linker der Verbindungen 2 und 3 in den zugelassenen Arzneimitteln Lorlatinib bzw. Pacritinib vorhanden. Nach unserem besten Wissen wurde jedoch nicht über den Linker von Verbindung 1 für die Entwicklung eines makrozyklischen und selektiven JAK2-Inhibitors berichtet. Anstatt die neuartigen Linker intensiv zu verfolgen, ist die Synthese dieser makrozyklischen Verbindungen unser Hauptanliegen, was auch die Voraussetzung für die weitere Aktivitätsbewertung ist. Das Vorhandensein dieser Linker in authentischen Makrozyklen impliziert im Allgemeinen eine bessere Synthesemöglichkeit, und die drei Makrozyklen, die drei verschiedene chemische Grundgerüste abdecken, wurden letztendlich auf drei verschiedenen Wegen synthetisiert (Ergänzende Methoden, ergänzende Abbildung 9–17).

Bei der retrospektiven Untersuchung der 300 von MacLS erzeugten Makrozyklen wurde keine der drei Verbindungen gefunden, was die Praktikabilität unserer Deep-Learning-Methode bei der Identifizierung wirksamer makrozyklischer JAK2-Inhibitoren zeigt, die von herkömmlichen Methoden möglicherweise übersehen wurden. Interessanterweise gibt es nur zwei gemeinsame Makrozyklen zwischen den von Macformer und MacLS erzeugten Verbindungen. Auch wenn dies in dieser Studie nicht praktiziert wird, glauben wir, dass die Chancen, wirksame makrozyklische Leitverbindungen zu erhalten, erheblich steigen werden, wenn die durch die beiden Methoden erhaltenen Verbindungen für weitere Untersuchungen kombiniert werden.

Anschließend wurden enzymatische Tests der Verbindungen 1–3 gegen JAK2 durchgeführt und die IC50-Werte der Verbindungen 1–3 wurden mit 0,07, 0,364 bzw. 0,006 μM gemessen (Tabelle 3). Die wirksamste Verbindung 3 weist im Vergleich zu Fedratinib eine ähnliche Aktivität im einstelligen nanomolaren Bereich auf. Um die Spezifität der beiden wirksamsten Makrozyklen, 1 und 3, zu beurteilen, wurden ihre Kinase-Selektivitätsprofile gegenüber einer vielfältigen Gruppe von 468 Kinasen bei einer Konzentration von 100 nM auf der DiscoveRx KINOMEscan-Plattform getestet, und Fedratinib wurde als Kontrolle verwendet (Abb. 4). ). Nur 10 bzw. 17 Wildtyp-Kinasen werden von den Verbindungen 1 bzw. 3 beeinflusst, während die Anzahl der durch Fedratinib gehemmten Wildtyp-Kinasen 34 beträgt (prozentuale Kontrolle <35 %). Fedratinib bindet an eine Vielzahl von Kinasen, wohingegen die Verbindungen 1 und 3 hauptsächlich auf die TK-Gruppe abzielen und eine vernachlässigbare Wirkung auf die CMGC-, CAMK- und AGC-Gruppe haben. Die Ergebnisse legen nahe, dass die makrozyklischen Verbindungen 1 und 3 bessere Kinomselektivitätsprofile aufweisen als Fedratinib.

Die Affinität wird als Prozentsatz der DMSO-Kontrolle (Prozentkontrolle) definiert, wobei der niedrigere Wert auf eine stärkere Hemmung hinweist. Quelldaten werden als Quelldatendatei bereitgestellt.

Die antiproliferativen Wirkungen der Verbindungen 1–3 auf humane Erythroleukämie (HEL) und megakaryoblastische SET-2-Zellen, die beide JAK2V617F-abhängig sind, wurden ebenfalls untersucht. Die Ergebnisse zeigten, dass die Verbindungen 1 und 3 die Proliferation beider Zelllinien unterdrücken konnten, wobei Verbindung 1 im Vergleich zu Fedratinib eine vergleichbare einstellige mikromolare Wirksamkeit aufwies. Wie andere JAK2-Inhibitoren vom Typ I47,48 erhöhten die Verbindungen 1 und 3 die Phosphorylierung von JAK2 an der Y1007/8-Stelle in HEL-Zellen, blockierten jedoch die Phosphorylierung an der Y221-Stelle dosisabhängig wirksam (Abb. 5), was wichtig ist für JAK2 Vollaktivierung49. Darüber hinaus hemmten beide Verbindungen die Aktivierung der nachgeschalteten Signalmoleküle STAT3 und STAT5 erheblich.

Als Positivkontrolle wurde Fedratinib in einer Konzentration von 1 μM verwendet. Es wurden drei unabhängige Wiederholungen durchgeführt, die ähnliche Ergebnisse lieferten. Quelldaten werden als Quelldatendatei bereitgestellt.

Die vorläufigen pharmakokinetischen (PK) Eigenschaften der Verbindungen 1 und 3 und Fedratinib in vivo bei Mäusen nach intravenöser (iv, 5 mg/kg) und oraler (po, 5 mg/kg) Verabreichung wurden untersucht. Die PK-Profile sind in der ergänzenden Abbildung 8 dargestellt und die Analyse der PK-Parameter ist in Tabelle 4 zusammengefasst. Verbindung 3 zeigte insgesamt bessere PK-Eigenschaften als Fedratinib, mit Ausnahme der etwas geringeren Bioverfügbarkeit (F, 9,4 % vs. 11,7 %). Nach oraler Gabe zeigte Verbindung 3 eine längere Halbwertszeit (T1/2, 10,07 vs. 4,70 h) und eine höhere systemische Exposition (AUCinf, 114,69 vs. 50,19 h*ng/ml). Im Vergleich zu Fedratinib zeigte die makrozyklische Verbindung 1 auch Vorteile hinsichtlich der oralen PK-Eigenschaften, z. B. der höheren systemischen Exposition (106,00 vs. 50,19 h*ng/ml) und der Bioverfügbarkeit (14,1 % vs. 11,7 %). Die ganzheitlich günstigen PK-Profile der beiden Makrocyclen legen nahe, dass die Makrocyclisierung eine effiziente Strategie zur Verbesserung der metabolischen Stabilität von Fedratinib in vivo ist.

Über eine Überexpression von JAK2 wurde bei Patienten mit entzündlichen Darmerkrankungen (IBD) berichtet, was bedeutet, dass die Hemmung von JAK2 zur Behandlung von IBD beitragen kann50,51. Um das therapeutische Potenzial der makrozyklischen JAK2-Inhibitoren bei IBD zu bewerten, haben wir das Dextransulfat-Natrium (DSS)-induzierte Kolitismodell52 etabliert. Das DSS-Colitis-Modell rekapituliert viele klinische und pathologische Merkmale menschlicher IBD, wie blutiger Stuhlgang, Gewichtsverlust, Durchfall und Infiltration von Entzündungszellen, und wird in der IBD-Forschung häufig als präklinisches Modell für erste Studien verwendet. Als Positivkontrolle wurde Salicylazosulfapyridin53 verwendet. Nach umfassender Betrachtung der enzymatischen und zellulären Aktivität, der Kinomselektivität und der PK-Eigenschaften wurde die makrozyklische Verbindung 3 für den In-vivo-Wirksamkeitstest ausgewählt. Gemäß früheren PK-Ergebnissen wurde Fedratinib in der doppelten Dosis (10 mg/kg) der Verbindung 3 (5 mg/kg) verabreicht. Wie in Abb. 6a gezeigt, könnte die Verabreichung von Verbindung 3 und Fedratinib die durch 3,5 % (w/v) DSS verursachte Abnahme des Körpergewichts lindern. Die Werte des Krankheitsaktivitätsindex (DAI) der mit Verbindung 3 und Fedratinib behandelten Gruppe waren ab Tag 8 signifikant verringert (Abb. 6b). Darüber hinaus wurde festgestellt, dass die Behandlung mit Verbindung 3 und Fedratinib das Verhältnis von Dickdarmgewicht zu Länge, einem Ersatzmaß für die Dickdarmentzündung, im Vergleich zur Modellgruppe verringerte (Abb. 6c). Der Schweregrad der Dickdarmentzündung wurde dann durch H&E-Färbung analysiert. Offensichtlich gab es in der Modellgruppe eine signifikante Entzündungsreaktion, die durch eine signifikante Infiltration von Entzündungszellen, einen Verlust der Becherzellen, einen nahezu vollständigen Verlust der Krypta, eine reaktive epitheliale Hyperplasie, ein submuköses Ödem und unregelmäßige Dickdarmzotten gekennzeichnet war. Im Gegensatz dazu zeigten mit Verbindung 3 und Fedratinib behandelte Mäuse eine geringere Infiltration entzündlicher Zellen im Dickdarmgewebe, eine intakte Dickdarmarchitektur mit weniger offensichtlicher Ulzeration und niedrigere histologische Werte (Abb. 6d – f). Insgesamt deuten diese Ergebnisse darauf hin, dass Verbindung 3 und Fedratinib die Symptome bei DSS-induzierter muriner Kolitis lindern können und dass Verbindung 3 bei einer niedrigeren Dosis eine vergleichbare therapeutische Wirksamkeit wie Fedratinib zeigte.

a Das tägliche Gewicht ändert sich in jeder Gruppe (n = 8 Mäuse pro Gruppe). b Die DAI-Score-Änderungskurven während des Experiments (n = 8 Mäuse pro Gruppe). c Das Verhältnis von Dickdarmgewicht zu Dickdarmlänge in jeder Gruppe. Kontrolle, n = 8 Dickdarmgewebe; Modell, n = 8 Dickdarmgewebe; SASP, n = 8 Dickdarmgewebe; Verbindung 3, n = 7 Dickdarmgewebe; Fedratinib, n = 7 Dickdarmgewebe. d Die histologischen Ergebnisse basierend auf Ameho-Kriterien62 in jeder Gruppe. Kontrolle, n = 8 Dickdarmgewebe; Modell, n = 7 Dickdarmgewebe; SASP, n = 8 Dickdarmgewebe; Verbindung 3, n = 7 Dickdarmgewebe; Fedratinib, n = 5 Dickdarmgewebe. e Repräsentative H&E-gefärbte Gewebeschnitte, die die Merkmale des Dickdarms jeder Gruppe veranschaulichen. Maßstabsbalken, 500 μm. f Repräsentative H&E-gefärbte Gewebeschnitte, die die Merkmale des Dickdarms jeder Gruppe veranschaulichen. Maßstabsbalken, 100 μm. Die Werte werden als Mittelwerte ± SEM angezeigt und die statistische Analyse wurde mit einer einfaktoriellen ANOVA gefolgt von einem LSD-Post-hoc-Test durchgeführt. Quelldaten werden als Quelldatendatei bereitgestellt.

Als JAK2-Inhibitor hat die makrozyklische Verbindung 3 in unserer ersten Studie unter Verwendung des akuten DSS-Kolitis-Modells vorläufige therapeutische Wirksamkeit bei IBD gezeigt. Es gibt jedoch noch viele Fragen, die durch umfangreiche Forschung geklärt werden müssen. Aus mechanistischer Sicht ist JAK2 stark an der Signalübertragung hämatopoetischer Zytokine und Hormone beteiligt, und die mögliche Nebenwirkung der Myelosuppression macht JAK2 als therapeutisches Ziel für IBD umstritten54. Daher sollten die mit der Myelosuppression verbundenen Indikatoren für In-vivo-Tests sorgfältig überwacht werden, um die Wirksamkeit und Sicherheit selektiver JAK2-Inhibitoren bei IBD zu klären. Mittlerweile werden chronische IBD-Tiermodelle empfohlen, um die chronischen pathologischen Zustände beim Menschen besser nachzuahmen.

Um das Problem der automatischen Makrozyklisierung durch Nutzung der Vorteile von Deep Learning anzugehen, haben wir das Macformer-Modell auf Basis der Transformer-Architektur entwickelt. Ausgehend von einer azyklischen Struktur, die als SMILES-Strings dargestellt und mit zwei Befestigungspunkten gekennzeichnet ist, widmet sich Macformer der automatischen Generierung entsprechender zyklischer Analoga. Mit Fähigkeiten zur Datenerweiterung unter Verwendung substrukturorientierter, randomisierter SMILES-Notationen ist Macformer in der Lage, die verborgenen Verbindungen zwischen den linearen Quell- und makrozyklischen SMILES-Zielsequenzen des ChEMBL-Trainingsdatensatzes zu erfassen und effizient Makrozyklen mit chemischer Diversität und Neuheit sowohl auf internem ChEMBL als auch auf externem ZINC zu erzeugen Testdatensatz. Die hervorragende Leistung und Generalisierungsfähigkeit von Macformer lassen darauf schließen, dass Macformer Potenzial für die Entwicklung makrozyklischer Verbindungen bietet und so die Anwendung der Deep-Learning-Technologie im Bereich der Arzneimittelforschung erweitert.

Das ultimative Ziel der Entwicklung rechnergestützter Methoden ist die Unterstützung des praktischen Arzneimitteldesignprozesses. Dieser Philosophie folgend wurde Macformer zur Entwicklung makrozyklischer JAK2-Inhibitoren eingesetzt, wobei die Kernstruktur von Fedratinib das ursprüngliche azyklische Gerüst war. Die von Macformer erzeugten Makrozyklen wurden an die ATP-Bindungsstelle von JAK2 angedockt, um ihre Wechselwirkungen mit dem Ziel weiter zu bewerten, die als Importkriterium für die anschließende Verbindungsauswahl verwendet wurden. Von den 218 generierten neuartigen Makrozyklen mit unterschiedlichen Linkern wurden drei synthetisiert und auf ihre biologischen Aktivitäten getestet. Unter diesen zeigten die Verbindungen 1 und 3 Hemmwirkungen gegen JAK2 sowohl auf enzymatischer als auch auf zellulärer Ebene und zeigten ein verbessertes Selektivitätsprofil gegenüber 468 Kinasen und günstigere PK-Eigenschaften als Fedratinib. Darüber hinaus zeigte Verbindung 3 in vivo eine entzündungshemmende Wirkung auf DSS-induzierte murine Kolitis bei einer niedrigeren Dosis als Fedratinib. Die prospektive Fallstudie bestätigt die Praktikabilität von Macformer, der potenzielle makrozyklische Gerüste für die weitere Entwicklung von Arzneimittelkandidaten liefern kann, die auf die JAK2-Kinase sowie andere Arzneimittelziele abzielen. Es wird erwartet, dass Macformer als leistungsstarke Ergänzung zur traditionellen Makrocyclisierungsmethode eine wertvolle Rolle bei der Entwicklung makrozyklischer Arzneimittelkandidaten spielen wird.

Der makrozyklische Datensatz wurde aus der ChEMBL-Datenbank30 gesammelt und es wurden nur Verbindungen beibehalten, die die folgenden Kriterien erfüllen: 1) enthalten nur einen Makroring mit 12 oder mehr Atomen; 2) Der Molekültyp wird als „kleines Molekül“ bezeichnet. 3) Die Bioaktivitätsdaten sind nicht leer. 4) Die Länge der kanonischen SMILES-Strings liegt unter 200. Die kanonische SMILES-Darstellung wurde mit RDKit generiert und die stereochemischen Informationen wurden zur Vereinfachung entfernt. Nach der Filterung doppelter Strukturen wurden 18.357 einzigartige Makrozyklen abgeleitet.

Um passende azyklisch-makrozyklische Paare zu erhalten, wurden die Makrozyklen durch gleichzeitiges Schneiden zweier Einfachbindungen des Makrorings in zwei Unterstrukturen fragmentiert. Die Unterstruktur mit den schwereren Atomen wurde als azyklisches Analogon und die andere als Linker klassifiziert. Für jede makrozyklische Verbindung im Datensatz würde der Fragmentierungsprozess mehrere Kombinationen aus azyklischem Analogon und entsprechendem Linker erzeugen. Aus Sicht der synthetischen Zugänglichkeit sollte der strukturell einfache Makrocyclus-Linker vorzuziehen sein. Folglich wurden die Linker nach folgenden Kriterien gefiltert: 1) enthalten nur eine Ringstruktur mit 6 Atomen oder weniger; 2) die Anzahl der schweren Atome auf dem kürzesten Weg ist auf den Bereich von 3–9 beschränkt; 3) das Verhältnis zwischen der Anzahl schwerer Atome auf dem kürzesten Weg und dem gesamten Linker beträgt mehr als 0,6; 4) das Verhältnis zwischen der Anzahl der Schweratome des Linkers und der ursprünglichen makrocyclischen Verbindung beträgt weniger als 0,25. Die SMILES-Strings des azyklischen Analogons wurden ebenfalls mit RDKit kanonisiert, wobei die beiden Schnittpunkte mit Dummy-Atomen markiert wurden. Die Informationen zur Linkerlänge wurden als Token vor der Sequenz hinzugefügt. Durch entsprechende Linkerlängen-Tokens55 wurde der resultierende Datensatz, der insgesamt 237.728 eindeutig übereinstimmende azyklische-makrozyklische Paare enthielt, zufällig in einen Trainingssatz (80 %), einen Validierungs- und einen Testsatz (jeweils 10 %) aufgeteilt.

Wir haben 486 bioaktive Makrozyklen aus der ZINC-Datenbank gesammelt, die alle nicht im ChEMBL-Datensatz vorhanden sind. Anschließend wurden daraus 5551 azyklisch-makrozyklische SMILES-Paare als externer Testdatensatz unter Verwendung desselben Datenverarbeitungsprotokolls extrahiert.

Mit RDKit wurden mehrere randomisierte SMILES generiert, um eine Datenerweiterung zu erreichen. Ein Molekül kann als 2D-Graph dargestellt werden, aus dem lineare SMILES-Notationen abgeleitet werden können, indem Knoten des Graphen einer bestimmten topologischen Reihenfolge folgend aufgezählt werden. Durch Festlegen des doRandom-Parameters der MolToSmiles-Funktion auf „True“ wählte RDKit zufällig einen Startknoten und den topologischen Pfad aus, um den Molekülgraphen aufzuzählen. Anschließend wurden zufällige SMILES der eingegebenen azyklischen Gerüste generiert. Die randomisierten SMILES der Zielmakrozyklen wurden auf eingeschränkte Weise generiert. Nach dem Unterstrukturabgleich durch RDKit werden die Indizes der Atome des Makrozyklus zurückgegeben, die mit der azyklischen Unterstrukturabfrage übereinstimmen. Diese Indizes wurden zuerst platziert, gefolgt von den Ordnungszahlen anderer Struktureinheiten, um die Atome des Makrozyklus neu anzuordnen. Die randomisierten SMILES des Zielmakrozyklus wurden schließlich anhand der neuen Ordnungszahlen erhalten.

Das Modell wurde auf Basis der Transformer-Architektur31 implementiert, die über eine schrittweise autoregressive Encoder-Decoder-Architektur verfügt. Sowohl Quell- als auch Ziel-SMILES-Sequenzen werden tokenisiert und in eine trainierbare Matrix eingebettet, wobei die Einbettungsvektorgröße für jedes Token auf 256 festgelegt ist. Außerdem werden die Sinus- und Kosinusfunktionen als Positionskodierung verwendet, um die Position verschiedener Token in der Sequenz anzuzeigen:

Dabei ist pos die Position und i bezeichnet den Iterator, der zur Konstruktion dieses Vektors verwendet wird, der von 0 bis demb/2 läuft. Die Positionskodierungen werden zu den Token-Einbettungen hinzugefügt und jede Sequenz wird schließlich wie folgt dargestellt:

Dabei ist xi der Vektor des i-ten Tokens (mit hinzugefügten Positionsvektoren) in einer Sequenz mit n Token.

Die Einbettungsmatrizen der Quellsequenzen werden in den Encoder eingespeist, um eine latente Darstellung L = (l1, l2, …, ln,) zu erzeugen und den Decodierungsprozess zu initialisieren. Sowohl Encoder als auch Decoder sind in identischen Schichten gestapelt. Jede Encoderschicht besteht aus einer Multi-Head-Attention-Subschicht und einer Positions-Feed-Forward-Netzwerk-Subschicht. Im Gegensatz zum Encoder wird in jede Decoderschicht eine zusätzliche Encoder-Decoder-Aufmerksamkeitsunterschicht eingefügt, die eine Multi-Head-Aufmerksamkeit über die Ausgabe des Encoderstapels ausübt und dem Decoder dabei hilft, sich auf geeignete Stellen in der Eingabesequenz zu konzentrieren.

Der Multi-Head-Aufmerksamkeitsmechanismus ermöglicht es dem Encoder und dem Decoder, gleichzeitig einen Blick auf verschiedene Token zu werfen, sodass der Transformatormodus erfolgreich mit Abhängigkeiten über große Entfernungen umgehen kann. Eine Multi-Head-Aufmerksamkeitseinheit besteht in dieser Studie aus acht parallel verlaufenden Aufmerksamkeitsschichten mit skalierten Punkten, die verkettet und in die Endwerte projiziert werden. Die Aufmerksamkeitsschicht mit skalierten Punkten verwendet drei Matrizen als Eingabe: die Matrix Q mit einer Reihe von Abfragen, die Matrix K mit Schlüsseln und die Matrix V mit Werten. Die Aufmerksamkeit wird wie folgt berechnet:

Dabei ist dk ein Skalierungsfaktor, der von der Größe der Gewichtsmatrizen abhängt.

Am Ende des Transformer-Modells werden nacheinander eine lineare Transformation und eine Softmax-Funktion angewendet, um die Decoder-Ausgabe in vorhergesagte Wahrscheinlichkeiten für das nächste Token umzuwandeln. Für eine bestimmte Quellsequenz besteht das Trainingsziel darin, die Lücke zwischen der vorhergesagten Sequenz und der entsprechenden Zielsequenz zu minimieren, die durch die Kreuzentropieverlustfunktion geschätzt wird:

Dabei ist k die Token-Nummer der Zielsequenz und yi und mi sind die Grundwahrheit bzw. die vorhergesagten Werte an der i-ten Position der Zielsequenz.

In unserer Studie wurde das Transformer-Modell mit vier Encoder- und Decoderschichten der Größe 256 konstruiert, was insgesamt 12 M trainierbare Parameter ergab. Zur Durchführung der Regularisierung wurde sowohl in der dichten als auch in der Aufmerksamkeitsschicht eine Abbruchrate von 0,1 verwendet. Das Modell wurde mit dem Adam-Optimierer56 mit β1 = 0,9 und β2 = 0,998 optimiert und die Lernrate variierte über 8000 Aufwärmschritte im Verlauf des Trainings. Die Batch-Größe wurde auf 2048 Token festgelegt und die Farbverläufe wurden über vier Batches akkumuliert, bevor die Parameter aktualisiert wurden. Das Modell wurde 200.000 Schritte auf einer GPU (NVIDIA TESLA V100) trainiert. Alle 10.000 Schritte wurde ein Prüfpunkt gespeichert und dann zur Modellvalidierung im Validierungssatz angewendet. Während der Schulungs- und Validierungskurse wurde eine Strategie zur Lehrererzwingung übernommen, daher wurde das Ausgabetoken auf der Grundlage des Grundwahrheitswerts aus dem vorherigen Zeitschritt vorhergesagt57. Alle Experimente wurden mit der PyTorch-Version von OpenNMT58 durchgeführt.

Zur Dekodierung der Quellsequenzen der Testdatensätze wurde ein Strahlsuchalgorithmus33 eingesetzt. Während die vorhergesagten Sequenzen erstellt werden, erweitert die Strahlsuche alle möglichen nächsten Token und verfolgt gleichzeitig die Top-k-Sequenzen basierend auf dem Produkt der Wahrscheinlichkeiten jedes Tokens.

Um sicherzustellen, dass Makrozyklen unter Verwendung derselben Daten wie Macformer erstellt werden, wurden 9243 einzigartige Linker aus dem ChEMBL-Trainingsdatensatz zum Aufbau der 3D-Linker-Datenbank verwendet. Für jeden Linker wurden maximal 20 Niedrigenergiekonformationen erzeugt und insgesamt 163.924 Strukturen erfasst. Dieser Prozess wurde mit RDKit implementiert und folgte dem in Referenz vorgeschlagenen Verfahren. 59. Die Konformationen der azyklischen und makrozyklischen Verbindungen wurden mit der gleichen Methode erzeugt, und die obersten drei Konformationen mit niedriger Energie wurden für jede chemische Struktur reserviert. Um den Makrocyclisierungsprozess zu beschleunigen, wurden die Linker zunächst nach geometrischen Kriterien gefiltert. Für die azyklischen 3D-Strukturen und Linker wurden zwei Abstandsparameter berechnet, einer zwischen den beiden austretenden Atomen auf den beiden Bindungsvektoren und der andere zwischen ihren benachbarten Atomen. Als zusätzlicher Parameter wurde auch der Diederwinkel der beiden Bindungsvektoren berechnet (ergänzende Abbildung 2). Der Abstandsschwellenwert zwischen der azyklischen Struktur und dem Linker ist auf 0,5 Å und der Diederwinkelschwellenwert auf 20° festgelegt. Nach Überlagerung der Bindungsvektoren der gegebenen azyklischen Struktur und der Linker, die die geometrischen Einschränkungen erfüllen, wurden die RMSD-Werte zwischen den Atomen der Bindungsvektoren berechnet (https://github.com/charnley/rmsd) und die Top-10-Linker ermittelt wurden zum Aufbau von Makrozyklen verwendet.

Die Leistungen von Macformer und MacLS wurden anhand der Metriken bewertet, die in früheren Arbeiten zur molekularen Generierung häufig verwendet wurden60.

Die Wiederherstellung ist der Prozentsatz der korrekt vorhergesagten Zielmakrozyklen des Testdatensatzes.

Die Gültigkeit ist der Prozentsatz der erzeugten chemisch gültigen Moleküle.

Eindeutigkeit ist der Prozentsatz einzigartiger Moleküle in den generierten gültigen Molekülen.

Neuheitmol ist der Prozentsatz der neuen Moleküle, die nicht im Trainingssatz vorhanden sind, an den generierten gültig eindeutigen Molekülen.

Neuheitslinker ist der Prozentsatz der neuen Moleküle, die über neue Linker verfügen, die nicht im Trainingssatz vorhanden sind, in den generierten gültig eindeutigen Molekülen.

Unter Makrocyclisierung versteht man den prozentualen Anteil an Makrozyklen in den erzeugten gültig eindeutigen Molekülen und ist ein eindeutiges Maß für die Makrocyclisierungsmethode.

Die Kristallstruktur der JAK2-Bindung mit Fedratinib (PDB-Code 6VNE) wurde aus der Proteindatenbank abgeleitet und mit dem Proteinvorbereitungsassistenten von Maestro v10.1 erstellt. Die das Gitter umschließende Box wurde auf dem Schwerpunkt des kristallographischen Liganden platziert und ein Skalierungsfaktor von 0,8 wurde auf Van-der-Waals-Radien mit partiellen Atomladungen von weniger als 0,15 eingestellt, um die unpolaren Teile des Rezeptors weicher zu machen. Die dreidimensionalen Strukturen von Verbindungen wurden mit dem Ligprep v3.3-Modul generiert und minimiert. Der Standardpräzisionsansatz (SP) von Glide wurde übernommen, um die Moleküle mit den Standardparametern an der Bindungsstelle anzudocken, und für jedes Molekül wurde nur die oberste Position beibehalten.

JAK-Kinase-Aktivitätstests wurden mit dem Z'-LYTETM-Kinase-Testkit (Life Technologies, pv4122) durchgeführt. Enzymreaktionen umfassen 10 μL Volumina 1 × Kinasepuffer (50 mM HEPES pH 7,5, 10 mM MgCl2, 1 mM EGTA, 0,01 % Brij-35) zusammen mit 25 μM ATP, 0,05–0,42 ng JAK2, 2 μM Peptidsubstrat (Tyr06). ) und verschiedene Konzentrationen von Verbindungen. Die Mischung wurde in die 384-Well-Mikrotiterplatte gegeben, leicht geschüttelt und dann 1 Stunde bei Raumtemperatur inkubiert. Anschließend wurden 5 μl Entwicklungslösung in die Vertiefung gegeben, um eine weitere Stunde lang zu inkubieren. Abschließend wurden 5 μL Stoppreagenz hinzugefügt, um die Reaktion zu stoppen. Die Fluoreszenz wurde mit Anregung bei 400 nm und Emission bei 445 und 520 nm gemessen. Die IC50-Werte wurden mit GraphPad Prism v8.0.3 berechnet und drei parallele Experimente durchgeführt.

Die humanen erythroiden Leukämiezellen (HEL 92.1.7) wurden von der American Type Culture Collection (ATCC, TIB-180) erworben, und die humanen Megakaryoblastenzellen (SET2) wurden von der Deutschen Sammlung für Mikroorganismen und Zellkulturen (DSMZ, ACC 608) bezogen ). Die antiproliferativen Aktivitäten der Verbindungen wurden mit dem WST-8-Zellzählkit-8 (Elabscience) bewertet. HEL- und SET-2-Zellen wurden mit 5000 Zellen/Well in 70 μl RPMI-1640-Medium (Hyclon) mit 10 % FBS (Gibco) auf der 96-Well-Platte ausgesät und über Nacht bei 37 °C mit 5 % CO2 inkubiert. Die Verbindungen wurden seriell in RPMI-1640-Medium verdünnt und die Zellen wurden 72 Stunden lang getrennt mit 30 μl verschiedenen Konzentrationen der Verbindungen behandelt. Die endgültige DMSO-Konzentration in den Kulturvertiefungen betrug 0,1 %, was keinen Einfluss auf die Lebensfähigkeit der Zellen hatte. Abschließend wurden 10 μl CCK-8-Lösung in die Vertiefungen gegeben. 4 Stunden später wurden die Absorptionswerte bei 450 nm aufgezeichnet. Die IC50-Werte wurden mit GraphPad Prism v8.3.0 bestimmt und drei parallele Experimente durchgeführt.

HEL-Zellen wurden in Platten mit sechs Vertiefungen gegeben (2 × 106 Zellen/Vertiefung) und dann in den Inkubator gegeben (37 °C, 5 % CO2). Nach 24 Stunden wurden die getesteten Verbindungen in RPMI-1640-Medium (endgültige DMSO-Konzentration = 0,1 %) mit unterschiedlichen Konzentrationen (0 μM, 0,3 μM, 1 μM, 3 μM und 10 μM) verdünnt und separat in die Vertiefungen gegeben weitere 0,5 Stunden inkubiert, dann wurden die Zellen gesammelt und lysiert. Proteine ​​​​aus jeder Probe wurden durch SDS-PAGE isoliert und auf eine PVDF-Membran übertragen. Die Membranen wurden 1 Stunde lang bei Raumtemperatur in 5 % Milch (TBST) blockiert und anschließend mit dem angegebenen Primärantikörper in Blockierungspuffer über Nacht bei 4 °C inkubiert. Primärantikörper wurden wie folgt verwendet: p-Y1007/8-JAK2 (#3771, CST, 1:1000), p-Y221-JAK2 (#11150, SAB, 1:500), p-Y705-STAT3 (#11045, SAB, 1:1000), p-Y694-STAT5 (#13386, SAB, 1:2000), STAT3 (10253-2-AP, Proteintech, 1:4000), STAT5 (12071-1-AP, Proteintech, 1: 4000), JAK2 (E-AB-70193, Elabscience, 1:2000) und β-Actin (E-AB-20034, Elabscience, 1:10000). Anschließend wurden die Membranen mit TBST (3 × 5 Minuten) gewaschen, 1 Stunde lang bei Raumtemperatur mit HRP-konjugiertem Sekundärantikörper inkubiert, erneut gewaschen und dann durch Chemilumineszenzmethode unter Verwendung des erweiterten ECL-Immunblotting-Systems (Tanon, Shanghai, China) exponiert. . Alle Experimente wurden dreifach wiederholt. Blot-Banden wurden durch Densitometrie mit der Image J-Software v1.51 quantifiziert.

Das Kinase-Selektivitätsprofil wurde mithilfe der DiscoveRx KINOMEscan-Plattform erstellt. Die Verbindungen wurden in einer Konzentration von 100 nM gegen eine Gruppe von 468 Kinasen gescreent. Die Testverbindungen wurden als 40-fache Stammlösung in 100 % DMSO hergestellt und direkt im Test verdünnt. Die Ergebnisse wurden als Prozentsatz des Signals zwischen der negativen (DMSO, 100 % Kontrolle) und der positiven (Kontrollverbindung, 0 % Kontrolle) Kontrolle definiert, der wie folgt berechnet wurde: Prozent Kontrolle = [(Testverbindungssignal – positives Kontrollsignal )/(negatives Steuersignal − positives Steuersignal)] × 100.

Die PK-Parameter der Verbindungen bei männlichen BALB/c-Mäusen (6–7 Wochen, 20–25 g, Shanghai SLRC-Labortier Co. Ltd) wurden von Hangzhou Leading Pharmatech Co., Ltd. durchgeführt. Die Mäuse wurden in einem Temperatur- Kontrollraum (22–25 °C, relative Luftfeuchtigkeit 52–63 %) mit 12-stündigen Dunkel-/Hell-Zyklen und hatten vor dem Experiment 3 Tage lang freien Zugang zu Nahrung und Wasser, um sich an die Umgebung anzupassen. Die 1 mg/ml-Dosierungslösungen von Verbindung 3 und Fedratinib wurden im Lösungsvehikel (5 % DMSO/30 % PEG400/65 % Kochsalzlösung) zur intravenösen und oralen Verabreichung zubereitet. Das gleiche Vehikel wurde für Verbindung 1 bei oraler Verabreichung verwendet, während 5 % DMSO/15 % (100 % Lösung)/80 % Kochsalzlösung bei intravenöser Verabreichung verwendet wurden. Den Mäusen wurde jeweils zu einem Zeitpunkt eine Gruppe von drei Mäusen getrennt zur intravenösen (5 mg/kg) oder oralen Verabreichung (5 mg/kg) verabreicht. Blutproben wurden 0,083, 0,25, 0,5, 1, 2, 4, 8 und 24 Stunden nach der intravenösen Verabreichung und 0,25, 1, 2, 3, 4, 6, 8 und 24 Stunden nach der oralen Verabreichung entnommen. Anschließend wurden die Proben durch Zentrifugation getrennt und mittels LC-MS/MS (XEVO TQ-S) analysiert, um die Plasma-Wirkstoffkonzentrationen zu bestimmen. Die PK-Parameter wurden unter Verwendung des Nicht-Kompartiment-Modells mit Phoenix WinNonLin v8.0 berechnet. Die tierexperimentellen Verfahren wurden von der Ethikkommission für medizinische Forschung der Hangzhou Leading Pharmatech Co., Ltd. genehmigt.

Männliche BALB/c-Mäuse (6 Wochen, ~20 g) wurden von Shanghai Sippr-BK Laboratory Animal Co. Ltd. erhalten. Die Mäuse wurden in einem Temperaturkontrollraum (25 °C, relative Luftfeuchtigkeit 40–60 %) mit 12 gehalten h-Dunkel-/Hell-Zyklen und hatten eine Woche lang freien Zugang zu Nahrung und Wasser, um sich vor dem Experiment an die Umgebung anzupassen. Alle tierexperimentellen Verfahren wurden von der Ethikkommission für medizinische Forschung der East China University of Science and Technology genehmigt.

Akute Kolitis wurde durch Ersetzen des Trinkwassers durch 3,5 % DSS (MW: 36.000–50.000, YEASEN) über 7 Tage (von Tag 1 bis Tag 7) induziert, wobei gesunde Kontrollmäuse normales Trinkwasser erhielten. Modellmäuse wurden in vier Gruppen eingeteilt und acht Mäuse wurden am 8. Tag in jede Gruppe aufgenommen. Die zu bewertenden Verbindungen wurden im solubilisierenden Vehikel (5 % DMSO/30 % PEG400/65 % Kochsalzlösung) formuliert und intragastrisch verabreicht, eine Routineverabreichung Methode, die auch in dem zuvor berichteten In-vivo-Test mit Fedratinib61 an Mäusen verwendet wurde, an verschiedene Gruppen zu einem festgelegten Zeitpunkt vom 8. bis zum 14. Tag. In der Zwischenzeit wurde der Kontrollgruppe und der Modellgruppe Lösungsmittel intragastrisch verabreicht. Am 15. Tag wurden die Mäuse getötet und die Länge und das Gewicht jedes Dickdarms gemessen.

Das Körpergewicht, die Stuhlkonsistenz und das Vorhandensein von Blut im Kot wurden täglich morgens aufgezeichnet. Der DAI wurde anhand der Kriterien bewertet: 0, Körpergewichtsverlust weniger als 1 %, normaler Stuhlgang, keine rektale Blutung; 1, Körpergewichtsverlust 1–4,99 %, weicherer Stuhl, schwache rektale Blutung; 2, Körpergewichtsverlust 5–10 %, mäßiger Durchfall, sichtbares Blut im Stuhl; 3, Körpergewicht mehr als 10 %, Durchfall, frische rektale Blutung. Die maximale Punktzahl betrug 9, was sich aus der Summe der Punktzahlen ergab. Etwa 1 cm dickes Dickdarmgewebe, das 0,5 cm vom Analrand entfernt ist, wurde entnommen und der Ileozökalbereich für die histopathologische Untersuchung verwendet. Nach der H&E-Färbung wurden die Gewebe unter Einfachblindbedingungen bewertet, um das Ausmaß der Entzündung und Gewebeschädigung im Dickdarm gemäß den in Ref. vorgeschlagenen Kriterien zu bewerten. 62. Statistische Analysen wurden mit SPSS v24.0 durchgeführt.

Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Portfolio Reporting Summary.

Die in dieser Studie verwendete kristallographische Struktur von Fedratinib im Komplex mit JAK2 ist in der PDB-Datenbank unter dem Zugangscode 6VNE verfügbar. Die aus der ChEMBL- bzw. ZINC-Datenbank extrahierten azyklisch-makrozyklischen SMILES-Paare und die in dieser Studie generierten vorab trainierten Modelle sind auf GitHub https://github.com/yydiao1025/Macformer verfügbar. Quelldaten werden mit diesem Dokument bereitgestellt.

Der Quellcode von Macformer und die zugehörigen Datenvorbereitungs-Python-v3.6.10-Skripte sind auf GitHub verfügbar (https://github.com/yydiao1025/Macformer)63.

Mallinson, J. & Collins, I. Makrozyklen in der Entdeckung neuer Arzneimittel. Zukünftiges Med. Chem. 4, 1409–1438 (2012).

Artikel CAS PubMed Google Scholar

Tron, AE et al. Entdeckung des Mcl-1-spezifischen Inhibitors AZD5991 und präklinische Aktivität bei multiplem Myelom und akuter myeloischer Leukämie. Nat. Komm. 9, 5341 (2018).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Giordanetto, F. & Kihlberg, J. Makrozyklische Arzneimittel und klinische Kandidaten: Was können medizinische Chemiker aus ihren Eigenschaften lernen? J. Med. Chem. 57, 278–295 (2014).

Artikel CAS PubMed Google Scholar

Lipinski, CA Fünferregel im Jahr 2015 und darüber hinaus: Einschränkungen der Ziel- und Ligandenstruktur, Struktur der Ligandenchemie und Entscheidungen zu Arzneimittelforschungsprojekten. Adv. Medikamentenlieferung. Rev. 101, 34–41 (2016).

Artikel CAS Google Scholar

Marsault, E. & Peterson, ML Makrozyklen sind großartige Zyklen: Anwendungen, Chancen und Herausforderungen synthetischer Makrozyklen in der Arzneimittelforschung. J. Med. Chem. 54, 1961–2004 (2011).

Artikel CAS PubMed Google Scholar

Whitty, A. et al. Quantifizierung der chamäleonischen Eigenschaften von Makrozyklen und anderen Arzneimitteln mit hohem Molekulargewicht. Arzneimittelentdeckung. Heute 21, 712–717 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Heinis, C. Werkzeuge und Regeln zur Wirkstoffentdeckung für Makrozyklen. Nat. Chem. Biol. 10, 696–698 (2014).

Artikel CAS PubMed Google Scholar

Zajac, M. et al. Hepatitis C – neue Medikamente und Behandlungsperspektiven. EUR. J. Med. Chem. 165, 225–249 (2019).

Artikel CAS PubMed Google Scholar

Dougherty, PG, Qian, ZQ & Pei, DH Makrozyklen als Protein-Protein-Interaktionsinhibitoren. Biochem. J 474, 1109–1125 (2017).

Artikel CAS PubMed Google Scholar

Abdelrahim, EMM, Shabani, S. & Domling, A. Künstliche Makrozyklen. Optics 29, 1136–1151 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Vendeville, S. & Cummings, MD Synthetische Makrozyklen in der Wirkstoffforschung kleiner Moleküle. Annu. Rep. Med. Chem. 48, 371–386 (2013).

CAS Google Scholar

Cummings, MD & Sekharan, S. Strukturbasiertes Makrocyclus-Design in der Wirkstoffforschung kleiner Moleküle und einfache Metriken zur Identifizierung von Möglichkeiten für die Makrocyclisierung kleiner Molekülliganden. J. Med. Chem. 62, 6843–6853 (2019).

Artikel CAS PubMed Google Scholar

Johnson, TW et al. Entdeckung von (10R)−7-Amino-12-fluor-2,10,16-trimethyl-15-oxo-10,15,16,17-tetrahydro-2H-8,4-(metheno)pyrazolo[4,3 -h][2,5,11]-Benzoxadiazacyclotetradecin-3-carbonitril (PF-06463922), ein makrozyklischer Inhibitor der anaplastischen Lymphomkinase (ALK) und des c-ros-Onkogens 1 (ROS1) mit präklinischer Hirnexposition und Breitbandwirksamkeit gegen ALK-resistente Mutationen. J. Med. Chem. 57, 4720–4744 (2014).

Artikel CAS PubMed Google Scholar

Viarengo-Baker, LA, Brown, LE, Rzepiela, AA & Whitty, A. Definition und Navigation im chemischen Raum von Makrozyklen. Chem. Wissenschaft. 12, 4309–4328 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Driggers, EM, Hale, SP, Lee, J. & Terrett, NK Die Erforschung von Makrozyklen für die Arzneimittelentwicklung – eine wenig genutzte Strukturklasse. Nat. Rev. Drug Discov. 7, 608–624 (2008).

Artikel CAS PubMed Google Scholar

Mulligan, VK Die neue Rolle des Computerdesigns bei der Entdeckung von Peptid-Makrozyklen-Arzneimitteln. Expertenmeinung. Drogendis. 15, 833–852 (2020).

Artikel CAS Google Scholar

Hosseinzadeh, P. et al. Umfassendes computergestütztes Design geordneter Peptidmakrozyklen. Science 358, 1461–1466 (2017).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Wagner, V. et al. Computergestützte Makrocyclisierung: von der De-novo-Makrozyklusgenerierung bis zur Bindungsaffinitätsschätzung. ChemMedChem 12, 1866–1872 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Sindhikara, D. et al. Automatisiertes Design von Makrozyklen für therapeutische Anwendungen: von kleinen Molekülen bis hin zu Peptiden und Proteinen. J. Med. Chem. 63, 12100–12115 (2020).

Artikel CAS PubMed Google Scholar

Chen, HM, Engkvist, O., Wang, YH, Olivecrona, M. & Blaschke, T. Der Aufstieg des Deep Learning in der Arzneimittelforschung. Arzneimittelentdeckung. Heute 23, 1241–1250 (2018).

Artikel PubMed Google Scholar

Zhong, FS et al. Künstliche Intelligenz im Arzneimitteldesign. Wissenschaft. China Life Sci 61, 1191–1204 (2018).

Artikel PubMed Google Scholar

Schneider, P. et al. Überdenken des Medikamentendesigns im Zeitalter der künstlichen Intelligenz. Nat. Rev. Drug Discov. 19, 353–364 (2020).

Artikel CAS PubMed Google Scholar

Jimenez-Luna, J., Grisoni, F. & Schneider, G. Arzneimittelentdeckung mit erklärbarer künstlicher Intelligenz. Nat. Mach. Intel. 2, 573–584 (2020).

Artikel Google Scholar

Mendez-Lucio, O., Baillif, B., Clevert, DA, Rouquie, D. & Wichard, J. De-novo-Generierung hit-ähnlicher Moleküle aus Genexpressionssignaturen mithilfe künstlicher Intelligenz. Nat. Komm. 11, 10 (2020).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Jing, YK, Bian, YM, Hu, ZH, Wang, LR & Xie, XQS Deep Learning für das Medikamentendesign: ein Paradigma der künstlichen Intelligenz für die Medikamentenentwicklung im Big-Data-Zeitalter. AAPS J. 20, 58 (2018).

Artikel PubMed Google Scholar

Weininger, D. SMILES, ein chemisches Sprach- und Informationssystem. 1. Einführung in die Methodik und Kodierungsregeln. J. Chem. Inf. Berechnen. Wissenschaft. 28, 31–35 (1988).

Artikel CAS Google Scholar

Moret, M., Friedrich, L., Grisoni, F., Merk, D. & Schneider, G. Generatives molekulares Design in Low-Data-Regimen. Nat. Mach. Intel. 2, 171–180 (2020).

Artikel Google Scholar

Arus-Pous, J. et al. Randomisierte SMILES-Strings verbessern die Qualität molekularer generativer Modelle. J. Cheminform. 11, 71 (2019).

Artikel PubMed PubMed Central Google Scholar

Arus-Pous, J. et al. SMILES-basierter Deep Generative Scaffold Decorator für das De-novo-Arzneimitteldesign. J. Cheminform. 12, 38 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Gaulton, A. et al. ChEMBL: eine groß angelegte Bioaktivitätsdatenbank für die Arzneimittelforschung. Nukleinsäuren Res. 40, D1100–D1107 (2012).

Artikel CAS PubMed Google Scholar

Vaswani, A. et al. Aufmerksamkeit ist alles, was Sie brauchen. Fortschritte in neuronalen Informationsverarbeitungssystemen 30 (Nips 2017), 5998–6008 https://arxiv.org/abs/1706.03762 (2017).

Kimber, TB, Engelke, S., Tetko, IV, Bruno, E. & Godin, G. Synergieeffekt zwischen Faltungs-Neuronalen Netzen und der Vielfalt von SMILES zur Verbesserung der molekularen Vorhersage. Vorabdruck unter https://arxiv.org/abs/1812.04439 (2018).

Freitag, M. & Al-Onaizan, Y. Beam-Suchstrategien für neuronale maschinelle Übersetzung. Vorabdruck unter https://arxiv.org/abs/1702.01806 (2017).

Landrum, G. RDKit: Open-Source-Software für Cheminformatik. http://www.rdkit.org (2016).

McInnes, L., Healy, J. & Melville, J. Umap: Einheitliche Mannigfaltigkeitsnäherung und Projektion zur Dimensionsreduktion. Vorabdruck unter https://arxiv.org/abs/1802.03426 (2018).

Belkina, AC et al. Automatisierte optimierte Parameter für die T-verteilte stochastische Nachbareinbettung verbessern die Visualisierung und Analyse großer Datensätze. Nat. Komm. 10, 5415 (2019).

Artikel ADS PubMed PubMed Central Google Scholar

Warr, WA Wissenschaftliche Workflow-Systeme: Pipeline-Pilot und KNIME. J. Comput. Unterstützt Mol. Des. 26, 801–804 (2012).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Taylor, PC Klinische Wirksamkeit eingeführter JAK-Inhibitoren bei rheumatoider Arthritis. Rheumatologie 58, 17–26 (2019).

Artikel Google Scholar

Hobbs, GS, Rozelle, S. & Mullally, A. Die Entwicklung und Verwendung von Januskinase-2-Inhibitoren zur Behandlung myeloproliferativer Neoplasien. Hämat. Oncol. Klin. Nr. 31, 613–626 (2017).

Artikel Google Scholar

William, AD et al. Entdeckung des Makrozyklus 11-(2-Pyrrolidin-1-yl-ethoxy)−14,19-dioxa-5,7,26-triaza-tetracyclo[19.3.1.1(2,6).1(8,12)] Heptacosa-1(25),2(26),3,5,8,10,12(27),16,21,23-Decaen (SB1518), eine starke Janus-Kinase 2/Fms-ähnliche Tyrosinkinase-3 ( JAK2/FLT3)-Inhibitor zur Behandlung von Myelofibrose und Lymphomen. J. Med. Chem. 54, 4638–4658 (2011).

Artikel CAS PubMed Google Scholar

Mascarenhas, J. et al. Pacritinib vs. beste verfügbare Therapie, einschließlich Ruxolitinib, bei Patienten mit Myelofibrose, eine randomisierte klinische Studie. JAMA Oncol 4, 652–659 (2018).

Artikel PubMed PubMed Central Google Scholar

Blair, HA Fedratinib: erste Zulassung. Drogen 79, 1719–1725 (2019).

Artikel CAS PubMed Google Scholar

Davis, MI et al. Umfassende Analyse der Kinase-Inhibitor-Selektivität. Nat. Biotechnologie. 29, 1046–U1124 (2011).

Artikel CAS PubMed Google Scholar

Zhou, T. et al. Spezifität und Wirkungsmechanismus der JAK2-Tyrosinkinase-Inhibitoren Ruxolitinib und SAR302503 (TG101348). Leukämie 28, 471–472 (2014).

Artikel Google Scholar

Davis, RR et al. Strukturelle Einblicke in die JAK2-Hemmung durch Ruxolitinib, Fedratinib und Derivate davon. J. Med. Chem. 64, 2228–2241 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Friesner, RA et al. Glide: ein neuer Ansatz für schnelles, präzises Andocken und Scoring. 1. Methode und Bewertung der Andockgenauigkeit. J. Med. Chem. 47, 1739–1749 (2004).

Artikel CAS PubMed Google Scholar

Mascarenhas, J. & Hoffman, R. Ruxolitinib: die erste von der FDA zugelassene Therapie zur Behandlung von Myelofibrose. Klin. Krebs Res. 18, 3008–3014 (2012).

Artikel CAS PubMed Google Scholar

Hart, S. et al. SB1518, ein neuartiger JAK2-Inhibitor auf der Basis makrozyklischer Pyrimidine zur Behandlung von myeloischen und lymphatischen Malignomen. Leukämie 25, 1751–1759 (2011).

Artikel CAS PubMed Google Scholar

Argetsinger, LS et al. Die Autophosphorylierung von JAK2 an den Tyrosinen 221 und 570 reguliert seine Aktivität. Mol. Zelle. Biol. 24, 4955–4967 (2004).

Artikel CAS PubMed PubMed Central Google Scholar

Song, L. et al. Hohe intestinale und systemische Werte des Interleukin-23/T-Helfer-17-Signalwegs bei chinesischen Patienten mit entzündlichen Darmerkrankungen. Mediatoren Entzündung. 2013, 425915 (2013).

Asadzadeh-Aghdaei, H. et al. V617F-unabhängige Hochregulierung der JAK2-Genexpression bei Patienten mit entzündlichen Darmerkrankungen. J. Zelle. Biochem. 120, 15746–15755 (2019).

Artikel CAS PubMed Google Scholar

Chassaing, B., Aitken, JD, Malleshappa, M. & Vijay-Kumar, M. Dextransulfat-Natrium (DSS)-induzierte Kolitis bei Mäusen. Curr. Protokoll. Immunol. 104, 15.25.1–15.25.14 (2014).

Artikel PubMed Google Scholar

Das, K., Eastwood, M., McManus, J. & Sircus, W. Nebenwirkungen während der Salicylazosulfapyridin-Therapie und der Zusammenhang mit dem Arzneimittelstoffwechsel und dem Acetylator-Phänotyp. N. engl. J. Med. 289, 491–495 (1973).

Artikel CAS PubMed Google Scholar

Hanzel, J., Hulshoff, MS, Grootjans, J. & D'Haens, G. Neue Therapien für Colitis ulcerosa. Experte Rev. Clin. Immunol. 18, 513–524 (2022).

Artikel CAS PubMed Google Scholar

Yang, YY et al. SyntaLinker: Automatische Fragmentverknüpfung mit tiefen bedingten transformatorischen neuronalen Netzen. Chem. Wissenschaft. 11, 8312–8322 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Kingma, DP & Ba, J. Adam: eine Methode zur stochastischen Optimierung. Vorabdruck unter https://arxiv.org/abs/1412.6980 (2014).

Luong, M.-T., Pham, H. & Manning, CD Effektive Ansätze für aufmerksamkeitsbasierte neuronale maschinelle Übersetzung. Vorabdruck unter https://arxiv.org/abs/1508.04025 (2015).

Klein, G., Kim, Y., Deng, YT, Senellart, J. & Rush, AM OpenNMT: Open-Source-Toolkit für neuronale maschinelle Übersetzung. In: Proc. 55. Jahrestagung der Association for Computational Linguistics (Acl 2017): System Demonstrations, 67–72 (2017).

Ebejer, JP, Morris, GM & Deane, CM Frei verfügbare Methoden zur Konformergenerierung: Wie gut sind sie? J. Chem. Inf. Modell. 52, 1146–1158 (2012).

Artikel CAS PubMed Google Scholar

Polykovskiy, D. et al. Molecular Sets (MOSES): eine Benchmarking-Plattform für molekulare Generationsmodelle. Vorderseite. Pharmakol. 11, 565644 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Werning, G. et al. Wirksamkeit von TG101348, einem selektiven JAK2-Inhibitor, bei der Behandlung eines Mausmodells der JAK2V617F-induzierten Polyzythämie vera. Cancer Cell 13, 311–320 (2008).

Artikel Google Scholar

Ameho, CK et al. Prophylaktische Wirkung einer Nahrungsergänzung mit Glutamin auf die Produktion von Interleukin 8 und Tumornekrosefaktor Alpha bei Trinitrobenzolsulfonsäure-induzierter Kolitis. Gut 41, 487–493 (1997).

Artikel CAS PubMed PubMed Central Google Scholar

Diao, Y. & Li, H. Makrozyklisierung linearer Moleküle durch Deep Learning zur Erleichterung der Entdeckung makrozyklischer Arzneimittelkandidaten. yydiao/Macformer. Zenodo https://doi.org/10.5281/zenodo.8125850 (2023).

Tao, ZF et al. Strukturbasiertes Design, Synthese und biologische Bewertung wirksamer und selektiver makrozyklischer Checkpoint-Kinase-1-Inhibitoren. J. Med. Chem. 50, 1514–1527 (2007).

Artikel CAS PubMed Google Scholar

Referenzen herunterladen

Diese Arbeit wurde teilweise vom National Key Research and Development Program of China (2022YFC3400501) unterstützt; und die National Natural Science Foundation of China (81825020 und 82150208); HL wurde außerdem vom National Program for Special Supports of Eminent Professionals und dem National Program for Support of Top-notch Young Professionals gesponsert.

Shanghai Key Laboratory of New Drug Design, School of Pharmacy, East China University of Science & Technology, Shanghai, 200237, China

Yanyan Diao, Dandan Liu, Huan Ge, Rongrong Zhang, Kexin Jiang, Runhui Bao, Xiaoqian Zhu, Hongjie Bi, Wenjie Liao, Ziqi Chen, Rui Wang, Lili Zhu, Zhenjiang Zhao und Honglin Li

Innovationszentrum für KI und Arzneimittelforschung, East China Normal University, Shanghai, 200062, China

Kai Zhang, Qiaoyu Hu und Honglin Li

Lingang Laboratory, Shanghai, 200031, China

Honglin Li

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

YD entwickelte die Macformer-Methode und schrieb das Manuskript; DL, RZ, HB, WL und ZZ synthetisierten die makrozyklischen Verbindungen; XZ analysierte die Stabilität der synthetisierten makrozyklischen Verbindungen in Lösung; HG, ZC und LZ bewerteten die Aktivitäten der Verbindungen gegen JAK2 auf enzymatischer und zellulärer Ebene; KJ, RB und RW führten die In-vivo-Experimente durch; KZ und QH halfen bei der Überarbeitung des Manuskripts; HL hat das gesamte Projekt entworfen und das Manuskript überarbeitet.

Korrespondenz mit Honglin Li.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Nature Communications dankt Yuemin Bian, Christian Heinis und den anderen, anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit. Eine Peer-Review-Datei ist verfügbar.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Diao, Y., Liu, D., Ge, H. et al. Makrozyklisierung linearer Moleküle durch Deep Learning, um die Entdeckung makrozyklischer Arzneimittelkandidaten zu erleichtern. Nat Commun 14, 4552 (2023). https://doi.org/10.1038/s41467-023-40219-8

Zitat herunterladen

Eingegangen: 28. Juli 2022

Angenommen: 18. Juli 2023

Veröffentlicht: 28. Juli 2023

DOI: https://doi.org/10.1038/s41467-023-40219-8

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein gemeinsam nutzbarer Link verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.