Badacze opracowali nowy model oparty na sztucznej inteligencji, zaprojektowany do przewidywania sekwencji białek z rusztowań szkieletowych, obejmujący złożone środowiska molekularne. Obiecuje on znaczące postępy w inżynierii białek i zastosowaniach w różnych dziedzinach, w tym medycynie i biotechnologii.
Opis obrazu: Schematyczna reprezentacja przewidywania sekwencji za pomocą CARBonAra. Transformator geometryczny pobiera próbki przestrzeni sekwencji enzymu beta-laktamazy TEM-1 (w kolorze szarym) kompleksującego naturalny substrat (w kolorze cyjanowym), aby wytworzyć nowe, dobrze złożone i aktywne enzymy. Źródło: Alexandra Banbanaste (EPFL)
Projektowanie białek, które mogą wykonywać określone funkcje, wymaga zrozumienia i manipulowania ich sekwencjami i strukturami. To zadanie jest kluczowe dla opracowywania ukierunkowanych metod leczenia chorób i tworzenia enzymów do zastosowań przemysłowych.
Jednym z największych wyzwań w inżynierii białek jest projektowanie białek de novo, czyli od podstaw, aby dostosować ich właściwości do konkretnych zadań. Ma to głębokie implikacje dla biologii, medycyny i nauki o materiałach. Na przykład, inżynieryjne białka mogą celować w choroby z dużą precyzją, oferując konkurencyjną alternatywę dla tradycyjnych leków opartych na małych cząsteczkach.
Ponadto specjalnie zaprojektowane enzymy, które działają jako naturalne katalizatory, mogą ułatwiać rzadkie lub nieistniejące reakcje w naturze. Ta zdolność jest szczególnie cenna w przemyśle farmaceutycznym do syntezy złożonych cząsteczek leków i w technologii środowiskowej do bardziej wydajnego rozkładu zanieczyszczeń lub tworzyw sztucznych.
Zespół naukowców pod przewodnictwem Matteo Dal Peraro z EPFL opracował teraz CARBonAra (Context-aware Amino acid Recovery from Backbone Atoms and heteroatoms), model oparty na sztucznej inteligencji, który może przewidywać sekwencje białek, ale biorąc pod uwagę ograniczenia narzucane przez różne środowiska molekularne – wyjątkowe osiągnięcie. CARBonAra jest trenowany na zestawie danych obejmującym około 370 000 podjednostek, z dodatkowymi 100 000 do walidacji i 70 000 do testowania z Protein Data Bank (PDB).
CARBonAra opiera się na architekturze struktury Protein Structure Transformer (PeSTo) – również opracowanej przez Luciena Krappa z grupy Dal Peraro. Wykorzystuje transformatory geometryczne, które są modelami głębokiego uczenia, przetwarzającymi relacje przestrzenne między punktami, takimi jak współrzędne atomowe, w celu uczenia się i przewidywania złożonych struktur.
CARBonAra może przewidywać sekwencje aminokwasów z rusztowań szkieletowych, strukturalnych ram cząsteczek białkowych. Jednak jedną z wyróżniających się cech CARBonAra jest świadomość kontekstu, która jest szczególnie widoczna w tym, jak poprawia wskaźniki odzyskiwania sekwencji – procent prawidłowych aminokwasów przewidywanych w każdej pozycji w sekwencji białkowej w porównaniu ze znaną sekwencją odniesienia.
CARBonAra znacząco poprawiła wskaźniki odzyskiwania, gdy uwzględniała „konteksty” molekularne, takie jak interfejsy białkowe z innymi białkami, kwasami nukleinowymi, lipidami lub jonami. „Dzieje się tak, ponieważ model jest trenowany z wszelkiego rodzaju cząsteczkami i opiera się wyłącznie na współrzędnych atomowych, dzięki czemu może obsługiwać nie tylko białka” — wyjaśnia Dal Peraro. Ta cecha z kolei zwiększa moc predykcyjną modelu i jego przydatność w rzeczywistych, złożonych systemach biologicznych.
Model nie sprawdza się dobrze tylko w testach syntetycznych, ale został eksperymentalnie zweryfikowany. Naukowcy wykorzystali CARBonAra do zaprojektowania nowych wariantów enzymu TEM-1 –laktamazy, który bierze udział w rozwoju oporności na środki przeciwdrobnoustrojowe. Niektóre z przewidywanych sekwencji, różniące się o około 50% od sekwencji typu dzikiego, zostały prawidłowo złożone i zachowują pewną aktywność katalityczną w wysokich temperaturach, gdy enzym typu dzikiego jest już nieaktywny.
Elastyczność i dokładność CARBonAra otwierają nowe możliwości inżynierii białek. Jego zdolność do uwzględniania złożonych środowisk molekularnych sprawia, że jest cennym narzędziem do projektowania białek o określonych funkcjach, co usprawnia przyszłe kampanie odkrywania leków. Ponadto sukces CARBonAra w inżynierii enzymów pokazuje jego potencjał do zastosowań przemysłowych i badań naukowych.
Bibliografia
Lucien F. Krapp, Fernando A. Meireles, Luciano A. Abriata, Jean Devillard, Sarah Vacle, Maria J. Marcaida, Matteo Dal Peraro. Głębokie uczenie geometryczne uwzględniające kontekst do projektowania sekwencji białek. Nature Communications 25 lipca 2024 r. DOI: 10.1038/s41467’024 -50571-y