Sztuczna inteligencja dopasowuje partnerów interakcji białkowych – SofolFreelancer


Porównanie domyślnej strategii parowania transformatorów MSA AFM z DiffPALM w celu określenia struktury białka.

Naukowcy z EPFL prezentują DiffPALM, innowacyjną metodę sztucznej inteligencji, która poprawia przewidywanie interakcji białkowych i pomaga nam zrozumieć procesy biologiczne potencjalnie istotne w zastosowaniach medycznych.

Białka są budulcem życia, zaangażowanym w praktycznie każdy proces biologiczny. Zrozumienie, w jaki sposób białka oddziałują ze sobą, jest kluczowe dla rozszyfrowania złożoności funkcji komórkowych i ma istotne implikacje dla rozwoju leków i leczenia chorób.

Jednak przewidywanie, które białka wiążą się ze sobą, było trudnym aspektem biologii obliczeniowej, głównie ze względu na ogromną różnorodność i złożoność struktur białek. Ale nowe badanie przeprowadzone przez grupę Anne-Florence Bitbol z EPFL może teraz to wszystko zmienić.

Zespół naukowców, w tym Umberto Lupo, Damiano Sgarbossa i Bitbol, ​​opracował DiffPALM (Differentiable Pairing using Alignment-based Language Models), podejście oparte na sztucznej inteligencji, które może znacznie przyspieszyć przewidywanie oddziałujących sekwencji białek. Badanie zostało opublikowane w PNAS.

DiffPALM wykorzystuje moc modeli języka białek, zaawansowanej koncepcji uczenia maszynowego zapożyczonej z przetwarzania języka naturalnego, aby analizować i przewidywać interakcje białek między członkami dwóch rodzin białek z niespotykaną dotąd dokładnością. Wykorzystuje te techniki uczenia maszynowego do przewidywania oddziałujących par białek. Prowadzi to do znacznej poprawy w porównaniu z innymi metodami, które często wymagają dużych, zróżnicowanych zestawów danych i zmagają się ze złożonością kompleksów białek eukariotycznych.

Kolejną zaletą DiffPALM jest jego wszechstronność, ponieważ może działać nawet z mniejszymi zestawami danych sekwencji, a tym samym odnosić się do rzadkich białek, które mają niewiele homologów — białek różnych gatunków, które mają wspólne pochodzenie ewolucyjne. Opiera się na modelach języka białek trenowanych na wielu dopasowaniach sekwencji (MSA), takich jak MSA Transformer i moduł EvoFormer AlphaFold, co pozwala mu zrozumieć i przewidzieć złożone interakcje między białkami z wysokim stopniem dokładności. Co więcej, korzystanie z DiffPALM daje duże nadzieje, jeśli chodzi o przewidywanie struktury kompleksów białkowych, które są skomplikowanymi strukturami tworzonymi przez wiązanie wielu białek i są niezbędne dla wielu procesów komórkowych.

W badaniu zespół porównał DiffPALM z tradycyjnymi metodami parowania opartymi na koewolucji, które badają, w jaki sposób sekwencje białek ewoluują razem w czasie, gdy ściśle oddziałują — zmiany w jednym białku mogą prowadzić do zmian w jego partnerze oddziałującym. Jest to niezwykle ważny aspekt biologii molekularnej i komórkowej, który jest dobrze uchwycony przez modele języka białek trenowane na MSA. Wykazano, że DiffPALM przewyższa tradycyjne metody Top of Formon wymagające testy porównawcze, co dowodzi jego solidności i wydajności.

Zastosowanie DiffPALM jest oczywiste w dziedzinie podstawowej biologii białek, ale wykracza poza nią, ponieważ ma potencjał, aby stać się potężnym narzędziem w badaniach medycznych i rozwoju leków. Na przykład dokładne przewidywanie interakcji białek może pomóc zrozumieć mechanizmy chorób i opracować ukierunkowane terapie.

Naukowcy udostępnili narzędzie DiffPALM bezpłatnie, mając nadzieję, że środowisko naukowe szeroko je przyjmie, co przyczyni się do dalszego rozwoju biologii obliczeniowej i umożliwi naukowcom badanie złożoności interakcji białkowych.

Łącząc zaawansowane techniki uczenia maszynowego i wydajne przetwarzanie złożonych danych biologicznych, DiffPALM oznacza znaczący krok naprzód w biologii obliczeniowej. Nie tylko zwiększa nasze zrozumienie interakcji białek, ale także otwiera nowe ścieżki w badaniach medycznych, potencjalnie prowadząc do przełomów w leczeniu chorób i rozwoju leków.

Bibliografia

Umberto Lupo, Damiano Sgarbossa, Anne-Florence Bitbol. Parowanie oddziałujących sekwencji białkowych przy użyciu maskowanego modelowania języka. PNAS 24 czerwca 2024 r. DOI: 10.1073/pnas.2311887121

Leave a Reply