Sztuczna inteligencja zamiast biologa

Fot. Adobe Stock
Fot. Adobe Stock

SI określiła trójwymiarową strukturę praktycznie wszystkich białek znanych nauce. A to dopiero początek, bo inteligentne komputery nieporównanie sprawniej od człowieka potrafią prowadzić różnego typu biologiczne badania, w tym testować nowe leki.

Eksperci z EMBL European Bioinformatics Institute (EMBL-EBI) i firmy DeepMind ogłosili wyjątkowe dokonanie, które łączy dwie dziedziny - biologię molekularną i sztuczną inteligencję. Z pomocą inteligentnego programu stworzyli bazę z opisem trójwymiarowej struktury niemal wszystkich znanych nauce białek. Białka pochodzą z organizmów, których genom udało się do tej pory zsekwencjonować - w tym roślin, bakterii, zwierząt. Już wcześniejsza, znacznie uboższa wersja stała się ważnym narzędziem dla badaczy z całego świata.

„AlphaFold oferuje trójwymiarowy wgląd we wszechświat białek. Popularność stworzonej bazy oraz jej wzrost to wspólny sukces DeepMind i EMBL. Pokazuje nam dostrzec moc multidyscyplinarnych badań” - zwraca uwagę dyrektor generalny EMBL, Edith Heard. „Byliśmy zadziwieni tempem, z jakim AlphaFold stała się podstawowym narzędziem setek tysięcy naukowców w laboratoriach i uniwersytetach z całego świata. Od walki z chorobami po próby usuwania zanieczyszczeń plastikiem, AlphaFold wywarła już wpływ na prace nad największymi globalnymi wyzwaniami. Mamy nadzieję, że rozbudowana baza będzie pomagała niezliczonej rzeszy naukowców w ich tak ważnej pracy i otworzy zupełnie nowe drogi do naukowych odkryć” - mówi Demis Hassabis, założyciel i prezes DeepMind.

Pierwsza wersja systemu powstała w 2021 roku i zawierała opis budowy 350 tys. białek, w tym wszystkich białek ludzkich. Potem dodawano kolejne proteomy (zestaw białek danego gatunku) m.in. związane z tropikalnymi chorobami. W niecały rok bazę cytowało ponad tysiąc naukowych publikacji i korzystało z niej ponad 500 tys. specjalistów ze 190 krajów, aby przejrzeć ponad 2 mln białek. Niektórzy eksperci, na podstawie oprogramowania AlphaFold stworzyli własne informatyczne narzędzia do pracy z białkami i inne systemy, np. przewidujące strukturę RNA. Konsekwencje powstania bazy trudno jest więc przecenić, to bowiem od białek zależy niemal wszystko, co dzieje się w żywej komórce.

Wśród prowadzonych dzięki AlphaFold badań można wymienić m.in. prace związane z chorobą Parkinsona, zaniedbanymi chorobami takimi jak choroba Chagasa czy leiszmanioza, nad zdrowiem pszczół czy ewolucją człowieka.

„AlphaFold wytworzyła falę, która rozchodzi się w społeczności związanej z biologią molekularną. Tylko w ostatnim roku pojawiło się ponad tysiąc naukowych artykułów poświęconych różnym tematom, które odnosiły się do AlphaFold. Nigdy nie widziałem czegoś takiego” - mówi Sameer Velankar z EMBL-EBI’s Protein Data Bank. „A to tylko wpływ bazy z milionem struktur. Wyobraźmy sobie oddziaływanie 200 mln dostępnych dla wszystkich struktur białek” - podkreśla ekspert.

Jednak oprócz tego, jak białko jest zbudowane (od czego zależy jego działanie), niemniej istotne jest, w którym miejscu komórki się znajduje. Nad taką mapą pracują eksperci z Chan Zuckerberg Biohub. Zespół ten właśnie zaprezentował oparty na sztucznej inteligencji system, który nauczył się analizować mikroskopowe obrazy białek. System o nazwie Cytoself przedstawia lokalizację danego białka w komórce oraz jego funkcję. Każda komórka zwiera tymczasem tysiące różnych białek, z których wiele pracuje przy tym wspólnie. „Komórka jest dużo bardziej zorganizowana przestrzennie, niż nam się kiedyś wydawało” - mówi Manuel Leonetti, jeden z autorów pracy opublikowanej w piśmie „Nature Methods”.

Komputery mogą więc zaoszczędzić ludziom gigantyczną ilość pracy. Co więcej system został tak zaprogramowany, że sam nauczył się, jak analizować mikroskopowe obrazy. „W nadzorowanym uczeniu sztucznej inteligencji trzeba ręcznie pokazywać jej kolejne przykłady. Oznacza to ogrom żmudnej pracy” - podkreśla główny autor badania Hirofumi Kobayashi. „Pytanie o miejsca występowania danego białka - o wszystkie lokalizacje i ich kombinacje, w których może się znajdować - ma fundamentalne znaczenie. Biolodzy próbowali ustalić wszystkie możliwe miejsca i komórkowe struktury występowania białek od dekad. Zawsze jednak robiło się to z pomocą pracy człowieka analizującego dane. Rodzi się pytanie - w jakim stopniu ograniczenia i niedokładności ludzi wprowadziły błędy” - podkreśla Loic Royer jeden z autorów nowej publikacji.

Naukowcy twierdzą, że zaskoczyła ich ilość informacji, jaką algorytm potrafił wydobyć z samodzielnie analizowanych mikroskopowych zdjęć komórek. „Poziom dokładności lokalizowania białek był dużo wyższy, niż się spodziewaliśmy” - podkreśla dr Manuel Leonetti.

Wprowadzana do biologii molekularnej SI wykracza już jednak dalej, niż badania podstawowe. Specjaliści z Nagoya University zaprezentowali w lipcu system, który pomaga dopracować leczenie zaburzeń neurodegeneracyjnych. Jak zwracają uwagę naukowcy, leki przeciw chorobom tego typu często powodują przykre skutki uboczne, jak np. zaburzenia funkcji seksualnych czy działania mięśni. Szukający lepszych leków naukowcy zauważyli, że wymagające terapii neurony mają nieco inny kształt od pozostałych. To oznacza, że być może na tej podstawie dałoby się opracować terapie działające bardziej selektywnie - tylko na chore komórki. Jednak różnice te trudno jest zauważyć człowiekowi, co bardzo utrudnia badania. Komputerowy system o nazwie FOCUS świetnie sobie z tym radzi i do tego sprawdza, czy neuron o danym kształcie reaguje na wybrany lek. Badacze przetestowali swój system na chorobie Kennedy’ego (opuszkowo-rdzeniowym zaniku mięśni), która prowadzi do śmierci neuronów motorycznych. FOCUS potrafił ze 100 proc. dokładnością rozpoznać reakcję komórek na terapię.

„Technologia ta umożliwia czułą i niezawodną ocenę skutków działania leków przez analizę zmiany kształtu chorych komórek w kształt komórek zdrowych. W normalnych warunkach nie potrafiliśmy ich rozróżnić” - tłumaczy kierujący pracami prof. Ryuji Kato. „To ultrawydajna metoda badań przesiewowych, która pozwala przewidzieć ich skuteczność tylko z pomocą analizy zdjęć. Dzięki temu można zaoszczędzić czas potrzebny do prowadzenia analizy działania leku z kilku godzin - w przypadku kilkuset tysięcy komórek - do zaledwie kilku minut. Metoda pozwala na dokładne prognozowanie terapeutycznych efektów bez konieczności prowadzenia skomplikowanych i inwazyjnych eksperymentów” - podkreśla specjalista. Wygląda więc na to, że stanie się potężnym narzędziem biologów, co może wprowadzić badania na nowy poziom, a to powinno przynieść odkrycia, terapie i inne niespodzianki, których dzisiaj nie przewidzi chyba nawet sama SI.

Marek Matacz

Fundacja PAP zezwala na bezpłatny przedruk artykułów z Serwisu Nauka w Polsce pod warunkiem mailowego poinformowania nas raz w miesiącu o fakcie korzystania z serwisu oraz podania źródła artykułu. W portalach i serwisach internetowych prosimy o zamieszczenie podlinkowanego adresu: Źródło: naukawpolsce.pl, a w czasopismach adnotacji: Źródło: Serwis Nauka w Polsce - naukawpolsce.pl. Powyższe zezwolenie nie dotyczy: informacji z kategorii "Świat" oraz wszelkich fotografii i materiałów wideo.

Czytaj także

  • Deska Galtona ilustruje sposób powstawania w naturze rozkładu normalnego pod wpływem drobnych losowych odchyleń fot: Matemateca (IME/USP) via Wikipedia

    Kwestia smaku w matematyce. Co wyróżnia piękne dowody i twierdzenia?

  • Adobe Stock

    Akcja: autoryzacja

Przed dodaniem komentarza prosimy o zapoznanie z Regulaminem forum serwisu Nauka w Polsce.

newsletter

Zapraszamy do zapisania się do naszego newslettera