
Naradzające się między sobą modele sztucznej inteligencji (SI) uzyskały skuteczność odpowiedzi na poziomie 97, 93 i 94 proc. w trzech etapach amerykańskiego egzaminu medycznego USMLE. Rezultat ten wskazuje nowy paradygmat wprowadzania SI.
Naukowcy z Johns Hopkins Unviersity i innych ośrodków opracowali system, w którym pięć modeli SI opartych na Chat GPT, wspólnie analizuje pytania egzaminacyjne, porównuje i uzasadnienia swoje odpowiedzi, a następnie dochodzi do wspólnego wniosku.
Metoda, nazwana „AI council” (rada SI) została przetestowana na 325 pytaniach obejmujących medyczną wiedzę podstawową i kliniczną. Wynik zespołowego podejścia okazał się wyraźnie lepszy od działania pojedynczego modelu.
Rada SI, która nie była specjalnie trenowana pod kątem wiedzy medycznej, osiągnęła doskonałe wyniki.
„Nasze badanie pokazuje, że gdy kilka systemów sztucznej inteligencji prowadzi wspólną dyskusję, osiągają one najwyższą dotąd skuteczność w egzaminach licencyjnych dla lekarzy - odpowiednio 97, 93 i 94 proc. w trzech etapach testu - bez specjalnego szkolenia ani dostępu do danych medycznych. To dowód na siłę współpracy i dialogu między systemami SI, które pozwalają uzyskiwać dokładniejsze i bardziej wiarygodne odpowiedzi” – mówi Yahya Shaikh, współautor badania opisanego na łamach periodyku „PLOS Digital Health”.
„Nasza praca dostarcza pierwszych jednoznacznych dowodów, że systemy SI potrafią samodzielnie się korygować poprzez ustrukturyzowany dialog, a efekty ich współdziałania przewyższają możliwości pojedynczego modelu” – dodaje.
W sytuacjach, gdy modele nie były zgodne, do akcji wkraczał tzw. mediator – dodatkowy algorytm analizujący rozbieżności i streszczający argumenty. Następnie uruchamiano kolejną rundę dyskusji. Takie podejście pozwoliło poprawić błędne odpowiedzi w 53 proc. przypadków.
„Poprzez strukturyzowany dialog między systemami SI można samodzielnie korygować błędy, co pokazuje, że konsensus może przewyższać potencjał pojedynczego modelu” – podkreślają autorzy badania.
Choć metoda nie była jeszcze testowana w realnych warunkach klinicznych, naukowcy wskazują, że kolektywna inteligencja maszyn może w przyszłości zwiększać wiarygodność decyzji wspierających pracę lekarzy.
Marek Matacz (PAP)
mat/ agt/
Fundacja PAP zezwala na bezpłatny przedruk artykułów z Serwisu Nauka w Polsce pod warunkiem mailowego poinformowania nas raz w miesiącu o fakcie korzystania z serwisu oraz podania źródła artykułu. W portalach i serwisach internetowych prosimy o zamieszczenie podlinkowanego adresu: Źródło: naukawpolsce.pl, a w czasopismach adnotacji: Źródło: Serwis Nauka w Polsce - naukawpolsce.pl. Powyższe zezwolenie nie dotyczy: informacji z kategorii "Świat" oraz wszelkich fotografii i materiałów wideo.