Sztuczna inteligencja karmiona danymi generowanymi przez AI może się "załamać"

Świat

Sztuczna inteligencja karmiona danymi generowanymi przez AI może się "załamać"

27.07.2024 aktualizacja: 27.07.2024

2 minuty czytania

Fot. Adobe Stock

Modele sztucznej inteligencji (AI) upadają, gdy są trenowane na danych generowanych przez AI – dowodzą naukowcy na łamach „Nature”. Podkreślają też konieczność używania wiarygodnych danych do trenowania modeli AI.

Używanie zestawów danych generowanych przez AI do trenowania przyszłych generacji modeli uczenia maszynowego może zanieczyścić ich wyniki, co jest koncepcją znaną jako „upadek modelu” (model collapse). Badania pokazują, że w ciągu "życia" kilku generacji modeli sztucznej inteligencji oryginalna treść zostaje zastąpiona niepowiązanymi ze sobą nonsensami.

Narzędzia generatywnej sztucznej inteligencji, takie jak duże modele językowe (LLM), zyskały na popularności i były głównie trenowane za pomocą danych generowanych przez ludzi. Jednakże – jak dowodzą naukowcy – w miarę, jak te modele AI będą się rozprzestrzeniać w internecie, treści generowane komputerowo mogą być używane do trenowania innych modeli AI — lub siebie samych — co określa się za pomocą pojęcia pętla rekurencyjna.

Ilia Shumailov z Uniwersytetu Oksfordzkiego w Wielkiej Brytanii i jego współpracownicy, korzystając z modeli matematycznych, przedstawili, jak modele AI mogą doświadczać upadku. Autorzy pokazali, że AI może pomijać pewne wyniki (na przykład mniej powszechne fragmenty tekstu) w danych treningowych, co powoduje, że trening odbywa się tylko na części zestawu danych.

Naukowcy zbadali również, jak modele AI reagują na zestaw danych treningowych, który w większości został stworzony przez sztuczną inteligencję. Odkryli, że karmienie modelu danymi generowanymi przez AI powoduje, że kolejne generacje degradują, jeśli chodzi o zdolność do uczenia się, co ostatecznie prowadzi do upadku modelu. Niemal wszystkie testowane przez naukowców modele językowe trenowane rekurencyjnie wykazywały tendencję do powtarzania fraz. Badacze podali za przykład test, w którym wykorzystano do treningu tekst o średniowiecznej architekturze. Okazało się, że w dziewiątej generacji sztuczna inteligencja zamiast o architekturze, podawała informacje o zającach.

Autorzy badania wskazują, że upadek modelu jest nie do uniknięcia, jeśli do treningu AI będą używane zestawy danych tworzonych przez poprzednie generacje. Ich zdaniem skuteczne trenowanie sztucznej inteligencji na jej własnych wynikach nie jest niemożliwe, ale filtrowanie wygenerowanych danych należy traktować poważnie. Jednocześnie – zdaniem naukowców – firmy technologiczne, które będą wykorzystywały do trenowania AI tylko treści generowane przez ludzi, zyskają przewagę w porównaniu do konkurencji, która przyjmie inną strategię.

Więcej informacji w materiale źródłowym. (PAP)

Urszula Kaczorowska

uka/ zan/

sztuczna inteligencja

Fundacja PAP zezwala na bezpłatny przedruk artykułów z Serwisu Nauka w Polsce pod warunkiem mailowego poinformowania nas raz w miesiącu o fakcie korzystania z serwisu oraz podania źródła artykułu. W portalach i serwisach internetowych prosimy o zamieszczenie podlinkowanego adresu: Źródło: naukawpolsce.pl, a w czasopismach adnotacji: Źródło: Serwis Nauka w Polsce - naukawpolsce.pl. Powyższe zezwolenie nie dotyczy: informacji z kategorii "Świat" oraz wszelkich fotografii i materiałów wideo.

Świat

Odkryto cząsteczkę, która działa na kilka mechanizmów choroby Alzheimera
Świat

Dania na wynos często zawierają więcej soli niż podano w menu

Przed dodaniem komentarza prosimy o zapoznanie z Regulaminem forum serwisu Nauka w Polsce.

Zioło-Pużuk: koniec z gonitwą za punktami, liczyć się będzie poziom badań i jakość miejsca pracy
Polski wynalazca: w Polsce barierą dla kolei magnetycznej jest mentalność
Archeolodzy chcą rozwikłać sekret szkieletów w domu Göringa w Wilczym Szańcu
Badania: masa ciała jednym z najbardziej bezwzględnych kryteriów oceny na rynku pracy
Walka z dezinformacją ma być ustawową rolą uczelni. Prof. Jemielniak: ucierpią badania ryzykowne

Im więcej wypijamy kawy, tym mniejsze ryzyko poważnych schorzeń wątroby
Nowy kalkulator pomaga ocenić ryzyko poważnych skutków ubocznych statyn
Biologiczny zegar decyduje o jakości pracy
Substytuty cukru szkodzą jelitom i metabolizmowi
Fruktoza i glukoza mają tyle samo kalorii, ale inaczej wpływają na głód i apetyt

Świat

Szef ONZ ostrzega przed niebezpieczeństwami związanymi ze sztuczną inteligencją
Świat

ONZ/ Guterres: AI rozwija się szybciej, niż ktokolwiek jest w stanie nadążyć
Świat

„Economist”: AI przyniesie załamanie na rynku pracy, krach i koniec kontraktu społecznego

Polscy naukowcy rozpoczynają kolejną odsłonę projektu śledzenia migracji bocianów białych

Naukowcy z Polski kontynuują badania nad migracją i zachowaniem bocianów białych. W tegorocznej, drugiej edycji projektu zastosowali ulepszone urządzenia GPS i kamery, które pozwalają oglądać otoczenie z punktu widzenia ptaków. Powstało już nawet zdjęcie, na którym pierwszy raz w historii bocian udokumentował pracę człowieka.