Az Anthropic társalapítója, Jack Clark szerint az AI-ügynökök hamarosan képesek lehetnek modelleket építeni és tanítani, és ha ez bekövetkezik, az emberek elveszíthetik az irányítást az AI-rendszerek felett.
Az Anthropic társalapítója, Jack Clark azt szeretné, ha a mesterségesintelligencia-iparág még időben rálépne a fékre, mielőtt a technológia emberi beavatkozás nélkül kezdi továbbfejleszteni önmagát.
A BBC-nek nyilatkozva Clark elmondta, hogy az Anthropic kódolási munkáinak 80 százalékát már most is a cég Claude nevű mesterséges intelligenciája végzi, és ez néhány éven belül akár 100 százalékra is emelkedhet. Ugyanakkor hangsúlyozta: „döntés kérdése”, hogy a vállalatok hagyják-e idáig eljutni a folyamatot anélkül, hogy megállítanák.
„Úgy gondoljuk, hogy ez egy olyan téma, amelyről a világnak sokkal többet kellene beszélnie” – mondta Clark. „A mesterségesintelligencia-ipar jelenleg rendelkezik gázpedállal, de a kocsiban nincs fékpedál, és mi szeretnénk elvégezni annak a munkának egy részét, amely a fék kialakításához kell.”
Ezt a folyamatot „rekurzív önfejlesztésnek” nevezik: ilyenkor egy mesterséges intelligencia emberi beavatkozás nélkül képes önmaga továbbfejlesztésére – áll az Anthropic egy kapcsolódó csütörtök esti blogbejegyzésében (forrás: angol).
Egy rekurzív modellben az MI-ügynökök – vagyis a chatbotok által létrehozott autonóm „munkások” – idővel „eléggé képessé válhatnak arra, hogy saját maguk építsenek és tanítsanak modelleket”, így Claude „folyamatosan továbbfejleszthetné Claude-ot” – fogalmaz az Anthropic.
Bár a rekurzív mesterséges intelligencia a tudomány és az egészségügy terén is hozhatna pozitív eredményeket, az Anthropic arra figyelmeztet, hogy ezzel „megnőhet annak a kockázata, hogy az emberek elveszítik az ellenőrzést az MI-rendszerek felett”.
„Ha a rendszerek teljes mértékben képesek megalkotni saját utódaikat, akkor az, ahogyan biztosítjuk, felügyeljük őket, és ahogyan formáljuk a viselkedésüket, mindennél fontosabbá válik” – olvasható a blogbejegyzésben.
Már az Anthropic saját modellje is arra utal, hogy a rekurzió inkább előbb, mint utóbb megjelenik. A cég szerint ezt jelzi például, hogy az elmúlt egy évben folyamatosan csökkent a munkatársaik által végzett kódjavítások aránya, ami azt jelenti, hogy Claude kevesebb hibát vét.
Claude emellett képes saját kutatási kísérleteket is futtatni, ha nyitott végű kérdést kap, például: „Képes lehet-e egy gyengébb modell egy erősebbet felügyelni?”, és emberi beavatkozás nélkül is képes saját megoldásokkal előállni.
„A bizonyítékok arra utalnak, hogy a mesterséges intelligencia fejlesztésének minden egyes lépésében szűkül az emberi szerep” – áll a blogban.
Az Anthropic közölte, hogy intézete olyan kutatásokat végez majd, amelyek célja egy olyan rendszer kidolgozása, amellyel ellenőrizni lehet, hogy a fejlesztők valóban megállították-e, illetve lelassították-e a rekurzív MI felé vezető folyamatot.
Valódi lassítás azonban csak akkor valósulhatna meg, ha „több, jelentős erőforrásokkal rendelkező, a technológiai élvonalban működő laboratórium, több országban is, ugyanazok mellett a feltételek mellett egyezne meg a leállásról”.