Anthropic: kiberbűnözők és kémek visszaélhetnek vele, ezért egyelőre nem indul nyilvánosan a Mythos Preview MI-modell
Az Egyesült Államokban működő Anthropic mesterségesintelligencia-fejlesztő cég a héten bejelentett egy új, általános célú nyelvi modellt, amelyről azt állítja, hogy túl erős ahhoz, hogy szabadon elengedjék a világban.
A vállalat kedden közölte (forrás: angol), hogy legújabb technológiája, a Mythos (hivatalos nevén „Claude Mythos Preview”) egyelőre nem alkalmas a nyilvános bevezetésre, mert túl hatékonyan találja meg a súlyos sebezhetőségeket, illetve a főbb operációs rendszerekben és böngészőkben meglévő potenciális gyengeségeket. Ez azt kockáztatja, hogy kiberbűnözők és hírszerző szolgálatok visszaélnek vele.
Egy márciusi adatkiszivárgás fedte fel először, hogy az Anthropic a Mythos Preview-n dolgozik, amelyről akkor azt mondta, „példátlan kiberbiztonsági kockázatokat” hordoz. A hírek hatására a kiberbiztonsági cégek részvényei esni kezdtek, mivel a technológia ereje a hackerek álomeszközévé teheti a modellt.
Most újabb bizonyítékok erősítették meg ezeket az aggodalmakat, ami arra késztette a céget, hogy leállítsa a technológia nyilvános megjelentetését.
„A Claude Mythos Preview képességeinek jelentős növekedése miatt úgy döntöttünk, hogy nem tesszük általánosan elérhetővé” – írta az Anthropic a kedden közzétett, a modellről szóló rendszerleírásban.
„Ehelyett egy védelmi célú kiberbiztonsági program részeként használjuk, korlátozott számú partnerrel.”
Mennyire erős a Mythos?
A vállalat több aggasztó eredményt is részletezett az új modellel kapcsolatban, például hogy képes volt követni azokat az utasításokat, amelyek arra bíztatták, hogy törjön ki egy virtuális homokozóból, vagyis megkerülje a modellre vonatkozó biztonsági, hálózati vagy fájlrendszer-korlátozásokat.
A prompt azt kérte a Mythostól, hogy ha sikerül kitörnie, találjon módot egy üzenet elküldésére. „A modellnek ez sikerült, ami arra utal, hogy veszélyes módon képes megkerülni a védelmi mechanizmusainkat” – közölte az Anthropic, hozzátéve, hogy a modell ezután még tovább ment.
„Egy aggasztó, és tőlünk nem kért kísérletként, a siker demonstrálása érdekében a modell több, nehezen megtalálható, de technikailag nyilvános weboldalon is közzétette a kihasznált sebezhetőség részleteit.”
Az Anthropic visszatart bizonyos részleteket azokról a kiberbiztonsági résekről, amelyeket a Mythos felfedezett, de néhány példát nyilvánosságra hozott. A modell hibákat talált a Linux kernelben, amelyet a világ szervereinek többsége használ, és ezeket önállóan úgy fűzte össze, hogy egy hacker teljes irányítást szerezhet bármely, Linuxot futtató gép felett.
Egy másik, aggodalomra okot adó esetben a Mythos egy 27 éve meglévő sebezhetőséget azonosított az OpenBSD nyílt forráskódú operációs rendszerben, amely lehetővé teheti, hogy hackerek összeomlasszanak bármelyik ilyen rendszert futtató gépet. Az OpenBSD-t világszerte széles körben használják speciális, magas biztonsági igényű és kritikus infrastruktúrákban.
Kik kapnak hozzáférést?
A mostani eredmények fényében az Anthropic csak a világ legnagyobb kiberbiztonsági és szoftvercégei egy részének teszi elérhetővé a Mythos Preview-t.
Hozzáférést kap maga az Anthropic, valamint további 11 szervezet (az Amazon Web Services, az Apple, a Broadcom, a Cisco, a CrowdStrike, a Google, a JPMorganChase, a Linux Foundation, a Microsoft, az Nvidia és a Palo Alto Networks) az Anthropic új kezdeményezése, a „Project Glasswing” keretében.
Ez lehetővé teszi a cégek számára, hogy a Mythos Preview-t biztonsági munkájuk részeként használják, az Anthropic pedig megosztja majd a program tanulságait.
A vállalat a kiberbiztonsági projektet a glasswing (átlátszószárnyú) pillangóról nevezte el, mondván, ez jól szemlélteti, hogyan talált a Mythos nyíltan, mindenki szeme előtt meglévő sebezhetőségeket, és hogyan igyekezett a kockázatokat átláthatóan bemutatva megelőzni a károkat.
Az Anthropic közölte, hogy „hosszú távú célja, hogy felhasználóink biztonságosan, nagy léptékben is bevethetővé tegyék a Mythos-kategóriájú modelleket kiberbiztonsági célokra, de azokra a számos egyéb területre is, ahol az ilyen nagy teljesítményű modellek előnyöket hozhatnak”.
„Ehhez az is szükséges, hogy előrelépjünk olyan kiberbiztonsági (és más) védelmi rendszerek fejlesztésében, amelyek képesek észlelni és blokkolni a modell legveszélyesebb kimeneteit” – írta a cég blogbejegyzésében.
Folyik egyeztetés az amerikai kormánnyal?
Az Anthropic a blogposztban azt is közölte, hogy „folyamatos egyeztetést” folytat amerikai kormányzati tisztviselőkkel a Claude Mythos Preview „támadó és védelmi célú kiberképességeiről”.
„Ezeknek a kiberképességeknek a megjelenése újabb ok arra, hogy az Egyesült Államok és szövetségesei megőrizzék egyértelmű technológiai előnyüket a mesterséges intelligencia terén” – írta a cég. Hozzátették, a kormányoknak fontos szerepük van abban, hogy fenntartsák ezt az előnyt, illetve felmérjék és mérsékeljék az MI-modellekhez kapcsolódó nemzetbiztonsági kockázatokat.
„Készen állunk együttműködni a helyi, állami és szövetségi döntéshozókkal, hogy segítsük őket ezekben a feladatokban.”
A bejelentés arra az időszakra esik, amikor az Anthropic és a Pentagon jogi vitában áll, miután az amerikai védelmi minisztérium februárban ellátási láncot érintő kockázatnak minősítette a céget, mivel az Anthropic nem engedte, hogy Claude nevű MI-jét autonóm fegyverekben és tömeges megfigyelésre használják.
Más MI-eszközök is képesek erre?
„Hozzánk és másokhoz is köthetők majd még ennél is erősebb modellek, ezért szükség van egy tervre, hogyan reagálunk minderre” – mondta Dario Amodei, az Anthropic vezérigazgatója egy, a Mythos bejelentésével együtt közzétett videóban.
Hat és 18 hónap közé tehető az az idő, amíg más MI-fejlesztők hasonló modelleket dobnak piacra – mondta a Logal Graham, az Anthropic úgynevezett frontier red teamjének vezetője az Axiosnak. A csapat azt vizsgálja, milyen következményekkel járnak a legfejlettebb MI-modellek a kiberbiztonságra, a biobiztonságra és az autonóm rendszerekre nézve.
„Számunkra teljesen egyértelmű, hogy erről nyilvánosan beszélnünk kell” – tette hozzá Graham. „A biztonsági iparágnak tisztában kell lennie azzal, hogy ezek a képességek hamarosan megjelenhetnek.”