Az MI-ügynök kivételes technikai kifinomultságról tett tanúbizonyságot, és a tanulmány legerősebb emberi résztvevőinek teljesítményével vetekedett.
Egy mesterségesintelligencia-ügynök (MI-ügynök) egy új tanulmány szerint felülmúlta az emberi hekkerek többségét, miután 16 órán át sebezhetőségek után kutatva feltérképezte egy egyetem honlapját.
A tanulmány megjelenésének idején Oroszországból, Észak-Koreából, Iránból és kínai hátterű csoportokból érkező hekkerek nagy nyelvi modelleket (LLM-eket) használnak a kibertámadások csiszolására, a Microsoft és a OpenAI idén. Fegyveres csoportok, például az Iszlám Államot támogató szervezetek is kísérleteznek az MI-vel támadások végrehajtására.
A Stanford Egyetem megállapította, hogy az általa fejlesztett ARTEMIS nevű MI-ügynök tízből a második helyen végzett egy emberi hekkerekkel végzett kísérletben. A kutatók szerint MI-ügynökük „műszaki kifinomultságot” mutatott, a tanulmány legerősebb emberi résztvevőivel összemérhető szinten.
Az ARTEMIS MI-ügynök működtetése óránként mindössze 18 dollárba (kb. 15 euró) kerül, szemben egy „hivatásos penetrációs tesztelő” 60 dolláros (52 eurós) óradíjával, olvasható a jelentésben. A tanulmányt még nem közölték hivatalos tudományos folyóiratban.
A teljesen automatizált, emberi felügyelet nélkül feladatokat végrehajtani képes digitális asszisztensek, azaz MI-ügynökök várhatóan 2026-ban a rosszindulatú szereplők szolgálatába állnak, hogy egyszerűsítsék és felskálázzák a támadásokat, a Google jelentése szerint.
A Stanford Egyetem hozzáférést adott az ARTEMIS-nek, hat MI-ügynöknek és tíz emberi tesztelőnek az egyetem hálózatában lévő mind a 8 000 eszközhöz, beleértve a szervereket, számítógépeket és okoseszközöket. A kutatók összehasonlították az emberi tesztelő, a Stanford ARTEMIS-e és a másik hat MI-ügynök teljesítményét; mindegyiknek 16 órás feltérképezést írtak elő, de a teljesítményt csak az első 10 órában értékelték.
Ez idő alatt az ARTEMIS kilenc sebezhetőséget azonosított az egyetem rendszerében, és megállapításainak 82 százalékát érvényes jelentésként nyújtotta be. Az MI-ügynök a rangsorban a második helyen végzett, és tízből kilenc emberi tesztelőt felülmúlt.
A program sikerét az adta, hogy minden észlelt sebezhetőség esetén képes volt „alügynököket” létrehozni, amelyek a háttérben azonnal kivizsgálták a problémát, miközben ő maga tovább pásztázott más fenyegetések után. Az emberek ezt nem tudták megtenni, minden sebezhetőséget külön ki kellett vizsgálniuk, mielőtt tovább léphettek volna, áll a tanulmányban.
Ugyanakkor a tanulmány megjegyzi, hogy az ARTEMIS így is kihagyott néhány, emberek által azonosított sebezhetőséget, és ezek megtalálásához támpontokra volt szüksége.
A jelenlegi, például az OpenAI Codexe és az Anthropic Claude Code-ja alapján működő kiberbiztonsági MI-ügynökök tervezéséből „hiányzik a kiberbiztonsági szakértelem”, áll a tanulmányban.
A tesztelés során a hagyományos vállalatok MI-ügynökei vagy megtagadták a sebezhetőségek keresését, vagy megakadtak.
Az OpenAI és az Anthropic modelljei csak két emberi ügynöknél teljesítettek jobban, ami arra utal, hogy ezek a modellek „alulteljesítenek”.