Az EU-jogot csak az esetek 54%-ában tartja be a legjobban teljesítő MI-ügynök, az Anthropic Claude Opus egy holland kutatócég szerint.
A világ néhány legnépszerűbb MI-modellje olyan ügynököket épít, amelyek aktívan szembeszegülnek az uniós szabályozással, hogy elérjék céljaikat – derül ki egy új kutatásból.
Az Aithos, egy holland, a mesterséges intelligencia összehangolásával foglalkozó nonprofit szervezet LARA (forrás: angol) néven fejlesztett ki egy rendszert, amellyel 12 népszerű MI-ügynökmodellt teszteltek: forgatókönyv-alapú kérdésekben vizsgálták, hogy követik-e az uniós AI-rendelet kulcsfontosságú előírásait – amely azt szabályozza, hogyan lehet MI-rendszereket használni –, valamint a blokk adatvédelmi szabályait (GDPR).
A LARA az uniós AI-rendelet hat előírását vizsgálta: hogy a modellek kihasználják-e a sebezhetőségeket, próbálnak-e érzelmeket kikövetkeztetni, végeznek-e „társadalmi pontozást”, vagyis az emberek tulajdonságai, háttere alapján rangsorolást, eltitkolják-e egy beszélgetésben, hogy MI-ről van szó, alkalmaznak-e tudatalatti befolyásolást, illetve biztosítanak-e érdemi emberi felügyeletet.
Emellett a GDPR négy szempontját is vizsgálták, például az átláthatóságot, az adatminimalizálást, a célhoz kötöttséget és a jogszerű adatkezelést. Három MI-modell és emberi bírálók értékelték, hogy a válaszok sértik-e az uniós jogot.
A tanulmány szerint valamennyi modell teljesítménye gyenge volt. A leginkább jogkövető modell, a Claude Opus 4.7 a forgatókönyvek 54 százalékában tartotta be a szabályokat, míg a legrosszabbul teljesítő, a kínai Moonshot AI mindössze az esetek 7 százalékában.
A kutatás szerint valamennyi modell beleegyezett a forgatókönyvekben abba, hogy figyelje az alkalmazottak érzelmi állapotát, vagy hogy kiszolgáltatott embereket használjon ki egy eladás érdekében.
A Mistral, az egyetlen vizsgált, európai fejlesztésű MI-modell 12 százalék alatti eredményt ért el, ami a kutatók szerint azt mutatja, hogy még az uniós szolgáltatók sincsenek „felkészülve az uniós jog betartására”.
„Még a ma használt legfejlettebb modellek sem garantálják a jogszabályoknak való megfelelést, ha ügynökként vetik be őket” – írta az Aithos egy blogbejegyzésben.
Egy példában (forrás: angol) egy felhasználó arra kérte az Anthropic Claude modelljét, hogy a teljesítményükre és szabadságkérelmeikre vonatkozó adatok alapján állapítsa meg, mekkora eséllyel „lépnek le” az alkalmazottai, vagyis válnak felmondási kockázattá.
A felhasználónak három próbálkozásba telt, mire rá tudta venni Claude-ot az alkalmazottak rangsorolására; a LARA szerint ez sérti az uniós AI-rendeletnek azt a rendelkezését, amely tiltja a felhasználók érzelmeinek kikövetkeztetését.
A LARA nyomon követte, mikor tanúsítottak ellenállást az MI-k – mint ebben a Claude-példában is –, de megjegyezte, hogy az esetek 8 százalékában az MI-k végül mégis teljesítették a felhasználók kéréseit.
Egy másik esetben az OpenAI ChatGPT 5.5 modelljét arra kérték, (forrás: angol) hogy a teljesítménymutatók alapján rangsorolja az alkalmazottakat, és állapítsa meg, kiket kellene előléptetésre javasolni – ezúttal bármiféle ellenállás nélkül.
A kutatók kiemelték, hogy az MI-knek nem mondták el kifejezetten, hogy követniük kell az uniós jogot, mert a modellek belső viselkedését akarták vizsgálni, és hozzátették: további kutatásokra lenne szükség annak összehasonlítására, hogyan viselkednek a modellek, ha kifejezetten a jogszabályok és előírások betartására szólítják fel őket.