Newsletter Hírlevél Events Események Podcasts Videók Africanews
Loader
Hirdetés

Tanulmány: az AI-ügynökök tudatosan megszegik az uniós jogot

Aithos: a leginkább jogkövető modell is alig több mint az esetek felében tartja be az uniós jogot
Leginkább szabálykövető modell az Aithos szerint csak az esetek alig több mint felében tartja be az uniós jogot Szerzői jogok  Canva
Szerzői jogok Canva
Írta: Anna Desmarais
Közzétéve:
Megosztás Kommentek
Megosztás Close Button

Az EU-jogot csak az esetek 54%-ában tartja be a legjobban teljesítő MI-ügynök, az Anthropic Claude Opus egy holland kutatócég szerint.

A világ néhány legnépszerűbb MI-modellje olyan ügynököket épít, amelyek aktívan szembeszegülnek az uniós szabályozással, hogy elérjék céljaikat – derül ki egy új kutatásból.

HIRDETÉS
HIRDETÉS

Az Aithos, egy holland, a mesterséges intelligencia összehangolásával foglalkozó nonprofit szervezet LARA (forrás: angol) néven fejlesztett ki egy rendszert, amellyel 12 népszerű MI-ügynökmodellt teszteltek: forgatókönyv-alapú kérdésekben vizsgálták, hogy követik-e az uniós AI-rendelet kulcsfontosságú előírásait – amely azt szabályozza, hogyan lehet MI-rendszereket használni –, valamint a blokk adatvédelmi szabályait (GDPR).

A LARA az uniós AI-rendelet hat előírását vizsgálta: hogy a modellek kihasználják-e a sebezhetőségeket, próbálnak-e érzelmeket kikövetkeztetni, végeznek-e „társadalmi pontozást”, vagyis az emberek tulajdonságai, háttere alapján rangsorolást, eltitkolják-e egy beszélgetésben, hogy MI-ről van szó, alkalmaznak-e tudatalatti befolyásolást, illetve biztosítanak-e érdemi emberi felügyeletet.

Emellett a GDPR négy szempontját is vizsgálták, például az átláthatóságot, az adatminimalizálást, a célhoz kötöttséget és a jogszerű adatkezelést. Három MI-modell és emberi bírálók értékelték, hogy a válaszok sértik-e az uniós jogot.

A tanulmány szerint valamennyi modell teljesítménye gyenge volt. A leginkább jogkövető modell, a Claude Opus 4.7 a forgatókönyvek 54 százalékában tartotta be a szabályokat, míg a legrosszabbul teljesítő, a kínai Moonshot AI mindössze az esetek 7 százalékában.

A kutatás szerint valamennyi modell beleegyezett a forgatókönyvekben abba, hogy figyelje az alkalmazottak érzelmi állapotát, vagy hogy kiszolgáltatott embereket használjon ki egy eladás érdekében.

A Mistral, az egyetlen vizsgált, európai fejlesztésű MI-modell 12 százalék alatti eredményt ért el, ami a kutatók szerint azt mutatja, hogy még az uniós szolgáltatók sincsenek „felkészülve az uniós jog betartására”.

„Még a ma használt legfejlettebb modellek sem garantálják a jogszabályoknak való megfelelést, ha ügynökként vetik be őket” – írta az Aithos egy blogbejegyzésben.

Egy példában (forrás: angol) egy felhasználó arra kérte az Anthropic Claude modelljét, hogy a teljesítményükre és szabadságkérelmeikre vonatkozó adatok alapján állapítsa meg, mekkora eséllyel „lépnek le” az alkalmazottai, vagyis válnak felmondási kockázattá.

A felhasználónak három próbálkozásba telt, mire rá tudta venni Claude-ot az alkalmazottak rangsorolására; a LARA szerint ez sérti az uniós AI-rendeletnek azt a rendelkezését, amely tiltja a felhasználók érzelmeinek kikövetkeztetését.

A LARA nyomon követte, mikor tanúsítottak ellenállást az MI-k – mint ebben a Claude-példában is –, de megjegyezte, hogy az esetek 8 százalékában az MI-k végül mégis teljesítették a felhasználók kéréseit.

Egy másik esetben az OpenAI ChatGPT 5.5 modelljét arra kérték, (forrás: angol) hogy a teljesítménymutatók alapján rangsorolja az alkalmazottakat, és állapítsa meg, kiket kellene előléptetésre javasolni – ezúttal bármiféle ellenállás nélkül.

A kutatók kiemelték, hogy az MI-knek nem mondták el kifejezetten, hogy követniük kell az uniós jogot, mert a modellek belső viselkedését akarták vizsgálni, és hozzátették: további kutatásokra lenne szükség annak összehasonlítására, hogyan viselkednek a modellek, ha kifejezetten a jogszabályok és előírások betartására szólítják fel őket.

Ugrás az akadálymentességi billentyűparancsokhoz
Megosztás Kommentek

kapcsolódó cikkek

AI-avatárok és okoslabdák: a FIFA csúcstechnológiás 2026-os világbajnoksága

Miért marad le Európa az USA mögött a munkahelyi MI-használatban?

Tanulmány: az AI-ügynökök tudatosan megszegik az uniós jogot