Európa szeretne megszabadulni attól, hogy az MI terén amerikai technológiai óriásoktól függjön, és saját, önálló utat keres.
Három évvel azután, hogy az OpenAI elindította a ChatGPT-t és a mesterséges intelligenciát (MI) a fősodorba emelte, több európai ország saját szuverén rendszereket épít.
A szuverén MI egy ország képessége arra, hogy olyan, saját területén létrehozott és polgárai számára készülő MI-rendszereket fejlesszen, üzemeltessen, bevezessen és szabályozzon, amelyek nem függnek külföldi rendszerektől vagy felhőszolgáltatók joghatóságától.
Az Európai Parlament egy júniusi jelentésben elismerte, hogy „jelenleg erősen függ a külföldi technológiáktól”, különösen az amerikaiaktól, ami megakadályozza, hogy a blokk saját tech-óriásokat neveljen. A jelentés szerint Európa függősége „várhatóan fennmarad”, részben az Egyesült Államok nemrég bejelentett, 500 milliárd dolláros (432,9 milliárd eurós) hazai MI-beruházás miatt.
Az EU szerint előnye visszaszerzéséhez kutatásba kell fektetni és új rendszereket kell fejleszteni. Ebben a nemzeti kormányoknak juthat szerep.
Európa-szerte néhányan már saját szuverén MI-rendszert építenek. Az Euronews Next áttekinti, mi készült el eddig.
Németország
Németország a legutóbbi ország, amely bejelentette saját MI-tervét, Sovereign Open Source Foundation Models (SOOFI) néven.
A német kormány szerint a SOOFI egy kísérlet egy alapvető, „fejlett MI” nyílt forráskódú modell felépítésére, amelyet az AI-termékeket fejlesztő vállalatok testre szabhatnak.
A technológiát a német kormány közlése szerint rendkívül összetett feladatokra, például MI-vezérelt robotokra használják.
„A SOOFI-val lerakjuk a következő generációs európai MI-modellek alapjait: szuverének, nagy teljesítményűek, és teljes mértékben európai kézben lesznek” mondta Wolfgang Nejdl, a hannoveri Leibniz Egyetem professzora, a projektben részt vevő egyetemek egyikének képviselője.
„Az európai értékeket tiszteletben tartó, nagy MI-modellek elengedhetetlenek ahhoz, hogy bizalom épüljön az MI iránt, különösen olyan érzékeny területeken, mint az oktatás, az orvoslás, a közigazgatás és a termelés” – tette hozzá.
A Deutsche Telekom és a T-Systems távközlési vállalatok szerint a cél, hogy a SOOFI 100 milliárd paraméterrel rendelkezzen, vagyis olyan beállításokkal, amelyek szabályozzák a modell működését.
Mindkét cég technikai támogatást nyújt a nagy nyelvi modellhez egyik MI-gyárában. A modell betanításához a Deutsche Telekom mintegy 130 NVIDIA chipet és több mint 1 000 grafikus processzort (GPU-t) használ majd, amelyek a jövő márciusára állnak rendelkezésre.
A projektben részt vevő német egyetemek egyike, a TU Darmstadt közölte, hogy a SOOFI azt is feltárja, mire van szükség ahhoz, hogy szakértelem épüljön ki a nagy MI-modellek fejlesztésének minden területén, az adatok gyűjtésétől és előkészítésétől a szoftver megépítéséig és betanításáig.
Svájc
Szeptemberben a svájci MI-kezdeményezés bemutatta az Apertus modellt, az ország első többnyelvű nyelvi modelljét.
Az Apertus, ami latinul „nyitottat” jelent, lehetővé teszi a kutatók, szakemberek és a széles közönség számára, hogy a modellt saját igényeikre szabják.
A fejlesztők szerint a modell minden eleme szabadon hozzáférhető, beleértve a tanítási architektúrát, az adatkészleteket, a forráskódot és a modell-súlyokat, vagyis azokat a paramétereket, amelyek meghatározzák, hogyan értelmezze az LLM az adatokat.
A közreműködő egyetemek egyike, az ETH Zürich közölte, hogy az Apertust 15 billió tokenen, azaz információegységen képezték, több mint 1 000 nyelven, köztük svájci németen és rétorománon.
Az Apertust feltöltötték a Public AI felületre, amely a szuverén modellek online hozzáférési pontja, így a világ minden tájáról elérhetővé vált.
A Swiss AI Initiative szerint jogi, klíma-, egészségügyi és oktatási szakterületekre fókuszáló, speciális modelleket is kidolgoznak.
„Ez a kiadás nem a végső lépés, hanem a kezdet” mondta Antoine Bosselut, a Swiss AI Initiative társvezetője a Public AI felületén. „Hosszú távú elköteleződésen dolgozunk a szuverén, nyílt MI-alapok mellett, amelyek a közjó szolgálatában állnak világszerte.”
Lengyelország
Februárban Lengyelország elindította saját hazai nagy nyelvi modelljét, a Polish Large Language Modelt (PLLuM).
A PLLuM „a lengyel nyelv sajátosságaihoz van szabva”, így bármely MI-alapú beszéd- vagy írásprojekt „nagyon jól megbirkózik a ragozás és az összetett szintaxis kihívásaival” – állt a kormány közleményében a bevezetés idején.
A kormány úgy véli, hogy a PLLuM modellekből olyan MI-k készíthetők, amelyek segítenek szövegek és e-mailek megírásában, dokumentumok összefoglalásában, diákok felkészülésében, chatbot-tartalmak generálásában, utazások megtervezésében vagy vázlatok készítésében.
Dariusz Standerski, Lengyelország digitális ügyekért felelős helyettes minisztere akkor úgy fogalmazott, hogy a PLLuM „befektetés a digitális államba”.
Standerski a modell bemutatásakor azt is mondta, hogy Hive AI néven bővítik tovább: olyan rendszerré, amelyet végül beépítenek a kormány közigazgatási folyamataiba, és amely segíti „a nemzeti MI-ökoszisztéma” fejlesztését.
Ez például azt jelenti, hogy a lakosság hozzáférhet egy virtuális asszisztenshez, amely segít közérdekű információk megszerzésében, valamint egy „intelligens” irodai asszisztenshez, amely automatizálja a dokumentumfeldolgozást és az információkeresést.
Később a PLLuM a pedagógusok munkáját is támogatja majd, hogy „lebilincselő órákat” tarthassanak a legújabb technológiák segítségével.
Spanyolország
Januárban a Barcelona Supercomputing Centre (BSC) elindította az Aliát, az „első európai nyílt, többnyelvű infrastruktúrát”, amely „felelős MI-t fejleszt az emberek szolgálatára”.
A BSC a MareNostrum 5 segítségével fejlesztette az Aliát; ez egy szuperszámítógép, amely másodpercenként 314 billiárd műveletet tud elvégezni.
Az Alia nyílt adatbázist biztosít olyan erőforrásokkal, mint adatkészletek, nyelvi modellek és integrációs eszközök spanyol, baszk, katalán és galíciai nyelveken, hogy a startupok saját hazai modelleket építhessenek.
A Spanyol Mesterségesintelligencia-felügyeleti Ügynökség (AESIA) közlése szerint az Aliát később adóhatósági chatbotként is fejlesztik, és egy olyan alkalmazásba építik, amely képes lesz könnyen szívelégtelenséget diagnosztizálni.
Az Alia-projekt az Ilenára is épít, egy másik spanyol kormányzati kezdeményezésre, amely több mint 100 MI-erőforrást hozott létre spanyol, baszk, katalán és galíciai nyelven a hazai vállalatok számára.
2020-ban a katalán kormány elindította az Ainát, egy pilot projektet, amely katalán nyelvű számítógépes modelleket hoz létre azoknak a vállalatoknak, amelyek hangasszisztenseket, automatikus fordítókat vagy beszélgető MI-ügynököket akarnak fejleszteni.
A modellt egy kezdeti katalán adatbázison képezték, amely 1,7 millió szót tartalmaz, 95 millió mondatba rendezve.
Hollandia
2023-ban három nonprofit szervezet kezdett el egy holland nyelvű, nyílt forráskódú MI-modellt fejleszteni GPT-NL néven.
A projektre létrehozott weboldal a GPT-NL-t „a holland nyelv és kultúra számára készült, megbízható, átlátható, kölcsönös és szuverén” modellként írja le.
A konzorcium használ egy olyan adatkészlet-keveréket, amely minőségi forrásokból szerzői jogi megállapodásokkal beszerzett adatokból, nyilvános adatokból, valamint saját szintetikus adatokból áll.
A konzorcium nemrég megállapodást kötött holland kiadókkal az NDP Nieuwsmedia szakmai szervezet és az ANP hírügynökség égisze alatt, hogy felhasználhassák cikkeiket a GPT-NL betanításához. Cserébe a kiadók részesedést kapnak az LLM profitjából, amikor azt végül nyilvánosságra hozzák.
A projekt nyílt forráskódú lesz, vagyis az akadémiai intézmények, kutatók és a kormány is kipróbálhatja alkalmazásait az egészségügyben, az oktatásban és a szolgáltatások területén. Azoknak a felhasználóknak, akik nem szakmai célra használják az LLM-et, egy kisebb díjat kellhet fizetniük a hozzáférésért, miután elérhetővé válik.
A kutatók 2025 júniusában kezdték meg a modell betanítását, és egy friss tájékoztatás szerint az első verzió az év vége előtt elérhető lehet.
Portugália
2024 óta portugál egyetemek konzorciuma dolgozik az Amalia nevű szuverén MI-n.
Az Amalia mögött álló kutatócsoportok egyike, a Nova School of Science and Technology közölte, hogy a rendszer képes kérdések megválaszolására, kód generálására, fogalmak magyarázatára, szövegek összefoglalására és információk értelmezésére portugál nyelven, helyi kontextusban.
Eddig szeptemberben tesztelték az Amalia béta verzióját, és azon dolgoznak, hogy 2026 közepe táján nyilvánosan megjelenjen az MI.
A kormány már tervezi, hogy ezt a nagy nyelvi modellt a közigazgatási szolgáltatásokban, online portálján keresztül, valamint a tudományban elemzési feladatok támogatására használja.
Helyi beszámolók szerint az Amalia nem lesz chatbotként nyilvánosan elérhető, miután elkészül, viszont az LLM kódja nyílt forráskódú lesz, így más portugál vállalatok felhasználhatják saját MI-modelljeikhez.