rendkívüli hír

rendkívüli hír

Transkribus: életre kelnek az ősrégi kéziratok

Éppen ezt olvassa:

Transkribus: életre kelnek az ősrégi kéziratok

Transkribus: életre kelnek az ősrégi kéziratok
Betűméret Aa Aa

Denis Loctier, Euronews: Hogyan találhatunk meg gyorsan szövegrészletet egy régi kéziratban? A számítógépek eddig nem nagyon tudtak mit kezdeni a kézírással, de a mesterséges intelligencia áttörést hozott.

A Tiroli Állami Archívum Innsbruckban sok száz éves kéziratokat őriznek. A többségük hivatalos irat, jogi dokumentum és ezekhez hasonló, több ezer kézzel írt hagyatéka a múltnak. Ezeknek a könyveknek az átírása nehéz feladat, és sok kérdést vet fel. Éppen ezért az archívum vezetése úgy döntött, informatikai szakembereket hív segítségül, hátha a komputertechnika révén lehetségessé válik ennek a folyamatnak az automatizálása.

Christoph Haidacher, az Archívum igazgatója: "Az ilyen kurzivált szöveggel, amilyen ez is itt, a modern technológiáknak szerintem gondjuk lesz. De az aránylag tiszta kalligráfiával, amilyen ez itt, a legújabb eljárások megbírkóznak majd, nagy segítségünkre lesznek."

Az ilyen könyvek digitalizálásán a tudósok egy európai együttműködés keretében dolgoznak, a projekt neve READ, és egy elég egyszerű rendszert kínál máris egy speciális telefonos applikáció formájában. Ez nyomon követi az olvasás folyamatát, és minden egyes lapozás alkalmával automatikusan készít egy nagyfelbontású fotót minden egyes oldalról.

Günter Mülberger, a READ projekt vezetője: "Ez az applikáció természetesen többféle technológia, régebbi és vadonatúj eljárások együtteséből jött létre. Ez például egy meglehetősen egyszerű, low-tech alkatrész. Ugyanakkor egy high-tech alkalmazást futtat az okostelefonon, amely össze van kötve az átíró platformmal, a Transkribusszal. Az applikáció továbbítja a felvételeket a szervernek, amely azonosítja a kézzel írt szöveget."

A Transkribus több évnyi munkát spórol meg a tudósoknak. Lehetővé teszi, hogy megfejtsék a bonyolult kéziratokat, a megszokottól eltérő kalligráfiákat is. Dr. Mario Klarer éppen az 500 oldalas "Hősök Könyvén" dolgozik, amely a legjelentősebb középkori német szöveggyűjtemény, I. Miksa német-római császár megbízásából készült a 16. században.

Mario Klarer, az Innsbrucki Egyetem professzora: "Ennek a rendszernek a legnagyobb vívmánya, hogy összeköti a szöveg tartalmát és megjelenését, ráadásul nagyon egyszerűen teszi ezt, így aztán az átíró azonnal átfogó képet kap a szövegről. Ez olyan minimálisra csökkenti a hiba lehetőségét, amilyenre enélkül a módszer nélkül elképzelhetetlen lenne."

Az Innsbrucki Egyetem szervere olyan algoritmussal dolgozik, amely folyamatosan tanítja a számítógépnek az újabb és újabb írásmódokat. Vagyis elég bevinni a dokumentum elejét, a komputer befejezi a szöveg átírását, mégpedig elképesztő, több mint 95 százalékos pontossággal. És ez érvényes minden történelmi dokumentumra függetlenül attól, milyen nyelven, és milyen betűtípussal íródott.

Günter Mülberger, a READ projekt vezetője: "Betáplálok a gépbe egy képet és egy részletet a hozzá tartozó szövegből, és ennek alapján a komputer pontosan megtanulja a kézírást, és ettől kezdve felismeri az ilyen karaktereket."

Miután ez a rendszer nem nyelvhez kötött, a világon mindenütt hasznát vehetik a tudósok, kutatók, levéltárosok. A projekt résztvevői szeretnék a laikusok számára is elérhetővé tenni a Transkribust.

Günter Mülberger, a READ projekt vezetője: "Minket is meglepett a projekt óriási sikere, nagyon sokan megkerestek minket, hogy érdekelné őket ez a rendszer. És miután mi magunk is tovább akarunk lépni, tágítani és fejleszteni akarjuk ezt a szolgáltatást, céget alapítottunk erre."

A régi kéziratokat digitalizáló Transkribusról bővebben a projekt honlapján olvashatnak.

Még több futuris