A Google DeepMind új MI-modellje képes megfejteni a DNS-t és előre jelezni a mutációkat, és új lehetőségeket nyit a betegségek kutatásában.
DNS-ünk a szervezetet felépítő genetikai információ milliónyi kombinációjából épül fel. Ezeknek a szekvenciáknak már egészen apró módosulásai, illetve a működésükben bekövetkező változások is az egész szervezet működését megváltoztathatják, és olyan betegségekhez vezethetnek, mint a rák.
A Google új mesterségesintelligencia-eszköze, az AlphaGenome képes hosszú DNS-szakaszok elolvasására, és megjósolja, hogyan viselkednek az egyes régiók, illetve hogy a változások miként vezethetnek betegségekhez.
Mélytanulást alkalmaz, és az agy információfeldolgozását vette mintául; úgy tervezték, hogy segítse a kutatókat a DNS működésének megértésében.
A Google új eszköze segíthet megfejteni, miként irányítja a DNS a géneket, azáltal, hogy megjósolja, milyen szerepet töltenek be a hosszú genetikai kódszakaszok.
„Úgy hisszük, hogy az AlphaGenome értékes erőforrás lehet a tudományos közösség számára: segít jobban megérteni a genom működését és a betegségek biológiáját, és végső soron új biológiai felfedezéseket és új kezelések kidolgozását ösztönzi”, közölte a Google DeepMind.
Hogyan működik az AlphaGenome?
A modell akár egymillió DNS-bázist is képes egy bázisnyi pontossággal beolvasni – ami korábbi eszközökkel lehetetlen volt.
A DNS hosszú láncokból áll, amelyeket négy alapvető kémiai építőelem, az úgynevezett nukleotidok alkotnak; mindegyiket egy betű jelöli: A, C, G és T. Használati utasításként szolgál minden sejt felépítéséhez és szabályozásához.
Az emberi DNS mindössze mintegy két százaléka kódol közvetlenül fehérjéket, vagyis azokat az építőelemeket, amelyek a sejtjeinkben a munka oroszlánrészét végzik.
A fennmaradó 98 százalékot sokáig „szemét-DNS”-nek tartották; valójában azonban korántsem haszontalan: ezek a szekvenciák afféle vezérlőpultként működnek, és szabályozzák, hogyan dolgozik a másik két százalék.
Irányítják, hogy a gének mikor, hol és milyen mértékben kapcsolnak be vagy ki, reagálnak a környezeti jelekre, és befolyásolják az RNS-illesztést (splicingot), azt a mechanizmust, amely betűsorozatokat fűz össze, és lehetővé teszi, hogy ugyanaz a gén különböző olvasatokban fejeződjön ki.
Számos, betegségekkel összefüggő variáns itt rejtőzik, a fehérjék módosítása nélkül befolyásolva a génaktivitást.
Az AlphaGenome az első olyan mélytanulási modell, amely képes célba venni a DNS ezen részét, és megjósolni a működését.
A modell fel tudja becsülni, hogy a variánsként emlegetett, apró genetikai módosulások miként hatnak a génaktivitásra, illetve hogyan zavarhatják meg a normális folyamatokat, amelyek például a rákhoz kapcsolódnak.
Hogyan működik a gyakorlatban?
Gyakorlati példaként a kutatók egy akut leukémia-típusra összpontosítottak, a fehérvérsejtek rákjára, amelyben az éretlen T-sejtek, az immunrendszer „katonái”, fékezhetetlenül elszaporodnak.
Bizonyos leukémiás eseteket olyan apró DNS-változások idéznek elő, amelyek nem magát a fehérjét módosítják, hanem azt, hogy egyes gének mennyire erősen, illetve mikor kapcsolnak be.
Az AlphaGenome-modell összevetette a normál DNS-szekvenciát a mutánssal, és előre jelezte, milyen valószínűséggel növeli a mutáció a közeli gének aktivitását.
A modell jelenleg ingyenesen elérhető a kutatók számára nem kereskedelmi célú kutatáshoz; kutatási eszköz, nem klinikai használatra készült.
Miben segíthet?
A kutatócsoport szerint az új modellnek számos felhasználási területe van.
A molekuláris biológiában virtuális laboratóriumi eszközként működhet, lehetővé téve, hogy a kutatók szimulációval teszteljék ötleteiket, mielőtt költséges kísérletekbe kezdenének.
A biotechnológiában segíthet genetikai terápiák tervezésében vagy olyan molekulák fejlesztésében, amelyek meghatározott szöveteket céloznak.
„A DeepMind AlphaGenome-ja mérföldkő a genomikai mesterséges intelligencia területén”, mondta Robert Goldstone, a Francis Crick Intézet genomikai részlegének vezetője.
Hozzátette, hogy az új modell által kínált felbontás valódi áttörés: a technológiát az elméleti érdekességből a gyakorlati haszon irányába mozdítja, és lehetővé teszi, hogy a kutatók algoritmikusan tanulmányozzák és szimulálják az összetett betegségek genetikai gyökereit.
„Az AlphaGenome nem csodafegyver minden biológiai kérdésre, de alapvető, magas színvonalú eszköz, amely a genom statikus kódját megfejthető, felfedezésre alkalmas nyelvvé alakítja”, tette hozzá Goldstone.
A tudósok ugyanakkor arra figyelmeztetnek, hogy ahogyan minden MI-modell, az AlphaGenome is csak annyira jó, amennyire jók a betanításához használt adatok.
„A jelenleg rendelkezésre álló biológiai adatok többsége nem igazán alkalmas MI-hez: a készletek túl kicsik, és nem kellően szabványosítottak”, mondta Ben Lehner, a brit Wellcome Sanger Intézet generatív és szintetikus genomikával foglalkozó részlegének vezetője.
Szerinte most a legfontosabb kihívás az, miként lehet előállítani azokat az adatokat, amelyekkel a következő generációs MI-modelleket be lehet tanítani.