Newsletter Hírlevél Events Események Podcasts Videók Africanews
Loader
Hirdetés

Hangulatalapú kódolástól a gyorsabb modellekig: frissült a Google Gemini

Archív: A 2010. március 23-i, keddi fotón a Google logója látható a Google brüsszeli központjában
Archív: A 2010. március 23-án, kedden készült fotón a Google logója látható a Google brüsszeli központjában Szerzői jogok  AP Photo/Virginia Mayo, File
Szerzői jogok AP Photo/Virginia Mayo, File
Írta: Euronews
Közzétéve: A legfrissebb fejlemények
Megosztás Kommentek
Megosztás Close Button

A Vibe coding, a gyorsabb MI-modellek és a valós idejű fordítás csak néhány példa a Google Gemini-ben megjelent új frissítések közül.

Az ünnepi szezon előtt a Google új frissítéseket vezetett be a Geminihez, tehát a mesterséges intelligenciára (MI) épülő asszisztenséhez, jelezve, hogy a technológiai óriás igyekszik lépést tartani a gyorsan változó MI-versenyben.

Az új funkciók a kódírást nem igénylő alkalmazásépítést lehetővé tevő vibe coding eszközöktől a gyorsabb modelleken át a beszélgetősebb keresési és fordítási képességekig terjednek.

Az Euronews Next áttekinti a legfontosabb újdonságokat.

Vibe coding

Mostantól közvetlenül a Gemini felületén lehet MI-alapú alkalmazást készíteni.

A Google ezen a héten közölte, hogy az Opalt, a Gems néven ismert mini MI‑alkalmazások építésére szolgáló eszközét közvetlenül a webböngészőjébe integrálja.

Az eszköz, amelyet júliusban mutattak be, a vállalat szerint olyan, több lépésből álló alkalmazás tervét készíti el, amely promptok, MI‑modellhívások és más eszközök összefűzésével működik, egyetlen sor kód nélkül.

Ha a felhasználók finomítani szeretnék azt a promptot, amellyel az alkalmazást felépítették, új funkciót vagy eszközt adnának hozzá, a Google szerint mindez megoldható pusztán annak leírásával, milyen változtatást szeretnének.

Most a felhasználók vizuális szerkesztőt kapnak a Gemini felületén, amely rögzíti az alkalmazásokhoz kapcsolódó lépéseket és módosításokat. Emellett lehetővé teszi az alkalmazások előnézetét, mielőtt megosztanák őket más, Google‑fiókkal rendelkező felhasználókkal.

A vizuális szerkesztő azt is lehetővé teszi, hogy a felhasználók képeket vagy videólinkeket töltsenek fel, amelyeket az Opal hivatkozásként használhat az alkalmazás felépítésekor.

Az Opal a vibe coding eszközök egyik példája; ez egy újonnan felbukkanó terület, ahol az MI kód helyett egyszerű, természetes nyelvű utasításokból képes alkalmazásokat generálni.

Néhány MI‑cég, például az OpenAI és az Anthropic már az év elején kiadta a saját megoldását, miközben a svéd vibe coding startup, a Lovable a működésének első évében 200 millió dollár (170 millió euró) értékű, Európa egyik legnagyobb korai fázisú finanszírozását vonta be.

Gyorsabb, olcsóbb Gemini

„Olyan Gemini‑modell, amely okosságot és sebességet nyújt.” Ez a Google szlogenje a Gemini 3 Flashhez.

A vállalat közölte, hogy az új Flash modell doktori szintű következtetési képességekkel párosuló intelligenciával rendelkezik, amely „lépést tart a gondolataid sebességével”.

Két üzemmódja van: egy „gyors” mód a kérdések gyors megválaszolására, és egy „gondolkodó” mód az összetett problémák megoldására.

A Gemini 3 Flash a korábbi modelleknél sokkal jobb a videók és képek megértésében, és akár néhány másodperc alatt „hasznos, végrehajtható tervvé” alakíthatja ezt a tartalmat.

A vállalat szerint a korábbi modelleknél jobban érti a felhasználói kérdések árnyalatait, és az interneten elérhető valós idejű információkat felhasználva „átfogó, vizuálisan könnyen befogadható” válaszokat tud adni.

A Gemini 3 Flash megjelenése néhány héttel azután történt, hogy a Google kiadta a Gemini 3 Pro modellt, a vállalat „legerősebb” megoldását a vibe codinghoz és autonóm MI‑ügynökökhöz, valamint a Gemini 3 Deep Thinket, egy üzemmódot, amely összetett matematikai, tudományos és logikai problémákkal birkózik meg.

A Google szerint a Gemini 3 Flash teljesítménye „felveszi a versenyt a nagyobb csúcskategóriás modellekkel” az iparági benchmark teszteken, például a GPQA Diamondon (ez bonyolult biológiai, fizikai és kémiai kérdések sorozata), és felülmúlja a Gemini 2.5 Flash modellt, egy korábbi Flash‑verziót, amelyet adtak kijúniusban.

Fejlesztések a fordításban és a keresésben

A Google az Egyesült Államokban élő felhasználók számára azt is megkönnyítette, hogy közvetlenül a Keresés és a Fordítás funkcióival beszélgessenek.

A Live With Search funkció fejlesztései azt jelentik, hogy a felhasználók mostantól kétirányú hangos párbeszédet folytathatnak, és valós idejű segítséget kaphatnak a keresőmotortól.

A lekérdezésekre válaszoló, MI‑alapú hang „minden eddiginél gördülékenyebb és kifejezőbb” lesz, ahogyan azt a vállalat közölte közleményében.

A múlt héten a Google bejelentette, hogy a Gemini mostantól integrálva van a vállalat kereső‑ és fordítóalkalmazásaiba, így a felhasználók keresés közben „jóval okosabb, természetesebb és pontosabb szövegfordításokat” kapnak.

A vállalat az élő fordítás béta verzióját is kiadta, amely a címsorokon keresztül „valós idejű, természetes hangzású” fordításokat hoz el.

A Translate egyik fejlesztése, hogy megérti az olyan idiómákat és kifejezéseket, mint a „steal my thunder”, és ezekre a szó szerinti fordítás helyett természetesebb megfelelést ad.

Jelenleg az Egyesült Államokban és Indiában működik, angolról több mint 20 nyelvre, többek között spanyolra, hindire, japánra és németre fordítva.

Ugrás az akadálymentességi billentyűparancsokhoz
Megosztás Kommentek

kapcsolódó cikkek

Pornhub vizsgálja a több mint 200 millió felhasználó adatait érintő hackelést

Franciaország „külföldi beavatkozást” vizsgál, miután távoli vezérlésű kártevőt találtak egy kompon

Volt brit pénzügyminiszter csatlakozik az OpenAI-hoz a kormányzati AI-képességek bővítéséért