A Google mesterséges intelligenciája olyan kifinomult és innovatív megoldásokat nyújtott a matematikaverseny során, hogy végül az aranyérmet is elnyerte.


A Google Gemini egy különleges változata 42-ből 35 pontot szerzett a legutóbbi Nemzetközi Matematikai Diákolimpián. Bizonyos helyzetekben még az emberi megoldások teljesítményét is túlszárnyalta a rendszer.

Úgy tűnik, hogy nem csupán az OpenAI mesterséges intelligenciája emelkedett ki a világ egyik legkomplexebb matematikai megmérettetésén, a Nemzetközi Matematikai Diákolimpián (IMO). A Google MI-kutató részlege, a DeepMind frissen bejelentette, hogy a Gemini továbbfejlesztett verziója hivatalosan is aranyérmes teljesítményt nyújtott, hiszen hat feladatból ötöt sikeresen megoldott - számol be róla a Venture Beat.

Az eredmény nem csupán a Google számára kiemelkedő, hanem azt is tükrözi, hogy a mesterséges intelligencia mostantól képes összetett matematikai feladatok megoldására természetes nyelvi megértéssel. Ez azt jelenti, hogy az MI hasonló módon működik, mint az emberek, anélkül, hogy különleges programozási nyelvekre lenne szüksége ehhez a folyamathoz.

Az IMO-ra az országok legfeljebb hat diákot delegálhatnak, akiknek rendkívül összetett matematikai problémákat kell megoldaniuk. Ezek a feladatok elsőre egyszerűnek tűnnek, de gyakran kreatív gondolkodást igényelnek ahhoz, hogy a legmagasabb pontszámokat elérhessék. Az idei verseny, amely július 10. és 20. között zajlott, 630 résztvevőt vonzott, és csupán 67 versenyzőnek sikerült elnyernie az aranyérmet.

A Google legújabb sikere messze túlszárnyalja a 2024-es teljesítményét, amikor az AlphaProof és AlphaGeometry rendszerek együttműködve ezüstérmet zsebeltek be, miután hat feladatból négyet sikeresen megoldottak. Az idei áttörést a Gemini Deep Think hozta el, amely egy korszerűsített érvelési rendszer, és a "párhuzamos gondolkodás" módszerét alkalmazza. Ezzel szemben a hagyományos MI-modellek, amelyek egyetlen érvelési láncot követnek, a Deep Think képes egyszerre több lehetséges megoldást is mérlegelni, mielőtt végső válaszát megadná.

Ennek eredményeként a rendszer a verseny 4,5 órás időtartama alatt valósította meg az aranyérmes teljesítményt.

A modell 42-ből 35 pontot teljesített, ami azt jelenti, hogy éppen annyi eredményt ért el, mint az OpenAI által kifejlesztett változat.

A Google nyilatkozata szerint az eredmények késlekedésének oka az IMO kérésében rejlik, amely szerint a cégek addig ne tegyenek közzé információkat, amíg azokat a megfelelő bizottság nem ellenőrzi. Ezt a kérdést azonban az OpenAI figyelmen kívül hagyta, ami miatt a cég bejelentését kedvezőtlen visszhang övezte - számol be róla a Venture Beat.

De visszatérve a Google eredményéhez: a Google DeepMind sikere úgy tűnik, az újszerű betanítási technikáknak köszönhető, amelyek túlmutatnak a hagyományos megközelítéseken. A csapat fejlett megerősítéses tanulási módszereket alkalmazott, amelyek célja a többlépéses érvelés, a problémamegoldás és a tételbizonyítási adatok felhasználása volt. A modell emellett hozzáférést kapott kiváló minőségű matematikai megoldások válogatott gyűjteményéhez, és konkrét útmutatást kapott az IMO-stílusú problémák megközelítéséhez.

A modell rendkívül figyelemre méltó érveléssel rukkolt elő egy olyan problémában, ahol számos emberi versenytárs posztgraduális szintű matematikai fogalmakat alkalmazott. Junehyuk Jung, a DeepMind kutatója elmondta, hogy a Gemini "csupán az alapvető számelméletre támaszkodott egy önálló bizonyítás létrehozásakor", ami elegánsabb megoldást eredményezett, mint amilyenekkel számos konkurens előállt.

Felmerül a kérdés, hogy az ilyen típusú érvelési modellek más területeken is hasznosíthatók-e, és vajon képesek-e forradalmasítani a mesterséges intelligencia piacát. A matematikai problémák megoldása ugyanis egy szigorúan definiált szabályrendszeren alapul, míg a valós életben a döntések sokkal bonyolultabbak és sokrétűek.

Related posts