Inteligjenca Artificiale fiton medalje ari në Olimpiadën Ndërkombëtare të Matematikës 2025

Në një arritje historike për inteligjencën artificiale, kompanitë OpenAI dhe Google DeepMind kanë njoftuar se modelet e tyre eksperimentale arritën rezultate të klasit botëror në Olimpiadën Ndërkombëtare të Matematikës (IMO) 2025. Të dy sistemet arritën të zgjidhnin pesë nga gjashtë problemet e testit – një nivel i mjaftueshëm për të fituar një medalje ari në këtë garë elitare për nxënës të shkollave të mesme.

Modeli i OpenAI u testua në kushte të ngjashme me IMO-n: dy sesione 4.5-orëshe, pa ndihma të jashtme, dhe kërkesa për të prodhuar prova të shkruara në gjuhë natyrore. Rezultatet u vlerësuan nga tre ish-medalistë të IMO-së, të cilët ranë dakord se performanca përputhej me nivelin e medaljes së artë. Ndërkohë, Google DeepMind konfirmoi se versioni i tyre i avancuar, “Gemini Deep Think”, ishte zyrtarisht i regjistruar dhe rezultatet u vërtetuan nga gjyqtarët e vetë olimpiadës.

Megjithatë, edhe pse modelet e AI-së treguan aftësi të jashtëzakonshme në arsyetim matematikor, ato nuk e kaluan performancën e pjesëmarrësve më të mirë njerëzorë. Raportet zyrtare treguan se të paktën 26 nxënës e tejkaluan AI-në në pikë, duke zgjidhur edhe problemin më të vështirë të testit – një sfidë e fushës së kombinatorikës, që asnjë nga modelet nuk arriti ta zgjidhë plotësisht.

Ekspertët kanë nisur debate të forta mbi mënyrën e vlerësimit dhe mbi transparencën e OpenAI. Matematikani i njohur Terence Tao ka ngritur dyshime mbi faktin nëse problemi ishte paraqitur në formën origjinale apo i riformuluar për t’iu përshtatur modelit, çka mund të përbëjë një avantazh artificial në krahasim me nxënësit që përballen me problemet në formën e tyre të papërpunuar.

Megjithëse mbetet rrugë për të arritur arsyetimin e thellë dhe kreativitetin njerëzor, këto rezultate përfaqësojnë një hap gjigant drejt inteligjencës së përgjithshme artificiale. Ekspertët shprehen se kjo lloj AI mund të ketë përdorime jo vetëm në matematikë, por edhe në shkencë, kodim dhe zgjidhje të problemeve komplekse në botën reale.