Nuovo modello di OpenAI ha preso la medaglia d'oro nella più prestigiosa competizione matematica al mondo

In breve:

Un nuovo modello LLM sperimentale di OpenAI ha raggiunto una performance da medaglia d'oro all'International Math Olympiad (IMO), la più prestigiosa competizione di matematica al mondo. Il modello ha affrontato i problemi dell'IMO 2025 nelle stesse condizioni dei partecipanti umani, dimostrando una capacità di pensiero creativo e di elaborazione di dimostrazioni matematiche complesse e rigorose a un livello paragonabile a quello dei matematici umani e risolvendo 5 dei 6 problemi, sufficienti per la medaglia d'oro.

Riassunto completo:

OpenAI ha raggiunto un traguardo storico nell'intelligenza artificiale: il suo nuovo modello LLM sperimentale ha ottenuto una performance da medaglia d'oro nell'International Math Olympiad (IMO), la più prestigiosa competizione di matematica al mondo.
Il modello è stato valutato sui problemi IMO del 2025 seguendo le stesse regole dei concorrenti umani: due sessioni d'esame da 4,5 ore, senza strumenti o internet, leggendo i problemi ufficiali e scrivendo dimostrazioni in linguaggio naturale.
Questo è un risultato significativo perché i problemi IMO richiedono un livello di pensiero creativo sostenuto e un orizzonte temporale di ragionamento molto più lungo rispetto ai benchmark precedenti (da pochi minuti a circa 100 minuti per l'IMO).
I modelli hanno dimostrato di poter creare dimostrazioni complesse e ineccepibili, superando la necessità di ricompense chiare e verificabili nel paradigma di apprendimento per rinforzo.
Questo successo non deriva da una metodologia specifica per un compito, ma da progressi nel reinforcement learning (apprendimento per rinforzo) a scopo generale e nella scalabilità computazionale al momento del test.
Il modello ha risolto 5 dei 6 problemi dell'IMO 2025, ottenendo un punteggio totale di 35/42 punti, sufficiente per la medaglia d'oro, giudicato da tre ex medagliati IMO.
Sebbene OpenAI rilascerà presto GPT-5, è importante sottolineare che il modello LLM che ha vinto l'IMO è un modello di ricerca sperimentale e non sarà disponibile per diversi mesi.
Questo risultato evidenzia la rapida e inattesa accelerazione dei progressi dell'IA negli ultimi anni, superando di gran lunga le previsioni precedenti.