In breve:
Un nuovo modello LLM sperimentale di OpenAI ha raggiunto una performance da medaglia d'oro all'International Math Olympiad (IMO), la più prestigiosa competizione di matematica al mondo. Il modello ha affrontato i problemi dell'IMO 2025 nelle stesse condizioni dei partecipanti umani, dimostrando una capacità di pensiero creativo e di elaborazione di dimostrazioni matematiche complesse e rigorose a un livello paragonabile a quello dei matematici umani e risolvendo 5 dei 6 problemi, sufficienti per la medaglia d'oro.
Riassunto completo:
- OpenAI ha raggiunto un traguardo storico nell'intelligenza artificiale: il suo nuovo modello LLM sperimentale ha ottenuto una performance da medaglia d'oro nell'International Math Olympiad (IMO), la più prestigiosa competizione di matematica al mondo.
- Il modello è stato valutato sui problemi IMO del 2025 seguendo le stesse regole dei concorrenti umani: due sessioni d'esame da 4,5 ore, senza strumenti o internet, leggendo i problemi ufficiali e scrivendo dimostrazioni in linguaggio naturale.
- Questo è un risultato significativo perché i problemi IMO richiedono un livello di pensiero creativo sostenuto e un orizzonte temporale di ragionamento molto più lungo rispetto ai benchmark precedenti (da pochi minuti a circa 100 minuti per l'IMO).
- I modelli hanno dimostrato di poter creare dimostrazioni complesse e ineccepibili, superando la necessità di ricompense chiare e verificabili nel paradigma di apprendimento per rinforzo.
- Questo successo non deriva da una metodologia specifica per un compito, ma da progressi nel reinforcement learning (apprendimento per rinforzo) a scopo generale e nella scalabilità computazionale al momento del test.
- Il modello ha risolto 5 dei 6 problemi dell'IMO 2025, ottenendo un punteggio totale di 35/42 punti, sufficiente per la medaglia d'oro, giudicato da tre ex medagliati IMO.
- Sebbene OpenAI rilascerà presto GPT-5, è importante sottolineare che il modello LLM che ha vinto l'IMO è un modello di ricerca sperimentale e non sarà disponibile per diversi mesi.
- Questo risultato evidenzia la rapida e inattesa accelerazione dei progressi dell'IA negli ultimi anni, superando di gran lunga le previsioni precedenti.
Questo testo è un riassunto del seguente articolo (eng):
Thread by @alexwei_ on Thread Reader App
@alexwei_: 1/N I’m excited to share that our latest @OpenAI experimental reasoning LLM has achieved a longstanding grand challenge in AI: gold medal-level performance on the world’s most prestigious math competition...…

Alternativa in italiano: Everyeye