Salta al contenuto

Google lancia Gemini 2.5 Deep Think

In contesti difficile ci mette anche ore a ragionare, ma è potentissimo.

In breve:

Il modello presenta il "ragionamento multi-agente" cioè è capace di generare e valutare più idee in parallelo per selezionare la risposta migliore. È disponibile per gli abbonati al piano Ultra da 250 dollari al mese. Una sua versione ha già vinto una medaglia d'oro alle Olimpiadi Internazionale della Matematica, e sarà rilasciata a un gruppo selezionato di matematici. Ha tempi di elaborazione molto più lunghi rispetto alla versione consumer.

Riassunto completo:

  • Google DeepMind sta lanciando Gemini 2.5 Deep Think, il suo modello di intelligenza artificiale più avanzato per il ragionamento, capace di esplorare e considerare contemporaneamente più idee per poi scegliere la risposta migliore.
  • L'accesso a Gemini 2.5 Deep Think sarà disponibile a partire da venerdì per gli abbonati al piano Ultra di Google, che ha un costo mensile di 250 dollari.
  • Presentato per la prima volta a maggio in occasione del Google I/O 2025, è il primo modello multi-agente di Google reso disponibile al pubblico. Questi sistemi generano più agenti di intelligenza artificiale per affrontare un problema in parallelo, richiedendo più risorse computazionali ma portando a risposte migliori.
  • Una versione del modello è stata utilizzata da Google per ottenere una medaglia d'oro all'Olimpiade Internazionale di Matematica (IMO) di quest'anno.
  • Google ha dichiarato che rilascerà anche il modello specifico usato per le IMO a un gruppo selezionato di matematici e accademici; questo modello "impiega ore per ragionare", a differenza dei modelli consumer che impiegano secondi o minuti.
  • Il modello Gemini 2.5 Deep Think rappresenta un miglioramento significativo rispetto a quanto annunciato precedentemente al Google I/O e integra "nuove tecniche di apprendimento per rinforzo" per ottimizzare i suoi percorsi di ragionamento.
  • Ha dimostrato prestazioni all'avanguardia in test complessi come Humanity’s Last Exam (HLE), dove ha ottenuto il 34,8% (senza strumenti), superando Grok 4 di xAI (25,4%) e o3 di OpenAI (20,3%).
  • Nello specifico test LiveCodeBench 6, che valuta le capacità di programmazione competitiva, il modello di Google ha raggiunto l'87,6%, superando Grok 4 (79%) e o3 di OpenAI (72%).
  • Gemini 2.5 Deep Think è in grado di operare automaticamente con strumenti come l'esecuzione di codice e Google Search, e può produrre risposte molto più lunghe rispetto ai modelli tradizionali.
  • La capacità di questi sistemi multi-agente di risolvere problemi complessi, che richiedono creatività e pianificazione strategica, sta portando diverse aziende leader nel settore dell'intelligenza artificiale, come xAI e OpenAI, a convergere su questo approccio.
  • Nonostante le elevate prestazioni, i sistemi multi-agente sono più costosi da gestire, motivo per cui le aziende tecnologiche tendono a mantenerli legati ai piani di abbonamento più costosi.
  • Nelle prossime settimane, Google prevede di rendere Gemini 2.5 Deep Think disponibile tramite API a un gruppo ristretto di tester, per raccogliere feedback sull'uso da parte di sviluppatori e aziende.

Questo testo è un riassunto del seguente articolo (eng):

Google rolls out Gemini Deep Think AI, a reasoning model that tests multiple ideas in parallel | TechCrunch
Google released its first publicly available “multi-agent” AI system, which uses more computational resources, but produces better answers.

Alternativa in italiano:

Deep Think: l’intelligenza artificiale di Google che sfida i matematici
Google introduce Deep Think nell’app Gemini 2.5 per gli abbonati AI Ultra; è pensato per affrontare problemi complessi con ragionamenti paralleli

Commenti

Più recenti