In breve:
OpenAI ha rilasciato GPT-OSS, il suo primo modello open-weight dai tempi di GPT-2, scaricabile gratuitamente e personalizzabile. Disponibile in due versioni (una più impegnativa che richiede una GPU Nvidia e una meno), sta venendo distribuito su Hugging Face e Azure. Può ragionare, navigare sul web, scrivere codice ed è eseguibile sul proprio laptop.
Riassunto completo:
- OpenAI ha rilasciato GPT-OSS, il suo primo modello open-weight in oltre sei anni, disponibile gratuitamente e personalizzabile.
- Il modello è offerto in due versioni: 120 miliardi di parametri (richiede una GPU Nvidia) e 20 miliardi di parametri (richiede 16GB di VRAM).
- Entrambe le versioni sono disponibili su piattaforme come Hugging Face e Azure, sotto licenza Apache 2.0 che consente ampie modifiche commerciali.
- Questa mossa segna un cambiamento strategico per OpenAI; in precedenza, il CEO Sam Altman aveva citato preoccupazioni di sicurezza per la mancata distribuzione di modelli aperti.
- GPT-OSS può eseguire compiti di ragionamento, navigare sul web, scrivere codice e operare agenti tramite le API esistenti di OpenAI.
- OpenAI ha dichiarato che GPT-OSS è il suo modello più rigorosamente testato per la sicurezza, anche con l'aiuto di aziende esterne.
- Le prestazioni di GPT-OSS sono simili a quelle dei modelli closed-source di OpenAI per compiti di codifica e test specifici.
- L'azienda mira a che GPT-OSS venga utilizzato da sviluppatori e aziende più piccole per un maggiore controllo sui dati e per promuovere l'innovazione.
Cos'è un modello open-weight?
Un modello “open-weight” è un’intelligenza artificiale i cui pesi – cioè i numeri che regolano come il modello prende decisioni – sono resi pubblici. Durante l’addestramento, un’IA impara aggiustando milioni o miliardi di questi pesi, che funzionano un po’ come i “ricordi” del modello: determinano come risponde a una domanda, traduce un testo o genera un’immagine. Se i pesi sono aperti, chiunque può scaricarli, usarli, modificarli o analizzarli. Questo rende il modello più trasparente e accessibile, utile per la ricerca, per creare versioni personalizzate o per farlo funzionare su propri server. Questo non significa che sia open source, cioè che il codice sia pubblico.
Questo testo è un riassunto del seguente articolo (eng):

Alternativa in italiano:
