Salta al contenuto

Mistral rilascia un nuovo modello open source per la generazione vocale

Ed è ottimo in italiano.

In breve:

La francese Mistral ha presentato Voxtral TTS, un modello open source di sintesi vocale pensato per assistenti vocali e applicazioni aziendali come vendite, relazione con i clienti e supporto. Entra così in concorrenza con gruppi come ElevenLabs, Deepgram e OpenAI, ma con la differenza che Voxtral è specializzata in nove lingue, tra cui italiano, inglese, francese, tedesco, spagnolo, hindi e arabo. Secondo l’azienda può ricreare una voce personalizzata con meno di cinque secondi di campione audio. È basato su Ministral 3B, modello leggero che funziona anche su smartphone, laptop o smartwatch, e rientra nella strategia con cui Mistral vuole costruire una piattaforma completa per testo, audio e immagini.

Questo testo è un riassunto del seguente articolo (eng):

Mistral releases a new open source model for speech generation | TechCrunch
The model, which lets enterprises build voice agents for sales and customer engagement, puts Mistral in direct competition with the likes of ElevenLabs, Deepgram, and OpenAI.

Riassunto completo:

Questo post è solo per gli iscritti

Accedi

A quanto pare non sei loggato.

Più recenti