In breve:
La francese Mistral ha presentato Voxtral TTS, un modello open source di sintesi vocale pensato per assistenti vocali e applicazioni aziendali come vendite, relazione con i clienti e supporto. Entra così in concorrenza con gruppi come ElevenLabs, Deepgram e OpenAI, ma con la differenza che Voxtral è specializzata in nove lingue, tra cui italiano, inglese, francese, tedesco, spagnolo, hindi e arabo. Secondo l’azienda può ricreare una voce personalizzata con meno di cinque secondi di campione audio. È basato su Ministral 3B, modello leggero che funziona anche su smartphone, laptop o smartwatch, e rientra nella strategia con cui Mistral vuole costruire una piattaforma completa per testo, audio e immagini.
Questo testo è un riassunto del seguente articolo (eng):

