Mistral lança Voxtral, modelo de voz open-sour...

A Mistral lançou o Voxtral, plataforma de voz com modelos ASR e TTS de pesos abertos. O Voxtral 24B, baseado no Mistral Small 3.1, alcançou performance 'best in class' contra Whisper large-v3, GPT-4o mini Transcribe e Gemini 2.5 Flash em benchmarks de inglês e multilíngue FLEURS.

O modelo TTS de 4 bilhões de parâmetros clona voz a partir de 3 segundos de áudio de referência, capturando sotaque, inflexão e padrões naturais de fala, com latência de 70ms por $0,016 a cada 1.000 caracteres. Os modelos ASR estão sob licença Apache 2.0 no Hugging Face; o TTS é CC BY NC 4.0, com uso comercial exigindo acordo separado.

Mistral lança Voxtral, modelo de voz open-source que supera Whisper e GPT-4o mini

Pontos principais

Fontes

Mistral lança Voxtral — plataforma de voz com IA de pesos abertos

Leia também

OpenAI lança modelos de voz GPT-Realtime para interação em tempo real

OpenAI lança três modelos de voz em tempo real com raciocínio nível GPT-5

OpenAI otimiza IA de voz com nova arquitetura WebRTC

Microsoft lança três modelos próprios de IA: transcrição, voz e imagem

Databricks lança Lakewatch, SIEM agêntico com Claude que promete 80% menos custo

Comentários