Google libera Gemini 3.1 Flash TTS com 70+ idiomas e 200 marcadores inline

Modelo de texto-para-voz supera ElevenLabs v3 no ranking da Artificial Analysis e oferece 30 vozes, marcadores como [sussurros] e marca d'água SynthID.

16/04 às 09:00

Pontos principais

Lançado em prévia via Gemini API, Google AI Studio, Vertex AI e Google Vids
Suporta mais de 70 idiomas e 30 vozes pré-construídas
200+ marcadores inline (ex.: [sussurros], [ri], [excitadamente]) controlam tom, cadência e sons não verbais

O modelo foca expressividade e controle fino sobre a entrega vocal — algo que a ElevenLabs vinha dominando. Os marcadores inline permitem ao desenvolvedor orquestrar tom, ritmo, sotaque e efeitos não verbais frase a frase, sem treinar uma voz customizada.

O preço o posiciona como opção de custo-benefício: o ranking da Artificial Analysis destacou a relação qualidade/preço, e o Google acrescentou a marca d'água SynthID a todo áudio gerado, em aceno à regulação sobre conteúdo sintético.

O Futuro da Informação

Google libera Gemini 3.1 Flash TTS com 70+ idiomas e 200 marcadores inline

Pontos principais

Fontes

Google libera seu modelo Gemini 3.1 mais expressivo de texto-para-voz, com suporte a 70+ idiomas

Leia também

Google lança Gemini 3.1 Flash TTS, nova IA de fala expressiva

Alibaba lança Qwen3.5-Omni com 215 recordes em benchmarks e supera Gemini 3.1 Pro

Google lança Gemini 3.1 Flash Live, modelo de áudio em tempo real

Google lança Gemini 3.1 Flash Live para IA de áudio mais natural

Google lança Nano Banana 2, gerador de imagens com qualidade Pro na velocidade Flash