Google libera seu modelo Gemini 3.1 mais expressivo de texto-para-voz, com suporte a 70+ idiomas
The Decoder: Gemini 3.1 Flash TTS supera ElevenLabs v3 no ranking da Artificial Analysis e marca todo áudio com SynthID.
|
16/04 às 09:00
Pontos principais
- Elo de 1.211 na Artificial Analysis, acima do ElevenLabs v3 e pouco atrás do Inworld 1.5 Max
- Preço pago: US$1 por milhão de tokens de entrada e US$20 por milhão de tokens de saída
- Batch mode reduz custos pela metade
- Todo áudio gerado leva marca d'água SynthID
Mencionado nesta matéria
Pessoas
Vilobh MeshramMax Gubin
Organizações
GoogleDeepMindElevenLabsInworld
