Modelo de texto-para-voz supera ElevenLabs v3 no ranking da Artificial Analysis e oferece 30 vozes, marcadores como [sussurros] e marca d'água SynthID.
O modelo foca expressividade e controle fino sobre a entrega vocal — algo que a ElevenLabs vinha dominando. Os marcadores inline permitem ao desenvolvedor orquestrar tom, ritmo, sotaque e efeitos não verbais frase a frase, sem treinar uma voz customizada.
O preço o posiciona como opção de custo-benefício: o ranking da Artificial Analysis destacou a relação qualidade/preço, e o Google acrescentou a marca d'água SynthID a todo áudio gerado, em aceno à regulação sobre conteúdo sintético.
15 abr, 14:03
31 mar, 09:00
27 mar, 09:00
26 mar, 14:33
26 fev, 18:39