O novo modelo de voz do ChatGPT permitirá fala simultânea e interrupções, tornando as interações com a IA mais próximas de uma conversa humana.
A OpenAI está testando o GPT-Bidi-1, um novo modelo de voz para o ChatGPT projetado para tornar as interações mais fluidas e naturais. A principal inovação é a capacidade de processamento bidirecional, que permite que o usuário e a inteligência artificial falem simultaneamente, eliminando a necessidade de esperar o término de uma frase para prosseguir com a conversa. O sistema foi aprimorado para lidar com interrupções e falas truncadas, comportamentos comuns em diálogos humanos que costumavam causar falhas em modelos anteriores. Além da agilidade na comunicação, o modelo demonstra uma capacidade superior de manter o contexto ao longo da interação. Identificada em fase experimental por usuários, a funcionalidade será acessada por meio de um ícone amarelo, marcando um avanço importante na usabilidade de assistentes de voz baseados em LLM.
8 mai, 09:07
5 mai, 15:04
21 abr, 17:02
10 abr, 15:04
26 mar, 14:34
Carregando comentários...