Daily Journal
Daily Journal

Thinking Machines apresenta prévia de conversação por voz e vídeo em IA com novos 'modelos de interação' em tempo quase real

A startup Thinking Machines revelou uma nova classe de modelos de IA multimodais projetados para interações fluidas e em tempo real, superando a latência dos sistemas tradicionais de chat.

Daily Journal
|
11/05 às 19:21

Pontos principais

  • A nova arquitetura 'full-duplex' permite que a IA processe áudio e vídeo simultaneamente, eliminando a necessidade de turnos de espera.
  • O modelo TML-Interaction-Small utiliza um sistema dual que separa a gestão de diálogo da tarefa de raciocínio complexo em segundo plano.
  • Testes indicam latência de resposta de 0,40 segundos, superando concorrentes como o Gemini-3.1-flash-live e o GPT-realtime-2.0.
  • A tecnologia promete revolucionar setores como atendimento ao cliente e monitoramento industrial ao permitir interações proativas e contínuas.
  • A Thinking Machines, fundada por ex-executivos da OpenAI, planeja abrir uma prévia limitada para pesquisa nos próximos meses.

Mencionado nesta matéria

Pessoas

Mira Murati (fundadora)John Schulman (fundador)Mark Zuckerberg (CEO)Mark Jen (ex-funcionário)Yinghai Lu (ex-funcionário)Tianyi Zhang (ex-funcionário)Joshua Gross (ex-funcionário)Soumith Chintala (CTO)Neal Wu (pesquisador)Weiyao Wang (pesquisador)

Organizações

Thinking MachinesOpenAIMetaNvidiaGoogle CloudAndreessen HorowitzAccelServiceNowCiscoAMDJane StreetPrincetonStanfordBerkeleyRedwood Research