Startup de Mira Murati revela classe de modelo de 276bi parâmetros que ouve, vê e responde em micro-turnos de 200ms, com latência de 0,40s.
A Thinking Machines Lab, criada por Mira Murati após sua saída da OpenAI, abriu uma pesquisa preview de uma nova classe de modelos batizada de "interaction models" — sistemas que lidam com interação nativamente, sem o andaime externo usado por modelos de turno único. Em vez de alternar entre falar e ouvir, o modelo processa áudio, vídeo e texto em micro-turnos contínuos de 200 milissegundos.
O sistema principal, TML-Interaction-Small, é um Mixture-of-Experts de 276 bilhões de parâmetros com 12 bilhões ativos, acoplado a um módulo separado para raciocínio mais lento. No benchmark FD-bench, atinge latência de 0,40 segundo no turn-taking, contra 0,57s do Gemini-3.1-flash-live e 1,18s do GPT-realtime-2.0. Uma preview limitada será aberta nos próximos meses, com lançamento mais amplo previsto para este ano.
12 mai, 14:32
11 mai, 20:34
11 mai, 19:14
27 abr, 23:01
20 mar, 09:00
Carregando comentários...