Pesquisadores criam estrutura que utiliza espaço latente para comunicação entre agentes, aumentando a velocidade e reduzindo o consumo de tokens.

Pesquisadores desenvolveram o RecursiveMAS, uma nova estrutura voltada para otimizar a colaboração entre agentes de inteligência artificial. Ao substituir a comunicação baseada em texto por transmissões diretas em espaço latente, o sistema elimina gargalos de latência significativos. O framework utiliza um componente chamado RecursiveLink, que permite a troca de estados entre diferentes modelos sem a necessidade de realizar o ajuste fino de todos os parâmetros, resultando em uma economia substancial de memória GPU e custos operacionais. Além da eficiência técnica, o RecursiveMAS demonstrou um aumento de 2,4x na velocidade de inferência e uma redução de 75% no consumo de tokens. Com maior precisão em tarefas complexas, como codificação e diagnósticos médicos, a tecnologia se posiciona como uma alternativa escalável para o desenvolvimento de sistemas multi-agentes mais rápidos e econômicos.
11 mai, 19:14
11 mai, 12:31
5 mai, 17:07
28 abr, 12:13
1 mar, 13:19
Carregando comentários...