Sistema multi-agente construído sobre Nemotron-3-Super, treinado em 67.000 trajetórias, liderou os dois principais benchmarks de pesquisa profunda.
O AI-Q da NVIDIA conquistou primeiro lugar em ambos os DeepResearch Bench — os dois principais benchmarks para avaliação de agentes de pesquisa profunda. O sistema usa arquitetura multi-agente com três componentes (orquestrador, planejador e pesquisador), onde o pesquisador despacha especialistas em paralelo.
Construído sobre o Nemotron-3-Super lançado no dia anterior, o sistema foi treinado em 67.000 trajetórias SFT em aproximadamente 25 horas em 16×8 GPUs H100. Todo o stack é aberto e configurável via YAML, construído sobre o NeMo Agent Toolkit e LangChain DeepAgents.
13 mar, 09:00
12 mar, 09:00
7 mar, 09:00
2 mar, 15:30
1 mar, 13:19