AI-Q da NVIDIA conquista 1º lugar em ambos os DeepResearch Bench

Sistema multi-agente construído sobre Nemotron-3-Super, treinado em 67.000 trajetórias, liderou os dois principais benchmarks de pesquisa profunda.

13/03 às 09:00

Pontos principais

Primeiro lugar no DeepResearch Bench (55,95) e Bench II (54,50)
Construído sobre Nemotron-3-Super-120B-A12B lançado no dia anterior
Arquitetura multi-agente com orquestrador, planejador e pesquisador
Pesquisador despacha especialistas em paralelo: Evidence Gatherer, Mechanism Explorer, Comparator, Critic e Horizon Scanner
Treinado em 67.000 trajetórias SFT em ~25h em 16×8 GPUs H100

O AI-Q da NVIDIA conquistou primeiro lugar em ambos os DeepResearch Bench — os dois principais benchmarks para avaliação de agentes de pesquisa profunda. O sistema usa arquitetura multi-agente com três componentes (orquestrador, planejador e pesquisador), onde o pesquisador despacha especialistas em paralelo.

Construído sobre o Nemotron-3-Super lançado no dia anterior, o sistema foi treinado em 67.000 trajetórias SFT em aproximadamente 25 horas em 16×8 GPUs H100. Todo o stack é aberto e configurável via YAML, construído sobre o NeMo Agent Toolkit e LangChain DeepAgents.

AI-Q da NVIDIA conquista 1º lugar em ambos os DeepResearch Bench

Pontos principais

Fontes

Como o AI-Q da NVIDIA alcançou o 1º lugar nos DeepResearch Bench I e II

Leia também

Nvidia apresenta Nemotron 3 Ultra, MoE de 550 bilhões de parâmetros para agentes autônomos

Nvidia lança Dynamo 1.0, Agent Toolkit e AI-Q Blueprint na GTC

Mistral lança Small 4: MoE de 119B parâmetros com 6,5B ativos por token

GTC 2026 abre em San Jose com 30 mil presentes e foco em IA agêntica

Nvidia libera Nemotron 3 Super, modelo aberto de 120B para sistemas multi-agente

Comentários

AI-Q da NVIDIA conquista 1º lugar em ambos os DeepResearch Bench

Pontos principais

Fontes

Como o AI-Q da NVIDIA alcançou o 1º lugar nos DeepResearch Bench I e II

Leia também

Nvidia apresenta Nemotron 3 Ultra, MoE de 550 bilhões de parâmetros para agentes autônomos

Nvidia lança Dynamo 1.0, Agent Toolkit e AI-Q Blueprint na GTC

Mistral lança Small 4: MoE de 119B parâmetros com 6,5B ativos por token

GTC 2026 abre em San Jose com 30 mil presentes e foco em IA agêntica

Nvidia libera Nemotron 3 Super, modelo aberto de 120B para sistemas multi-agente

Comentários