Sakana AI desenvolve modelo para orquestrar LLMs como GPT-5 e Claude

A Sakana AI criou o "RL Conductor", um modelo de linguagem de 7B treinado por aprendizado por reforço para orquestrar LLMs, superando modelos individuais em benchmarks.

Sakana AI desenvolve modelo para orquestrar LLMs como GPT-5 e Claude — Foto: Venturebeat

07/05 às 18:38

Pontos principais

A Sakana AI introduziu o "RL Conductor", um modelo de linguagem pequeno (7B) treinado via aprendizado por reforço para orquestrar LLMs.
O Conductor analisa entradas, distribui tarefas entre LLMs e coordena agentes para resolver problemas complexos, sem design humano.
Ele alcança resultados de ponta em benchmarks de raciocínio e codificação, superando modelos como GPT-5 e Claude Sonnet 4.
O sistema otimiza o uso de diferentes modelos para tarefas específicas, utilizando menos tokens e etapas com alta precisão.
O Conductor é a base do Fugu, o serviço comercial de orquestração multiagente da Sakana AI, atualmente em fase beta.

A Sakana AI anunciou o desenvolvimento do "RL Conductor", um modelo de linguagem de 7 bilhões de parâmetros treinado por aprendizado por reforço para orquestrar múltiplos Large Language Models (LLMs). O Conductor é capaz de analisar dinamicamente as entradas, distribuir tarefas entre diferentes LLMs e coordenar agentes para solucionar problemas complexos, aprendendo estratégias de orquestração por tentativa e erro, sem a necessidade de design humano. Este sistema demonstrou superar modelos individuais como GPT-5 e Claude Sonnet 4 em benchmarks de raciocínio e codificação.

O "RL Conductor" é a tecnologia central por trás do Fugu, o serviço comercial de orquestração multiagente da Sakana AI, que está em fase beta. A empresa afirma que a tecnologia Fugu visa resolver as limitações de generalização de pipelines codificados manualmente, especialmente em setores como finanças e defesa, ao otimizar o uso de diferentes modelos para tarefas específicas com notável eficiência e precisão.

Tópicos relacionados

Inteligência Artificial

Fontes

How Sakana trained a 7B model to orchestrate GPT-5, Claude Sonnet 4 and Gemini 2.5 Pro

Venturebeat • 7 mai, 18:23

Comentários

Carregando comentários...

Pontos principais

A Sakana AI introduziu o "RL Conductor", um modelo de linguagem pequeno (7B) treinado via aprendizado por reforço para orquestrar LLMs.

O Conductor analisa entradas, distribui tarefas entre LLMs e coordena agentes para resolver problemas complexos, sem design humano.

Ele alcança resultados de ponta em benchmarks de raciocínio e codificação, superando modelos como GPT-5 e Claude Sonnet 4.

O sistema otimiza o uso de diferentes modelos para tarefas específicas, utilizando menos tokens e etapas com alta precisão.

O Conductor é a base do Fugu, o serviço comercial de orquestração multiagente da Sakana AI, atualmente em fase beta.

Sakana AI desenvolve modelo para orquestrar LLMs como GPT-5 e Claude

Pontos principais

Tópicos relacionados

Fontes

How Sakana trained a 7B model to orchestrate GPT-5, Claude Sonnet 4 and Gemini 2.5 Pro

Leia também

Sebastian Raschka lança livro sobre construção de LLMs com raciocínio

Sakana AI lança agente autônomo para pesquisas corporativas profundas

Nova técnica RLSD otimiza modelos de raciocínio com menos recursos

Nature publica framework open-source conectando LLMs ao ROS

OpenAI lança IH-Challenge para melhorar segurança de LLMs

Comentários

Sakana AI desenvolve modelo para orquestrar LLMs como GPT-5 e Claude

Pontos principais

Tópicos relacionados

Fontes

How Sakana trained a 7B model to orchestrate GPT-5, Claude Sonnet 4 and Gemini 2.5 Pro

Leia também

Sebastian Raschka lança livro sobre construção de LLMs com raciocínio

Sakana AI lança agente autônomo para pesquisas corporativas profundas

Nova técnica RLSD otimiza modelos de raciocínio com menos recursos

Nature publica framework open-source conectando LLMs ao ROS

OpenAI lança IH-Challenge para melhorar segurança de LLMs

Comentários