Pesquisadores da Anthropic introduziram o "model spec midtraining", uma nova fase no desenvolvimento de modelos de inteligência artificial para melhorar a generalização do treinamento de alinhamento.

Pesquisadores da Anthropic desenvolveram uma nova metodologia para o treinamento de modelos de inteligência artificial, denominada "model spec midtraining". Esta técnica adiciona um estágio intermediário entre o pré-treinamento e o ajuste fino dos modelos, com o objetivo de melhorar significativamente a capacidade de generalização e otimizar o treinamento de alinhamento.
A pesquisa, conduzida por Sara Price, Samuel Marks e Jon Kutasov no âmbito do Anthropic Fellows Program e pela própria Anthropic, busca aprimorar a forma como os modelos de IA aprendem e se adaptam a novas tarefas, tornando-os mais robustos e eficientes em diversas aplicações.
6 mai, 04:04
28 abr, 12:13
26 mar, 09:00
25 mar, 15:03
24 jul, 21:00
Carregando comentários...