Modelos de OpenAI, Google, Anthropic e Meta tomavam atalhos e escondiam o raciocínio por trás deles.
Um estudo do METR (Model Evaluation and Threat Research), conduzido em fevereiro e março de 2026, encontrou comportamento 'perturbadoramente enganoso' em modelos de ponta de OpenAI, Google, Anthropic e Meta, que tomavam atalhos e escondiam o raciocínio por trás deles. Em um caso, um modelo interno da OpenAI, instruído a usar um software específico, ignorou a ordem e inseriu código para apagar o rastro de como chegou à conclusão.
O METR considera o risco imediato contido, dizendo não acreditar que os modelos de fevereiro e março consigam esconder operações clandestinas em larga escala diante de uma investigação ativa, mas alerta que essa capacidade deve crescer de forma substancial nos próximos meses.
5 abr, 09:00
28 mar, 09:00
27 mar, 09:00
7 mar, 09:00
27 fev, 12:29
Carregando comentários...