Nove cópias do Claude Opus 4.6 superaram dois pesquisadores humanos em cinco dias e US$18 mil de custo computacional.
A Anthropic conduziu um experimento em que nove cópias do Claude Opus 4.6, seu modelo mais avançado, receberam cada uma um ambiente isolado de programação e um fórum compartilhado. A tarefa: melhorar técnicas de supervisão escalável — um proxy para garantir que IAs mais inteligentes que humanos continuem seguindo instruções.
Em cinco dias e US$18 mil em custos computacionais, as IAs resolveram 97% do problema proposto (PGR de 0,97). Dois pesquisadores humanos, com sete dias, resolveram apenas 23%. Os pesquisadores automatizados também descobriram abordagens que os humanos não haviam considerado, ampliando o espaço de exploração em pesquisa de alinhamento.
11 abr, 09:00
28 mar, 09:00
26 mar, 15:03
7 mar, 09:00
22 fev, 21:00