Evidências de que IA já consegue realizar tarefas de programação de semanas
Epoch AI: MirrorCode testa agentes em reimplementação de programas reais; Claude Opus 4.6 completou tarefa de semanas por US$550.
|
11/04 às 09:00
Pontos principais
- Gotree reimplementado do zero: 16 mil linhas de Go, 40+ comandos
- Tarefa estimada em 2-17 semanas para um humano
- Agente gastou US$550 e passou em 99,95% dos testes
- Ganhos contínuos com aumento do orçamento de tokens
Mencionado nesta matéria
Organizações
METREpoch AIAnthropic
