Personalidade 'Nerdy' premiava linguagem lúdica com criaturas; o sinal contaminou gerações seguintes via retroalimentação de dados.
A OpenAI publicou uma autópsia detalhada do chamado "mistério dos goblins": desde o GPT-5.1, seus modelos passaram a usar metáforas com goblins, gremlins, ogros e guaxinins com frequência crescente. A investigação revelou que a origem foi a personalidade "Nerdy", recurso de customização cujo sinal de recompensa premiava linguagem lúdica.
O problema se agravou por um ciclo de retroalimentação: as respostas geradas pelo modelo entravam no material de treinamento da geração seguinte, herdando o estilo fora do contexto original. A OpenAI removeu o sinal e filtrou os dados, mas o GPT-5.5 já estava em treinamento e saiu contaminado.
30 abr, 01:07
28 abr, 22:03
23 abr, 16:12
26 mar, 14:34
11 mar, 16:04