OpenAI rastreia origem do "mistério dos goblins" a vazamento de recompensa no treinamento

Personalidade 'Nerdy' premiava linguagem lúdica com criaturas; o sinal contaminou gerações seguintes via retroalimentação de dados.

30/04 às 09:00

Pontos principais

Uso de 'goblin' subiu 175% após o lançamento do GPT-5.1; 'gremlin' subiu 52%
Personalidade 'Nerdy' representava 2,5% das respostas mas 66,7% das menções a goblins
Sinal de recompensa mostrou viés positivo para palavras de criaturas em 76,2% dos datasets auditados
Estilo vazou para outras personalidades porque respostas geradas alimentavam o treinamento seguinte
OpenAI removeu o sinal, filtrou dados e aposentou o Nerdy em março
GPT-5.5 já estava em treinamento e saiu contaminado

A OpenAI publicou uma autópsia detalhada do chamado "mistério dos goblins": desde o GPT-5.1, seus modelos passaram a usar metáforas com goblins, gremlins, ogros e guaxinins com frequência crescente. A investigação revelou que a origem foi a personalidade "Nerdy", recurso de customização cujo sinal de recompensa premiava linguagem lúdica.

O problema se agravou por um ciclo de retroalimentação: as respostas geradas pelo modelo entravam no material de treinamento da geração seguinte, herdando o estilo fora do contexto original. A OpenAI removeu o sinal e filtrou os dados, mas o GPT-5.5 já estava em treinamento e saiu contaminado.

Comentários

Carregando comentários...

OpenAI rastreia origem do "mistério dos goblins" a vazamento de recompensa no treinamento

Pontos principais

Leia também

OpenAI expande acesso a versão permissiva do GPT-5.5 para ciberdefensores

Modelos GPT-5.1 da OpenAI mencionam criaturas míticas

OpenAI lança GPT-5.5 Instant com redução de alucinações e nova memória

OpenAI corrige "goblins" que alteravam personalidade do GPT-5

OpenAI lança GPT-5.5, codinome "Spud", e publica Card do Sistema

Comentários

OpenAI rastreia origem do "mistério dos goblins" a vazamento de recompensa no treinamento

Pontos principais

Leia também

OpenAI expande acesso a versão permissiva do GPT-5.5 para ciberdefensores

Modelos GPT-5.1 da OpenAI mencionam criaturas míticas

OpenAI lança GPT-5.5 Instant com redução de alucinações e nova memória

OpenAI corrige "goblins" que alteravam personalidade do GPT-5

OpenAI lança GPT-5.5, codinome "Spud", e publica Card do Sistema

Comentários