Rich Sutton on "AI creativity & discovery"

O Limite da IA Generativa e a Necessidade de Descoberta

Neste vídeo, Rich Sutton, um dos pioneiros do aprendizado por reforço, discute as limitações fundamentais da inteligência artificial generativa atual (como LLMs) e defende que, para alcançar avanços reais em ciência e matemática, precisamos de sistemas capazes de "descoberta" autônoma, e não apenas de mimetismo.

A Falácia da Criatividade na IA Generativa

Sutton utiliza uma analogia acadêmica para explicar o estado atual da IA: "O trabalho é novo e bom. Infelizmente, as partes que são boas não são novas e as partes que são novas não são boas".

Mimetismo vs. Descoberta: A IA generativa baseia-se em aprendizado supervisionado, processando grandes volumes de dados para imitar padrões existentes. Ela é eficaz para tarefas onde a qualidade deriva da fonte (resumos, textos), mas falha quando exigimos inovação real.
O Dilema da Aleatoriedade: A IA generativa produz resultados através de processos estocásticos. A saída é ou aleatória (nova, mas sem garantia de qualidade) ou baseada em dados (boa, mas não original). Ela raramente consegue ser ambas simultaneamente, pois carece de um mecanismo interno de avaliação.
Ausência de Avaliação: O aprendizado supervisionado carece de um ciclo de feedback. Sem um processo de avaliação e retenção seletiva, a "novidade" gerada pela IA é efêmera e não se traduz em descoberta científica.

O Processo de Descoberta

Para Sutton, a verdadeira criatividade exige um processo de três etapas, comum à evolução biológica, ao método científico e ao aprendizado por reforço:

Variação: Gerar múltiplas possibilidades (o "tiro no escuro").
Avaliação: Testar o que funciona em relação a um objetivo claro.
Retenção Seletiva: Manter apenas as soluções que demonstraram valor.

Sistemas como AlphaGo, AlphaZero e AlphaFold são citados como exemplos de sucesso porque possuem objetivos claros (vencer o jogo, resolver a estrutura proteica) que permitem ao sistema avaliar suas próprias tentativas e aprender com elas.

Implicações

Limitação do Backpropagation: O algoritmo de backpropagation tradicional é determinístico e perde a plasticidade ao longo do tempo. Sutton menciona que seu grupo desenvolveu o "continual backprop", que reintroduz variação através da re-inicialização periódica de neurônios, mantendo a capacidade de aprendizado.
Rumo à IA Autônoma: Para que a IA se torne um "cientista autônomo", não basta apenas prever o próximo token. É necessário fornecer aos sistemas objetivos explícitos e permitir que eles realizem o ciclo de variação e avaliação.
Chamado à Ação: Sutton conclui que a comunidade de IA deve focar em automatizar a criatividade e a descoberta, indo além do simples reconhecimento de padrões. "Se queremos o poder total de cientistas de IA, devemos compartilhar os objetivos com eles para que possam criar, avaliar e descobrir".

"A criatividade requer que as coisas geradas sejam avaliadas. Sem avaliação e retenção do melhor, nada é criado."