Daily Journal

Rich Sutton on "AI creativity & discovery"

Rich Sutton31 de maio de 202615minVer no YouTube|

O Limite da IA Generativa e a Necessidade de Descoberta

Neste vídeo, Rich Sutton, um dos pioneiros do aprendizado por reforço, discute as limitações fundamentais da inteligência artificial generativa atual (como LLMs) e defende que, para alcançar avanços reais em ciência e matemática, precisamos de sistemas capazes de "descoberta" autônoma, e não apenas de mimetismo.

A Falácia da Criatividade na IA Generativa

Sutton utiliza uma analogia acadêmica para explicar o estado atual da IA: "O trabalho é novo e bom. Infelizmente, as partes que são boas não são novas e as partes que são novas não são boas".

  • Mimetismo vs. Descoberta: A IA generativa baseia-se em aprendizado supervisionado, processando grandes volumes de dados para imitar padrões existentes. Ela é eficaz para tarefas onde a qualidade deriva da fonte (resumos, textos), mas falha quando exigimos inovação real.
  • O Dilema da Aleatoriedade: A IA generativa produz resultados através de processos estocásticos. A saída é ou aleatória (nova, mas sem garantia de qualidade) ou baseada em dados (boa, mas não original). Ela raramente consegue ser ambas simultaneamente, pois carece de um mecanismo interno de avaliação.
  • Ausência de Avaliação: O aprendizado supervisionado carece de um ciclo de feedback. Sem um processo de avaliação e retenção seletiva, a "novidade" gerada pela IA é efêmera e não se traduz em descoberta científica.

O Processo de Descoberta

Para Sutton, a verdadeira criatividade exige um processo de três etapas, comum à evolução biológica, ao método científico e ao aprendizado por reforço:

  1. Variação: Gerar múltiplas possibilidades (o "tiro no escuro").
  2. Avaliação: Testar o que funciona em relação a um objetivo claro.
  3. Retenção Seletiva: Manter apenas as soluções que demonstraram valor.

Sistemas como AlphaGo, AlphaZero e AlphaFold são citados como exemplos de sucesso porque possuem objetivos claros (vencer o jogo, resolver a estrutura proteica) que permitem ao sistema avaliar suas próprias tentativas e aprender com elas.

Implicações

  • Limitação do Backpropagation: O algoritmo de backpropagation tradicional é determinístico e perde a plasticidade ao longo do tempo. Sutton menciona que seu grupo desenvolveu o "continual backprop", que reintroduz variação através da re-inicialização periódica de neurônios, mantendo a capacidade de aprendizado.
  • Rumo à IA Autônoma: Para que a IA se torne um "cientista autônomo", não basta apenas prever o próximo token. É necessário fornecer aos sistemas objetivos explícitos e permitir que eles realizem o ciclo de variação e avaliação.
  • Chamado à Ação: Sutton conclui que a comunidade de IA deve focar em automatizar a criatividade e a descoberta, indo além do simples reconhecimento de padrões. "Se queremos o poder total de cientistas de IA, devemos compartilhar os objetivos com eles para que possam criar, avaliar e descobrir".

"A criatividade requer que as coisas geradas sejam avaliadas. Sem avaliação e retenção do melhor, nada é criado."