Rich Sutton on "AI creativity & discovery"
O Limite da IA Generativa e a Necessidade de Descoberta
Neste vídeo, Rich Sutton, um dos pioneiros do aprendizado por reforço, discute as limitações fundamentais da inteligência artificial generativa atual (como LLMs) e defende que, para alcançar avanços reais em ciência e matemática, precisamos de sistemas capazes de "descoberta" autônoma, e não apenas de mimetismo.
A Falácia da Criatividade na IA Generativa
Sutton utiliza uma analogia acadêmica para explicar o estado atual da IA: "O trabalho é novo e bom. Infelizmente, as partes que são boas não são novas e as partes que são novas não são boas".
- Mimetismo vs. Descoberta: A IA generativa baseia-se em aprendizado supervisionado, processando grandes volumes de dados para imitar padrões existentes. Ela é eficaz para tarefas onde a qualidade deriva da fonte (resumos, textos), mas falha quando exigimos inovação real.
- O Dilema da Aleatoriedade: A IA generativa produz resultados através de processos estocásticos. A saída é ou aleatória (nova, mas sem garantia de qualidade) ou baseada em dados (boa, mas não original). Ela raramente consegue ser ambas simultaneamente, pois carece de um mecanismo interno de avaliação.
- Ausência de Avaliação: O aprendizado supervisionado carece de um ciclo de feedback. Sem um processo de avaliação e retenção seletiva, a "novidade" gerada pela IA é efêmera e não se traduz em descoberta científica.
O Processo de Descoberta
Para Sutton, a verdadeira criatividade exige um processo de três etapas, comum à evolução biológica, ao método científico e ao aprendizado por reforço:
- Variação: Gerar múltiplas possibilidades (o "tiro no escuro").
- Avaliação: Testar o que funciona em relação a um objetivo claro.
- Retenção Seletiva: Manter apenas as soluções que demonstraram valor.
Sistemas como AlphaGo, AlphaZero e AlphaFold são citados como exemplos de sucesso porque possuem objetivos claros (vencer o jogo, resolver a estrutura proteica) que permitem ao sistema avaliar suas próprias tentativas e aprender com elas.
Implicações
- Limitação do Backpropagation: O algoritmo de backpropagation tradicional é determinístico e perde a plasticidade ao longo do tempo. Sutton menciona que seu grupo desenvolveu o "continual backprop", que reintroduz variação através da re-inicialização periódica de neurônios, mantendo a capacidade de aprendizado.
- Rumo à IA Autônoma: Para que a IA se torne um "cientista autônomo", não basta apenas prever o próximo token. É necessário fornecer aos sistemas objetivos explícitos e permitir que eles realizem o ciclo de variação e avaliação.
- Chamado à Ação: Sutton conclui que a comunidade de IA deve focar em automatizar a criatividade e a descoberta, indo além do simples reconhecimento de padrões. "Se queremos o poder total de cientistas de IA, devemos compartilhar os objetivos com eles para que possam criar, avaliar e descobrir".
"A criatividade requer que as coisas geradas sejam avaliadas. Sem avaliação e retenção do melhor, nada é criado."
