The Supply and Demand of AI Tokens | Dylan Patel Interview
Neste episódio do "Invest Like The Best", Dylan Patel, da SemiAnalysis, discute a dinâmica de oferta e demanda de tokens de IA, o impacto da IA nas empresas e na economia, e os desafios e gargalos da cadeia de suprimentos. Ele compartilha insights sobre como a IA está transformando a produtividade e os modelos de negócios, além de expressar preocupações sobre a concentração de recursos e a percepção pública da tecnologia.
O Impacto da IA na Produtividade e Custos
- Aumento Exponencial de Gastos com IA: A SemiAnalysis, que gastava dezenas de milhares de dólares anualmente em IA, viu seus gastos dispararem para uma taxa anual de 7 milhões de dólares. Isso representa mais de 25% dos gastos com salários da empresa, com projeção de ultrapassar 100% até o final do ano se a trajetória continuar.
- Redução da Necessidade de Contratação: O crescimento da empresa é acelerado pela IA, permitindo que ela não precise contratar tão rapidamente, apesar do aumento dos gastos com tecnologia.
- Automação de Tarefas Complexas: Dylan Patel cita exemplos práticos:
- Engenharia Reversa de Chips: Um membro da equipe, com alguns milhares de dólares em tokens, criou um aplicativo acelerado por GPU que analisa imagens de chips e sobrepõe a localização de cada material. Anteriormente, essa era uma tarefa para uma equipe inteira, levando anos.
- Análise Econômica: Um economista de um grande banco, usando IA, analisou dados econômicos, rodou regressões e avaliou o impacto de revoluções econômicas. Ele também classificou 2.000 tarefas do Bureau of Labor Statistics (BLS), descobrindo que cerca de 3% podem ser feitas por IA atualmente. Ele chamou o aumento de produtividade resultante de "PIB Fantasma".
- Comoditização e Vantagem Competitiva: Patel argumenta que a IA comoditiza a execução. Empresas que se movem rapidamente e melhoram continuamente seus produtos e serviços usando IA prosperarão, enquanto as incumbentes que não se adaptarem perderão sua vantagem. "Se eu não adotar IA, outra pessoa o fará e me vencerá."
- Modelagem de Energia: Em apenas 3 semanas, um analista usou IA para mapear toda a rede elétrica dos EUA, incluindo usinas e linhas de transmissão, e identificar déficits e superávits de energia. Esse trabalho, que levaria uma década para uma equipe de 100 pessoas, foi feito com um custo de tokens de cerca de 6.000 dólares por dia.
Dinâmica de Demanda por Tokens de IA
- Demanda Explosiva: A demanda por tokens de IA é "completamente explosiva". A Anthropic, por exemplo, viu sua receita anualizada (ARR) saltar de 9 bilhões para 35-40 bilhões de dólares, enquanto suas margens brutas aumentaram de 30% para mais de 72% devido à alta demanda e à capacidade de limitar o uso.
- Acesso a Modelos de Ponta: Há uma insistência em usar os modelos mais recentes e caros (como o Opus 4.7 e o Mythos da Anthropic), mesmo que modelos anteriores fossem satisfatórios. Isso se deve à capacidade de gerar valor econômico significativamente maior com as versões mais avançadas.
- "Psicose Claude": Patel descreve um fenômeno em que as pessoas, ao experimentarem o que a IA pode fazer, se tornam obcecadas em utilizá-la, levando a um aumento massivo no consumo de tokens.
- Arbitragem de Tokens: A longo prazo, o negócio pode se tornar a arbitragem de tokens, onde o valor está em saber como direcionar os tokens para as tarefas de maior valor.
- Queda nos Custos de Capacidade: O custo para atingir um determinado nível de capacidade de IA caiu drasticamente (por exemplo, 1/100 a 1/1000 do custo anterior para modelos da classe GPT-4).
- "Subclasse Permanente": Patel adverte que quem não usar mais tokens, gerar valor econômico com eles e capturar esse valor, corre o risco de ficar para trás em uma "subclasse permanente" à medida que a capacidade dos modelos e a concentração de recursos aumentam.
Gargalos na Cadeia de Suprimentos
- Aumento de Preços e Vida Útil de GPUs: A demanda crescente por tokens eleva os preços de tudo na cadeia de suprimentos. GPUs, como as H100, têm seus preços e vida útil estendidos (potencialmente 7-8 anos, não 5).
- Margens Crescentes: As margens estão se expandindo em todas as camadas da cadeia de suprimentos: nuvem, hardware (Nvidia com 75% de margem bruta), e memória.
- Prazos de Entrega Mais Longos: As cadeias de suprimentos são mais complexas e os produtos mais sofisticados, resultando em prazos de entrega mais longos. A capacidade incremental de memória, por exemplo, só chegará em 2028.
- Aumento de Preços da Memória: Os preços da DRAM devem dobrar ou triplicar novamente devido à alta demanda e à necessidade de desviar capacidade de outras áreas, resultando em "destruição de demanda via preços mais altos".
- Problemas de Capacidade Lógica: Empresas como a TSMC, apesar de aumentarem o capex, não conseguem acompanhar a demanda. Patel prevê que a TSMC pode gastar 100 bilhões de dólares em capex em 2028, o que terá um efeito cascata em toda a cadeia de suprimentos de equipamentos de fabricação de semicondutores.
- Demanda por CPUs: CPUs estão esgotadas devido a duas razões principais:
- Aprendizado por Reforço: Ambientes de aprendizado por reforço, que testam e avaliam as saídas dos modelos de IA, rodam em CPUs.
- Implantação de Aplicações: O código gerado pelos modelos de IA é implantado em aplicativos que rodam em CPUs, não diretamente em GPUs ou ASICs.
O Futuro da IA e Preocupações Sociais
- Robótica e "Singularidade Apenas de Software": Patel acredita que a "singularidade apenas de software" é um passo intermediário. A verdadeira transformação virá quando a IA for aplicada à robótica, tornando a programação de microcontroladores e atuadores muito mais fácil. Ele prevê avanços reais em robótica nos próximos 6 a 18 meses, com modelos de robôs pré-treinados capazes de aprender com poucos exemplos.
- Aceleração da Deflação de Bens Físicos: A explosão na robótica levará a uma aceleração na produção de bens físicos e a efeitos deflacionários.
- Protestos em Larga Escala: Patel prevê protestos em larga escala contra a IA nos próximos três meses, pois a tecnologia é impopular e as pessoas culparão a IA por problemas sociais e econômicos.
- Estratégias para a Indústria de IA: Para combater a percepção negativa, os líderes da indústria de IA precisam:
- Ser mais carismáticos e evitar entrevistas que alienem o público.
- Mostrar exemplos positivos e inspiradores do uso da IA.
- Parar de falar constantemente sobre as capacidades transformadoras futuras da IA e focar nos benefícios presentes.
- Realizar uma "reorganização e rebranding" para mudar a narrativa pública sobre a IA. Ele sugere que a falta de conexão entre o público e os desenvolvedores de IA leva a uma visão negativa da tecnologia como uma força que "destruirá a sociedade".
Implicações
- Investimento em IA é Imperativo: Empresas que desejam manter a competitividade devem investir pesadamente em IA e na utilização de tokens para otimizar processos e criar novos produtos/serviços. A inação resultará em comoditização e perda de mercado.
- Foco na Geração de Valor: O valor não está apenas em usar mais tokens, mas em direcioná-los para as tarefas de maior valor e capturar o valor econômico gerado. Isso exige uma estratégia clara e inovação contínua.
- Preparação para Gargalos na Cadeia de Suprimentos: A demanda por componentes de IA (GPUs, memória, CPUs) continuará a superar a oferta, levando a aumentos de preços e prazos de entrega estendidos. Empresas devem planejar com antecedência e considerar estratégias para garantir acesso a esses recursos.
- Gestão da Percepção Pública: A indústria de IA precisa proativamente gerenciar sua imagem pública, destacando os benefícios e abordando as preocupações sociais para evitar uma reação negativa que possa impactar a regulamentação e a adoção. A comunicação deve ser mais acessível e focada no impacto positivo imediato. A concentração de recursos e o acesso privilegiado a modelos avançados podem exacerbar as desigualdades e a percepção negativa da IA. Empresas com capital significativo podem garantir acesso exclusivo, criando uma vantagem competitiva esmagadora. Isso levanta questões sobre a equidade no acesso à tecnologia e suas implicações para a concorrência de mercado.
