Chatting with the Physical World: Google's Yael Maguire on AI, Maps, and 280 Billion Images
Neste vídeo, Matt Forrest entrevista Yael Maguire, GM e VP de Google Maps Platform e Google Earth, para discutir como a inteligência artificial (IA) está transformando a interação com o mundo físico. Eles exploram o uso de 280 bilhões de imagens do Google Street View e IA generativa de ponta para diversas aplicações, desde planejamento urbano e resposta a desastres até a criação de vídeos hiper-realistas baseados em localização a partir de um único prompt.
IA e Geoinformação
Maguire destaca que a IA está impulsionando uma grande mudança de plataforma, e o Google Maps Platform busca integrar a geoinformação nas jornadas de IA dos usuários. A empresa visa capacitar desenvolvedores e empresas a criar experiências que respondam a perguntas complexas sobre o mundo real.
- Ask Maps: Um exemplo de integração de IA é o recurso "Ask Maps" no Google Maps, que permite aos usuários fazer perguntas em linguagem natural para encontrar restaurantes, atividades e informações contextuais. Maguire usou o recurso em uma viagem a Portugal, destacando sua utilidade para navegar em locais desconhecidos ou que mudaram.
- Ferramentas para Desenvolvedores e Empresas: O Google pretende estender essa capacidade a desenvolvedores e empresas, permitindo que construam chatbots e serviços que respondam a perguntas factuais e geoespaciais, como horários de lojas, localização de buracos ou infraestrutura urbana.
- Integração com Google Cloud: A plataforma Vertex do Google Cloud, que inclui modelos Gemini e de terceiros como Anthropic, será alimentada com o vasto corpus de informações factuais do Google para enriquecer as respostas de sistemas de IA.
- Busca no Mundo Real: O objetivo é permitir que modelos de IA realizem buscas no mundo físico usando as 280 bilhões de imagens do Street View, de forma análoga à busca de imagens na web. Isso permitirá encontrar objetos de interesse nas imagens e fornecer respostas quantitativas.
Street View e Imagens Aéreas/de Satélite
O Google está expandindo o uso de suas imagens para extrair informações valiosas e responder a perguntas complexas sobre o ambiente físico.
- Street View Insights: Este produto, que será expandido para incluir imagens aéreas e de satélite, permite que modelos como o Gemini respondam a praticamente qualquer pergunta sobre o vasto corpus de imagens. Isso inclui identificar postes de luz, infraestrutura de serviços públicos, buracos e bueiros, especialmente útil para cidades.
- Digital Twins: A capacidade de extrair informações detalhadas das imagens é vista como um facilitador para a construção de "gêmeos digitais" do mundo físico, permitindo uma compreensão semântica e quantitativa da infraestrutura (ex: altura de postes, condição de hidrantes).
- Parcerias para Resposta a Desastres: Em parceria com empresas como a Vantour, que fornece imagens de satélite de alta frequência, o Google utiliza seus modelos de IA para analisar cenas após desastres naturais. Isso permite identificar áreas queimadas, infraestrutura danificada e planejar a mobilização de recursos de forma rápida e eficiente.
- Análise de Painéis Solares: Um exemplo de aplicação existente é a API que usa IA para analisar a geometria de telhados a partir de imagens aéreas e de satélite, prevendo a capacidade de instalação de painéis solares e a geração de energia. Essa capacidade está sendo generalizada para permitir a análise em larga escala, como a identificação de todos os painéis solares em uma cidade, útil para instaladores e governos.
- Aspecto Temporal: A combinação de imagens de diferentes fontes (Street View, aérea, satélite) permite aproveitar a alta resolução do Street View com a atualização frequente das imagens de satélite, fornecendo uma visão unificada e temporal do mundo físico.
- BigQuery e Google Cloud: Todas as 280 bilhões de imagens do Street View e as informações de imagens aéreas/de satélite estão disponíveis no Google Cloud como instâncias do BigQuery, permitindo a aplicação de algoritmos de IA e modelos unificados para consultas em larga escala.
IA Generativa e Criatividade
O Google está aplicando a IA generativa para criar experiências visuais imersivas e personalizadas, baseadas em dados geoespaciais reais.
- Fundamentação em Imagens do Maps: A IA generativa, como o Nano Banana e o Veo, agora pode usar imagens do Street View como prompt para criar imagens ou vídeos realistas e criativos, mas fundamentados na realidade de um local específico. Isso resolve o problema de modelos de IA que criam cenas geograficamente imprecisas.
- Personalização em Publicidade: Essa capacidade abre portas para campanhas publicitárias altamente personalizadas, onde um anúncio pode ser renderizado no bairro específico de cada espectador, aumentando o impacto e a relevância.
- Ferramentas para Criadores: A tecnologia visa democratizar a criação de conteúdo visual de alta qualidade, permitindo que criadores produzam filmes, anúncios e outros materiais sem a necessidade de grandes investimentos em locações e equipes de produção. Isso simula cenários como transformar uma rua para uma filmagem de época ou adicionar elementos de ficção científica a uma cena real.
- Simulação e Planejamento Urbano: A capacidade de gerar cenas realistas também é útil para simulações, como visualizar o impacto de uma nevasca em uma área ou como uma ponte modernizada ou novos postes de luz afetariam um ambiente urbano.
Implicações
- Disponibilidade de Ferramentas: O Google está lançando o "Maps Imagery Grounding" para criadores e o produto "Insights" no BigQuery para análise de dados geoespaciais. Modelos de IA para processamento de imagens também estarão disponíveis no Vertex Model Garden para aqueles que desejam usar sua própria base de imagens.
- Feedback e Colaboração: A empresa busca ativamente feedback dos usuários sobre a eficácia dessas novas ferramentas em diversas aplicações, desde planejamento urbano até simulações e criação de conteúdo.
- Google Earth AI: Uma iniciativa interna, Google Earth AI, está unindo todos os modelos geoespaciais do Google (clima, qualidade do ar, agricultura, energia) com LLMs para permitir uma compreensão mais profunda e preditiva do mundo, beneficiando consumidores, empresas e a sociedade em geral.
- Democratização da Geoinformação: A IA atua como uma interface flexível, permitindo que mais pessoas acessem e interpretem a vasta quantidade de dados geoespaciais, transformando a forma como interagimos com o mundo físico e planejamos o futuro. A visão é tornar a geoinformação acessível e acionável, respondendo a perguntas que antes exigiam muito esforço ou eram impossíveis de responder.
Maguire enfatiza que o ritmo de desenvolvimento da IA é acelerado, e as possibilidades de integração com a geoinformação estão apenas começando a ser exploradas. O objetivo é ser "confiável e útil" em todas as interações com o mundo real.
