A era RAG está terminando para a IA agêntica — uma nova camada de conhecimento em estágio de compilação é o próximo passo
A indústria de IA está passando de sistemas RAG (Retrieval-Augmented Generation) para uma nova arquitetura de conhecimento em estágio de compilação, exemplificada pelo Nexus da Pinecone, para atender às necessidades da IA agêntica, que exige contextualização e raciocínio pré-compilados para otimizar custos e desempenho.
|
04/05 às 16:13
Pontos principais
- A categoria de banco de dados vetorial está mudando, com a adoção de bancos de dados vetoriais autônomos diminuindo e a intenção de recuperação híbrida triplicando, indicando uma necessidade de abordagens mais sofisticadas para IA agêntica.
- A Pinecone lançou o Nexus, uma "engine de conhecimento" que inclui um compilador de contexto para converter dados brutos em artefatos de conhecimento persistentes e específicos para tarefas, e um retriever composable para servir esses artefatos.
- O Nexus também introduz o KnowQL, uma linguagem de consulta declarativa que permite aos agentes especificar a forma da saída, requisitos de confiança e orçamentos de latência, otimizando o consumo de tokens em até 98% em benchmarks internos.
- Ao contrário do RAG, que foi construído para usuários humanos e opera com uma consulta/uma resposta, o Nexus é projetado para agentes que precisam de contexto montado a partir de múltiplas fontes, resolução de conflitos e rastreamento de informações.
- O Nexus move o trabalho de raciocínio do tempo de inferência para o tempo de compilação, criando artefatos de conhecimento reutilizáveis que reduzem custos de tokens, latência imprevisível e resultados não determinísticos.
- Analistas como Stephanie Walter e Arun Chandrasekaran veem o Nexus como uma evolução importante da arquitetura RAG, transformando a compilação de conhecimento em uma camada de infraestrutura de primeira classe, embora não seja uma reinvenção completa.
- A competição inclui tecnologias como FabricIQ da Microsoft e Agentic Data Cloud do Google, mas o foco para compradores empresariais deve ser controle de custos, governança e segurança, e não apenas recursos.
Mencionado nesta matéria
Pessoas
Ash Ashutosh (CEO da Pinecone)Stephanie Walter (líder de prática para pilha de IA na HyperFRAME Research)Arun Chandrasekaran (VP analista distinto da Gartner)
Organizações
VentureBeatPineconeHyperFRAME ResearchGartnerMicrosoftGoogle

