A Pinecone introduziu o Nexus, uma nova "engine de conhecimento" projetada para otimizar o desempenho e reduzir custos em sistemas de IA agêntica, marcando uma evolução da arquitetura RAG.

A Pinecone, empresa de banco de dados vetorial, lançou o Nexus, uma nova "engine de conhecimento" desenvolvida para atender às demandas da IA agêntica. Esta tecnologia representa uma evolução da arquitetura de Geração Aumentada por Recuperação (RAG), que tem sido amplamente utilizada na indústria de inteligência artificial. O Nexus inclui um compilador de contexto para converter dados brutos em artefatos de conhecimento persistentes e específicos para tarefas, além de um retriever composable para servir esses artefatos.
O principal objetivo do Nexus é otimizar o desempenho e reduzir os custos operacionais de sistemas de IA agêntica. Ao mover o trabalho de raciocínio do tempo de inferência para o tempo de compilação, a plataforma cria artefatos de conhecimento reutilizáveis, o que pode reduzir significativamente o consumo de tokens, a latência imprevisível e a ocorrência de resultados não determinísticos. A Pinecone afirma que o Nexus pode otimizar o consumo de tokens em até 98% em benchmarks internos, oferecendo uma solução mais eficiente para a crescente complexidade das aplicações de IA.
1 mai, 00:01
28 abr, 12:13
8 abr, 19:04
20 mar, 09:00
24 jul, 21:00