Pesquisador do Google DeepMind estabelece distinção entre contextos curtos e longos para otimizar a execução de tarefas complexas por modelos de IA.
O pesquisador Pranav Shyam, do Google DeepMind, propôs uma nova classificação técnica para as janelas de contexto em modelos de linguagem, visando diferenciar interações simples de operações complexas. Segundo a definição, contextos de até 32 mil tokens são classificados como curtos, enquanto horizontes de 64 mil tokens ou mais exigem uma arquitetura de processamento mais robusta. A distinção é fundamental para o desenvolvimento de sistemas de IA, uma vez que janelas extensas demandam o uso de chamadas de ferramentas e execução de código para manter a coerência e o estado das informações entre as etapas de processamento. Essa padronização busca esclarecer os desafios técnicos enfrentados pelos desenvolvedores ao gerenciar grandes volumes de dados em modelos de linguagem, garantindo maior eficiência na resolução de tarefas que exigem raciocínio prolongado e acesso a múltiplas fontes de informação.
1 jul, 06:04
11 jun, 14:34
20 mai, 09:00
1 mar, 13:19
22 set, 21:00
Carregando comentários...