Pesquisadores da Anthropic criaram autoencoders de linguagem natural que traduzem as ativações internas de LLMs em texto, revelando como esses modelos processam informações.

Pesquisadores da Anthropic desenvolveram autoencoders de linguagem natural, uma tecnologia que permite traduzir as ativações internas de Modelos de Linguagem Grande (LLMs) em texto compreensível. Essas ativações são os números que codificam os "pensamentos" e o processamento interno de um modelo de inteligência artificial. A inovação oferece uma nova maneira de entender como os LLMs funcionam.
Quando um usuário interage com um modelo de IA, como o Claude, as palavras são processadas internamente como longas listas de números. A nova tecnologia da Anthropic permite converter esses dados numéricos de volta para a linguagem natural, revelando os mecanismos subjacentes ao processamento de informações dos modelos de IA. Isso pode aprofundar a compreensão sobre o funcionamento e as decisões desses sistemas.
8 mai, 09:00
7 mai, 18:38
29 abr, 14:07
10 mar, 16:03
20 mai, 21:00
Carregando comentários...