O modelo HRM-Text desafia a necessidade de grandes investimentos em infraestrutura ao alcançar alto desempenho com custo reduzido de treinamento.
Pesquisadores da Sapient desenvolveram o HRM-Text, um modelo de linguagem que desafia o paradigma de que o treinamento de sistemas de inteligência artificial exige investimentos milionários. Com um custo de apenas US$ 1.500, o projeto utilizou uma arquitetura de Hierarchical Recurrent Model (HRM) que separa camadas de estratégia e execução, permitindo uma eficiência superior no processamento de dados. Ao focar em 40 bilhões de tokens voltados ao raciocínio, em vez da memorização massiva de conteúdos da internet, o modelo demonstrou desempenho competitivo em benchmarks acadêmicos importantes, superando alternativas de maior escala. Esta inovação é relevante por democratizar o acesso à tecnologia, permitindo que empresas desenvolvam seus próprios modelos especializados sem a necessidade de infraestruturas massivas, reduzindo significativamente a barreira de entrada para o desenvolvimento de modelos de raciocínio avançados.
10 jun, 10:35
29 mai, 13:46
28 mai, 19:05
26 abr, 09:01
5 mar, 09:00
Carregando comentários...