Dataset traz os exemplos negativos que faltam aos modelos atuais para treinar a próxima IA da biologia.
O laboratório Rocklin, da Universidade Northwestern, liberou um banco de dados aberto com medições de estabilidade de 1,8 milhão de proteínas para treinar a próxima geração de IA da biologia, incluindo os exemplos negativos que faltam aos modelos atuais. O conjunto foi gerado pela técnica de proteólise por exibição de cDNA.
O lançamento teve apoio do OpenFold Consortium, que defende que a previsão de estrutura, sozinha, não basta: os modelos precisam aprender propriedades biofísicas como estabilidade, dobramento e risco de agregação a partir de dados experimentais abertos e de alta qualidade.
27 mai, 09:34
22 mai, 09:00
26 mar, 09:00
18 mar, 09:00
5 mar, 09:00
Carregando comentários...