Biohub lança ESMFold2, novo modelo para biologia proteica em escala
-
Maicon Ramos
- 3 minutos de leitura
Navegue por tópicos
Biohub lançou o ESMFold2, um modelo de linguagem de proteínas treinado em 2,8 bilhões de sequências para prever estruturas e desenhar proteínas. O modelo supera em velocidade o AlphaFold e traz um atlas com bilhões de sequências mapeadas.
- Velocidade até 60x maior que o AlphaFold.
- Mapeamento de bilhões de proteínas em atlas aberto.
- Potencial para avanços em câncer e imunologia.
- Modelo open source para acelerar descobertas biomoleculares.
Lide
Biohub, iniciativa apoiada por Mark Zuckerberg, lançou o ESMFold2, um modelo de linguagem de proteínas treinado em 2,8 bilhões de sequências. Este avanço permite prever estruturas proteicas com alta velocidade e projetar proteínas, potencialmente beneficiando pesquisas em câncer e doenças imunológicas. Além disso, o ESM Atlas associado mapeia bilhões de sequências e estruturas previstas, ampliando o conhecimento sobre a evolução proteica.
Detalhes do ESMFold2 e do Atlas
- O ESMFold2 funciona a partir da análise da sequência primária da proteína, dispensando alinhamentos múltiplos extensos (MSA), o que o torna muito mais rápido e escalável.
- Treinado com base em modelos anteriores da Meta/FAIR (como o ESM-2), ele alcança até 60x mais rapidez em previsões comparadas ao AlphaFold, com desempenho competitivo em precisão.
- O ESM Atlas contém mapeamento de mais de 770 milhões de proteínas preditas com alta confiança, permitindo explorar relações evolutivas e identificar novos alvos para biotecnologia.
Aplicações e Potenciais Impactos
Embora detalhes específicos do design de proteínas e “binders” para câncer e alvos imunes no ESMFold2 ainda não estejam oficialmente documentados, a trajetória do campo sugere potencial real nessa área. A plataforma promete acelerar a pesquisa básica, a descoberta de proteínas raras e o desenvolvimento de tratamentos, desde que a validação experimental continue sendo realizada no laboratório.
Limitações e Considerações
- Apesar do ganho em velocidade, o ESMFold2 não supera o AlphaFold em todas as situações, apresentando desempenho competitivo, mas não universalmente superior.
- Um atlas gigante não elimina o desafio de interpretar funções biológicas ou validar experimentos em laboratório.
- Extrapolações de relações evolutivas a partir de estruturas previstas devem ser feitas com cautela para evitar conclusões errôneas.
- Esse avanço pode pressionar o mercado e fomentar competição com outras plataformas de design molecular e descoberta de fármacos.
FAQ
- O que é o ESMFold2? Um modelo de linguagem de proteínas para previsão e design estrutural, treinado em bilhões de sequências.
- Ele supera o AlphaFold? Não integralmente; é mais rápido, mas com precisão competitiva, sem superar em todos os casos.
- Quantas sequências no treinamento? A pauta refere 2,8 bilhões de sequências, mesmo que ainda não confirmado oficialmente.
- O que é o ESM Atlas? Um atlas metagenômico de estruturas proteicas previstas em bilhões de sequências.
- Isso substitui trabalho de laboratório? Não, validação experimental permanece essencial.
Para mais detalhes, consulte a página oficial do Biohub ESMFold.













