Biohub lança ESMFold2, novo modelo para biologia proteica em escala

Biohub lança ESMFold2, novo modelo para biologia proteica em escala

Navegue por tópicos

Biohub lançou o ESMFold2, um modelo de linguagem de proteínas treinado em 2,8 bilhões de sequências para prever estruturas e desenhar proteínas. O modelo supera em velocidade o AlphaFold e traz um atlas com bilhões de sequências mapeadas.

  • Velocidade até 60x maior que o AlphaFold.
  • Mapeamento de bilhões de proteínas em atlas aberto.
  • Potencial para avanços em câncer e imunologia.
  • Modelo open source para acelerar descobertas biomoleculares.

Lide

Biohub, iniciativa apoiada por Mark Zuckerberg, lançou o ESMFold2, um modelo de linguagem de proteínas treinado em 2,8 bilhões de sequências. Este avanço permite prever estruturas proteicas com alta velocidade e projetar proteínas, potencialmente beneficiando pesquisas em câncer e doenças imunológicas. Além disso, o ESM Atlas associado mapeia bilhões de sequências e estruturas previstas, ampliando o conhecimento sobre a evolução proteica.

Detalhes do ESMFold2 e do Atlas

  • O ESMFold2 funciona a partir da análise da sequência primária da proteína, dispensando alinhamentos múltiplos extensos (MSA), o que o torna muito mais rápido e escalável.
  • Treinado com base em modelos anteriores da Meta/FAIR (como o ESM-2), ele alcança até 60x mais rapidez em previsões comparadas ao AlphaFold, com desempenho competitivo em precisão.
  • O ESM Atlas contém mapeamento de mais de 770 milhões de proteínas preditas com alta confiança, permitindo explorar relações evolutivas e identificar novos alvos para biotecnologia.

Aplicações e Potenciais Impactos

Embora detalhes específicos do design de proteínas e “binders” para câncer e alvos imunes no ESMFold2 ainda não estejam oficialmente documentados, a trajetória do campo sugere potencial real nessa área. A plataforma promete acelerar a pesquisa básica, a descoberta de proteínas raras e o desenvolvimento de tratamentos, desde que a validação experimental continue sendo realizada no laboratório.

Limitações e Considerações

  • Apesar do ganho em velocidade, o ESMFold2 não supera o AlphaFold em todas as situações, apresentando desempenho competitivo, mas não universalmente superior.
  • Um atlas gigante não elimina o desafio de interpretar funções biológicas ou validar experimentos em laboratório.
  • Extrapolações de relações evolutivas a partir de estruturas previstas devem ser feitas com cautela para evitar conclusões errôneas.
  • Esse avanço pode pressionar o mercado e fomentar competição com outras plataformas de design molecular e descoberta de fármacos.

FAQ

  • O que é o ESMFold2? Um modelo de linguagem de proteínas para previsão e design estrutural, treinado em bilhões de sequências.
  • Ele supera o AlphaFold? Não integralmente; é mais rápido, mas com precisão competitiva, sem superar em todos os casos.
  • Quantas sequências no treinamento? A pauta refere 2,8 bilhões de sequências, mesmo que ainda não confirmado oficialmente.
  • O que é o ESM Atlas? Um atlas metagenômico de estruturas proteicas previstas em bilhões de sequências.
  • Isso substitui trabalho de laboratório? Não, validação experimental permanece essencial.

Para mais detalhes, consulte a página oficial do Biohub ESMFold.

Foto de Maicon Ramos

Maicon Ramos

Infoprodutor e especialista em automações de Marketing, fundador do Automação sem Limites, uma comunidade para ajudar empreendedores e startup.