Startup Taalas lança chip HC1 com acelerador de IA 10x mais rápido

Startup Taalas lança chip HC1 com acelerador de IA 10x mais rápido

Navegue por tópicos

A startup Taalas lançou o chip HC1, acelerador de IA que incorpora o modelo Llama-3.1 8B diretamente no silício para acelerar inferência.

  • Performance de até 17.000 tokens por segundo, cerca de 10x mais rápido que concorrentes como Cerebras.
  • Consumo energético reduzido em comparação a chips similares, com operação padrão em servidores air-cooled.
  • Limitação na flexibilidade por rodar apenas um modelo hardwired, com atualização planejada para 2026.
  • Foco em aplicações com latência sensível, como robótica e agentes autônomos.

A startup Taalas apresentou em fevereiro de 2026 seu primeiro produto comercial, o chip HC1, um acelerador de inteligência artificial projetado para executar o modelo Llama-3.1 8B da Meta diretamente embutido em hardware. Diferentemente dos aceleradores convencionais, o HC1 armazena permanentemente o modelo no silício, eliminando o gargalo tradicional entre memória e computação, o que permite uma velocidade de inferência cerca de 10 vezes superior a concorrentes como Cerebras e Groq.

Especificações técnicas e desempenho

  • Construído no processo de fabricação TSMC N6 (6 nm), o chip tem um die de 815 mm² com 53 bilhões de transistores.
  • Consome cerca de 250W por chip; um servidor com 10 placas consome aproximadamente 2,5 kW, podendo operar com refrigeração por ar tradicional.
  • Entrega performance de cerca de 17.000 tokens por segundo por usuário, número que supera em 10x chips como o da Cerebras e em 28x o da Groq.
  • Distribuído em formato de cartão PCIe padrão para fácil integração em servidores convencionais.
  • O modelo embarcado é o Llama-3.1 8B da Meta, com pesos e arquitetura hardwired, mas permite alguma personalização via LoRA (Low-Rank Adaptation).

Arquitetura inovadora

  • A arquitetura do HC1 une memória e computação no mesmo chip, eliminando a latência de acesso à memória tradicional de modelos grandes, diferente do modelo convencional que depende de HBM e interconexões como PCIe ou NVLink.
  • Esta abordagem sacrifica a flexibilidade, pois o HC1 roda exclusivamente o Llama-3.1 8B, sem suporte para outros modelos.
  • O equilíbrio é buscar latência extremamente baixa (inferior a 100 ms) para aplicações sensíveis, como robótica e agentes de IA em tempo real.

Limitações e desafios

  • A rigidez do design impede a execução de múltiplos modelos ou atualizações rápidas. Embora a Taalas planeje lançamentos de chips novos e atualizações em 2026, o HC1 é atrelado a um modelo específico.
  • O Llama-3.1 8B é um modelo intermediário lançado em 2024, que pode ficar defasado frente a modelos mais avançados que surgem rapidamente.
  • HC1 suporta apenas inferência e não treinamento, limitando seu uso a cenários específicos.
  • A latência sub-100 ms é consistente somente para o processo de inferência do chip; o tempo fim-a-fim ainda depende da infraestrutura de rede.
  • Mercado alvo tende a ser nichado, focado em clientes com demandas de latência crítica e eficiência energética.

Perspectivas e roadmap

  • Para o segundo trimestre de 2026, a Taalas planeja lançar um chip para um modelo de tamanho médio com capacidade de raciocínio.
  • Até o final de 2026, a empresa pretende lançar a segunda geração, o HC2, com ainda maior densidade e desempenho.
  • O investimento recente substancial indica que a Taalas está com recursos para continuar sua agenda agressiva de inovação.

O Taalas HC1 demonstra uma mudança importante no mercado de aceleradores de IA, priorizando performance extrema em inferência para casos onde a latência é crítica, embora com sacrifício da flexibilidade. Se a empresa conseguir iterar rapidamente com novos modelos e chips, poderá se consolidar em nichos importantes da indústria.

Chip Taalas HC1

Fonte: Site oficial da Taalas

Foto de Maicon Ramos

Maicon Ramos

Infoprodutor e especialista em automações de Marketing, fundador do Automação sem Limites, uma comunidade para ajudar empreendedores e startup.