Startup Taalas lança chip HC1 com acelerador de IA 10x mais rápido

Maicon Ramos
23/02/2026
4 minutos de leitura

A startup Taalas lançou o chip HC1, acelerador de IA que incorpora o modelo Llama-3.1 8B diretamente no silício para acelerar inferência.

Performance de até 17.000 tokens por segundo, cerca de 10x mais rápido que concorrentes como Cerebras.
Consumo energético reduzido em comparação a chips similares, com operação padrão em servidores air-cooled.
Limitação na flexibilidade por rodar apenas um modelo hardwired, com atualização planejada para 2026.
Foco em aplicações com latência sensível, como robótica e agentes autônomos.

A startup Taalas apresentou em fevereiro de 2026 seu primeiro produto comercial, o chip HC1, um acelerador de inteligência artificial projetado para executar o modelo Llama-3.1 8B da Meta diretamente embutido em hardware. Diferentemente dos aceleradores convencionais, o HC1 armazena permanentemente o modelo no silício, eliminando o gargalo tradicional entre memória e computação, o que permite uma velocidade de inferência cerca de 10 vezes superior a concorrentes como Cerebras e Groq.

Especificações técnicas e desempenho

Construído no processo de fabricação TSMC N6 (6 nm), o chip tem um die de 815 mm² com 53 bilhões de transistores.
Consome cerca de 250W por chip; um servidor com 10 placas consome aproximadamente 2,5 kW, podendo operar com refrigeração por ar tradicional.
Entrega performance de cerca de 17.000 tokens por segundo por usuário, número que supera em 10x chips como o da Cerebras e em 28x o da Groq.
Distribuído em formato de cartão PCIe padrão para fácil integração em servidores convencionais.
O modelo embarcado é o Llama-3.1 8B da Meta, com pesos e arquitetura hardwired, mas permite alguma personalização via LoRA (Low-Rank Adaptation).

Arquitetura inovadora

A arquitetura do HC1 une memória e computação no mesmo chip, eliminando a latência de acesso à memória tradicional de modelos grandes, diferente do modelo convencional que depende de HBM e interconexões como PCIe ou NVLink.
Esta abordagem sacrifica a flexibilidade, pois o HC1 roda exclusivamente o Llama-3.1 8B, sem suporte para outros modelos.
O equilíbrio é buscar latência extremamente baixa (inferior a 100 ms) para aplicações sensíveis, como robótica e agentes de IA em tempo real.

Limitações e desafios

A rigidez do design impede a execução de múltiplos modelos ou atualizações rápidas. Embora a Taalas planeje lançamentos de chips novos e atualizações em 2026, o HC1 é atrelado a um modelo específico.
O Llama-3.1 8B é um modelo intermediário lançado em 2024, que pode ficar defasado frente a modelos mais avançados que surgem rapidamente.
HC1 suporta apenas inferência e não treinamento, limitando seu uso a cenários específicos.
A latência sub-100 ms é consistente somente para o processo de inferência do chip; o tempo fim-a-fim ainda depende da infraestrutura de rede.
Mercado alvo tende a ser nichado, focado em clientes com demandas de latência crítica e eficiência energética.

Perspectivas e roadmap

Para o segundo trimestre de 2026, a Taalas planeja lançar um chip para um modelo de tamanho médio com capacidade de raciocínio.
Até o final de 2026, a empresa pretende lançar a segunda geração, o HC2, com ainda maior densidade e desempenho.
O investimento recente substancial indica que a Taalas está com recursos para continuar sua agenda agressiva de inovação.

O Taalas HC1 demonstra uma mudança importante no mercado de aceleradores de IA, priorizando performance extrema em inferência para casos onde a latência é crítica, embora com sacrifício da flexibilidade. Se a empresa conseguir iterar rapidamente com novos modelos e chips, poderá se consolidar em nichos importantes da indústria.

Fonte: Site oficial da Taalas

Treinamentos

Startup Taalas lança chip HC1 com acelerador de IA 10x mais rápido

Navegue por tópicos

Especificações técnicas e desempenho

Arquitetura inovadora

Limitações e desafios

Perspectivas e roadmap

Maicon Ramos

OpenAI Codex cria jogo completo com um único prompt estruturado

IA Mais que Dobra Produção de Código, mas Ganhos São Desiguais

Apple Renova Siri com IA do Google Gemini para Competir com ChatGPT

Anthropic Lança Claude Opus 4.8 e Desafia OpenAI

Guia ensina a treinar IA para editar no seu estilo

AWS destaca bases sólidas para escalar agentic AI corporativo

Categorias

Soluções

Inscreva-se em nossa newsletter