Startup Taalas lança chip HC1 com acelerador de IA 10x mais rápido
-
Maicon Ramos
- 4 minutos de leitura
Navegue por tópicos
A startup Taalas lançou o chip HC1, acelerador de IA que incorpora o modelo Llama-3.1 8B diretamente no silício para acelerar inferência.
- Performance de até 17.000 tokens por segundo, cerca de 10x mais rápido que concorrentes como Cerebras.
- Consumo energético reduzido em comparação a chips similares, com operação padrão em servidores air-cooled.
- Limitação na flexibilidade por rodar apenas um modelo hardwired, com atualização planejada para 2026.
- Foco em aplicações com latência sensível, como robótica e agentes autônomos.
A startup Taalas apresentou em fevereiro de 2026 seu primeiro produto comercial, o chip HC1, um acelerador de inteligência artificial projetado para executar o modelo Llama-3.1 8B da Meta diretamente embutido em hardware. Diferentemente dos aceleradores convencionais, o HC1 armazena permanentemente o modelo no silício, eliminando o gargalo tradicional entre memória e computação, o que permite uma velocidade de inferência cerca de 10 vezes superior a concorrentes como Cerebras e Groq.
Especificações técnicas e desempenho
- Construído no processo de fabricação TSMC N6 (6 nm), o chip tem um die de 815 mm² com 53 bilhões de transistores.
- Consome cerca de 250W por chip; um servidor com 10 placas consome aproximadamente 2,5 kW, podendo operar com refrigeração por ar tradicional.
- Entrega performance de cerca de 17.000 tokens por segundo por usuário, número que supera em 10x chips como o da Cerebras e em 28x o da Groq.
- Distribuído em formato de cartão PCIe padrão para fácil integração em servidores convencionais.
- O modelo embarcado é o Llama-3.1 8B da Meta, com pesos e arquitetura hardwired, mas permite alguma personalização via LoRA (Low-Rank Adaptation).
Arquitetura inovadora
- A arquitetura do HC1 une memória e computação no mesmo chip, eliminando a latência de acesso à memória tradicional de modelos grandes, diferente do modelo convencional que depende de HBM e interconexões como PCIe ou NVLink.
- Esta abordagem sacrifica a flexibilidade, pois o HC1 roda exclusivamente o Llama-3.1 8B, sem suporte para outros modelos.
- O equilíbrio é buscar latência extremamente baixa (inferior a 100 ms) para aplicações sensíveis, como robótica e agentes de IA em tempo real.
Limitações e desafios
- A rigidez do design impede a execução de múltiplos modelos ou atualizações rápidas. Embora a Taalas planeje lançamentos de chips novos e atualizações em 2026, o HC1 é atrelado a um modelo específico.
- O Llama-3.1 8B é um modelo intermediário lançado em 2024, que pode ficar defasado frente a modelos mais avançados que surgem rapidamente.
- HC1 suporta apenas inferência e não treinamento, limitando seu uso a cenários específicos.
- A latência sub-100 ms é consistente somente para o processo de inferência do chip; o tempo fim-a-fim ainda depende da infraestrutura de rede.
- Mercado alvo tende a ser nichado, focado em clientes com demandas de latência crítica e eficiência energética.
Perspectivas e roadmap
- Para o segundo trimestre de 2026, a Taalas planeja lançar um chip para um modelo de tamanho médio com capacidade de raciocínio.
- Até o final de 2026, a empresa pretende lançar a segunda geração, o HC2, com ainda maior densidade e desempenho.
- O investimento recente substancial indica que a Taalas está com recursos para continuar sua agenda agressiva de inovação.
O Taalas HC1 demonstra uma mudança importante no mercado de aceleradores de IA, priorizando performance extrema em inferência para casos onde a latência é crítica, embora com sacrifício da flexibilidade. Se a empresa conseguir iterar rapidamente com novos modelos e chips, poderá se consolidar em nichos importantes da indústria.
Fonte: Site oficial da Taalas














