Google revoluciona IA com Gemini 3 Deep Think e Aletheia
-
Maicon Ramos
- 3 minutos de leitura
Navegue por tópicos
Google lançou atualização do Gemini 3 Deep Think, superando benchmarks em matemática, ciência e programação.
- 84.6% no ARC-AGI-2, maior índice do mercado.
- 3.455 Elo no Codeforces, quase 1.000 pontos acima dos rivais.
- Medalhas simuladas em Olimpíadas Internacionais de Ciência.
- Agente Aletheia para resolução autônoma de problemas matemáticos.
- Disponível via Google AI Ultra e API para pesquisadores.
Lide
A Google DeepMind anunciou em fevereiro de 2026 uma atualização significativa do modo Gemini 3 Deep Think, seu sistema avançado de raciocínio para desafios complexos em ciência, engenharia e pesquisa. O novo sistema alcançou 84.6% no benchmark ARC-AGI-2, superando concorrentes como Opus 4.6 e GPT-5.2, além de obter um recorde de 3.455 pontos Elo no Codeforces. A empresa também lançou Aletheia, um agente matemático autônomo para resolução e verificação de problemas abertos, ampliando as fronteiras da IA aplicada à ciência.
Desempenho e Recursos
- O Gemini 3 Deep Think utiliza “test-time compute”, permitindo mais tempo de processamento e maior precisão em tarefas complexas, focando em dados incompletos e cenários sem soluções claras.
- Alcançou 84.6% no ARC-AGI-2, superando humanos (~60%) e outras IAs concorrentes.
- Conquistou 48.4% no Humanity’s Last Exam sem uso de ferramentas, demonstrando força em raciocínio puro.
- Obteve o nível “Legendary Grandmaster” com 3.455 Elo no Codeforces, quase 1.000 pontos à frente do competidor mais próximo.
- Simulou medalhas de ouro nas Olimpíadas Internacionais de Matemática, Física e Química de 2025.
- O agente Aletheia foi lançado para resolver problemas matemáticos abertos e verificar provas automaticamente, colaborando com pesquisadores científicos.
Aplicações e Acesso
O upgrade está disponível para assinantes do Google AI Ultra no app Gemini e para pesquisadores via programa de early access da API Gemini. A ferramenta é voltada para uso em análise de dados complexos, sistemas físicos e geração de código executável.
Críticas e Limitações
- O benchmark ARC-AGI-2 ainda é provisório, sujeito a retestes e avaliações mais amplas.
- Acesso restrito limita avaliações independentes e adoção ampla inicial.
- O sistema ainda depende de “test-time compute” para alcançar desempenho, questionando se há verdadeira inteligência geral artificial (AGI).
- O resultado no Humanity’s Last Exam sem ferramentas pode não refletir cenários do mundo real, onde o uso de ferramentas é comum.
- O foco em olimpíadas e benchmarks específicos pode não cobrir complexidades reais de pesquisas científicas e dados “bagunçados”.
Implicações
O lançamento reforça a liderança da Google em IA para pesquisa e engenharia avançada, ao mesmo tempo que incentiva debates sobre o impacto da automação em programação e pesquisa científica. O agente Aletheia representa avanço importante rumo à automação de tarefas complexas na ciência.














