Sonar Expõe Falhas Críticas em LLMs Líderes
Relatório da Sonar analisa 4.442 tarefas Java de LLMs como Claude Sonnet 4 e GPT-4o. Sintaxe perfeita, mas bugs BLOCKER e falhas de segurança explodem em modelos novos. Descubra riscos ocultos. (152 chars)
DeepSeek V3.2 rivaliza GPT-5 por US$ 0,28/M
DeepSeek AI lança V3.2 e V3.2-Speciale: modelos open-weight que igualam GPT-5 e Gemini 3 Pro em matemática e código, com preços de US$ 0,28 por milhão de tokens. Eficiência via DSA. Saiba mais sobre benchmarks e limitações.
ByteDance lança Vidi: IA edita vídeos com precisão espacial
ByteDance, dona do TikTok, lança Vidi, modelo de IA de 12B parâmetros para edição de vídeo com localização espaciotemporal precisa. Integração no TikTok via Smart Split. Saiba capacidades, limitações e riscos.
StepFun Lança GELab-Zero: Novo SOTA em Agentes GUI
StepFun revela GELab-Zero, agente GUI open-source para Android que bate recordes em benchmarks. Executa localmente, sem nuvem. Saiba limitações e como testar. Lançado em 1º dez 2025.
DeepSeek lança Math-V2: IA autoverificável em matemática
DeepSeek AI lança DeepSeekMath-V2, modelo open-source de 685B parâmetros que verifica seu próprio raciocínio matemático. Supera IMO e Putnam, mas exige alto poder computacional. Detalhes e benchmarks aqui.
Mito Desmascarado: China Não Lidera IA Aberta
Alegação viral diz que China superou EUA em IA aberta com 17,1% de mercado vs 15,8%. Análise revela mito: EUA dominam investimentos (US$ 109 bi) e modelos. Veja dados reais do Stanford e limitações chinesas. (158 caracteres)
IA Aristotle resolve enigma de Erdős… mas trivial
Startup Harmonic anuncia que IA Aristotle resolveu Problema #124 de Erdős em 6 horas. Mas especialistas apontam: é versão trivial, não o enigma original de 30 anos. Detalhes e críticas.
ToolOrchestra: IA de 8B supera GPT-5 com 2,5x eficiência
Pesquisadores publicam ToolOrchestra, framework que treina orquestradores de IA leves para coordenar ferramentas e superar GPT-5 em eficiência. Paper no arXiv revela ganhos de 2,5x em testes complexos, mas com limitações reais. Saiba mais sobre a revolução na orquestração de modelos.
OpenAI expõe dados de usuários da API em brecha na Mixpanel
OpenAI notificou usuários após brecha na Mixpanel expor nomes, e-mails e locais de perfis da API. Sem chaves ou chats vazados. Empresa corta laços e reforça segurança em terceiros. Entenda o risco.
DeepSeek-Math-V2 Conquista Ouro na IMO 2025
DeepSeek lança DeepSeek-Math-V2, modelo open weights que atinge ouro na IMO 2025 e 118/120 no Putnam 2024. Avanço em raciocínio matemático com verificação autônoma, mas exige alto custo computacional. (148 chars)








