Novidades - Runzos

02 dez

Sonar Expõe Falhas Críticas em LLMs Líderes

Postado por

Maicon Ramos

2 de dezembro de 2025

Relatório da Sonar analisa 4.442 tarefas Java de LLMs como Claude Sonnet 4 e GPT-4o. Sintaxe perfeita, mas bugs BLOCKER e falhas de segurança explodem em modelos novos. Descubra riscos ocultos. (152 chars)

Continue lendo

DeepSeek V3.2 rivaliza GPT-5 por US$ 0,28/M

02 dez

Novidades

DeepSeek V3.2 rivaliza GPT-5 por US$ 0,28/M

Postado por

Maicon Ramos

2 de dezembro de 2025

DeepSeek AI lança V3.2 e V3.2-Speciale: modelos open-weight que igualam GPT-5 e Gemini 3 Pro em matemática e código, com preços de US$ 0,28 por milhão de tokens. Eficiência via DSA. Saiba mais sobre benchmarks e limitações.

Continue lendo

ByteDance lança Vidi: IA edita vídeos com precisão espacial

02 dez

Novidades

ByteDance lança Vidi: IA edita vídeos com precisão espacial

Postado por

Maicon Ramos

2 de dezembro de 2025

ByteDance, dona do TikTok, lança Vidi, modelo de IA de 12B parâmetros para edição de vídeo com localização espaciotemporal precisa. Integração no TikTok via Smart Split. Saiba capacidades, limitações e riscos.

Continue lendo

StepFun Lança GELab-Zero: Novo SOTA em Agentes GUI

02 dez

Novidades

StepFun Lança GELab-Zero: Novo SOTA em Agentes GUI

Postado por

Maicon Ramos

2 de dezembro de 2025

StepFun revela GELab-Zero, agente GUI open-source para Android que bate recordes em benchmarks. Executa localmente, sem nuvem. Saiba limitações e como testar. Lançado em 1º dez 2025.

Continue lendo

DeepSeek lança Math-V2: IA autoverificável em matemática

02 dez

Novidades

DeepSeek lança Math-V2: IA autoverificável em matemática

Postado por

Maicon Ramos

2 de dezembro de 2025

DeepSeek AI lança DeepSeekMath-V2, modelo open-source de 685B parâmetros que verifica seu próprio raciocínio matemático. Supera IMO e Putnam, mas exige alto poder computacional. Detalhes e benchmarks aqui.

Continue lendo

Mito Desmascarado: China Não Lidera IA Aberta

01 dez

Novidades

Mito Desmascarado: China Não Lidera IA Aberta

Postado por

Maicon Ramos

1 de dezembro de 2025

Alegação viral diz que China superou EUA em IA aberta com 17,1% de mercado vs 15,8%. Análise revela mito: EUA dominam investimentos (US$ 109 bi) e modelos. Veja dados reais do Stanford e limitações chinesas. (158 caracteres)

Continue lendo

IA Aristotle resolve enigma de Erdős... mas trivial

01 dez

Novidades

IA Aristotle resolve enigma de Erdős… mas trivial

Postado por

Maicon Ramos

1 de dezembro de 2025

Startup Harmonic anuncia que IA Aristotle resolveu Problema #124 de Erdős em 6 horas. Mas especialistas apontam: é versão trivial, não o enigma original de 30 anos. Detalhes e críticas.

Continue lendo

ToolOrchestra: IA de 8B supera GPT-5 com 2,5x eficiência

28 nov

Novidades

ToolOrchestra: IA de 8B supera GPT-5 com 2,5x eficiência

Postado por

Maicon Ramos

28 de novembro de 2025

Pesquisadores publicam ToolOrchestra, framework que treina orquestradores de IA leves para coordenar ferramentas e superar GPT-5 em eficiência. Paper no arXiv revela ganhos de 2,5x em testes complexos, mas com limitações reais. Saiba mais sobre a revolução na orquestração de modelos.

Continue lendo

OpenAI expõe dados de usuários da API em brecha na Mixpanel

28 nov

Novidades

OpenAI expõe dados de usuários da API em brecha na Mixpanel

Postado por

Maicon Ramos

28 de novembro de 2025

OpenAI notificou usuários após brecha na Mixpanel expor nomes, e-mails e locais de perfis da API. Sem chaves ou chats vazados. Empresa corta laços e reforça segurança em terceiros. Entenda o risco.

Continue lendo

DeepSeek-Math-V2 Conquista Ouro na IMO 2025

28 nov

Novidades

DeepSeek-Math-V2 Conquista Ouro na IMO 2025

Postado por

Maicon Ramos

28 de novembro de 2025

DeepSeek lança DeepSeek-Math-V2, modelo open weights que atinge ouro na IMO 2025 e 118/120 no Putnam 2024. Avanço em raciocínio matemático com verificação autônoma, mas exige alto custo computacional. (148 chars)

Continue lendo

Treinamentos

Sonar Expõe Falhas Críticas em LLMs Líderes

DeepSeek V3.2 rivaliza GPT-5 por US$ 0,28/M

ByteDance lança Vidi: IA edita vídeos com precisão espacial

StepFun Lança GELab-Zero: Novo SOTA em Agentes GUI

DeepSeek lança Math-V2: IA autoverificável em matemática

Mito Desmascarado: China Não Lidera IA Aberta

IA Aristotle resolve enigma de Erdős… mas trivial

ToolOrchestra: IA de 8B supera GPT-5 com 2,5x eficiência

OpenAI expõe dados de usuários da API em brecha na Mixpanel

DeepSeek-Math-V2 Conquista Ouro na IMO 2025

Categorias

Soluções

Inscreva-se em nossa newsletter