OpenAI lança GPT-5.3-Codex-Spark para codificação ultrarrápida

OpenAI lança GPT-5.3-Codex-Spark para codificação ultrarrápida

Navegue por tópicos

OpenAI e Cerebras apresentam o GPT-5.3-Codex-Spark, modelo otimizado para codificação ultrarrápida. Disponível para ChatGPT Pro e parceiros empresariais.

  • Velocidade superior a 1.000 tokens por segundo.
  • Usa hardware Wafer-Scale Engine 3 da Cerebras, primeira parceria fora das GPUs Nvidia.
  • Foco em inferência rápida com janela de contexto de 128k tokens.
  • Disponível como preview para ChatGPT Pro e API limitada para empresas.

Lançamento do GPT-5.3-Codex-Spark pela OpenAI

OpenAI, em parceria com a Cerebras Systems, anunciou em 12 de fevereiro de 2026 o lançamento do GPT-5.3-Codex-Spark, um modelo de inteligência artificial focado em codificação ultrarrápida. Diferente dos produtos anteriores que rodavam exclusivamente em GPUs Nvidia, este modelo opera no hardware Wafer-Scale Engine 3 (WSE-3) da Cerebras, marcando a primeira vez que a OpenAI utiliza tecnologia fora do ecossistema Nvidia.

Características e Desempenho

  • O GPT-5.3-Codex-Spark é uma versão menor e otimizada do GPT-5.3-Codex com foco na velocidade de inferência, capaz de gerar mais de 1.000 tokens por segundo.
  • O modelo possui uma janela de contexto de 128 mil tokens e suporta apenas entrada de texto no lançamento, sem suporte multimodal.
  • Em benchmarks como SWE-Bench Pro e Terminal-Bench 2.0, o Codex-Spark apresentou 77,3% de acurácia no Terminal-Bench 2.0, superando versões anteriores.
  • Está integrado ao stack de produção da OpenAI com acesso via ChatGPT Pro (app Codex, CLI, extensão VS Code) e API com acesso limitado para parceiros empresariais.

Objetivos e Aplicações

O foco do Codex-Spark é a codificação em tempo real, com respostas instantâneas que melhoram a eficiência dos desenvolvedores, especialmente em workflows que demandam iterações rápidas e feedback imediato. Isso permite manter o chamado “flow state” durante o desenvolvimento, beneficiando principalmente edições e revisões rápidas de código e visualizações instantâneas, como geração de SVGs via CLI.

Limitações e O Lado B

  • O modelo é limitado a texto, não suportando análises visuais, interfaces gráficas ou multimodalidade, o que pode limitar seu uso em debugging visual.
  • A janela de contexto, embora ampla, é menor comparada a modelos ponta como os GPT-5 com contextos superiores a 1 milhão de tokens.
  • O acesso inicial está limitado à assinatura ChatGPT Pro e parceiros empresariais, com rate limits e flutuações de performance relatadas pela comunidade.
  • A dependência de hardware novo, como o WSE-3 da Cerebras, levanta preocupações sobre estabilidade e escalabilidade em produção comparado a GPUs consolidadas da Nvidia.

Impacto no Mercado e Futuro

O lançamento do GPT-5.3-Codex-Spark representa uma diversificação estratégica do hardware utilizado pela OpenAI, desafiando o domínio das GPUs Nvidia no mercado de inferência AI. A parceria com Cerebras abre caminho para aceleração em wafer-scale e maior capacidade para modelos de trilhões de parâmetros em 2026.

Embora seja focado em tarefas de codificação interativa rápida, a OpenAI mantém suas GPUs como fundamento para cargas de trabalho de treinamento e inferência de longo prazo, indicando que a solução Cerebras é complementar, não substitutiva.

Espera-se que o modelo seja expandido futuramente para outras categorias além do ChatGPT Pro, incluindo versões empresariais, à medida que a capacidade de infraestrutura e a demanda cresçam.

Vídeo Demonstrativo

Para demonstração da velocidade e benchmarks do GPT-5.3-Codex-Spark, o vídeo oficial está disponível no YouTube mostrando uso em pair programming em tempo real e análise crítica do lançamento.

GPT-5.3-Codex-Spark

Foto de Maicon Ramos

Maicon Ramos

Infoprodutor e especialista em automações de Marketing, fundador do Automação sem Limites, uma comunidade para ajudar empreendedores e startup.