OpenAI lança GPT-5.3-Codex-Spark para codificação ultrarrápida
-
Maicon Ramos
- 3 minutos de leitura
Navegue por tópicos
OpenAI e Cerebras apresentam o GPT-5.3-Codex-Spark, modelo otimizado para codificação ultrarrápida. Disponível para ChatGPT Pro e parceiros empresariais.
- Velocidade superior a 1.000 tokens por segundo.
- Usa hardware Wafer-Scale Engine 3 da Cerebras, primeira parceria fora das GPUs Nvidia.
- Foco em inferência rápida com janela de contexto de 128k tokens.
- Disponível como preview para ChatGPT Pro e API limitada para empresas.
Lançamento do GPT-5.3-Codex-Spark pela OpenAI
OpenAI, em parceria com a Cerebras Systems, anunciou em 12 de fevereiro de 2026 o lançamento do GPT-5.3-Codex-Spark, um modelo de inteligência artificial focado em codificação ultrarrápida. Diferente dos produtos anteriores que rodavam exclusivamente em GPUs Nvidia, este modelo opera no hardware Wafer-Scale Engine 3 (WSE-3) da Cerebras, marcando a primeira vez que a OpenAI utiliza tecnologia fora do ecossistema Nvidia.
Características e Desempenho
- O GPT-5.3-Codex-Spark é uma versão menor e otimizada do GPT-5.3-Codex com foco na velocidade de inferência, capaz de gerar mais de 1.000 tokens por segundo.
- O modelo possui uma janela de contexto de 128 mil tokens e suporta apenas entrada de texto no lançamento, sem suporte multimodal.
- Em benchmarks como SWE-Bench Pro e Terminal-Bench 2.0, o Codex-Spark apresentou 77,3% de acurácia no Terminal-Bench 2.0, superando versões anteriores.
- Está integrado ao stack de produção da OpenAI com acesso via ChatGPT Pro (app Codex, CLI, extensão VS Code) e API com acesso limitado para parceiros empresariais.
Objetivos e Aplicações
O foco do Codex-Spark é a codificação em tempo real, com respostas instantâneas que melhoram a eficiência dos desenvolvedores, especialmente em workflows que demandam iterações rápidas e feedback imediato. Isso permite manter o chamado “flow state” durante o desenvolvimento, beneficiando principalmente edições e revisões rápidas de código e visualizações instantâneas, como geração de SVGs via CLI.
Limitações e O Lado B
- O modelo é limitado a texto, não suportando análises visuais, interfaces gráficas ou multimodalidade, o que pode limitar seu uso em debugging visual.
- A janela de contexto, embora ampla, é menor comparada a modelos ponta como os GPT-5 com contextos superiores a 1 milhão de tokens.
- O acesso inicial está limitado à assinatura ChatGPT Pro e parceiros empresariais, com rate limits e flutuações de performance relatadas pela comunidade.
- A dependência de hardware novo, como o WSE-3 da Cerebras, levanta preocupações sobre estabilidade e escalabilidade em produção comparado a GPUs consolidadas da Nvidia.
Impacto no Mercado e Futuro
O lançamento do GPT-5.3-Codex-Spark representa uma diversificação estratégica do hardware utilizado pela OpenAI, desafiando o domínio das GPUs Nvidia no mercado de inferência AI. A parceria com Cerebras abre caminho para aceleração em wafer-scale e maior capacidade para modelos de trilhões de parâmetros em 2026.
Embora seja focado em tarefas de codificação interativa rápida, a OpenAI mantém suas GPUs como fundamento para cargas de trabalho de treinamento e inferência de longo prazo, indicando que a solução Cerebras é complementar, não substitutiva.
Espera-se que o modelo seja expandido futuramente para outras categorias além do ChatGPT Pro, incluindo versões empresariais, à medida que a capacidade de infraestrutura e a demanda cresçam.
Vídeo Demonstrativo
Para demonstração da velocidade e benchmarks do GPT-5.3-Codex-Spark, o vídeo oficial está disponível no YouTube mostrando uso em pair programming em tempo real e análise crítica do lançamento.














