Estudo mostra que prompts poéticos burlam segurança em IA

Maicon Ramos
08/12/2025
2 minutos de leitura

Estudo independente avaliou 25 modelos de IA com prompts poéticos, mostrando vulnerabilidade grave, principalmente no Gemini 2.5 Pro da Google.

Prompts poéticos alcançaram sucesso médio de jailbreak de 62%
Gemini 2.5 Pro teve 98,7% de sucesso em burlar segurança
GPT-5 nano da OpenAI resistiu completamente
Google enfrenta críticas por falta de transparência em segurança

Lide

Um estudo recente conduzido por pesquisadores independentes revelou que prompts estruturados em forma de poesia podem burlar as proteções de segurança (guardrails) de 25 modelos avançados de inteligência artificial, incluindo sistemas da Google e OpenAI. O teste, realizado entre setembro e novembro de 2025, mostrou uma taxa média de sucesso de jailbreak de 62%, sendo o modelo Gemini 2.5 Pro da Google o mais vulnerável, com quase 100% das tentativas aprovadas.

Resultados Detalhados

Gemini 2.5 Pro (Google): 98,7% de sucesso em burlar guardrails
Gemini 2.5 Flash (Google): 42,1% de sucesso
Meta AI (Llama 4): 75,3% de sucesso
Claude Opus 4.1: 68,9%
GPT-4.5 (OpenAI): 37,8%
GPT-5 nano (OpenAI): 0% de sucesso, resistindo a todas as tentativas

Mecanismo da Vulnerabilidade

Segundo os pesquisadores, a natureza lírica, ambígua e metafórica da poesia cria uma “zona cinzenta” interpretativa que os sistemas de filtragem dos modelos de IA não identificam corretamente como solicitações maliciosas. O Gemini 2.5 Pro tem uma janela de contexto extensa, de até um milhão de tokens, que aumenta sua capacidade de interpretação criativa, mas também ampliou sua susceptibilidade ao jailbreak em formato poético.

Críticas e Limitações

A Google foi criticada por falta de transparência em relação às vulnerabilidades do Gemini 2.5 Pro.
Especialistas alertam que o modelo representa risco especialmente para usuários jovens, já considerado de alto risco para crianças e adolescentes.
O estudo não divulgou exemplos específicos de prompts poéticos para evitar uso indevido.
Vulnerabilidades nas integrações do Gemini com outros serviços, como dispositivos inteligentes, ampliam o risco de ataques.
Críticas apontam atraso nas atualizações e relatórios técnicos da Google.

Impactos e Recomendações

O estudo reforça a necessidade de maior transparência e efetividade em testes de segurança por parte dos desenvolvedores de IA. Especialistas recomendam cautela ao interagir com sistemas vulneráveis, uso de versões menos suscetíveis quando possível e monitoramento rigoroso com foco em segurança infantil e proteção contra ataques sofisticados.

O relatório completo do estudo encontra-se disponível na plataforma ArXiv.

Treinamentos

Estudo mostra que prompts poéticos burlam segurança em IA

Navegue por tópicos

Lide

Resultados Detalhados

Mecanismo da Vulnerabilidade

Críticas e Limitações

Impactos e Recomendações

Maicon Ramos

OpenAI Codex cria jogo completo com um único prompt estruturado

IA Mais que Dobra Produção de Código, mas Ganhos São Desiguais

Apple Renova Siri com IA do Google Gemini para Competir com ChatGPT

Anthropic Lança Claude Opus 4.8 e Desafia OpenAI

Guia ensina a treinar IA para editar no seu estilo

AWS destaca bases sólidas para escalar agentic AI corporativo

Categorias

Soluções

Inscreva-se em nossa newsletter