Sua IA está escrevendo código inseguro? O que os testes com LLMs nos revelam

Por Tiago Neves Furtado, sócio do Opice Blum Advogados

A inteligência artificial generativa está transformando a maneira como desenvolvemos software. Pedir para um modelo gerar um trecho de código tornou-se tão comum quanto consultar um colega no Slack. Mas, segundo uma análise recente da Backslash Security, os principais modelos de IA do mercado ainda estão entregando código inseguro por padrão, especialmente quando os prompts são simples ou genéricos.

O estudo avaliou sete versões atuais de LLMs (Large Language Models), incluindo o GPT-4o (OpenAI), o Claude 3.7-Sonnet (Anthropic) e o Gemini (Google). A metodologia foi clara: testar o que esses modelos fazem quando recebem comandos como “escreva um código que faça X”. O resultado? Todos geraram código vulnerável a pelo menos quatro das dez falhas mais comuns do CWE (Common Weakness Enumeration).

Entre as falhas mais frequentes estavam:

· Command injection

· Cross-site scripting (XSS) — tanto no frontend quanto no backend

· Insecure file upload

· Path traversal

Mesmo quando os prompts pediam explicitamente por segurança — como “make sure you are writing secure code” — a maioria dos modelos ainda gerava saídas com vulnerabilidades. No caso do GPT-4o, apenas 20% dos códigos gerados com esse tipo de alerta genérico estavam seguros. O desempenho só melhora quando se pede algo mais específico como “follow OWASP secure coding best practices”, mesmo assim, 35% dos códigos ainda apresentaram falhas.

A exceção foi o modelo Claude 3.7-Sonnet, que chegou a 100% de sucesso com prompts genéricos de segurança, mostrando que o comportamento varia bastante entre modelos, e também depende muito de como se escreve o prompt. Esses dados reforçam um ponto já levantado pelo Cybersecurity Readiness Index 2025, da Cisco: as empresas ainda não têm visibilidade sobre como a IA está sendo usada internamente. Cerca de 60% não conseguem monitorar os prompts feitos por funcionários a ferramentas de GenAI, o que significa que há uma grande chance de código inseguro estar sendo produzido e implementado sem qualquer revisão técnica.

O uso informal ou não autorizado de IA no ambiente corporativo é conhecido como shadow AI. E ele cresce rápido. Segundo a Cisco, mais da metade das empresas não consegue sequer identificar se ferramentas não aprovadas estão em uso. É um campo cego dentro da própria organização.

A boa notícia? Existe um caminho. A análise da Backslash mostra que prompts bem estruturados, com foco em segurança, ajudam — e muito — a melhorar a qualidade do código gerado. Mas isso não pode ficar apenas nas mãos do desenvolvedor. Como o próprio estudo destaca: “Developers are still learning prompt engineering themselves and are not expected to be security experts”. Ou seja, é papel dos times de segurança criarem regras, templates e ferramentas para garantir que o código gerado por IA seja seguro por design.

A IA não é o problema. O risco está na confiança cega e na falta de controle. Se bem usada, ela pode ser uma aliada poderosa para reforçar práticas que há anos tentamos incorporar na rotina de desenvolvimento. Mas, para isso, precisamos de governança, visibilidade e engenharia de prompts com responsabilidade.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Next A IA é espelho ou armadilha da humanidade? »

Previous « Salesforce absorve equipe da Moonhub e reforça estratégia de IA para RH

Published by

Pamela Sousa

Tags: códigoLLM

1 ano ago

UE ordena que Meta reabra WhatsApp a chatbots rivais

A Comissão Europeia determinou que a Meta reestabeleça o acesso de assistentes de inteligência artificial…

15 horas ago

Notícias

IPO da SpaceX chega ao mercado como aposta de US$ 1,75 trilhão em IA, não em foguetes

As negociações com as ações da SpaceX têm início nesta quinta-feira, 12, em uma oferta…

15 horas ago

Notícias

IA muda jornada de compra e devolve relevância aos sites de avaliação B2B, diz Forrester

A ascensão dos agentes de inteligência artificial (IA) está criando uma oportunidade para plataformas de…

16 horas ago

Notícias

Prêmio Executivo de TI do Ano 2026: conheça os critérios de avaliação

Continuam abertas as inscrições para o prêmio Executivo de TI do Ano 2026. A iniciativa,…

16 horas ago

Notícias

Meta cria programa de formação para técnicos de data centers em meio à expansão da infraestrutura de IA

A Meta anunciou um investimento de US$ 115 milhões para criar um programa de capacitação…

16 horas ago

Notícias

Apple apresenta nova geração do Siri AI e amplia aposta em inteligência artificial na WWDC 2026

A Apple utilizou a edição de 2026 da Worldwide Developers Conference (WWDC) para apresentar uma…

17 horas ago

Sua IA está escrevendo código inseguro? O que os testes com LLMs nos revelam

Related Post

Recent Posts

UE ordena que Meta reabra WhatsApp a chatbots rivais

IPO da SpaceX chega ao mercado como aposta de US$ 1,75 trilhão em IA, não em foguetes

IA muda jornada de compra e devolve relevância aos sites de avaliação B2B, diz Forrester

Prêmio Executivo de TI do Ano 2026: conheça os critérios de avaliação

Meta cria programa de formação para técnicos de data centers em meio à expansão da infraestrutura de IA

Apple apresenta nova geração do Siri AI e amplia aposta em inteligência artificial na WWDC 2026