Relatório do Gartner aponta modelos baseados em consumo de tokens como desafio para os orçamentos corporativos
Os custos de codificação com inteligência artificial devem superar o salário médio de um desenvolvedor até 2028, impulsionados pelo crescimento no consumo de tokens por Grandes Modelos de Linguagem (LLMs) e pela migração de fornecedores para modelos de licenciamento baseados em uso, aponta relatório do Gartner.
Tokens de IA são unidades de dados processadas por modelos de Inteligência Artificial Generativa (GenAI). Em ferramentas de codificação com IA, o volume consumido tem impacto direto nos custos, especialmente quando a cobrança é baseada no uso.
“As organizações estão avançando rapidamente da experimentação para a implementação em escala de agentes de codificação baseados em IA, mas muitas estão subestimando o impacto financeiro do aumento do consumo de tokens”, afirma Nitish Tyagi, diretor Analista Sênior do Gartner. “A disciplina no uso de tokens não surgirá apenas pela escolha dos desenvolvedores, já que eles tendem a priorizar velocidade e conveniência em vez de eficiência de custos. Sem um modelo operacional de engenharia governado, os custos podem crescer mais rapidamente do que os ganhos de produtividade que essas ferramentas prometem entregar.”
A mudança de modelos de licenciamento por usuário para formatos baseados em consumo tem tornado os gastos com engenharia de software mais variáveis e difíceis de prever. Segundo o Gartner, muitos fornecedores de agentes de codificação com IA ainda não oferecem transparência suficiente sobre como o consumo de tokens é calculado e cobrado.
Sem uma visão clara do uso de tokens nas diferentes etapas de desenvolvimento, empresas correm o risco de ultrapassar orçamentos e perder a capacidade de medir a relação entre custo e valor gerado.
“A maioria das organizações ainda não possui a maturidade nem os frameworks necessários para medir efetivamente custos versus impacto nos negócios”, afirma Tyagi. “Os líderes de engenharia de software estão cada vez mais preocupados à medida que os gastos com IA baseados em consumo de tokens se tornam mais difíceis de justificar, com orçamentos frequentemente sendo consumidos antes do esperado.”
Leia também: Percepção de ROI da inteligência artificial cresce 14 pontos percentuais entre os bancos brasileiros, aponta Febraban
Além da precificação e da falta de visibilidade, os padrões de uso dos agentes de codificação também ampliam a pressão sobre os custos. O Gartner aponta que gastos excessivos com tokens costumam estar ligados à ausência de governança em fluxos de trabalho orientados por agentes, ao uso de janelas de contexto muito amplas e à falta de mecanismos estruturados de feedback para otimizar a utilização.
Outro fator é que os fornecedores de soluções de codificação com IA ainda não disponibilizaram recursos maduros e nativos de otimização de custos em seus agentes, o que contribui para a escalada dos gastos.
“Os custos da codificação com IA continuarão aumentando à medida que os investimentos em infraestrutura e os desafios de rentabilidade pressionarem os preços dos modelos para cima”, afirma Tyagi. “Ao mesmo tempo, conforme mais desenvolvedores adotam ferramentas de IA, usuários ocasionais tendem a se tornar usuários frequentes à medida que aumenta sua familiaridade e dependência dessas tecnologias, impulsionando ainda mais o consumo de tokens e os gastos totais.”
Para evitar estouros de orçamento, o Gartner recomenda que líderes de engenharia de software adotem um modelo operacional disciplinado para o uso de IA. Entre as medidas estão a criação de um framework de decisão orientado por casos de uso, com definição clara de quando agentes de codificação devem ser acionados e qual nível de autonomia é adequado para cada tarefa.
A consultoria também aconselha alinhar a escolha dos modelos à complexidade das atividades. Tarefas menores e recorrentes podem ser direcionadas a modelos menores, enquanto modelos mais avançados devem ser reservados para demandas complexas e de maior valor.
Outra orientação é tornar obrigatórias práticas de engenharia de contexto, com treinamento dos desenvolvedores para fornecer aos sistemas de IA apenas informações relevantes, resumir conteúdos quando possível e eliminar dados desnecessários. A medida busca reduzir o consumo de tokens sem comprometer a qualidade dos resultados.
Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!
Redação
1 hora atrás
Redação
2 horas atrás
Redação
2 horas atrás
Daniel Porta
3 horas atrás