Notícias

Infraestrutura própria pode reduzir custo da IA generativa em até 18 vezes, defende Lenovo

Usar infraestrutura própria para rodar cargas de inteligência artificial generativa pode ser mais vantajoso que depender exclusivamente da nuvem, e esse investimento pode se pagar em menos de quatro meses. Além disso, em cenários de uso contínuo e grande escala, manter servidores próprios pode gerar economias significativas em até 18 vezes.

Os dados acima fazem parte de um estudo recente da Lenovo, chamado On-Premise vs Cloud: Generative AI Total Cost of Ownership (2026 Edition), que analisa quanto custa operar aplicações de IA generativa na nuvem e em infraestrutura própria dentro das empresas. O levantamento considera o custo total de propriedade (TCO, na sigla em inglês) ao longo de cinco anos, incluindo hardware, energia, operação e manutenção.

Leia também: CMOs em destaque: as lideranças que transformam o marketing

Segundo os dados, o custo aproximado para gerar 1 milhão de tokens usando serviços de IA na nuvem é de US$ 2,00, enquanto na infraestrutura própria esse valor é de US$ 0,11. Em um dos cenários analisados, rodar um modelo de grande porte em servidores próprios pode custar cerca de US$ 4,74 por milhão de tokens, enquanto a execução equivalente em instância de nuvem pode chegar a US$ 29,09, economia de aproximadamente 84%.

“Com a popularização da IA generativa, muitas empresas começaram projetos diretamente na nuvem pela facilidade de implementação. O que o estudo mostra é que, quando essas aplicações passam a operar de forma contínua e em grande escala, o modelo de custos muda significativamente”, diz em comunicado Valério Mateus, gerente geral para a América Latina de serviços e soluções da Lenovo.

Segundo os autores do estudo, essa diferença ocorre principalmente porque aplicações de IA generativa costumam operar de forma contínua, gerando respostas e processando solicitações ao longo do dia. Outra razão apontada é que novas gerações de GPUs e servidores otimizados para IA têm aumentado o desempenho e a eficiência energética, permitindo que empresas “executem modelos mais complexos com melhor relação custo-benefício”.

O estudo completo da Lenovo pode ser baixado (em inglês) nesse link.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Recent Posts

Movida lança agente de IA no WhatsApp em parceria com a Meta e aposta em nova experiência de locação

A plataforma de locação de automóveis Movida lançou um agente de inteligência artificial integrado ao…

2 dias ago

Oracle nomeia Marcelle Paiva como nova VP de vendas, Data&AI Hub na América Latina

A Oracle anunciou Marcelle Paiva como nova vice-presidente de vendas, Go-to-Market (GTM) e ecossistema para…

2 dias ago

Mercado de IPOs de tecnologia ganha força com avanço da IA

O mercado de ofertas públicas iniciais voltou a ganhar tração em 2026, impulsionado principalmente pelo…

2 dias ago

Oracle adiciona US$ 85 bilhões em contratos de IA e encerra trimestre com carteira recorde de US$ 638 bilhões

A Oracle encerrou o quarto trimestre e o ano fiscal de 2026 com resultados recordes,…

2 dias ago

Disputa entre Anthropic e OpenAI expõe divergências sobre o futuro da inteligência artificial

A disputa entre Anthropic e OpenAI ganhou novos contornos e se tornou um dos principais…

2 dias ago

Marketing B2B precisa se reorganizar para atender compradores mais autônomos, diz Forrester

As áreas de marketing B2B precisam rever sua estrutura operacional para acompanhar a transformação do…

2 dias ago