Notícias

Infraestrutura própria pode reduzir custo da IA generativa em até 18 vezes, defende Lenovo

Usar infraestrutura própria para rodar cargas de inteligência artificial generativa pode ser mais vantajoso que depender exclusivamente da nuvem, e esse investimento pode se pagar em menos de quatro meses. Além disso, em cenários de uso contínuo e grande escala, manter servidores próprios pode gerar economias significativas em até 18 vezes.

Os dados acima fazem parte de um estudo recente da Lenovo, chamado On-Premise vs Cloud: Generative AI Total Cost of Ownership (2026 Edition), que analisa quanto custa operar aplicações de IA generativa na nuvem e em infraestrutura própria dentro das empresas. O levantamento considera o custo total de propriedade (TCO, na sigla em inglês) ao longo de cinco anos, incluindo hardware, energia, operação e manutenção.

Leia também: CMOs em destaque: as lideranças que transformam o marketing

Segundo os dados, o custo aproximado para gerar 1 milhão de tokens usando serviços de IA na nuvem é de US$ 2,00, enquanto na infraestrutura própria esse valor é de US$ 0,11. Em um dos cenários analisados, rodar um modelo de grande porte em servidores próprios pode custar cerca de US$ 4,74 por milhão de tokens, enquanto a execução equivalente em instância de nuvem pode chegar a US$ 29,09, economia de aproximadamente 84%.

“Com a popularização da IA generativa, muitas empresas começaram projetos diretamente na nuvem pela facilidade de implementação. O que o estudo mostra é que, quando essas aplicações passam a operar de forma contínua e em grande escala, o modelo de custos muda significativamente”, diz em comunicado Valério Mateus, gerente geral para a América Latina de serviços e soluções da Lenovo.

Segundo os autores do estudo, essa diferença ocorre principalmente porque aplicações de IA generativa costumam operar de forma contínua, gerando respostas e processando solicitações ao longo do dia. Outra razão apontada é que novas gerações de GPUs e servidores otimizados para IA têm aumentado o desempenho e a eficiência energética, permitindo que empresas “executem modelos mais complexos com melhor relação custo-benefício”.

O estudo completo da Lenovo pode ser baixado (em inglês) nesse link.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Recent Posts

Unico processa Serasa Experian por suposto uso indevido de tecnologia de biometria facial

A Unico, empresa brasileira especializada em identidade digital e biometria facial, ingressou com ações nas…

12 horas ago

Salesforce leva Agentforce à Copa do Mundo de 2026

A Salesforce anunciou parceria com a FIFA como apoiadora oficial da Copa do Mundo de…

12 horas ago

Neil Redding abre IT Forum Praia do Forte 2026 com debate sobre liderança na era da IA

Neil Redding será o palestrante de abertura do IT Forum Praia do Forte 2026. Com…

14 horas ago

47% das empresas brasileiras devem adiar migração para a nuvem nos próximos três anos

Apesar da consolidação da computação em nuvem como um dos pilares da transformação digital, uma…

14 horas ago

Deepfakes, IA e software open source lideram lista de ameaças críticas para empresas, diz Gartner

As equipes de segurança cibernética enfrentarão um cenário cada vez mais complexo nos próximos anos,…

15 horas ago

Apenas um em cada três americanos aprova a construção de data centers

Apenas uma em cada três pessoas dos Estados Unidos aprova o ritmo acelerado de construção…

16 horas ago