Notícias

Preços de inferências de IA cairão 90% até 2030, prevê o Gartner

Realizar inferências em um grande modelo de linguagem (LLM) com um trilhão de parâmetros terá redução de custos de mais de 90% até 2030, na comparação com os preços praticados em 2025, para os provedores de IA generativa. Segundo o Gartner, isso se deve tanto aos novos hardwares produzidos para esse fim quanto à eficiência dos novos modelos.

“Essas melhorias de custo serão impulsionadas por uma combinação de avanços na eficiência de semicondutores e infraestrutura, inovações no design de modelos, maior utilização dos chips, aumento do uso de silício especializado para inferência e aplicação de dispositivos de borda (edge) para casos de uso específicos”, explica em comunicado Will Sommer, diretor analista sênior do Gartner.

O Gartner prevê que os LLMs em 2030 serão até 100 vezes mais eficientes em termos de custo do que os primeiros modelos de tamanho similar desenvolvidos em 2022. Os ganhos elevados consideram um cenário em que todo o processamento dos modelos ocorre usando chips de ponta, diferente de um cenário de “combinação legada”, ou seja, que utiliza tanto hardware mais moderno quanto antigo.

O que parece uma boa notícia, no entanto, pode não ser tanto assim. Essa queda nos custos por tokens dos provedores de IA generativa não será totalmente repassada aos clientes corporativos, diz o Gartner, porque a tecnologia exigirá “significativamente mais” tokens do que as aplicações convencionais atuais.

Modelos agênticos, por exemplo, exigem de 5 a 30 vezes mais tokens por tarefa do que um chatbot padrão, e podem executar muito mais tarefas do que um humano usando IA generativa. Além disso, as melhorias impulsionarão uma demanda “desproporcionalmente maior por tokens”.

“Os Chief Product Officers (CPOs) não devem confundir a deflação de tokens básicos com a democratização do raciocínio de ponta”, diz Sommer. “À medida que a inteligência comoditizada se aproxima de um custo próximo de zero, a capacidade computacional e os sistemas necessários para suportar o raciocínio avançado permanecem escassos.”

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Next Motorola Solutions adquire Exacom e reforça estratégia de dados »

Previous « Accenture e Microsoft lançam projeto de engenharia de implantação de IA para empresas

Published by

Redação

Tags: custo da IAGartnerIA generativaLLMprocessamentotokens

2 meses ago

Propagandistas chineses usaram ChatGPT para gerar conteúdo contra tarifas de Trump e expansão de data centers nos EUA

A OpenAI divulgou na última quarta-feira um relatório revelando que propagandistas ligados à China utilizaram…

6 horas ago

Notícias

Anthropic pede ao Congresso americano que preserve leis estaduais de IA na ausência de regulação federal robusta

A Anthropic enviou ao Congresso dos Estados Unidos, na última quarta-feira, uma série de recomendações…

7 horas ago

Notícias

Leo conclui migração para SAP S/4HANA e acelera estratégia de digitalização

A Leo, maior revendedora de insumos para marcenaria do Brasil, finalizou a migração de seu…

7 horas ago

Notícias

NTT Data cria AI Office no Brasil para acelerar a transformação empresarial com IA

A NTT Data criou um AI Office no Brasil, uma iniciativa estratégica para inovar no…

8 horas ago

Notícias

IA reduz em 90% o tempo de transcrição de acervo histórico da Santa Casa de Porto Alegre

O Centro Histórico-Cultural da Santa Casa de Porto Alegre encontrou na inteligência artificial uma forma…

9 horas ago

Notícias

LinkedIn chega a 100 milhões de usuários no Brasil e mira a era dos agentes de IA

O LinkedIn anunciou hoje (10), em evento para imprensa em São Paulo, a marca de…