Notícias

Demanda de energia da IA aumenta drasticamente e se torna desafio crítico

O consumo exponencial de energia pelos data centers está impulsionando uma nova era de desafios e oportunidades no setor de tecnologia, à medida que gigantes como Nvidia, AMD e Intel investem bilhões em infraestrutura de inteligência artificial (IA). Com o lançamento de novos aceleradores gráficos consumindo até 1.500W por chip e projeções indicando um aumento triplo no uso global de energia até 2024, o futuro da computação de alto desempenho se vê às voltas com questões críticas de eficiência energética e sustentabilidade.

Para se ter dimensão do problema à frente, em 2023, a Nvidia, principal fornecedora de GPUs para data centers, essenciais para IA e computação de alto desempenho, teve um aumento significativo nas remessas de unidades de processamento gráfico (GPUs) para data centers, alcançando 3,76 milhões de unidades, um crescimento de mais de 1,1 milhão em relação ao ano anterior. Estimativas indicam que essas GPUs podem consumir até 14,38 terawatts-hora (TWh) de energia, o que equivale ao consumo anual de energia de mais de 1,3 milhão de residências nos EUA.

Leia também: IA dá vida a personas digitais criadas pela NTT Data

Esse consumo não inclui o das GPUs da AMD, Intel ou de outros silícios personalizados de grandes empresas de tecnologia, nem considera as GPUs já em uso ou as novas remessas da geração Blackwell previstas para 2024 e 2025. Portanto, o consumo total de energia deve ser ainda maior até o final do ano, à medida que as GPUs Blackwell da Nvidia entrarem em operação em maior quantidade.

Consumo por chip

O consumo máximo de energia da GPU Nvidia A100 é de 250W com PCIe (um padrão de interface para conectar componentes de hardware) e 400W com SXM (um módulo PCIe Express para servidores). Já o H100 consome entre 300-350W com PCIe e até 700W com SXM, um aumento de até 75% em relação ao A100.

Os aceleradores MI250 da AMD consomem 500W de energia, chegando a 560W no pico, enquanto o MI300x atinge 750W no pico, um aumento de até 50%.

O acelerador Gaudi 2 da Intel consome 600W, e seu sucessor, o Gaudi 3, consome 900W, representando também um aumento de 50% em relação à geração anterior. O próximo processador híbrido de IA da Intel, codinome Falcon Shores, deve consumir impressionantes 1.500W de energia por chip.

A próxima geração de GPUs Blackwell da Nvidia apresenta um aumento ainda maior no consumo de energia: o modelo B200 consome até 1.200W, e o GB200, que combina duas GPUs B200 e uma unidade central de processamento (CPU) Grace, deve consumir 2.700W. Este aumento representa até 300% no consumo de energia em uma geração de GPUs, com sistemas de IA aumentando o consumo de energia a uma taxa mais alta.

Projeções de consumo de energia

As grandes empresas de tecnologia ainda estão no início do ciclo de investimento em infraestrutura de IA, com um aumento de mais de 35% nas despesas de capital (capex) previsto para 2024, totalizando entre US$ 200 bilhões e US$ 210 bilhões. A maior parte desse investimento está sendo direcionada para a compra de GPUs e silício personalizado, utilizados no treinamento e desenvolvimento de IA, além de atender à crescente demanda na nuvem.

Projeções de analistas, como as da Morgan Stanley e da Wells Fargo, sugerem que o consumo de energia nos data centers continuará a crescer rapidamente. A Morgan Stanley prevê que o uso global de energia em data centers triplicará em 2024, atingindo 46 TWh, devido ao aumento dos chips Blackwell da Nvidia e à maior utilização de GPUs da AMD e silício personalizado.

A projeção é de que o consumo de energia de IA generativa possa superar o uso de energia dos data centers de 2022 até 2027, com uma possível quintuplicação da demanda nos próximos três anos. A Wells Fargo prevê um aumento de 550% no consumo de energia de IA até 2026, atingindo 52 TWh, e um salto de 1.150% até 2030, chegando a 652 TWh, impulsionado principalmente pelo treinamento de IA, que poderá representar 16% do consumo total de eletricidade nos EUA.

Além disso, o Instituto de Pesquisa de Energia Elétrica projeta que o consumo de eletricidade dos data centers nos EUA pode mais que dobrar até 2030, representando 9% da demanda total de eletricidade no país. A Agência Internacional de Energia (IEA) prevê um aumento na demanda global de eletricidade para IA, data centers e criptomoedas, com um cenário base alcançando 800 TWh em 2026, um aumento de quase 75% desde 2022. Em seu cenário de alta, a IEA prevê que essa demanda mais do que dobrará, atingindo 1.050 TWh.

Para mitigar o impacto do aumento no consumo de energia, a indústria está adotando tecnologias de resfriamento mais eficientes, como o resfriamento líquido. Executivos da Nvidia e outros líderes do setor preveem que os data centers precisarão evoluir para acomodar clusters de GPUs em escala muito maior, possivelmente chegando a milhões de GPUs até 2027.

Empresas da cadeia de suprimentos, como a Taiwan Semiconductor, estão desenvolvendo tecnologias mais eficientes em termos de energia para atender a essa demanda crescente. A transição para processos de fabricação de chips de 3nm e 2nm é vista como uma solução promissora para reduzir o consumo de energia enquanto aumenta a densidade e o desempenho dos chips.

*Com informações da Forbes

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Recent Posts

Quando a agilidade organizacional fracassa?

Nos últimos anos, presenciamos diversas ondas de maturidade, aplicabilidade e resultados em torno da agilidade no cenário corporativo.…

34 minutos ago

Uso de IA generativa é desafio para mais de 60% das startups no Brasil

Uma pesquisa inédita do Google for Startups, unidade de apoio a empresas inovadoras da Big…

1 hora ago

Brasil é país com profissionais mais digitalmente qualificados da A. Latina e Caribe

O aumento do interesse pela IA generativa e outras tecnologias digitais por parte dos trabalhadores…

3 horas ago

Amy Webb: Brasil está vivendo no passado

O “país do futuro” ainda vive no passado. Essa foi uma das provocações deixadas por…

16 horas ago

Banco do futuro fará parte de ecossistema personalizado

Carlos Benitez, CEO da BMP, acredita que o banco do futuro não será, exatamente, um…

18 horas ago

Embratel lança Centro de Excelência em Inteligência Artificial

Durante o Febraban Tech 2024, a Embratel anunciou seu novo Centro de Excelência em Inteligência…

19 horas ago