Notícias

Ironwood: TPU de sétima geração do Google é desenhado para a ‘era da inferência’

Há uma década, o Google iniciou uma estratégia ambiciosa: desenvolver chips próprios  customizados para alimentar a demanda por processamento de seus sistemas de inteligência artificial (IA).

Nesta quarta-feira (9), durante o Google Cloud Next 2025, principal evento da empresa para clientes e parceiros, que começou hoje em Las Vegas (EUA), a organização deu mais um passo importante nessa jornada com o novo Ironwood, a sétima geração dos seus TPUs (Tensor Processing Units).

Segundo a empresa, o Ironwood foi projetado para facilitar a inferência de modelos de IA em larga escala, abrindo caminho para o que chama de “era da inferência”. Essa nova fase será marcada pelo uso generalizado de agentes de IA por empresas – sistemas autônomos e inteligentes, capazes de executar tarefas sozinhos, em tempo real – alavancando a demanda por poder computacional.

Leia mais: Google Cloud aposta em plataformas abertas para ganhar espaço em ambientes multiagente 

“A discussão já não gira mais em torno dos dados inseridos no modelo, mas sim em torno do que o modelo consegue fazer com os dados com os quais foi treinado”, explica Amin Vahdat, vice-presidente de Machine Learning, Sistemas e IA do Google Cloud.

O Ironwood representa um salto significativo em desempenho. Ele entrega o dobro da performance por watt em comparação com o Trillium, a geração anterior de TPUs, lançada em 2024. Se comparado ao primeiro TPU do Google, de 2018, sua eficiência energética é 30 vezes maior.

Outro destaque é a largura de banda de memória, que atinge 7,2 terabits por segundo (Tbps) por chip – mais de quatro vezes superior à geração passada. A comunicação entre os chips também evoluiu: a nova largura de banda intrachip (ICI) é 1,5 vez maior que a do Trillium, chegando a 1,2 Tbps, o que permite uma inferência de IA ainda mais eficiente.

O Ironwood estará disponível em duas configurações: 256 chips e 9.216 chips. Na configuração maior, a capacidade computacional será de 42,5 Exaflops, mais de 24 vezes superior ao El Capitan – maior supercomputador em operação da atualidade. Cada chip, individualmente, entrega 4.614 TFLOPs de performance, diz o Google. Os TPUs Ironwood têm disponibilidade prevista para o final de 2025.

Cloud WAN

A demanda por computação não é a única a ter crescido por conta do avanço da demanda por sistemas de inteligência artificial (IA) ao redor do mundo: as redes do Google também se expandiram pelo mundo para suportar o fluxo de dados necessário. Hoje, já são mais de 3,2 milhões de quilômetros de fibra e 33 cabos submarinos operados pela companhia no mundo.

Também nesta quarta, o Google anunciou o novo serviço Cloud WAN, que disponibilizará sua rede privada para companhias e governos. De acordo com o Google, o backbone oferece uma performance até 40% superior – quando comparada à “internet pública”, além de redução no custo total de propriedade (TCO).

O produtos é visto como uma nova alterativa para clientes enterprise que operam grandes redes de data centers e têm alta demanda por movimentação de dados. O Cloud WAN oferece opções de conectividade flexíveis para interligar data centers distribuídos geograficamente, funcionando como uma alternativa às soluções de capacidade limitada, alto custo operacional e menor confiabilidade.

*O jornalista viajou a Las Vegas a convite do Google Cloud

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Recent Posts

Propagandistas chineses usaram ChatGPT para gerar conteúdo contra tarifas de Trump e expansão de data centers nos EUA

A OpenAI divulgou na última quarta-feira um relatório revelando que propagandistas ligados à China utilizaram…

10 horas ago

Anthropic pede ao Congresso americano que preserve leis estaduais de IA na ausência de regulação federal robusta

A Anthropic enviou ao Congresso dos Estados Unidos, na última quarta-feira, uma série de recomendações…

11 horas ago

Leo conclui migração para SAP S/4HANA e acelera estratégia de digitalização

A Leo, maior revendedora de insumos para marcenaria do Brasil, finalizou a migração de seu…

11 horas ago

NTT Data cria AI Office no Brasil para acelerar a transformação empresarial com IA

A NTT Data criou um AI Office no Brasil, uma iniciativa estratégica para inovar no…

12 horas ago

IA reduz em 90% o tempo de transcrição de acervo histórico da Santa Casa de Porto Alegre

O Centro Histórico-Cultural da Santa Casa de Porto Alegre encontrou na inteligência artificial uma forma…

13 horas ago

LinkedIn chega a 100 milhões de usuários no Brasil e mira a era dos agentes de IA

O LinkedIn anunciou hoje (10), em evento para imprensa em São Paulo, a marca de…

13 horas ago