Notícias

AWS anuncia disponibilidade de chips para treinamento de IA

Durante o AWS re:Invent, em Las Vegas (EUA), a Amazon Web Services (AWS) anunciou a disponibilidade das instâncias do Amazon Elastic Compute Cloud (Amazon EC2) com tecnologia AWS Trainium2. Também apresentou os Trn2 UltraServers, que permitem o treinamento e a implantação de modelos de inteligência artificial (IA), bem como futuros modelos de grande linguagem (LLM) e modelos fundacionais (FM), com mais desempenho e eficiência de custos, e ainda revelou chips Trainium3 de última geração.

Segundo a AWS, as instâncias Trn2 oferecem relação preço x performance de 30% a 40% melhor do que a geração atual de instâncias EC2 P5e e P5en baseadas em GPU, e apresentam 16 chips Trainium2 para fornecer 20,8 petaflops de pico de computação – ideal para treinamento e implantação de LLMs com bilhões de parâmetros.

Os Amazon EC2 Trn2 UltraServers são uma oferta EC2 nova que apresenta 64 chips Trainium2 interconectados, usando a interconexão NeuronLink ultrarrápida, para escalonar até 83,2 petaflops de pico de computação – quadruplicando a computação, a memória e a rede de uma única instância – o que torna possível treinar e implementar os maiores modelos do mundo.

Com a Anthropic, a AWS está construindo um UltraCluster EC2 de UltraServers Trainium2 – denominado Project Rainier -, contendo centenas de milhares de chips Trainium2 e mais de cinco vezes o número de exaflops usados para treinar sua geração atual de modelos líderes de IA.

A colaboração da AWS com empresas como Databricks e Hugging Face também reflete o impacto do Trainium2 na otimização de custos e desempenho. O Mosaic AI da Databricks utilizará o Trainium2 para reduzir o custo total de propriedade em até 30%, enquanto a Hugging Face já integrou os benefícios do chip em suas ferramentas, incluindo o serviço HUGS no AWS Marketplace. Ambas as empresas destacam a importância dessa tecnologia para expandir o uso de IA generativa em diferentes setores.

Além disso, a poolside, uma plataforma voltada ao desenvolvimento de redes neurais com inteligência próxima à humana, planeja usar os UltraServers Trainium2 para reduzir custos em até 40%. Essa infraestrutura permitirá a criação de modelos fundacionais e APIs avançadas, capacitando desenvolvedores a explorar todo o potencial da IA generativa de maneira econômica e eficiente.

Segundo a empresa, o Trainium3, seu chip de IA de última geração, foi projetado para redefinir o desempenho com um processo de 3 nanômetros. Espera-se que os UltraServers com Trainium3 ofereçam desempenho quatro vezes maior do que os modelos atuais, com disponibilidade prevista para 2025. Com o Neuron SDK, a AWS facilita a integração com ferramentas populares como JAX e PyTorch, promovendo a adoção mais ampla de seus chips e permitindo que os desenvolvedores maximizem a eficiência em cargas de trabalho exigentes.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Recent Posts

UE ordena que Meta reabra WhatsApp a chatbots rivais

A Comissão Europeia determinou que a Meta reestabeleça o acesso de assistentes de inteligência artificial…

2 horas ago

IPO da SpaceX chega ao mercado como aposta de US$ 1,75 trilhão em IA, não em foguetes

As negociações com as ações da SpaceX têm início nesta quinta-feira, 12, em uma oferta…

3 horas ago

IA muda jornada de compra e devolve relevância aos sites de avaliação B2B, diz Forrester

A ascensão dos agentes de inteligência artificial (IA) está criando uma oportunidade para plataformas de…

3 horas ago

Prêmio Executivo de TI do Ano 2026: conheça os critérios de avaliação

Continuam abertas as inscrições para o prêmio Executivo de TI do Ano 2026. A iniciativa,…

4 horas ago

Meta cria programa de formação para técnicos de data centers em meio à expansão da infraestrutura de IA

A Meta anunciou um investimento de US$ 115 milhões para criar um programa de capacitação…

4 horas ago

Apple apresenta nova geração do Siri AI e amplia aposta em inteligência artificial na WWDC 2026

A Apple utilizou a edição de 2026 da Worldwide Developers Conference (WWDC) para apresentar uma…

4 horas ago