AWS anuncia disponibilidade de chips para treinamento de IA

Segundo a AWS, chips oferecem relação preço x performance de 30% a 40% melhor do que a geração atual de instâncias EC2 baseadas em GPU

Author Photo
4:06 pm - 05 de dezembro de 2024
Amazon EC2 Trn2 Instance Server Sled. Foto: Divulgação

Durante o AWS re:Invent, em Las Vegas (EUA), a Amazon Web Services (AWS) anunciou a disponibilidade das instâncias do Amazon Elastic Compute Cloud (Amazon EC2) com tecnologia AWS Trainium2. Também apresentou os Trn2 UltraServers, que permitem o treinamento e a implantação de modelos de inteligência artificial (IA), bem como futuros modelos de grande linguagem (LLM) e modelos fundacionais (FM), com mais desempenho e eficiência de custos, e ainda revelou chips Trainium3 de última geração.

Segundo a AWS, as instâncias Trn2 oferecem relação preço x performance de 30% a 40% melhor do que a geração atual de instâncias EC2 P5e e P5en baseadas em GPU, e apresentam 16 chips Trainium2 para fornecer 20,8 petaflops de pico de computação – ideal para treinamento e implantação de LLMs com bilhões de parâmetros.

Os Amazon EC2 Trn2 UltraServers são uma oferta EC2 nova que apresenta 64 chips Trainium2 interconectados, usando a interconexão NeuronLink ultrarrápida, para escalonar até 83,2 petaflops de pico de computação – quadruplicando a computação, a memória e a rede de uma única instância – o que torna possível treinar e implementar os maiores modelos do mundo.

Com a Anthropic, a AWS está construindo um UltraCluster EC2 de UltraServers Trainium2 – denominado Project Rainier -, contendo centenas de milhares de chips Trainium2 e mais de cinco vezes o número de exaflops usados para treinar sua geração atual de modelos líderes de IA.

A colaboração da AWS com empresas como Databricks e Hugging Face também reflete o impacto do Trainium2 na otimização de custos e desempenho. O Mosaic AI da Databricks utilizará o Trainium2 para reduzir o custo total de propriedade em até 30%, enquanto a Hugging Face já integrou os benefícios do chip em suas ferramentas, incluindo o serviço HUGS no AWS Marketplace. Ambas as empresas destacam a importância dessa tecnologia para expandir o uso de IA generativa em diferentes setores.

Além disso, a poolside, uma plataforma voltada ao desenvolvimento de redes neurais com inteligência próxima à humana, planeja usar os UltraServers Trainium2 para reduzir custos em até 40%. Essa infraestrutura permitirá a criação de modelos fundacionais e APIs avançadas, capacitando desenvolvedores a explorar todo o potencial da IA generativa de maneira econômica e eficiente.

Segundo a empresa, o Trainium3, seu chip de IA de última geração, foi projetado para redefinir o desempenho com um processo de 3 nanômetros. Espera-se que os UltraServers com Trainium3 ofereçam desempenho quatro vezes maior do que os modelos atuais, com disponibilidade prevista para 2025. Com o Neuron SDK, a AWS facilita a integração com ferramentas populares como JAX e PyTorch, promovendo a adoção mais ampla de seus chips e permitindo que os desenvolvedores maximizem a eficiência em cargas de trabalho exigentes.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Author Photo
Redação

A redação contempla textos de caráter informativo produzidos pela equipe de jornalistas do IT Forum.

Author Photo

Newsletter de tecnologia para você

Os melhores conteúdos do IT Forum na sua caixa de entrada.