AWS anuncia disponibilidade de chips para treinamento de IA
Segundo a AWS, chips oferecem relação preço x performance de 30% a 40% melhor do que a geração atual de instâncias EC2 baseadas em GPU
Durante o AWS re:Invent, em Las Vegas (EUA), a Amazon Web Services (AWS) anunciou a disponibilidade das instâncias do Amazon Elastic Compute Cloud (Amazon EC2) com tecnologia AWS Trainium2. Também apresentou os Trn2 UltraServers, que permitem o treinamento e a implantação de modelos de inteligência artificial (IA), bem como futuros modelos de grande linguagem (LLM) e modelos fundacionais (FM), com mais desempenho e eficiência de custos, e ainda revelou chips Trainium3 de última geração.
Segundo a AWS, as instâncias Trn2 oferecem relação preço x performance de 30% a 40% melhor do que a geração atual de instâncias EC2 P5e e P5en baseadas em GPU, e apresentam 16 chips Trainium2 para fornecer 20,8 petaflops de pico de computação – ideal para treinamento e implantação de LLMs com bilhões de parâmetros.
Os Amazon EC2 Trn2 UltraServers são uma oferta EC2 nova que apresenta 64 chips Trainium2 interconectados, usando a interconexão NeuronLink ultrarrápida, para escalonar até 83,2 petaflops de pico de computação – quadruplicando a computação, a memória e a rede de uma única instância – o que torna possível treinar e implementar os maiores modelos do mundo.
Com a Anthropic, a AWS está construindo um UltraCluster EC2 de UltraServers Trainium2 – denominado Project Rainier -, contendo centenas de milhares de chips Trainium2 e mais de cinco vezes o número de exaflops usados para treinar sua geração atual de modelos líderes de IA.
A colaboração da AWS com empresas como Databricks e Hugging Face também reflete o impacto do Trainium2 na otimização de custos e desempenho. O Mosaic AI da Databricks utilizará o Trainium2 para reduzir o custo total de propriedade em até 30%, enquanto a Hugging Face já integrou os benefícios do chip em suas ferramentas, incluindo o serviço HUGS no AWS Marketplace. Ambas as empresas destacam a importância dessa tecnologia para expandir o uso de IA generativa em diferentes setores.
Além disso, a poolside, uma plataforma voltada ao desenvolvimento de redes neurais com inteligência próxima à humana, planeja usar os UltraServers Trainium2 para reduzir custos em até 40%. Essa infraestrutura permitirá a criação de modelos fundacionais e APIs avançadas, capacitando desenvolvedores a explorar todo o potencial da IA generativa de maneira econômica e eficiente.
Segundo a empresa, o Trainium3, seu chip de IA de última geração, foi projetado para redefinir o desempenho com um processo de 3 nanômetros. Espera-se que os UltraServers com Trainium3 ofereçam desempenho quatro vezes maior do que os modelos atuais, com disponibilidade prevista para 2025. Com o Neuron SDK, a AWS facilita a integração com ferramentas populares como JAX e PyTorch, promovendo a adoção mais ampla de seus chips e permitindo que os desenvolvedores maximizem a eficiência em cargas de trabalho exigentes.
Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!