Notícias

AWS anuncia disponibilidade de chips para treinamento de IA

Durante o AWS re:Invent, em Las Vegas (EUA), a Amazon Web Services (AWS) anunciou a disponibilidade das instâncias do Amazon Elastic Compute Cloud (Amazon EC2) com tecnologia AWS Trainium2. Também apresentou os Trn2 UltraServers, que permitem o treinamento e a implantação de modelos de inteligência artificial (IA), bem como futuros modelos de grande linguagem (LLM) e modelos fundacionais (FM), com mais desempenho e eficiência de custos, e ainda revelou chips Trainium3 de última geração.

Segundo a AWS, as instâncias Trn2 oferecem relação preço x performance de 30% a 40% melhor do que a geração atual de instâncias EC2 P5e e P5en baseadas em GPU, e apresentam 16 chips Trainium2 para fornecer 20,8 petaflops de pico de computação – ideal para treinamento e implantação de LLMs com bilhões de parâmetros.

Os Amazon EC2 Trn2 UltraServers são uma oferta EC2 nova que apresenta 64 chips Trainium2 interconectados, usando a interconexão NeuronLink ultrarrápida, para escalonar até 83,2 petaflops de pico de computação – quadruplicando a computação, a memória e a rede de uma única instância – o que torna possível treinar e implementar os maiores modelos do mundo.

Com a Anthropic, a AWS está construindo um UltraCluster EC2 de UltraServers Trainium2 – denominado Project Rainier -, contendo centenas de milhares de chips Trainium2 e mais de cinco vezes o número de exaflops usados para treinar sua geração atual de modelos líderes de IA.

A colaboração da AWS com empresas como Databricks e Hugging Face também reflete o impacto do Trainium2 na otimização de custos e desempenho. O Mosaic AI da Databricks utilizará o Trainium2 para reduzir o custo total de propriedade em até 30%, enquanto a Hugging Face já integrou os benefícios do chip em suas ferramentas, incluindo o serviço HUGS no AWS Marketplace. Ambas as empresas destacam a importância dessa tecnologia para expandir o uso de IA generativa em diferentes setores.

Além disso, a poolside, uma plataforma voltada ao desenvolvimento de redes neurais com inteligência próxima à humana, planeja usar os UltraServers Trainium2 para reduzir custos em até 40%. Essa infraestrutura permitirá a criação de modelos fundacionais e APIs avançadas, capacitando desenvolvedores a explorar todo o potencial da IA generativa de maneira econômica e eficiente.

Segundo a empresa, o Trainium3, seu chip de IA de última geração, foi projetado para redefinir o desempenho com um processo de 3 nanômetros. Espera-se que os UltraServers com Trainium3 ofereçam desempenho quatro vezes maior do que os modelos atuais, com disponibilidade prevista para 2025. Com o Neuron SDK, a AWS facilita a integração com ferramentas populares como JAX e PyTorch, promovendo a adoção mais ampla de seus chips e permitindo que os desenvolvedores maximizem a eficiência em cargas de trabalho exigentes.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Recent Posts

Propagandistas chineses usaram ChatGPT para gerar conteúdo contra tarifas de Trump e expansão de data centers nos EUA

A OpenAI divulgou na última quarta-feira um relatório revelando que propagandistas ligados à China utilizaram…

13 horas ago

Anthropic pede ao Congresso americano que preserve leis estaduais de IA na ausência de regulação federal robusta

A Anthropic enviou ao Congresso dos Estados Unidos, na última quarta-feira, uma série de recomendações…

13 horas ago

Leo conclui migração para SAP S/4HANA e acelera estratégia de digitalização

A Leo, maior revendedora de insumos para marcenaria do Brasil, finalizou a migração de seu…

14 horas ago

NTT Data cria AI Office no Brasil para acelerar a transformação empresarial com IA

A NTT Data criou um AI Office no Brasil, uma iniciativa estratégica para inovar no…

14 horas ago

IA reduz em 90% o tempo de transcrição de acervo histórico da Santa Casa de Porto Alegre

O Centro Histórico-Cultural da Santa Casa de Porto Alegre encontrou na inteligência artificial uma forma…

15 horas ago

LinkedIn chega a 100 milhões de usuários no Brasil e mira a era dos agentes de IA

O LinkedIn anunciou hoje (10), em evento para imprensa em São Paulo, a marca de…

16 horas ago