Intel anuncia 5ª geração do processador Xeon e amplia alcance da IA
Empresa aposta em um mundo híbrido de IA, com Large Language Models (LLMs), software aberto, APIs e arquiteturas heterogêneas de silício
A Intel anuncia hoje (14/12) sua mais recente conquista: a 5ª geração do processador Intel Xeon. Sandra Rivera, vice-presidente sênior e diretora de tecnologia da Intel, lembrou que vivemos agora apenas o começo da revolução da inteligência artificial (IA) e o novo Xeon está em linha com essa era. “IA não é ‘one size fits all’. Por isso, nos concentramos em levar a inteligência artificial para todos os lugares”, sintetizou ela em workshop com jornalistas no escritório da empresa, em Portland*, nos Estados Unidos. O encontro apresentou, em primeira mão, a novidade para o grupo.
A executiva reforçou que a transformação impulsionada pela IA é evidente em diversos setores. Na indústria financeira, é possível acompanhar avanços significativos em detecção de fraudes, avaliação de riscos e atendimento ao cliente. Na saúde, a IA contribuiu para descobertas de medicamentos, análises de diagnósticos e tratamentos personalizados. No varejo, a gestão de estoques, prevenção de fraudes e otimização da cadeia de suprimentos são impulsionadas por essa tecnologia. Na manufatura, o controle de qualidade, automação e eficiência energética estão sendo revolucionados pela IA.
Os gastos globais com IA estão projetados para ultrapassar US$ 300 bilhões até 2026, segundo dados da IDC. Essa democratização da IA vem acompanhada do crescimento exponencial na geração de dados, com mais de 300 milhões de terabytes criados diariamente, algo que levanta questões éticas e preocupações com vieses, segurança, privacidade e sustentabilidade.
Para superar esses desafios, a Intel aposta em um mundo híbrido de IA, com Large Language Models (LLMs), software aberto, APIs e arquiteturas heterogêneas de silício. “A 5ª geração do processador Intel Xeon vai ao encontro desse cenário, sendo a melhor CPU para IA. Com avanços notáveis, a nova geração oferece desempenho 42% superior em inferência de IA em comparação com a geração anterior, ganhos de 21% na computação geral e uma melhoria de 36% na eficiência por watt em uma variedade de cargas de trabalho”, destacou Lisa Spelman, vice-presidente e general manager para produtos Intel Xeon.
Lisa Spelman, vice-presidente e general manager para produtos Intel Xeon
Pat Gelsinger, CEO da Intel, fez uma aparição surpresa no workshop e contou que parceiros, como a Dell, já estão integrando a quinta geração em seus produtos. Ele ressaltou ainda que a preocupação com a sustentabilidade está no centro das discussões, refletindo a crescente importância desse tema no mercado. “Apesar das inquietações com custo e desempenho, estamos comprometidos em oferecer produtos mais sustentáveis”, contou.
Menos latência, mais desempenho
Ronak Singhal e Sailesh Kottapalli, ambos sênior fellow da Intel, indicaram que com essa geração, o Intel Xeon passa de uma arquitetura de quatro blocos para dois, resultando em melhorias notáveis de latência e desempenho.
“A introdução do Compute Express Link 1.1 traz melhorias na memória e suporte de memória em um único nível, beneficiando aplicações web, serviços de dados, HPC, IA e redes. A mudança resulta em até 10 vezes melhor desempenho por watt”, comentou Kottapalli.
Sailesh apontou o compromisso com a IA, evidenciado pelos até 64 núcleos por CPU, melhorias na memória, grande cache de último nível (LLC) e o suporte de software Intel AI. Além disso, a confidencialidade da computação merece destaque, com recursos como Intel SGX e Intel TDX, proporcionando isolamento de aplicativos e máquinas virtuais.
Gaudi 2 e deep learning
Reza Jazayeri, diretor de produtos para Inteligência Artificial da Intel, e Vasudev Lal, cientista de pesquisa para IA e machine learning da Intel, apresentaram o Intel Gaudi2 AI Accelerator, solução para treinamento e inferência de deep learning. Com desempenho dobrado em FP8, flexibilidade e escalabilidade eficientes, o Gaudi2 promete atender às demandas das arquiteturas de IA da próxima geração.
Jazayeri contou que, com o compromisso de oferecer desempenho excepcional e custo-benefício otimizado, o Guadi 2 estabelece um novo padrão ao proporcionar uma performance duas vezes superior e um preço duas vezes mais vantajoso. Sua flexibilidade e escalabilidade eficiente destacam-se no design do sistema, capaz de se adaptar às exigências computacionais do LLM. “A integração de 24 portas GbE padrão da indústria em cada unidade amplia ainda mais suas capacidades”, assinalou.
Disponível tanto para instalações locais quanto para a Intel Developer Cloud, o Guadi 2 simplifica o desenvolvimento de novos modelos ou a migração de modelos existentes, tudo com um mínimo de linhas de código, assegurou ele.
Recursos dedicados para desenvolvedores estão acessíveis para o Guadi, proporcionando suporte essencial. Lançado em julho de 2022, o Guadi 2 alcançou marcos significativos em apenas um ano, desde a primeira publicação, com mais de 100 bilhões de parâmetros. O processo incluiu seis meses para treinamento de modelos de linguagem em grande escala usando GPT, com mais de 100 bilhões de parâmetros. “Além disso, introduzimos diversas capacidades adicionais, como paralelismo comunitário, deep speed e deep speed zero, em várias etapas do lançamento da nossa Synapse AI 1.13”, frisou.
O roadmap revelado pelos executivos mostram planos para o lançamento do Gaudi 3 em 2024, reforçando o compromisso contínuo da Intel em liderar inovações na área de IA.
Inteligência artificial em todos os lugares
Até 2025, projeta-se que mais de 50% dos dados gerados pelas empresas serão criados e processados nos data centers, de acordo com o Gartner. Seguindo essa tendência, até 2026, prevê-se que 50% das implementações na borda envolverão aprendizado de máquina. Essa mudança significativa reflete uma evolução na natureza dos dados empresariais e indica uma transformação substancial na infraestrutura de processamento.
Antecipa-se que a demanda por inferência de IA aumentará em mais de 1.4 vez, impulsionada pelas necessidades dos clientes e pela crescente adoção de edge computing nos data centers. Essas projeções sinalizam uma era de avanços expressivos na interconexão entre dados, aprendizado de máquina e infraestrutura computacional, moldando o cenário empresarial rumo a empresas cada vez mais centradas em dados e inteligência artificial.
Andres Rodriguez, Intel Fellow e arquiteto-chefe para IA da Intel, e Pallavi Mahajan, vice-presidente corporativa e gerente-geral para rede e Edge Group da Intel, exploraram essa abordagem e adicionaram a estratégia da Intel para a inteligência artificial híbrida, conectando inferências baseadas em nuvem com aquelas em tempo real na borda. “A plataforma completa da Intel, com técnicas de Hybrid AI, visa proporcionar uma coordenação perfeita e economicamente viável da nuvem à borda”, explicou Rodriguez.
Mahajan apresentou o caso de uso da Vistry.ai, uma plataforma de conversação para comércio de alimentos, destacando como essa abordagem híbrida pode transformar setores, fornecendo informações em tempo real e assertivas sobre processos operacionais.
Cargas de trabalho otimizadas
Jeremy Rader, gerente-geral de preparação para o mercado Xeon Intel Data Center e AI Group, e Suzi Jewett, gerente-geral para produtos Xeon, apresentaram como a 5ª geração do Intel Xeon Scalable supera a concorrência em diversas métricas-chave que impulsionam os resultados de negócios dos clientes. Desde a aceleração de desempenho para cargas de trabalho em nuvem, empresa, HPC e redes até uma base mais segura e eficiente em termos de custos, a 5ª geração do Xeon promete ser uma revolução.
Rader revelou benefícios para os clientes em áreas cruciais, enquanto Suzi enfatizou as otimizações específicas para cargas de trabalho de HPC e IA, visando extrair mais valor dos dados.
Performance
Allen Chu, diretor de Desempenho e Competição de Data Center da Intel, sinalizou a superioridade dos processadores Intel Xeon Scalable de 5ª geração em relação à concorrência em vários indicadores-chave de desempenho.
Segundo ele, a nova geração de processadores supera em eficiência e vantagens de Custo Total de Propriedade (TCO) em áreas como inteligência artificial, cargas de trabalho amplas e diferentes modelos de implementação. O executivo finalizou explicando que o desempenho virtualizado do Xeon, especialmente em implementações virtualizadas, continua a oferecer liderança em desempenho de vCPU.
Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!
*A jornalista viajou a convite da Intel