A IBM anunciou nesta segunda-feira (23), durante a Hot Chips, o processador IBM Telum, primeiro processador de IBM que contém aceleração para a inferência de inteligência artificial (IA) desde o chip enquanto ocorre uma transação.
Segundo a IBM, o semicondutor é desenhado para inferir Deep Learning a cargas de trabalho empresariais a fim de ajudar a abordar fraudes em tempo real. O chip contém 8 núcleos de processamento com um pipeline detalhado de instrução super-scalar out-of-order, sendo executado numa frequência de mais de 5 GHz, otimizada para demandas de carga de trabalho heterogêneas de classe empresarial.
A infraestrutura de cache e interconexão de chip totalmente redesenhada proporciona 32 MB de cache por núcleo e pode escalar até 32 chips de Telum. O design de módulo dual do chip contém 22 bilhões de transistores e cerca de 30 quilômetros de fio em 17 camadas de metal.
Com três anos de desenvolvimento, a inovação desse novo chip para aceleração do hardware foi desenhada para ajudar clientes a obterem insights de negócios em escala para aplicações bancárias, financeiras, comerciais, de seguros e interações com os clientes.
O IBM Telum é desenhado para permitir que as aplicações sejam executadas eficientemente no local onde residem os dados, ajudando a superar os enfoques tradicionais de IA empresarial, que tendem a exigir uma quantidade significativa de memória e capacidades para mover os dados e gerenciar a inferência.
De acordo com a IBM, ter o acelerador próximo aos dados de missão crítica e aplicações significa que as empresas podem realizar um alto volume de inferências para transações sensíveis em tempo real sem ter de recorrer a soluções de IA fora da plataforma, o que poderia impactar o desempenho. Clientes também poderão construir e treinar modelos de IA fora da plataforma, estender e inferir para análises em um sistema IBM habilitado para Telum.
“Uma das principais inovações no design do Telum é que construímos um acelerador de IA direto no silício do chip, conectamos diretamente todos os núcleos e construímos um ecossistema no stack por meio do design de hardware, por meio do firmware e por meio dos sistemas operacionais e do software, que permitem trazer esse aprendizado profundo para as transações”, Anthony Saporito, técnico sênior de desenvolvimento de hardware da IBM Z.
O silício é construído pela Samsung em parceria com o IBM Research AI Hardware Center, usando a tecnologia da linha de semicondutores de ultravioleta extremo (EUV), de 7nm. A expectativa é que os primeiros sistemas equipados com o Telum sejam lançados na primeira metade de 2022.
(Com informações de ZDNet)
Neil Redding será o palestrante de abertura do IT Forum Praia do Forte 2026. Com…
Apesar da consolidação da computação em nuvem como um dos pilares da transformação digital, uma…
As equipes de segurança cibernética enfrentarão um cenário cada vez mais complexo nos próximos anos,…
Apenas uma em cada três pessoas dos Estados Unidos aprova o ritmo acelerado de construção…
Desde o início do ano, a redação acompanha como a Copa do Mundo 2026 extrapola…
A NiCE anunciou a criação do NiCE Labs, um laboratório voltado ao desenvolvimento e à…