AMD LLANO Tech Day ? parte 2 por dentro da APU Llano

Finalmente posso falar do Llano, e há muito por falar. Desculpo-me com os leitores, pois confundi a data do embargo das informações, era dia 14 e não dia 18. Erro meu. Paciência, mas vamos em frente que o assunto é quente!! Até rimou!
[singlepic id=4230 w=320 h=240 float=]
O começo de tudo é a compra da ATI pela AMD anos atrás. O mercado torceu o nariz e não entendeu direito. A AMD se reestruturou, delegou a fabricação dos valiosos chips para a Global Foundries e manteve para si a nobre tarefa de conceber e projetar as CPUs, GPUs, etc. Havia um objetivo estratégico com a compra que seria fundir as tecnologias de CPU e GPU em um produto único, versátil, poderoso e inovador. E não por acaso este novo tipo de chip passou a ser denominado FUSION, fruto da fusão de duas áreas até então distintas da tecnologia.
A concorrente Intel lançou processador com GPU integrada de boa qualidade, mas arquiteturalmente são dois chips encapsulados juntos, sem compartilhar o “motor” para as duas funções. Isso não tira o mérito da Intel, de forma alguma, apenas caracteriza uma maneira distinta de atacar o mesmo problema. E a solução da AMD demorou mais um pouco porque é mais profunda, mais integrada. A espera valeu a pena.
A começar pelo nome, que agora é diferente, estão as inovações. Não mais CPU, não mais GPU e sim APU que significa “Accelerated Processing Unit”, ou seja, Unidade de Processamento Acelerada. No começo de 2011 chegou a primeira leva desta nova arquitetura, cuja plataforma foi denominada BRAZOS. Consistia da primeira geração de APUs FUSION de baixo consumo (cerca de 9W na série C e 18W na série E) visando o mercado de ultra portabilidade ou notebooks pequenos, do tamanho de netbooks, mas muito melhores. Um bom exemplo são os SONY VAIO Série Y lançados no Brasil fevereiro passado.
Isso dá margem para outra discussão. Quando a AMD comprou a ATI e anunciou que trabalharia na direção do FUSION eu imaginava que estes chegariam primeiro para os Desktops e não notebooks. Mas neste meio tempo o mercado mudou rápido e já se vende mais notebooks que desktop no mundo e no Brasil falta pouco para isso acontecer. Isso fez também crescer a demanda por notebooks com melhor qualidade gráfica. Em 2010 50% dos notebooks tinham recursos gráficos mais sofisticados e se prevê que em 2014 serão 85%. Isso somado a mais alguns aspectos técnicos explicam o porquê das APUs Fusion terem nascido primeiro paro o mercado de dispositivos móveis.
Assim foi cumprida a promessa do Fusion, integrar CPU e GPU, em um processador de alta capacidade que poderia em um notebook prover até 10 horas de vida de bateria : “Supercomputer power in a notebook that lasts all day”.
Conhecendo melhor o LLANO
LLANO é codinome desta geração de APUs de 32 nm para notebooks (e em breve também para desktops) mais potentes (série A) enquanto Brazos é a APU para notebooks menores, ou nebooks, mas com desempenho diferenciado. Há um conjunto de características comuns aos produtos desta geração :
[singlepic id=4231 w=320 h=240 float=]
– Brillant HD : desempenho equivalente a soluções com placa de vídeo discreta em toda a faixa de preços de APUs . Conta com suporte a DirectX 11 (interface gráfica para jogos mais atual), suporte a mais de um monitor e “AMD Steady Video” para estabilizar filmagens tremidas.
– Supercomputer in a Notebook : dispõe de modelo Quadcore (série A8 e A6), com modo “turbo” automático (overclock sob demanda ? Turbo Core) e até 400 cores RADEON para desempenho do sistema de vídeo.
[singlepic id=4232 w=320 h=240 float=]
– AMD All Day Power : mais de 10 horas de vida de bateria com uma experiência visual diferenciada. Capaz de reproduzir dois filmes inteiros em Blu-ray sem necessidade de recarga de bateria.
[singlepic id=4233 w=320 h=240 float=]
Estes são resumidamente os pontos de destaque mais visíveis do LLANO. Mas há razões que os explicam que merecem ser consideradas s explicadas com mais detalhes.
Detalhando um pouco mais
Uma APU Llano é composta por vários subsistemas integrados:
– Controlador de memória DDR3 que, aliás, já faz um bom tempo que a AMD moveu esta importante parte de um PC para o processador trazendo grande benefício em desempenho.
– “Northbridge” que gerencia a comunicação com as interfaces de comunicação (barramento PCI Express) e com a memória.
– Os dois núcleos de processamento (CPUs) ou quatro núcleos no caso da APU A8 ou A6
– Cache L2 de 1 Mb para cada núcleo/CPU
– GPU contendo até 400 stream processors (Radeon Cores) mais interface com display
– UVD ? Unified Video Decoder para processar e decodificar vídeo
– Gerenciamento de interfaces PCI-Express
– Suporte nativo a USB 3.0
– Alta velocidade de acesso à memória. Até 25.6 GB/s para notebooks e 29.8 GB/s para desktop
– Memória operando em “dual-channel”, suporte a até 32 GB de memória para notebooks (usando 2 módulos de 16 GB) e 64 GB em desktops (usando 4 módulos de 16 GB)
[singlepic id=4234 w=320 h=240 float=]
É diferencial nesta arquitetura o “Fusion Compute Link“, assim a parte gráfica (GPU) do chip pode acessar a memória compartilhada com a CPU que tem um grande impacto na velocidade de processamento de aplicações que usam GPGPU (cálculo intensivas) e OpenCL (mais detalhes adiante). No final isto se traduz em desempenho sensivelmente melhor para gráficos e jogos que a solução HD 3000 dos processadores Intel com gráficos integrados.
Na prática isso faz surgir no mercado notebooks com faixa de preço “de entrada” (cerca de US$ 700 nos EUA) com bom desempenho para jogos, mesmo com a grande parte das configurações e melhorias visuais ligadas. Isso não era possível até então.
Projetado para usar pouca energia
São diversas tecnologias que nasceram junto com o Llano para que a APU gaste o mínimo de energia ao mesmo tempo em que entrega o desempenho necessário:
– CPU Power Gating : permite que determinado(s) núcleo(s) da CPU sejam completamente desligados, seja por inatividade ou por comando explícito enviado pelo sistema operacional (OS Halt).
– GPU dynamics power gating : núcles da GPU vão sendo desligados se determinado intervalo de inatividade são atingidos. Da mesma forma também são desligados o UVD (decodificador de vídeo) e áreas de memória da GPU.
– Display Power optimizations: algoritmo capaz de aos poucos ir reduzindo a intensidade da luz de fundo da tela enquanto aumenta seletivamente a intensidade e brilho de pontos (pixels) identificados como importantes para a percepção da imagem. Dessa forma reduzindo o uso de energia e mantendo a imagem a mais fiel possível.
Na imagem abaixo podem ser vistos alguns destes cenários, com partes da APU desligada. Trata-se de uma imagem térmica, assim a cor azul indica locais mais frios (desligados) e a parte verde indica funcionamento normal.
[singlepic id=4235 w=320 h=240 float=]
Este gerenciamento de energia é feito de forma contínua e dinâmica. A figura abaixo mostra a variação do uso e energia ao longo do tempo. Veja que em situação “normal”, sem maior demanda a energia gasta nem se aproxima do máximo (TDP). Isto é importante ser notado para que se entenda como funciona o próximo tópico que explicarei que será o Turbo Core.
[singlepic id=4236 w=320 h=240 float=]
Turbo Core ? extraindo o máximo possível da APU
A ideia é genial e não é nova. Tanto AMD como INTEL têm tecnologias que permitem avaliar a “sobra” existente no chip como um todo e acelerar alguns núcleos na medida em que seja necessário maior desempenho. AMD chama de Turbo Core, Intel chama de Turbo Boost. A figura mostrada acima exibe estas “sobras” que podem ser usadas. Mas a AMD trouxe novidades notáveis para este recurso.
Em primeiro lugar no Llano existe um sistema que digitalmente mede a atividade e estima o consumo total chamado Digital APM Module. Desta forma consegue inferir quanto pode aumentar a frequência para acelerar o processamento. O Turbo Boost da Intel, segundo a AMD, utiliza a temperatura para esta função que é menos precisa (sujeita às variações ambientais).
Mas o que me pareceu muito interessante a forma como o gerenciamento é feito. Consegue balancear o consumo de energia, pelo aumento de frequência (clock) da APU, entre a CPU e a GPU. Assim se o programa em execução demanda mais processamento e a GPU está “aliviada” a GPU perde frequência e a CPU aumenta. Se a GPU é mais exigida que a CPU esta em seu clock aumentado e a CPU tem sua frequência diminuída. Isso tudo em tempo real, instante a instante. Isso é bem ilustrado na sequência de imagens abaixo.
[singlepic id=4237 w=320 h=240 float=]
[singlepic id=4238 w=320 h=240 float=]
[singlepic id=4239 w=320 h=240 float=]
Posicionamento de Mercado
A AMD procura orientar o mercado em relação às equivalências com processadores da concorrente Intel. Assim a APU A8 se situa entre os mais rápidos Core i5 e os Core i7 de entrada. A APU A6 se situa entre os mais velozes Core i3 e os Core i5 mas simples. E finalmente a APU Llano A4 equivale aos Core i3 mais simples e medianos. Este posicionamento é feito por critérios técnicos e econômicos, ou seja, pelo preço estimado do PC com estas soluções.
[singlepic id=4240 w=320 h=240 float=]
São duas APUs A4, duas APUs A6 e 3 APUs A8. As A6 e A8 contam com CPU de 4 núcleos (quadcore) e 4 MB de memória cache (1 MB por core). São 3 APUs A8 porque uma delas, a A8-3500M, de clock mais baixo (1.5 Ghz Turbo Core até 2.4 Ghz ), tem menor consumo (35W) . E toda a série A8 dispõe de 400 “Radeon Cores”, ou seja, 400 núcleos de processamento gráfico.
Na tabela abaixo estão expostos todos os modelos de APUs Llano com suas características principais.
[singlepic id=4241 w=320 h=240 float=]
E o desempenho?? E os testes??
As APUs Llano pretendem conquistar o mercado por suas características de alto desempenho gráfico, processamento e pela economia de energia. Para explicar melhor e mostrar como é o comportamento destas APUs este texto será dividido ainda em mais 2 partes.
No texto seguinte (parte 3) apresentarei diversos cenários nos quais as APUs foram testadas, programas, jogos, codificação de vídeo, etc. Serão dados compilados e apresentados pela própria AMD.
O outro texto (parte 4) será especial! A AMD forneceu para testes um notebook com a plataforma “Sabine”, com APU Llano. Este já está comigo sendo testado. Assim a última parte desta sequência será um texto extenso e detalhado com este notebook, espremendo o máximo que conseguir de informações. Já estão convidados para esta sequência!!
PS: Este texto foi publicado originalmente no meu blog pessoal FXREVIEW
