Novas Características do Núcleo Penryn
Por Gabriel Torres e Cássio Lima em 04 de abril de 2007
Introdução
O Penryn é o codinome do núcleo que será usado pelos processadores Core 2 e Xeon baseados na microarquitetura Core fabricada com processo de 45 nm. Além do novo processo de fabricação, este núcleo trará novos recursos que explicaremos neste artigo. Nós mostraremos a você também o cronograma que a Intel seguirá até 2010 e também falaremos um pouco sobre a próxima microarquitetura da Intel, codinome Nehalem.
Todos esses nomes podem parecer confusos, por isso vamos explicar melhor. A mais nova microarquitetura da Intel é chamada Core e é usada pelos processadores Core 2 e pelos novos processadores Xeon. Leia nosso tutorial Por Dentro da Microarquitetura Core para aprender mais sobre o assunto. Atualmente os processadores que usam esta microarquitetura são fabricados com processo de 65 nm.
A Intel começará a usar o processo de construção de 45 nm na segunda metade deste ano, quando será lançado um novo núcleo baseado na microarquitetura Core, codinome Penryn. Leia nosso artigo Detalhes Sobre a Nova Tecnologia de Fabricação de 45 nm da Intel para aprender mais sobre o assunto. A Intel revelou que este novo núcleo trará algumas novas características, que explicaremos neste artigo.
Em 2008 a Intel lançará uma nova microarquitetura, codinome Nehalem. O primeiro processador a usar esta nova microarquitetura será fabricado com processo de 45 nm. A Intel revelou algumas das novas características desta nova microarquitetura, que explicaremos ao final deste artigo.
Para 2010 (ou lá pelo final de 2009) a Intel planeja lançar um novo processador baseado na microarquitetura Nehalem, mas fabricado com processo de 32 nm. Este novo núcleo é conhecido pelo codinome Westmere.
Ainda em 2010 a Intel lançará uma nova microarquitetura, codinome Gesher. Os primeiros processadores a usarem esta microarquitetura serão fabricados com processo de 32 nm.
Na Figura 1 apresentamos um breve resumo deste cronograma.
clique para ampliar
Figura 1: Cronograma para os próximos núcleos e microarquiteturas da Intel.Como você pode ver, a Intel está agora comprometida em lançar uma nova microarquitetura a cada dois anos, em anos pares, com uma versão aprimorada de cada nova microarquitetura lançada no ano seguinte, ou seja, em anos ímpares.
Núcleo Penryn
Além do novo processo de fabricação que já explicamos em nosso artigo Detalhes Sobre a Nova Tecnologia de Fabricação de 45 nm da Intel, o núcleo Penryn é um aprimoramento da microarquitetura Core, trazendo algumas novas características:
- Cache de memória L2 maior (até 6 MB para os processadores de dois núcleos e até 12 MB para os processadores de quatro núcleos).
- Caches com divisão de carga.
- Barramentos externos mais rápidos (até 1.600 MHz).
- Novo conjunto de instruções SSE4 (que traz 47 novas instruções SSE para o processador).
- Tecnologia de Desligamento Profundo (Deep Power Down, apenas nos processadores para notebooks).
- Tecnologia de Aceleração Dinâmica Avançada (Enhanced Intel Dynamic Acceleration, apenas nos processadores para notebooks).
- Circuito divisor usando o algoritmo Raiz-16 (aprimoramento da unidade de ponto flutuante).
- Unidade “Shuffle” aprimorada (aprimoramento da unidade de ponto flutuante).
- Tecnologia de Virtualização Aprimorada (entre 25% e 75% de aumento de desempenho no tempo de transição entre máquinas virtuais).
clique para ampliar
Figura 2: Aprimoramentos da microarquitetura Core trazidos pelo núcleo Penryn.Nas Figuras 3 e 4 você pode ver um resumo dos processadores que serão lançados para o mercado de notebooks, desktops e servidores baseados no novo núcleo Penryn.
clique para ampliar
Figura 3: Processadores para desktop e para notebooks baseados no núcleo Penryn.
clique para ampliar
Figura 4: Processadores para servidores baseados no núcleo Penryn.Vamos falar agora sobre algumas das novas características do novo núcleo Penryn.
Aprimoramentos para Processadores para Notebooks
O núcleo Penryn traz duas novas tecnologias para processadores para notebooks: Tecnologia de Desligamento Profundo (Deep Power Down) e Tecnologia de Aceleração Dinâmica Avançada (Enhanced Intel Dynamic Acceleration).
Tecnologia de Desligamento Profundo
Para economizar energia, os processadores para notebook da Intel podem reduzir suas tensões de alimentação, desabilitar seus clock e até mesmo desabilitar seus caches de memória quando estiverem ociosos. Isto é particularmente interessante para notebooks, onde qualquer economia de energia reflete diretamente em maior autonomia da bateria.
Existem três modos básicos de economia de energia, chamados Parar (Halt ou C1), Parar Clock (Stop Clock ou C2) e Sono Profundo (Deep Sleep ou C3). Quando nenhum modo de economia de energia estiver sendo usado o processador estará trabalhando em sua carga máxima e dizemos que ele está no modo C0. Esses modos de economia de energia são genericamente chamados Estados C.
Com o primeiro processador de dois núcleos baseado no núcleo do Pentium M, chamado Core Duo, a Intel permitiu que esses modos fossem configurados por núcleo, o que significa que se um dos núcleos do processador estiver ocioso, o processador pode reduzir a tensão de alimentação e desligar o clock para este núcleo, mantendo o outro núcleo funcionando normalmente. Portanto os dois núcleos podem estar em diferentes Estados C. Além disso, com este processador a Intel introduziu dois novos Estados C, Sono Mais Profundo (Deeper Sleep ou C4) e Sono Mais Profundo Aprimorado (Enhanced Deeper Sleep ou DC4), que podem apenas ser ativados para os dois núcleos ao mesmo tempo.
O núcleo Penryn traz um novo Estado C, chamado Desligamento Profundo (Deep Power Down ou C6). Quando o processador entra neste modo, sua tensão de alimentação é reduzida bastante, os sinais de clocks são desabilitados e ambos os caches de memória são desligados. Este modo economiza mais energia (isto é, bateria) do que todos os outros modos C disponíveis até hoje, mas por outro lado o processador demora mais tempo para voltar para o seu estado ativado.
Na Figura 5 você pode ver uma comparação do novo modo Desligamento Profundo com os outros Estados C atualmente disponíveis nos processadores Core Duo e Core 2.
clique para ampliar
Figura 5: Modo Desligamento Profundo comparado com outros Estados C.Este novo modo C está disponível apenas nos processadores para notebooks.
Tecnologia de Aceleração Dinâmica Avançada
Quando um dos núcleos entra em um dos estados “Profundos” de economia de energia (ou seja, do estado C3 em diante) o novo núcleo Penryn permite que outro núcleo aumente seu clock (ou seja, ele faz um overclock nele mesmo) mantendo o consumo interno do processador no mesmo nível. Como o núcleo inativo estará consumindo menos energia, o núcleo ativo pode dissipar mais calor e consumir mais energia e ainda assim manter o consumo e os requisitos de potência do processador dentro do valor padrão: o processador estará consumindo a mesma quantidade de energia (ou menos) e estará dissipando a mesma quantidade de calor (ou menos).
clique para ampliar
Figura 6: Tecnologia de Aceleração Dinâmica Avançada.Assim como o Desligamento Profundo, este novo recurso está disponível apenas nos processadores para notebooks.
Aprimoramentos da Unidade de Ponto Flutuante
O novo núcleo Penryn traz dois aprimoramentos para a unidade de ponto flutuante do processador, uma para sua unidade de divisão e outro para a sua unidade “shuffle”, que é usada por instruções SSE.
Divisor Usando Algoritmo Raiz-16
Este é um aprimoramento no modo como a unidade de ponto flutuante do processador manipula operações de divisão. Nos processadores Core 2, as operações de divisão processam dois bits por pulso de clock. O novo circuito divisor implementado no Penryn é capaz de processar quatro bits por pulso de clock, o que significa que é duas vezes mais rápido em operações de divisão do que os processadores Core 2.
Na Figura 7 você pode ver uma comparação entre a unidade de ponto flutuante do Core 2 Duo e a unidade de ponto flutuante do novo núcleo Penryn. O eixo “y” representa os pulsos de clock e quanto menor as barras, melhor (menos tempo é gasto para processar uma instrução). No eixo “x” você pode ver as várias instruções de divisão selecionadas para esta comparação.
Aqui está um pequeno glossário para entender a Figura 7 caso você não esteja familiarizado com as instruções do processador:
- int = Inteiro.
- SP = Precisão simples (números de 32 bits).
- DP = Precisão dupla (números de 64 bits).
- EP = Precisão dupla estendida (números de 80 bits).
clique para ampliar
Figura 7: Comparação de desempenho da nova unidade de divisão usada no núcleo Penryn.Aprimoramento da Unidade “Shuffle”
Este é um aprimoramento no modo como a unidade de ponto flutuante do processador manipula operações usadas pelas instruções SSE de formatação de dados, permitindo aos processadores com núcleo Penryn executar algumas instruções em menos pulsos de clock se comparado com o núcleo usado atualmente pelos processadores Core 2 Duo.
Na Figura 8 você pode ver uma comparação entre o número de pulsos de clock que esses dois núcleos levam para executar cada uma dessas instruções. Quanto menor forem as barras, melhor – a utilização de menos pulsos de clock significa menos tempo gasto, o que se traduz em maior desempenho.
Como você pode ver, várias instruções SSE de 128 bits que levam mais do que um pulso de clock para serem processadas são agora processadas em apenas um pulso de clock, aumentando o desempenho SSE. As extensões SSE (Streaming SIMD Extensions) são usadas em aplicativos multimídia que implementam este tipo de instrução.
clique para ampliar
Figura 8: Comparação de desempenho da nova unidade “shuffle” usada no núcleo Penryn.Microarquitetura Nehalem
A Intel revelou alguns pontos-chave da sua futura microarquitetura Nehalem.
O que sabemos até agora sobre esta nova microarquitetura é o seguinte:
- Será baseada na microarquitetura Core.
- Terá capacidade de até oito núcleos por processador.
- Trará a Tecnologia HyperThreading para a microarquitetura Core. Como a tecnologia HyperThreading está disponível apenas na microarquitetura Netburst (usada pelos processadores Pentium 4), ela foi renomeada para Multi-Threading Simultâneo (nós precisamos aguardar e ver se este será o nome definitivo que será usado). Esta tecnologia simula dois núcleos lógicos em cada núcleo físico do processador. Dessa forma, um processador de quatro núcleos será reconhecido como sendo um processador de oito núcleos pelo sistema operacional.
- Alguns modelos terão um controlador de vídeo integrado. Sim, vídeo on-board controlado pelo processador. Esta solução deve ser muito mais rápida do que o vídeo on-board controlado pelo chipset. Com a aquisição da ATI pela AMD, devemos esperar algo similar por parte da AMD também. A propósito, esta não é uma idéia nova. A Cyrix já usava esta abordagem em seu Cyrix MediaGX de 1997, que tinha diversos circuitos integrados diretamente dentro do processador, como o controlador de vídeo e o controlador de memória. A divisão da Cyrix responsável pelo MediaGX foi vendida para a National, que desenvolveu sua linha de processadores Geode baseada no MediaGX. Ainda mais curiosamente, a AMD comprou a linha Geode da National em 2003.
- Terá o chip ponte norte embutido no processador, da mesma forma que acontece com os processadores AMD64.
- Cache multi-nível, seja lá o que isso significa. Provavelmente cada núcleo terá seu próprio cache L2 e o processador terá um cache L3 que será compartilhado entre todos os núcleos. Esta é apenas uma especulação: precisamos aguardar a Intel divulgar mais informações sobre esta nova microarquitetura para podermos ter certeza desta característica.
A Intel listou várias características genéricas e óbvias que simplesmente não significam nada para nós, portanto precisamos aguardar até que eles divulguem mais informações sobre a microarquitetura Nehalem para que possamos entender o que eles querem dizer com:
- “Escalabilidade dinâmica para desempenho sob demanda líder do mercado com eficiência energética”.
- “Largura de banda de sistema e de memória líderes de mercado”.
- “Gerenciamento de consumo de acordo com o desempenho”.
- “Nova arquitetura de sistema para processadores Intel e plataformas da próxima geração”.
- “Núcleos, threads, cache, interfaces e consumo gerenciados dinamicamente”.
Originalmente em http://www.clubedohardware.com.br/artigos/1346
© 1996-2008, Clube do Hardware. Todos os direitos reservados.
É expressamente proibida a reprodução total ou parcial do conteúdo deste site e dos textos disponíveis, seja através de mídia eletrônica, impressa, ou qualquer outra forma de distribuição. Os infratores serão indiciados e punidos com base na lei nº 9.610 de 19/02/1998.
Não nos responsabilizamos por danos materiais e/ou morais de qualquer espécie promovidos pelo uso das informações contidas no Clube do Hardware.