Novas Características do Núcleo Penryn

4 de abril de 2007 73.726 visualizações Processadores 1 comentário

Índice

Aprimoramentos da Unidade de Ponto Flutuante

O novo núcleo Penryn traz dois aprimoramentos para a unidade de ponto flutuante do processador, uma para sua unidade de divisão e outro para a sua unidade “shuffle”, que é usada por instruções SSE.

Divisor Usando Algoritmo Raiz-16

Este é um aprimoramento no modo como a unidade de ponto flutuante do processador manipula operações de divisão. Nos processadores Core 2, as operações de divisão processam dois bits por pulso de clock. O novo circuito divisor implementado no Penryn é capaz de processar quatro bits por pulso de clock, o que significa que é duas vezes mais rápido em operações de divisão do que os processadores Core 2.

Na Figura 7 você pode ver uma comparação entre a unidade de ponto flutuante do Core 2 Duo e a unidade de ponto flutuante do novo núcleo Penryn. O eixo “y” representa os pulsos de clock e quanto menor as barras, melhor (menos tempo é gasto para processar uma instrução). No eixo “x” você pode ver as várias instruções de divisão selecionadas para esta comparação.

Aqui está um pequeno glossário para entender a Figura 7 caso você não esteja familiarizado com as instruções do processador:

int = Inteiro.
SP = Precisão simples (números de 32 bits).
DP = Precisão dupla (números de 64 bits).
EP = Precisão dupla estendida (números de 80 bits).

Figura 7: Comparação de desempenho da nova unidade de divisão usada no núcleo Penryn.

Aprimoramento da Unidade “Shuffle”

Este é um aprimoramento no modo como a unidade de ponto flutuante do processador manipula operações usadas pelas instruções SSE de formatação de dados, permitindo aos processadores com núcleo Penryn executar algumas instruções em menos pulsos de clock se comparado com o núcleo usado atualmente pelos processadores Core 2 Duo.

Na Figura 8 você pode ver uma comparação entre o número de pulsos de clock que esses dois núcleos levam para executar cada uma dessas instruções. Quanto menor forem as barras, melhor – a utilização de menos pulsos de clock significa menos tempo gasto, o que se traduz em maior desempenho.

Como você pode ver, várias instruções SSE de 128 bits que levam mais do que um pulso de clock para serem processadas são agora processadas em apenas um pulso de clock, aumentando o desempenho SSE. As extensões SSE (Streaming SIMD Extensions) são usadas em aplicativos multimídia que implementam este tipo de instrução.

Figura 8: Comparação de desempenho da nova unidade “shuffle” usada no núcleo Penryn.