Arquitetura da Série GeForce GTX 200
Por Gabriel Torres e Cássio Lima em 16 de junho de 2008
Introdução
Assim como as séries GeForce 8 e GeForce 9 a nova série GeForce GTX 200 também é baseada no DirectX 10 (ou seja, Shader 4.0), mas usando uma arquitetura diferente. Vejamos o que há de novo.
O principal destaque da série GeForce GTX 200 é que a nVidia está agora oficialmente pressionando o mercado de usuários “comuns” na adoção do GPGPU (General Purpose Graphics Processing Unit, ou Unidade de Processamento Gráfico de Propósito Geral) – que é o uso do chip gráfico localizado na placa de vídeo para processar programas “comuns”. Portanto você verá a nVidia dizendo que os chips desta série são do tipo “2-em-1” ou que têm “capacidades de computação em paralelo”. O departamento de marketing da nVidia está chamando este conceito de “beyond gaming” ou “além dos jogos”.
Na verdade todas as placas de vídeo podem ser usadas desta forma. O segredo está no compilador e a nVidia tem o seu próprio compilador, chamado CUDA, disponível para download já há algum tempo. O CUDA permite que programas comuns escritos em C/C++ possam ser executados primariamente no chip gráfico. Antes do lançamento do CUDA os programadores tinham de escrever os programas na linguagem do chip gráfico, o que significava que eles teriam de aprender algo completamente novo e diferente.
O GPGPU tem sido visto pelo mundo acadêmico já há algum tempo como sendo uma forma de aumentar o desempenho em várias aplicações específicas. Com o lançamento da plataforma Tesla – basicamente placas de vídeo GeForce 8 sendo usadas para processar programas comuns e não para produzir vídeo – a nVidia mostrou o seu comprometimento de mover o GPGPU de um mero estágio de pesquisa para uma aplicação mais séria para a comunidade científica. Agora com o lançamento da série GTX 200 a nVidia quer dar um passo adiante, encorajando os desenvolvedores de programas a incorporarem o conceito de GPGPU em aplicações disponíveis para o público em geral.
A razão principal por trás desta idéia é que hoje o chip gráfico (GPU) – especialmente os modelos topo de linha – têm muito mais poder de computação do que os processadores. Na Figura 1 você pode ver uma comparação entre o novo chip GeForce GTX 280 e um processador intermediário (Core 2 Duo E8400) e um processador topo de linha (Core 2 Extreme QX9650). O GFLOPS, que significa bilhões de operações de ponto flutuante (operações matemáticas) por segundo, mede o desempenho matemático máximo de um chip.
clique para ampliar
Figura 1: Comparação entre o GeForce GTX 280, o Core 2 Duo E8400 e o Core 2 Extreme QX9650.Durante o Editor’s Day Spring 2008 a nVidia fez algumas demonstrações de como jogar o processamento que normalmente é feito pelo processador para o chip gráfico pode aumentar o desempenho de aplicações comuns. Na Figura 2 você pode ver um exemplo de quanto tempo um filme de alta definição de 2 horas no formato H.264 leva para ser codificado usando diferentes processadores. O ganho de desempenho é inacreditável, mas lembre-se que este não é um recurso exclusivo da série GTX 200 (qualquer placa de vídeo pode fazer isso – os programas compilados com o CUDA funcionarão somente em placas GeForce 8 e superiores; veja como eles comparam o desempenho da GTX 280 com uma GeForce 9600 GT) e você precisa de um programa que use GPGPU. Não se empolgue achando que só porque você instalou a nova GTX 280 em seu micro você terá este ganho de desempenho. Esta demonstração específica foi feita com um programa chamado BadaBOOM, que é um programa que converte filmes para o formato usado em tocadores de vídeo portáteis. Este programa ainda não foi lançado, mas a mesma empresa oferece um codificador chamado RapidHD, que está disponível para o Adobe Premiere Pro e também usa GPGPU.
clique para ampliar
Figura 2: Ganho de desempenho de codificação de filmes em alta definição.Um outro exemplo dado pela nVidia foi o Folding@Home, o programa de computação distribuída para a análise de proteínas patrocinado pela Universidade de Standford. Cada pessoa que faz o download e instala este programa adiciona seu próprio micro na rede do programa, montando assim um supercomputador usando micros de todos os cantos do planeta. Na Figura 3 você ver o ganho de desempenho neste programa, que é capaz de usar placas de vídeo para fazer o processamento.
clique para ampliar
Figura 3: Ganho de desempenho no Folding@Home.Em resumo, o GPGPU não é algo novo e exclusivo da nova série GeForce GTX 200, mas espera-se ver mais programas comuns sendo capazes de usar o chip gráfico da placa de vídeo para processar programas. Por exemplo, a Adobe anunciou que a nova versão do Photoshop, que será lançada no segundo semestre deste ano, usará o chip gráfico para fazer parte do processamento, consequentemente aumentando o desempenho do programa.
Vamos agora falar sobre a arquitetura da série GeForce GTX 200.
Arquitetura
A nVidia está lançando hoje dois chips dentro da família GeForce GTX 200: o GTX 280 e o GTX 260. Na Figura 4 você pode ver um diagrama em blocos do novo GeForce GTX 280 e na Figura 5 uma foto da pastilha de silício do GeForce GTX 280 mostrando a localização dos principais blocos.
clique para ampliar
Figura 4: Diagrama em blocos do GeForce GTX 280.
clique para ampliar
Figure 5: Localização dos principais blocos na pastilha de silício do GeForce GTX 280.No meio do diagrama em blocos na Figura 5 você pode ver 10 blocos. Esses blocos são chamados Thread Processing Cluster ou Cluster de Processamento de Threads ou simplesmente TPC e na Figura 7 você tem uma visão detalhada de um desses blocos.
clique para ampliar
Figura 6: Cluster de Processamento de Threads (TPC).Cada TPC tem um cache de memória L1 e três conjuntos de unidades de processamento. Cada um desses conjuntos é chamado Streaming Multiprocessors (SM) ou Multiprocessadores Streaming pela nVidia. Cada conjunto tem oito unidades de processamento (chamadas “core” ou “núcleo” pela nVidia; elas também são chamadas de Streaming Processors ou Processadores de Streaming ou SP) compartilhando uma pequena quantidade de memória RAM (chamada “local memory” ou “memória local” pela nVidia). A inclusão dessas pequenas quantidades de memória RAM é uma das principais diferenças entre a arquitetura usada pela série GeForce GTX 200 e pelas séries GeForce 8 e GeForce 9. Você pode aprender mais sobre a arquitetura dessas duas séries em nosso artigo Arquitetura da Série GeForce 8 (apesar do seu nome, o GeForce 9 é baseado na arquitetura do GeForce 8).
A principal idéia por trás do DirectX 10 – isto é, o modelo de programação Shader 4.0 – é que cada unidade de processamento é uma unidade “genérica” permitindo qualquer tipo de processamento (este conceito ajudou muito o GPGPU). Antigamente o chip gráfico tinha unidades específicas para cada tipo de processamento possível (mais notavelmente as unidades de processamento específicas para sombreamento de pixels e unidades de processamento específicas para sombreamento de vértices).
Como cada conjunto dentro do TPC tem oito unidades de processamento, cada TPC tem 24 unidades de processamento, para um total de 240 unidades de processamento (10 TPCs) no GeForce GTX 280. O GeForce GTX 260 tem menos unidades, 192, obtidas com a utilização de oito TPCs em vez de 10.
Dentro de cada TPC você pode encontrar ainda oito unidades de filtragem de texturas (rotuladas “TF” na Figura 7), para um total de 80 unidades de textura na GeForce GTX 280 e 64 no GeForce GTX 260.
Como você pode ver na Figura 4, o GeForce GTX 280 tem oito unidades de interface com a memória, cada uma podendo transferir 64 bits. Isto significa que o GeForce GTX 280 tem uma interface de memória de 512 bits (64 bits x 8) – já estava na hora: o GeForce 8800 GTX usa uma interface de memória de 384 bits e o GeForce 9800 GTX usa uma interface de memória de 256 bits. Esse modelo suporta 1 GB de memória de vídeo, com um chip de 128 MB (1 Mbit) ligado a cada unidade de interface com a memória. O GeForce GTX 260 tem sete unidades de interface com a memória, o que significa que esta versão usa uma interface de memória de 448 bits (64 bits x 7) e vem com 896 MB de memória de vídeo (128 MB por chip x 7).
A série GeForce GTX 200 finalmente usa unidades de ponto flutuante de precisão dupla (ou seja, registradores de ponto flutuante de 64 bits).
Os chips da nova série GeForce GTX 200 vêm com o motor de processamento de vídeo 2D atualizado, chamado VP2 ou “PureVideo HD de 2ª geração”, que tem um decodificador H.264 totalmente baseado em hardware (usado para decodificar filmes de alta definição como Blu-Ray e HD-DVD), dispensando o uso do processador para esta tarefa. Este mesmo decodificador é encontrado em todas as placas de vídeo das séries GeForce 8 e 9, menos nos chips "G80" (GeForce 8800 GTS, GTX e Ultra), que são baseados no motor antigo do PureVideo HD, o VP1, que ainda usa parcialmente o processador da máquina para esta decodificação.
A série GeForce GTX 200 tem ainda mais modos de economia de energia. Quatro modos estão disponíveis:
- Modo ocioso/2D: usado quando você está trabalhando no Windows e executando programas comuns, como processamento de textos e navegando na internet. A placa de vídeo consome cerca de 25 W quando está neste modo.
- Modo de reprodução de vídeo: usado quando você quer assistir vídeos e usar o decodificador baseado em hardware incorporado no chip gráfico em vez de usar o processador do micro para decodificação. A placa de vídeo consome cerca de 35 W quando está neste modo.
- Modo de desempenho máximo 3D: Quando você roda jogos a placa de vídeo ativa seu modo 3D. O consumo de energia será o máximo (máximo de 236 W no GeForce GTX 280 e 182 W no GeForce GTX 260).
- HybridPower: Esta é uma tecnologia onde o vídeo 2D é produzido pela placa-mãe (ou seja, vídeo on-board) e a placa de vídeo é automaticamente desligada quando você não está rodando jogos. Portanto o consumo de energia da placa de vídeo é zero quando você não está rodando jogos. Você precisa de uma placa-mãe compatível com a tecnologia HybridPower para usufruir deste recurso.
Modelos Lançados
Como mencionamos dois modelos estão sendo lançados neste momento: a GeForce GTX 280 e a GeForce GTX 260. Abaixo você pode ver as fotos dos modelos de referência – como você pode ver, eles têm a mesma aparência externa. Ambas as placas requerem dois conectores de alimentação auxiliar, com a GTX 280 necessitando de um conector de 6 pinos e outro de 8 pinos e a GTX 260 necessitando de dois conectores de 6 pinos. Ambas as placas de vídeo são PCI Express 2.0, naturalmente. Portanto para obter o desempenho máximo você precisa instalar as placas em uma placa-mãe que suporte o barramento PCI Express 2.0. Ambas as placas suportam o modo SLI de três vias.
clique para ampliar
Figura 7: Modelo de referência da GeForce GTX 260.
clique para ampliar
Figura 8: Modelo de referência da GeForce GTX 280.Na tabela abaixo nós resumimos as principais especificações dessas duas placas.
Recurso
GeForce GTX 280
GeForce GTX 260
Clock interno
602 MHz
576 MHz
Processadores Streaming (Motores de Sombreamento)
240
192
Clock dos Processadores Streaming
1.296 MHz
1.242 MHz
Clock da Memória (Real)
1.107 MHz
999 MHz
Clock da Memória (DDR)
2.214 MHz
1.998 MHz
Memória
1 GB GDDR3
896 MB GDDR3
Interface de memória
512 bits
448 bits
Consumo Máximo
236 W
182 W
Preço Sugerido para o Mercado Norte-Americano
US$ 649
US$ 399
Originalmente em http://www.clubedohardware.com.br/artigos/1512
© 1996-2008, Clube do Hardware. Todos os direitos reservados.
É expressamente proibida a reprodução total ou parcial do conteúdo deste site e dos textos disponíveis, seja através de mídia eletrônica, impressa, ou qualquer outra forma de distribuição. Os infratores serão indiciados e punidos com base na lei nº 9.610 de 19/02/1998.
Não nos responsabilizamos por danos materiais e/ou morais de qualquer espécie promovidos pelo uso das informações contidas no Clube do Hardware.