Radeon HD 2900 XTX
A Radeon HD 2900 XT trabalha a 740 MHz e acessa seus 512 MB de memória GDDR3 a 825 MHz (1,65 GHz DDR), usando uma nova interface com a memória de 512 bits. Com isso, a taxa de transferência máxima teórica de acesso à memória suportada por esta placa é de até 105,6 GB/s – a taxa de transferência máxima teórica de acesso à memória suportada pela Radeon X1950 XTX é de 64 GB/s e da GeForce 8800 GTX é de 86,4 GB/s, mas a da nova GeForce 8800 Ultra é de 103,6 GB/s.
Sua arquitetura de sombreamento unificada tem 320 processadores de sombreamento – a GeForce 8800 GTX tem 128.
Na Figura 1 você tem uma visão geral da arquitetura usada pela Radeon HD 2900 XT.
Figura 1: Arquitetura da Radeon HD 2900 XT.
Na Figura 2 você ver em mais detalhes como ela funciona. Como você pode ver, ela tem uma unidade de despacho que pode enviar até oito instruções de sombreamento para os processadores e até duas instruções de vértice ou de textura por pulso de clock. Como explicaremos abaixo, cada uma dessas instruções de sombreamento pode na verdade representar até seis instruções.
Figura 2: Por dentro da arquitetura da Radeon HD 2900 XT.
Os processadores são divididos em quatro grupos principais (chamados “arranjos SIMD”) com 80 processadores cada, cada grupo conectado a duas portas da unidade de despacho. Esses grupos são subdivididos em 16 unidades, cada unidade contendo cinco processadores e uma unidade de processamento de desvios. A arquitetura de cada uma dessas unidades pode ser vista na Figura 3.
Figura 3: Arquitetura de cada unidade de processamento, contendo cinco processadores cada.
Essas unidades são superescalares, o que significa que cada processador pode processar várias instruções em paralelo ao mesmo tempo. Todos os cinco processadores podem manipular instruções de multiplicação-adição, que é o tipo mais comum de instruções, enquanto que apenas uma (a primeira na Figura 3) pode também manipular instruções transcendentais, isto é, instruções logarítmicas e trigonométricas como SIN, COS, LOG, EXP, etc. É muito importante notar que cada processador é, na verdade, uma pequena unidade de ponto flutuante de 32 bits.
Outra coisa muito interessante é que cada instrução enviada para a cada unidade pode representar até seis instruções (cinco instruções matemáticas mais uma instrução de controle de fluxo) em uma única instrução. Portanto, em vez de ter que enviar seis instruções separadas para cada unidade, a unidade de despacho pode preencher todas as seis unidades de execução com apenas uma instrução grande. Este conceito é chamado VLIW (Very Long Instruction Word, Instrução Muito Longa).
Respostas recomendadas
Crie uma conta ou entre para comentar
Você precisa ser um usuário para fazer um comentário
Criar uma conta
Crie uma nova conta em nossa comunidade. É fácil!
Crie uma nova contaEntrar
Já tem uma conta? Faça o login.
Entrar agora