Arquitetura da Série AMD ATI Radeon HD 2000
Por Gabriel Torres e Cássio Lima em 09 de julho de 2007
Introdução
AMD está anunciando hoje sua nova série ATI Radeon HD 2000. Este é a primeira série da AMD/ATI a ter suporte ao modelo de programação DirectX 10 e cinco modelos para desktop foram anunciados: Radeon HD 2900 XT para o mercado de alto desempenho (conhecida anteriormente pelo codinome R600), Radeon HD 2600 Pro e XT para o mercado intermediário e a Radeon 2400 Pro e XT para o mercado de baixo custo. Enquanto a Radeon HD 2900 XT pode ser encontrada no mercado a partir de hoje, os outros modelos foram lançados apenas no papel, já que eles chegarão ao mercado apenas no final de junho, ainda sem data específica. Neste artigo exploraremos os detalhes desta nova arquitetura usada por esta nova série.
É muito importante notar que muitos dos aprimoramentos arquitetônicos que estão sendo anunciados pela AMD e por outras mídias referem-se apenas a Radeon HD 2900 XT, não sendo válidos para as duas outras famílias, HD 2600 e HD 2400.
Para um melhor entendimento e comparação com as tecnologias antigas, recomendamos a leitura de outros dois artigos, Série ATI Radeon X1000 e Arquitetura da Série GeForce 8.
Aqui está um resumo do que há de novo nesta nova série. Nas páginas seguintes falaremos especificamente sobre a arquitetura usada em cada família.
- Modelo de Programação Shader 4.0 (DirectX 10). Clique aqui para entender o que há de novo neste novo modelo de programação.
- Por se tratar de uma placa de vídeo Shader 4.0, ela usa uma arquitetura de processamento de sombreamento unificado, isto é, em vez de ter unidades separadas para processamento de sombreamento de pixels, sombreamento de vértice, física e geometria, ela tem várias unidades “genéricas” que podem executar qualquer tipo de processamento. Esses processadores trabalham com o mesmo clock do chip (na série GeForce 8 eles trabalham com um clock diferente, maior do que o resto do chip).
- HDR (High Dynamic Range, Alta Faixa Dinâmica) de 128 bits. A série Radeon X1000 suportava apenas HDR de 64 bits. Chips concorrentes da nVidia usam HDR de 128 bits desde a série GeForce 7.
- Nova geração do Avivo – chamada Avivo HD –, os aprimoramentos 2D da AMD/ATI, com suporte HDMI nativo no chip gráfico – ou seja, sem usar um chip externo. Com um adaptador qualquer conector DVI das placas da série HD 2000 pode ser transformado em um conector HDMI suportando saída de áudio digital, recurso este não presente em nenhuma outra placa de vídeo no mercado hoje.
- Novo modelo suavização de serrilhado (anti-aliasing) chamado Anti-Aliasing de Filtro Personalizado (Custom Filter Anti-Aliasing ou simplesmente CFAA), disponível até 24x, competindo com o Anti-Aliasing de Amostra de Cobertura (Coverage Sample Anti-Aliasing ou simplesmente CSAA) disponível na série GeForce 8 da nVidia.
- CrossFire Nativo nas famílias Radeon HD 2600 e 2900.
- Processo de fabricação de 80 nm na Radeon HD 2900 XT e processo de 65 nm nos outros modelos. Na verdade esta é a razão pela qual a Radeon HD 2900 XT está sendo lançada agora e os outros modelos não.
- Novas características de gerenciamento de energia para os modelos para notebook, chamadas “PowerPlay 7”.
Vamos falar agora sobre a arquitetura específica e recursos de cada família anunciada hoje.
Radeon HD 2900 XTX
A Radeon HD 2900 XT trabalha a 740 MHz e acessa seus 512 MB de memória GDDR3 a 825 MHz (1,65 GHz DDR), usando uma nova interface com a memória de 512 bits. Com isso, a taxa de transferência máxima teórica de acesso à memória suportada por esta placa é de até 105,6 GB/s – a taxa de transferência máxima teórica de acesso à memória suportada pela Radeon X1950 XTX é de 64 GB/s e da GeForce 8800 GTX é de 86,4 GB/s, mas a da nova GeForce 8800 Ultra é de 103,6 GB/s.
Sua arquitetura de sombreamento unificada tem 320 processadores de sombreamento – a GeForce 8800 GTX tem 128.
Na Figura 1 você tem uma visão geral da arquitetura usada pela Radeon HD 2900 XT.
clique para ampliar
Figura 1: Arquitetura da Radeon HD 2900 XT.Na Figura 2 você ver em mais detalhes como ela funciona. Como você pode ver, ela tem uma unidade de despacho que pode enviar até oito instruções de sombreamento para os processadores e até duas instruções de vértice ou de textura por pulso de clock. Como explicaremos abaixo, cada uma dessas instruções de sombreamento pode na verdade representar até seis instruções.
clique para ampliar
Figura 2: Por dentro da arquitetura da Radeon HD 2900 XT.Os processadores são divididos em quatro grupos principais (chamados “arranjos SIMD”) com 80 processadores cada, cada grupo conectado a duas portas da unidade de despacho. Esses grupos são subdivididos em 16 unidades, cada unidade contendo cinco processadores e uma unidade de processamento de desvios. A arquitetura de cada uma dessas unidades pode ser vista na Figura 3.
clique para ampliar
Figura 3: Arquitetura de cada unidade de processamento, contendo cinco processadores cada.Essas unidades são superescalares, o que significa que cada processador pode processar várias instruções em paralelo ao mesmo tempo. Todos os cinco processadores podem manipular instruções de multiplicação-adição, que é o tipo mais comum de instruções, enquanto que apenas uma (a primeira na Figura 3) pode também manipular instruções transcendentais, isto é, instruções logarítmicas e trigonométricas como SIN, COS, LOG, EXP, etc. É muito importante notar que cada processador é, na verdade, uma pequena unidade de ponto flutuante de 32 bits.
Outra coisa muito interessante é que cada instrução enviada para a cada unidade pode representar até seis instruções (cinco instruções matemáticas mais uma instrução de controle de fluxo) em uma única instrução. Portanto, em vez de ter que enviar seis instruções separadas para cada unidade, a unidade de despacho pode preencher todas as seis unidades de execução com apenas uma instrução grande. Este conceito é chamado VLIW (Very Long Instruction Word, Instrução Muito Longa).
Radeon HD 2900 XTX (Cont.)
Na Figura 4 você pode dar uma olhada na arquitetura de uma unidade de textura da Radeon HD 2900 XT, que suporta texturas de até 8192 x 8192. Este chip tem quatro unidades de texturas, cada um com oito processadores de endereçamento de texturas (32 no total), 20 unidades de amostragem de texturas (80 no total) e quatro unidades de filtragem de texturas (16 no total). Existe ainda um cache de vértice, um cache L1 de texturas e um cache L2 de texturas de 256 KB.
clique para ampliar
Figura 4: Unidade de textura.Na Figura 5 você pode ver os detalhes da unidade de renderização, que pode processar até 32 pixels por clock no teste de profundidade e estêncil. A Radeon HD 2900 XT tem quatro dessas unidades.
clique para ampliar
Figura 5: Unidade de renderização.Ela continua usando a mesma configuração de memória em anel que foi introduzida na série X1000, mas agora usando um projeto totalmente distribuído em vez de usar um circuito chaveador (“crossbar switch”). O controlador de memória usa um anel de 1024 bits, usado dois barramentos separados de 512 bits, um para leitura e outro para escrita. Outra diferença é que agora o barramento PCI Express é um cliente do anel. Como já foi dito, a Radeon HD 2900 XT acessa a memória a 512 bits, que é obtido pelo uso de oito canais de memória de 64 bits – cada canal é conectado a um chip de memória diferente.
clique para ampliar
Figura 6: Interface com a memória.Na Figura 7 você pode ver a ATI Radeon HD 2900 XT. Uma coisa importante sobre sua instalação é que ela usa dois conectores de alimentação auxiliar PCI Express: um conector auxiliar PCI Express padrão de seis pinos e um conector auxiliar PCI Express de oito pinos definido pelo novo padrão PCI Express 2.0. Você tem que prestar atenção porque este novo conector se parece muito com o conector de alimentação EPS12V disponível em muitas fontes de alimentação, mas a polaridade é invertida, isto é, onde no conector EPS12V é terra no novo conector de alimentação auxiliar PCI Express é +12V e vice-versa. Se você forçar um conector EPS12V em um conector de alimentação de oito pinos encontrado nesta placa de vídeo você pode queimá-la (nós esperamos que o circuito de proteção contra curto-circuito de sua fonte de alimentação entre em ação caso isto aconteça).
clique para ampliar
Figura 7: ATI Radeon HD 2900 XT.Por ainda utilizar um processo de fabricação de 80 nm ela tem um consumo típico de 215 W. A AMD recomenda uma fonte de alimentação de pelo menos 500 W para esta criança (750 W se for usa a configuração CrossFire) – no entanto a AMD certificou algumas fontes de 400 W para serem usadas com esta nova placa de vídeo. A lista das fontes de alimentação certificadas pode ser encontrada aqui.
O seu preço, para sua categoria, não é nada ruim: a Radeon HD 2900 XT chegará ao mercado com um preço sugerido nos EUA de US$ 399.
Abaixo você pode encontrar um resumo da Radeon HD 2900 XT.
Modelo
Clock
Clock Memória
Interface Memória
Configuração Memória
Taxa de Transf. Memória
Processadores
Preço Sugerido nos EUA
Radeon HD 2900 XT
740 MHz
1,65 GHz (825 MHz x 2)
512 bits
512 MB GDDR3
105,6 GB/s
320
US$ 399
Radeon HD 2600
A Radeon HD 2900 é a família intermediária da série Radeon HD 2000 e tem dois modelos, Pro e XT, com a única diferença entre elas duas sendo o clock usado. Ela chegará ao mercado apenas no final de junho. Este longo atraso é devido ao novo processo de fabricação do chip (65 nm).
Na Figura 8 você pode ver a arquitetura usada na Radeon HD 2600.
clique para ampliar
Figura 8: Arquitetura da Radeon HD 2600.As principais características da Radeon HD 2600 são:
- 120 processadores divididos em três arranjos SIMD com oito unidades por arranjo e cinco processadores por unidade.
- Seis portas de despacho.
- Duas unidades de texturas (16 processadores de endereçamento de texturas, 40 unidades de amostragem de texturas e oito unidades de filtragem de texturas).
- Cache L2 de texturas de 128 KB.
- Uma unidade de renderização.
- Interface com a memória de 128 bits.
- Processo de fabricação de 65 nm.
Nas Figuras 9 e 10 você pode ver a Radeon HD 2600 Pro e XT.
clique para ampliar
Figura 9: Radeon HD 2600 Pro.
clique para ampliar
Figura 10: Radeon HD 2600 XT.De acordo com a AMD a Radeon HD 2600 terá um consumo típico de 45 W (eles não disseram de qual modelo estão falando, Pro ou XT).
Até agora as especificações finais de clock e preço ainda não estão definidas. A AMD nos deu alguns números, mas eles não são definitivos. Nós só saberemos esses números com certeza quando o produto final chegar ao mercado.
A AMD lançou duas versões da Radeon HD 2600 XT, uma com 256 MB de memória GDDR4 rodando a 2,2 GHz (1,1 GHz x 2) e uma outra com 256 MB de memória GDDR3 rodando a 1,6 GHz (800 MHz x 2). No momento de seu lançamento a Radeon HD 2600 XT com memória GDDR4 compete diretamente com a GeForce 8600 GT, deixando a Radeon HD 2600 XT com memória GDDR3 sem concorrente direto. A Radeon HD 2600 Pro compete diretamente com a GeForce 8500 GT.
Modelo
Clock
Clock Memória
Interface Memória
Configuração Memória
Taxa Transf. Memória
Processadores
Preço Sugerido nos EUA
Radeon HD 2600 Pro
600 MHz
800 MHz (400 MHz x 2)
128 bits
256 MB DDR2
12,8 GB/s
120
US$ 99
Radeon HD 2600 XT GDDR3
800 MHz
1,6 GHz (800 MHz x 2)
128 bits
256 MB GDDR3
25,6 GB/s
120
US$ 129
Radeon HD 2600 XT GDDR4
800 MHz
2,2 GHz (1,1 GHz x 2)
128 bits
256 MB GDDR4
35,2 GB/s
120
US$ 149
É muito importante ter em mente que os fabricantes podem usar um clock de memória diferente do listado na tabela acima. Portanto você deve prestar muita atenção nesta característica ao comparar duas placas baseadas em um chip desta série, pois placas de um fabricante podem ser mais rápidas do que placas de outro fabricante por conta da diferença no clock da memória.
Radeon HD 2400
A Radeom HD 2400 é a família de baixo custo na nova série Radeon HD 2000, também com dois modelos, Pro e XT, com a única diferença sendo o clock usado. A diferença mais séria entre a nova família Radeon HD 2400 e todas as outras placas de vídeo da ATI de baixo custo lançadas até hoje é a interface da memória: esta família usa interface de 64 bits em vez de 128 bits!
Como as placas de vídeo com interface com a memória de 64 bits obtém um desempenho muito menor do que as que usam interface de 128 bits, nós ainda precisamos fazer alguns testes com esta nova série, porque apesar do seu nome ela é capaz de ela ser mais lenta do que as “antigas” placas Radeon X1300 XT e a Radeon X1300 Pro.
Nós sabemos que a ATI já lançou placas de vídeo com interface com a memória de 64 bits no passado, mas para essas placas eles usavam as letras “SE”, portanto era fácil identificá-las.
Na Figura 11 você pode ver a arquitetura da Radeon HD 2400.
clique para ampliar
Figura 11: Arquitetura da Radeon HD 2400.As principais características da Radeon HD 2400 são:
- 40 processadores divididos em quatro arranjos SIMD com cinco unidades por arranjo e cinco processadores por unidade.
- Quatro portas de despacho.
- Uma unidade de textura (oito processadores de endereçamento de texturas, 20 unidades de amostragem de texturas e quatro unidades de filtragem de texturas).
- Cache unificado de textura.
- Uma unidade de renderização.
- Interface com a memória de 64 bits.
- Processo de fabricação de 65 nm.
A AMD lançará dois modelos de referência, um com um cooler ativo e outro com um cooler passivo, como você pode ver nas Figuras 12 e 13. As duas placas são idênticas, a única diferença é o cooler.
clique para ampliar
Figura 12: Radeon HD 2400 com cooler ativo.
clique para ampliar
Figura 13: Radeon HD 2400 com cooler passivo.De acordo com a AMD a Radeon HD 2400 terá um consumo típico de apenas 25 W (eles não disseram se este consumo é para o modelo Pro ou para o XT).
A série Radeon HD 2400 é uma série de baixo desempenho, usando interface de memória de 64 bits. No momento de seu lançamento a Radeon HD 2400 XT compete diretamente com a GeForce 7300 GT ou com a GeForce 8400 GS, enquanto que a principal concorrente da Radeon HD 2400 Pro é a GeForce 7300 GS..
Modelo
Clock
Clock Memória
Interface Memória
Configuração Memória
Taxa Transf. Memória
Processadores
Preço Sugerido nos EUA
Radeon HD 2400 Pro
525 MHz
800 MHz (400 MHz x 2)
64 bits
128 MB ou 256 MB DDR2
6,4 GB/s
40
US$ 59
Radeon HD 2400 XT
700 MHz
1,6 GHz (800 MHz x 2)
64 bits
256 MB GDDR3
12,8 GB/s
40
US$ 79
É muito importante ter em mente que os fabricantes podem usar um clock de memória diferente do listado na tabela acima. Portanto você deve prestar muita atenção nesta característica ao comparar duas placas baseadas em um chip desta série, pois placas de um fabricante podem ser mais rápidas do que placas de outro fabricante por conta da diferença no clock da memória.
Avivo HD
Avivo é o nome dos aprimoramentos 2D oferecidos pelos chips da ATI em sua série Radeon X1000. Esses aprimoramentos 2D incluem coisas como decodificação MPEG2 (para decodificação de DVDs usando a placa de vídeo em vez do processador) e desentrelaçamento (para aumentar a qualidade de vídeos originalmente veiculados ou criados para TV). Clique aqui para uma descrição completa do motor Avivo.
Agora com a nova série Radeon HD 2000 a AMD está introduzindo a segunda geração da Avivo, chamada Avivo HD, privilegiando conteúdo HD (High Definition, Alta Definição), possibilitando ao chip gráfico decodificar conteúdos HD-TV, HD-DVD, Blu-Ray e MPEG-4 (também conhecido como H.264). Só a título de informação, o HD-DVD e o Blu-Ray usam um algoritmo de compressão chamado VC-1.
Por que colocar decodificação DVD, HD-DVD, Blu-Ray e MPEG-4 no chip gráfico é importante? Porque reduz a carga de trabalho do processador, o que significa que o computador trabalhará mais “leve”. Não é só isso. Quando o processador atinge sua carga máxima quando decodifica um disco ou arquivo de vídeo, ele começará a descartar quadros – isto é, você começará a ter menos de 30 quadros por segundo. O que acontece é que você vê que algo está errado no vídeo, pois os movimentos dos personagens ficam “robotizados”.
O problema ao decodificar padrões em alta definição é o primeiro estágio, decodificador de entropia. Tanto no Avivo quanto no Purevideo HD (a tecnologia equivalente a Avivo no mundo nVidia) este estágio é feito pelo processador. Com o Avivo HD a AMD foi capaz de também colocar este estágio no chip gráfico, como você pode ver no esquema comparativo da Figura 14.
clique para ampliar
Figura 14: Comparação entre o Avivo HD e outras tecnologias de decodificação disponíveis.De acordo com a AMD mesmo os novos produtos da nVidia conhecidos hoje pelos seus codinomes G84 e G86 não conseguirão decodificar totalmente discos HD-DVD e Blu-Ray, ainda confiando no processador do micro para o primeiro estágio de decodificação, decodificador de entropia. Esses futuros chips serão capazes, no entanto, de decodificar totalmente conteúdo MPEG-4 usando o chip gráfico.
clique para ampliar
Figura 15: Comparação entre o Avivo HD e a futura tecnologia Purevideo que será usada nos produtos G86 e G84 da nVidia.Outra vantagem apontada pela AMD ao chip gráfico para decodificar vídeo é que o micro consome menos energia e com o novo Avivo HD você será capaz de assistir um disco inteiro HD-DVD ou Blu-Ray em notebooks trabalhando na bateria.
Uma nova característica introduzida pelo Avivo HD refere-se ao HDCP, o mecanismo de criptografia que permite rodar conteúdo protegido como discos HD-DVD e Blu-Ray. Normalmente um chip de memória ROM externo é necessário para armazenar as chaves de criptografia. Na série Radeon HD 2000 essas chaves estão armazenadas dentro do chip, barateando o custo de produzir placas de vídeo compatíveis com HDCP e aumentando a compatibilidade da placa de vídeo com este.
Por último – e não por isso menos importante –, a nova familia Radeon HD 2000 tem HDMI com áudio no mesmo conector sem a necessidade de se conectar qualquer cabo de áudio na placa de vídeo – a placa de vídeo redireciona as informações de áudio digital do chipset diretamente para a placa de vídeo usando o barramento PCI Express. Outras placas de vídeo quando têm um conector HDMI fornecem apenas vídeo digital e não áudio (existem algumas placas de vídeo com HDMI suportando áudio digital, mas você precisa instalar um cabo externo para conectar o conector SPDIF da placa-mãe na placa de vídeo). Clique aqui para aprender mais sobre HDMI.
Para usar o conector HDMI em qualquer placa de vídeo da série ATI Radeon HD 2000 você precisa apenas instalar um adaptador no conector DVI, como mostrado na Figura 16.
clique para ampliar
Figura 16: Saída HDMI na Radeon HD 2900 XT.Originalmente em http://www.clubedohardware.com.br/artigos/1365
© 1996-2008, Clube do Hardware. Todos os direitos reservados.
É expressamente proibida a reprodução total ou parcial do conteúdo deste site e dos textos disponíveis, seja através de mídia eletrônica, impressa, ou qualquer outra forma de distribuição. Os infratores serão indiciados e punidos com base na lei nº 9.610 de 19/02/1998.
Não nos responsabilizamos por danos materiais e/ou morais de qualquer espécie promovidos pelo uso das informações contidas no Clube do Hardware.