R1000, Radeon 7**0, "Southern Islands", tópico oficial de discussão

jonny_br · 31 de dezembro de 2011

Rapazes, que ótimo teste, mas confesso, deu um nó no meu cérebro..

http://www.rage3d.com/reviews/video/amd_hd7970_launch_review/index.php?p=8

anjinho66 · 31 de dezembro de 2011

AMD has executed very well in the graphics space for the last three years, delivering on promises to improve performance through hardware, software and ISV relations. Neal Robison tells us AMD is increasing its budget and people power in that last area for 2012, working hard to get more developers and games working their best with AMD hardware to use in their dev and QA cycles. GCN is easier to code for, has massive amounts of compute capability and plenty of features for developers to leverage for implementing their tweaks and tricks. AMD's outline for Catalyst features and improvements are heading in the right direction, finally getting towards solving some of the problems that premium features such as Crossfire, Eyefinity and HD3D present to users.

Isso me deixou bem animado quanto ao futuro da AMD.

xineis · 31 de dezembro de 2011

Eu acho que ainda não postaram isso, então vai;

Quem tá esperando pela HD 7950 (principalmente por causa do preço), vai ter que esperar um pouco mais: http://www.fudzilla.com/graphics/item/25380-amd-hd-7950-wont-show-up-on-january-9th

Como diz o link, ela não deve ser lançada em Janeiro, mas em Fevereiro. Até chegar no Brasil...

Pistigrilo · 31 de dezembro de 2011

Bom se a HD 7770 tiver realmente 896 SPs, então teremos um Cape Verde XT composto de 14 CUs, totalizando 896 SPs + 14 SPs Escalares + 56 TMUs. Teremos então 2 Barramentos de 64 bits (128 bits), ou seja 4 Grupos ROPS de 4 Color ROPS e 16 Z/Stencil Cada um, totalizando 16 Color ROPS e 64 Z/Stencil.
Se compararmos com a HD 5770 (Juniper XT) de 800 SPs em VLIW5 + 40 TMUs, e com 16 ROPS e 64 Z/Stencil. Porque a HD 7770 deveria ser tão mais poderosa? Basta vocês repararem nas especificações de cada uma, e veram que não houve quase aumento nenhum em termos de unidades.

A Banda de memoria da HD 7770 se a GDDR5 dela for de 1125 Mhz, teremos 72 GB/s de banda, contra 76.8 GB/s da HD 5770....

O que ajuda ,é sem duvida, o Clock base elevado, se for mesmo 1 GHZ. porém mesmo com 1 GHZ, contra os 850 MHZ da HD 5770, teremos 1.79 Teraflops em MAD de precisão Simples, contra 1.36 Teraflops em MAD de precisão Simples. Ou seja, pouca diferença real.

porém como os Shaders do GNC são bem mais otimizados, esse poder sera melhor aproveitado no Cape Verde.

Com isso não adianta esperar MUITA COISA, não acham

Ótima explicação. Parabéns.

Realmente com diferenças tão pequenas e tendo clock das memórias menor, o ganho de desempenho só será grande se o GNC for realmente MUITO melhor otimizado e aproveitado que o VLIW5. Eu acho que só vai fazer diferença de verdade no GPGPU, onde o GNC se destaca com força.

Eu acho que ainda não postaram isso, então vai;
Quem tá esperando pela HD 7950 (principalmente por causa do preço), vai ter que esperar um pouco mais: http://www.fudzilla.com/graphics/item/25380-amd-hd-7950-wont-show-up-on-january-9th

Como diz o link, ela não deve ser lançada em Janeiro, mas em Fevereiro. Até chegar no Brasil...

Pelo menos ainda é antes das NVIDIA Kepler (me corrijam se eu estiver errado).

jonny_br · 31 de dezembro de 2011

Só pra babarmos um pouquinho...

- Sapphire ATOMIC RX (HD7970) - (GPU: 1335Mhz / Memória: 5735Mhz, 3GB GDDR5) - 2 x Mini-DP, 1x HDMI 1.4a, 1 Link xS DVI.
- Sapphire ATOMIC WC (HD7970) - (GPU: 1335Mhz / Memória: 5735Mhz, 3GB GDDR5) - 2 x Mini-DP, 1x HDMI 1.4a, 1 Link xS DVI.

- 3G Sapphire Toxic (HD7970) - (GPU: 1125Mhz / Memória: 5600Mhz, 3GB GDDR5) - 2 x Mini-DP, 1x HDMI 1.4a, 1 Link xS DVI.

- Sapphire Flex 6G (HD7970) - (GPU: 925Mhz / Memória: 5500Mhz, 6GB GDDR5) - 6 x Mini-DP.

- Sapphire VaporX 3G (HD7970) - (GPU: 1010Mhz / Memória: 5500Mhz, 3GB GDDR5) - 2 x Mini-DP, HDMI 1.4a, 1 Link xS DVI.

- Dual Fan Sapphire 3G (HD7970) - (GPU: 925Mhz / Memória: 5500Mhz, 3GB GDDR5) - 2 x Mini-DP, 1x HDMI 1.4a, 1 Link xS DVI.

- Sapphire Original (HD7970) - (GPU: 925Mhz / Memória: 5500Mhz, 3GB GDDR5) - 2 x Mini-DP, 1x HDMI 1.4a, 1 Link DVI xS - Modelo referência.

telminão · 31 de dezembro de 2011

CARACA Jonny_br essa Saphire Atomic RX vai ser o Bicho quero uma de presente de Natal uahauhau

Agora Olhem isso, sério, reparem na escalabilidade em um Crosfire 2way, a AMD ta mandando MUITO, mas, MUITO bem nessa escalabilidade, mas... antes, umas fotinhas para nos encher os olhos

Tem gente que não sabe brincar, não sei porque tanta agressividade rs...

Agora reparem atentamente na escalabilidade, no 2 way, apavoraram, e lembrem, drivers ainda estão no começo, então pode ser que o 3-way melhore muito mais (ou não )

Looks like the retailer tested out the MSI HD7970 as seen from the third card’s fan sticker. The cards were tested on a Sandy Bridge-E setup which supports PCIe 3.0. Benchmark results below:
Single HD7970 (1680×1050, 4xAA/4xAF, DX11, Tessellation Normal): AVG FPS 72.6 / Score: 1830

2-Way CrossfireX HD7970 (1680×1050, 4xAA/4xAF, DX11, Tessellation Normal): AVG FPS 139.1 / Score: 3504

3-Way CrossfireX HD7970 (1680×1050, 4xAA/4xAF, DX11, Tessellation Normal): AVG FPS 195.1 / Score: 4915

2560×1600 res benchmarks below:

3-Way CrossfireX HD7970 (2560×1600, 4xAA/4xAF, DX11, Tessellation Normal): AVG FPS 108.5/ Score: 2734

3-Way CrossfireX HD7970 (2560×1600, 8xAA/8xAF, DX11, Tessellation Extreme): AVG FPS 77.0/ Score: 1939

Aqui os Scores no "Teçeleixonxon"

Por hoje é só pessoal, divirtam-se a si mesmos que ano que vem, tenhamos uns presentinhos desses em nossas máquinas

obs: não bebam muito hein

Pistigrilo · 31 de dezembro de 2011

Só pra babarmos um pouquinho...

Radeon HD 4870 X2? =S

CARACA Jonny_br essa Saphire Atomic RX vai ser o Bicho quero uma de presente de Natal uahauhau
Agora Olhem isso, sério, reparem na escalabilidade em um Crosfire 2way, a AMD ta mandando MUITO, mas, MUITO bem nessa escalabilidade, mas... antes, umas fotinhas para nos encher os olhos

Tem gente que não sabe brincar, não sei porque tanta agressividade rs...

Agora reparem atentamente na escalabilidade, no 2 way, apavoraram, e lembrem, drivers ainda estão no começo, então pode ser que o 3-way melhore muito mais (ou não )

Aqui os Scores no "Teçeleixonxon"

Por hoje é só pessoal, divirtam-se a si mesmos que ano que vem, tenhamos uns presentinhos desses em nossas máquinas

obs: não bebam muito hein

Nossa! Que fotos!!! São de babar mesmo!

telminão · 31 de dezembro de 2011

Parem as prensas!!!!!!!! (sempre quis dizer, isso, e quem não quis?)

A AMD mal lançou a série HD 7k A.K.A Southern Island, e já começam a circular rumores sobre a geração HD 8k codename "Sea Island", será que é para não dar chance de propaganda para a Nvidia?

AMD is just about to launch its highly anticipated “Southern Island” Series graphic cards, However AMD’s ASIC design department employees have leaked what is known to be the successor of the current 28nm chips codenamed “Sea Islands”.
The name Sea Islands represents the U.S. Atlantic coast located in areas around South Carolina, Georgia and eastern Florida. The Sea Island chip would also be based on TSMC’s 28nm Fabrication process but its unknown whether they would compete against Nvidia’s High End 28nm Kepler based card (Most likely to launch in 2H 2012) or the Maxwell Series which is expected to launch in 2013-2014.

Fonte aqui: Wccftech

Diego Hwoarang · 31 de dezembro de 2011

Bem, uma das coisas que eu esperava era a escalabilidade nessa nova geração, mas nas 78xx. Que bom que as 79xx serão boas pra fazer CF. Mas, será que as 78xx e as 77xx também serão boas de escalabilidade?

bitow · 1 de janeiro de 2012

boa tarde pessoal, alguma ideia quando a 7970 deve desembarcar na dilma's land?

Evandro · 1 de janeiro de 2012

Vendo essa monstruosidade de OC, penso que a AMD poderia nos brindar com modelos de referência, pelo menos, um pouco acima de 1Ghz pra acabar com essa coisa de que a AMD poderia ter dado uma encorpada melhor na 7970, como eu mesmo acho que poderia ser feito assim. Também não acho que a AMD deveria segurar a performance da VGA apenas na base do clock. Até porque o que a VGA pode alcançar fica previsível nesse quesito. A não ser que a AMD queira fazer um combo clock+revisão no chip, que pode ser possivel até lançarem o Kepler, e lançarem uma 7980 parrudona.

Lembram as HD 4890 "1 GHZ" ?

Pergunta pra todos:

Vocês comprariam a série 7 high-end agora ou esperariam a saída dos quéprer?

Me dê R$ 4000 que eu penso no assunto pra você. (e compro meu computador )

boa tarde pessoal, alguma ideia quando a 7970 deve desembarcar na dilma's land?

Em um mês em algumas lojas e gradualmente na grande maioria delas até 3 meses depois do lançamento no resto do mundo.

Gun'ss · 1 de janeiro de 2012

Só uma dúvida, hoje li um artigo explicando o GCN (ou uma sigla parecida) e a AMD saiu do VLIW como tinhamos, e fiquei na dúvida, antes casa shader "simulava" 5 então ao invés de 1600 tinhamos 320.

Hoje a HD 7970 tem 2048, mas quantos realmente ela tem? Estou falando como se não tivesse entendido bulhufas sobre a nova arquitetura, porém nessa parte de contagem eu realmente não entendi, ela esta adodando o esquema das HD 6900 com 4?

jonny_br · 2 de janeiro de 2012

a brincadeira começou a ficar divertida.... 84% em Overclock

MyDrivers

L u c k y · 2 de janeiro de 2012

a brincadeira começou a ficar divertida.... 84% em Overclock

MyDrivers

AIUShAIshIAHsiAHS

Massa demais... Mas olha o que os caras fazem, soldam fios e trocam resistores.

Sem contar que a configuração do maluco é com Nitrogênio líquido.

Ninguém vai fazer isso pra uso doméstico, certo?

telminão · 2 de janeiro de 2012

Jonny_br esse ai parece o mesmo cara que eu postei na semana passada, só que ele ainda, pelo visto está usando um modelo de referencia, quero ver quando esse maluco pegar uma Asus Mars, ai o trem vai ficar louco. Quero ver a resposta da Nvidia para esse poder de over

jonny_br · 2 de janeiro de 2012

AIUShAIshIAHsiAHS
Massa demais... Mas olha o que os caras fazem, soldam fios e trocam resistores.

Sem contar que a configuração do maluco é com Nitrogênio líquido.

Ninguém vai fazer isso pra uso doméstico, certo?

é só melhorando o suprimento elétrico...

certamente coisas que serão feitas em placas com Mars, *****, GV-R797OC-3GD entre outras, mas em trilhas no PCB e não via gambiarra.

Shamino.... sem palavras

EspadaDaJustiça · 2 de janeiro de 2012

Só uma dúvida' date=' hoje li um artigo explicando o GCN (ou uma sigla parecida) e a AMD saiu do VLIW como tinhamos, e fiquei na dúvida, antes casa shader "simulava" 5 então ao invés de 1600 tinhamos 320.
Hoje a HD 7970 tem 2048, mas quantos realmente ela tem? Estou falando como se não tivesse entendido bulhufas sobre a nova arquitetura, porém nessa parte de contagem eu realmente não entendi, ela esta adodando o esquema das HD 6900 com 4?[/quote']

E aí Gun'ss tudo bom?. Vou Explicar o que ocorre. Na Arquitetura Cypress na qual se usou o VLIW5, tinhamos um Cypress XT composto de 20 SIMD Cluster , ou Cores (como Preferir ). Em cada Core tinhamos 16 "processadores de Threds", na qual cada Processador de Thread é composto por 5 Unidades VLIW5, sendo que a ultima é a mais complexa. Veja bem se você pegar 20 multiplicar por 16, e depois multiplicar por 5, você vai obter os 1600 SPs. Portanto o 320, representa o total de Processadores de Threds no Cypress XT. Veja que não é que 320 simula 1600, é que temos 320 Grupos de SPs, na qual cada grupo tem 5 unidades.

Ja no GCN, se pegarmos Tahiti XT, nos vamos ter 32 ***** (Computer Units) que são os Cores, dentro de cada ***** temos 4 Grupos de SPs, compostos de 16 SPs cada um. Dai pegamos 32 * 4 *16 = 2048 SPs, entendeu agora ?

porém tem um detalhe que quase todos os Reviews esqueceram de mencionar, na verdade o Tahiti XT tem 2048 SPs Vetorias + 32 SPs Escalares. Apesar que no GCN a unidade Escalar é especifica para operações condicionais, e transcedentais, ela pode realizar varias operações.

É isso, espero ter ajudado.

xineis · 3 de janeiro de 2012

Notícias interessantes: http://www.fudzilla.com/graphics/item/25396-kepler-to-show-its-face-in-q1-2012

Aparentemente, o Kepler vai aparecer no primeiro trimestre de 2012 mesmo (deve ser mais pro final). A parte interessante é que estão dizendo que o Kepler (modelo não especificado) é mais rápido que a HD 7970.

Até que ponto é mais rápido, e com quais desvatagens (consumo, temperatura?) não ficou esclarecido.

Espero que isso sirva para abaixar os preços! hehe

EspadaDaJustiça · 3 de janeiro de 2012

Notícias interessantes: http://www.fudzilla.com/graphics/item/25396-kepler-to-show-its-face-in-q1-2012
Aparentemente, o Kepler vai aparecer no primeiro trimestre de 2012 mesmo (deve ser mais pro final). A parte interessante é que estão dizendo que o Kepler (modelo não especificado) é mais rápido que a HD 7970.

Até que ponto é mais rápido, e com quais desvatagens (consumo, temperatura?) não ficou esclarecido.

Espero que isso sirva para abaixar os preços! hehe

So Espero que a Nvidia tome vergonha na cara, e melhore a eficiência dos seus ROPs, ao invés de querer colocar um Kepler em um barramento de memoria de 512 Bits .....

Outro desejo meu, é que ela melhore esse esquema de 4 Rasterizers, que na teoria deveriam gerar quase 4 Triangulos por Clock, mas que na pratica mal consegue chegar a 2 por clock.....

Enfim, tomara que o Kepler não decepcione.....

Gun'ss · 3 de janeiro de 2012

E aí Gun'ss tudo bom?. Vou Explicar o que ocorre. Na Arquitetura Cypress na qual se usou o VLIW5, tinhamos um Cypress XT composto de 20 SIMD Cluster , ou Cores (como Preferir ). Em cada Core tinhamos 16 "processadores de Threds", na qual cada Processador de Thread é composto por 5 Unidades VLIW5, sendo que a ultima é a mais complexa. Veja bem se você pegar 20 multiplicar por 16, e depois multiplicar por 5, você vai obter os 1600 SPs. Portanto o 320, representa o total de Processadores de Threds no Cypress XT. Veja que não é que 320 simula 1600, é que temos 320 Grupos de SPs, na qual cada grupo tem 5 unidades.
Ja no GCN, se pegarmos Tahiti XT, nos vamos ter 32 ***** (Computer Units) que são os Cores, dentro de cada ***** temos 4 Grupos de SPs, compostos de 16 SPs cada um. Dai pegamos 32 * 4 *16 = 2048 SPs, entendeu agora ?

porém tem um detalhe que quase todos os Reviews esqueceram de mencionar, na verdade o Tahiti XT tem 2048 SPs Vetorias + 32 SPs Escalares. Apesar que no GCN a unidade Escalar é especifica para operações condicionais, e transcedentais, ela pode realizar varias operações.

É isso, espero ter ajudado.

Espada, como sempre você põe as coisas em ordem. Mas então no GCN temos realmente uma estrutura diferente da VLIW, mas que pelos artigos que li, também lembra a arquitetura passada. Ainda estou longe de entender como isso funciona e compreender a diferença entre ambas, mas agora esta mais claro.

Uma dúvida a mais que eu espero que não gere flame war. Apenas por não conhecimento meu tenho esta duvida. sempre vemos a Que as placas da AMD tem muito mais SP's que as da Nvidia, porém sempre elas tem desempenho parecido, porque? Tenho essa dúvida pois confeço que nunca li nada sobre a arquitetura fermi.

Mas sei, como foi dito aqui várias vezes, a eficiência das placas AMD é bem menor que do lado verde da força. Tanto isso é verdade, que em programas como bitcoin onde ganhamos dinheiro "minerando" decodificando chaves, víamos que as placas da AMD tinham o dobro do desempenho das Nvidia, isso porque talvez essa seja uma das únicas situações onde seja possível se extrair tanto de uma arquitetura tão dependente da ordem dos dados estarem certas.

Enfim, a eficiência dos SPs era tão ruim assim por conta dessa necessidade de uma ordem correta de dados para ocupar toda a placa, que fez com que a AMD repensasse sobre essa aproximação ou existem outros motivos?

Ps: sou só eu que estou com a sensação que entendi mas não entendi essa nova arquitetura?

jonny_br · 3 de janeiro de 2012

Ps: sou só eu que estou com a sensação que entendi mas não entendi essa nova arquitetura?

Entendeu mais não compreendeu, estamos juntos nessa.

Pelo que andei lendo, há uma proximidade maior agora, o GK100 vai precisar de 13% mais SPs no mesmo clock para gerá cerca de 13~15% mais GFlops.

EspadaDaJustiça · 4 de janeiro de 2012

Espada' date=' como sempre você põe as coisas em ordem. Mas então no GCN temos realmente uma estrutura diferente da VLIW, mas que pelos artigos que li, também lembra a arquitetura passada. Ainda estou longe de entender como isso funciona e compreender a diferença entre ambas, mas agora esta mais claro.[/quote']
Bom vou tentar explicar. porém temos que voltar um pouco no tempo.

O Esquema VLIW surgiu de forma plena na epoca em que a ATI usando a equipe da então recem adquirida ArtX criou o R300, da Serie Radeon 9000. O esquema VLIW surgiu para se lidar com as operações envolvendo o Pixel Shader.

No Caso do Pixel Shader, cada Pixel tem seu valor no Esquema RGBA, na qual o R tem o valor do Vermelho, G do Verde, B do Azul, e o A (Alpha) guarda a transparência. Dessa forma independente do pixel, sempre teremos que trabalhar esses valores. Naquela Epoca se tinha o Esquema VLIW QUAD, que servia justamente para trabalhar esses valores.

Como naquela epoca Pixel e Vertex Shaders eram separados, o esquema VLIW usado era apropiado e tinha muitas vantagens. Economizando area/transistores.

porém com a vinda do R600 se viu a necessidade de se criar unidades SIMD que pudessem trabalhar com os dois tipos de operações Shader (Pixel e Vertex). O VLIW era de fato eficaz quando se trabalhava Pixel Shaders, porém quando o assunto era vertex Shaders, ele ja perdia muito do seu "encanto". Foi ai que Surgiu o esquema VLIW5, sendo que a ultimo SP era o mais complexo, que podia trabalhar envolvendo operações Transcedentais. Alem de uma Unidade de Branch e os registradores habituais.

As Operações Transcedentais, são as operações envolvendo Seno, Cosseno,Log, etc... Que são operações muito usadas quando se usa Vertex Shaders.

Como as operações Pixel Shader eram a grande maioria das operações realizadas, era de fato prudente, deixar a maioria das unidades mais otimizadas a trabalhar com ele, do que com o Vertex Shader.

Com Isso a AMD tinha um otimo esquema de Shaders para os Games DX9 e DX10.

O Forte do Esquema VLIW é justamente poder trabalhar com multiplas instruções , ou seja , o VLIW usa o chamado ILP (Instruction level parallelism) Ou Paralelismo a Nivel de Instrução. Que torna o VLIW rápido para se executar Instruções, DESDE QUE, essas sejam não dependentes entre si. O VLIW tem a tarefa de executar multiplas operações em paralelo, ele faz isso, quebrando as operações em pequenos grupos chamados de Wavefronts (ou Warps pela nvidia ).

No VLIW um Wavefront é composto de 64 Pixels ou Valores + a lista de instruções que do que DEVE ser feito com esses Pixels ou Valores. SE Dentro do Wavefront, voce tiver 2 ate 5 Instruções não dependentes entre si, essas 2 ou 5 são executadas de uma so vez pelo VLIW5, lembra do esquema Pixel Shader?

Neste cenario a pior hipotese é caso a instrução dentro do Wavefront for dependente de outra, dessa forma, você tera uma sub-utilização dos SPs.

Enfim, a eficiência dos SPs era tão ruim assim por conta dessa necessidade de uma ordem correta de dados para ocupar toda a placa, que fez com que a AMD repensasse sobre essa aproximação ou existem outros motivos?

Nos jogos era digamos "Adequado", porém conforme o tempo foi passando, cada vez mais os fabricantes de GPUs se viram em um dilema. As GPUs estavam muito limitadas apenas No segmento Multimidia, na qual se destacavam mais em games. porém com a vinda das APUs os processadores começavam a incorporar funções antes exclusivas das GPUs. Por uma questão de sobrevivencia as GPUs precisavam de novos mercados.

Por sua natureza SIMD altamente paralela, as GPUs se encaixavam bem em programas chamados FLOPS intensivos, na qual, são programas que demandam altissimo poder em computação com numeros em ponto flutuante. Que eram programas que as tradicionais CPUs X86 simplesmente não davam conta do recado . (Claro que poderiamos criar Cluster com varias CPUs X86, porém isso não era muito satisfatorio, alem de ser econômicamente ineficiente).

Dessa forma o GPGPU se viu em uma escalada para o futuro. Com o surgimento de GPUs, não apenas criadas para renderização, mas tambem para computação FLOPS de alto desempenho.

Dai temos o problema, como o VLIW não se dava bem com Wavefronts dependentes entre si, não era adequado para GPGPU. Outro detalhe importante sobre o VLIW é que o AGENDAMENTO de quais instruções iriam ser executadas primeiro dentro do Wavefront, eram ja definidas na compilação, dessa forma, o compilador tem um papel IMPORTANTE na performance geral do esquema, ja que dependendo da ordem escolhida, podemos ter baixa ou alta performance, principalmente em Linguagem de alto nivel de abstração. Em jogos isso não é um problema, ja que neles podemos facilmente compilar e agendar as Instruções mais apropiadas dentro do Wavefront, ja que são na sua grande maioria bem semelhantes.

porém instruções de computação Geral, a coisa muda. Em GPGPU podemos ter programas que precisem de um Agendamento dinamico, ja que teremos varios tipos de Wavefronts dependentes.

Olha um exemplo bacana que peguei da net de um exemplo mais adequado para o VLIW:

Ja aqui é um exemplo onde temos wavefronts dependentes entre si, na qual é inadequado pro VLIW:

É ai que o GCN brilha. O GCN tambem tem SPs no esquema SIMD, porém o GCN tem grupos grande de SPs. No atual GCN temos por "CORE" 4 Grupos compostos de nada menos que 16 SPs, sendo que esses são homogeneos entre si (semelhante aos usados no VLIW4, apenas por efeito de comparação ). porém o que torna o GCN melhor no GPGPu é justamente o esquema de utilização dos Wavefronts e seu Agendamento.

No GCN, temos um Agendador por hardware, que fica responsavel em agendar dinamicamente as instruções dentro dos Wavefronts conforme a necessidade. Assim como na figura acima, caso se tenha Wavefronts dependentes entre si, você não tera problemas de performance, ja que o agendador, ira ajustar as instruções de acordo com o que esta sendo trabalhado.

Isso é similar no Fermi, que tambem tem seu proprio Agendador de Warps via Hardware. Veja que um Agendador por hardware requer transistores dentro do Die, e portanto torna a GPU mais complexa para se fabricar, porém a torna mais dinamica, fator importante hoje em dia.

O Legal disso é que tirando o peso do agendamento do compilador, pelo menos em TEORIA, não deveremos mais sofrer de quedas bruscas de performance por causa de problemas nos drivers (pelo menos no que se refere aos Shaders).

Mas sei, como foi dito aqui várias vezes, a eficiência das placas AMD é bem menor que do lado verde da força. Tanto isso é verdade, que em programas como bitcoin onde ganhamos dinheiro "minerando" decodificando chaves, víamos que as placas da AMD tinham o dobro do desempenho das Nvidia, isso porque talvez essa seja uma das únicas situações onde seja possível se extrair tanto de uma arquitetura tão dependente da ordem dos dados estarem certas.

Veja que o VLIW tambem tem seus pontos de brilho em operações de GPGPU, como Decripitar Chaves por Brute-Force, na qual a GPU ira efetuar TODAS as possiveis variações de letras e numeros em formato string. São operações Paralelas e não dependentes entre si. porém ate mesmo nisso o GNC não tera nenhum problema em se ajustar .

Uma dúvida a mais que eu espero que não gere flame war. Apenas por não conhecimento meu tenho esta duvida. sempre vemos a Que as placas da AMD tem muito mais SP's que as da Nvidia, porém sempre elas tem desempenho parecido, porque? Tenho essa dúvida pois confeço que nunca li nada sobre a arquitetura fermi.

Bom EU SEI que você tem o conhecimento que o motivo da AMD ter mais SPs é devido justamente a adoção de SIMDs com SPs SuperEscalares, devido ao que ja dissemos antes. A nvidia usa a abordagem de SPs Escalares, que são mais simples de serem gerenciados.

Bom quando pegamos a PERFORMANCE EM MAD precisão Simples o esquema de Shaders da AMD sempre deram um banho em termos de performance teorica certo?

O motivo de que nos games a performance se mater "parecida" com as GPUs da nvidia, tem mais a ver com as outras etapas da renderização, do que dos Shaders propriamente.

Se pegarmos em Testes Sinteticos os Shaders da AMD, que damandam BASICAMENTE MUITO Pixel Shader, teremos de fato uma boa vantagem da AMD nesse teste (lembra do que eu disse do VLIW? ). porém se eu pegar um Teste sintetico como foco Vertex Shader, a coisa muda, a nvidia atualmente tem vantagem aqui. .

porém o que torna a performance mais "parea" é que as GPUs Da Nvidia, possuem mais "PIXEL POWER" e "BLEND POWER" devido aos ROPs mais Parrudos usados pela nvidia. Alem das Otimizações que a Nvidia fez nos seus TMUs para contrabalançar os TMUs da AMD.

Alem disso, o que torna a vida da nvidia mais confortavel, é que justamente por não usar o VLIW, e ter um Agendador por hardware, não é necessario toda uma otimização MASSIVA para que eu possa ter uma boa performance usando as GPUs dela. Coisa que era preciso fazer nas GPUs da AMD, se eu quisesse mostrar todo o seu poder.

Claro que o GCN não é de "graça". Os CORES ou CUs são bem mais complexos dos que os CORES usados no VLIW, ou seja, são mais densos em termos de transistores. Basta você olhar que a HD 7970 tem quase o DOBRO de transistores do que o Cayman, porém apenas 33% a mais de unidades de Shaders e TMUs, e O MESMO Numero de ROPS.

Bom é isso, realmente eu escrevi demais, peço desculpas de exagerei.

Gun'ss · 4 de janeiro de 2012

@Espada, eu agradeço por você ter escrito muito!!! Então podemos dizer que eficiência no agendador é a palavra chave. Obrigado, material obrigatório para todos aqui!

Yuri.Joker · 4 de janeiro de 2012

Uma verdadeira aula para newbies aqui no fórum como eu.

Diego Hwoarang · 4 de janeiro de 2012

Eu lembro do Espada ter me dado umas explicações meio off-topic em algum tópico a respeito da FX 5200 e continuou por MP dando uma explicada a respeito da diferença entre os SPs da AMD e dos Pipelines dedicados da Nvidia (acho que foi isso), e lembro dele ter dito que, por mais que as VGAs AMD tivessem maior quantidade de processadores de pixel e vertex em relação à Nvidia, é que como esses SPs seriam genéricos e poderiam fazer operações mais diversificadas, não tinham o mesmo poder bruto dos processadores da Nvidia, por estes serem dedicados. Eu não captei se isso foi diluido no post do Espada acima, mas caso não tenha sido, que o Espada esclareça isso, pois me parece que tem alguma coisa a ver com a dúvida do Gun'ss.