Ir ao conteúdo

AMD R900 - Northern Islands: Radeon HD6**0


Evandro

Posts recomendados

Postado
Ao que tudo indica, houve na realidade um equívoco na leitura do GPU-Z. O software calcula o número de ROPs inativos através de um conjunto de bits definidos. No caso da 6790, há 2 conjuntos de bits, indicando assim 2 unidades desativadas. A GPU Barts tem um total de 32 ROPs em 8 unidades, deixando então o teórico calculo da 6790 em 24 ROPs: (8 [total ROPs] - 2 [ROPs desativados]) * 4 [pixels por clock por ROP] .

Contudo, olhando para a arquitetura com atenção, percebe-se que os ROPs estão divididos em 2 shader arrays (conjuntos de shaders/Stream Processors), e não em um único bloco. Assim, a contagem correta no cálculo dos ROPs é: (4 [ROPs por shader array] - 2 [ROPs desativados por shader array]) * 2 [shader arrays] * 4 [pixels por clock por ROP] = 16!

Deste modo, a confusão finalmente está esclarecida: todas as Radeons HD 6790 têm um total de 16 ROPs.

De fato pode ter ocorrido um Erro no GPU-Z, que ja seria ate esperado, afinal a placa foi recem lançada. porém voce não entendeu como os ROPs estão de fato ligados.

Os Cores SIMDs e os ROPS, não tem uma relação direta, que determine qualquer dependencia em termos de numeros um do outro. A Unica coisa que os SIMD cores fazem para os ROPS, e mandar os dados dos Shaders pro Shader Export, que esse se encarrega de mandar para os ROPS os dados dos Shaders, para que sejam convertidos em Pixels propriamente ditos. Os ROPS estão ligados com os Setup Engines e com os Controladores de memoria, ok.

Os SIMD cores ou SIMD Clusters como são mais conhecidos, no caso do Barts estão de fato divididos em 2 grandes blocos, porém isso so ocorreu devido a estrategia de se criar dois Dispatch Processors e com isso criar uma GPU que pode balancear melhor a carga dos Threads entre os SIMDs.

Veja bem, no Barts voce tem 8 Super Grupos de ROPS, sendo que em cada grupo voce tem 4 Color ROPS e 16 Z/Stencil Rops. porém cada barramento de 64 bits possui não 1 mais 2 Super Grupos de ROPS. AQUI QUE VEM O SEGREDO PESSOAL:

No caso do Fermi da Nvidia você tem um Super Grupo de ROPS para cada barramento. Apesar de ser mais efetivo essa abordagem, ela não é tão flexivel. Ja que nessa abordagem da Nvidia, se você tem 1 Grupo de ROPS em cada controlador, caso voce Queira desativar ROPS, você obrigatoriamente TEM QUE DESATIVAR o CONTROLADOR LIGADO A ELE. Acho que eu ja disse isso antes né :D

porém no Barts cada controlador de 64 bits, voce tem 2 Grupos de ROPS. E caso queira desativar ROPS, voce pode desativa-los de certa forma que não obriga você de perder Controladores de memoria.

O que ocorreu é que a AMD no Barts LE, desativou 1 Super Grupo de ROPS de cada controlador, com isso você não ficou com 8 mais sim com 4 No total. Cada Super grupo tem 4 Color ROPs e 16 Stecil/Z ROPS, totalizando 16 Color ROPS e 64 Z/Stencil ROPS.

Entendeu agora?

Sobre o GPU-Z e so dar tempo deles arrumarem ele :).

Postado
Achei que eles poderiam desativar qualquer um dos grupos, assim aproveitariam mais chips, mas, antes isso do que vender como chaveiro Geek.

Tadáá !!

http://www.techpowerup.com/143770/TechPowerUp-GPU-Z-v0.5.3-Released.html

Poder, eles podem Evandro. Mas dependendo do Grupo em questão, você tem certas consequências.

O W1zzard Foi rápido dessa vez hein Evandro :).

  • Membro VIP
Postado

De fato pode ter ocorrido um Erro no GPU-Z, que ja seria ate esperado, afinal a placa foi recem lançada. porém voce não entendeu como os ROPs estão de fato ligados.

Os Cores SIMDs e os ROPS, não tem uma relação direta, que determine qualquer dependencia em termos de numeros um do outro. A Unica coisa que os SIMD cores fazem para os ROPS, e mandar os dados dos Shaders pro Shader Export, que esse se encarrega de mandar para os ROPS os dados dos Shaders, para que sejam convertidos em Pixels propriamente ditos. Os ROPS estão ligados com os Setup Engines e com os Controladores de memoria, ok.

Os SIMD cores ou SIMD Clusters como são mais conhecidos, no caso do Barts estão de fato divididos em 2 grandes blocos, porém isso so ocorreu devido a estrategia de se criar dois Dispatch Processors e com isso criar uma GPU que pode balancear melhor a carga dos Threads entre os SIMDs.

Veja bem, no Barts voce tem 8 Super Grupos de ROPS, sendo que em cada grupo voce tem 4 Color ROPS e 16 Z/Stencil Rops. porém cada barramento de 64 bits possui não 1 mais 2 Super Grupos de ROPS. AQUI QUE VEM O SEGREDO PESSOAL:

No caso do Fermi da Nvidia você tem um Super Grupo de ROPS para cada barramento. Apesar de ser mais efetivo essa abordagem, ela não é tão flexivel. Ja que nessa abordagem da Nvidia, se você tem 1 Grupo de ROPS em cada controlador, caso voce Queira desativar ROPS, você obrigatoriamente TEM QUE DESATIVAR o CONTROLADOR LIGADO A ELE. Acho que eu ja disse isso antes né :D

porém no Barts cada controlador de 64 bits, voce tem 2 Grupos de ROPS. E caso queira desativar ROPS, voce pode desativa-los de certa forma que não obriga você de perder Controladores de memoria.

O que ocorreu é que a AMD no Barts LE, desativou 1 Super Grupo de ROPS de cada controlador, com isso você não ficou com 8 mais sim com 4 No total. Cada Super grupo tem 4 Color ROPs e 16 Stecil/Z ROPS, totalizando 16 Color ROPS e 64 Z/Stencil ROPS.

Entendeu agora?

Sobre o GPU-Z e so dar tempo deles arrumarem ele :).

Só um detalhe, esssa notícia eu peguei em algum site da net, ou seja, a teoria não é minha...

Mas obrigado pela explicação ;)

abraços

Postado

Só um detalhe, esssa notícia eu peguei em algum site da net, ou seja, a teoria não é minha...

Mas obrigado pela explicação ;)

abraços

Imagina Phoenix, sei que voce postou pra informar o pessoal ^_^. So estou mostrando como são as ligações entre eles.

Existe sempre aberrações como a GTX 550 que gostam de fugir das regras do bom senso em termos de GPUs, que faz a gente sempre ter que revisar as arquiteturas uma por uma.

Postado

Gostei muito do cooler passivo desta 6850! Mas pelo que pude analisar é uma variação de um tri-slot ocupando atras da placa também. Um CF destas belezinhas, um cooler de cpu silencioso, deva dar novo nivel de conforto para o usuário!

Postado
Gostei muito do cooler passivo desta 6850! Mas pelo que pude analisar é uma variação de um tri-slot ocupando atras da placa também. Um CF destas belezinhas, um cooler de cpu silencioso, deva dar novo nivel de conforto para o usuário!

E lá vai caber numa mobo isso? hehe

Mas como comentaram lá, se você colocar uma ventoinha por cima deve ficar muito bom.

Como duas dessas acabariam fazendo uma "chapa tomando todo um lado da mobo", acho que até mesmo um cooler horizontal por cima das duas fique bacana. lol

Postado

Tijolinho legal, se eu tivesse dinheiro sobrando, bem q poderia ter uma dessas, algum cooler de CPU super silecioso e claro, coolers de gabinete silenciosos.

Fonte silenciosa pelo menos eu ja tenho heheh

Postado

Boa notícia para a AMD e para o OpenCL:

Um grupo de Stanford deu uma trabalhada no F@H para dar suporte decente ao OpenCL e consequentemente às placas da AMD. Em versão beta, já oferece quase o dobro de performance em comparação às Work Units antigas. Só funciona em placas da série 5000 e 6000.

3.jpg

Sobre a performance:

While things look quite rosy all around, performance seems to scale in a linear fashion based on the number of Stream Processors on a given card and the graphics engine’s clock speeds. For example the HD 6870 has 1120 cores and a clock speed of 900Mhz so it can hang with a 1440 SP, 725Mhz HD 5850. Meanwhile, the 1600 core HD 5870 edges out the 1536 SP HD 6970. There also wasn’t much of a difference between identical cards sporting different memory configurations. As the new Core 16 projects mature, we’ll surely see things change a bit but for the time being it seems like the older AMD cards are more than holding their own.

http://www.hardwarecanucks.com/forum/hardware-canucks-reviews/42471-f-h-core-16-taking-amd-gpu-folding-next-level.html

Evandro, isso é mais uma indicação de que o projeto das placas novas (no caso, VLIW4) está bem direcionado para o público gamer e que o FireStream se beneficiaria bastante com um chip novo, focado no OpenCL e tal. (não que vá existir tal chip novo, claro)

  • Membro VIP
Postado
Boa notícia para a AMD e para o OpenCL:

Um grupo de Stanford deu uma trabalhada no F@H para dar suporte decente ao OpenCL e consequentemente às placas da AMD. Em versão beta, já oferece quase o dobro de performance em comparação às Work Units antigas. Só funciona em placas da série 5000 e 6000.

3.jpg

Sobre a performance:

http://www.hardwarecanucks.com/forum/hardware-canucks-reviews/42471-f-h-core-16-taking-amd-gpu-folding-next-level.html

Evandro, isso é mais uma indicação de que o projeto das placas novas (no caso, VLIW4) está bem direcionado para o público gamer e que o FireStream se beneficiaria bastante com um chip novo, focado no OpenCL e tal. (não que vá existir tal chip novo, claro)

Pra mim isso é um indicativo de que finalmente a AMD terminou a parte dela e o pessoal de Stanford parou de usar o Brook ou o CUDA. ;)

Esse aí ainda é beta, vamos ver como fica depois.. se bem que, pelo que o Espada falou, esse resultado "entre radeons" não deve mudar, porque o poder de processamento bruto das placas segue essa ordem aí mesmo.

Postado

Uma pergunta.... Os drivers de vídeo nvos que saem, tipo o Catalyst 11.4, muda alguma coisa nas VGAs da geração passada? Normalmente se vêem explicações de ganhos de performance, isso acontece com as VGAs mais antigas também?

  • Membro VIP
Postado
Uma pergunta.... Os drivers de vídeo nvos que saem, tipo o Catalyst 11.4, muda alguma coisa nas VGAs da geração passada? Normalmente se vêem explicações de ganhos de performance, isso acontece com as VGAs mais antigas também?

Talvez, especialmente neste caso onde a arquitetura é semelhante desde as primeiras HD 2000, mas não tem nada garantido, o foco deles são as placas novas. ;)

Postado
Boa notícia para a AMD e para o OpenCL:

Um grupo de Stanford deu uma trabalhada no F@H para dar suporte decente ao OpenCL e consequentemente às placas da AMD. Em versão beta, já oferece quase o dobro de performance em comparação às Work Units antigas. Só funciona em placas da série 5000 e 6000.

3.jpg

Sobre a performance:

http://www.hardwarecanucks.com/forum/hardware-canucks-reviews/42471-f-h-core-16-taking-amd-gpu-folding-next-level.html

Evandro, isso é mais uma indicação de que o projeto das placas novas (no caso, VLIW4) está bem direcionado para o público gamer e que o FireStream se beneficiaria bastante com um chip novo, focado no OpenCL e tal. (não que vá existir tal chip novo, claro)

Será que vai ser tudo isso mesmo?? Tem um aumento de 90% de desempenho bruto aí...

Tomara que dê uma diferençazinha no tempo de render por aqui ^_^

Arquivado

Este tópico foi arquivado e está fechado para novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...