Ir ao conteúdo
  • Cadastre-se

R1000, Radeon 7**0, "Southern Islands", tópico oficial de discussão


Evandro

Posts recomendados

Talvez agora saibamos o porquê da Nvidia não usar GK110 para lançar as nova Top-End de suas VGAs:o

Vazam alguns slides e especificações da suposta resposta da AMD ao GF110.

Iw84J.png

http://forums.guru3d.com/showpost.php?p=4259767&postcount=97

GCN 2.0:

2304 SPs(96 32 bit ALUs per *****)

192 TMUs(8 TMUs per *****)

48 ROPs(2 ROPs per *****)

GK112

768 CUDA Cores

192 TMUs(24 TMUs per SM)

48 ROPs(6 ROPs per SM)

2304 * 2 * 1.0GHz => 4' date='608 GFlops

768 * 2 * ~1.5GHz => 2,304 GFlops

I personally think 1.6GHz will be achievable.

I still have no idea why Fermi and Kepler are still off by 2x in performance ratios[/quote']

  • Curtir 1
Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Talvez agora saibamos o porquê da Nvidia não usar GK110 para lançar as nova Top-End de suas VGAs:o

Vazam alguns slides e especificações da suposta resposta da AMD ao GF110.

Iw84J.png

http://forums.guru3d.com/showpost.php?p=4259767&postcount=97

Parece real, achei a porporção entre as partes um pouco estranha, mas é bom ver que o número de ROPS e TMUs cresceu, se tiver mais rasterizadores, ela pode ser perigosa pra NVIDIA.

--

Telminão, bem observado o detalhe, mas é estranho falarem disso neste momento e com tantos dados, se a placa não estivesse no forno.

CGN 2 é coisa pro fim do ano.

Link para o comentário
Compartilhar em outros sites

Outra coisa que devemos lembrar, é que a Nvidia, andou meio que zuando a AMD dizendo que esperava mais... e que vão lançar um produto que simplesmente não pode ser batido, talvez o marketing da divisão gráfica da AMD quis, dar o troco e de uma forma ou de outra dar uma embaçada no que vem sendo falado da Nvidia pelos fóruns da vida

Link para o comentário
Compartilhar em outros sites

Na Verdade Sirro, não tem nada de estranho na performance o Cape Verde, dependendo de ONDE você olhar é claro :D. Em primeiro Lugar o cache L1 de Dados e Instruções que são Compartilhados por 3 ou 4 CUs é apenas de Leitura, e é usado mais para processos de compartilhamento rápido entre os CUs.

Dentro de Cada ***** temos um outro Tipo de Cache L1 que o Cache de Texture Fetch, alem do Scheduler, e PRINCIPALMENTE temos a unidade Escalar.

E fácil se esquecer dela, porém no GCN , esse unidade escalar tem um papel importante, de realizar calculos que não sao bem realizados pelas unidades vetoriais.

O Scheduler ta ai, porque o GNC como uma arquitetura que agora nao depende mais ILP, deve gerenciar melhor os Warps entre as unidades vetoriais e PRINCIPALMENTE mandar os Warps certos para a unidade escalar. porém ele so gerencia o seu proprio *****, quem de fato é o Grande Scheduler do chip são os ACEs.

Outra coisa MUITO importante é que agora o Cape Verde tem nada menos que o DOBRO de Cache L2. No Juniper XT (HD 6770) tinhamos 128 KB de Cache L2 para cada controlador de memoria, totalizando 256 KB De Cache L2.

Ja no Cape Verde temos 512 KB de Cache Unificada. O L2 é de fato o grande compartilhador de dados para TODO o Chip, não apenas para os ROPS (que agora não tem mais uma conexão direta com o L2).

Portanto o GNC com sua Unidade Escalar + aumento de clock + L2 enorme, tem muito mais peso nessa performance que o L1 D & I.

Erro de design sem duvida que não é :D. Veja bem Sirro, o L1 D & I é bem pequeno e poderia ser aumentado sem muitas consequências. porém não é um Cache digamos CRITICO aqui. Ja o L2 compartilhado e o L1 de Texturas, esses sim, pesam mais nos jogos.

O Aumento do L2 não é uma surpresa digamos assim, a Nvidia ja tem seguido essa linha, porém no caso dela, foi uma obrigação, ja que devido aos Multiplos Rasterizers (coisa que ate então nao se viu em GPUs) você precisava de um Cache L2 Grande e Unificado, senão o esquema do Fermi não funcionaria.

Se me permite eu vou fazer uma consideração até ^_^, As GPUs tinham por caracteristica, justamente muitas Unidades de Execução e poucas areas de memorias (buffers, Registradores, Caches,etc..), ja as CPUs por outro lado sempre forem conhecidas por menos unidades de execução e mais areas de memoria dentro do Die. E o que estamos vendo agora? GPUs com mais area de memoria, perdendo sua eficiência em relação performance/Transistores, porém ganhando flexibilidade. Esse é o preço da Flexibilidade. :cool:

Bom se o Slide que nosso amigo Jonny_br postou estiver correto, as HDs 7800 vão trabalhar com 2 Primitivas por Clock, ou seja, 2 Triangulos por Clock, que é a mesma capacidade de Rasterização do Tahiti. Ou seja Clock a Clock o mesmo poder de Tesselation. Vamos ver se eles vão fazer outros tipos de Cortes né :)

E o Espada sempre chega para salvar o pessoal. o/

Eu tive a impressão de que o CV tinha performance ligeiramente melhor do que eu esperava em alguns testes, especialmente a 7750 (819 GFLOPS). Tipo o fato de que em alguns testes ela supera consideravelmente a 5770 (1360 GFLOPS). Ou o fato dela ter performance melhor do que o esperado em comparação com a 7770.

N tem nenhum tipo de workload em que esses caches "menos congestionados" com menos CUs ajudariam nisso ai? No caso a dúvida é, essa comunicação rápida entre CUs que usa o tal cache read-only, ajuda ou não em jogos? Ou é uma coisa mais para GPGPU mesmo?

Um colega do Criminal nos trouxe essa imagem:

162a.jpg

Quem lembra dela?

você ta falando dos 2304 SPs dessa folha que muita gente fala que é falsa?

Sei não. Acho que, no mínimo, é coincidência. E prova de que o povo queria as SI mais fortes do que elas vieram.

Link para o comentário
Compartilhar em outros sites

você ta falando dos 2304 SPs dessa folha que muita gente fala que é falsa?

Sei não. Acho que, no mínimo, é coincidência. E prova de que o povo queria as SI mais fortes do que elas vieram.

A própria AMD disse que era falsa. Comentamos sobre ela antes.

Outra coisa interessante é que Tenerife pertence macaronésia, assim como Cabo Verde

Link para o comentário
Compartilhar em outros sites

E se eles mentiram, escondendo o jogo descaradamente, e todo mundo acreditou ?

Você confia em declaração oficial de empresa ? :D

Advogado do diabo...;)

não sei se foi oficial, mas que eu me lembre, algo próximo na época... deixa eu ver se acho os links.

http://pcper.com/news/Graphics-Cards/Does-AMD-have-2304-stream-processor-GPU-waiting

Link para o comentário
Compartilhar em outros sites

macaronésia se refere à ilhas no índico que eram colônias italianas?? :D

afinal, o que é o pensamento sobre tenerife? HD7989, HD7990 ou HD8970? Eu interpretei como o último, e aí ter 20% a mais de performance é piada! Além do que não vejo a GK110 como arma a ser guardada pro futuro em nenhum cenário!

Link para o comentário
Compartilhar em outros sites

macaronésia se refere à ilhas no índico que eram colônias italianas?? :D

A-Pealla agora que o negócio jamón

Se não fugir da escola, refere-se a um bioma, e o negócio é do lado de cá, costa de Marrocos, colonizada pelos gafanhotos espanhóis, assim com Cabo Verde.

Ops... nada melhor que Wikipedia.

afinal, o que é o pensamento sobre tenerife? HD7989, HD7990 ou HD8970?

Segundo os rumores, seria o nome da placa pertencente a família Sea Islands.

Um colega citou pra mim sobre macaronésia, dai, é fácil deduzir eu seria uma Southrn Islands, provavelmente a HD 7980, uma suposta VGA uni-processada e mais poderosa.

Eu interpretei como o último, e aí ter 20% a mais de performance é piada! Além do que não vejo a GK110 como arma a ser guardada pro futuro em nenhum cenário!

Esse brinquedinho ai teria que arranca pelo menos 5GFlops.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP

Boa Telminão!

Vi o do TPU. A relação desempenho x consumo está excelente, como já vimos com as outras baseadas no GCN. No quesito desempenho, em 1920 x 1080, a 7850 ficou entre a 6950 e a 6970, já a 7870 ficou entre a GTX 570 e GTX 580/7950. O consumo em idle está excelente, com as duas consumindo perto da casa dos ~10 W... Em jogos, a 7850 chegou a consumir 96 W e a 7870, 115 W. O nível de ruído dos modelos de referência está bom, mas poderia ser um pouco melhor em full load. Pelo que vi, as duas são boas de over (especialmente a 7850). O preço até está justo, mas continuam sendo VGAs relativamente caras, a 7870 deve chegar aqui por mais de R$1000 e a 7850 na casa dos R$800 (mas elas se saíram bem em relação às high end na tabela do "custo/benefício" do TPU).

Link para o comentário
Compartilhar em outros sites

E o Espada sempre chega para salvar o pessoal. o/

Eu tive a impressão de que o CV tinha performance ligeiramente melhor do que eu esperava em alguns testes, especialmente a 7750 (819 GFLOPS). Tipo o fato de que em alguns testes ela supera consideravelmente a 5770 (1360 GFLOPS). Ou o fato dela ter performance melhor do que o esperado em comparação com a 7770.

N tem nenhum tipo de workload em que esses caches "menos congestionados" com menos CUs ajudariam nisso ai? No caso a dúvida é, essa comunicação rápida entre CUs que usa o tal cache read-only, ajuda ou não em jogos? Ou é uma coisa mais para GPGPU mesmo?

Eu entendo o que quer dizer. Como você ja sabe as Otimizações do GNC dão ao Cape Verde sua cartada na questão de Eficiência nos Shaders.

Vale lembrar que dependendo da Engine do jogo a ser testado os resultados vão variar (normal ^_^). Em Engines menos Shader Intensivos a HD 7750 fica mais proxima a sua irmã maior. Eu vi testes em que a HD 7750 perde por quase o dobro de FPS(em relação a HD 7770), geralmente em games DX11 com Post-Processamento alto e em engines muito shader intensivas, em outros games a diferença cai muito. O que é normal não é meu caro amigo Sirro ^_^.

No caso do Juniper XT (HD 5770) os 1360 GFlops SP em MAD não significam muita coisa, até porque o VLIW5 é consideravelmente ineficiente em relação ao GNC. Vertex Shader então, no VLIW5 era bem decepcionante. Ja no GNC, melhorou bem isso.

Outro detalhe é que se você prestar atenção cada vez mais jogos estão introduzindo o famoso FXAA. O FXAA como filtro pos-processado a renderização em si, vai se beneficiar bem de uma arquitetura como o GNC, e com isso você ganha alguns frames aqui.

Sobre os caches L1 D & I, basicamente qualquer Workload, dentro dos CUs que precisa ser sincronizada com os outros do grupo local, uma hora ou outra vai ter que usar eles;).

Geralmente Hull e Domain Shaders tende a usar mais ele (jogos), e no GPGPU vai variar de muito ou pouco, dependendo da bendita (ou maldita :D) aplicação.

porém o que eu quis colocar, e que apesar de ser um cache Importante, são de fatos os outros detalhes da arquitetura usada nas Novas Radeons, que pesam mais na performance dos jogos. O Cache L2 então....

Porque se fosse um caso de cache muito congestionada a AMD teria por obrigação ter que mudar isso na etapa de design.

Uma outra situação ainda mais bizarra é a performance MUITO pareada das novas HD 7800 com as TOPS HD 7900. Ai voce pode dizer, "Onde esta a magica ?", bom não tem magica :), o motivo é que apesar das novas HDs 7800 terem bem menos Shaders que as HD 7900, o seu poder em termos de ROPs (ou o que eu costumo chamar de Pixel Power) TMUs, foram bem preservados se compararmos com as HDs 7900. Alem de possuirem um otimo "Shader Power" :).

porém é como eu disse, quanto mais Shader Intensiva é uma Engine, maior tende a ser essa diferença. Ou seja para as novas HD 7900 brilharem mesmo, so faltava mais ROPs (e com isso mais Rasterizers e assim maior poder de Tesselation) e novos jogos com Engines que de fato aproveitem essa super poder nos Shaders.

  • Curtir 4
Link para o comentário
Compartilhar em outros sites

Visitante
Este tópico está impedido de receber novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...

Ebook grátis: Aprenda a ler resistores e capacitores!

EBOOK GRÁTIS!

CLIQUE AQUI E BAIXE AGORA MESMO!