Ir ao conteúdo

Posts recomendados

Postado

Arquitetura: Bulldozer -> Piledriver

CPU: Zambezi -> Vishera

APU: Llano* -> Trinity

*(o Llano tem núcleos K10 e pula direto para módulos Piledriver no Trinity)

Postado
O Trinity é Piledriver, assim como o Vishera (substituto do Bulldozer), e este vem só em Q3 ou Q4.
Arquitetura: Bulldozer -> Piledriver

CPU: Zambezi -> Vishera

APU: Llano* -> Trinity

*(o Llano tem núcleos K10 e pula direto para módulos Piledriver no Trinity)

Mas houve um rumor (não confirmado? acho que do xbit labs) dizendo que o trinity teria um "meio piledriver", a AMD simplificou a arquitetura do trinity para fazer um "meio tock", focando o time to market. Acho que foi a isso que o Tijolo Espacial fez a referência.

O "piledriver completo" viria no Vishera, inclusive com algumas instruções novas.

Postado

sirroman, não, a arquitetura é a mesma.

Podem haver pequenas diferenças entre o Trinity e um Vishera 2M/4C porque a controladora de memória é diferente e o Trinity não tem cache L3, mas os módulos em si são os mesmos.

Pelos resultados que estão voando por aí, mesmo sem cache L3, o Trinity é um pouco mais rápido "clock por clock" que um FX-4100, por exemplo. Só resta ver como fica o consumo e como o Piledriver escala em overclock.

O Trinity top de desktop (o A10 5800K) vai trabalhar a 3.8GHz com Turbo para 4.2GHz. Com a mesma TDP de 100w do Llano top, que tem 4 núcleos K10 a 3GHz. As GPUs são diferentes, mas acho que é seguro afirmar que a porção CPU do Trinity consome menos energia que a do Llano (afinal o Trinity comporta uma GPU mais potente na mesma TDP "global", CPU+GPU).

Apesar das diferenças na arquitetura (o Bulldozer rende cerca de 80% da IPC do K10) e considerando que o Trinity é 2 Módulos / 4 Núcleos, enquanto o Llano tem 4 núcleos K10 "completos"; os clocks são bem mais altos, a diferença de clock é suficiente para compensar a diferença de IPC. E parece que isso foi suficiente para tornar o Trinity mais rápido que o Llano em tudo, single thread ou multi thread.

Os notebooks com Trinity devem ser lançados muito em breve (maio), então veremos como isso tudo se ajeita. E será bom ver uma comparação "apples to apples" contra o Llano nesse ambiente (até 35w), que é o território ideal para o processo de 32nm da GlobalFoundries. Aqui o Trinity tem boas chances até contra o IvyBridge.

Postado
sirroman, não, a arquitetura é a mesma.

Podem haver pequenas diferenças entre o Trinity e um Vishera 2M/4C porque a controladora de memória é diferente e o Trinity não tem cache L3, mas os módulos em si são os mesmos.

Pelos resultados que estão voando por aí, mesmo sem cache L3, o Trinity é um pouco mais rápido "clock por clock" que um FX-4100, por exemplo. Só resta ver como fica o consumo e como o Piledriver escala em overclock.

O Trinity top de desktop (o A10 5800K) vai trabalhar a 3.8GHz com Turbo para 4.2GHz. Com a mesma TDP de 100w do Llano top, que tem 4 núcleos K10 a 3GHz. As GPUs são diferentes, mas acho que é seguro afirmar que a porção CPU do Trinity consome menos energia que a do Llano (afinal o Trinity comporta uma GPU mais potente na mesma TDP "global", CPU+GPU).

Apesar das diferenças na arquitetura (o Bulldozer rende cerca de 80% da IPC do K10) e considerando que o Trinity é 2 Módulos / 4 Núcleos, enquanto o Llano tem 4 núcleos K10 "completos"; os clocks são bem mais altos, a diferença de clock é suficiente para compensar a diferença de IPC. E parece que isso foi suficiente para tornar o Trinity mais rápido que o Llano em tudo, single thread ou multi thread.

Os notebooks com Trinity devem ser lançados muito em breve (maio), então veremos como isso tudo se ajeita. E será bom ver uma comparação "apples to apples" contra o Llano nesse ambiente (até 35w), que é o território ideal para o processo de 32nm da GlobalFoundries. Aqui o Trinity tem boas chances até contra o IvyBridge.

Vamos ver, sairam uns leaks que o fudzilla reproduziu, mostrando que o IB melhorou seu IPC em 20%....

Postado

lfmetalicus, 20% de ganho de desempenho não é a mesma coisa que 20% de ganho de IPC ("desempenho por clock").

Os ganhos de IPC do IvyBridge em relação ao SandyBridge são pequenos (menos de 5%), mas o processo de 22nm permite que os IvyBridge operem com clock maior que os SandyBridge e ainda consumam menos energia.

A AMD não mudou de processo, mas mudou completamente de arquitetura (do Llano para o Trinity) e o processo de 32nm da GlobalFoundries amadureceu um bocado desde o lançamento do Llano e dos FX.

A AMD diz que o Trinity oferece o dobro de performance/watt do Llano. Resta ver em que situações isso é verdade.

Postado
, mas acho que é seguro afirmar que a porção CPU do Trinity consome menos energia que a do Llano (afinal o Trinity comporta uma GPU mais potente na mesma TDP "global", CPU+GPU)..

Certamente a Trinity virá com 240mm² "perticularmente, acho muito", Llano tem 228mm².

Se, como lemos algum tempo atrás, a AMD precisou de +25% pra construir um módulo Bulldozer, então presumiria que CPU da Trinity deve ter por volta de 2/3 da CPU Llano, ou seja, Menor e com o mesmo TDP eu diria que proporcionalmente, consome mais.

Postado

jonny_br, creio que nesse caso a performance/mm^2 não importa muito. Mas creio que a maior responsável por esse aumento em área seja a GPU.

E o Turbo se encarrega de fazer a porção CPU e a GPU se ajeitarem dentro da TDP.

Postado

Na minha opinião, não ocorreu grandes ganhos do Vliw5 para o Vliw4 nos jogos, mesmo no quesito eficiência energética. Isso explica um pouco o porque do aumento da área da fração GPU na nova APU, para conseguir ganhar 30 a 50% na performance de vídeo, como prometido.

Postado
Na minha opinião, não ocorreu grandes ganhos do Vliw5 para o Vliw4 nos jogos, mesmo no quesito eficiência energética. Isso explica um pouco o porque do aumento da área da fração GPU na nova APU, para conseguir ganhar 30 a 50% na performance de vídeo, como prometido.

Esse provavelmente é o motivo de também a AMD ter trabalhado no GCN para as GPUs high-end novas, apesar de o VLIW4 ser recente. Não demora o GCN chega nas APUs, aí sim quero ver o que a Intel vai fazer para competir em matéria de IGP.

Postado

Se não me engano o objetivo da arquitetura VLIW4 é justamente aumentar a performance/mm^2, pois o processo de 32nm foi abortado e a AMD precisava de uma GPU mais forte mas que não fosse uma jamanta de tão grande.

Postado
sirroman, não, a arquitetura é a mesma.

Podem haver pequenas diferenças entre o Trinity e um Vishera 2M/4C porque a controladora de memória é diferente e o Trinity não tem cache L3, mas os módulos em si são os mesmos.

Se a arquitetura for a mesma então o lançamento do trinity vai ser bem mais interessante do que eu (já!) esperava

jonny_br, creio que nesse caso a performance/mm^2 não importa muito. Mas creio que a maior responsável por esse aumento em área seja a GPU.

E o Turbo se encarrega de fazer a porção CPU e a GPU se ajeitarem dentro da TDP.

Se não me engano o objetivo da arquitetura VLIW4 é justamente aumentar a performance/mm^2, pois o processo de 32nm foi abortado e a AMD precisava de uma GPU mais forte mas que não fosse uma jamanta de tão grande.

Sim, os 6 SIMDs do trinity devem ter praticamente o mesmo tamanho dos 5 SIMDs do Llano. A gente também n pode esquecer que a AMD vai colocar o VCE no trinity, algo que não temos no Llano, isso já ajuda a explicar a diferença de tamanho.

E ainda tem a questão da densidade também. Por isso mm^2 é meio enganador (mas é uma métrica bacana, eu gosto). É possível que o trinity tenha densidade ligeiramente menor que do Llano, por precaução e para aumentar os yields, já que o Llano tava meio atrapalhado.

Esse provavelmente é o motivo de também a AMD ter trabalhado no GCN para as GPUs high-end novas, apesar de o VLIW4 ser recente. Não demora o GCN chega nas APUs, aí sim quero ver o que a Intel vai fazer para competir em matéria de IGP.

Ainda mais porque depois do pitcairn, do cape verde e dos drivers novos a gente talvez precise é aumentar a relação de performance em jogos do GCN em relação ao VLIW4, eu achava que a performance era igual, mas parece que tá melhor.

Postado

sirroman, performance/mm^2 é uma métrica bem interessante, embora não absoluta.

Por exemplo, se no mesmo processo de fabricação um módulo Piledriver ocupa mais área que dois núcleos K10, mas no final das contas o Piledriver oferece mais performance/watt, não podemos afirmar que sua performance/mm^2 seja pior.

Postado
Se a arquitetura for a mesma então o lançamento do trinity vai ser bem mais interessante do que eu (já!) esperava

Sim, os 6 SIMDs do trinity devem ter praticamente o mesmo tamanho dos 5 SIMDs do Llano. A gente também n pode esquecer que a AMD vai colocar o VCE no trinity, algo que não temos no Llano, isso já ajuda a explicar a diferença de tamanho.

E ainda tem a questão da densidade também. Por isso mm^2 é meio enganador (mas é uma métrica bacana, eu gosto). É possível que o trinity tenha densidade ligeiramente menor que do Llano, por precaução e para aumentar os yields, já que o Llano tava meio atrapalhado.

Ainda mais porque depois do pitcairn, do cape verde e dos drivers novos a gente talvez precise é aumentar a relação de performance em jogos do GCN em relação ao VLIW4, eu achava que a performance era igual, mas parece que tá melhor.

Sirroman, VCE é um concorrente pro QuickSync ou é algo que se refere a GPGPU??

--------------------------------------------------------------------------------------------------------------------------------------------

sirroman, performance/mm^2 é uma métrica bem interessante, embora não absoluta.

Por exemplo, se no mesmo processo de fabricação um módulo Piledriver ocupa mais área que dois núcleos K10, mas no final das contas o Piledriver oferece mais performance/watt, não podemos afirmar que sua performance/mm^2 seja pior.

Interessante lembrar que, caso o Bulldozer tivesse ao menos cumprido com suas promessas de performance/w e Performance por mm², teria em ambos alcançado marcas históricas. Algo está me cheirando que não apenas o Bulldozer falhou no projeto, como as peças de silício da GF tiveram um rendimento abaixo do esperado.

Queria fazer mais uma pergunta: A peça de silício do tratorzão tem o tal do HKMG nele? Se sim, alguém conseguiria estimar se isto acarretou em alguma melhora na performance dos Bulldozer(sem falar em Clock, até porque o consumo dos FX tá horroso...)?

--------------------------------------------------------------------------------------------------------------------------------------------

Pra terminar meu post, gostaria de desafiar algum usuário de um PhenomII 965/955 @3.6Ghz com 4GB de DDR3 em Dual Channel no wprime e superpi, pra ter umas idéias mais consistentes da performance do Bulldozer. Se alguém quiser colaborar, manda PM por favor.

Postado

lfmetalicus, no papel o processo de 32nm é o melhor do mercado, melhor até que o da Intel. Por ser SOI com High K Metal Gate e litografia de imersão.

Mas além de atrasar, apresentar um Yield muito baixo no começo, não atingiu as expectativas de clock que a AMD tinha para o Bulldozer.

Nem tudo foi resolvido, mas pelo menos o Yield está bom, a produção (volume) foi regularizada, então fornecimento não será problema, e as expectativas de clock melhoraram um pouquinho (nada que possa salvar os FX atuais, por isso ainda não temos uma revisão B3/C0, por exemplo).

Felizmente, apesar de todos os problemas, o processo rende muito bem em frequências baixas, permitindo excelentes chips "mobile".

E a AMD pegou "as manhas" do processo e adequou o Piledriver a isso. Então não há dúvidas que o Trinity de notebook será um excelente produto, podendo competir inclusive com o Ivybridge.

Terá boas chances no desktop também. Se a AMD conseguir comunicar direito ao consumidor o que é uma APU, muita gente pode preferir uma APU a uma solução Intel + GPU dedicada.

A GPU deve ser forte o suficiente para rodar a maioria dos jogos atuais em resolução 1366x768 e detalhes em High. E espera-se que porção CPU do Trinity possa superar o desempenho de um Phenom II X4 em qualquer situação.

Quanto aos FX baseados no Piledriver (Vishera) não sou tão otimista.

Esperamos uma melhora razoável no desempenho (15 a 20%). Portanto a história deve se repetir, um FX-8 Vishera deve ficar entre um i5 e um i7 Ivybridge em multithread, mas bem atrás em single thread. Sem falar no consumo bem maior (125w vs 77w) e potencial de overclock bem menor. :(

Um Ivybridge deve chegar a 5GHz com um bom cooler a ar.

Um Vishera também deve chegar a uns 5GHz, mas precisando de um watercooler bem potente e o desempenho dos dois ao mesmo clock nem se compara....

  • Curtir 3
Postado
Sirroman, VCE é um concorrente pro QuickSync ou é algo que se refere a GPGPU??

--------------------------------------------------------------------------------------------------------------------------------------------

Interessante lembrar que, caso o Bulldozer tivesse ao menos cumprido com suas promessas de performance/w e Performance por mm², teria em ambos alcançado marcas históricas. Algo está me cheirando que não apenas o Bulldozer falhou no projeto, como as peças de silício da GF tiveram um rendimento abaixo do esperado.

Queria fazer mais uma pergunta: A peça de silício do tratorzão tem o tal do HKMG nele? Se sim, alguém conseguiria estimar se isto acarretou em alguma melhora na performance dos Bulldozer(sem falar em Clock, até porque o consumo dos FX tá horroso...)?

--------------------------------------------------------------------------------------------------------------------------------------------

Pra terminar meu post, gostaria de desafiar algum usuário de um PhenomII 965/955 @3.6Ghz com 4GB de DDR3 em Dual Channel no wprime e superpi, pra ter umas idéias mais consistentes da performance do Bulldozer. Se alguém quiser colaborar, manda PM por favor.

Cara tenho a mesma duvida tb tenho um PII 955 @ 3.9 e queria saber se vale trocar por um FX4100 ou por um FX6100, considerando que tb vou fazer over neles.

Postado

Isso me escapou, foi mal, lfm.

Sirroman, VCE é um concorrente pro QuickSync ou é algo que se refere a GPGPU??

É o concorrente do QuickSync sim. A maior parte das coisas "para GPGPU" só vão vir com o GCN nos APUs, ano que vem, mas esse bloco de hardware de função-fixa (decodifica h264 e etc) vai vir para os APUs antes.

A AMD prometeu que o VCE trabalhe em conjunto com os CUs da GPU, mas n sei se isso vai vir para o trinity n.

  • Curtir 1
Postado
Cara tenho a mesma duvida tb tenho um PII 955 @ 3.9 e queria saber se vale trocar por um FX4100 ou por um FX6100, considerando que tb vou fazer over neles.

Faz uns testes nele pra nós então(com ele nos 3.6Ghz, pra gente comparar a performance) daí você posta as screens pra gente!

Postado
Faz uns testes nele pra nós então(com ele nos 3.6Ghz, pra gente comparar a performance) daí você posta as screens pra gente!

Quais testes ? prime mesmo ?

Visitante
Este tópico está impedido de receber novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...