Ir ao conteúdo
  • Cadastre-se

AMD Bulldozer / Bobcat / Zambezi - Plataformas.


Posts recomendados

O Trinity é Piledriver, assim como o Vishera (substituto do Bulldozer), e este vem só em Q3 ou Q4.
Arquitetura: Bulldozer -> Piledriver

CPU: Zambezi -> Vishera

APU: Llano* -> Trinity

*(o Llano tem núcleos K10 e pula direto para módulos Piledriver no Trinity)

Mas houve um rumor (não confirmado? acho que do xbit labs) dizendo que o trinity teria um "meio piledriver", a AMD simplificou a arquitetura do trinity para fazer um "meio tock", focando o time to market. Acho que foi a isso que o Tijolo Espacial fez a referência.

O "piledriver completo" viria no Vishera, inclusive com algumas instruções novas.

Link para o comentário
Compartilhar em outros sites

sirroman, não, a arquitetura é a mesma.

Podem haver pequenas diferenças entre o Trinity e um Vishera 2M/4C porque a controladora de memória é diferente e o Trinity não tem cache L3, mas os módulos em si são os mesmos.

Pelos resultados que estão voando por aí, mesmo sem cache L3, o Trinity é um pouco mais rápido "clock por clock" que um FX-4100, por exemplo. Só resta ver como fica o consumo e como o Piledriver escala em overclock.

O Trinity top de desktop (o A10 5800K) vai trabalhar a 3.8GHz com Turbo para 4.2GHz. Com a mesma TDP de 100w do Llano top, que tem 4 núcleos K10 a 3GHz. As GPUs são diferentes, mas acho que é seguro afirmar que a porção CPU do Trinity consome menos energia que a do Llano (afinal o Trinity comporta uma GPU mais potente na mesma TDP "global", CPU+GPU).

Apesar das diferenças na arquitetura (o Bulldozer rende cerca de 80% da IPC do K10) e considerando que o Trinity é 2 Módulos / 4 Núcleos, enquanto o Llano tem 4 núcleos K10 "completos"; os clocks são bem mais altos, a diferença de clock é suficiente para compensar a diferença de IPC. E parece que isso foi suficiente para tornar o Trinity mais rápido que o Llano em tudo, single thread ou multi thread.

Os notebooks com Trinity devem ser lançados muito em breve (maio), então veremos como isso tudo se ajeita. E será bom ver uma comparação "apples to apples" contra o Llano nesse ambiente (até 35w), que é o território ideal para o processo de 32nm da GlobalFoundries. Aqui o Trinity tem boas chances até contra o IvyBridge.

Link para o comentário
Compartilhar em outros sites

sirroman, não, a arquitetura é a mesma.

Podem haver pequenas diferenças entre o Trinity e um Vishera 2M/4C porque a controladora de memória é diferente e o Trinity não tem cache L3, mas os módulos em si são os mesmos.

Pelos resultados que estão voando por aí, mesmo sem cache L3, o Trinity é um pouco mais rápido "clock por clock" que um FX-4100, por exemplo. Só resta ver como fica o consumo e como o Piledriver escala em overclock.

O Trinity top de desktop (o A10 5800K) vai trabalhar a 3.8GHz com Turbo para 4.2GHz. Com a mesma TDP de 100w do Llano top, que tem 4 núcleos K10 a 3GHz. As GPUs são diferentes, mas acho que é seguro afirmar que a porção CPU do Trinity consome menos energia que a do Llano (afinal o Trinity comporta uma GPU mais potente na mesma TDP "global", CPU+GPU).

Apesar das diferenças na arquitetura (o Bulldozer rende cerca de 80% da IPC do K10) e considerando que o Trinity é 2 Módulos / 4 Núcleos, enquanto o Llano tem 4 núcleos K10 "completos"; os clocks são bem mais altos, a diferença de clock é suficiente para compensar a diferença de IPC. E parece que isso foi suficiente para tornar o Trinity mais rápido que o Llano em tudo, single thread ou multi thread.

Os notebooks com Trinity devem ser lançados muito em breve (maio), então veremos como isso tudo se ajeita. E será bom ver uma comparação "apples to apples" contra o Llano nesse ambiente (até 35w), que é o território ideal para o processo de 32nm da GlobalFoundries. Aqui o Trinity tem boas chances até contra o IvyBridge.

Vamos ver, sairam uns leaks que o fudzilla reproduziu, mostrando que o IB melhorou seu IPC em 20%....

Link para o comentário
Compartilhar em outros sites

lfmetalicus, 20% de ganho de desempenho não é a mesma coisa que 20% de ganho de IPC ("desempenho por clock").

Os ganhos de IPC do IvyBridge em relação ao SandyBridge são pequenos (menos de 5%), mas o processo de 22nm permite que os IvyBridge operem com clock maior que os SandyBridge e ainda consumam menos energia.

A AMD não mudou de processo, mas mudou completamente de arquitetura (do Llano para o Trinity) e o processo de 32nm da GlobalFoundries amadureceu um bocado desde o lançamento do Llano e dos FX.

A AMD diz que o Trinity oferece o dobro de performance/watt do Llano. Resta ver em que situações isso é verdade.

Link para o comentário
Compartilhar em outros sites

, mas acho que é seguro afirmar que a porção CPU do Trinity consome menos energia que a do Llano (afinal o Trinity comporta uma GPU mais potente na mesma TDP "global", CPU+GPU)..

Certamente a Trinity virá com 240mm² "perticularmente, acho muito", Llano tem 228mm².

Se, como lemos algum tempo atrás, a AMD precisou de +25% pra construir um módulo Bulldozer, então presumiria que CPU da Trinity deve ter por volta de 2/3 da CPU Llano, ou seja, Menor e com o mesmo TDP eu diria que proporcionalmente, consome mais.

Link para o comentário
Compartilhar em outros sites

Na minha opinião, não ocorreu grandes ganhos do Vliw5 para o Vliw4 nos jogos, mesmo no quesito eficiência energética. Isso explica um pouco o porque do aumento da área da fração GPU na nova APU, para conseguir ganhar 30 a 50% na performance de vídeo, como prometido.

Esse provavelmente é o motivo de também a AMD ter trabalhado no GCN para as GPUs high-end novas, apesar de o VLIW4 ser recente. Não demora o GCN chega nas APUs, aí sim quero ver o que a Intel vai fazer para competir em matéria de IGP.

Link para o comentário
Compartilhar em outros sites

sirroman, não, a arquitetura é a mesma.

Podem haver pequenas diferenças entre o Trinity e um Vishera 2M/4C porque a controladora de memória é diferente e o Trinity não tem cache L3, mas os módulos em si são os mesmos.

Se a arquitetura for a mesma então o lançamento do trinity vai ser bem mais interessante do que eu (já!) esperava

jonny_br, creio que nesse caso a performance/mm^2 não importa muito. Mas creio que a maior responsável por esse aumento em área seja a GPU.

E o Turbo se encarrega de fazer a porção CPU e a GPU se ajeitarem dentro da TDP.

Se não me engano o objetivo da arquitetura VLIW4 é justamente aumentar a performance/mm^2, pois o processo de 32nm foi abortado e a AMD precisava de uma GPU mais forte mas que não fosse uma jamanta de tão grande.

Sim, os 6 SIMDs do trinity devem ter praticamente o mesmo tamanho dos 5 SIMDs do Llano. A gente também n pode esquecer que a AMD vai colocar o VCE no trinity, algo que não temos no Llano, isso já ajuda a explicar a diferença de tamanho.

E ainda tem a questão da densidade também. Por isso mm^2 é meio enganador (mas é uma métrica bacana, eu gosto). É possível que o trinity tenha densidade ligeiramente menor que do Llano, por precaução e para aumentar os yields, já que o Llano tava meio atrapalhado.

Esse provavelmente é o motivo de também a AMD ter trabalhado no GCN para as GPUs high-end novas, apesar de o VLIW4 ser recente. Não demora o GCN chega nas APUs, aí sim quero ver o que a Intel vai fazer para competir em matéria de IGP.

Ainda mais porque depois do pitcairn, do cape verde e dos drivers novos a gente talvez precise é aumentar a relação de performance em jogos do GCN em relação ao VLIW4, eu achava que a performance era igual, mas parece que tá melhor.

Link para o comentário
Compartilhar em outros sites

sirroman, performance/mm^2 é uma métrica bem interessante, embora não absoluta.

Por exemplo, se no mesmo processo de fabricação um módulo Piledriver ocupa mais área que dois núcleos K10, mas no final das contas o Piledriver oferece mais performance/watt, não podemos afirmar que sua performance/mm^2 seja pior.

Link para o comentário
Compartilhar em outros sites

Se a arquitetura for a mesma então o lançamento do trinity vai ser bem mais interessante do que eu (já!) esperava

Sim, os 6 SIMDs do trinity devem ter praticamente o mesmo tamanho dos 5 SIMDs do Llano. A gente também n pode esquecer que a AMD vai colocar o VCE no trinity, algo que não temos no Llano, isso já ajuda a explicar a diferença de tamanho.

E ainda tem a questão da densidade também. Por isso mm^2 é meio enganador (mas é uma métrica bacana, eu gosto). É possível que o trinity tenha densidade ligeiramente menor que do Llano, por precaução e para aumentar os yields, já que o Llano tava meio atrapalhado.

Ainda mais porque depois do pitcairn, do cape verde e dos drivers novos a gente talvez precise é aumentar a relação de performance em jogos do GCN em relação ao VLIW4, eu achava que a performance era igual, mas parece que tá melhor.

Sirroman, VCE é um concorrente pro QuickSync ou é algo que se refere a GPGPU??

--------------------------------------------------------------------------------------------------------------------------------------------

sirroman, performance/mm^2 é uma métrica bem interessante, embora não absoluta.

Por exemplo, se no mesmo processo de fabricação um módulo Piledriver ocupa mais área que dois núcleos K10, mas no final das contas o Piledriver oferece mais performance/watt, não podemos afirmar que sua performance/mm^2 seja pior.

Interessante lembrar que, caso o Bulldozer tivesse ao menos cumprido com suas promessas de performance/w e Performance por mm², teria em ambos alcançado marcas históricas. Algo está me cheirando que não apenas o Bulldozer falhou no projeto, como as peças de silício da GF tiveram um rendimento abaixo do esperado.

Queria fazer mais uma pergunta: A peça de silício do tratorzão tem o tal do HKMG nele? Se sim, alguém conseguiria estimar se isto acarretou em alguma melhora na performance dos Bulldozer(sem falar em Clock, até porque o consumo dos FX tá horroso...)?

--------------------------------------------------------------------------------------------------------------------------------------------

Pra terminar meu post, gostaria de desafiar algum usuário de um PhenomII 965/955 @3.6Ghz com 4GB de DDR3 em Dual Channel no wprime e superpi, pra ter umas idéias mais consistentes da performance do Bulldozer. Se alguém quiser colaborar, manda PM por favor.

Link para o comentário
Compartilhar em outros sites

lfmetalicus, no papel o processo de 32nm é o melhor do mercado, melhor até que o da Intel. Por ser SOI com High K Metal Gate e litografia de imersão.

Mas além de atrasar, apresentar um Yield muito baixo no começo, não atingiu as expectativas de clock que a AMD tinha para o Bulldozer.

Nem tudo foi resolvido, mas pelo menos o Yield está bom, a produção (volume) foi regularizada, então fornecimento não será problema, e as expectativas de clock melhoraram um pouquinho (nada que possa salvar os FX atuais, por isso ainda não temos uma revisão B3/C0, por exemplo).

Felizmente, apesar de todos os problemas, o processo rende muito bem em frequências baixas, permitindo excelentes chips "mobile".

E a AMD pegou "as manhas" do processo e adequou o Piledriver a isso. Então não há dúvidas que o Trinity de notebook será um excelente produto, podendo competir inclusive com o Ivybridge.

Terá boas chances no desktop também. Se a AMD conseguir comunicar direito ao consumidor o que é uma APU, muita gente pode preferir uma APU a uma solução Intel + GPU dedicada.

A GPU deve ser forte o suficiente para rodar a maioria dos jogos atuais em resolução 1366x768 e detalhes em High. E espera-se que porção CPU do Trinity possa superar o desempenho de um Phenom II X4 em qualquer situação.

Quanto aos FX baseados no Piledriver (Vishera) não sou tão otimista.

Esperamos uma melhora razoável no desempenho (15 a 20%). Portanto a história deve se repetir, um FX-8 Vishera deve ficar entre um i5 e um i7 Ivybridge em multithread, mas bem atrás em single thread. Sem falar no consumo bem maior (125w vs 77w) e potencial de overclock bem menor. :(

Um Ivybridge deve chegar a 5GHz com um bom cooler a ar.

Um Vishera também deve chegar a uns 5GHz, mas precisando de um watercooler bem potente e o desempenho dos dois ao mesmo clock nem se compara....

  • Curtir 3
Link para o comentário
Compartilhar em outros sites

Sirroman, VCE é um concorrente pro QuickSync ou é algo que se refere a GPGPU??

--------------------------------------------------------------------------------------------------------------------------------------------

Interessante lembrar que, caso o Bulldozer tivesse ao menos cumprido com suas promessas de performance/w e Performance por mm², teria em ambos alcançado marcas históricas. Algo está me cheirando que não apenas o Bulldozer falhou no projeto, como as peças de silício da GF tiveram um rendimento abaixo do esperado.

Queria fazer mais uma pergunta: A peça de silício do tratorzão tem o tal do HKMG nele? Se sim, alguém conseguiria estimar se isto acarretou em alguma melhora na performance dos Bulldozer(sem falar em Clock, até porque o consumo dos FX tá horroso...)?

--------------------------------------------------------------------------------------------------------------------------------------------

Pra terminar meu post, gostaria de desafiar algum usuário de um PhenomII 965/955 @3.6Ghz com 4GB de DDR3 em Dual Channel no wprime e superpi, pra ter umas idéias mais consistentes da performance do Bulldozer. Se alguém quiser colaborar, manda PM por favor.

Cara tenho a mesma duvida tb tenho um PII 955 @ 3.9 e queria saber se vale trocar por um FX4100 ou por um FX6100, considerando que tb vou fazer over neles.

Link para o comentário
Compartilhar em outros sites

Isso me escapou, foi mal, lfm.

Sirroman, VCE é um concorrente pro QuickSync ou é algo que se refere a GPGPU??

É o concorrente do QuickSync sim. A maior parte das coisas "para GPGPU" só vão vir com o GCN nos APUs, ano que vem, mas esse bloco de hardware de função-fixa (decodifica h264 e etc) vai vir para os APUs antes.

A AMD prometeu que o VCE trabalhe em conjunto com os CUs da GPU, mas n sei se isso vai vir para o trinity n.

  • Curtir 1
Link para o comentário
Compartilhar em outros sites

Visitante
Este tópico está impedido de receber novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...

 

GRÁTIS: ebook Redes Wi-Fi – 2ª Edição

EBOOK GRÁTIS!

CLIQUE AQUI E BAIXE AGORA MESMO!