Ir ao conteúdo
  • Cadastre-se

AMD Bulldozer / Bobcat / Zambezi - Plataformas.


Posts recomendados

Actually, we already have such an issue known for Bulldozer, and NO bench-marked system has the patch installed!

The shared L1 cache is causing cross invalidations across threads so that the prefetch data is incorrect in too many cases and data must be fetched again. The fix is a "simple" memory alignment and (possible)tagging system in the kernel of Windows/Linux.

I reviewed the code for the Linux patch and was astonished by just how little I know of the Linux kernel... lol! In any event, it could easily cost 10% in terms of single threaded performance, possibly more than double that in multi-threaded loads on the same module due to the increased contention and randomness of accesses.

Not sure if ordained reviewers have been given access to the MS patch, but I'd imagine (and hope) so! Last I saw, the Linux kernel patch was still being worked on by AMD (publicly) and Linus was showing some distaste for the method used to address the issue. One comment questioned the performance cost but had received no replies... but you don't go re-working kernel memory mapping for anything less than 5-10%... just not worth it!

Seria fantástico se for verdade. Que novela...

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Evandro, o negócio é que quanto maior o hype, maiores são as criticas se o produto não vier como esperado... Já até imagino a quantidade de gente fazendo piadas e vídeos como o que o RobsonS postou aqui no tópico (que por sinal me fez dar umas risadas aqui :D). Ou seja, esse pode ser um marketing negativo para a AMD.

Sem dúvidas meu caro, mas ainda acho este nervosismo todo algo sem sentido.

A minha impressão é que esses novos processadores parecem ser, na prática, MENOS EFICIENTES que os Thuban (ou o 1100T em específico), mas o que não necessariamente quer dizer que são PIORES.

Boa !

Mas isso ainda vai ser em um caso ou outro, com grandes ganhos em outros casos, e aquela salada pro consumidor final e o leigo.

Por questão de clareza só adiciono que eles estão pagando por chip produzido (só para que nenhum lurker veja seu post e ache que essa é a prática usual na indústria).

Bem lembrado. :joia:

Se me lembro bem, um dos funcionários da AMD disse a um ou dois anos atrás que o esperado da arquitetura era que fosse em média cerca de 5% menos eficiente por clock mas que compensasse isso com clocks 25% a 30% mais altos. Mas por enquanto eles estão com dificuldade em aumentar os clocks (sem hélio líquido).

Dessa eu não lembrava, obrigado.

Alguém sabe se as versões de 6 e 4 núcleos serão os mesmos que os de 8, porém com módulos desativados?

Sim, não falaram nada de chips "x4 nativos", nem os Phenom I e II tiveram essas versões. ;)

Não, não era, a 3.0GHz o Phenom em 32nm não impressionaria ninguém...

O processo está tão ruim que eles não conseguiriam ao menos os mesmos clocks dos Phenom II ?

Pelo menos eles reduziriam o consumo e o custo teórico de fabricação, indo mais longe, poderiam fazer X8 e X12 desktops como tem pros servidores..

Já perceberam que o "único" problema é só conseguirem atingir 80% do clock planejado?

De novo.. por isso o Vishera está tão próximo, nem uma revisão ou duas vão salvar ?!

Seria fantástico se for verdade. Que novela...

Novela é isso ficar pra última hora e poder atrapalhar um pouco o lançamento, que é crucial pro sucesso do produto..

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Bom dia pepessoal, assumindo que os resultados sejam reais, o FX8 obteve resultados bem próximos de um sistema Dual Opteron Quad Core:

phenom2vsfxvsthuban.png

http://www.amdzone.com/phpbb3/viewtopic.php?f=532&t=138556&sid=a0c66b506696ed3fa88998be4c66b407&start=1600

Melhoraram bastante em SSE ein ? Bacana.

Mas seinão Ziebert, semana passada colocaram um desse no XS e era fake, ou tendencioso (o sistema Intel era bem melhor).

Link para o comentário
Compartilhar em outros sites

Para quem está atrasado e não sabe o que é o Bulldozer: http://semiaccurate.com/2011/10/10/exclusive-a-look-at-the-bulldozer-architecture/

O Charlie promete atualizar a matéria, já que supostamente existem detalhes da arquitetura sobre NDA.

EDIT: Errado, errado!

Faltou o número E a bandeirinha! :D

2 dias e uns quebrados.

:bandeira:

Link para o comentário
Compartilhar em outros sites

Postado Originalmente por r0b viewpost.gif

Alguém sabe se as versões de 6 e 4 núcleos serão os mesmos que os de 8, porém com módulos desativados?

A Gigabyte retirou a função de destravar núcleos da bios para Bulldozer da minha placa além de retirar a palavra "Bulldozer" do descritivo da bios.

http://www.gigabyte.com/products/product-page.aspx?pid=3420#bios :eek::confused::angry:

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
A Gigabyte retirou a função de destravar núcleos da bios para Bulldozer da minha placa além de retirar a palavra "Bulldozer" do descritivo da bios.

http://www.gigabyte.com/products/product-page.aspx?pid=3420#bios :eek::confused::angry:

Possivelmente receberam uma prensa da AMD por terem violado algo do NDA e por isto removeram.

Link para o comentário
Compartilhar em outros sites

A Gigabyte retirou a função de destravar núcleos da bios para Bulldozer da minha placa além de retirar a palavra "Bulldozer" do descritivo da bios.

http://www.gigabyte.com/products/product-page.aspx?pid=3420#bios :eek::confused::angry:

Isso pode ser uma questão de compatibilidade, Trabanom. Se a gente sabe que o ACC (Core Unlocker nas versões mais recentes) utiliza alguns pinos do processador para desbloquear os núcleos desativados e a arquitetura dos Bulldozer é bem diferente da dos processadores anteriores, provavelmente a manutenção dessa função na BIOS pode causar alguma instabilidade.

Link para o comentário
Compartilhar em outros sites

Para quem está atrasado e não sabe o que é o Bulldozer: http://semiaccurate.com/2011/10/10/exclusive-a-look-at-the-bulldozer-architecture/

Taí a resposta para a pergunta do Evandro (por que o processador precisa de tanto cache).

Se o previsor advinha errado, ou os dados não são puxados [para o cache] antes que a CPU precise deles, então você tem muitas coisas ruins acontecendo, a CPU fica lá por umas centenas de ciclos sem fazer nada (ou até que ela possa fazer algo)...

Lá no subtítulo "Bulldozer front end", 6º parágrafo: "If a predictor identifies the correct data, and the fetcher gets..."

Não deu para copiar o trecho, requer obtenção de licença.

Link para o comentário
Compartilhar em outros sites

Taí a resposta para a pergunta do Evandro (por que o processador precisa de tanto cache).

Lá no subtítulo "Bulldozer front end", 6º parágrafo: "If a predictor identifies the correct data, and the fetcher gets..."

Não deu para copiar o trecho, requer obtenção de licença.

"If a predictor identifies the correct data, and the fetcher gets the data before the CPU needs it, then everything works out. If the predictor guesses wrong, or the data isn’t pulled in before the CPU needs it, you can have a lot of very bad things happen, the least ugly of which is the CPU just sits there for a few hundred cycles before it can do anything. Penalties for a miss range from bad to horrific in terms of performance loss, there is a reason that modern caches are so big."

É só apertar "quit asking me" ;).

  • Curtir 2
Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Evandro, não tenho números agora, mas lembro que no lançamento do Phenom II comentaram que o Cache L3 maior deu uma boa ajuda, principalmente em jogos.

Desenterrando:

http://techreport.com/articles.x/16382/4

http://techreport.com/articles.x/16382/5

http://www.computerbase.de/artikel/prozessoren/2009/test-amd-athlon-ii-x4-620-und-athlon-ii-x3-420/29/#abschnitt_performancerating

O Spiele eu entendo que é o resultado dos jogos.

Do Propus pro Deneb até tem alguma diferença, mas entre 4 e 6 MiB nos Denebs, tem bem pouca. ;)

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
O processo está tão ruim que eles não conseguiriam ao menos os mesmos clocks dos Phenom II ?

Não, não conseguiriam, iriam bater nos 3.0GHz e chorar.

Pelo menos eles reduziriam o consumo e o custo teórico de fabricação, indo mais longe, poderiam fazer X8 e X12 desktops como tem pros servidores..

O problema do Phenom II X6 não é a performance multi-thread, é a performance single-thread, ter ainda mais multi-thread e menos single-thread não ajudaria em nada a AMD.

Mesmo com clock baixo se o Bulldozer aumentar a performance single-thread em 1% será o melhor que a AMD tem...

De novo.. por isso o Vishera está tão próximo, nem uma revisão ou duas vão salvar ?!

Talvez.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Talvez a melhor maneira de comparar seria ver o FX-6100 contra o Phenom II 1100T... ambos 6 cores e clocks semelhantes.

Djalexm, isto é o que estamos prosperando para daqui uma semana no máximo. Em dois dias acabará o NDA. Após isto, com certeza sairão testes comparativos tanto com os Sandy quanto com os Thuban.

Link para o comentário
Compartilhar em outros sites

Talvez a melhor maneira de comparar seria ver o FX-6100 contra o Phenom II 1100T... ambos 6 cores e clocks semelhantes.

Os reviewers devem fazer comparações clock por clock, mas apenas a título de curiosidade. As arquiteturas são muito diferentes, desempenho por clock não quer dizer nada.

Acho que as comparações mais relevantes são um FX-8 top (8150) contra i7 2600k e i5 2500k e um FX-8 low (8100) contra um i5 baixo (tipo o 2400), um Phenom II X6 top e um Phenom II X4 top. Por estarem na mesma faixa de preço.

A título de curiosidade também dá pra jogar o i7 980x e um i7 950 ou 860 no meio.

Acho que o pior é ainda não termos certeza de quais "leaks" estão na direção certa. Esses últimos dias de espera são os piores.

Link para o comentário
Compartilhar em outros sites

Os reviewers devem fazer comparações clock por clock, mas apenas a título de curiosidade. As arquiteturas são muito diferentes, desempenho por clock não quer dizer nada.

Acho que as comparações mais relevantes são um FX-8 top (8150) contra i7 2600k e i5 2500k e um FX-8 low (8100) contra um i5 baixo (tipo o 2400), um Phenom II X6 top e um Phenom II X4 top. Por estarem na mesma faixa de preço.

A título de curiosidade também dá pra jogar o i7 980x e um i7 950 ou 860 no meio.

Acho que o pior é ainda não termos certeza de quais "leaks" estão na direção certa. Esses últimos dias de espera são os piores.

Concordo.

Até pelo fato de um FX-6100 ter um consumo bem menor que o 1100T.

Link para o comentário
Compartilhar em outros sites

Sobre essa questão de Leaks verdadeiros ou falsos, estive reparando que nenhum site, tem comentado oficialmente esse grande número de reviews que estão rolando. Ou tem algo de errado com esses vazamentos, ou os caras não querem botar mais lenha na fogueira por respeito ao NDA (Ou DNA como alguns preferem não é mesmo Nav01 :D:aplausos:)

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Sobre essa questão de Leaks verdadeiros ou falsos, estive reparando que nenhum site, tem comentado oficialmente esse grande número de reviews que estão rolando. Ou tem algo de errado com esses vazamentos, ou os caras não querem botar mais lenha na fogueira por respeito ao NDA (Ou DNA como alguns preferem não é mesmo Nav01 :D:aplausos:)

Dá um crédito ao Nav porque o DNA dele é: Desisto de Narrar os Acontecimentos. :cool:

Estou bem esperançoso com este silêncio mórbido pensando que seja igual ao caso da Microsoft com o 7, mas meu lado racional está sentindo cheiro a distância igual ao do camarada evacuando no banheiro e espantando todos do grande AP da república que o Evandro morava. :priv:

De qualquer forma, alguém comentou há alguns posts atrás que dificilmente a AMD cometeria o mesmo erro que a Intel com os Nettburst, mas...

Link para o comentário
Compartilhar em outros sites

Sobre essa questão de Leaks verdadeiros ou falsos, estive reparando que nenhum site, tem comentado oficialmente esse grande número de reviews que estão rolando. Ou tem algo de errado com esses vazamentos, ou os caras não querem botar mais lenha na fogueira por respeito ao NDA (Ou DNA como alguns preferem não é mesmo Nav01 :D:aplausos:)

Rapaiz, como no Semiaccurate alguns disseram e o próprio Evandro disse, difícil acreditar que produziram algo pior do que o Phenom.

Mas os clocks em stock poderiam estar mais altos, o problema deve advir do processo de fabricação em 32nm. Parece que ao menos é uma arquitetura que escala muito bem em termos de frequência.

Quanto ao DNA, ô coisinha chata! Poderia ter me formado em Medicina, como alguns já me disseram, mas pensar em Biologia quando se está falando de Informática, parece que os neurônios estão meio cafusos :wacko: hehe!!!

anyione up to date on this ? My win7 and 8 were fully patched, no idea if this is included yes or no

"Actually, we already have such an issue known for Bulldozer, and NO bench-marked system has the patch installed!

The shared L1 cache is causing cross invalidations across threads so that the prefetch data is incorrect in too many cases and data must be fetched again. The fix is a "simple" memory alignment and (possible)tagging system in the kernel of Windows/Linux.

I reviewed the code for the Linux patch and was astonished by just how little I know of the Linux kernel... lol! In any event, it could easily cost 10% in terms of single threaded performance, possibly more than double that in multi-threaded loads on the same module due to the increased contention and randomness of accesses.

Not sure if ordained reviewers have been given access to the MS patch, but I'd imagine (and hope) so! Last I saw, the Linux kernel patch was still being worked on by AMD (publicly) and Linus was showing some distaste for the method used to address the issue""

And Tiborr, sorry but changing all sort of options in the bios is not done by most users, neither is setting affinity or co.. Either it works or it doesn't. Not everybody has Chews knowledge on the matter. Disabling PowerManageralready boosted multithreaded performance on my testbed...

Leeghoofd é membro do XS e possui um exemplar do Bulldozer em mãos. Ele está sob contrato de NDA.

O Bulldozer possui 02 caches L1, um individual, para cada núcleo, e outro compartilhado no módulo. Ao que tudo indica, uma falha grave está invalidando os dados no cache L1 a nível de módulo (compartilhamento de dados entre os 02 núcleos), fazendo com que o previsor (prefetcher) busque novamente os dados na maioria dos casos. Enquanto isso, os núcleos do processador ficam gastando ciclos de processamento inutilmente, sem fazer nada, apenas esperando mais dados.

O patch do Linux trouxe uma melhora em single-threading correspondente a 10% (ou mais) e possivelmente mais do que o dobro em MT no mesmo módulo. Foi lançado um patch para o Windows e é provável que no patch da MS esteja incluída a devida correção.

Link: http://www.xtremesystems.org/forums/showthread.php?265710-AMD-Zambezi-news-info-fans-!&p=4969482&viewfull=1#post4969482

Link para o comentário
Compartilhar em outros sites

Visitante
Este tópico está impedido de receber novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...

 

GRÁTIS: ebook Redes Wi-Fi – 2ª Edição

EBOOK GRÁTIS!

CLIQUE AQUI E BAIXE AGORA MESMO!