Ir ao conteúdo
  • Cadastre-se

AMD Bulldozer / Bobcat / Zambezi - Plataformas.


Posts recomendados

Embora o Bulldozer não se tenha saído bem em single-thread o FX-8150 só perde para o X6-1100T em 4% no referido quesito, segundo o HT4U.net (link daquele teste intensivo).

Já em MT o FX-8150 bateu o X6-1100T em 16%.

Em jogos vai depender das configurações de vídeo, estando 3% abaixo do X6-1100T no HT4U.net. No Tom's Hardware ficou no nível do X4-980 (3,7GHz), já em configurações de alta qualidade chega a ultrapassar o i7-2600K em alguns cenários.

No geral exceto jogos (índice medido pelo HT4U.net), o índice foi 11% superior ao X6 1100T.

Já no geral incluindo os jogos, o índice do FX-8150 foi 8% superior ao 1100T, mas aí entra a questão da configuração dos jogos. Além do mais é péssimo jogar em baixa resolução, sem filtro anti-serrilhado (AA) e anti-embassamento (AF) e isso é pouco representativo do mundo real.

Quanto aos FX-4100 e FX-6100, pra mim são péssimos produtos. O FX-4170 não está saindo nos reviews e isto é porque certamente não foi lançado ainda (embora o VIX disse que já tenha saído do forno). Creio que a AMD já poderia tê-lo lançado e não o fez ainda porque não quis. O FX-6100 é um produto horroroso com clock de apenas 3,3GHz e também foi outro que apanhou bastante nos reviews. Se contasse pelo menos com o turbo já daria alguma coisa, mas infelizmente o turbo não funciona direito no agendador do Windows 7.

Refresque minha memória. O 4170 e 6100, no papel, eram pra concorrer com o que? I3 5XX e I5 2xxx, respectivamente? Porque se for, prevejo que quando saírem testes detalhados desses, ou vão tomar um pau muito brabo, ou vão ficar no mesmo nivel(muito, muito improvável)

Link para o comentário
Compartilhar em outros sites

Bulldozer tem cara de que algo não saiu com planejado, alguma coisa não funcionou como esperado mas que não deu tempo arrumar, do contrário não teriamos Piledriver e Steamroller. Acho que tem alguma cois estranha no Bulldozer que ainda não foi revelado.

Ele por si só não faria o estardalhaço a ponto de muito acharem que a Intel teve medo e no fim, saiu esse fiasco.

Link para o comentário
Compartilhar em outros sites

na melhor das hipóteses infiniband da vida. Cluster de "pobre". Mas é uma prova interessante de conceito.

Já pensaram se desse pra fazer que nem nos blue-gene, com a infiniband dentro do processador? quer dizer, de repente até podemos, com a ideia do pci-e de suportar cabos pra competir com o thunderbolt e usb3... Nossa, se isso realizasse o mercado de clusters ferveria!

Link para o comentário
Compartilhar em outros sites

Bulldozer tem cara de que algo não saiu com planejado, alguma coisa não funcionou como esperado mas que não deu tempo arrumar, do contrário não teriamos Piledriver e Steamroller. Acho que tem alguma cois estranha no Bulldozer que ainda não foi revelado.

Ele por si só não faria o estardalhaço a ponto de muito acharem que a Intel teve medo e no fim, saiu esse fiasco.

O BDZ foi feito com ferramentas de automação, ou seja, programas que criam o que é pedido e não na unha como a Intel faz. O resultado é isso ai. Na F1, o carro da Spanã foi feito assim. O resultado: pior carro da categoria.

Link para o comentário
Compartilhar em outros sites

o que, esses patches de agendadores e turbos? acho difícil, eles tem mais a ver com a geometria esquisita dos módulos.

o que me preocupa é que nunca vai haver suporte a isso nos compiladores da intel.

O agendador que distribui as threads entre os núcleos. No Bulldozer um núcleo ocioso consome 1400MHz, enquanto que no Thuban 800MHz, quase a metade. Só que o Bulldozer tem a capacidade de desligar módulos completamente, sendo que para isso o agendador não poderá atribuir tarefas a nenhum núcleo de um determinado módulo. Mesmo que apenas 01 núcleo de um determinado módulo esteja sendo usado pelo SO, o outro núcleo vai estar rodando a 1400MHz, além da FPU, do front-end e do cache L2. Imagine a economia de energia que adviria com o desligamento de um módulo! Quanto mais energia consumida, maior a dissipação térmica e o alcance do limite do TDP.

Quanto mais módulos desligados maiores são os ganhos com OC. Da mesma forma em um Thuban ou qualquer outro processador multi-core, quanto mais núcleos desativarmos maiores são os ganhos com OC. O turbo é uma espécie de OC, só que feita de forma automática, limitada no Bulldozer pelo TDP.

Suponhamos que o FX-8150 consuma uns 110W usando os 08 núcleos, sem o turbo e que com o turbo para 3,9GHz tope rapidamente nos 125W. No caso o turbo é desligado e volta a ligar, ficando nesse ciclo oscilativo por conta do limite estabelecido pelo TDP. Com 02 módulos desligados, o consumo de energia seria consideravelmente menor, havendo maior espaço térmico para o turbo. Isso já foi explicado pelo Tom's Hardware.

Turbo Core isn’t limited to just a base and some arbitrarily higher frequency, either. It’s actually implemented in three p-states: the base (referred to as P2), an intermediate state (P1), and a higher state (P0). That’s an improvement over the first-gen version of Turbo Core, which AMD says only switched between two p-states. And it’s significant, too, because you can enter P1 with all eight cores active, so long as the headroom is there. Stepping up to P0 requires at least two of four modules to idle. AMD does allow the chip’s TDP to be exceeded instantaneously, but of course it can’t hold that for any thermally significant amount of time.

Fonte: Tom's Hardware

O TDP é excedido instantaneamente, porém isso não pode ser mantido termicamente por qualquer significante espaço de tempo.

Concorda que esses 11% são muito pouca coisa ?

Perfeitamente. 11% são muito pouco ante a concorrência.

E concorda que o ganho só foi bruto quando há aproveitamento de novos conjuntos de instruções, o que acontece em poucos casos ?

O Bulldozer tem 04 novos conjuntos de instruções (no escopo da AMD): AVX, AES, FMA e XOP.

Desses 04 conjuntos de instruções, 02 são novos na arquitetura x86: FMA e XOP. Os demais conjuntos de instruções já são usados pelos Sandy.

O que estou querendo dizer? Os compiladores não estão otimizados para FMA4 e XOP. Talvez a Intel já tenha implementado FMA no seu compilador, porém na forma FMA3, não FMA4, já preparando terreno para os Ivy.

Você se recorda daqueles caras que estavam batendo papo sobre o desempenho do Bulldozer no AVX e que foi especulado lá no XS? O cara que estava fazendo o profile do Bulldozer disse que havia algo estranho no desempenho do Bulldozer no uso do AVX. O AVX no BDZ é muito lento e quando há instruções AVX256 a serem executadas enquanto uma FMAC está ocupada, ocorre uma penalidade, pois a outra FMAC ficará ociosa até que a instrução seja executada na FMAC ocupada. Isso já foi comentado no LostCircuits, conforme trecho abaixo:

Without AVX, the FX-8150 is almost as fast as the 2600K, which is a higly respectable achievement but just as SB gains from enabling AVX, the FX-8150 takes a performance hit. There are folks who have better understanding of what is happening there, however, aside from contention of two threads vying for the same ganged FMACs, there are also potential alignment issues, for example if a 128-bit FP instruction is queued up in between the 256-bit AVX instructions, the result will be a performance penalty since one of the FMACs will sit idle for that particlar cycle.

Isso para explicar quedas de performance ao usar AVX, conforme os seguintes gráficos:

avx1.jpg

avx2.jpg

avx3.jpg

sancrypt.jpg

Neste último caso, o primeiro bench mostra uma incrível queda de desempenho ao usar SHA256 iSSE/AVX que o desempenho cai em cerca de 64%, conforme comentado lá no artigo:

Very similar to Kribi, enabling AVX results in a severe performance hit on the Zambezi processor while speeding up Sandy Bridge. In the case of SHA256 iSSE/AVX the performance drops by an incredible 64% when AVX is enabled.

Fonte: LostCircuits

Portanto a minha conclusão é que no momento não podemos contar com os novos conjuntos de instruções implementados no Bulldozer.

E ainda, concorda que o preço escolhido foi péssimo ?

Depende... Se você observar que em certos fóruns como o XS (há outro que não me lembro o nome) onde há usuários que estão aguardando a chegada de um BDZ pré-ordenado, dá para perceber que a GlobalFoundries não está dando conta da demanda, doutra sorte as pessoas estariam comprando BDZ em estoque.

O preço está salgado sim, mas enquanto a demanda estiver sendo superior à oferta não vejo porque baixarem os preços. No momento compensa para entusiastas de overclock sub-zero e endinheirados fanboys. Já para um consumidor que ganha seu dinheiro suado não adianta nem sonhar com o FX-8150. Há o FX-8120 que tem conseguido o mesmo nível de over quando refrigerado a ar, porém especula-se que ele não se saia muito bem no sub-zero.

Link para o comentário
Compartilhar em outros sites

Nav01, só estou passando para postar o resultado da consulta de flags do processador Bobcat C-50 do meu notebook. Outro dia você disse que a AMD ainda não tinha implementado as instruções ssse3 em seus processadores, mas parece que esse aqui tem suporte, sim:

cat /proc/cpuinfo | grep -i ssse3

flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm constant_tsc rep_good nopl nonstop_tsc extd_apicid aperfmperf pni monitor ssse3 cx16 popcnt lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch ibs skinit wdt arat npt lbrv svm_lock nrip_save pausefilter

Legal! Eu não sabia que o Bobcat (e provavelmente o Llano também) já possuíam essas instruções. O Phenom II (mesmo o X6) não possui SSSE3, embora tenha o SSE3.

Link para o comentário
Compartilhar em outros sites

O BDZ foi feito com ferramentas de automação, ou seja, programas que criam o que é pedido e não na unha como a Intel faz. O resultado é isso ai. Na F1, o carro da Spanã foi feito assim. O resultado: pior carro da categoria.

acredito que isso seja lenda.

O die é menor que o thuban, com praticamente o dobro de transistores.

O que "matou" o BDZ é o clock, que era pra ser 30% maior, e assim superior em todos os sentidos, inclusive ao 2600K, mas não deu...

Link para o comentário
Compartilhar em outros sites

@Evandro, alguma ideia do tipo de interconexão usada nesse cluster de APUs? Pois o Llano não tem Hyper Transport... Parece que são 104 máquinas individuais...

A resposta é Infiniband

Legal! Eu não sabia que o Bobcat (e provavelmente o Llano também) já possuíam essas instruções. O Phenom II (mesmo o X6) não possui SSSE3, embora tenha o SSE3.

E eu já tenho essa instrução configurada no compilador do Linux. Nem sei para que serve, mas está lá! :D

Link para o comentário
Compartilhar em outros sites

cat /proc/cpuinfo | grep -i ssse3

flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm constant_tsc rep_good nopl nonstop_tsc extd_apicid aperfmperf pni monitor ssse3 cx16 popcnt lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch ibs skinit wdt arat npt lbrv svm_lock nrip_save pausefilter

O Atlhon II também tem o SSE3 (com dois SS). Não sei quais outros processadores tem essas instruções, embora suponha que todo AMD pós Atlhon 64 venha com eles.

Acho que, com exceção das instruções 3DNow! e 3DNowExt!, todos os processadores mais novos incluem instruções sem deixar de suportar as que foram incluídas em processadores mais antigos. Entretanto, prestando atenção na lista de flags do Bobcat, não há na lista as instruções sse3 mas há as instruções sse4a... mistééééério!:wacko:

Link para o comentário
Compartilhar em outros sites

Nav, eu quis dizer que não vejo os patches pro bdz favorecendo a intel de alguma maneira neste caso.

Ah sim, realmente entendi errado. Trata-se de uma resposta ao Eriberto. Os patches para o Bulldozer são exclusivos para ele mesmo.

Só que também há um rumor de que o Windows 8 necessitará de menos recursos computacionais, o que beneficiaria todos os sistemas. Mas neste último caso não se trata de patches.

While AMD demonstrates the advantages of its own eight-core microprocessor in the Windows 8 environment, but does not indicate whether other CPUs also benefit from the next-gen OS. It is widely believed that Microsoft's operating system due next year needs less compute resources than existing OS and will therefore work better on all systems.

Fonte: Xbit Labs

Link para o comentário
Compartilhar em outros sites

O Atlhon II também tem o SSE3 (com dois SS). Não sei quais outros processadores tem essas instruções, embora suponha que todo AMD pós Atlhon 64 venha com eles.

Tem SSE3, mas não tem SSSE3. Pelo menos não os modelos de 45nm baseados no Phenom. Já esses novos baseados em Llano não sei. De acordo com o colega acima o Bobcat já tem, então acho que o Llano também deva ter. ;)

Obs.: O Core2Duo já possui essas instruções desde seus primeiros modelos de 65nm, que datam de 2006.

Acho que, com exceção das instruções 3DNow! e 3DNowExt!, todos os processadores mais novos incluem instruções sem deixar de suportar as que foram incluídas em processadores mais antigos. Entretanto, prestando atenção na lista de flags do Bobcat, não há na lista as instruções sse3 mas há as instruções sse4a... mistééééério!:wacko:

SSE4.a até os Phenom B2 já possuíam. ;)

Link para o comentário
Compartilhar em outros sites

Uma coisa: a M$ NUNCA soube o que era escrever alguma coisa leve... Então, no máximo eu engoliria que eles vão fazer algo mais leve que o que eles tem agora, mas definitivamente qualquer outro conseguirá bater eles (se não apanhar dentro da própria empresa!!).

Agora, tava lendo a reportagem do Semiaccurate sobre as demissões. Ok, tem gente que não gosta do Charlie, mas é exatametne por isso que é importante: O Charlie puxa o saco da amd até cansar, e tá muito preocupado, e com razão. É o tipo de informação que se olha: quando teu aliado te critica, ou quando teu adversário te elogia, tu levanta as orelhas e presta atenção.

http://semiaccurate.com/2011/11/03/amd-cuts-10-of-workforce-leaves-one-group-untouched/

"the list of ‘optimized’ employees is going to hurt. Carrell Killebrew, the man credited with Eyefinity, probably the largest advantage AMD has in the graphics market right now"

Perda irreparável! Se alguém tiver o link de quando isso foi lançado e eles contaram a história do cara coordenando tudo e mantendo isso em segredo absoluto até praticamente depois do lançamento, pegando todo mundo de surpresa num mundo onde todo mundo fala demais, vai entender o porque. Esse cara era fundamental nem que fosse pela capacidade de criar em sigilo!!

"With all of the optimizations flying around, you have to wonder about one group that has been totally untouched by this round, the board."

Não bastasse, esse clássico bando de inúteis que não sabe ***** nenhuma continua intacto. Realmente, me preocupo se a AMD não está se "VIAficando", como disse alguém num comentário nas notícias... :(

Link para o comentário
Compartilhar em outros sites

http://www.rage3d.com/reviews/cpu/amd_fx_8150/index.php?p=10

So how does it compare to the competition? We've got a healthy bump in performance, matching Sandy Bridge in a lot of ways, a real win some/lose some. Intel wins the integer heavy race, AMD wins the 128-bit floating point but not the 256-bit fight; not much change there, except how much AMD has gained on Intel on the integer side.

Eu não sei como o Rage3D chegou à essa conclusão nesse review, mas o ponto de vista deles é parecido com o meu quanto ao desempenho do Bulldozer em inteiros, ponto flutuante 128 bits e ponto flutuante 256 bits. Para mim o Bulldozer ganha em ponto flutuante 128 bits dos Phenom, mas não dos Sandy.

À exceção do AES 256 bits, todos os demais cenários do Bulldozer no uso de instruções de 256 bits se mostram fracos, certamente devido à impossibilidade de executar 02 threads em um mesmo módulo simultaneamente. Para executar uma instrução de 256 bits o Bulldozer precisa ocupar ambas as unidades de execução FMAC de 128 bits, podendo causar penalidade de latência de ciclos no outro thread do mesmo módulo se o mesmo também requisitar dados da FPU. Para consertar isso o correto é que o Bulldozer utilize instruções de 128 bits em vez de 256 bits.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP

Chegaram os FailX aqui no Peru. O preço do FX-4100 está pouco mais caro que um Phenon II X4 965, e acho que mesmo assim, não vale a compra, ou valeria?

Trago mais notícias do mundo verde.

Da mais antiga para a mais nova:

O novo recorde do BDZ (já foi comentada, mas vale lembrar que a diferença do primeiro recorde, esse foi feito individualmente, o primeiro foi feito pela equipe da AMD).

http://www.chw.net/2011/10/rompen-record-de-overclock-de-bulldozer-8461-51-mhz/

Novos (velhos), processadores reciclados FM1, agora teremos Sempron, Atlhon sem gpu integrada.

http://www.chw.net/2011/11/se-vienen-nuevos-sempron-x2-athlon-ii-x2-y-x4-basados-en-llano/

Mais um review do trator no Linux, e sinceramente, acho que estão tentando tirar leite de pedra ou justificar um incompreendido. Fico com a segunda :devil:

http://www.chw.net/2011/11/amd-fx-8150-review-en-linux-parte-3/

Essa, o mercado de ações deve ter adorado, downsizing e resizing. 11% dos trabalhadores da AMD foram para a rua. Até vice presidente rodou.

http://www.chw.net/2011/11/amd-despide-al-11-de-sus-trabajadores/

E para finalizar, um comparativo de 3 placas 990FX, já adianto que quem tem uma Asus Cross Formula V deve ficar bastante feliz ;)

http://www.chw.net/2011/11/bulldozer-probado-con-tarjetas-madre-990fx-de-asus-gigabyte-y-msi/

E com essa findo meu pacote de notícias e vou trabalhar.

Abraços para quem fica :)

Link para o comentário
Compartilhar em outros sites

  • Membro VIP

O ziebert postou isso lá no doompc, epasso pra cá:

http://www.xtremesystems.org/forums/showthread.php?275867-AMD-Bulldozer-Thread&p=4984046&viewfull=1#post4984046

Comparativo de vários processadores a 2 GHz e "com 1 núcleo"..

Assim como do i5 2500, 1100T e 8150 a 3.3 GHz, aprece-me que "completos".

Link para o comentário
Compartilhar em outros sites

pelo jeito o gargalo de CPU só houve no StarCraft 2, que é um jogo de estratégia, dar pra ser ter uma ideia pelo desempenho do Bulldozer no Fritz Chess Benchmark.

Link para o comentário
Compartilhar em outros sites

Visitante
Este tópico está impedido de receber novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...

 

GRÁTIS: ebook Redes Wi-Fi – 2ª Edição

EBOOK GRÁTIS!

CLIQUE AQUI E BAIXE AGORA MESMO!