Ir ao conteúdo
  • Cadastre-se

AMD Bulldozer / Bobcat / Zambezi - Plataformas.


Posts recomendados

o FX 8150 não tem 25% a mais de núcleos propriamente ditos.

Jonny' date=' o que o Gun'ss quis dizer é que, embora o FX-8150 conte com 08 ALUs, ele conta somente com 04 FPUs e que, a medida que um software puxa mais da FPU, a escalabilidade desse software vai se aproximando mais de 04 threads, não de 08. Teríamos que conhecer bem os programas para saber o porquê de a escalabilidade estar tendendo a 04 ou a 08.

Por exemplo, o Cinebench escalando a 6,72 vezes o ST pode estar puxando muito da ALU, mas de 6,72 para 8,00 tem algum chão e parte desse chão pode advir da FPU. O Phenom X6 conta com [b']06 FPUs, logo seriam 04 FPUs do FX-8xxx contra 06 FPUs do Phenom.

Porém segundo alguns benchs (não sei se FAKES - cautela antes do lançamento), a ALU que é fraca e a FPU apresenta desempenho bem superior ao do SB i7-2600K. O que deve estar pegando em single-thread é a ALU.

EDIT:

Estava aqui pensando com os meus botões..., até parece que os comentários do Gun'ss e do Jonny vieram como uma luva.

Para comparar o desempenho em single-thread do Bulldozer em relação ao Phenom só se comparando por meio de programas sintéticos dedicados a extrair o desempenho da ALU e da FPU de forma independente, doutra sorte como faríamos para proceder com a fórmula: 4x + 8y = p?:confused: Suponhamos que p = (BDZ FX-8xxx). x e y podem assumir quaisquer valores, vai depender do software a ser utilizado (não se sabe a proporção de uso da ALU e da FPU a ser requerida).

Link para o comentário
Compartilhar em outros sites

Nav, SuperPi não usa só FPU?

Não serviria? Minha memória fraca diz que já faz tempo, mas sairam benchs do SuperPi e o BDZ não estava bem assim.

Agora, se SuperPi realmente usa só FPU, se esses benchs existiram, se realmente o BDZ perdeu, se a revisão era a B2 ou B2G...

São coisas que EU NÃO SEI! :seila:

Link para o comentário
Compartilhar em outros sites

Nav, SuperPi não usa só FPU?

Não serviria? Minha memória fraca diz que já faz tempo, mas sairam benchs do SuperPi e o BDZ não estava bem assim.

Agora, se SuperPi realmente usa só FPU, se esses benchs existiram, se realmente o BDZ perdeu, se a revisão era a B2 ou B2G...

São coisas que EU NÃO SEI! :seila:

A revisão era B1 e mesmo assim SuperPi é muito arcaico. Calcular o Pi em milhões de casas é muito surreal.

Segue aqui o teste de benchmark ao qual eu havia me referido (entenda "This computer" como "i7 2600K, clock padrão"):

4f528cdd-6a5b-4f05-8f48-f9709dd9c627.jpg

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
A revisão era B1 e mesmo assim SuperPi é muito arcaico. Calcular o Pi em milhões de casas é muito surreal.

Segue aqui o teste de benchmark ao qual eu havia me referido (entenda "This computer" como "i7 2600K, clock padrão"):

4f528cdd-6a5b-4f05-8f48-f9709dd9c627.jpg

Se você pegou isso do xtremesystems, atente pros sistemas que tem algumas diferenças entre as configurações, o i7 tem 4 vezes mais memória..

Link para o comentário
Compartilhar em outros sites

  • Membro VIP

OBS: Baseado nos meus cálculos, o índice de desempenho do E-350 do Diego Paladin foi 77%, não 81% em relação ao Phenom 1090T.

Erro meu, refiz a conta e é realmente 77%.

Pelo que saiu por aí em testes envolvendo programas sintéticos de benchmark, o FX-8150 ganha do i7 2600K no CPU Mark nos seguintes cenários: "CPU - Floating Point Math", "CPU - Find Prime Numbers", "CPU Compression", "CPU Encryption", "CPU - Physics" e "CPU - String Sorting", então não é impossível de se prever que o FX tenha um desempenho superior em alguns programas do mundo real.

Depende do algorítimo e instruções usadas mas os que eu marquei em vermelho tradicionalmente usam inteiros.

O primeiro não da para saber;

O segundo com certeza só usa inteiros;

O terceiro depende, se for AES ele talvez use as instruções de aceleração, como o Tuban foi mais rápido duvido que use, se não for AES não tem aceleração, ai é só inteiros.

E por fim o quarto depende, tradicionalmente é feito com inteiros, mas pode usar as (raramente usadas) instruções de manipulação de strings com prefixo REP, as novas instruções de strings SSE4.2 ou SSE2 mesmo.

Tirando a criptografia (que por sinal, o Tuban foi mais rápido) todas as outras dependem muito da unidade de load store que era a principal deficiência do Tuban, se reais esses testes indicam que elas melhoraram muito.

A criptografia é só um teste para ver quem tem mais ALUs, com três por núcleo e 6 núcleos o Tuban deixa os outros pra trás, normal.

Por outro lado, os supostos testes realizados mostram o FX-8150 com ALU muito fraca (ou então algum bug) em cálculos envolvendo inteiros. Em strings o resultado foi satisfatório, mas nos cálculos envolvendo inteiros o resultado foi desastroso.

Depende, como é o calculo?

Eu penso que o Cinebench usa muita ALU, pois se considerarmos que aquele teste seja verdadeiro, a taxa MT de 6,72 em relação a ST dá a entender isso.

Fiz um profile rápido no Cinebench R11.5, muito parecido com o Cinebench 9...

Em um Phenom faz em média mais ou menos 1,3 instruções por ciclo (de no máximo 3) e 40% dessas instruções vão para a FPU, mas são instruções escalares, não vetoriais.

Os números são baixos, isso não é suficente para saturar nem a unidade de inteiros e nem de ponto flutuante e nem decodificadores do K-10, nem do Bulldozer e nem do Sandy Bridge, saber porque o Sandy Bridge não ganha quase nada com o HT e Bulldozer ganha muito com o segundo núcleo do módulo não é tarefa fácil... Provavelmente são fatores diferentes, e mais de um fator em cada caso.

Nav, SuperPi não usa só FPU?

Nenhum programa usa só FPU, o SuperPi usa bastante, que eu me lembre mais de 50% das instruões vão para a FPU, não da para ter certeza que p que deixa os processadores da Intel tão rápidos é a FPU.

De qualquer jeito é um programa antigo, mal feito e ultrapassado e que nem para calcular milhões de casas decimais de Pi ele serve, programas mais novos fazem o mesmo trabalho em 1/10 do tempo, menos ainda quando usam todos os núcleos do processador...

  • Curtir 1
Link para o comentário
Compartilhar em outros sites

Sim, Oliverda estava explicando ao xdan que o Bulldozer deve ser considerado um octacore (não um quad-core), pois em teste envolvendo ST e 8 Threads o BDZ conseguiu desempenhar uma performance MT superior a 4x (6,72x). Daí o OC manual para 4,2GHz (para equiparar os clocks).

Rumores de que o reparo de alguns bugs no BDZ (novo stepping, B2.G???) e na BIOS (por conta do AGESA) trouxeram um incremento de IPC na ordem de -5% a 17,5% em relação ao Thuban:

http://semiaccurate.com/forums/showpost.php?p=136383&postcount=2205

Todavia ainda persistem algumas falhas no cache L3, segundo o rumor.

Pelo que eu entendi do intervalo de incremento de IPC em relação ao Thuban, podem ocorrer cenários onde o IPC do BDZ é mais fraco que o do Thuban em 5%. Observe que o intervalo citado no comentário começa com um número negativo (-5%).

O intervalo começa negativo em 5%, mas o lado positivo é maior, o que garante uma chance grande de haver incremento sobre o IPC do Thuban. A média fica em 6,25% a mais.

Link para o comentário
Compartilhar em outros sites

vamos lá....

OBR supostamente B2, não me culpem pela credibilidade, não sou fã desse cara.

update.png

Escalabilidade no Cinebench R11

scaling.png

Thuban vs Bulldozer

x264

http://3.bp.blogspot.com/-MyJVKb1AgJA/TnuhpuQHIBI/AAAAAAAABGo/vvm9gGAyhvE/s1600/obr14.png

wPrime 2,4

http://3.bp.blogspot.com/-g8yVYocypT4/TnuhsDvdvYI/AAAAAAAABGw/-kgUPGhzhT4/s1600/obr15.png

No espeço entre () geralmente o aplicativo descrimina o clock do processador....

Link para o comentário
Compartilhar em outros sites

vamos lá....

OBR supostamente B2, não me culpem pela credibilidade, não sou fã desse cara.

update.png

Escalabilidade no Cinebench R11

scaling.png

Thuban vs Bulldozer

x264

http://3.bp.blogspot.com/-MyJVKb1AgJA/TnuhpuQHIBI/AAAAAAAABGo/vvm9gGAyhvE/s1600/obr14.png

wPrime 2,4

http://3.bp.blogspot.com/-g8yVYocypT4/TnuhsDvdvYI/AAAAAAAABGw/-kgUPGhzhT4/s1600/obr15.png

No espeço entre () geralmente o aplicativo descrimina o clock do processador....

Tudo bem que não se trata da revisão b2.G, mas o resultado soa muito estranho (a não ser que houve uma enorme diferença entre b2 e b2.G).

Tanto naqueles slides como na screenshot do Xtreme Systems mostra o Bulldozer bem superior nos números primos, inclusive em relação ao Sandy i7 2600K. Já nestes resultados aparece o Bulldozer apanhando de um Phenom nos números primos, mesmo em MT!:eek::eek::eek:

E partindo do OBR...:eek::eek::eek:

Link para o comentário
Compartilhar em outros sites

Duvido que lancem um processador mais fraco que os phenom II, como da a parecer nesse slide feito no quintal dos fundos de uma birósca... Mais clock, melhor litografia, mais instruções... Seria a falha do século. Nem o phenom superaria.

PS: Claro que é uma regressiva! Faltam 10 dias... Vai sair de tudo agora! Deve rolar uma grana preta por traz, só imagino...

Link para o comentário
Compartilhar em outros sites

Duvido que lancem um processador mais fraco que os phenom II, como da a parecer nesse slide feito no quintal dos fundos de uma birósca... Mais clock, melhor litografia, mais instruções... Seria a falha do século. Nem o phenom superaria.

PS: Claro que é uma regressiva! Faltam 10 dias... Vai sair de tudo agora! Deve rolar uma grana preta por traz, só imagino...

Realmente não faz sentido algum lançar algo pior que os produtos atuais. Se fosse para ser assim seria melhor continuar com os produtos atuais ou então melhorá-los (eu ainda acho que se a AMD tivesse lançado um Phenom III com 32nm, instruções SSE 4.1 e 4.2, cache L2 de 1MB por núcleo, cache L3 de 8MB ou 9MB, clocks mais altos, turbo mais agressivo e com seis núcleos mesmo, tudo isso em 2010, daria um fôlego legal para lançar algo muito bem lançado em 2012, mas é claro que esse ano não teria sentido um produto desse frente a Sandy). Prefiro acreditar que o Bulldozer virá no mínimo mais forte que os Phenom II X6 atuais.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Se fosse para ser assim seria melhor continuar com os produtos atuais ou então melhorá-los (eu ainda acho que se a AMD tivesse lançado um Phenom III com 32nm, instruções SSE 4.1 e 4.2, cache L2 de 1MB por núcleo, cache L3 de 8MB ou 9MB, clocks mais altos, turbo mais agressivo e com seis núcleos mesmo, tudo isso em 2010,

Exceto que a AMD não conseguiria clocks mais altos em 32nm... Ainda mais em 2010.

Há dois itens muito importantes para um bom processador:

1) Um bom projeto.

2) Um bom processo da fabricação.

O 1 ainda é uma incógnita, mas o 2 está sendo uma verdadeira pedra no sapato da AMD...

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Realmente não faz sentido algum lançar algo pior que os produtos atuais. Se fosse para ser assim seria melhor continuar com os produtos atuais ou então melhorá-los (eu ainda acho que se a AMD tivesse lançado um Phenom III com 32nm, instruções SSE 4.1 e 4.2, cache L2 de 1MB por núcleo, cache L3 de 8MB ou 9MB, clocks mais altos, turbo mais agressivo e com seis núcleos mesmo, tudo isso em 2010, daria um fôlego legal para lançar algo muito bem lançado em 2012, mas é claro que esse ano não teria sentido um produto desse frente a Sandy). Prefiro acreditar que o Bulldozer virá no mínimo mais forte que os Phenom II X6 atuais.

Com clocks maiores e "mais núcleos" é de se esperar que ele seja mais rápido. ;)

E colocar instruções não é tão simples, pelo pouco que sei eu acho que não daria pra fazerem isso sem ter que refazer uma parte do bixo, então, refizeram mais coisas.

Link para o comentário
Compartilhar em outros sites

Bom... Só foi uma ideia. E eu deixei bem claro que isso seria bom se fosse ano passado. Esse ano não faz sentido sair um novo Phenom. De qualquer forma, mesmo sem as instruções, se a AMD conseguisse utilizar o processo de 32nm e fazer um Phenom nele com certeza alcançaria clocks maiores e daria para pôr mais cache. Isso iria com certeza aumentar o desempenho, bom para concorrer com o Nehalem e para pelo menos chegar perto da Sandy. Mas de qualquer forma o que eu quero dizer com tudo isso é que no mínimo o Bulldozer será melhor (nem que seja pouca coisa) que os Phenom, mesmo os X6, senão será um dos maiores fiascos da empresa. Eu duvido que ela lance algo pior.

Link para o comentário
Compartilhar em outros sites

Exceto que a AMD não conseguiria clocks mais altos em 32nm... Ainda mais em 2010.

Há dois itens muito importantes para um bom processador:

1) Um bom projeto.

2) Um bom processo da fabricação.

O 1 ainda é uma incógnita, mas o 2 está sendo uma verdadeira pedra no sapato da AMD...

"Fala sério..." Tudo bem que o rendimento ainda não está aquela coisa - isso se resolve, e sempre se resolveu -, mas colocar um Phenom II @ quase 3.0ghz com uma radeon de 400Sps era difícil de acreditar, principalmente com TDP de ~100W e levando em conta o tamanho do chip. O processo não é ruim não.

Tudo isso foi possível com os 32nm GF, né?

Então? Agora tem até uns meses de 32nm no mercado já, para aprimorar o processo. Não acho que será como os 65nm que PERDIAM para o - ótimo - 90nm do passado recente, ocorrido com os X2 90nm Windsor ; X2 brisbane - que foi uma perda de tempo, pois tinha X2 6000+ windsor com 95W F2 - e Phenom... Nesse caso, o processo novo só reduziu custos, pois os 6000+ windsor 95W subiam mais que os brisbane G2 65nm e tinham o mesmo TDP... Pena que nunca achei um desses pra por as garras... Depois veio os phenom... não preciso comentar...

Bem... Só de recordar isso, já me faz pensar que o Llano é uma prova que os 32nm não são o novo 65nm... Não tem desculpa... Tem que sair cachorro desse mato... Pelo menos capaz de dar umas mordidas no 2600/2700K... E nem adianta fazer propaganda com 8 rottweilers contra 4 poodles, pois só vai recordar o fracasso do phenom...

Link para o comentário
Compartilhar em outros sites

Não sei se já levantaram isso por aqui:

Originally Posted by Ironlynx

A friend working at a MOBO company told me Bulldozer went from -5% to 17.5% increase in IPC over Thuban with new stepping+ new AGESA, but there is still some L3 issues.There is any truth in that?

http://semiaccurate.com/forums/showpost.php?p=136384&postcount=2206

Backup:

Quote:

You don't trust your friend?

He is not all that close.But he made some reliable hints in the past:

I was expecting a july-august BD lunch, and he told me "dont expecting anything till october".When some benchs are posted showing L2-L3 writes, he told me: forget it!Its a crippled ES sample,a bug or a fake.

And he told me the core frequency(3.6) of 8150 before was made official.

So, he looks reliable... TRUST but VERIFY.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
"Fala sério..." Tudo bem que o rendimento ainda não está aquela coisa - isso se resolve, e sempre se resolveu -, mas colocar um Phenom II @ quase 3.0ghz com uma radeon de 400Sps era difícil de acreditar, principalmente com TDP de ~100W e levando em conta o tamanho do chip. O processo não é ruim não.

Tudo isso foi possível com os 32nm GF, né?

Dragum, se o processo estivesse bom, o Yield do Llano não estaria na casa dos 50-60% e eles teriam conseguido clocks maiores nos Bulldozers.

Em partes é problema do chip já que o boato do dia fala que a AMD só vai conseguir suprir a demanda deste segmento quando trocar os chips:

http://www.digitimes.com/news/a20111003PD212.html

Link para o comentário
Compartilhar em outros sites

Sinceramente, aqueles slides e a screenshot que eu passei na página anterior parecem muito mais legítimos do que essas tabelas feitas em excel pelo famoso OBR (a fama dele não é só neste fórum não). Ademais, como o próprio Jonny falou, geralmente o wPrime mostra a frequência em que o processador está operando entre parênteses e os parênteses lá estão vagos.

Sei que um Phenom II X6 alcançaria maiores clocks em 32nm, mas convenhamos, não acredito que o simples fato de aumentar a frequência e aumentar o cache resultaria quase no desempenho de um i7 2600K. Deve ter um tanto da arquitetura nisso.

9.....! :D

Na contagem....

Vamo que vamo!:D

Dragum, se o processo estivesse bom, o Yield do Llano não estaria na casa dos 50-60% e eles teriam conseguido clocks maiores nos Bulldozers.

Sim, mas o que tem a ver os clocks com o IPC? Se os resultados que apareceram recentemente se confirmarem, o FX-8150 terá desempenho próximo ao i7 2600K.

Agora o que se está discutindo é o IPC apontado pelo OBR. Será que com um IPC bem inferior ao Phenom, como ele mostrou, o Bulldozer chegaria próximo ao i7 2600K?

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Se Thuban tivesse o Turbo do FX, a vantagem da Sandy seria bem estreita.

di7O81XBmwQJLDco.jpg

Que diabos a Asus Internacional quer dizer com isso?????

Que eles tomam chá de cogumelo.. mas isso tem cara de ultraportátil ou coisa do tipo, duvido que seja Bulldozer. ;)

--

http://techreport.com/articles.x/21730

Teste do Llano 3800.

Link para o comentário
Compartilhar em outros sites

Se Thuban tivesse o Turbo do FX, a vantagem da Sandy seria bem estreita.

di7O81XBmwQJLDco.jpg

Que diabos a Asus Internacional quer dizer com isso?????

Pode vir uma grande surpresa dos bulldozer, (Esperança ultima que morre)

Talvez algumas BIOS OFFICIAL Atualizadas da ASUS, para retrocompatibilidade com os Socket AM3???

Link para o comentário
Compartilhar em outros sites

Visitante
Este tópico está impedido de receber novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...

 

GRÁTIS: ebook Redes Wi-Fi – 2ª Edição

EBOOK GRÁTIS!

CLIQUE AQUI E BAIXE AGORA MESMO!