Ir ao conteúdo
  • Cadastre-se

AMD Bulldozer / Bobcat / Zambezi - Plataformas.


Posts recomendados

O Trinity é uma APU e terá núcleos Piledriver.

Ah sim. Piledriver se diz respeito à estrutura modular da próxima arquitetura, se é que entendi o que você disse. No caso a confusão foi com o Vishera. Aos poucos vou me acertando com essa salada.

Claro que um 4M/4C vai ser mais rápido que um 2M/4C ao mesmo clock, a questão é por quanto. E vale lembrar que a AMD não vai fazer um processador desktop com 8 módulos (para eles compararem com 4M/8C)....

Bem observado! Até a distribuição térmica deve ser melhor (além de eliminar compartilhamentos desnecessários). :joia:

Grato Ziebert!

A minha outra resposta está cheia de remendos e já ficou lá para trás, então resolvi postar nova mensagem.

Bom, agora todo mundo quer achar uma forma de justificar a cagada que foi o Bulldozer, no link abaixo o Xbit faz referencia ao Cliff Meier, aquele ex-engenheiro da AMD que o Dick_Trace postou e gerou o maior rebuliço aqui :D

http://www.xbitlabs.com/news/cpu/display/20111013232215_Ex_AMD_Engineer_Explains_Bulldozer_Fiasco.html

Em resumo falam daquele lance de não fazer o design do chip manualmente, e ao invés disso usarem ferramentas automáticas e etc..

Sim, aparentemente ele está certo, não? Se os módulos ocupam apenas 852 milhões de transistores e 8MB de cache L3 ocupa apenas 405 milhões de transistores, o que eles fizeram do resto, para consumir quase 2bi de transistores?

Com mais transistores o consumo elétrico fica maior e a eficiência fica menor. Ele não está dizendo que a arquitetura Bulldozer é ruim, está falando que a forma como foi implantada a arquitetura que é ruim. Segundo ele, o projeto deve ter sido muito automatizado, ao invés de o terem feito mais na mão.

Cliff Meier, mesmo tendo sido um dos projetistas do Athlon64, criticou a AMD por manter uma arquitetura, que já faz quase década, viva. Daí você imagina o que ele pode arguir a respeito de uma possível revitalização dos Phenom!

Foi bom para a sua época. Chega a hora que não tem mais de onde tirar.

OBS: Logo abaixo do título, "Engineer: AMD Should Have Hand-Crafted Bulldozer to Ensure High Speed"

"AMD deveria ter feito o Bulldozer em um processo artesanal, a fim de assegurar alta velocidade"

Link para o comentário
Compartilhar em outros sites

no fim das contas galera esse teste do guru3d não muda nada.. Prometeram um produto com desempenho extremo e não é isso que estamos vendo.

não adianta agora ficar procurando o motivo maior ou menor que está limitando ou afetando o desempenho/performance deste produto.

o que eu realmente desejava era ver apenas um produto "competitivo" acho que isso não está estimulando a concorrência, não podemos afirmar que a intel está super tranquila mas também não podemos dizer que ela está muito preocupada. espero que a AMD volte e faça a lição de casa eu como consumidor desejo ver um mercado acirrado, e o melhor, com uma guerra de preços!

Link para o comentário
Compartilhar em outros sites

Éhhh galera... acho que esse Trator enterrou-se na Areia!

Que pena, esperava mais da AMD, depois de tanta expectativa.

O bicho tá meio que atolado, mas não está enterrado não.

http://www.pccanada.com/viewitem.asp?id=35992

http://www.pccanada.com/viewitem.asp?id=35991

http://www.pccanada.com/viewitem.asp?id=35990

http://www.pccanada.com/viewitem.asp?id=35989

Precisa de abaixar os preços e resolver esse problema de desempenho single-thread, que eu não imaginava ser tão ruim, além de outros bugs.

Só que eu acho que a maior parte dos problemas será corrigida apenas com a arquitetura Piledriver. Certamente as críticas chegaram aos ouvidos dos engenheiros da AMD e eles deverão trabalhar em cima para consertar.

Link para o comentário
Compartilhar em outros sites

Isso infelizmente não é algo tão simples assim.

Em primeiro lugar cabe lembrar que as Radeon são fabricadas lá na TSMC, enquanto os processadores da AMD são fabricados na GlobalFoundries. Não dá para simplesmente pegar e mandar fazer tudo na TSMC, além de que a AMD não teria a vantagem da produção de 32 nm, e trocar de litografia não é algo tão simples quanto você imagina. É um trabalho de vários e vários meses. Mesmo produzir os Bulldozer em 40 nm poderia implicar nas mesmas dificuldades em produzí-lo em 32 nm. Fora que a AMD já chegou atrasada nos 32 nm, imagine se adiassem ainda mais. Iria perder qualquer chance de competir com a Intel.

O que adianta chegar num processo se ele está ruim. A ideia dos 40nm é porque já é um processo amadurecido, diferentemente desse 32nm que está ruim. Só lembrar que a AMD conseguiu rendimentos melhores no Athlon 64 X2 nos 90nm que nos 65nm, como já foi discutido aqui nesse mesmo tópico, para pensar nisso. É claro que um processo de 32nm bom é melhor que 40nm, mas se ainda não estava pronto, não adianta nada lançar algo para queimar a ficha. E eu sei que não é fácil mudar de litografia. Só falei que SERIA (do verbo "não é, mas poderia ter sido") melhor terem feito isso que falei que esse projeto de Netburst turbinado que saiu no mercado.

Instruções SSE3 a AMD já tem desde os Athlon 64. Inclusive possuo um Athlon 64 3000+ Venice, que já conta com o SSE3.

E eu falei que não tem? Eu falei em instruções SSSE3 (um "S" a mais, instruções presentes desde os Core2Duo de 65nm, que a AMD não usa até hoje).

Eu lamento dizer que a arquitetura do Phenom já não tem mais onde ser melhorada, aliás trata-se basicamente de um K8, uma arquitetura de 8 anos atrás, com alguns remendos.

E a arquitetura do Pentium PRO, que já tem 16 (dezesseis) anos??? Os Core ix de hoje ainda tem a base sobre o Pentium PRO (P6), processador corporativo lançado em 1995 (que foi sucedido da seguinte forma: Pentium PRO => Pentium II => Pentium III => Pentium M => CoreDuo => Core2Duo 65nm = Core2Duo 45nm = Core ix Nehalem = Core ix Sandy Bridge), com muitíssimos melhoramentos. Fora que a Intel aproveitou vários conceitos adquiridos nos Phenom (caches L1 e L2 pequenos e individuais, cache L3 grande compartilhado entre os núcleos, controlador de memória integrado ao processador, barramento similar ao HyperTransport, etc). O resultado aí, depois dos vários melhoramentos que citei é o que temos hoje. Só porque a base é antiga o produto final é ruim? Minha ideia era pegar o Phenom de hoje e MELHORÁ-LO, da mesmo forma que a Intel fez com seu Pentium PRO.

De qualquer maneira, o Bulldozer não é verdadeiramente um octa-core. Isso é mais um tiro de marketing, aliás, tiro que infelizmente saiu pela culatra.

https://www.clubedohardware.com.br/artigos/Por-Dentro-da-Arquitetura-AMD-Bulldozer/2063/3

Aliás, sejamos justos, a Intel tem threads há tempos e ninguém a criticou por isso.

Eu sei muito bem disso. Mas o pecado da AMD foi o marketing burro. Ela não tem um octa-core completo, mas o que ela prometeu foi um octa-core. O consumidor leigo (ou mesmo o entendido), após a promessa de um octa-core, merece algo que entregue a performance de um. A Intel nunca prometeu octa-core nos seus quad-core mais HT. Embora NÓS, minoria da população, saibamos que o "octa" da AMD concorra com o quad mais HT da Intel, o mesmo não dá conta nem de acompanhá-lo, o que é um pecado grave.

Eu sou simpatizante da AMD. Uso AMD desde 1999, desde o K6-II 350MHz! Eu sempre defendi a AMD nesse tópico antes do lançamento disso aí que ela lançou, pois eu não achava justo ver o pessoal criticando a empresa antes dos testes oficiais e do lançamento do produto. Mas eu não sou fanboy cego. Prova disso que em 2008 eu sonhava com um Core2Quad e hoje se eu fosse comprar outro processador seria Core i7 na certa.

Ivy Bridge será lançado no final do segundo semestre do ano que vem (provavelmente). Até lá, tem muita coisa para acontecer...

Sim, mas para quem tem um PC bom hoje vale muito a pena aguardar. Não acho grande vantagem trocar um Phenom II X4 por uma Sandy. Melhora? Sim! Mas se tiver um pouco mais de paciência vai pegar algo muito melhor daqui a pouco. Fora que mesmo que o Ivy mantenha compatibilidade com as placas LGA1155 atuais (que é o esperado, mas nada garantido, ainda mais em se tratando de Intel), devem sair chipsets novos que terminem de consertar as falhas dos atuais. Ainda estou encucado com aquele bug nos chipsets Intel para lidar com SSDs. Alguém comentou algo por aí mas o assunto morreu rapidinho. E não estou falando do bug velho da revisão B2, que foi corrigido. Fora que não estou com pressa para comprar um notebook. Necessidade mesmo nem há tanta. É mais faniquito mesmo que tudo! KKK!

Uma outra coisa que eu não entendo é o pessoal com esperança de que otimizem pra ver se melhora. O pessoal se esquece que em caso de otimização, processadores como o Core i7 2600 (que tem HT), Core i5 2500 (mesmo sem HT) e Phenom II 1100T também vão sair ganhando. Proporcionalmente a diferença ainda vai continuar sendo a mesma (e a favor da Intel), mesmo que apareçam otimizações.

Eu também acho besteira isso, ainda mais que os ganhos esperados são insignificantes (mas já é alguma coisa). Mas essa otimização vale mais para o Bulldozer, porque ele trabalha com os núcleos de forma bem diferente que esses outros processadores. Só que não deixa de ser bobiça aguardar um patch milagroso. ;)

Na verdade, o Ivy Bridge é esperado para Março~Abril do ano que vem...

Ou seja, para breve. :)

O fato de que 40<45 não quer dizer nada...

O Phenom e o processo 45nm/32nm da GloFo são SOI, já o processo 40nm da TSMC é bulk. Aí já está o primeiro e óbvio problema. E o processo TSMC 40nm não é feito para CPUs x86 high-end, por isso se o Phenom hipotético conseguisse chegar a 3GHz já seria incrível, consumindo menos que 150W seria mais incrível ainda. E nem há evidência de que um K10 chegaria a clocks muito mais altos que os atuais em stock de forma consistente (overclock não vale) mesmo num processo (bem) mais apropriado que o 40nm TSMC. Eu imagino que os engenheiros da AMD devem ter ao menos feito uma análise e concluido que já não tinha mais muita margem para progredir. Reduzir o processo não significa que os clocks e desempenho vão aumentar automaticamente. Agora, se a arquitetura do Bulldozer foi ou não a melhor escolha é algo controverso (um engenheiro que trabalhou na Intel e AMD insinuou que a AMD não tinha nada melhor na época mas precisava de algo novo)... vamos ver o que acontece depois que melhorarem os caches e o processo no futuro.

Um Sandybridge é uma mistura de PPro com Phenom em que sentido?

Bom... Eu não tinha pensado nessa questão de diferença de processo nem de fábrica. Mas vale lembrar que os Bobcat/Ontario saíram em 40nm e são muito eficientes. Está certo que talvez a escolha do processo se dê por conta do IGP embutido na APU, mas é estranho o Llano não ter seguido essa tendência.

Quanto a Sandy, respondi mais acima. E quero que leve em consideração que não é simplesmente uma "fusão" de Pentium PRO e Phenom, pois modificaram muita coisa na arquitetura. Mas é sabido que a base de qualquer Core (seja Core2, Core ix, etc) ainda é a família Intel P6, que nasceu no Pentium PRO, sendo que a cada geração modifica-se bastante coisa. Prova disso é a Sandy já ser muito diferente dos Penryn, por exemplo.

Provavelmente o fim da família Intel P6 se dê com o Ivy Bridge, pois espera-se algo diferente depois dele. Mas isso não é certeza (e não duvido nada que se ocorrer outro fracasso como foi com os Netburst a Intel ressucite o P6 de novo).

Link para o comentário
Compartilhar em outros sites

Alguém ai sabe para quando que vai sair a primeira revisão do Bull será que vai ter alguma melhora muito significativa????

Coisa estranha é a Intel e a AMD que acham que a unica solução as vezes é aumentar o clock digo isso porque a Intel aumentou absurdamente o clock da hd graphics para ver se dava uma melhorada e a AMD aumentou o clock dos Bull acho que isso é um tanto errado!!!!

Em falar em clock será que os próximos Bull serão melhorados no rendimento clock por clock?

Link para o comentário
Compartilhar em outros sites

Bom... Eu não tinha pensado nessa questão de diferença de processo nem de fábrica. Mas vale lembrar que os Bobcat/Ontario saíram em 40nm e são muito eficientes. Está certo que talvez a escolha do processo se dê por conta do IGP embutido na APU, mas é estranho o Llano não ter seguido essa tendência.

Um Bobcat é bem diferente de um Phenom e tem prioridades bem diferentes quanto à fabricação.

Opções disponíveis no Llano: 1) portar o CPU do Llano (3GHz quad-core) para um processo TSMC 40nm bulk feito para ser genérico só porque a GPU já é feita nele; 2) portar a GPU do Llano para um processo GF 32nm SOI feito para alto desempenho. Se essas são as opções então a escolha é obvia, e foi a que a AMD tomou.

Quanto a Sandy, respondi mais acima. E quero que leve em consideração que não é simplesmente uma "fusão" de Pentium PRO e Phenom, pois modificaram muita coisa na arquitetura. Mas é sabido que a base de qualquer Core (seja Core2, Core ix, etc) ainda é a família Intel P6, que nasceu no Pentium PRO, sendo que a cada geração modifica-se bastante coisa. Prova disso é a Sandy já ser muito diferente dos Penryn, por exemplo.

Provavelmente o fim da família Intel P6 se dê com o Ivy Bridge, pois espera-se algo diferente depois dele. Mas isso não é certeza (e não duvido nada que se ocorrer outro fracasso como foi com os Netburst a Intel ressucite o P6 de novo).

http://realworldtech.com/page.cfm?ArticleID=RWT091810191937
Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Gostei do link, o cara parecia que estava "adivinhando chuva" :

Para um artigo que foi feito em set/2010, parecia mesmo.

Porém a arquitetura Bulldozer é muito nova e não vislumbro mais alternativas de melhora para os Phenom.

Como Cliff Maier disse, o Bulldozer foi feito de uma forma muito automatizada e por isso foi lançado com cerca de 2bi de transistores. Dá ainda para tirar um bocado de gordura do chip atual.

O corte das FPUs pela metade já foi alguma dieta bem adotada, resta ainda jogar fora um monte de transistores inúteis, que só estão ocupando espaço. haha Ninguém me esgane por isso... :lol:

Link para o comentário
Compartilhar em outros sites

  • Membro VIP

Bom... Eu não tinha pensado nessa questão de diferença de processo nem de fábrica. Mas vale lembrar que os Bobcat/Ontario saíram em 40nm e são muito eficientes. Está certo que talvez a escolha do processo se dê por conta do IGP embutido na APU, mas é estranho o Llano não ter seguido essa tendência.

1) O Bobcat não passa de 1.6GHz, o Llano chega a 2.9Ghz;

2) O Ontario é ~ 20% CPU e 80% GPU, o Llano é 50% CPU e 50% GPU;

3) O Bobcat foi feito nas tão mal faladas ferramentas automáticas e com isso é fácil mudar ele de um processo para outro, o Llano foi feito na unha e da muito trabalho mudar de processo, quer dizer, tiveram que mudar de qualquer jeito, mas de 45nm SOI para 32nm SOI é muito mais fácil do que de 45nm SOI para 45nm Bulk ou 40nm Bulk, as estruturas (feitas na unha) no SOI são muito diferentes do que no Bulk, eles tiveram um trabalhão no passado para botar o Opteron no SOI.

  • Curtir 1
Link para o comentário
Compartilhar em outros sites

  • Membro VIP
quase toda vez que se lança uma arquitetura nova,tem algum tipo,de bug ou fiasco,até a Intel faz isso

Bug tem e sempre vai ter, fiasco é outra coisa..

Alguém aí tem algumas informações trazidas do XS, Semiaccurate ou qualquer outro lugar a respeito do Bulldozer e das eventuais correções? Ou será que ficará tudo para ser resolvido com o Piledriver?

Não vi nada em lugar nenhum, exceto aquele slide "15% a mais com Vishera".

O 8170 deve sair daqui um tempo, mas fora isso, não tinha nenhum outro rumor.

Link para o comentário
Compartilhar em outros sites

Encontrei um artigo que fala sobre a revisão:

The first one is that there is a new stepping coming, SemiAccurate is hearing mid- to late Q1/2012 for the next rev. That rev is said to bump performance, specifically integer performance, up by quite a bit, and possibly improve clocks too.

Fonte: Semiaccurate

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
1) O Bobcat não passa de 1.6GHz, o Llano chega a 2.9Ghz;

2) O Ontario é ~ 20% CPU e 80% GPU, o Llano é 50% CPU e 50% GPU;

3) O Bobcat foi feito nas tão mal faladas ferramentas automáticas e com isso é fácil mudar ele de um processo para outro, o Llano foi feito na unha e da muito trabalho mudar de processo, quer dizer, tiveram que mudar de qualquer jeito, mas de 45nm SOI para 32nm SOI é muito mais fácil do que de 45nm SOI para 45nm Bulk ou 40nm Bulk, as estruturas (feitas na unha) no SOI são muito diferentes do que no Bulk, eles tiveram um trabalhão no passado para botar o Opteron no SOI.

Você acha que para migrar uma arquitetura "do automatizado para o manual" como a Bulldozer demora quanto tempo ? 12 meses ?

Link para o comentário
Compartilhar em outros sites

Você acha que para migrar uma arquitetura "do automatizado para o manual" como a Bulldozer demora quanto tempo ? 12 meses ?

Boa pergunta.

Acrescentando mais uma pergunta, como seria esse processo? Eles vão olhando os transistores pelo microscópio e dizendo: -- Esse presta, já aquele não presta, -- ou estou enganado? A unha, no caso, seria uma espécie de bisturi ou alicate?

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Você acha que para migrar uma arquitetura "do automatizado para o manual" como a Bulldozer demora quanto tempo ? 12 meses ?

Será que dá pra fazer isso, compensa, ou é melhor sentar o rabo na cadeira e fazer do zero ?

AMD será vendida quando?

Brincadeiras a parte, que tiro pela culatra, desempenho em ST pior que o 965, /e5.

:mellow:

Bobcat, Llano e o Bulldozer pra servidores. A AMD está bem em 3 mercados dos 4 onde atua, não é por causa deste fiasco que ela vai falir, e se eles pensarem, vão baixar o preço dos FX e contornar em partes a mermelada que fizeram.

Link para o comentário
Compartilhar em outros sites

Fonte: Tom's Hardware

Em outras palavras, o Turbo Core nos Bulldozer não está funcionando direito, pois não está havendo espaço térmico. O SO está espalhando os threads entre os núcleos e em aplicações otimizadas para até 04 núcleos, se os outros 04 núcleos fossem desabilitados, conforme planejado, haveria muito mais espaço térmico para o Turbo Core.

Acredito que seja porque a AMD só olha para o trabalho de processamento feito, ao uso dos recursos. É irrelevante se o CPU está a -50°, se ele fez "X de trabalho, então desliga o Turbo".

Acho que, como vou mencionar com o ziebert lá embaixo, talvez valha a pena desativar no BIOS dois módulos (se possível) e ver como o turbo ainda assim trabalha, pois teoricamente nessa configuração ele vai funcionar o tempo todo com o turbo.

Do mesmo jeito que você comparou abaixo...

Juura? U_U'

Na verdade você tem que ignorar os testes 6 e 8 se estiver comparando o BDZ com o SB... Veja que no caso do BDZ, ele está gargalando a GPU, por isso que o FPS ficou tão baixo. No caso do i5, a GPU é quem está gargalando o CPU, pois o FPS estava bem alto e não aumentou quase nada com um over forte.

A razão de cortar o 6 é que, aparentemente, você podia dar over em 100MHz ou em 1000MHz o ganho seria minúsculo para ambos pela natureza do teste.

Quanto ao 8, realmente faz sentido ignorá-lo, mas apenas para a plataforma do SB, já que para a BDZ esse teste mostra a escalabilidade da arquitetura (não tem gargalo da GPU, seja por bem ou por mal =/).

Mas ai fica toda torta a média (cortando os testes), só parando para ver mesmo.

Discordo... O L3 vai afetar o resultado, provavelmente. Se não afetar, demite o "espertalão" que colocou no BDZ esses transistores inúteis.

Depende do tipo de tarefa que você quer rodar no sistema, como o Trinity mira o mobile o corte no L3 deve influenciar muito pouco na performance.

E agora vejo o pessoal concordando com minha ideia de terem lançado um novo Phenom no lugar desse Netburst turbinado aí. Eu penso o seguinte: já que o processo de 32nm está essa porcaria que tantos falam por aqui, que pegassem a litografia de 40nm (usada desde a Radeon HD 4770) e já dessem um "upgrade" nos 45nm do Phenom II. Da mesma forma que a Intel foi pegando arquitetura anterior e melhorando (a base da Sandy, por exemplo, é uma mistureba de Pentium PRO e Phenom com MUITOS melhoramentos), a AMD podia usar o já maduro processo de 40nm e dado uma melhorada na arquitetura do Phenom. Adicionando as instruções SSE 4.1 e 4.2, AVX, SSSE3, fora que não tinha necessidade do octa-core agora. Deixasse o octa-core quando o processo de 32nm ficassem bom para lançar algo decente. Podiam lançar o Phenom III X6 com esses aperfeiçoamentos que falei, e talvez um ligeiro aumento de cache, clock e turbo. Pronto! Provavelmente ainda não ia bater na Sandy, mas já ia encostar melhor perto dela e com uma eficiência energética pelo menos apresentável.

Aposto que agora que todos viram a porcaria que o Bulldozer saiu ninguém vai me crucificar por pensar dessa forma. Eu que não vou trocar de processador tão cedo, senão minha opção de upgrade seria o Ivy Bridge com toda certeza. Talvez eu pegue um para notebooks. Veremos!

Eu ia deixar de comentar isso porque o Dick e o EduardoS falaram, mas só para reforçar: existem diferenças em cada processo que são tão ou mais relevantes que a litografia para a escolha do processo adequado ao produto. Como o 40nm é feito em Bulk não deve valer a pena fazer a mudança.

Foi exatamente por essa diferença eu defendi logo de cara que era "falso" o leak de que futuros CPUs viriam em 28nm... até a GF anunciar um processo de 28nm com todas as firulas que os CPUs hoje tem.

Na verdade, o Ivy Bridge é esperado para Março~Abril do ano que vem...

Ou seja, entre o Q1 e o Q2, não?

O Trinity é uma APU e terá núcleos Piledriver.

Quanto aos testes, desativar um "núcleo" de dentro do módulo é inútil. Os poucos casos onde realmente se perde desempenho a diferença é pequena e o Windows 8 será capaz de reverter a situação (fazer com que o processador ganhe desempenho nelas graças ao melhor uso do Turbo).

Claro que um 4M/4C vai ser mais rápido que um 2M/4C ao mesmo clock, a questão é por quanto. E vale lembrar que a AMD não vai fazer um processador desktop com 8 módulos (para eles compararem com 4M/8C)....

Concordo, mas por hora podiam ver se a desculpa toda faz sentido desativando metade dos módulos (afinal boa parte dos programas é otimizado para no máximo 4 núcleos e com metade dos módulos o 1° turbo já deve funcionar).

Vendo por um lado mais técnico... mas tá gostoso zuar.

AMD CMT é +/- 120% mais eficiente que SMT da Intel. Fato!

É mais caro, é feito de Pipeline, ou seja, material nobre e espaço no die. Fato!

O núcleo ainda é fraco. Fato!

Para mim 5% no die para +20% de performance parece ser uma boa troca. Isso se a AMD conseguiu aumentar em apenas 5% o die com a nova unidade de inteiros

Gostei do link, o cara parecia que estava "adivinhando chuva" :

Foi um "chute calculado" =P, a própria AMD declarou os alvos da arquitetura e tal.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Juura? U_U'

Não entendi o sarcasmo Sirro... Apenas lembrando, eu tinha questionado que a "fórmula" que você usou abaixo não era a certa para comparar escalabilidade com over:

O Nav01 esclareceu o ponto que fiz, se for comparar % por % ([+% de clock] - [+% performance], completamente não-científico esse cálculo xDDD eu sei XDDD) em 4 dos 7 testes o BDZ "deixa menos performance sobrando na mesa", o que leva a crer que sim, ele escala bem.
A razão de cortar o 6 é que, aparentemente, você podia dar over em 100MHz ou em 1000MHz o ganho seria minúsculo para ambos pela natureza do teste.

Quanto ao 8, realmente faz sentido ignorá-lo, mas apenas para a plataforma do SB, já que para a BDZ esse teste mostra a escalabilidade da arquitetura (não tem gargalo da GPU, seja por bem ou por mal =/).

Mas ai fica toda torta a média (cortando os testes), só parando para ver mesmo.

Como eu disse, para comparar é justo que o teste 8 seja cortado, pois mesmo que você aumente absurdamente o clock do SB, os ganhos serão nulos, e a causa disso é o gargalo da VGA, algo que não ocorre com o BDZ.

Ou seja, entre o Q1 e o Q2, não?

Sim, mas é esperado especificamente para Março~Abril.

Link para o comentário
Compartilhar em outros sites

Acho que o segundo cluster de inteiros era +20% de transistores = 80% mais desempenho.

+5% de transistores = 20% de desempenho é o Hyper Threading.

Você não entendeu o que eu quis dizer com "desativar um ou mais núcleos". O Bulldozer tem a capacidade de desligar núcleos completamente, ao invés de ficar rodando em 800MHz, que nem os atuais Phenom. Não se trata de desativar os núcleos pela BIOS e sim de o próprio SO discernir quando não convem espalhar as threads entre todos os núcleos e, dessa forma, o processador poder desligar alguns núcleos, algo que não está funcionando.

Em programas otimizados para 08 núcleos, obviamente é vantajoso que o SO não desligue nenhum núcleo, mas em outras situações, obviamente desligar um ou mais núcleo seria vantajoso.

Quem deverá fazer o balanceamento bem sucedido é o SO, não nós desligando núcleos pela BIOS para executarmos determinados programas e depois recorrendo de novo a ela para re-habilitarmos.

Ah sim! Você então deverá estar se perguntando por que naqueles testes em todos os casos a configuração 4CU/8C se desempenhou melhor. Simples: Todos aqueles programas são otimizados para pelo menos mais do que 04 núcleos.

OBS: Entenda "espalhar as threads entre os núcleos" o fato de o Windows alternar, em frações de milissegundos, as threads entre os núcleos (não que o Windows utilize todos os núcleos simultaneamente em tarefas otimizadas para menos que 08 núcleos).

Não necessariamente otimizados para mais que 4 núcleos, mas podem se beneficiar de alguma forma de mais núcleos.

Quanto a espalhar os processos pelos núcleos disponíveis. O Windows 7 já "estaciona" os processos nos núcleos, em vez de ficarem pulando de núcleo em núcleo. Isso resolveu o problema da perda de desempenho com o Cool n' Quiet no Phenom I, onde os núcleos tinham clock independente.

No caso do Bulldozer, por enquanto o Windows não faz distinção entre os núcleos. Pra ele todos são núcleos individuais, como os núcleos de um Phenom, por exemplo.

Nos processadores com HT (i7 e afins) o Windows vai alocando processos ao primeiro thread de cada núcleo antes de usar o segundo, para evitar perdas de desempenho.

Mas no Bulldozer o ideal é que ocorra o contrário: que o Windows ocupe o primeiro e o segundo núcleos de um módulo antes de acordar os demais, pois assim pode se beneficiar mais do Turbo.

Muitos ficaram com medo disso, achando que o desempenho de um núcleo (dentro de um módulo BD) seria muito afetado quando o segundo núcleo do mesmo módulo também estiver trabalhando.

Mas não, o impacto é pequeno. Um programa que usa dois núcleos por exemplo, usando os dois núcleos de um módulo, roda pouca coisa mais lento que se estiver usando o primeiro núcleo de um módulo e o primeiro núcleo de outro módulo.

E mesmo sem considerar o Turbo ou o desligamento de módulos, usando os dois núcleos de um módulo se gasta menos energia que usando dois núcleos de dois módulos (um de cada).

Então podemos aproveitar os recursos de gerenciamento de energia avançados em nosso favor. Portanto ao usar apenas dois núcleos em um módulo, os demais módulos podem permanecer completamente desligados e o Turbo Core pode aumentar o clock do módulo que está trabalhando. Essa diferença de clock não só deve compensar o pequeno impacto no desempenho (pelos dois núcleos terem que brigar por recursos dentro do módulo), como deve proporcionar um desempenho melhor que ao usar um núcleo de cada módulo a um clock menor.

@Nav, por desativar núcleo de um módulo me referia à opção de desativar o segundo núcleo dentro de um módulo; através de um ajuste no BIOS da placa. Tornando um FX-8 em um processador quad-core simples (4 módulos, total de 4 núcleos); seria como desativar o HT num i7, tornando-o um i5.

Tudo bem, pode-se fazer isso justamente para investigar a diferença de desempenho entre rodar um programa usando apenas um núcleo de cada módulo (assim o núcleo tem o módulo todo para si) e usando ambos núcleos de um módulo (ou alguns módulos).

Por exemplo, para rodar um programa que utiliza 4 núcleos em 2M/4C ou 4M/4C.

Mas não vejo nenhuma vantagem prática em fazer isso, pois se estaria abrindo mão de metade do potencial de inteiros em programas multithread (que, como vimos, vários podem se beneficiar de mais de 4 núcleos).

Fazendo isso também não se ganha nada em programas single thread, pois se o segundo núcleo de um módulo não está trabalhando, ele não atrapalhará o primeiro.

Como levantaram no teste do site hardware.fr (tabela anexa abaixo)

artigo original (em francês) aqui: http://www.hardware.fr/articles/842-9/efficacite-cmt.html

Observem que os únicos casos onde se teve um pequeno ganho de desempenho ao desativar o segundo núcleo de cada módulo foi em alguns jogos e a diferença foi pequena (5% ou menos).

Esse é o cenário que temos hoje com o Windows 7, pois como ele não sabe que os núcleos são irmãos dentro de módulos, joga os processos por aí de qualquer jeito.

Supondo 4 threads: um em um núcleo de um módulo, outro em um núcleo de outro módulo e os outros dois nos dois núcleos de outro módulo, por exemplo. Assim só o quarto módulo está ocioso, podendo ser desligado. O processador poderá subir um pouco o clock, mas não poderá chegar ao Turbo máximo (que só é possível quando pelo menos metade dos módulos está desligada).

Isso só vai funcionar bonitinho no Windows 8.

Aí sim, numa tabela como essa abaixo, nos jogos veremos mais de 100% tanto na primeira coluna quanto na terceira, pois como haverá menos módulos em uso, o processador poderá operar com um clock mais alto.

Claro que programas muito pesados continuariam perdendo um pouco mais de desempenho ao rodar nos dois núcleos dentro de um módulo (principalmente por competirem pelo uso das FPUs), mas esse tipo de programa já deve estar preparado para aproveitar mais do que 4 núcleos, portanto são casos onde veríamos um belo ganho na primeira coluna de uma tabela como essa de baixo.

post-907959-13884960767498_thumb.gif

  • Curtir 3
Link para o comentário
Compartilhar em outros sites

Mas que diabos é isso agora? lol

http://www.techpowerup.com/153567/AMD-to-Turn-to-TSMC-for-Bulldozer-Manufacturing.html

Em 32nm? Fake. TSMC nem tem um processo desse.

Em 28nm?.. Alguém sabe os processos em 28nm que a TSMC tem?

----

Não entendi o sarcasmo Sirro... Apenas lembrando, eu tinha questionado que a "fórmula" que você usou abaixo não era a certa para comparar escalabilidade com over:

Se eu postei, eu sei: eis a razão do sarcasmo. Se você achou necessário responder separadamente, faço o mesmo. Mas se quiser ajudar na discussão, o windows tem uma calculadora por ai.

Como eu disse, para comparar é justo que o teste 8 seja cortado, pois mesmo que você aumente absurdamente o clock do SB, os ganhos serão nulos, e a causa disso é o gargalo da VGA, algo que não ocorre com o BDZ.

Como a comparação é entre escalabilidade e existem muitos poucos testes eu pessoalmente o manteria nos números do BDZ. Caso contrário teriamos que voltar e cortar um teste que o johny comentou que diminuiram a banda da memória.

Já foi falado e repetido que esses números não são suficientes para comparar nada "justamente". Mas agora eu pergunto: você tem alguma dúvida sobre se o BDZ escala ou não?

Se não, fim da discussão e meu ponto foi confirmado com os números que estão aqui. Se sim, fale o porquê e proponha algo.

A gente tá enrolando sem saber a que ponto queremos chegar.

----

Eureka! A MSI descobriu como corrigir a propaganda do BDZ!

BOOBS.

http://www.donanimhaber.com/anakart/haberleri/AMD-Bulldozer-icin-dikkat-cekici-ilk-tanitim-MSidan-geldi-.htm

Isso é que é um exemplo de marketing, convenhamos. :D

Link para o comentário
Compartilhar em outros sites

Visitante
Este tópico está impedido de receber novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...