Ir ao conteúdo

Posts recomendados

  • Membro VIP
Postado
O cache L1 continuou sendo 128KB por núcleo até o Phenom II e até o Llano. Mudou foi agora no Bulldozer e já vi outras pessoas falando o mesmo que eu citei: que isso gargalou o sistema.

Já vi muita gente falando muita coisa, sem dados.

O cache L1 é muito mais rápido que o L2 e o L3, aí mesmo que o Bulldozer/Vishera possuam o exagero de 16MB (L2+L3), isso não compensa um L1 minúsculo. E já vi também várias pessoas falando que o Bulldozer não aproveita bem esses 16MB que ele carrega nas costas. Será que pelo menos o Vishera vai aproveitar isso bem? Mas eu ainda acho que deviam aumentar o cache L1.

O L2 é bem aproveitado, o L3 basicamente só existe para sistemas multi-processados.

@EduardoS, qual sua opinião sobre o cache L1 ser write-thru com o L2?

Acho uma decisão pensada em sistemas multi-processados, o buffer de escrita é bem grande (4kB) então em desktops ele deve se comportar de maneira bem parecida com os caches write-back tradicionais.

Só quem pode te dar certeza é quem trabalhou no projeto, essas decisões não são tomadas aleatoriamente, ainda mais nos detalhes fáceis de mudar (ex: write-back ou write-through?), são feitas simulações e com o resultado dessas simulações e nos objetivos isso é decidido, pessoalmente não acho que em aplicações desktop haja alguma diferença significativa entre essas duas políticas de cache e se existe diferença acho que é a favor do write-back, e é tudo "acho" porque não fiz simulação nenhuma, e é isso que me incomoda em 99% das análises sobre o BD que existem na net, não é feita nenhuma simulação e nem coleta de dados, simplesmente olham o resultado de um benchmark sem nem se preocupar com o que aquele benchmark mede, constatam que o núcleo do BD é mais lento que o núcleo do Phenom II e sem qualquer esforço mental extra concluem que a perda de desempenho é porque o cache mudou como se essa fosse a única diferença entre os processadores.

E vou finalizar o post com o que eu acho sobre a filosofia do Bulldozer em sistemas-multiprocessados já que citei essa expressão duas vezes no post sem explicar o porque.

Primeiro o L3, em um sistema multi-processado quando um núcleo vai ler ou gravar alguma coisa na memória (ou botar aquilo no cache dele) ele primeiro tem que mandar uma mensagem para todos os agentes (quer dizer, outros processadores/núcleos) do sistemas de que ele vai ler/gravar naquela região para evitar que dois núcleos gravem na mesma região ao mesmo tempo (coerência, os detalhes ficam pra próxima, alias, acho que já tem um post ou artigo aqui no Clube do Hardware sobre isso), se existem 4 agentes no sistema temos cada núcleo enviando 3X mensagens para outros núcleos e no total 12X mensagens no sistema, se temos 16 agentes temos 15X mensagens por núcleo e 240X mensagens no sistema, se forem 64 agentes 63X mensagens por núcleo e 4032X mensagens no sistema... Um sistema multi-processado com o Opteron pode chegar a até 64 núcleos, se cada núcleo fosse um agente teria mensagem pra !#$%$#!, ao invés disso existe uma hierarquia, o nível mais baixo é o controlador de memória e L3 de cada die que formam um agente, esse agente vai trazer ou gravar na memória quando necessário, também vai gravar alguma coisa no L3 além de usar uma parte deste como filtro para saber para quem ele precisa mandar mensagem ao invés de mandar mensagens para todo mundo, e ele não vai se comunicar diretamente com todo mundo, apenas com os núcleos do próprio die ou com os controladores dos demais dies do sistema, nesse caso o L3 funciona como um cache desse agente, não exatamente como um cache do núcleo (e também acho que o fato do L3 e do controlador de memória rodarem em um clock próprio, diferente dos núcleos não é mera coincidência) e com esse nível na hierarquia já reduzimos o número total de mensagens em ~75%.

Agora quanto ao L2, primeiro, ao invés do controlador de memória falar com 8 núcleos ele só vai falar com os 4 L2 que existem no die, segundo, sendo write-through o L2 estará sempre atualizado e ninguém vai precisar importunar o L1 de dados (que geralmente está ocupado) para obter uma cópia dos dados.

  • Curtir 5
Postado

EduardoS, obrigado pelos comentários.

Tudo que você falou parecem ser boas decisões de projeto. O que você achar que há de errado com o Bulldozer (e derivados) e espera que seja corrigido ou o que você acha que poderia melhorar?

  • Membro VIP
Postado
Tudo que você falou parecem ser boas decisões de projeto.

Para o objetivo do projeto...

O que você achar que há de errado com o Bulldozer (e derivados)

O problema é que ele é um processador para servidores com 4 núcleos com vendas baixas em especial porque paga licenças como se tivesse 8 e que está sendo vendido em desktops e notebooks.

Sério, se ele estivesse no lugar certo e sendo vendido da forma correta ninguém reclamaria dele, mas essa bagunça que o marketing fez...

Para desktop acho que falta força bruta, quer dizer, mais ALUs e mais espaço no scheduller para instruções sem referencia a memória.

espera que seja corrigido ou o que você acha que poderia melhorar?

Não acho que tenha alguma mudança ou correção simples que vai trazer um grande ganho de desempenho pro Bulldozer por isso não espero muito, o caso da ALU por exemplo, não é fácil adicionar uma ALU e nem aumentar (muito, aumentar um pouquinho até que é fácil mas não ajuda) o scheduller, se eu fosse o chefe do setor meu objetivo seria aumentar a performance "desktop" para equilibrar melhor o chip e acho que esse seria o caminho, mas não consigo nem imaginar qual o objetivo da AMD hoje, o Dirk Meyer era mais previsível do que o Rory Reed.

  • Curtir 5
  • Membro VIP
Postado
Pistigrilo, não acho que a competição seja tão "desigual" quanto Phenom II vs Core i5 1ª geração. O cenário deve ficar +- igual ao do Bulldozer vs Sandybridge.

Talvez o Vishera supere o i7 Ivybridge em mais cenários multithread que o Zambezi em relação ao i7 Sandybridge.

Se ele ao menos competir de igual para igual com o i7 SB já tá valendo. Aproveito o investimento na placa-mãe. Se ele conseguir NAO vencer o SB, ai eu comeco a chorar.

Acho que se a AMD aprendeu com o erro vai entrar com preco bom e competir de sola ao menos com os SB. O maior vilao da AMD na minha opiniao foi o preco dos SB, eles vieram bons e com preco excelente (para os padroes Intel), e a Intel nem jogou a primeira leva de SB como top, deixou ai no mercado mainstream e o Zambezi era o mercado extreme top da AMD. Se o marketing da AMD nao tivesse colocado o BDZ como octa-core, tivessem tido boa sorte com yelds, disponibilidade, preco, marketing, inteligente, etc., o BDZ teria sido menos pior, mas... se a AMD disse que ele é um octa-core, tem que ser julgado como tal, e ficou feio ele perder parau m quad-core da Intel e para o X6 da propria companhia. Em multithread ele nao era estão ruim, espero que o Vishera siga essa linha e ao menos faca o que o BDZ nao fez: competir de igual para igual com o SB.

Precos? Eu chuto os mesmos precos do lancamento do BDZ, afinal, se venderam rios de BDZ, nao precisam recusar receita baixando muito o preco do Vishera.

  • Curtir 1
Postado
O problema é que ele é um processador para servidores com 4 núcleos com vendas baixas em especial porque paga licenças como se tivesse 8 e que está sendo vendido em desktops e notebooks.

Salvo engano a AMD anunciou acordos com mais de uma empresa para que a licença para CPUs baseados em BDZ fosse por módulo ao invés de por núcleo. Parei de acompanhar isso.

Não acho que tenha alguma mudança ou correção simples que vai trazer um grande ganho de desempenho pro Bulldozer por isso não espero muito, o caso da ALU por exemplo, não é fácil adicionar uma ALU e nem aumentar (muito, aumentar um pouquinho até que é fácil mas não ajuda) o scheduller, se eu fosse o chefe do setor meu objetivo seria aumentar a performance "desktop" para equilibrar melhor o chip e acho que esse seria o caminho, mas não consigo nem imaginar qual o objetivo da AMD hoje, o Dirk Meyer era mais previsível do que o Rory Reed.

Até o Steamroller acho que haverão muito poucas mudanças técnicas, até por falta de tempo. Então pode fazer o chute baseado no "What would Dirk Do?" xD que vai ter 99% de chance de estar certo.

Provavelmente Vishera era um projeto que a AMD estava fazendo já que foi alçado ao papel de "novo protagonista" ao invés do Komodo, acho muuuito difícil (para não dizer impossível) que a AMD conseguisse fazer ele do zero. Apesar de que a AMD ter falado na AFDS que conseguiu reduzir bastante o tempo de validação dos designs com uma estratégia cloud.

  • Membro VIP
Postado
Salvo engano a AMD anunciou acordos com mais de uma empresa para que a licença para CPUs baseados em BDZ fosse por módulo ao invés de por núcleo. Parei de acompanhar isso.

Não conheço nenhuma, sabe de um exemplo?

Até o Steamroller acho que haverão muito poucas mudanças técnicas, até por falta de tempo. Então pode fazer o chute baseado no "What would Dirk Do?" xD que vai ter 99% de chance de estar certo.

O Dirk tentaria salvar o mercado de servidores, colocar mais núcleos, tentar conseguir mais parceiros, não é o que o Reed está fazendo.

Provavelmente Vishera era um projeto que a AMD estava fazendo já que foi alçado ao papel de "novo protagonista" ao invés do Komodo, acho muuuito difícil (para não dizer impossível) que a AMD conseguisse fazer ele do zero. Apesar de que a AMD ter falado na AFDS que conseguiu reduzir bastante o tempo de validação dos designs com uma estratégia cloud.

Em relação a tempo de desenvolvimento a AMD está sempre quebrando records... Mas não é o bastante para uma mudança drástica em um ou dois anos, usando uma fração do orçamento da Intel.

  • Curtir 1
Postado
Não conheço nenhuma, sabe de um exemplo?

Achei esse

VMware has worked closely with AMD in support for the new “Bulldozer” core technology that is at the heart of our AMD Opteron 6200 and 4200 Series processors. This is reflected in a licensing change with vSphere 4.1u2, which was released on Nov. 18, 2011. In this version a “Bulldozer” module (compute unit) will count as the licensing core unit as opposed to the individual core. Here is a chart that reflects how currently shipping AMD and Intel processors will be treated for licensing by vSphere 4.1u2.

http://blogs.amd.com/work/2011/12/13/simply-spectacular-virtualization-–-vmware-and-the-amd-opteron-6200-series-processor/

Confesso que não sei se teve alguma outra empresa além da vmware (mas tb n procurei extensivamente).

O Dirk tentaria salvar o mercado de servidores, colocar mais núcleos, tentar conseguir mais parceiros, não é o que o Reed está fazendo.

Ah, falei no sentido técnico (achei que tinha sido claro o suficiente). Como eu e você concordamos, simplesmente não tem como o Read mudar o que já tá tão avançado na rooadmap.

Em relação a tempo de desenvolvimento a AMD está sempre quebrando records... Mas não é o bastante para uma mudança drástica em um ou dois anos, usando uma fração do orçamento da Intel.

Se me lembro bem o cara (CTO acho) só deu um exemplo, do Brazos que fizeram em ~1 mês a validação (de ~3 meses). Mas claro que deve ter sido um trabalho pequeno (acho que foi de algum embedded) então eu concordo com você.

Acredito que a ideia do RR é fazer chips por encomenda de forma o mais rápida possível, tipo "você quer um SoC com CPU assim e GPU assado? E se a gente te oferecer um com tudo isso mais esse IP e ainda esse outro? AH! E se começarmos a fabricar no semestre que vem?". O detalhe é saber se existe um mercado grande o bastante para isso e como a AMD e o mercado vão estar quando os primeiros produtos e o HSA chegarem, a AMD tá apostando tudo nisso.

  • Curtir 1
  • Membro VIP
Postado
Ah, falei no sentido técnico (achei que tinha sido claro o suficiente). Como eu e você concordamos, simplesmente não tem como o Read mudar o que já tá tão avançado na rooadmap.

Minha resposta continua a mesma...

Os engenheiros trabalham para alcançar algum objetivo e o objetivo do Dirk claramente era servidores, nesse ponto o BD não precisa de muitos ajustes (talvez mais núcleos, mais cache voltar a um die por processador ao invés do MCM quando mudar o socket, mas nenhuma mudança em especial no núcleo), é mais o marketing que tem que funcionar direito.

Uma das primeiras coisas que aconteceu quando o Reed entrou foi a remoção dos dies com 10 núcleos do roadmap, não posso dizer que foi ele que mandou tirar mas esse die de 10 núcleos é algo que eu esperava do Dirk.

  • Curtir 1
Postado

AMD contrata novo arquiteto de processadores

Jim Keller, 53 anos, foi anunciado hoje pela AMD como vice-presidente e arquiteto-chefe de microprocessadores. Seu último emprego foi como diretor na equipe que arquitetava as plataformas de processamento da Apple, onde ele projetou as famílias de chips encontrados nos iPads, iPhones, iPods e no Apple TV. Em seu novo cargo na AMD, Keller deve estar focado no design de microprocessadores que tenham alto desempenho e baixo consumo de energia, que devem ser a base dos próximos produtos da empresa.

Assine a tag processador para ser avisado sempre que novos conteúdos marcados pela tag forem publicados

Ele já passou vários anos trabalhando na AMD há mais de dez anos, e fez parte da equipe que projetou as séries AMD Athlon 64 e Opteron 64. Antes de trabalhar na Apple, foi vice-presidente de Design na P.A. Semi, escritório especializado em processadores para celular com baixo-consumo de energia que foi comprado pela empresa de Steve Jobs em 2008.

Agora essa AMD vai andar! :D

http://amd.adrenaline.uol.com.br/tecnologia/noticias/13449/amd-contrata-novo-arquiteto-de-processadores.html

  • Curtir 1
Postado
Ele já passou vários anos trabalhando na AMD há mais de dez anos, e fez parte da equipe que projetou as séries AMD Athlon 64 e Opteron 64. Antes de trabalhar na Apple, foi vice-presidente de Design na P.A. Semi, escritório especializado em processadores para celular com baixo-consumo de energia que foi comprado pela empresa de Steve Jobs em 2008.

Ele projetou foi o K8 original que foi cancelado por ser ambicioso demais, não o K7 melhorado que foi chamado de Opteron64/Athlon64.

E a PA Semi não fazia chips para celulares, mas sim para roteadores e coisas do tipo. Dizem que o último chip deles também visava os Macs PPC, mas a Apple preferiu migrar para CPUs x86.

EDIT: Pelo visto o K8 original foi projetado por David Witt, a segunda tentativa foi feita por Jim Keller e a terceira por Fred Weber (e a terceira foi o K7 melhorado chamado de Athlon64).

Postado
Ele projetou foi o K8 original que foi cancelado por ser ambicioso demais, não o K7 melhorado que foi chamado de Opteron64/Athlon64.

E a PA Semi não fazia chips para celulares, mas sim para roteadores e coisas do tipo. Dizem que o último chip deles também visava os Macs PPC, mas a Apple preferiu migrar para CPUs x86.

EDIT: Pelo visto o K8 original foi projetado por David Witt, a segunda tentativa foi feita por Jim Keller e a terceira por Fred Weber (e a terceira foi o K7 melhorado chamado de Athlon64).

Será que esse K8 "original" seria bom?

Postado
Será que esse K8 "original" seria bom?

Só Deus sabe.

  • Membro VIP
Postado
Esses OEMs já apareceram aqui no tópico antes, pelo que me lembro. ;)

como nenhum site de review teve a brilhante ideia de gastar 600 dolares, comprar a bagaça e fazer um review contra o i3?

  • Membro VIP
Postado
como nenhum site de review teve a brilhante ideia de gastar 600 dolares, comprar a bagaça e fazer um review contra o i3?

Cláusula de NDA ou falta de vontade em gastar essa grana com o bicho ?

  • Membro VIP
Postado

Galera, tenho um "boato".

Especulo que o FX-8300 deve sair rápido. Porque da especulacao? Entrei hoje no site de um distribuidor de hardware que costumo comprar e vi na home:

Unlock the world's first 8-core desktop CPU. Coming soon.

http://clip2net.com/s/2b6ua

Na página com precos ainda nao tem nenhum FX-8300. Será que sai logo? Vou ver se especulo com a vendedora rss.

  • Membro VIP
Postado
Ou a vendedora está atrasada e vai começar a vender os FX 81*0, porque este mote aí foi dele.

Nao, os primeiros FX eles vendem desde o lancamento. Aqui ao menos para comprar coisa de lancamento presta rsss.

Isso nao foi a vendedora que me passou, está na home page do distribuidor. Será que os FX já estão para ser embarcados e despachados?

Postado
Nao, os primeiros FX eles vendem desde o lancamento. Aqui ao menos para comprar coisa de lancamento presta rsss.

Isso nao foi a vendedora que me passou, está na home page do distribuidor. Será que os FX já estão para ser embarcados e despachados?

Tomara! Tudo o que a AMD não precisa é de outro "Another Major Delay". ;)

  • Curtir 1
  • Membro VIP
Postado
Tomara! Tudo o que a AMD não precisa é de outro "Another Major Delay". ;)

Sim, o que é lancamento chega rápido aqui. A única coisa que demorou foram as APUs (notebooks com APU mais especificamente), mas chegaram.

Agora que o Evandro falou, me veio outra teoria: por falta de algo melhor para promover os produtos da AMD, largaram esse banner na página. Mas acho que deve vir novidades, porque nao tinha visto esse banner antes.

Postado

Membro do fórum Coolaler afirma ter em mãos ES da nova CPU FX-8350 e começa a partilhar algumas particularidades, nada colclusivo, já que o clock está ou pra mais ou pra menos.

http://www.coolaler.com/showthread.php/292963-%E5%82%B3%E8%AA%AA%E4%B8%ADAMD%E4%B8%8B%E4%B8%80%E4%BB%A3%E8%99%95%E7%90%86%E5%99%A8-quot-%E6%89%93%E6%A8%81%E6%A9%9FPiledriver-quot-%E8%AB%8B%E4%BD%8E%E8%AA%BF%E6%9C%8D%E7%94%A8!/page12?

202416_499421983405786_729584999_o.jpg622325_499428010071850_1320080374_o.jpg

  • Curtir 3
Postado

Agora me ocorreu uma coisa, alguém já viu comparativo daquela versão do SuperPI modificada para usar SSE, rodando num FX e num SandyBridge, por exemplo?

Visitante
Este tópico está impedido de receber novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...