Ir ao conteúdo
  • Cadastre-se

aziebert

Membro Pleno
  • Posts

    353
  • Cadastrado em

  • Última visita

Tudo que aziebert postou

  1. Eu adoro quando o Charlie desabafa sobre o "niver" de certos analistas de tecnologia que andam por aí respirando nosso precioso ar.
  2. @Edcreek, esses bank conflicts no cache L1 de instruções (que é compartilhado por ambos núcleos do módulo, já que eles compartilham o frontend) devem ser a origem daquele problema que observaram no Linux, onde um thread ficava poluindo o cache, forçando o outro a buscar informações no nível seguinte. Mas falaram que só afetava o desempenho em uns 3% e a solução proposta era perigosa demais para ser implementada... @Pistigrilo, mas a ideia do Bulldozer é ganhar muito clock com pouca perda de IPC. O Pipeline foi alongado +- 50% em relação ao K10. Não é 2 a 3 vezes maior, como se você comparar um Core 2 Duo e um Pentium 4. O problema é que o processo de fabricação não permite clocks altos o suficiente para compensar a diferença de IPC. E nesse caso não me refiro à redução de IPC pelo alongamento do pipeline, mas à simplificação dos núcleos (que foram reduzidos de 3 para 2 ALUs). Considerando todas essas dificuldades, o resultado ainda foi muito bom. O Bulldozer faz cerca de 80% da IPC do K10. Quando ele puder operar com clock pelo menos 30% maior que o K10 ele já não deve perder em nada. Isso deve acontecer já no Piledriver. Aí entram em jogo as outras vantagens da arquitetura: 8 núcleos, FPU muito mais forte, suporte a novas instruções (AVX, XOP e FMA), caches maiores, controladora de memória melhorada, Turbo mais agressivo e inteligente (quando pareado ao Windows 8), etc. E respondendo ao JovaKz, a plataforma AM3+ deve ir até o final de 2013. O Vishera (8 núcleos Piledriver) será lançado no terceiro trimestre desse ano.
  3. Análise da arquitetura Bulldozer do ponto de vista de um desenvolvedor de software: http://semiaccurate.com/forums/showpost.php?p=154836&postcount=132 Para quem se interessar, o cidadão tem vários guias de otimização muito bons: http://www.agner.org/optimize/
  4. Pergunto, como fica a refrigeração de um sanduicheiche desses? Imagine uma CPU grande + uma GPU grande + um monte de memória na mesma área... Será que dá pra preparar refrigeração por ambos lados da placa? edit: achei uma foto do processador do PS4:
  5. As DDR4 ainda estão longe (2014), o Kaveri tem que sair em 2013. O design do chip já deve estar pronto, o tape out não deve demorar (se é que já não aconteceu, lembra que o Trinity foi mostrado funcionando no lançamento do Llano!?). E memórias GDDR5 suficientes para montar um barramento significativo (2 chips para cada 64 bits, precisaria de pelo menos 128 bits) encareceriam muito a solução. Sem falar que a AMD vai lançar a nova plataforma (FM2) agora. Um chute na boca de quem comprou uma placa FM1, ela não pode se dar ao luxo de trocar de plataforma todo ano. O Kaveri tem que funcionar nas placas FM2! Pelo lado bom; ainda não vi nenhum teste concreto, mas parece que a arquitetura GCN se vira bem com pouca banda, uma GPU do porte de uma HD 7750 ainda estará um bocado limitada com a banda da controladora da APU, mas deve trazer um ganho razoável (em relação à GPU do Trinity), sem falar nos ganhos em GPGPU (a arquitetura é muito boa pra isso e a HSA vai fazer o negócio decolar).
  6. Para quem se interessar, mais detalhes sobre o sistema de Resonant Clock da Cyclos: http://www.semiwiki.com/forum/content/917-clock-design-socs-lower-power-better-specs.html Hat tip: @Dresdenboy O Kaveri deve mesmo ter uma GPU do porte da HD 7750, mas eu não apostaria em sideport. Espero que ele seja FM2 e que funcione nas placas para o Trinity!
  7. Acho que desde o acordo com a Intel na época que a AMD deu o spin-off das fábricas, ela pode mandar fazer CPUs onde bem entender. Falando em acordos, lembram daquele que diz que se alguém quiser comprar a NVIDIA a Microsoft tem poder de veto. Foi feito na época do Xbox 1, mas ainda está em vigor e parece que a NVIDIA não está muito preocupada em desfazê-lo, afinal a protege de uma possível "hostile takeover", pela Intel, por exemplo...
  8. Trinity na Samsung = impossível, pois ela não tem SOI. Acho tarde demais para fazer Zacate/Ontario lá. Agora parte da produção do Kabini (substituto do Zacate/Ontario) é bem possível. A Samsung tem um bom processo de 28nm, suas fábricas devem estar meio ociosas agora que perdeu o contrato da Apple, e a AMD já desenvolve esses chips de forma que seja possível mudar de uma foundry pra outra facilmente. Eriberto, o boato da AMD fabricar Llano ou Trinity na IBM é falso porque a IBM, embora faça SOI, não tem linhas de 32nm. A única coisa verdade nessa história é que a IBM auxiliou a GlobalFoundries na construção da unidade de New York. edit: GF e Samsung usam o mesmo processo de 28nm LPH (mais barato, ideal para o Kabini): http://semiaccurate.com/2011/08/30/global-foundries-and-samsung-split-28nm-processes/
  9. Evandro, seria bem interessante o Air com Llano. O produto em si é excelente, provavelmente teria uma autonomia ainda melhor, sem falar no desempenho das aplicações OpenCL. Mas a AMD não conseguiu nem entregar amostras a tempo e não conseguiria produzir o volume que a Apple precisa. Eu acho que a AMD ainda não se queimou muito com a Apple nessa história. Teria sido muito pior se eles tivessem mandado as amostras a tempo e depois não conseguissem suprir a demanda. Então a porta ainda deve estar aberta para o Trinity.
  10. Só uma atualização sobre o IB@7GHz. Não foi com Gelo Seco, deve ter sido com Nitrogênio Líquido mesmo.
  11. O fato de terem usado gelo seco deve indicar que assim como o SandyBridge, o IvyBridge não gosta de muito frio...
  12. jonny, esse pouco de memória a menos deve ser a porção do vídeo onboard, que estava habilitado junto com as placas de vídeo (duas HD 7970). johannes, essa é pra você então. Cada processador (G34 no caso) tem 4 canais de memória e a placa tem 3 slots em cada canal.
  13. johannesrs, são 4 slots de memória por CPU, 1 para cada canal. E como cada processador tem 40 linhas PCIe, os 4 slots PCIe x16 azuis operam com banda máxima (16x PCIe 3.0). A Intel não deve lançar processadores com multiplicador desbloqueado, mas assim como nas placas X79 deve ser possível fazer um overclock no BCLK. Uma monstrinha dessas com dois Xeon de 8 núcleos (16 threads cada) @ uns 4GHz devem fazer um estrago no folding.
  14. Lembro de ter visto uns testes onde conseguiram fazer um bom overclock com undervolt num Llano. http://semiaccurate.com/forums/showthread.php?t=5494 No review do FX-4100 conseguiram quase 1GHz de overclock sem mexer no vcore. http://www.legitreviews.com/article/1766/16/ Meu palpite é que os chips sejam testados por amostragem e que haja apenas alguns chips abençoados em cada lote, assim o lote todo tem que operar com tensão mais alta para garantir a estabilidade total. Assim o consumo sofre... À medida que o processo amadurece o número de chips "abençoados" por lote aumenta.
  15. jonny, o Trinity concorre com os Sandy/Ivy 2C/4T e vídeo mais completo. Para Sandy/iVy 4C/8T só o Vishera mesmo. Em baixo consumo (notebooks) o processo de 32nm da GF rende muito bem, então o Trinity deve ter clocks maiores que os SandyBridge pelo menos. Ainda não deve ser o suficiente para igualar a performance single thread, mas em multi thread a briga deve ser boa.
  16. jonny, lembre que também mudaram a arquitetura em cada processo, cada uma escala clock de uma forma diferente...
  17. johannesrs, o processo de 22nm parece sim ter sido "tunado" para baixo consumo em vez de clocks altos, mas não acho que o negócio seja tão crítico quanto o processo de 32nm SOI HKMG da GlobalFoundries (que requer tensões muito altas para altas frequência, mandando o consumo pra cucuias).
  18. Os clocks subiram pouco ou nada, mas o consumo caiu (os i5 e i7 agora tem TDP de 77w em vez de 95w), ao mesmo tempo que o vídeo ficou mais forte e o potencial de overclock deve aumentar um bocado (5GHz no ar deve ser bem mais fácil).
  19. EduardoS sei que a AMD falou 10 a 15% de ganho em performance/watt. Mas ainda acho que a performance/watt do Bulldozer está totalmente fora de escala devido aos problemas no processo de 32nm. O processo melhorou desde o lançamento do Bulldozer e agora a AMD também tem um melhor conhecimento do processo, isso permitirá frequências bem maiores. Os avanços em IPC do Piledriver devem ser modestos, mas pelo que se ouve do Trinity podem ser significativos. Claro que o que se ouve é referente ao terreno mobile (até 35w) onde o processo de 32nm rende maravilhas. Não sei quanto disso deve se traduzir no terreno dos 125w (onde as altas frequências requerem alta tensão e aí o consumo vai pra casa do chapéu), mas eu diria que 15% em desempenho é uma margem razoável. É semelhante a o que esperamos de melhora no desempenho do SandyBridge para IvyBridge e as melhorias na arquitetura e processo (IPC + clock alto em Turbo) devem trazer uma boa melhora (mais que os tais 15%) em desempenho Single Thread.
  20. Contiusa, o tio Papermaster deixou a entender que o salto em IPC do Piledriver para o Steamroller (ou pelo menos de Steamroller para Excavator) pode ser maior que 15%: http://techreport.com/articles.x/22452/4 A diferença em IPC com certeza permanecerá grande, afinal conceitualmente as arquiteturas (AMD e Intel) são bem diferentes. Mas isso não necessariamente quer dizer que a diferença em performance (single ou multithread) também seja. Como o IvyBridge deve trazer muito pouca coisa em termos de IPC sobre o SandyBridge (menos de 5%, afinal teoricamente é só um die shrink) e os envelopes térmicos irão diminuir, a mudança de processo não trará muito em termos de performance bruta. Um i7 IvyBridge top deve ser pouca coisa (10 a 15%) mais rápido que um i7 SandyBridge top como o 2600k. Claro, ele fará isso com um consumo sensivelmente menor (77w vs 95w) o que é excelente. Enquanto isso, a AMD aproveitará para exercitar seus ganhos em performance (Bulldozer -> Piledriver, melhoras no processo de 32nm e melhor domínio sobre o mesmo) sob o mesmo envelope térmico (125w). Então no final das contas um FX Vishera deve sim ficar bem competitivo em termos de performance em relação a um i7 IvyBridge, principalmente em multithread, onde deve vencer em um número razoável de cenários. Obviamente ainda perderá em performance single thread, mas como os i7 ainda operarão a menos de 4GHz e o Vishera provavelmente terá Turbo para uns 5GHz, o gap pode não ser mais tão grande. Claro que em performance/watt o IvyBridge dará um banho de água gelada no Vishera, da mesma forma que o SandyBridge faz com o Bulldozer (o SandyBridge obtem pelo menos o dobro de performance/watt do Bulldozer). Mas em PCs high end isso não é tão importante assim.
  21. @soull, mas já se vê muito notebook com Brazos (bem mais do que o que se via antes com Athlon/Turion). O Llano é mosca branca por aqui, mas acho que com o Trinity as coisas devem melhorar bastante. Quanto ao Vishera, estimo um ganho de uns 10% em IPC e clocks razoavelmente mais altos. Deve ser o suficiente para deixá-lo mais perto dos i7 que dos i5 em termos de performance, mas o consumo ainda será um problema (principalmente agora que os i5/i7 terão TDP de 77w).
  22. Espero mesmo que o Piledriver esteja para o Bulldozer como o Phenom II para o Phenom I. Não tem a vantagem da mudança de processo, mas parece que o processo de 32nm evoluiu bastante. Resolveram os problemas de produção, o Yield aumentou e melhorias no processo permitem clocks mais altos. E a AMD tendo mais experiência com o processo pode fazer o Piledriver sob medida para aproveitá-lo melhor.
  23. estou com o Charlie nessa, tem muita notícia sem pé nem cabeça no xbit...
  24. jonny, o chip/DIE é testado assim que fica pronto, se ele se qualifica para ser um Opteron, vai pro encapsulado de Opteron; se não, vira Phenom (se não atingir os clocks desejados com o consumo que eles precisa; ou Atlhon, se tiver algum defeito). O mesmo acontece com o Llano, se o chip não for bom o suficiente para um notebook, vai pro desktop. Se se tiver um defeito, vira um A6 ou A4 em vez de A8. Desativar pedaços do chip é a parte mais fácil do processo... O processador também tem uma espécie de firmware que diz que recursos estão ativos. Lembro que na época do Athlon64, quando os FX custavam 1000 dólares um cara descobriu como acessar essa memória nos A64, o que teoricamente permitiria desbloquear o multiplicador de qualquer processador. O problema é que ele precisava de um controlador muito raro para fazer a interface (ia fazer uma plaquinha, ligar alguns contatos a determinados pinos do processador). Isso foi perto do lançamento dos Core 2 Duo, logo a ideia perdeu a graça.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...

Ebook grátis: Aprenda a ler resistores e capacitores!

EBOOK GRÁTIS!

CLIQUE AQUI E BAIXE AGORA MESMO!