Ir ao conteúdo
  • Cadastre-se

AMD Bulldozer / Bobcat / Zambezi - Plataformas.


Posts recomendados

É possível, o aumento não é nada expressivo. Segundo alguns usuário de Asus, uma Bios em específico tem melhor desempenho para o Thuban e outra tem melhor desempenho para o Zambezi.

Isso trás uma luz no fim do túnel, pois se um upgrade de BIOS melhora ligeiramente o desempenho (e quem sabe também o consumo elétrico) e se o Windows 8 tiver um agendador otimizado como muitos falam, trazendo mais um ligeiro aumento de desempenho, já é alguma coisa para tornar o Bulldozer e produtos futuros da AMD mais competitivos. "De grão em grão a galinha enche o papo." Vamos ver até onde isso vai. Será que algum upgrade de BIOS pode consertar o bug do turbo?

Link para o comentário
Compartilhar em outros sites

26 December Launch Date for AMD A8 3870K and A6 3670K Black Edition Unlocked APUs

http://www.techpowerup.com/156834/26-December-Launch-Date-for-AMD-A8-3870K-and-A6-3670K-Black-Edition-Unlocked-APUs.html

Pelo slide o a6 tá empatado em cpu com o i3, parecem interessantes, a capacidade de over do llano talvez faça com q fique acima do i3.

Link para o comentário
Compartilhar em outros sites

Isso trás uma luz no fim do túnel, pois se um upgrade de BIOS melhora ligeiramente o desempenho (e quem sabe também o consumo elétrico) e se o Windows 8 tiver um agendador otimizado como muitos falam, trazendo mais um ligeiro aumento de desempenho, já é alguma coisa para tornar o Bulldozer e produtos futuros da AMD mais competitivos. "De grão em grão a galinha enche o papo." Vamos ver até onde isso vai. Será que algum upgrade de BIOS pode consertar o bug do turbo?

Qual bug no turbo?

Link para o comentário
Compartilhar em outros sites

Então vai de i3, que vem com HD2000 ou HD3000, mais do que suficiente para uma interface gráfica 2D, além de prover economia de energia e uma capacidade de CPU maior.

Bom, se o Eriberto vai usar como um NAS, acho que iria no mais barato. Se quiser uma potência maior no cpu, já poderia pegar um celeron g5xx ou pentium g620 que daria e sobraria. Eles vem com o intel hd graphics (o i3 2100 vem com o hd 2000).

Comparação entre E-350 e pentium G620: http://www.anandtech.com/bench/Product/328?vs=406

Celeron 530

Pentium G620

O E-350 deve levar vantagem no consumo e na placa mãe melhor equipada se comparado com uma de chipset h61 da intel. A intel leva vantagem no preço (pelo menos aqui no Brasil) e no poder de processamento.

Mas, sinceramente, para um NAS isso seria suficiente (e seguiria as dicas do tópico "A TOASTER" para deixá-lo menos quente): http://www.dealextreme.com/p/standalone-bittorrent-bt-client-usb-nas-ftp-samba-printer-upnp-sharing-network-lan-server-26320

Link para o comentário
Compartilhar em outros sites

  • Membro VIP

No meu caso eu acho que iria de E-350 ou Llano realmente por causa da placa, porque se fosse pela cpu, i3 na cabeça.

A umas páginas atrás eu havia falado sobre o agendador do Win 7 que seria atualizado ;)

Só que leio tanta coisa que perco as referências :(

Link para o comentário
Compartilhar em outros sites

Bom, se o Eriberto vai usar como um NAS, acho que iria no mais barato. Se quiser uma potência maior no cpu, já poderia pegar um celeron g5xx ou pentium g620 que daria e sobraria. Eles vem com o intel hd graphics (o i3 2100 vem com o hd 2000).

Comparação entre E-350 e pentium G620: http://www.anandtech.com/bench/Product/328?vs=406

Celeron 530

Pentium G620

O E-350 deve levar vantagem no consumo e na placa mãe melhor equipada se comparado com uma de chipset h61 da intel. A intel leva vantagem no preço (pelo menos aqui no Brasil) e no poder de processamento.

Mas, sinceramente, para um NAS isso seria suficiente (e seguiria as dicas do tópico "A TOASTER" para deixá-lo menos quente): http://www.dealextreme.com/p/standalone-bittorrent-bt-client-usb-nas-ftp-samba-printer-upnp-sharing-network-lan-server-26320

Não é meio injusto comparar um pentium a E-350, o certo seria não seria um atom????

Link para o comentário
Compartilhar em outros sites

Pelo que eu vi esse patch faz o windows reconhecer os Bulldozer como 4 núcleos / 8 threads e adota a mesma estratégia dos i7: aloca um processo para o primeiro núcleo de cada módulo antes de começar a usar o segundo núcleo de cada módulo.

O que é justamente o contrário do que a AMD recomenda...

Alguns casos podem se beneficiar ligeiramente dessa estratégia, já que programas que usam até 4 threads, cada thread terá um módulo inteiro para si.

Mas isso não fará com que o processador aproveite muito mais o Turbo. Pelo visto isso só acontecerá no Windows 8 mesmo.

Agora o que me preocupa é que em alguns casos ele pode perder desempenho. Tudo bem que são menos comuns que os casos onde o patch trará benefícios, mas no WinRAR, por exemplo, que usa poucos threads e depende de muita comunicação entre eles.

Antes dependia um pouco da sorte, de coincidir dos threads caírem em núcleos vizinhos (do mesmo módulo) assim eles podiam compartilhar dados pelo cache L2 do módulo. Agora é certeza que isso não vai acontecer, os threads vão cair um em cada módulo e eles terão que compartilhar dados pelo cache L3 (bem mais lento).

O resultado (abaixo), o desempenho no Winrar caiu pela metade!

http://www.octeamdenmark.com/forums/nyheder/9028-microsoft-klar-med-hotfix-til-bulldozer.html

edit:

Por outro lado, há relatos de melhora em jogos. Média e máxima não mudaram, mas o FPS mínimo aumentou:

http://www.overclock.net/t/1185039/the-1st-windows-7-scheduler-patch-results-are-in-have-fun

edit 2:

o ht4u fez vários testes com e sem o patch, os resultados flutuam bastante (vários ganharam, vários perderam desempenho):

http://ht4u.net/news/24857_patch_soll_bulldozer_unter_windows_7_beschleunigen_-_ergebnisse_enttaeuschen/

post-907959-13884961389403_thumb.jpg

post-907959-1388496138978_thumb.jpg

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Pelo que eu vi esse patch faz o windows reconhecer os Bulldozer como 4 núcleos / 8 threads e adota a mesma estratégia dos i7: aloca um processo para o primeiro núcleo de cada módulo antes de começar a usar o segundo núcleo de cada módulo.

O que é justamente o contrário do que a AMD recomenda...

Alguns casos podem se beneficiar ligeiramente dessa estratégia, já que programas que usam até 4 threads, cada thread terá um módulo inteiro para si.

Mas isso não fará com que o processador aproveite muito mais o Turbo. Pelo visto isso só acontecerá no Windows 8 mesmo.

Agora o que me preocupa é que em alguns casos ele pode perder desempenho. Tudo bem que são menos comuns que os casos onde o patch trará benefícios, mas no WinRAR, por exemplo, que usa poucos threads e depende de muita comunicação entre eles.

Antes dependia um pouco da sorte, de coincidir dos threads caírem em núcleos vizinhos (do mesmo módulo) assim eles podiam compartilhar dados pelo cache L2 do módulo. Agora é certeza que isso não vai acontecer, os threads vão cair um em cada módulo e eles terão que compartilhar dados pelo cache L3 (bem mais lento).

O resultado (abaixo), o desempenho no Winrar caiu pela metade!

http://www.octeamdenmark.com/forums/nyheder/9028-microsoft-klar-med-hotfix-til-bulldozer.html

edit:

Por outro lado, há relatos de melhora em jogos. Média e máxima não mudaram, mas o FPS mínimo aumentou:

http://www.overclock.net/t/1185039/the-1st-windows-7-scheduler-patch-results-are-in-have-fun

edit 2:

o ht4u fez vários testes com e sem o patch, os resultados flutuam bastante (vários ganharam, vários perderam desempenho):

http://ht4u.net/news/24857_patch_soll_bulldozer_unter_windows_7_beschleunigen_-_ergebnisse_enttaeuschen/

Grande mestre! Pelo que dá para preceber com isto, acerdito eu, é um detalhe muito importante: precisam corrigir os bdz (além de outras milhões de correções) e chegar a um resultado onde compartilhar as informações entre os núcleos de um módulo seja tão rápido quanto com outro módulo pelo l3. Desta form, poderão agendar sempre para preencher um módulo primeiro, o que trará benefícios no sentido de melhor aproveitar o turbo e na economia de energia, pois permitirá desligar os demais módulos por completo, certo?

Com esta postagem sua, Ziebert, cheguei a uma conclusão de que o BDZ como está atualmente não tem muita solução a não ser corrigir a arquitetura. As melhoras de agendamento trouxeram ganhos, mas detonaram em outros pontos. Não sei se concluí errado, mas não tem muito o que mexer a favor dos BDz atualmente.

Link para o comentário
Compartilhar em outros sites

Hausak, fazer núcleos em módulos diferentes compartilharem dados pelo L3 com a mesma velocidade de núcleos dentro do mesmo módulo compartilham pelo L2 é meio que impossível, o L3 é mais lento porque é maior e acessado por vários núcleos, enquanto o L2 é menor e acessado por apenas 2 núcleos...

O problema não é a arquitetura, mas o agendador do Windows.

Esse patch não é ideal mas vejo como uma solução simples da Microsoft para oferecer um pouco de ganho aos usuários do Bulldozer.

O Windows 8 é que será capaz de aproveitá-los corretamente, "preenchendo" os módulos antes de acordar os demais.

Como a penalidade por utilizar ambos núcleos dentro do módulo é pequena (há pouca diferença de desempenho entre 2 threads rodando em um núcleo de cada módulo ou nos dois núcleos do mesmo módulo) e assim o Turbo poderá ser melhor aproveitado, essa estratégia trará mais desempenho e menor consumo de energia.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Hausak, fazer núcleos em módulos diferentes compartilharem dados pelo L3 com a mesma velocidade de núcleos dentro do mesmo módulo compartilham pelo L2 é meio que impossível, o L3 é mais lento porque é maior e acessado por vários núcleos, enquanto o L2 é menor e acessado por apenas 2 núcleos...

O problema não é a arquitetura, mas o agendador do Windows.

Esse patch não é ideal mas vejo como uma solução simples da Microsoft para oferecer um pouco de ganho aos usuários do Bulldozer.

O Windows 8 é que será capaz de aproveitá-los corretamente, "preenchendo" os módulos antes de acordar os demais.

Como a penalidade por utilizar ambos núcleos dentro do módulo é pequena (há pouca diferença de desempenho entre 2 threads rodando em um núcleo de cada módulo ou nos dois núcleos do mesmo módulo) e assim o Turbo poderá ser melhor aproveitado, essa estratégia trará mais desempenho e menor consumo de energia.

Entendi... sei que o l2 é muito mais rápido e é incomparável seu acesso ao l3, mas o l3 dos BDZ tão absurdos :o.

O agendamento para um módulo inteiro como prioridade será o caminho tanto agora quanto futuramente com correções, mas ainda sim fico pasmo porque este agendamento deveria trazer somente benefícios (não considero a perda de utilizar dois núcleos de um módulo tão grande para se considerar um problema). No entanto, este agendamento faz o winrar pular bem e eficientemente, mas faz outros programas ou jogos caírem e é justamente isto que impressiona mais.

Link para o comentário
Compartilhar em outros sites

O Windows 8 é que será capaz de aproveitá-los corretamente, "preenchendo" os módulos antes de acordar os demais.

.

Uma coisa que sempre me entrigou, se preenchendo o módulo com dois threads do mesmo aplicativo, isso não faria o Bulldozer perder desempenho por conta de um único FPU? Tudo bem que de contra partida ele teria ao benefícios o turbo core e o compartilhamento de L2.

Link para o comentário
Compartilhar em outros sites

Perguntinha comum, já deve ter sido feita milhares de vezes, mas alguém poderia me explicar por que a AMD não desenvolveu uma tecnologia semelhante ao Hyper Threading ao invés de inovar com os Bulldozer?

E outra, já faz algum tempo, anunciaram uma tecnologia em que seria possível unificar o trabalhos de núcleos diferentes em prol de uma única thread, o que seria o inverso do Hyper Threading, mas depois não vi mais nenhuma notícia a respeito. Abandonaram essa ideia? Não funcionou, não foi interessante?

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Perguntinha comum, já deve ter sido feita milhares de vezes, mas alguém poderia me explicar por que a AMD não desenvolveu uma tecnologia semelhante ao Hyper Threading ao invés de inovar com os Bulldozer?

Porque, segundo a AMD, duplicar algumas partes do chip tem um resultado melhor.

Link para o comentário
Compartilhar em outros sites

Hausak, desculpe mas acho que você entendeu justamente o contrário.

Supondo um programa de 2 threads. Dar preferência a executar um thread em um núcleo de cada módulo não necessariamente sempre traz benefícios (em desempenho). Pois se dois threads forem executados nos dois núcleos do mesmo módulo perderão muito pouco rendimento (versus em um núcleo de cada módulo) e poderão compartilhar dados pelo cache L2.

Da mesma forma, se forem executados em um núcleo de cada módulo, ganharão muito pouco rendimento, mas não poderão compartilhar dados pelo L2 e sim pelo L3 (mais lento).

Foi o caso do WinRAR (que usa apenas 4 threads e depende muito do compartilhamento de dados) que perdeu desempenho com o patch.

Além disso, como o Windows 8 estará preparado para aproveitar corretamente os Bulldozer, dando preferência a executar os threads nos núcleos do mesmo módulo, mantendo os demais módulos completamente desligados para fazer Turbo nos módulos ativos.

edit: uns números para exemplificar cada caso:

(obs: são minhas estimativas/chutes, não leve muito a sério)

Supondo que 1x seja o rendimento de 1 thread em usando um núcleo de um módulo só para si (o segundo núcleo do módulo está ocioso)

Com 2 threads em um núcleo de cada módulo teríamos um rendimento teórico de 2x

Com esses mesmos 2 threads em 2 núcleos do mesmo módulo, segundo a AMD teríamos um rendimento de 1.8x

Mas fazendo isso (supondo que os demais módulos estão ociosos/desligados) podemos aproveitar o Turbo ao máximo, o que (dependendo do processador) pode nos dar um ganho de 29% (de 3.1GHz para 4GHz no FX-8120, por exemplo), portanto em vez de 1.8x teríamos 1.8x 1.29 = 2.32x

Ou seja, a estratégia de usar primeiro ambos núcleos de cada módulo (mantendo os demais desligados para poder fazer Turbo nos núcleos ativos, a estratégia que será usada pelo Windows 8) apresenta um rendimento 32% maior que usando 2 núcleos em módulos separados (com cada thread tendo um módulo todo para si, que é o que esse patch para o Windows 7 propoe)

Uma coisa que sempre me entrigou, se preenchendo o módulo com dois threads do mesmo aplicativo, isso não faria o Bulldozer perder desempenho por conta de um único FPU? Tudo bem que de contra partida ele teria ao benefícios o turbo core e o compartilhamento de L2.

Sim, mas são muito raros os programas que usam muita FPU em poucos threads. É mais provável que os programas que usam muita FPU usem todos os núcleos/threads do processador.

Alias, acho que o WinRAR é um desses poucos casos.

Link para o comentário
Compartilhar em outros sites

E outra, já faz algum tempo, anunciaram uma tecnologia em que seria possível unificar o trabalhos de núcleos diferentes em prol de uma única thread, o que seria o inverso do Hyper Threading, mas depois não vi mais nenhuma notícia a respeito. Abandonaram essa ideia? Não funcionou, não foi interessante?

Dois núcleos sobre o mesmo thread???

Só se dobrar o as unidades de execução, mas continua sendo um único Núcleo, o que se fez foi separar em dois grupos as ALUs, assim torna possível executar dos threads ao mesmo tempo. Se eu estiver certo.

Link para o comentário
Compartilhar em outros sites

Porque, segundo a AMD, duplicar algumas partes do chip tem um resultado melhor.

Então aí está o grande tiro no pé: digamos que processadores Bulldozer e Sandy Bridge tivessem o mesmo desempenho single thread. Se comparássemos os Bulldozer FX 8xxx com os Core i7, em multithreading, sendo que os primeiros têm 8 threads reais, ganhariam dos i7 com tranquilidade. Entretanto, a AMD resolveu chamá-los de processadores de 8 núcleos, o que foi ultra-pretensioso, e resultou no que vimos.

Ainda assim, volto à questão: por que não desenvolver tecnologia similar? Ao que consta, o Hyper Threading funciona como torcer o pano de chão o mais forte possível: sempre sai umas gotas a mais de água. E nós vemos que mesmo os aplicativos superparalelizados deixam de usar algumas unidades de execução, caso contrário i5 e i7 nessas aplicações teriam o mesmo desempenho sob o mesmo clock.

Link para o comentário
Compartilhar em outros sites

Visitante
Este tópico está impedido de receber novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...

Ebook grátis: Aprenda a ler resistores e capacitores!

EBOOK GRÁTIS!

CLIQUE AQUI E BAIXE AGORA MESMO!