Ir ao conteúdo
  • Cadastre-se

AMD Bulldozer / Bobcat / Zambezi - Plataformas.


Posts recomendados

Nav, o Eduardo deve estar muito melhor habilitado a comentar sobre o assunto do que eu. Mas pelo que entendi dos comentários do desenvolvedor do X264 o BD é um pouco lento para executar SSE e AVX.

Agora as instruções XOP são fantásticas.

Realizar uma CABAC com SSE, AVX ou FMA demora cerca de 340 ciclos.

Fazendo uma boa otimização "na unha" ele conseguiu baixar para 253 ciclos.

Fazendo uns ajustes rápidos em assembly para aproveitar as XOP ele baixou para 93 ciclos!

Uma coisa interessante é que o BD suporta FMA (Fused Multiply ADD) nos registros de SSE.

Outro detalhe que chamou atenção é que operações MOVE (pelo que eu entendi ele se refere a mover dados de um registro a outro) são "de gratis". Isso seria uma novidade exclusiva do AVX, mas o BD faz também para outras instruções.

Uma observação é que o Bulldozer suporta FMA4, o SandyBridge não suporta FMA e a Intel só implementará suporte a FMA3 no Haswell. E parece que o Piledriver vai suportar FMA3 também.

FMA3 e FMA4 são coisas diferentes porque com FMA3 você multiplica dois números, soma com um terceiro mas tem que salvar o resultado em um dos 3 registros usados.

Com FMA4 você multiplica dois números, soma com um terceiro e salva o resultado em um quarto registro. Assim você não precisa se preocupar em perder/modificar dados de entrada, o que facilita bastante a programação (ou pelo menos o trabalho do compilador).

  • Curtir 4
Link para o comentário
Compartilhar em outros sites

wencell, FMA é uma espécie de atalho. A grosso modo é como fundir 2 linhas de código em uma só (uma multiplicação e uma soma).

Teoricamente qualquer programa pode se beneficiar disso, desde que o compilador saiba aproveitar o recurso.

O que me preocupa disso é justamente como os processadores Intel ainda não suportam FMA e os compiladores mais usados tendem a privilegiar os processadores Intel em termos de otimização, muitos programas novos podem continuar saindo sem tirar proveito do FMA...

Link para o comentário
Compartilhar em outros sites

wencell, FMA é uma espécie de atalho. A grosso modo é como fundir 2 linhas de código em uma só (uma multiplicação e uma soma).

Teoricamente qualquer programa pode se beneficiar disso, desde que o compilador saiba aproveitar o recurso.

O que me preocupa disso é justamente como os processadores Intel ainda não suportam FMA e os compiladores mais usados tendem a privilegiar os processadores Intel em termos de otimização, muitos programas novos podem continuar saindo sem tirar proveito do FMA...

Essa sempre foi a tônica da AMD.

Se a Intel cria ou implementa algo, então, ele se torna padrão no mercado, porém neste meio tempo, a AMD leva cascudo e um monte de donzelos em fóruns ficam detonando os processadores dela.

Se a AMD cria ou implementa algo, ele passa desapercebido, porque o mercado só implementa o que a Intel quer...

Enfim... Deste jeito, temo que a AMD nunca vai poder concorrer com a Intel em pé de igualdade no quesito desempenho, a menos que reinvente a roda, como no caso dos processadores de 64bits, pois as melhorias desenvolvidas e implementadas, não servem pra nada, até que a Intel as adote também.

  • Curtir 1
Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Essa sempre foi a tônica da AMD.

Se a Intel cria ou implementa algo, então, ele se torna padrão no mercado, porém neste meio tempo, a AMD leva cascudo e um monte de donzelos em fóruns ficam detonando os processadores dela.

Se a AMD cria ou implementa algo, ele passa desapercebido, porque o mercado só implementa o que a Intel quer...

Enfim... Deste jeito, temo que a AMD nunca vai poder concorrer com a Intel em pé de igualdade no quesito desempenho, a menos que reinvente a roda, como no caso dos processadores de 64bits, pois as melhorias desenvolvidas e implementadas, não servem pra nada, até que a Intel as adote também.

Mas aí tem que ver o seguinte também:

Os programadores vão preferir otimizar para a empresa que tem 80% do mercado ou para a que tem 20%? Por isso que a AMD muitas vezes se ferra e ainda tem que esperar a Intel lançar algo para poder copiar (no caso o FMA3) e assim ter os mesmos benefícios que vem do "favorecimento" dos programadores...

  • Curtir 1
Link para o comentário
Compartilhar em outros sites

Mas aí tem que ver o seguinte também:

Os programadores vão preferir otimizar para a empresa que tem 80% do mercado ou para a que tem 20%? Por isso que a AMD muitas vezes se ferra e ainda tem que esperar a Intel lançar algo para poder copiar (no caso o FMA3) e assim ter os mesmos benefícios que vem do "favorecimento" dos programadores...

Não que seja teoria da conspiração, mas é que a maioria dos benchs utilizados para mostrar ao mercado quem manda, não são feitos por programadores autônomos ou pequenas empresas.

O povo usa compilador intel, otimiza para conjuntos de instruções muitas vezes constantes nos processadores intel e por ai vai...

Mas, deixa pra lá, que daqui há pouco isto vai se tornar uma discussão sem sentido.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
O 7-Zip se aproveita do L3, mas pouco (aprox. 5%). O Winzip 12 apresentava um menor benefício com o L3 (9%) do que o WinRar 3.9 64 bits (16%). Isso testando um Athlon II X4 (Phenom sem L3) vs um Phenom II X4 com clocks equiparados. Ressalta-se que o Winzip já está na versão 15 e que o aproveitamento pode ter melhorado de lá para cá.

Link: http://www.tomshardware.com/reviews/athlon-l3-cache,2416-7.html

Certo, isso eu sei, só aí que vi diferença significativa nos testes de processadores "desktop" por causa do L3, mas e comparando um Phenom 8** com 4 MiB de cache e o com 6, qual a diferença entre eles ?

Uma observação é que o Bulldozer suporta FMA4, o SandyBridge não suporta FMA e a Intel só implementará suporte a FMA3 no Haswell. E parece que o Piledriver vai suportar FMA3 também.

FMA3 e FMA4 são coisas diferentes porque com FMA3 você multiplica dois números, soma com um terceiro mas tem que salvar o resultado em um dos 3 registros usados.

Com FMA4 você multiplica dois números, soma com um terceiro e salva o resultado em um quarto registro. Assim você não precisa se preocupar em perder/modificar dados de entrada, o que facilita bastante a programação (ou pelo menos o trabalho do compilador).

A pergunta que não quer calar, porque "regredir" ? Ter a FMA4 não implica em ter (pelo menos boa parte) da FMA3 ?

Ah, e só de trocar o compilador do meu micro eu já teria a melhoria ou o desenvolvedor tem que trocar o compilador no desenvolvimento do programa ?

Se a AMD cria ou implementa algo, ele passa desapercebido, porque o mercado só implementa o que a Intel quer...

Coffff, SSE5, cofff !!

V i X, bom ponto. :joia:

  • Curtir 1
Link para o comentário
Compartilhar em outros sites

Mas aí tem que ver o seguinte também:

Os programadores vão preferir otimizar para a empresa que tem 80% do mercado ou para a que tem 20%? Por isso que a AMD muitas vezes se ferra e ainda tem que esperar a Intel lançar algo para poder copiar (no caso o FMA3) e assim ter os mesmos benefícios que vem do "favorecimento" dos programadores...

Claro, eles estão mais que certos em privilegiar o maior público.

O problema é que o compilador mais usado é feito pela Intel, ele pode simplesmente "esquecer" de implementar algumas otimizações para processadores concorrentes, mesmo que elas já sejam suportadas. E a Intel vai muito se preocupar em implementar otimizações que só o concorrente suporta né...

O que vejo como ideal seria que todo mundo adotasse como padrão o GCC, por exemplo. E que AMD e Intel fizessem elas mesmas as bibliotecas de otimização para os seus processadores.

A pergunta que não quer calar, porque "regredir" ? Ter a FMA4 não implica em ter (pelo menos boa parte) da FMA3 ?

Justamente para pegar carona em programas otimizados para Intel. Assim, quando o Haswell sair e o mercado todo começar a otimizar seus programas para FMA3, os processadores AMD também serão beneficiados.

Enquanto isso, quem quiser otimizar especificamente para AMD, já pode aproveitar o suporte a FMA4 desde o Bulldozer.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Essa sempre foi a tônica da AMD.

Se a Intel cria ou implementa algo, então, ele se torna padrão no mercado, porém neste meio tempo, a AMD leva cascudo e um monte de donzelos em fóruns ficam detonando os processadores dela.

Se a AMD cria ou implementa algo, ele passa desapercebido, porque o mercado só implementa o que a Intel quer...

Enfim... Deste jeito, temo que a AMD nunca vai poder concorrer com a Intel em pé de igualdade no quesito desempenho, a menos que reinvente a roda, como no caso dos processadores de 64bits, pois as melhorias desenvolvidas e implementadas, não servem pra nada, até que a Intel as adote também.

Acho redundante, mas é bom lembrar :)

O 3Dnow da AMD era mais utilizado do que o MMX da Intel ;) e bem mais quisto e útil para jogos, pena que o IPC dos K6-2 era fraco :(

E pelo que entendi do grosso da discussão dessa página, um código bem otimizado para as instruções que o BDZ vai suportar, diminuíram bem o consumo de ciclos, é isso? Quer dizer: um programa bem otimizado para BDZ utilizando essas instruções vai ser mais rápido em algumas aplicações específicas que utilizem essas instruções?

Outra dúvida: a AMD faz/comercializa compiladores? Pergunto porque sei que a Intel o faz e seus compiladores tem um ajuste mínimo de códigos que otimiza os mesmos para utilizarem as instruções existentes no processador.

Exemplo:

Código que não utiliza SSE2, o compilador se encarrega de minimamente fazer o código utilizar essas instruções, dando uns 10% a mais de desempenho no código não-otimizado.

  • Curtir 1
Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Claro, eles estão mais que certos em privilegiar o maior público.

O problema é que o compilador mais usado é feito pela Intel, ele pode simplesmente "esquecer" de implementar algumas otimizações para processadores concorrentes, mesmo que elas já sejam suportadas. E a Intel vai muito se preocupar em implementar otimizações que só o concorrente suporta né...

O que vejo como ideal seria que todo mundo adotasse como padrão o GCC, por exemplo. E que AMD e Intel fizessem elas mesmas as bibliotecas de otimização para os seus processadores.

Não seria o caso de achar que o compilador da Intel oferece algo a mais que os outros? Em uma pesquisa rápida no Google achei referências de que os compiladores da Intel seriam mais eficientes que o GCC, por exemplo.

Link para o comentário
Compartilhar em outros sites

Antes que eu esqueça DE NOVO de postar isso: Vishera no Q3 2012.

http://www.fudzilla.com/processors/item/24345-vishera-bulldozer-fx-successor-in-q3-12

Tomara que com este, a AMD não seja novamente Another Major Delay!

Mesmo assim, acho que vou comprar os Bulldozer mesmo, mas daqui uns 5 meses, quando já devem surgir novas revisões com clocks maiores e menos consumo.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Não seria o caso de achar que o compilador da Intel oferece algo a mais que os outros? Em uma pesquisa rápida no Google achei referências de que os compiladores da Intel seriam mais eficientes que o GCC, por exemplo.

Exato, da mesma forma que ele é melhor que o Visual C por exemplo. A diferença que o GCC é livre o povo tem que fazer funcionar na raça, sem um caixa gigante e uma cornucópia mágica de onde brota dinheiro, no caso do Visual C a MS tem sua cornucópia e dos compiladores Intel, além da cornucópia, eles fabricam os processadores e tem acesso a tudo o que um compilador para seus produtos deve ter.

E do BDZ, mesmo querendo muito um review, será que sai mesmo? Alguém poderia ao menos dizer: Os sites já tem um exemplar para review, nem precisa dizer qual site, só não vale o OBR :P

Link para o comentário
Compartilhar em outros sites

Essa sempre foi a tônica da AMD.

Se a Intel cria ou implementa algo, então, ele se torna padrão no mercado, porém neste meio tempo, a AMD leva cascudo e um monte de donzelos em fóruns ficam detonando os processadores dela.

Se a AMD cria ou implementa algo, ele passa desapercebido, porque o mercado só implementa o que a Intel quer...

Enfim... Deste jeito, temo que a AMD nunca vai poder concorrer com a Intel em pé de igualdade no quesito desempenho, a menos que reinvente a roda, como no caso dos processadores de 64bits, pois as melhorias desenvolvidas e implementadas, não servem pra nada, até que a Intel as adote também.

Faço das suas palavras as minhas. A "Gigante Azul" continua ditando os padrões, é como eu expliquei há algum tempo (e posts) atrás, num exemplo sobre um emulador de PS2 que há muito tempo privelegia as instruções SSE4 e SSSE3 nos processadores Intel e com isso os jogos emulados fluíam melhor num Core 2 Quad 2,4GHz e 65nm do que no meu Phenom II 3,6GHz e 45nm que possui somente instruções SSE3. E quanto aos compiladores, infelizmente vai sempre ser assim, vide a NVIDIA que patrocina 90% dos jogos...

Link para o comentário
Compartilhar em outros sites

Só uma observação, acho que isso mudou, pois não vejo mais propaganda de jogos patrocinados pela NVIDIA, é raro ver, já a logo Gaming Evolved, e AMD? Direto! :D

Deve ter mudado, mas ainda assim a NVIDIA patrociona uma porcentagem maior dos jogos, até porque a maioria das placas low, são vendidados por ela, logo ela tem mais dinheiro para investir, ainda vejo muita gente que tem Intel(Celeron)+Geforce 8400GS e enche a boca para falar. AMD até patrocina, Game Envolved e tal, mas exceto alguns casos, os jogos patrocinados por ela não tem "nome de peso" ou uma legião de fãs, posso até está enganado, e se tiver por favor fique a vontade para me corrigir, pois não jogo há algum tempo devido a morte prematura da minha HD5770, que por sinal irei enviar para o RMA e detalharei todo o processo no fórum de VGAs daqui a alguns dias (vou pedir até a ajuda de algum moderador como o Evandro, ou Eriberto, para que o tópico seja destacado, para se torna uma base de consulta para RMA da Sapphiretech, que por sinal é muito complicado).

Link para o comentário
Compartilhar em outros sites

  • Membro VIP

E do BDZ, mesmo querendo muito um review, será que sai mesmo? Alguém poderia ao menos dizer: Os sites já tem um exemplar para review, nem precisa dizer qual site, só não vale o OBR :P

http://www.guru3d.com/news/amd-bulldozer-fxseries-launch-date-confirmed/

Quase certeza que sim (99%).

--

http://www.techpowerup.com/153098/AMD-Readies-Opteron-4200-Valencia-Line-for-1P-2P-Servers.html

AMD prepara Opterins Valencia para sistemas 1P/2P.

http://www.fudzilla.com/processors/item/24344-single-core-zacate-retires-in-q4-2011

"Zacatinho" mononuclear (E-350) deve sair de linha até o fim do ano, com envio até Q2 de 2012, o E-240 deve morrer meso até o fim do ano, e o E-300 pode durar até o ano que vem. Os que vão sair de linha serão substituídos pelo E-450. Wichita vem na segunda metade de 2012 pra substituir os Zacates.

Link para o comentário
Compartilhar em outros sites

Parece que vem mesmo em caixa de biscoito :D

FXTinCan.jpg

FXOuterProc.jpg

FXBuckle.jpg

P1000373.jpg

Para os entendidos

http://www.cpubenchmark.net/cpu.php?cpu=AMD+FX-8150+Eight-Core

Porque o I7 2600k ganha do I7 2600 sob o mesmo clock? a diferença não é apenas o fato de ser desbloqueado?

o FX 8150 fica na meiuca entre o 2500k e o 2600k

O gráfico de preço o 8150 aparece zerado, pois, ainda não está a venda? fiquei sem entender

Link para o comentário
Compartilhar em outros sites

Evandro, uma correçãozinha:

O E-240 é single core 1.5GHz

O E-300 é dual core 1.3GHz

O E-350 é dual Core 1.6GHz.

E o E-450 é dual core 1.3GHz/1.65GHz (Turbo)

Isso tudo com TDP de 18w (Zacate)

O E-300 substitui o E-240 (portanto o único Single Core será aposentado), e o E-450 substitui o E-350 (além de Turbo, o E-450 tem um clock um pouquinho maior na GPU).

Em 9w (Ontario), o C50 (dual core 1GHz) será substituído pelo C-60 (1GHz, Turbo para 1.3GHz).

Não estou encontrando informações sobre a versão single core, mas é provável que seja eliminada também.

Link para o comentário
Compartilhar em outros sites

Para os entendidos

http://www.cpubenchmark.net/cpu.php?cpu=AMD+FX-8150+Eight-Core

Porque o I7 2600k ganha do I7 2600 sob o mesmo clock? a diferença não é apenas o fato de ser desbloqueado?

o FX 8150 fica na meiuca entre o 2500k e o 2600k

O gráfico de preço o 8150 aparece zerado, pois, ainda não está a venda? fiquei sem entender

ali diz 1090 melhor custo/beneficio, xd:D

agora fiquei feliz, rsrsrsr

Link para o comentário
Compartilhar em outros sites

Visitante
Este tópico está impedido de receber novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...

 

GRÁTIS: ebook Redes Wi-Fi – 2ª Edição

EBOOK GRÁTIS!

CLIQUE AQUI E BAIXE AGORA MESMO!