Ir ao conteúdo
  • Cadastre-se

AMD Bulldozer / Bobcat / Zambezi - Plataformas.


Posts recomendados

ah' date=' assim, só uma dúvida, AVX é uma instrução usada em ponto flutuante certo?

se for, ela seria usada por pessoas que lidam muito com gráfico. Edição de vídeos, imagens, etc... Foi nisso que pensei, porque não se trata apenas de rodar fullhd.

Agora se ela não for isso que eu penso, esqueci, eu não disso nada :D[/quote']

sim, mas essas são vetoriais, se não estou enganado significa q elas rodariam com melhor fluidez um video (corrijam-me se não for isso), você pode configurar um video pra mostrar os vetores q "formam" a imagem no seu programa de visualização de video, como o kmplayer, smplayer e outros q tenha essa opção de config.

e ainda são 256bits

wikies

Advanced Vector Extensions

XOP instruction set

mas acho q elas podem ser usadas em outras coisas... não estão aos poucos substituindo o x87 por instruções SIMD como 3dnow, sse1-2-3-4, só não sei q fim levou o mmx:confused:

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
mas não tem tanta coisa assim no mercado doméstico que use SIMD, ou tem?

Que usa ou que poderia usar?

Que usa - Não.

Que poderia usar - Sim.

E o mesmo vale para servidores.

Não, ninguém vai passar a usar só porque a Intel incluiu essas intruções e a MS incluiu os intríssicos, não é disso que eu to falando.

ah' date=' assim, só uma dúvida, AVX é uma instrução usada em ponto flutuante certo?[/quote']

Não, AVX é uma extensão das SSE (2, 3, S3, 4.1 e 4.2), agora com 256 bits e operadores não destrutivos, é usada tanto com ponto flutuante como inteiros vetoriais, por causa do modelo usado hoje as instruções de ponto flutuante escalares e vetoriais e inteiros vetoriais compartilham a mesma unidade enquanto os inteiros escalares ficam em unidades a parte, no caso do Bulldozer cada núcleo tem 4 unidades desses inteiros escalares e cada dois núcleos compartilham as unidades que executam ponto flutuante vetorial e escalar e inteiros vetoriais.

E ah, x87 foram as primeiras instruções de ponto flutuante integradas aos processadores x86 com precisão simples, dupla e extendida, MMX veio depois, mas eram instruções de inteiros vetoriais, 64 bits compartilhando os registradores da x87 (e por causa disso essa divisão de tarefas), depois a AMD lançou a 3DNow! com ponto flutuante vetorial (mas limitado a precisão simples e registradores 64 bits) compartilhando os registradores com as MMX, SSE veio depois, ponto flutuante de precisão simples em novos registradores, dessa vez com 128 bits e também adicionaram algumas instruções MMX que a AMD incluiu no primeiro Athlon, depois veio SSE2 trazendo precisão dupla e também trouxe as instruções MMX para os registradores SSE (XMM para os íntimos) ampliando-as para 128 bits, ai a AMD lançou a AMD64 duplicando o número de registradores gerais e SSE sem tocar nos da x87/MMX/3DNow!, marcando o início da obsolência desses últimos, depois SSE3 e SSSE3 apenas trazendo novas instruções, com SSE4.1 pararam de replicar as novas instruções para as MMX, elas são completamente obsoletas agora, ai a AMD ameça com SSE5 e nova codificação com operadores não-destrutivos e fundindo multiplicações e soma e por fim vem as AVX que duplicaram os registradores SSE (agora YMM para os íntimos) e os operadores não destrutivos e a fusão da multiplicação e soma em uma codificação nova.

Uffa... Resuminho simples não?

ps: To meio morto agora, pode ter erros bestas no post acima.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP

http://www.xbitlabs.com/news/video/display/20100806165804_AMD_s_Fusion_Processors_Are_Designed_to_Be_as_Fast_as_Discrete_GPUs_Company.html

Mais um diretor de alguma coisa da AMD falando que o Fusion terá desemoenho excepcional para um vídeo integrado, se bobear, mais forte que o Redwood das HD 5500. (esse foi palpite do Xbit)

Link para o comentário
Compartilhar em outros sites

Falando em ponto flutuante, nestes programas que o fazem uso, um processador Bulldozer de 8 núcleos (4 unidades de ponto flutuante) teria desempenho inferior a um 8 núcleos tradicional com 8 unidades de PF?

Na verdade, um processador Bulldozer de 8 núcleos teria 4 "blocos" de ponto flutuante, cada um com, ao que eu saiba, duas unidades de ponto flutuante de 128 bits capazes de executar FMAs. Se seu código usar FMAs, isso significa o dobro de performance bruta por "bloco" de ponto flutuante em relação aos Phenoms atuais. Se não usar, significa a mesma performance bruta (mas existe uma lenda de que cada unidade FMA poderia se dividir em duas: uma FMUL e uma FADD). Como existe um "bloco" por módulo, o Bulldozer de 8 núcleos provavelmente perderia em ponto flutuante de um Phenom de 8 núcleos, mais ou menos dependendo de quanto você usa FMAs e de quanto inteiros importa para você.

Lembrando que tudo isso é especulação. Não sei realmente como funcionará a unidade de ponto flutuante do Bulldozer. É bem provável, até por comentários de funcionários da AMD, que eu esteja subestimando muito o Bulldozer, pelo menos em códigos sem FMAs.

Que usa ou que poderia usar?

Que usa - Não.

Que poderia usar - Sim.

E o mesmo vale para servidores.

Não, ninguém vai passar a usar só porque a Intel incluiu essas intruções e a MS incluiu os intríssicos, não é disso que eu to falando.

Entendo. Mas imagino que na maior parte dos casos SIMD só valeria a pena se fosse muito mais fácil do que é hoje...

http://www.xbitlabs.com/news/video/display/20100806165804_AMD_s_Fusion_Processors_Are_Designed_to_Be_as_Fast_as_Discrete_GPUs_Company.html

Mais um diretor de alguma coisa da AMD falando que o Fusion terá desemoenho excepcional para um vídeo integrado, se bobear, mais forte que o Redwood das HD 5500. (esse foi palpite do Xbit)

O XBIT tá mal ultimamente. A fonte solta algumas coisinhas a mais...

Eu tenho a impressão de que esse blog não acrescentou muito sobre o Fusion... todo mundo sabia que eles seriam mais lentos que 5970 :). Eu mantenho minha estimativa: entre 5550 e 5570, provavelmente rodando os muitos SPs a uma frequência bem baixa para diminuir o consumo.

MAS:

And to make the point, we’ve scheduled a whole new generation of discrete GPUs for release later this year.

Isso é interessante... e ele ainda disse nos comentários que a ideia é lançar o maior número possível de peças a tempo dos feriados de fim de ano.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Nossa me confudi total agora!

Estava pensando em ir comprar meu computador sexta feira..

Mais o que é melhor espera esses processadores ou comprar logo de uma vez?

Quem sabe a resposta não vai responder pois trabalha na AMD.

6 meses é muito tempo, e outra, ao sair um Bulldozer os Phenom não se tornarão lixo, continuarão a ser bons processadores.

Link para o comentário
Compartilhar em outros sites

Quem sabe a resposta não vai responder pois trabalha na AMD.

6 meses é muito tempo, e outra, ao sair um Bulldozer os Phenom não se tornarão lixo, continuarão a ser bons processadores.

E com bons preços. Eu acredito que os Bulldozer virão com preços parecidos com o Thuban (cujos preços devem cair no lançamento do Bulldozer). assim, se houver urgencia, compre agora, caso não haja, espere (talves mais um ano até o preço estabilizar para não pagar pelo lançamento).

Link para o comentário
Compartilhar em outros sites

  • Membro VIP

Eu acho que eles vem mais caros em alguns modelos, coisa pra 600 dólares no top, mas esse é chute. ;)

O f.. de esperar é: eles devem ser lançados em Janeiro/Fevereiro lá fora, até chegarem aqui em grandes quantidades coloque mais 1 a 3 meses (isso porque tem Carnaval e esse país não funciona nem antes, nem durante e nem logo depois dessa jossa), como ele será vendido como um óquitacór, o preço vem inflacionado, mesmo que não seja um pentium 4 de 40 GHz ou um córdoisdú/córísete.

Isso nos espreme pra Abril-Junho em termos de boa compra. :chicote:

Se fosse nos EUA, seria uma boa hora pra comprar um Thuban a preço baixo.

Link para o comentário
Compartilhar em outros sites

Também acho muito tempo pra esperar... A menos que ele tenha algum contato muito amigo nos EUA. Se pelo menos os benchs estivessem pra sair, aí sim. Mas é tempo demais até se eu fosse investir num cluster (ok, nesse caso TALVEZ não), e aí eu apostaria que vai haver suporte pra AM3 e montaria uma pré-plataforma pra up depois. ;)

Link para o comentário
Compartilhar em outros sites

Lendo um artigo outro dia do Laercio Vasconcelos, sobre uma comparação entre o melhor X4 da AMD o Phenom II 465 VS o Thuban X6 1090T, a diferença de desempenho não foi lá aquelas coisas algo em torno de 5%, não pelos processadores em si, mas, principalmente pelas aplicações que ainda não estão tão otimizadas para utilizar um maior número de núcleos, e creio eu que ainda vai demorar um pouco, dessa forma penso que ainda no próximo ano um "quad" ainda daria conta do recado tranquilamente, isso sem precisar gastar tubos na plataforma completa.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Lendo um artigo outro dia do Laercio Vasconcelos, sobre uma comparação entre o melhor X4 da AMD o Phenom II 465 VS o Thuban X6 1090T, a diferença de desempenho não foi lá aquelas coisas algo em torno de 5%, não pelos processadores em si, mas, principalmente pelas aplicações que ainda não estão tão otimizadas para utilizar um maior número de núcleos, e creio eu que ainda vai demorar um pouco, dessa forma penso que ainda no próximo ano um "quad" ainda daria conta do recado tranquilamente, isso sem precisar gastar tubos na plataforma completa.

E vai, pra muitas pessoas, pois poucas precisam de um X6 ou mais. ;)

Sobre o artigo, tudo depende dos programas utilizados e de como os testes foram feitos, tem vários outros testes, postados aqui e também no tópico de comentários do teste do 1090T aqui do CDH, que mostram um grande ganho de desempenho em certos aplicativos, claro, bem otimizados para utilizarem vários núcleos, em outros o resultado é o mesmo que o Laércio obteve e é exatamente como deveria ser. ^_^

Uma pena que muitas pessoas não pensem e interpretem os resultados dos testes ou sequer leiam a conclusão escrita pelo editor. (_(

Link para o comentário
Compartilhar em outros sites

  • Membro VIP

http://www.techpowerup.com/128529/AMD_Spurs_Software_Development_to_Benefit_from_Heterogeneous_Compute_Architectures.html

AMD lança pacote de desenvolvimento de programas para que eles se beneficiem de arquiteturas heterogêneas.

Resumindo: preparando terreno pro Fusion, usando o OpenCL, pra alegria de um certo gaúcho terrorista aqui do forum, né Jones ? :D:D:D:D:D:D

Link para o comentário
Compartilhar em outros sites

Assus desenvolvendo a primeira placa para o Ontário (Fusion):

http://www.fudzilla.com/motherboard/motherboard/motherboard/asus-designs-amd-mini-board

Parece que o Ontário vai ter performance parecida com Athlon II X2 250U:

http://www.bit-tech.net/news/hardware/2010/08/12/asus-has-amd-fusion-mini-itx-in-development/1

Link para o comentário
Compartilhar em outros sites

O John Fruehe soltou em alguns comentários de seu blog algumas dicas interessantes sobre o Bulldozer...

From a single thread performance, the increase from Magny Cours to Interlagos running a single thread will be significantly higher than you are indicating. I don’t have the exact numbers but I would be willing to bet that that will be above the 50% at the socket level.

Aparentemente, ele "está disposto a apostar" que um Bulldozer Interlagos será mais de 50% mais rápido que um Magny Cours em aplicações single-threaded.

Segundo, ele deixou bem claro (pelo menos para mim) que a vantagem de 50% do Bulldozer sobre o Interlagos é no SPEC, particularmente no SPEC INT rate. O que não ajuda tanto, mas permite prever que o Bulldozer Interlagos terá boa vantagem sobre o Westmere nisso. E pelo menos evita algumas quebras mais óbvias (por exemplo, T P C-C com SSDs)...

OBS: Johannesrs, cuidado! Precisa de mais de 50% de reprovação ou você não conquista a meta anual :)! Pelo menos é assim que parece funcionar com meus professores...

EDIT: Esse Fruehe tá praticamente dando um "Tudo que você queria saber sobre o Bulldozer" nos comentários!

Actually, every 2 integer core share a 256-bit FPU, so an 8-core processor could execute 4 256-bit FP executions per cycle OR execute 8 128-bit FP executions per cycle.

Portanto cada módulo tem duas VFPUs de 128 bits a disposição, que podem ser utilizadas como uma VFPU de 256 bits... assim um Bulldozer de 8 núcleos terá a mesma capacidade de VFPU de um Phenom II X4 em aplicações sem FMACs... ainda tinha algum dúvida se não seria mais que isso.

Link para o comentário
Compartilhar em outros sites

thiago, barbada... 1º semestre tive 11 alunos, 2º vou ter mais de 60... barbadinha de cobrir a média! :D

Thiago, tu tá dizendo que o bulldozer em fp vai ser apenas tão bom quanto o phenom 2 x4???

Em FP pico por clock que não use FMAC, sim. Aparentemente... segundo essa citação do John Fruehe. Só que ele foi muito vago. Ainda há espaço para algum truque, mas diminuiu bastante.

Link para o comentário
Compartilhar em outros sites

será q isso q ele disse

A 50% increase on top of the 80–120% that we just delivered with Magny Cours, that is a massive 2 year perfofmance increase.

Since intel just delivered the westmere xeons with 50% more cores and 33% more performance, I think that this is a very compelling increase.

serviria como base comparativa?

é, realmente ta soltando coisassss

Nehalem’s top 2P SPEC INT: 267

Westmere’s top 2P SPEC INT: 381

Magny Cours’ top 2P SPEC INT: 402

Bulldozer should be ~50% faster than that. That would probably put it at ~2X Nehalem as a minimum and probably more than 50% above Westmere.

How can you not call that a clear improvement.

pelo q ele falou, fazendo contas doidas, em cima dos dados daria algo em torno dos 595 pros 2P SPEC INT

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Portanto cada módulo tem duas VFPUs de 128 bits a disposição, que podem ser utilizadas como uma VFPU de 256 bits... assim um Bulldozer de 8 núcleos terá a mesma capacidade de VFPU de um Phenom II X4 em aplicações sem FMACs... ainda tinha algum dúvida se não seria mais que isso.

8 operações... FMADD conta como duas? Bons tempos em que uma operação era o mesmo que uma instrução...

Agora ta mais perto da "FPU não ser fraca".

Adoraria ver um processador com muita força bruta mas do ponto de vista comercial acho que para o JF usar operações como instruções nessa só se alguém tivesse misturado cogumelos alucinógenos no café dos engenheiros que projetaram o Bulldozer...

Aparentemente, ele "está disposto a apostar" que um Bulldozer Interlagos será mais de 50% mais rápido que um Magny Cours em aplicações single-threaded.

Socket level... Multi-thread... Talvez seja melhor fazer o anti-dopping nos engenheiros da AMD antes de continuar os comentários.

Link para o comentário
Compartilhar em outros sites

Visitante
Este tópico está impedido de receber novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...

Ebook grátis: Aprenda a ler resistores e capacitores!

EBOOK GRÁTIS!

CLIQUE AQUI E BAIXE AGORA MESMO!