Ir ao conteúdo
  • Cadastre-se

AMD Bulldozer / Bobcat / Zambezi - Plataformas.


Posts recomendados

a minha aposta é o bulldozer compatível por algum milagre de retrocompatibilidade sem algumas coisinhas milagrosas da arquitetura. Agora, como se faria pra encixar sei eu quantos pinos a mais ali não sei, desta vez precisaria de adaptador mesmo! ;)

Eu chutaria que o Bulldozer será AM3, suportando memórias um pouco mais rápidas... um sucessor do Bulldozer seria diferente, provavelmente suportando uma nova geração de memórias, talvez com retrocompatibilidade para AM3, se as memórias forem similares o suficiente.

Já nos servidores a tendência é G32 (ou o F mesmo, sei lá...)/G34... com G32 para a versão menor, G34 para a maior, com mais núcleos, talvez MCM e mais canais de memória.

Link para o comentário
Compartilhar em outros sites

bom, o socket AM3 não tem como ser um coringa eterno. quad-channel seria interessante, mesmo que só nos toptoptop, pra jogar na cara da intel com o seu triple-channel (mas teria que fazer de alguma forma que a implementação fosse absurdamente competitiva). E, de qq forma, acho que vai ter que dar uma saída boa de arquitetura no bulldozer mesmo pra competir com a intel "mais batendo que levando", e com uma arquitetura decentemente diferente imaginaria que a pinagem seria diferente. Apenas torço que "diferente mas retrocompatibilizável".

Óbvio que se for AM3 puro e simples melhor pra mim e todos nós, mas eu tô contando com algo mais forte mesmo, demais pra esse socket dar conta de todo o potencial, mas restringindo detalhes "frescos" ele "suportando"... ;)

Link para o comentário
Compartilhar em outros sites

também não vamos contar com a série AM"X" para sempre. Estaria satisfeito com a troca por uma nova geração de sockets (que podem até não ser compatível com o atual, mas que terá sucessores e esses sim retrocompatíveis), se isso resultar em um ganho de desempenho e tecnologia surpreendente. Nada é eterno, nem os sockets da AMD.

QuadChannel? será que o problema das CPUs DESKTOPS atuais é a banda de acesso a memória? questiono isso pois os I7 com seu triple channel não possuem grande vantagem em desempenho se comparados a os I5, com os simples dualchannel.

Espero algo revolucionário, com poder bem dividido. Eu sei que é sonhar alto, mas num futuro não tão distante acredito que veremos processadores X86 praticamente só voltados a INTEIROS, e GPUs integradas farão o trabalho em Ponto flutuante, aumentando assim exponencialmente a performasse. O Bulldozer com seu esquema de 2 unidades de inteiro para cada uma de ponto flutuante é apenas um degrau nessa escada, concordam?

Link para o comentário
Compartilhar em outros sites

Pra que quad channel no mundo "civil" ?

Até sair o sucessor do BDZ já deveremos ter DDR4 na área.

Sim... sem contar que Quad Channel é muito caro. Triple Channel ou aumenta a latência ou só traz ganho em aplicações com acesso a memória comportado.

sei não... tô achando mudanças demais na arquitetura pra conseguir manter o AM3. compatível com am3 sim, mas pra ser am3 eles vão ter q abrir mão até da possibilidade de quad-chanel. Eu tô cogitando um adaptador entre os sockets pra compatibilizar desta vez.

Aposta alta. ;)

Acho difícil QC para todas as plataformas, diria que só para servidores MCM/chip grande.

bom, o socket AM3 não tem como ser um coringa eterno. quad-channel seria interessante, mesmo que só nos toptoptop, pra jogar na cara da intel com o seu triple-channel (mas teria que fazer de alguma forma que a implementação fosse absurdamente competitiva).

Isso não deve ser tão difícil. Triple Channel não é tão fácil de implementar, e a Intel cortou caminho nessa parte. O TC é mais para aumentar a capacidade de memória do que qualquer outra coisa, diria.

E, de qq forma, acho que vai ter que dar uma saída boa de arquitetura no bulldozer mesmo pra competir com a intel "mais batendo que levando", e com uma arquitetura decentemente diferente imaginaria que a pinagem seria diferente. Apenas torço que "diferente mas retrocompatibilizável".

Isso não tem tanta relação, dá para lançar um chip completamente diferente usando a mesma plataforma... e eu acho que uma AM3/"AM4" (compatível com AM3 mas com opção de um soquete próprio para DDR4) seria bem mais interessante. Nos servidores, manter a plataforma é melhor ainda... o G34 dá e sobra, o soquete F que tem para onde melhorar.

QuadChannel? será que o problema das CPUs DESKTOPS atuais é a banda de acesso a memória? questiono isso pois os I7 com seu triple channel não possuem grande vantagem em desempenho se comparados a os I5, com os simples dualchannel.

Triple Channel não deveria dar muito ganho mesmo em desempenho. Mesmo porque o Dual Channel é suficiente para não ter muita carga, pelo menos para desktops.

Espero algo revolucionário, com poder bem dividido. Eu sei que é sonhar alto, mas num futuro não tão distante acredito que veremos processadores X86 praticamente só voltados a INTEIROS, e GPUs integradas farão o trabalho em Ponto flutuante, aumentando assim exponencialmente a performasse. O Bulldozer com seu esquema de 2 unidades de inteiro para cada uma de ponto flutuante é apenas um degrau nessa escada, concordam?

As GPUs não servem para todo o PF, você precisa de alguma coisa na CPU. E por incrível que pareça já vi muita gente do Bulldozer falando que ele irá muito bem em PF... sabe-se lá como.

em teoria não é lá muita diferença, 1333x8x2=21GB/s vs 1066x8x3=25GB/s.

Acho que quendo se fala em melhorar a banda de memórias referem-se ao uso prático.

AM3 ± 12GB/s, LGA 1156 ± 16GB/s e LGA 1366 19GB/s, é isso não é?

Mas isso é muito por causa do núcleo... você aumenta a banda de memória na ponta para garantir que o controlador de memória nunca seja gargalo, não para aumentar a banda de memória mesmo. Cada vez que o controlador de memória "enche" de requisições o resto do sistema, que é muito mais rápido, fica parado...

Link para o comentário
Compartilhar em outros sites

E por incrível que pareça já vi muita gente do Bulldozer falando que ele irá muito bem em PF... sabe-se lá como.

interessante... já estão testando com algum sucesso exemplares do Bulld?? Será q vão aperfeiçoar o PF a ponto de superar a próxima geração da Intel, seria até interessante conseguirem fazer como a Intel ao colocar os primeiros Core-padrão sendo mais rápidos que os CPUs AMD Athlon64 da época, isso em testes vazados, se não me falha a memo :D

offii: vi na newegg.com q os tubõns estão subindo um pouco no US$$ tanto o 1090T qto o 1055T, será q tá tendo procura? :confused:

interessante q vendo nos testes com uns 3.8GHz o 1090T já empata com o i7-860 de 2.8GHz na grande maioria dos testes, são 6 da AMD contra 4(reais)+4(virtuais) da Intel, e daria pra ir com menos de 1.400V

Link para o comentário
Compartilhar em outros sites

As GPUs não servem para todo o PF, você precisa de alguma coisa na CPU. E por incrível que pareça já vi muita gente do Bulldozer falando que ele irá muito bem em PF... sabe-se lá como.

Hmm... Seria uma retribuição dos engenheiros da ATI para com os da AMD, que ajudaram a criar o R700 e evergreen e querem uma forcinha agora, com o PF do BD? Não duvido não.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Sim... sem contar que Quad Channel é muito caro. Triple Channel ou aumenta a latência ou só traz ganho em aplicações com acesso a memória comportado.

Não seria mais fácil darem suporte a memórias com clock maior ao invés de criar mais pistas ?

Isso não tem tanta relação, dá para lançar um chip completamente diferente usando a mesma plataforma... e eu acho que uma AM3/"AM4" (compatível com AM3 mas com opção de um soquete próprio para DDR4) seria bem mais interessante. Nos servidores, manter a plataforma é melhor ainda... o G34 dá e sobra, o soquete F que tem para onde melhorar.

Será que dá pra colocar 8 núcleos nos ~945 pinos ?

As GPUs não servem para todo o PF, você precisa de alguma coisa na CPU. E por incrível que pareça já vi muita gente do Bulldozer falando que ele irá muito bem em PF... sabe-se lá como.

Ahm.. porque não servem ?

Sobre o como vai ser, nenhuma ideia mesmo ?

interessante... já estão testando com algum sucesso exemplares do Bulld?? Será q vão aperfeiçoar o PF a ponto de superar a próxima geração da Intel, seria até interessante conseguirem fazer como a Intel ao colocar os primeiros Core-padrão sendo mais rápidos que os CPUs AMD Athlon64 da época, isso em testes vazados, se não me falha a memo :D

Provavelmente sim, as primeiras amostras saem um boom tempo antes do lançamento, e já tem amostra de outros chips circulando por aí.

Link para o comentário
Compartilhar em outros sites

Nos servidores, manter a plataforma é melhor ainda... o G34 dá e sobra, o soquete F que tem para onde melhorar.

pera, o soquete F que ta fraco?

@XITA, o lance de memórias com maior clock interfere no lance da tensão não? não pode passar de um certo limite

Link para o comentário
Compartilhar em outros sites

Provavelmente sim, as primeiras amostras saem um boom tempo antes do lançamento, e já tem amostra de outros chips circulando por aí.

uma nova Rev. do BD? hummm, será interessante juntar $Lulas$ pra pegar uma plataforma forte, até porque os futuros substitutos do Windows7 e programinhas, digamos, atualizados (exclusivamente) para tal plataforma vai consumir mais processamento, embora acredite q muita coisa vai permanecer como está, mas com processadores de ponta como o 980X nego q desenvolve software lá fora, pega um desses e compila tudo com máquina ultra-top, aí os quad-core de hj levam "quatro-couros nas costas", apanham feio, tanto q você pega um processador potente, mas com apenas um núcleo e ele já abre o bico, dual core tenho visto ficar em 50% em ambos os núcleos (e é Core2Duo).

ainda bem q vem mais memo por aí, quero ver tb pente de 16GiBas ao menos :D pra poder brincar

outra coisa q ainda não confirmaram é a bendita USB3 nos SB8xx, cadê??

interessante, pelo q entendi do Thiago, mais linhas ou canais além do Triple Channel pra memo pode ser bom apenas pra programinhas de teste sintético, isso se um desenvolvedor não resolver fazer um que faça uma simulação de leitura/escrita "aloprada aleatorimente" pra tentar quebrar as pernas desses canais a mais e mostrar que nem sempre banda de memo e mais canais = performance

outra coisa: será q BD sai ainda este ano???

Link para o comentário
Compartilhar em outros sites

  • Membro VIP

@XITA' date=' o lance de memórias com maior clock interfere no lance da tensão não? não pode passar de um certo limite[/quote']

Em partes.. mas já vi DDR3 2000 MHz operando a 1.65V e sem ter latências altas (e nem preço catastrófico)

uma nova Rev. do BD?

outra coisa: será q BD sai ainda este ano???

Outra revisão é coisa lá pra quando o mundo acabar.

Sobre sair este ano, se sair será pro Natal, mas acho bem mais provável em meados de Janeiro.

Link para o comentário
Compartilhar em outros sites

Hmm... Seria uma retribuição dos engenheiros da ATI para com os da AMD, que ajudaram a criar o R700 e evergreen e querem uma forcinha agora, com o PF do BD? Não duvido não.

O pessoal da ATI começou a mexer com ponto flutuante bem depois da AMD... até um tempo atrás GPUs usavam apenas inteiros :). Bom, na verdade quando eu digo PF eu quero dizer não apenas o PF clássico (x87), mas também o PF SIMD (SSEs de ponto flutuante, AVX, SSE5/XOP/FMA/Novo Nome da Semana) e os inteiros SIMD (MMX para vovôs, SSEs de inteiros). E de SIMD o pessoal da ATI entende, realmente... GPUs são SIMD, ou algo muito parecido.

Mas o pessoal da ATI não deve ajudar muito... Isso porque a CPU oferece um ambiente diferente, com latências menores, maior flexibilidade, vetores menores, execução fora de ordem, programação mais "clássica", etc. Os desafios de uma unidade x87/SSE/AVX como a do Bulldozer são bem diferentes dos das unidades de uma GPU.

Não seria mais fácil darem suporte a memórias com clock maior ao invés de criar mais pistas ?

Clock maior de I/O significa menor confiabilidade, maior gasto em PCB, células de memória mais rápidas (sem mudar tecnologia), maiores latências relativas (timings) ou novas tecnologias com menor flexibilidade de acesso (mudando tecnologia e aumentando o tamanho dos bursts, como nas transições SDR->DDR->DDR2->DDR3), possivelmente menor capacidade... a vantagem é que você ganha em largura de banda.

Com mais canais você aumenta a capacidade, aumenta o gasto em PCB, aumenta o tamanho da pastilha e a pinagem, mas não precisa mudar as memórias, aumenta a flexibilidade de acesso e o número de canais simultâneos e ganha em capacidade... além da largura de banda.

Enfim, são duas coisas bem diferentes. Um POWER7 tem 8 canais de memória (dois controladores de 4 canais cada), porque a IBM resolveu pagar o preço em PCB, espaço de pastilha e pinagem para ter capacidade, largura de banda e paralelismo de memória imbatíveis. Não dá para fazer o mesmo com frequência, você tem de esperar as coisas avançarem...

Será que dá pra colocar 8 núcleos nos ~945 pinos ?

Não vejo porque não daria... o problema é largura de banda, se não for suficiente os 8 núcleos ficarão parados. Mas o Thuban tem 6 núcleos e o mesmo número de canais, e não acho que a largura de banda cause tantos problemas. Para servidores, ainda mais se rolar um MCM ou chip maior, o soquete G34 existe para isso mesmo. O novo soquete de servidores 1S/2S não-MCM será o C32, basicamente um F com DDR3.

Ahm.. porque não servem ?

Para começar existe a compatibilidade... além disso existem as latências, as características de comunicação com o processador, flexibilidade, modelo de programação, etc. A Intel e a AMD estão propondo novos padrões SIMD com largura maior, e por mais que essas coisas sejam uma guerra de MachoFLOPS, alguma serventia existe.

Sobre o como vai ser, nenhuma ideia mesmo ?

O DresdenBoy tem várias teorias, mas eu prefiro concordar com o EduardoS e deixar quieto. O Bulldozer é cheio de truques, pelo visto... será pior que um P4, que sempre que leio a respeito me revela o quanto eu não entendi direito nem a parte simples da microarquitetura.

pera' date=' o soquete F que ta fraco?[/quote']

DDR2 ao invés de DDR3, HT 3.0 ao invés de 3.1, sem contar que ele tem 3 links HT, sendo que atualmente é focado somente em servidores 1-2S, que usam apenas 2...

O C32 corrigirá tudo isso... será o soquete principal para servidores 1S/2S. O G34 suportará versões MCM/monolíticas com o dobro de núcleos, para o mercado 2S/4S, com o dobro de tudo: controladores de memória, HTs..

interessante, pelo q entendi do Thiago, mais linhas ou canais além do Triple Channel pra memo pode ser bom apenas pra programinhas de teste sintético, isso se um desenvolvedor não resolver fazer um que faça uma simulação de leitura/escrita "aloprada aleatorimente" pra tentar quebrar as pernas desses canais a mais e mostrar que nem sempre banda de memo e mais canais = performance

A questão é a seguinte... para que o maior número de canais funcione bem, você tem que espalhar os dados pelos canais, de tal forma que um acesso sempre use todos os canais ao mesmo tempo.

Para números múltiplos de dois isso é fácil. Normalmente você joga os dados de forma que se o sistema acessar duas linhas contíguas estas estarão uma em cada canal. Para isso basta jogar a primeira linha no canal 0, a segunda no canal 1, a terceira no canal 0, etc... e é fácil ver que em um endereço binário o primeiro bit decidirá o canal.

Para três canais isso é muito mais complicado... requer muito mais aritmética para atingir a solução ótima, que seria primeira linha no canal 0, segunda no canal 1 e terceira no canal 2. Isso é um sério problema, porque pode aumentar a latência e com certeza aumenta a complexidade. Sem considerar que a cada aumento de canal você tem de ter mais transações contíguas para ganhar alguma coisa.

Link para o comentário
Compartilhar em outros sites

O pessoal da ATI começou a mexer com ponto flutuante bem depois da AMD... até um tempo atrás GPUs usavam apenas inteiros :). Bom, na verdade quando eu digo PF eu quero dizer não apenas o PF clássico (x87), mas também o PF SIMD (SSEs de ponto flutuante, AVX, SSE5/XOP/FMA/Novo Nome da Semana) e os inteiros SIMD (MMX para vovôs, SSEs de inteiros). E de SIMD o pessoal da ATI entende, realmente... GPUs são SIMD, ou algo muito parecido.

Mas o pessoal da ATI não deve ajudar muito... Isso porque a CPU oferece um ambiente diferente, com latências menores, maior flexibilidade, vetores menores, execução fora de ordem, programação mais "clássica", etc. Os desafios de uma unidade x87/SSE/AVX como a do Bulldozer são bem diferentes dos das unidades de uma GPU.

talvez estejam ajudando num ponto específico, pelo q você escreveu dá pra entender que talvez seja possível algo assim.

Enfim, são duas coisas bem diferentes. Um POWER7 tem 8 canais de memória (dois controladores de 4 canais cada), porque a IBM resolveu pagar o preço em PCB, espaço de pastilha e pinagem para ter capacidade, largura de banda e paralelismo de memória imbatíveis. Não dá para fazer o mesmo com frequência, você tem de esperar as coisas avançarem...

será que teremos dois controladores de memoria num BD?? acho q com tanto núcleo seria algo necessario, principalmente com uma GPU lá

O DresdenBoy tem várias teorias, mas eu prefiro concordar com o EduardoS e deixar quieto. O Bulldozer é cheio de truques, pelo visto... será pior que um P4, que sempre que leio a respeito me revela o quanto eu não entendi direito nem a parte simples da microarquitetura.

interessante... pior q um P4...???? como assim??? e q truques seriam???

A questão é a seguinte... para que o maior número de canais funcione bem, você tem que espalhar os dados pelos canais, de tal forma que um acesso sempre use todos os canais ao mesmo tempo.

Para números múltiplos de dois isso é fácil. Normalmente você joga os dados de forma que se o sistema acessar duas linhas contíguas estas estarão uma em cada canal. Para isso basta jogar a primeira linha no canal 0, a segunda no canal 1, a terceira no canal 0, etc... e é fácil ver que em um endereço binário o primeiro bit decidirá o canal.

Para três canais isso é muito mais complicado... requer muito mais aritmética para atingir a solução ótima, que seria primeira linha no canal 0, segunda no canal 1 e terceira no canal 2. Isso é um sério problema, porque pode aumentar a latência e com certeza aumenta a complexidade. Sem considerar que a cada aumento de canal você tem de ter mais transações contíguas para ganhar alguma coisa.

saquei, então seria menos dor de cabeça partir pro 4channel... seria por ter 3 nos i7-9xx q a Intel arrasa nos canais e não vai tão arrasadora assim nos demais testes?? mas não deixa de ser uma ajudinha ali, né?

Link para o comentário
Compartilhar em outros sites

talvez estejam ajudando num ponto específico, pelo q você escreveu dá pra entender que talvez seja possível algo assim.

Acho difícil, no máximo ajudariam em mão de obra mesmo.

será que teremos dois controladores de memoria num BD?? acho q com tanto núcleo seria algo necessario, principalmente com uma GPU lá

Os Phenoms atuais já tem dois controladores de memória, com um canal cada... os Bulldozers com certeza terão dois também. Os Bulldozers G34 terão 4, mas o G34 é apenas para servidores 2S/4S mais "densos".

interessante... pior q um P4...???? como assim??? e q truques seriam???

O P4 é um processador complicado de entender, porque ao contrário dos K7/K8/K9/K10/Barcelona/Athlon/Phenom e dos P6/Core/Nehalem/Pentium II/Pentium III/Core Duo/Core ix a arquitetura dele é diferente do "padrão Intel", cheia de "truques" que não poderiam existir na P6, como o "Trace Cache", ALUs rodando ao dobro da frequência, etc.

A Bulldozer também será bem diferente do "padrão AMD", ou seja, dos K8s. Por isso muitas coisas ainda são pouco claras... por exemplo, é difícil saber como funciona o esquema dos módulos e núcleos, o que é compartilhado e por quem, e por isso você acaba semi-prevendo uma performance que pode ser bem diferente da real. Da mesma forma que no P4...

saquei, então seria menos dor de cabeça partir pro 4channel... seria por ter 3 nos i7-9xx q a Intel arrasa nos canais e não vai tão arrasadora assim nos demais testes?? mas não deixa de ser uma ajudinha ali, né?

Sim, e de fato no soquete G34 a AMD aproveitou que o MCM contém dois chips com 2 controladores cada e montou um soquete de 4 canais... mas para consumidores normais eles parecem achar que dois canais são mais que suficientes, e diria que são...

Então... com certeza o fato de usar 3 canais não ajuda nem um pouco a conseguir a largura de banda máxima em situações reais. Ao que eu me lembre, para facilitar a implementação, a Intel usou uma solução meio porca (mas de baixa latência e fácil desenvolvimento) na hora de distribuir os dados entre os canais, o que significa que um dos canais deve passar boa parte do tempo parado. No fim das contas, como eu disse, a solução é mais para aumentar a capacidade...

Com 4 canais a coisa fica mais fácil... é só usar um comparador de 2 bits para conseguir uma excelente distribuição dos dados nos canais. Mas o 4º canal custa dinheiro em relação a um sistema de 3 canais. De qualquer modo, para conseguir ocupar tudo isso, só com monstros de 8 a 12 núcleos como os Nehalem-EX ou Magny Cours... é largura de banda demais para um processador de desktop.

Link para o comentário
Compartilhar em outros sites

Acho difícil, no máximo ajudariam em mão de obra mesmo.

se isso significar maior agilidade, então vai ser bom pra eles e pra gente:D

Os Phenoms atuais já tem dois controladores de memória, com um canal cada... os Bulldozers com certeza terão dois também. Os Bulldozers G34 terão 4, mas o G34 é apenas para servidores 2S/4S mais "densos".

não sabia disso, já tem dois então... oras, mas porque perde pro dual da Intel??? ou to enganado??

O P4 é um processador complicado de entender, porque ao contrário dos K7/K8/K9/K10/Barcelona/Athlon/Phenom e dos P6/Core/Nehalem/Pentium II/Pentium III/Core Duo/Core ix a arquitetura dele é diferente do "padrão Intel", cheia de "truques" que não poderiam existir na P6, como o "Trace Cache", ALUs rodando ao dobro da frequência, etc.

A Bulldozer também será bem diferente do "padrão AMD", ou seja, dos K8s. Por isso muitas coisas ainda são pouco claras... por exemplo, é difícil saber como funciona o esquema dos módulos e núcleos, o que é compartilhado e por quem, e por isso você acaba semi-prevendo uma performance que pode ser bem diferente da real. Da mesma forma que no P4...

pois é, estou na expectativa tb por ser uma arquitetura nova, no entanto seu alerta é valido mesmo, com tanta coisa nova e ainda nada de explicação a respeito dá pra imaginar q as coisas lá podem estar indo meio.... devagar ou melhor, algo fora do q deveria ser (em termo de performance). A menos q estejam se saindo bem nos testes os ES (exemplar de engenharia) q rondam por aí, pelo q você põe parece q já tem mesmo uma 2ªRev circulando, daria pra dizer q o pessoal tá eufórico ou jogando a toalha? isso é algo q muito interessa pro pessoal traçar a melhor estratégia de up, eu mesmo estou planejando um grande up em 2011, você apostaria, num up total de peças, em pegar um BD ou ir mesmo pro Intel q vai concorrer com ele??

sobre o funcionamento módulo/núcleos, realmente é interessante em teoria e falam sobre compartilhar o q não será vantajoso duplicar, tudo dentro de um conceito de módulo e, se não me engano,dizem q isto facilitará novas revisões e/ou acréscimos, talvez estejam apostando em outra coisa e não em performance em testes/programas :confused:

Sim, e de fato no soquete G34 a AMD aproveitou que o MCM contém dois chips com 2 controladores cada e montou um soquete de 4 canais... mas para consumidores normais eles parecem achar que dois canais são mais que suficientes, e diria que são...

Então... com certeza o fato de usar 3 canais não ajuda nem um pouco a conseguir a largura de banda máxima em situações reais. Ao que eu me lembre, para facilitar a implementação, a Intel usou uma solução meio porca (mas de baixa latência e fácil desenvolvimento) na hora de distribuir os dados entre os canais, o que significa que um dos canais deve passar boa parte do tempo parado. No fim das contas, como eu disse, a solução é mais para aumentar a capacidade...

Com 4 canais a coisa fica mais fácil... é só usar um comparador de 2 bits para conseguir uma excelente distribuição dos dados nos canais. Mas o 4º canal custa dinheiro em relação a um sistema de 3 canais. De qualquer modo, para conseguir ocupar tudo isso, só com monstros de 8 a 12 núcleos como os Nehalem-EX ou Magny Cours... é largura de banda demais para um processador de desktop.

muito esclarecedor !!! então vamos de dual novamente, obrigado Thiago:lol:

Link para o comentário
Compartilhar em outros sites

Ok, essa notícia é importantíssima, já que ela é baseada nos patches pro bulldozer que vão entrar no gcc, que é o pacote de compiladores aberto mais famoso do mundo. Logo, eles tem acesso a informações um pocuo privilegiadas.

Algum dos hyper-entendidos ali porém poderia por favor ajudar a "traduzir" aquilo? :D

"This patch defines -march=bdver1 and -mtune=bdver1 flag for the upcoming

AMD Bulldozer processor.

This patch also implements the following optimizations for Bulldozer

which are different from the previous generation of AMD processor named

AMDFAM10 or Barcelona.

- For 128-bit misaligned SSEx stores, use movupx instead of movlpx/movhpx

pairs. For 128-bit misaligned AVX loads and stores use movupx.

128-bit misaligned SSE/AVX stores are not micro-coded on Buldozer

unlike Barcelona.

As a side effect of the above, some instances of array copy/set loops

using integer/scalar FP moves are replaced with SSEx/AVX vector

128-bit moves.

- Improve fetch bandwidth by reducing code size.

This is accomplished by:

Replacing "packed double (PD)" and "packed integer (DQ)" forms of some

SSEx/AVX instructions with "packed single (PS)" forms, where the "PS" form

of the instruction is 1 byte shorter than the "PD" or "DQ" form.

This applies to

- use movaps instead of movapd/movdqa.

- use movups instead of movupd/movdqu.

- use xorps/andps/orpd instead of xorpd/andpd/orpd.

- Restore SSEx/AVX scalar converts since the scalar converts are not

microded on Bulldozer while they were microded on Barcelona.

This is accomplished by:

1. Not replacing scalar single precision (SP) to double precision (DP)

and DP to SP converts with the corresponding packed versions.

2. Not replacing scalar 32-bit signed integer to SP/DP converts with the

corresponding packed versions.

3. Not replacing memory forms of the above instructions with the reg-reg

form of same instruction.

- Exploit opportunities to generate cmp-jmp instructions instead of

inc/dec-jmp instructions since Bulldozer can do cmp/jmp fusion.

There are other optimizations that will need to be enhanced for Bulldozer

and more patches will be sent as the work progresses.

Correctness and performance testing is yet to be started on the simulator,

but static analysis testing has been done comparing polyhedron benchmarks

assembly listings."

Link para o comentário
Compartilhar em outros sites

(eu já sabia)

adoro quando o morto nem morreu e já tão enterrando! :lol:

BD já ta pronto, agora deve ser só aumentar eficiência, melhor consumo essas coisas (eu acho)^_^

Link para o comentário
Compartilhar em outros sites

num futuro, acho que compraremos algo tipo "Chip Mestre GameMax": ai vai vir com processador, placa de vídeo, Pci-ex, áudio digital, tudo num chip só e bem balanceado para aumentar a eficiência. Ai vai ter as plataforma entry, mid, Hí, Professional, etc... essa realidade não se concretiza pois tem a nvidia sem x86 e a intel sem boas PV. Elas não foram feitas uma para outra? olha só! Sei lá, por enquanto, vamos aos poucos.

Link para o comentário
Compartilhar em outros sites

num futuro, acho que compraremos algo tipo "Chip Mestre GameMax": ai vai vir com processador, placa de vídeo, Pci-ex, áudio digital, tudo num chip só e bem balanceado para aumentar a eficiência. Ai vai ter as plataforma entry, mid, Hí, Professional, etc... essa realidade não se concretiza pois tem a nvidia sem x86 e a intel sem boas PV. Elas não foram feitas uma para outra? olha só! Sei lá, por enquanto, vamos aos poucos.

Isso já acontece com celulares, existe um SoC que controla quase tudo, muitas vezes até processamento de rádio em banda base e alguns circuitos auxiliares de sinal misto (interface entre analógico e digital) e analógicos.

Na verdade, a tendência é que isso aconteça também para PCs. A questão é que, segundo a Lei de Moore, o número de transistores que minimiza o custo relativo em um chip dobra a cada dois anos... ou seja, a cada dois anos se torna econômico colocar o dobro de coisas em um chip.

Há 10 anos, um Core 2 Quad seria impossível de construir em um chip, e um SoC como os atuais seria no mínimo um chip imenso, lento, de baixo rendimento e altíssimo custo, maior até do que o custo dos vários chips necessários para "substitui-lo" (um processador rápido, uma GPU boa da época, chipset, controlador de display, Super I/O para embutidos, etc). Hoje, um Pentium III seria antieconômico, devido a sua inadequação em aproveitar o grande número de transistores e o desempenho que os processos atuais oferecem... e um DragonBall seria um alfinete escondido no meio do pacote, que custaria mais caro que o chip :)...

No fim das contas, a tendência aponta que daqui a alguns anos teremos tudo incorporado em um só CI, se a Lei de Moore continuar na ativa. O problema principal é largura de banda e consumo, isso pode obrigar as GPUs topo a continuarem discretas.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
O problema principal é largura de banda e consumo, isso pode obrigar as GPUs topo a continuarem discretas.

O segundo caso vai continuar a ser um problema mesmo com as GPUs TOP sendo discretas, o que vem depois de GDDR5 512 bits? E PCIe uma hora será problema também, daqui a 10 anos as GPU terão que inventar uma forma mais eficiente de usar a banda de memória, o XBox 360 se vira com um "Frame Buffer" de eDram de 10MB...

Link para o comentário
Compartilhar em outros sites

Visitante
Este tópico está impedido de receber novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...

Ebook grátis: Aprenda a ler resistores e capacitores!

EBOOK GRÁTIS!

CLIQUE AQUI E BAIXE AGORA MESMO!