Ir ao conteúdo
  • Cadastre-se

G5


Visitante

Posts recomendados

Eu vi esse topico em outro forum , ninguém respondeu ( deu uma resposta convincente) se alguem puder explicar isso aí valeu:

Um pente de 400Mhz que a Apple usa no G5 consome uma banda de 3,2Gbps.

Aí a Apple copiou todo mundo e adotou o Dual Channel, que faz dois pentes atuarem como um, e sua banda pulou para 6,4Gbps.

Como, eu pergunto encarecidamente, um banco de memória que só consegue ter uma vazão de 6,4 Gbps consegue sustentar dois processadores que possuem vazão de 8Gbps cada um?

Link para o comentário
Compartilhar em outros sites

Postado Originalmente por CBral@02 mar 2004, 10:12

Como, eu pergunto encarecidamente, um banco de memória que só consegue ter uma vazão de 6,4 Gbps consegue sustentar dois processadores que possuem vazão de 8Gbps cada um?

você já auto-respondeu a pergunta...É óbvio que não.

O que acontece é que tm o cache, então é capaz que enquanto um tá acessando a memória o outro só usa o cache.

Pode ser também que cada proc use um pente sozinho (como os Opteron) Não tenho certeza disso, mas já que a IBM licenciou o Hypertransport, deve ser isso sim.

Link para o comentário
Compartilhar em outros sites

Um complemento o G5 tem 6 slot de memoria que daria 2x3 ou 3x6400 com eles todos ocupados pode ter uma logica, 3200, 3200, 3200, 3200, 3200, 3200, 3200, ou 6400 , 6400 , 6400 , ai sim acho que tem logica. Daria 19200.

Link para o comentário
Compartilhar em outros sites

Eu postei isso la:

m pente de 400Mhz que a Apple usa no G5 consome uma banda de 3,2Gbps.

Aí a Apple copiou todo mundo e adotou o Dual Channel, que faz dois pentes atuarem como um, e sua banda pulou para 6,4Gbps.

Como, eu pergunto encarecidamente, um banco de memória que só consegue ter uma vazão de 6,4 Gbps consegue sustentar dois processadores que possuem vazão de 8Gbps cada um?

fácil: O que acontece é que tem o cache, então é capaz que enquanto um tá acessando a memória o outro só usa o cache. ( Lembrando que mesmo no boot sistemas SMP so usam um processador, somente depois que carregarem os servicos o segundo entra em acão ( no livro Kernel do Linux,Scoott Maxwell pags 243 a 266 explica ) Mais isso usando 2 pentes, com 4 pentes, sendo o ideal 3200x6=19200 logo que a Cpus sao 8000x2=16000 a coisa muda de papo, vejamos 3200x2= 6400, 3200x4=12800, 3200x6=19200

Pode ser também que cada proc use um pente sozinho (como os Opteron) Não tenho certeza disso, mas já que a IBM licenciou o Hypertransport, deve ser isso sim.

Ajuda do colega Tagbal do forum clubedohardware.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP

Olha, o Opteron acesso a memória independentemente é porque ele tem uma controladora de memória dual (64 + 64 bits). Então em um sistema dual, a placa pode ter os slots independentes, para cada processador, ou como algumas fazem, compartilhando a memória entre os processadores (eu acho besteira isso, mata uma das carateristicas mais importantes do Opteron, só pra reduzir custos). Em acesso simultâneo isso faz diferença.

O G5 não tem controladora on-die. E CBral, o correto é você dizer que um pente DDR400 fornece 3,2GB/s. O consumo da largura de banda é sempre feito pelo acesso do processador a ele.

Nas placas do G5 também são usados links HyperTransport. Talvez sejam de 8GB/s (os novos A64 começaram a ter links de 8GB/s a partir do soquete 939), eu não sei ao certo. Tem que ver o esquema de ligação do processador ao chipset/northbridge e do chipset a memória e a southbridge (se existir).

Link para o comentário
Compartilhar em outros sites

  • Membro VIP

Cbral, aquele tópico lá está uma zona. Tem muita coisa errada. O melhor é você se guiar sobre o que o cara da macworld respondeu. Mesmo assim eu não concordo com muitas coisas que ele disse, como por exemplo que ter uma controladora de memória on-die não é bom, porque o acesso dma de outros componentes atrapalha o processador. Isso é algo a se provar ainda. O único teste que conheço que talvez indique isso são os que formam o SpecViewPerf (gráficos OpenGL). Ali o A64 e Opteron não demonstram os ganhos que tem sobre o Athlon (fica meio parelho com o Athlon até inferior). É um dos testes que mais faz uso do desempenho de memória e intenso uso do AGP. Ou é um problema do intenso acesso da placa de video a memória atrapalhar o processador ou são os chipsets que são imaturos mesmo (até drivers pode ser). Agora, por causa de uma situação não se pode esquecer que a controladora on-die é um recurso fantástico, ainda mais para sistemas multiprocessados, que é o que faz o Opteron ter uma escalabilidade impressionante, mesmo com apenas 1MB de cache (os outros que conseguem valores parecidos tem muitos MB de cache e/ou controladora de memória on-die).

Me explique melhor qual é o problema/dúvida que você quer resolver? Eu não consegui entender o porque não sei do que você está falando.

Se é a questão da memória eu já expliquei.

PS: O cara foi menos educado do que eu com o "consome banda". Agora eu vi quem é o autor da frase (e que ainda fala pra procurar um fórum decente...).

Link para o comentário
Compartilhar em outros sites

Eu não entendi foi o seguinte: acabei entrando de gaiato, cada processador tem velocidade de 8 gbps, daria 16 os 2 juntos, mais so passa 6400 pelo northbridge ( chipset do G5) sendo que so passa 6400 não adiantaria colocar 6 pentes de memoria que daria 19200, isso em dual channel pois so passaria 12800 pelo northbridge 6400x2, de onde a apple tirou esse 16 de fluxo ?

No site da Apple está escrito:

Para acessar dados, o PowerPC G5 conta com o barramento frontal mais veloz no mercado, chegando a 1GHz por processador, um total de 16GBps de fluxo de dados em sistemas Power Mac G5 de dois processadores. Trata-se de um enorme salto em relação ao desempenho do Power Mac G4, cujo barramento é de 167MHz. Isto significa que não há gargalo limitando a velocidade de transferência de dados para o processador.

O certo era apple falar que o fluxo e de 12800 e não 16000 ou to errado.

Esses 19200 eu tirei do seguinte esquema, sao 6 slots de memoria 2x3 em dual channell daria 19200 Gbps.

Me explica isso aqui melhor: O G5 não tem controladora on-die. E CBral, o correto é você dizer que um pente DDR400 fornece 3,2GB/s. O consumo da largura de banda é sempre feito pelo acesso do processador a ele.

então pelo conclusão o dual channel não funcionaria no G5 ou você não entedeu o que eu escrevi, quando me refiro a 6400 digo 3200x2 ou 512ram+512ram. em duall channel.

Eu coloquei la uma conclusao dessa forma, o atual hypertrasnport tem velocidade de 12gbps 6400x2, o hypertansport vai chegar a 40 gpbs ou seja 20000x2 pelo que entendi a sim a apple pode falar que tem fluxo de ate 19200 com todos bancos ocupados de memoria em duall channell, se o hypertransport tem 6400x2 como ela fala (apple) que o G5 tem fluxo de 16gbps sera que e contando AGP PCI ...?

sledgehammer valeu, depois que você ler, respondendo ou não pode fechar esse topico, pra não ficar igual aquele.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP

Bem, não é cada processador que tem 8GBps, mas sim o link de ligação de cada processador com o chipset. Somando-se os dois você tem os 16GBps, é isso que a Apple está dizendo. Isso está correto, é o limite do barramento deles. É evidente que eles não irão dizer que o buraco é mais embaixo, que o acesso de memória está limitado.

Na verdade ficou tão moderno quanto o Athlon MP, que usava barramento P2P igual o G5 (porém ainda não era HyperTransport), mas que a controladora de memória no chipset não consegue fornecer tudo o que os processadores poderiam receber. Diferente do Opteron, que todos os processadores tem o seu acesso exclusivo a memória e ainda podem acessar a memória dos outros através do XBar.

E eu vi muita coisa errada lá no tópico, principalmente tratar valores de pico como algo importante. Primeira coisa, peque um Athlon XP 3200+ que roda a 2.2GHz e que pode calcular até 2 operações com ponto flutuante precisão dupla por ciclo. Isso quer dizer que para ele conseguir a trabalhar na velocidade de pico, ele precisaria que a controladora de memória fornecesse 2.2 x 2 x 8 = 35GB/s. Só no cache L1 dele que esse valor pode ser obtido (mesmo assim, a efetividade do cache nunca será de 100%). E veja que em geral o desempenho de memória dele é mais de 20x menor do que isso. Ou seja, tudo o que o foi discutido lá em termos de pico é besteira.

Eu não sei bem sobre a arquitetura do G5, mas pode ter certeza que a capacidade máxima do processador é muito maior do que a memória pode fornecer. Na maior parte dos casos o cache é quem abastece o processador, mas existem muitos programas que são limitados é pelo desempenho da memória.

Ah quanto a memória, pare de fazer contas, é só 6.4GB/s mesmo. Só isso, pois pelo que sei, só tem um chipset, dual channel e de 2 pentes pra cima, você tem os mesmos 6.4GB/s (se fossem eles seria uma maravilha).

Abrindo um parenteses sobre o dual channel. No melhor chipset do P4, o segundo pente melhora apenas 55% a largura de banda efetiva. No Opteron/Athlon FX, pelo fato de a controladora ser on-die e ter a latência mais baixa possível (está encostado no limite teórico), esse aproveitamento é maior, algo como 80%. No G5 a largura de banda deve ser parecida com a do P4, não mais que isso.

Link para o comentário
Compartilhar em outros sites

  • 2 meses depois...
Postado Originalmente por sledgehammer@03 mar 2004, 04:04

Abrindo um parenteses sobre o dual channel. No melhor chipset do P4, o segundo pente melhora apenas 55% a largura de banda efetiva. No Opteron/Athlon FX, pelo fato de a controladora ser on-die e ter a latência mais baixa possível (está encostado no limite teórico), esse aproveitamento é maior, algo como 80%. No G5 a largura de banda deve ser parecida com a do P4, não mais que isso.

O problema da solução da AMD (controlador de memória on-die) é que sempre que tem acesso DMA de um periférico à memória - e todos os acessos de Ethernet, FireWire, vídeo etc. usam DMA - tem que ser intermediados pelas CPUs, isso sim que faz o desempenho cair. Com o bridge tudo isso passa sem a CPU ficar sabendo, nem congestiona o barramento dela.

Link para o comentário
Compartilhar em outros sites

Postado Originalmente por Amianto@23 maio 2004, 11:20

O problema da solução da AMD (controlador de memória on-die) é que sempre que tem acesso DMA de um periférico à memória - e todos os acessos de Ethernet, FireWire, vídeo etc. usam DMA - tem que ser intermediados pelas CPUs, isso sim que faz o desempenho cair. Com o bridge tudo isso passa sem a CPU ficar sabendo, nem congestiona o barramento dela.

Amianto

Talvez (realmente não sei), tenha um jeito de fazer DMA/ Bus Mastering sem atrapalhar o processador.

Acho que o pessoal da AMD não ia deixar um detalhe "bobo" desses passar. Eu acredito que isso seja possível (igual como é feito nos sistemas tradicionais, mas só com a controladora de memória dentro) Isto é, usando o HT, acessar diretamente o controlador de memória, sem passar pelo proc (core).

Claro que eu ainda tenho o overhead do Hypertransport, mas é melhor do que mandar o proc fazer tudo.

E, veja só, isso pode "embolar o meio de campo" um pouco em sistemas SMP, já que o Hypertransport vai ter (comunicação entre procs + DMA).

Se bem que com esse bicho em 800MHz, duvido que atrapalhe muito.

Realmente, tá na hora de eu catar os manuais no site da AMD (hehehe)

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Postado Originalmente por Amianto+23 maio 2004, 11:20-->
sledgehammer@03 mar 2004, 04:04

Abrindo um parenteses sobre o dual channel. No melhor chipset do P4, o segundo pente melhora apenas 55% a largura de banda efetiva. No Opteron/Athlon FX, pelo fato de a controladora ser on-die e ter a latência mais baixa possível (está encostado no limite teórico), esse aproveitamento é maior, algo como 80%. No G5 a largura de banda deve ser parecida com a do P4, não mais que isso.

O problema da solução da AMD (controlador de memória on-die) é que sempre que tem acesso DMA de um periférico à memória - e todos os acessos de Ethernet, FireWire, vídeo etc. usam DMA - tem que ser intermediados pelas CPUs, isso sim que faz o desempenho cair. Com o bridge tudo isso passa sem a CPU ficar sabendo, nem congestiona o barramento dela.

Amianto, esse possível problema muita gente levantou quando a AMD fez o primeiro anúncio de que o K8 teria controladora de memória on-die. Mas não como você disse, sobre o processador ficar sobrecarregado, mas sim o que o tabgal apontou, que é o fato de acharem os links HyperTransport não muito adequados para a função.

Isso porque as placas de video realmente acessam bastante a memória principal em aplicações 3D profissionais.

Só que a AMD não seria boba de deixar isso acontecer dessa forma como você pensou. Os chipsets não tem a controladora de memória embutidos, mas eles tem conexão direta com a memória, para ter acesso DMA, que são o AGP Tunnel, PCI-X Tunnel, etc. Um tunnel mesmo, que faz a ligação direta com a controladora, que é um anexo ao processador, apenas está ali do lado.

O link HT que liga o processador ao chipset é suficiente para dar conta desse tráfego todo.

Gigabit ethernet não é tão preocupante assim. A preocupação recai sobre as placas de video e em programas aonde a memória usada para renderizar os objetos excede em muito a da placa de video.

Vamos olhar pelo lado prático. você constatou algum aplicativo aonde o desempenho não corresponde ao esperado?

É verdade que justamente no SpecViewPerf ocorre que o desempenho dele não acompanha o desempenho nos outros aplicativos. Mas acho meio prematuro culpar esse tipo de arquitetura. E mesmo assim a diferença não é tão grande, que justifique dizer que algo tradicional seria melhor.

Por sinal o Opteron equipa as máquinas mais poderosas voltadas para esse mercado profissional, aonde essa possível falha poderia atrapalhar o desempenho.

Se não atrapalhou até agora, com o aumento de 25% na frequência de trabalho do HT, que irá vir em breve, não será dessa vez que irá atrapalhar.

Link para o comentário
Compartilhar em outros sites

  Se não atrapalhou até agora, com o aumento de 25% na frequência de trabalho do HT, que irá vir em breve, não será dessa vez que irá atrapalhar.

Esses 25% se vão ser das novas NF3 250 GB, ou dos AMD64 939 ?

Link para o comentário
Compartilhar em outros sites

Arquivado

Este tópico foi arquivado e está fechado para novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...