Ir ao conteúdo
  • Cadastre-se

Pontuação/Rendimento de CPUs e GPUs no folding@home


V i X

Posts recomendados

  • 2 semanas depois...

Vitor, faz uns testes rodando somente o SMP, o SMP (4 threads) e as VGA's, e o SMP (2 threads) e as VGA's para ver o rendimento em cada situação, de preferência rodando as mesmas WU's. Usa o TPF para calcular o PPD de forma sintética.

Outra hora farei o mesmo e postarei os resultados para comparação.

Link para o comentário
Compartilhar em outros sites

Olhem os resultados do que fiz por aqui...

Rodei o cliente GPU3 no Linux e no Windows, o resultado é um TPF idêntico.

Rodei o GPU3 e o V7 simultaneamente...

1) 8 núcleos, as 7 threads do cliente SMP (V7) com núcleos dedicados e 1 núcleo rodando uma thread reservado para o GPU3 processar a WU da placa de vídeo;

2) 8 núcleos, threads dedicadas ao V7, cliente SMP, com o GPU3 parado;

3) 8 núcleos, 8 threads do cliente SMP (V7) + 1 thread do GPU3 compartilhando os 8 núcleos.

A WU foi a 7600 no SMP, 6801 no GPU3

1) TPF de 4:41 e 1:13, respectivamente. => 37026 PPD

2) TPF de 4:00 => 26700 PPD

3) TPF de 4:59 e 1:13, respectivamente. => 35150 PPD

Como conclusão temos que o melhor cenário é usando a CPU com núcleos dedicados ao cliente SMP e um núcleo reservado ao GPU3. O que não pode haver é compartilhamento de processamento de uma thread com outra thread que exija bastante processamento. O COMPARTILHAMENTO DA CAPACIDADE DE PROCESSAMENTO DOS NÚCLEOS ENVOLVIDOS NOS CÁLCULOS DO CLIENTE SMP IMPLICA PERDA DE DESEMPENHO, MENOR ESCALABILIDADE.

Bom, esses são testes com uma WU que não rende muitos pontos nos computadores multithreaded. À medida que uma WU rende mais pontos quando processada em CPU's de grande rendimento, menor se torna a vantagem de usar uma placa de vídeo para pontuar. Provarei essa teoria ao receber uma WU de maior rendimento no cliente V7, aquelas que rodam com o Core_A4.

EDIT:

Fiz testes com o Linux rodando o cliente SMP e o cliente GPU nas mesmas situações acima descritas, mas com outras WU's, estas de melhor rendimento. Veja abaixo:

1) 8 núcleos, 8 threads do cliente SMP (V7) + 1 thread do GPU3 compartilhando os 8 núcleos (auto-mator.sh on na 8004)

2) 8 núcleos, threads dedicadas ao V7, cliente SMP, com o GPU3 parado;

A WU foi a 7008 no SMP, 6804 no GPU3

1) TPF de 1:45 e 1:19 => 40678 + 14491 = 55169 PPD

2) TPF de 1:22 => 58942 PPD

Testes comparando o rendimento da placa de vídeo com ou sem o script auto-mator.sh, que é responsável por alterar alguns parâmetros que podem melhorar o desempenho da placa de vídeo no folding.

3) 8 núcleos, 8 threads do cliente SMP (V7) + 1 thread do GPU3 compartilhando os 8 núcleos, auto-mator.sh off.

Agora testes incluídos processando a WU 8004.

4) 8 núcleos, as 7 threads do cliente SMP (V7) com núcleos dedicados e 1 núcleo rodando uma thread reservado para o GPU3 processar a WU da placa de vídeo;

5) 8 núcleos, 7 threads do cliente SMP (V7), com o cliente GPU parado.

Fiz esses dois testes pelo seguinte: o WINE é um wrapper, ele faz a leitura de uma instrução que o software do Windows gera e a traduz para a linguagem do software Linux. A hipótese era de que esse processo pudesse influenciar o TPF rodando ao mesmo tempo que outras threads dos cálculos. Mantendo uma thread livre o cliente SMP estaria mais livre para processar melhor seu trabalho.

A WU 8004 no SMP, 6804 no GPU3

1) TPF de 0:29 e 2:11 => 46948 + 8739 = 55687 PPD

2) TPF de 0:24 => 62359 PPD

3) TPF de 0:28 e 2:35 => 49486 + 7385 = 56872 PPD

4) TPF de 0:26 e 1:13 => 55304 + 15682 = 70986 PPD

5) TPF de 0:26 => 55304 PPD

Observe que o auto-mator.sh, quando a WU da placa de vídeo compartilha com o cliente SMP recursos de processamento, aumenta o rendimento da placa de vídeo, mas piora o rendimento do cliente SMP. Quando o auto-mator.sh está desativado o processador tem TPF de 28 segundos e cada % da WU da VGA corre em 2:35. Se o auto-mator.sh é ativado o processador leva um segundo mais % e o TPF da VGA cai para 2:11. Entretanto esse mesmo comportamento é anulado quando a VGA tem para si um núcleo inteirinho. Aí o rendimento é de 0:26 %. A penalidade é a diminuição de uma thread para o cliente SMP, mas as demais threads restantes processam melhor sem interferência de nenhum outro processo.

Quanto à hipótese de interferência do WINE no desempenho, observa-se que, se há ele é muito pequeno, talvez perceptível na casa dos centésimos de segundo, algo que não é possível avaliar.

Fica comprovada a minha teoria: usar a placa de vídeo não é benéfico em determinadas situações. Observar também que, se combinadas as WU's de maior rendimento com o processamento da VGA o rendimento desta cai, além de atrapalhar o rendimento do cliente SMP. Esse desastre é ainda maior se for combinadas WU's SMP mais recentes, que utilizam-se melhor do multi-threading, e o cliente GPU compartilhando recursos.

  • Curtir 1
Link para o comentário
Compartilhar em outros sites

  • Membro VIP

Aqui pegou uma do projeto 8011, simplesmente impressionante. Teve uma pontuação superior à das bigWUs no Linux aqui no i7 920... Com um over intermediário (3.7GHz) e memórias em dual channel, fez um TPF de 42 segundos (com o cliente GPU desativado). Isso dá 40.161 PPD! Se eu pôr o i7 em 4GHz e dar um jeito de ativar o triple channel (não dá no momento porque um dos módulos está no outro PC), não duvido que chegue perto dos 50.000 PPD. No Linux então...

PS: Não esqueci do tópico! :D

Em breve vou dar uma reformulada nele e adicionar os resultados que o pessoal postou e ainda não foram pras tabelas. O negócio é que acho que vou tirar das tabelas dos primeiros posts as WUs antigas e substituí-las pelas novas que estão saindo. Aí os resultados antigos eu passo para outro post que servirá como espécie de "arquivo". O que acham?

Link para o comentário
Compartilhar em outros sites

Aqui pegou uma do projeto 8011, simplesmente impressionante. Teve uma pontuação superior à das bigWUs no Linux aqui no i7 920... Com um over intermediário (3.7GHz) e memórias em dual channel, fez um TPF de 42 segundos (com o cliente GPU desativado). Isso dá 40.161 PPD! Se eu pôr o i7 em 4GHz e dar um jeito de ativar o triple channel (não dá no momento porque um dos módulos está no outro PC), não duvido que chegue perto dos 50.000 PPD. No Linux então...

PS: Não esqueci do tópico! :D

Em breve vou dar uma reformulada nele e adicionar os resultados que o pessoal postou e ainda não foram pras tabelas. O negócio é que acho que vou tirar das tabelas dos primeiros posts as WUs antigas e substituí-las pelas novas que estão saindo. Aí os resultados antigos eu passo para outro post que servirá como espécie de "arquivo". O que acham?

Desde ontem notei que o rendimento das WU's 8004, 8011 estão bem mais baixos do que eram... achei que era algum erro do cliente V7, que ele estava dando a estimativa errada, mas não é não. A pontuação desses projetos foi corrigida. Agora uma WU 8004, que antes estava rendendo 62,4K PPD no meu i7 agora rende 31,2K PPD. A 8011 estava rendendo, sozinha, 72K PPD, agora dá 37,8K PPD. É ****!!!

Link para o comentário
Compartilhar em outros sites

  • 5 semanas depois...

Bom pessoal, depois de ter configurado o i7 para processar bigWU's e já ter entregue algumas posso informar estatísticas. Lembrando que, por serem bigs o TPF é bem alto, logicamente que o tempo que levei para levantar estas estatísticas também foi grande.

As bigWU's são aquelas processadas pelo FahCore_A5: 6900, 6901, 6903 e 6904. Aqui caíram duas 6900 e seis 6903. As 6900 rendem PPD de 44K, aproximadamente. Já as 6903 dão 71K PPD, em média. Esses dados são para esse processador rodando a 4,65GHz e utilizando-se todos os threads dedicados ao Folding.

6900 TPF 23'12", 44090 PPD, 71034 pontos

6903 TPF 51'33", 71632 PPD, 256434 pontos

Como já demonstrado, processar WU's SMP utilizando-se todos os threads e compartilhando recursos de um núcleo para processar com a VGA não traz benefícios nem para um, nem para outro: ambos têm perda de rendimento. Assim sendo, parti direto para testes utilizando 7 threads dedicados ao cliente SMP e 1 thread para o GPU3.

Com essa configuração o TPF da 6903 passou para 56'55", 61743 PPD, 244045 pontos ao entregar a WU. O rendimento da VGA é de 15800 PPD, sendo a soma do conjunto de 77543 PPD, um acréscimo de cerca de 5900 PPD.

6903 TPF 56'55", 61743 PPD, 244045 pontos

7622 TPF 4'43", 15836 PPD, 5187 pontos por WU entregue (advmethods)

Soma: 77543 PPD, diferença de 5911 pontos.

A diferença é algo semelhante ao PPD de uma Radeon HD 6790 com -advmethods (FahCore_16) neste mesmo micro, mas compensando o decréscimo de rendimento do cliente SMP ao diminuir um núcleo de processamento.

  • Curtir 1
Link para o comentário
Compartilhar em outros sites

  • Membro VIP

pois é pessoal. Aí está a minha dúvida. Acho que vou deixar assim. Eu foldo em linux apenas. Como eu uso o win para jogar apenas, não há porque forçar ainda mais o processador. As mesmas temps jogando estou tendo no F@H.

Estou entregando uma WU por dia, embora meu processador não pegue grandes WUs. A pontuação, para mim, está interessante, visto que em 2 ou 3 semanas, não lembro bem, eu estou com 62mil pontos.

sei lá

mas esse script que o colega citou acima me interessou, mas me desinteressou ao rodar em wine. to contribuindo, e é isso que quero. Ademais....sei lá. Acho que não virarei um F@H fan boy. pelo menos por enquanto

mas aceito sugestões dos colegas, mas em linux. Windows ainda não penso em foldar, visto que seria instalar o cliente e pronto. Linux é mais embaixo o furo

Link para o comentário
Compartilhar em outros sites

  • 3 semanas depois...
Olá!

Com uma 9500GT foldando a noite toda descobri isso:

P5771

9500GT@650/1625/400 (DDR2) -> TPF: ~04mim:49seg, PPD 1.055

Trsite, mas se fosse em stock, 550/1375/333 seria mais triste ainda...

Eu acho que é por causa da memória DDR2. A que testei usava GDDR3 e rendia quase o dobro.

Link para o comentário
Compartilhar em outros sites

Realmente marcos, o rendimento dessa WU é incrível!

Minha GTX560-TI HAWK Twin Frozr III ta rendendo 20000 PPD sem over.

Pena que o um dos fans do TFIII resolveu parar de funcionar, ai estou sem poder foldar =/!

A 560Ti Hawk já tem um overclock animal de fábrica, RicADSI. Isso explica o porquê dela pontuar tão bem, quase como uma GTX 570 ou a GTX 560Ti 448 cores.

Link para o comentário
Compartilhar em outros sites

Pois é Zeca, eu vi mesmo!

Fiz um pequeno over aqui, bem de levezinho mesmo, e o rendimento subiu pra 21286 PPD nessa nova WU boa ^^!

EDIT: Consegui resolver o problema do fan! Abri ele e dei uma boa lubrificada. Não ficou 100%, mas pelo menos uns 80% de sua capacidade estão funcionando ^^! A minha sorte são os 2 Vipers na lateral soprando em cima dela! Sem os mesmos a VGA passa dos 90º!

Link para o comentário
Compartilhar em outros sites

  • mês depois...
Fernando, o que achou dos SB-E, comparado aos Gulftown?

Parabéns pela aquisição... :joia:

Obrigado ViX.

É possível atingir maiores OC com os SB-E, por exemplo 4,5Ghz é muito fácil com os SB-E e muito difícil para os Gulftowns.

O desempenho no mesmo clock é melhor nos SB-E por exemplo:

990x com 4Ghz e linux nativo 90.000ppd na 6903

3960x com 4.5Ghz e linux com VM 128.000ppd na 6903

Apesar dos SB-E trabalharem com um clock próximo aos Gulftowns eles aquecem menos.

Wadson os SB-E rendem mais que os Gulftowns no mesmo clock e ainda trabalham com clocks mais altos.

Link para o comentário
Compartilhar em outros sites

  • Membro VIP
Obrigado ViX.

É possível atingir maiores OC com os SB-E, por exemplo 4,5Ghz é muito fácil com os SB-E e muito difícil para os Gulftowns.

O desempenho no mesmo clock é melhor nos SB-E por exemplo:

990x com 4Ghz e linux nativo 90.000ppd na 6903

3960x com 4.5Ghz e linux com VM 128.000ppd na 6903

Apesar dos SB-E trabalharem com um clock próximo aos Gulftowns eles aquecem menos.

Wadson os SB-E rendem mais que os Gulftowns no mesmo clock e ainda trabalham com clocks mais altos.

um dia vou ter um desses..kkk

no momento isto não é possivel..

no máximo monto outro i7 igual ao que eu tenho e vendo o meu x6...

mas se eu montar um i7 provavel que use 2 gtx460 1Gb.

Link para o comentário
Compartilhar em outros sites

Visitante
Este tópico está impedido de receber novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...

Ebook grátis: Aprenda a ler resistores e capacitores!

EBOOK GRÁTIS!

CLIQUE AQUI E BAIXE AGORA MESMO!