Pontuação/Rendimento de CPUs e GPUs no folding@home

V i X · 2 de janeiro de 2012

Deve ficar perto da GTX 570...

Pessoal, depois eu arrumo um tempo pra atualizar as tabelas, mas por enquanto está difícil...

VitorWolff · 11 de janeiro de 2012

Cliente v7 rodando GPU junto com SMP

I5 2500k @ 3.6Ghz Wu 8001 TPF 0'59" ppd 15766

GTX 460 @ 740 / 1480 / 1950 WU 6801 TPF 2'03" PPD 9432 (gpu que esta rodando o sistema)

GTX 460 @ 740 / 1480 / 1950 WU 6801 TPF 2'00" PPD 9639

Zeca Pagodinho · 11 de janeiro de 2012

Vitor, faz uns testes rodando somente o SMP, o SMP (4 threads) e as VGA's, e o SMP (2 threads) e as VGA's para ver o rendimento em cada situação, de preferência rodando as mesmas WU's. Usa o TPF para calcular o PPD de forma sintética.

Outra hora farei o mesmo e postarei os resultados para comparação.

Zeca Pagodinho · 11 de janeiro de 2012

Olhem os resultados do que fiz por aqui...

Rodei o cliente GPU3 no Linux e no Windows, o resultado é um TPF idêntico.

Rodei o GPU3 e o V7 simultaneamente...

1) 8 núcleos, as 7 threads do cliente SMP (V7) com núcleos dedicados e 1 núcleo rodando uma thread reservado para o GPU3 processar a WU da placa de vídeo;

2) 8 núcleos, threads dedicadas ao V7, cliente SMP, com o GPU3 parado;

3) 8 núcleos, 8 threads do cliente SMP (V7) + 1 thread do GPU3 compartilhando os 8 núcleos.

A WU foi a 7600 no SMP, 6801 no GPU3

1) TPF de 4:41 e 1:13, respectivamente. => 37026 PPD

2) TPF de 4:00 => 26700 PPD

3) TPF de 4:59 e 1:13, respectivamente. => 35150 PPD

Como conclusão temos que o melhor cenário é usando a CPU com núcleos dedicados ao cliente SMP e um núcleo reservado ao GPU3. O que não pode haver é compartilhamento de processamento de uma thread com outra thread que exija bastante processamento. O COMPARTILHAMENTO DA CAPACIDADE DE PROCESSAMENTO DOS NÚCLEOS ENVOLVIDOS NOS CÁLCULOS DO CLIENTE SMP IMPLICA PERDA DE DESEMPENHO, MENOR ESCALABILIDADE.

Bom, esses são testes com uma WU que não rende muitos pontos nos computadores multithreaded. À medida que uma WU rende mais pontos quando processada em CPU's de grande rendimento, menor se torna a vantagem de usar uma placa de vídeo para pontuar. Provarei essa teoria ao receber uma WU de maior rendimento no cliente V7, aquelas que rodam com o Core_A4.

EDIT:

Fiz testes com o Linux rodando o cliente SMP e o cliente GPU nas mesmas situações acima descritas, mas com outras WU's, estas de melhor rendimento. Veja abaixo:

1) 8 núcleos, 8 threads do cliente SMP (V7) + 1 thread do GPU3 compartilhando os 8 núcleos (auto-mator.sh on na 8004)

2) 8 núcleos, threads dedicadas ao V7, cliente SMP, com o GPU3 parado;

A WU foi a 7008 no SMP, 6804 no GPU3

1) TPF de 1:45 e 1:19 => 40678 + 14491 = 55169 PPD

2) TPF de 1:22 => 58942 PPD

Testes comparando o rendimento da placa de vídeo com ou sem o script auto-mator.sh, que é responsável por alterar alguns parâmetros que podem melhorar o desempenho da placa de vídeo no folding.

3) 8 núcleos, 8 threads do cliente SMP (V7) + 1 thread do GPU3 compartilhando os 8 núcleos, auto-mator.sh off.

Agora testes incluídos processando a WU 8004.

4) 8 núcleos, as 7 threads do cliente SMP (V7) com núcleos dedicados e 1 núcleo rodando uma thread reservado para o GPU3 processar a WU da placa de vídeo;

5) 8 núcleos, 7 threads do cliente SMP (V7), com o cliente GPU parado.

Fiz esses dois testes pelo seguinte: o WINE é um wrapper, ele faz a leitura de uma instrução que o software do Windows gera e a traduz para a linguagem do software Linux. A hipótese era de que esse processo pudesse influenciar o TPF rodando ao mesmo tempo que outras threads dos cálculos. Mantendo uma thread livre o cliente SMP estaria mais livre para processar melhor seu trabalho.

A WU 8004 no SMP, 6804 no GPU3

1) TPF de 0:29 e 2:11 => 46948 + 8739 = 55687 PPD

2) TPF de 0:24 => 62359 PPD

3) TPF de 0:28 e 2:35 => 49486 + 7385 = 56872 PPD

4) TPF de 0:26 e 1:13 => 55304 + 15682 = 70986 PPD

5) TPF de 0:26 => 55304 PPD

Observe que o auto-mator.sh, quando a WU da placa de vídeo compartilha com o cliente SMP recursos de processamento, aumenta o rendimento da placa de vídeo, mas piora o rendimento do cliente SMP. Quando o auto-mator.sh está desativado o processador tem TPF de 28 segundos e cada % da WU da VGA corre em 2:35. Se o auto-mator.sh é ativado o processador leva um segundo mais % e o TPF da VGA cai para 2:11. Entretanto esse mesmo comportamento é anulado quando a VGA tem para si um núcleo inteirinho. Aí o rendimento é de 0:26 %. A penalidade é a diminuição de uma thread para o cliente SMP, mas as demais threads restantes processam melhor sem interferência de nenhum outro processo.

Quanto à hipótese de interferência do WINE no desempenho, observa-se que, se há ele é muito pequeno, talvez perceptível na casa dos centésimos de segundo, algo que não é possível avaliar.

Fica comprovada a minha teoria: usar a placa de vídeo não é benéfico em determinadas situações. Observar também que, se combinadas as WU's de maior rendimento com o processamento da VGA o rendimento desta cai, além de atrapalhar o rendimento do cliente SMP. Esse desastre é ainda maior se for combinadas WU's SMP mais recentes, que utilizam-se melhor do multi-threading, e o cliente GPU compartilhando recursos.

V i X · 16 de janeiro de 2012

Aqui pegou uma do projeto 8011, simplesmente impressionante. Teve uma pontuação superior à das bigWUs no Linux aqui no i7 920... Com um over intermediário (3.7GHz) e memórias em dual channel, fez um TPF de 42 segundos (com o cliente GPU desativado). Isso dá 40.161 PPD! Se eu pôr o i7 em 4GHz e dar um jeito de ativar o triple channel (não dá no momento porque um dos módulos está no outro PC), não duvido que chegue perto dos 50.000 PPD. No Linux então...

PS: Não esqueci do tópico!

Em breve vou dar uma reformulada nele e adicionar os resultados que o pessoal postou e ainda não foram pras tabelas. O negócio é que acho que vou tirar das tabelas dos primeiros posts as WUs antigas e substituí-las pelas novas que estão saindo. Aí os resultados antigos eu passo para outro post que servirá como espécie de "arquivo". O que acham?

Evandro · 16 de janeiro de 2012

Cliente 7, SMP, Turion X2 TL-60, Ubuntu 10.04 32 bits, Kernel 2.6.38-10

Projeto 7903

TPF ~ 55' 22"

ETA ~3.74 dias

PPD ~ 423.81

Já rende quase o dobro do que os 250 de antes.

Zeca Pagodinho · 16 de janeiro de 2012

Aqui pegou uma do projeto 8011, simplesmente impressionante. Teve uma pontuação superior à das bigWUs no Linux aqui no i7 920... Com um over intermediário (3.7GHz) e memórias em dual channel, fez um TPF de 42 segundos (com o cliente GPU desativado). Isso dá 40.161 PPD! Se eu pôr o i7 em 4GHz e dar um jeito de ativar o triple channel (não dá no momento porque um dos módulos está no outro PC), não duvido que chegue perto dos 50.000 PPD. No Linux então...
PS: Não esqueci do tópico!

Em breve vou dar uma reformulada nele e adicionar os resultados que o pessoal postou e ainda não foram pras tabelas. O negócio é que acho que vou tirar das tabelas dos primeiros posts as WUs antigas e substituí-las pelas novas que estão saindo. Aí os resultados antigos eu passo para outro post que servirá como espécie de "arquivo". O que acham?

Desde ontem notei que o rendimento das WU's 8004, 8011 estão bem mais baixos do que eram... achei que era algum erro do cliente V7, que ele estava dando a estimativa errada, mas não é não. A pontuação desses projetos foi corrigida. Agora uma WU 8004, que antes estava rendendo 62,4K PPD no meu i7 agora rende 31,2K PPD. A 8011 estava rendendo, sozinha, 72K PPD, agora dá 37,8K PPD. É ****!!!

Zeca Pagodinho · 15 de fevereiro de 2012

Bom pessoal, depois de ter configurado o i7 para processar bigWU's e já ter entregue algumas posso informar estatísticas. Lembrando que, por serem bigs o TPF é bem alto, logicamente que o tempo que levei para levantar estas estatísticas também foi grande.

As bigWU's são aquelas processadas pelo FahCore_A5: 6900, 6901, 6903 e 6904. Aqui caíram duas 6900 e seis 6903. As 6900 rendem PPD de 44K, aproximadamente. Já as 6903 dão 71K PPD, em média. Esses dados são para esse processador rodando a 4,65GHz e utilizando-se todos os threads dedicados ao Folding.

6900 TPF 23'12", 44090 PPD, 71034 pontos

6903 TPF 51'33", 71632 PPD, 256434 pontos

Como já demonstrado, processar WU's SMP utilizando-se todos os threads e compartilhando recursos de um núcleo para processar com a VGA não traz benefícios nem para um, nem para outro: ambos têm perda de rendimento. Assim sendo, parti direto para testes utilizando 7 threads dedicados ao cliente SMP e 1 thread para o GPU3.

Com essa configuração o TPF da 6903 passou para 56'55", 61743 PPD, 244045 pontos ao entregar a WU. O rendimento da VGA é de 15800 PPD, sendo a soma do conjunto de 77543 PPD, um acréscimo de cerca de 5900 PPD.

6903 TPF 56'55", 61743 PPD, 244045 pontos

7622 TPF 4'43", 15836 PPD, 5187 pontos por WU entregue (advmethods)

Soma: 77543 PPD, diferença de 5911 pontos.

A diferença é algo semelhante ao PPD de uma Radeon HD 6790 com -advmethods (FahCore_16) neste mesmo micro, mas compensando o decréscimo de rendimento do cliente SMP ao diminuir um núcleo de processamento.

ilkyest · 18 de fevereiro de 2012

pois é pessoal. Aí está a minha dúvida. Acho que vou deixar assim. Eu foldo em linux apenas. Como eu uso o win para jogar apenas, não há porque forçar ainda mais o processador. As mesmas temps jogando estou tendo no F@H.

Estou entregando uma WU por dia, embora meu processador não pegue grandes WUs. A pontuação, para mim, está interessante, visto que em 2 ou 3 semanas, não lembro bem, eu estou com 62mil pontos.

sei lá

mas esse script que o colega citou acima me interessou, mas me desinteressou ao rodar em wine. to contribuindo, e é isso que quero. Ademais....sei lá. Acho que não virarei um F@H fan boy. pelo menos por enquanto

mas aceito sugestões dos colegas, mas em linux. Windows ainda não penso em foldar, visto que seria instalar o cliente e pronto. Linux é mais embaixo o furo

Adryanss · 8 de março de 2012

Olá!

Com uma 9500GT foldando a noite toda descobri isso:

P5771

9500GT@650/1625/400 (DDR2) -> TPF: ~04min:49seg, PPD 1.055

Trsite, mas se fosse em stock, 550/1375/333 seria mais triste ainda...

Zeca Pagodinho · 10 de março de 2012

Olá!
Com uma 9500GT foldando a noite toda descobri isso:

P5771

9500GT@650/1625/400 (DDR2) -> TPF: ~04mim:49seg, PPD 1.055

Trsite, mas se fosse em stock, 550/1375/333 seria mais triste ainda...

Eu acho que é por causa da memória DDR2. A que testei usava GDDR3 e rendia quase o dobro.

Marcosh72 · 14 de março de 2012

P8031, Client 6.41r2 Console

eVGA GTX 570 1280mb 800/1600/1900 ~> TPF: ~2 min e 33 seg; PPD: ~21703

Incrível o rendimento com essa WU.

Att,

Marcos.

RicADSI · 14 de março de 2012

Realmente marcos, o rendimento dessa WU é incrível!

Minha GTX560-TI HAWK Twin Frozr III ta rendendo 20000 PPD sem over.

Pena que o um dos fans do TFIII resolveu parar de funcionar, ai estou sem poder foldar =/!

Zeca Pagodinho · 17 de março de 2012

Realmente marcos, o rendimento dessa WU é incrível!
Minha GTX560-TI HAWK Twin Frozr III ta rendendo 20000 PPD sem over.

Pena que o um dos fans do TFIII resolveu parar de funcionar, ai estou sem poder foldar =/!

A 560Ti Hawk já tem um overclock animal de fábrica, RicADSI. Isso explica o porquê dela pontuar tão bem, quase como uma GTX 570 ou a GTX 560Ti 448 cores.

RicADSI · 17 de março de 2012

Pois é Zeca, eu vi mesmo!

Fiz um pequeno over aqui, bem de levezinho mesmo, e o rendimento subiu pra 21286 PPD nessa nova WU boa ^^!

EDIT: Consegui resolver o problema do fan! Abri ele e dei uma boa lubrificada. Não ficou 100%, mas pelo menos uns 80% de sua capacidade estão funcionando ^^! A minha sorte são os 2 Vipers na lateral soprando em cima dela! Sem os mesmos a VGA passa dos 90º!

fernando1 · 20 de abril de 2012

Projeto: 6903

I7 3960x@4.5 GHz - 16GB DDR3 2.133 MHz 9-11-10-28 Linux Ubuntu 10.10 x64 com VirtualBox -> TPF: 35mim 00seg, PPD: 128.000

EribertoTorres · 20 de abril de 2012

Fernando sempre apelao rss. Agora que eu vi o SB-Extreme

Quanto rendeu no total essa wu?

wadsonleite · 20 de abril de 2012

esse processador compra meu pc..kkkkk

fernando1 · 21 de abril de 2012

Fernando sempre apelao rss. Agora que eu vi o SB-Extreme
Quanto rendeu no total essa wu?

Renderá aprox. 311.000pts

esse processador compra meu pc..kkkkk

Compra nada

A melhor compra é o 3930K, custa menos e rende exatamente igual.

V i X · 21 de abril de 2012

Fernando, o que achou dos SB-E, comparado aos Gulftown?

Parabéns pela aquisição...

wadsonleite · 22 de abril de 2012

só esse processador compra meu i7 montado..

então obrigatoriamente ele tem que render muito mais que o meu i7 e pelo menos igual aos gulftowns....

essa é minha opinião..

kkkkkkkkkkkkkk

fernando1 · 22 de abril de 2012

Fernando, o que achou dos SB-E, comparado aos Gulftown?
Parabéns pela aquisição...

Obrigado ViX.

É possível atingir maiores OC com os SB-E, por exemplo 4,5Ghz é muito fácil com os SB-E e muito difícil para os Gulftowns.

O desempenho no mesmo clock é melhor nos SB-E por exemplo:

990x com 4Ghz e linux nativo 90.000ppd na 6903

3960x com 4.5Ghz e linux com VM 128.000ppd na 6903

Apesar dos SB-E trabalharem com um clock próximo aos Gulftowns eles aquecem menos.

Wadson os SB-E rendem mais que os Gulftowns no mesmo clock e ainda trabalham com clocks mais altos.

wadsonleite · 23 de abril de 2012

Obrigado ViX.
É possível atingir maiores OC com os SB-E, por exemplo 4,5Ghz é muito fácil com os SB-E e muito difícil para os Gulftowns.

O desempenho no mesmo clock é melhor nos SB-E por exemplo:

990x com 4Ghz e linux nativo 90.000ppd na 6903

3960x com 4.5Ghz e linux com VM 128.000ppd na 6903

Apesar dos SB-E trabalharem com um clock próximo aos Gulftowns eles aquecem menos.

Wadson os SB-E rendem mais que os Gulftowns no mesmo clock e ainda trabalham com clocks mais altos.

um dia vou ter um desses..kkk

no momento isto não é possivel..

no máximo monto outro i7 igual ao que eu tenho e vendo o meu x6...

mas se eu montar um i7 provavel que use 2 gtx460 1Gb.

EribertoTorres · 23 de abril de 2012

Acho melhor esperarem, saiu hoje os IB

Já tem o review do cdh

RicADSI · 23 de abril de 2012

Finalmente saiu os IB eim Eriba!

Depois de enrolar muito kkkk!

Já tem review??? o.O

Entrar

Pontuação/Rendimento de CPUs e GPUs no folding@home

Posts recomendados

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Link para o comentário

Compartilhar em outros sites

Quem está navegando aqui 0 usuários estão online

Últimos tópicos

Livros

Cursos

Conteúdo recente

Sobre o Clube do Hardware

Direitos autorais

Mais