Ir ao conteúdo

Posts recomendados

Postado

Zeca Pagodinho, como o EduardoS falou há algumas páginas, esse "HT reverso" não funcionaria pois programas single thread dificilmente tem ILP (Instruction Level Paralelism) suficiente para aproveitar um monte de unidades de execução.

edit:

mais algumas considerações sobre os números acima.

Esses são índices máximos/teóricos/ideais.

Na prática (na maioria dos casos) o rendimento de 2 threads rodando em 2 núcleos do mesmo módulo fica entre 1.4x e 1.5x

Bem melhor que o ganho do Hyper Threading (2 threads rodando dentro do mesmo núcleo) que dá no máximo 1.3x mas na média dá 1.15x.

O tio JF fez umas estimativas nesse sentido, quem quiser ver:

http://www.xtremesystems.org/forums/showthread.php?267050-What-to-Expect-From-AMD-at-ISSCC-2011&p=4755711#post4755711

E o behardware fez testes práticos (inclusive comparando o ganho do CMT do Bulldozer com o do HT do SandyBridge e os 2 núcleos físicos a mais de um Phenom II X6 (contra um Phenom II X4):

img00343531.png

http://www.behardware.com/articles/842-9/amd-fx-8150-and-fx-6100-bulldozer-arrives-on-am3.html

Esse teste ilustra isso à perfeição (alias, ainda não porque todos os testes foram feitos com clock padrão e o Turbo desligado, se fosse feito no Windows 8 com o Turbo ligado, em vários casos a coluna da direita seria superior a 100%)

img0034352.png

Observe que ao rodar um programa de 4 threads nos 4 núcleos de 2 módulos (coluna da direita) contra rodar os mesmos 4 threads em 1 núcleo de cada módulo (o segundo núcleo de cada módulo estava desabilitado, coluna do meio) houve muito pouca perda (em média menos de 20%).

Enquanto que ao rodar programas heavy multithread em 4 núcleos, cada um em um dos 4 módulos (coluna do meio), e usando todos os núcleos (8 núcleos, 4 módulos, coluna da esquerda) houve ganhos substanciais (em média 40%).

Os poucos casos onde a coluna da esquerda é inferior a 100% são os que esse patch do Windows 7 visa corrigir.

Postado

Supondo que 1x seja o rendimento de 1 thread em usando um núcleo de um módulo só para si (o segundo núcleo do módulo está ocioso)

Com 2 threads em um núcleo de cada módulo teríamos um rendimento teórico de 2x

Com esses mesmos 2 threads em 2 núcleos do mesmo módulo, segundo a AMD teríamos um rendimento de 1.8x

Mas fazendo isso (supondo que os demais módulos estão ociosos/desligados) podemos aproveitar o Turbo ao máximo, o que (dependendo do processador) pode nos dar um ganho de 29% (de 3.1GHz para 4GHz no FX-8120, por exemplo), portanto em vez de 1.8x teríamos 1.8x 1.29 = 2.32x

Ou seja, 32% maior que usando 2 núcleos em módulos separados (com cada thread tendo um módulo todo para si, que é o que esse patch para o Windows 7 propoe)

Isso ajuda a ilustrar minha ideia a respeito do uso do Hyper Threading: segundo a Intel, o uso do HT chega a aumentar o desempenho de processamento em até 30%, ou seja, o que seria 1x passa a ser 1,3x. Até por isso foram segmentados os processadores atuais entre i3, i5 e i7:

i3 com 2 núcleos, 4 threads

i5 com 4 núcleos, 4 threads

i7 com 4 núcleos, 8 threads

Diferindo, portanto, os segmentos em 30% de rendimento entre o seu antecessor e o seu sucessor, normalizado pelo clock. Claro que há algumas exceções dentro das famílias i3 e i5, mas como o próprio nome diz, são exceções (tem um ou dois modelos que fogem a essa regra).

A AMD disse que valeria mais duplicar uma parte do módulo justamente por isso: 1,8x, ao invés de 1,3x com o Hyper Threading. Os cálculos demonstrando essa lógica já foram apresentados aqui neste tópico, não lembro dos dados. Mas por que não obter ainda mais 30% sobre esses 1,8x? Nem que não sejam 30%, mas um ganho de 10% já seria algo a justificar o uso, por que não?

aziebert, quanto à tua colocação acho que, mesmo estando o processador com dois módulos ocupados, ele tem um nível de overclock (um pouco menor) considerando-se os outros dois módulos ociosos, o que diminui um pouco a gritante diferença de 32%. Correto?

Postado

Correto, Zeca Pagodinho.

O "turbo médio" do 8120 é 3.4GHz, enquanto o "turbo máximo" é 4GHz.

Assim o nosso 2x seria a 3.4GHz e o 1.8x teria um complemento de 1.17 o que dá 2.11x.

Que bate com o que vemos nos testes avaliando o comportamento do Bulldozer no Windows 8, cerca de 10% de ganho. Com possibilidade de aumentar mais um pouquinho se o programa compartilhar muitos dados entre os threads (o que será feito pelo cache L2).

Postado
Zeca Pagodinho, como o EduardoS falou há algumas páginas, esse "HT reverso" não funcionaria pois programas single thread dificilmente tem ILP (Instruction Level Paralelism) suficiente para aproveitar um monte de unidades de execução.

(observe que mesmo o SandyBridge tem apenas 3 dispatch ports, o Bulldozer tem 2, fora o pipeline de FPU, olhando assim um núcleo/módulo Bulldozer é mais "gordo/forte" que um núcleo SandyBridge)

Ok, mesmo que a capacidade de processamento total de dois núcleos fosse suficiente para aumentar em 2x o rendimento da dita aplicação single thread, dificilmente a aplicação daria conta de ocupar dois núcleos devido a características próprias: usaria poucas unidade de execução, ficando restritas à capacidade de processamento do núcleo.

  • Membro VIP
Postado
O que é justamente o contrário do que a AMD recomenda...

O contrário do que o departamento de marketing recomendava...

Em geral eles são a voz a empresa e soa estranho a empresa fazer o contrário, mas nesse caso como são esses os caras que fizeram o maior hype da decada e mataram a vantagem competitiva da AMD em bancos de dados ao chamar o módulo de módulo ao invés de núcleo e que agora estão a procura de novos empregos podemos ignorar algumas coisas que disseram...

Para todos que testaram o Bulldozer o módulo parecia um núcleo com SMT, o ganha era maior que o Hyper-Threading mas não alto o bastante para ser um núcleo extra, o estranho foi a AMD não ter feito o bicho ser reconhecido que nem os processadores com HyperThreading são, talvez por pressão do marketing que não queria algum programa reconhecendo o FX-8150 como quad core ou por incompetência de algum engenheiro mesmo, em ambos os casos o responsável deveria perder o emprego.

E por fim, o patch do Windows 7 é o que o Windows 8 fazia, aquele papo de turbo é balela, para a maioria esmagadora das aplicações é melhor alocar primeiro em módulos vazios.

Postado

Discordo, EduardoS. Pelo que vejo, a maioria das aplicações que usa até 4 threads dependem mais de ALU que de FPU, então faz mais sentido concentrá-los nos núcleos de poucos módulos que alocar o primeiro núcleo de cada módulo primeiro, como é feito nos i7.

Mesmo se o Turbo não for suficiente para compensar o impacto no desempenho do compartilhamento de recursos do módulo, isso será muito importante nos notebooks com Trinity para economizar energia.

Postado
Pelo jeito a AMD está igual a marido traído.

http://www.brightsideofnews.com/news/2011/12/16/microsoft-releases-amd-bulldozer-patch-by-mistake2c-incomplete-download.aspx

Não sabia da publicação do patch.

Eles comentam que há dois patchs sendo preparados para lançamento no primeiro quarto de 2012, portanto com prazo entre janeiro e março, e o que foi colocado no página da Microsoft foi justamente o primeiro. Não se espera que este traga grande diferença de desempenho, mas o segundo, sim. A surpresa está no fato de terem lançado o patch com antecipação, ainda mais que ele não traz aumento considerável de desempenho.

Não vejo problema aí: se não era esperado, não era para estar esperando sua publicação e é natural que nem tivessem tomado conhecimento, embora não seja isso que tenha sido dito no texto.

Postado

Pelo jeito, o primeiro é só para scheduler reconhecer os módulo com núcleos, o segundo 'por minha conta em risco' é para gerenciar os threads, quem sabe se não seja da forma como o Ziebert acredita?

O que não poderia ter acontecido era tê-los disponibilizados separadamente, até um *.EXE seria bem vindo.

Postado

Esse patch eu até acho válido. Mas seria bem interessante se a MS oferecesse uma opção para o usuário escolher como quer que o Windows gerencie os núcleos:

- Cada um por si (reconhecer cada núcleo como "completo", como o Windows 7 faz por enquanto)

- usar primeiro um núcleo de cada módulo

- preencher os módulos conforme a necessidade

  • Membro VIP
Postado
Esse patch eu até acho válido. Mas seria bem interessante se a MS oferecesse uma opção para o usuário escolher como quer que o Windows gerencie os núcleos:

- Cada um por si (reconhecer cada núcleo como "completo", como o Windows 7 faz por enquanto)

- usar primeiro um núcleo de cada módulo

- preencher os módulos conforme a necessidade

Acho que do ponto de vista de usuários profissionais até seria válido, pois dependendo do programa, o ganho seria melhor com uma escolha ou outra.

No entanto, acho que 95% ou mais das pessoas que comprarem os BDZ serão leigos e, com certeza, não saberão que tem esta possibilidade e, se souberem, não saberão qual escolher e, se ainda sim passarem desta etapa, não saberão para qual programa serve qual escolha (se houver um aviso por parte do windows sobre o que devemos escolher, acho que vai chover de chamados no suporte da M$).

Outro detalhe é que provavelmente deve que ter uma modificação no kernel monstra (não entendo disto, mas acredito que seja devido à quantidade de ferramentas e possibilidades no windows) para cada escolha.

Sinceramente não creio que a microsoft vai querer servir estas possibilidades dadas as problematicas encontradas para que ocorram.

Postado
Acho que do ponto de vista de usuários profissionais até seria válido, pois dependendo do programa, o ganho seria melhor com uma escolha ou outra.

No entanto, acho que 95% ou mais das pessoas que comprarem os BDZ serão leigos e, com certeza, não saberão que tem esta possibilidade e, se souberem, não saberão qual escolher e, se ainda sim passarem desta etapa, não saberão para qual programa serve qual escolha (se houver um aviso por parte do windows sobre o que devemos escolher, acho que vai chover de chamados no suporte da M$).

Outro detalhe é que provavelmente deve que ter uma modificação no kernel monstra (não entendo disto, mas acredito que seja devido à quantidade de ferramentas e possibilidades no windows) para cada escolha.

Sinceramente não creio que a microsoft vai querer servir estas possibilidades dadas as problematicas encontradas para que ocorram.

Concordo contigo, mas para usuários avançados as opções que o aziebert citou seriam interessantes sim. Mas também acho que isso não deve ser algo simples de se implementar, pelos motivos que você mesmo já citou.

  • Membro VIP
Postado
Antes que esse negócio cresça fora de proporção. Apareceu numa lista de compatibilidade da ECS um suposto Phenom II X8 de 32nm:

http://www.xtremesystems.org/forums/showthread.php?277788-Phenon-II-X8-ECS-bios-update

O OPN bate com um engineering sample antigo de Bulldozer, então desconsiderem, foi um erro de alguém da ECS, não existe Phenom II X8...

Wow... interessante é que tem os FX na lista também, então deixa qualquer pessoa com pulgas nas zoreba.

http://imageshack.us/photo/my-images/853/91843c7ba9c573dafbeae7c.jpg/

Postado
Acho que do ponto de vista de usuários profissionais até seria válido, pois dependendo do programa, o ganho seria melhor com uma escolha ou outra.

No entanto, acho que 95% ou mais das pessoas que comprarem os BDZ serão leigos e, com certeza, não saberão que tem esta possibilidade e, se souberem, não saberão qual escolher e, se ainda sim passarem desta etapa, não saberão para qual programa serve qual escolha (se houver um aviso por parte do windows sobre o que devemos escolher, acho que vai chover de chamados no suporte da M$).

Outro detalhe é que provavelmente deve que ter uma modificação no kernel monstra (não entendo disto, mas acredito que seja devido à quantidade de ferramentas e possibilidades no windows) para cada escolha.

Sinceramente não creio que a microsoft vai querer servir estas possibilidades dadas as problematicas encontradas para que ocorram.

Segundo o TecMundo o Windows 8 vai oferecer uma gama de controles para usuários em processamento multi-core: http://www.tecmundo.com.br/windows-8/15071-windows-8-vai-extrair-o-maximo-do-poder-de-processadores-multi-core.htm

Núcleos ociosos vão poder ser ativados com apenas alguns cliques. Para facilitar ainda mais, o Windows 8 vai permitir também que, em vez de controlar os núcleos, os usuários selecionem os serviços e processos para escolher quais núcleos serão responsáveis por eles.

Leia mais em: http://www.tecmundo.com.br/windows-8/15071-windows-8-vai-extrair-o-maximo-do-poder-de-processadores-multi-core.htm#ixzz1gwXdshXE

Quem não souber utilizar tais recursos, basta apenas não utilizá-los, a configuração padrão do Sistema será usada no caso.

Da mesma forma, o Windows 7 permite o usuário manipular várias opções (truques ou tweaks), mas nenhum usuário leigo é obrigado a conhecê-las. As pessoas também podem optar por instalar utilitários de otimização do Sistema, onde basta você selecionar as caixas de verificação dos itens que você deseja otimizar, muito mais fácil do que mexer no Registro do Windows.

Postado

Doutora Mocréia, telminão, pelo MIT ainda por cima.

A Lisa Su foi CFO e Vice Presidente da Freescale e antes disso Vice Presidente do Centro de Pesquisa e Desenvolvimento de Semicondutores da IBM! :o

http://techreport.com/discussions.x/22178

Dizem que o Rick Bergman saiu porque não foi escolhido CEO depois de mandarem o tio Dirk embora.

Agora ele é Presidente, CEO e membro da "board" de acionistas da Synaptics (a fabricante do touchpad da maioria dos notebooks).

Bom pra ele. Embora estivesse mais que qualificado para ser CEO da AMD, não seria uma posição nada confortável...

Postado

Pra quem achava que o FX-6100 era "até uma boa opção", olha o tamanho do gargalo que ele gerou no teste do "Sistema de 1000 dólares" da Tom's Hardware:

http://www.tomshardware.com/reviews/fx-overclock-crossfire-ssd,3098-13.html

http://www.tomshardware.com/reviews/fx-overclock-crossfire-ssd,3098-10.html

http://www.tomshardware.com/reviews/fx-overclock-crossfire-ssd,3098-12.html

Fora o consumo maluco.

Postado
Pra quem achava que o FX-6100 era "até uma boa opção", olha o tamanho do gargalo que ele gerou no teste do "Sistema de 1000 dólares" da Tom's Hardware:

http://www.tomshardware.com/reviews/fx-overclock-crossfire-ssd,3098-13.html

http://www.tomshardware.com/reviews/fx-overclock-crossfire-ssd,3098-10.html

http://www.tomshardware.com/reviews/fx-overclock-crossfire-ssd,3098-12.html

Fora o consumo maluco.

CF HD 6950 em Crysis, CPU em Over, 32% de ganho em performance é para eu acreditar agora? ou seria esse ganho todo com SLI GTX 460?

Postado

AMD Announces New A-Series Accelerated Processing Units (APUs)

http://www.techpowerup.com/157132/AMD-Announces-New-A-Series-Accelerated-Processing-Units-%28APUs%29.html

AMD today updated its A-Series line-up of desktop and notebook Accelerated Processing Units (APUs), further improving its top-performing family of dual- and quad-core APUs. Along with speed and performance improvements, AMD Steady Video update make this unique feature more compelling than ever. For desktop users, AMD extends its overclocking pedigree to the APU; for the first time users can tune both x86 and graphics settings in a single processor for boosted performance.

The updated AMD A-Series APUs combine up to four x86 CPU cores with up to 400 Radeon cores, delivering powerful DirectX 11-capable, discrete-level graphics and dedicated HD video processing on a single chip. These new APUs increase performance and deliver a richer feature set than existing AMD A-series APUs. Plus, only AMD APUs offer AMD Dual Graphics for an up to 144 percent visual performance boost when a select APU is paired with a select AMD Radeon HD 6500 Series graphics card.

The AMD A-Series family of APUs also features AMD Steady Video, designed to stabilize videos during playback – making unsteady, jumpy content look steady and smooth as you watch. On select systems using AMD A-Series APUs, Internet Explorer 9 will include an AMD Steady Video plugin, unlocking one-click control to simplify access to the premium AMD Steady Video feature for video stabilization.

All AMD A-Series processors are powered by AMD VISION Engine Software, a suite of software that provides end-users with regular updates designed to improve system performance and stability, and can add new software enhancements.

New A-Series Desktop APUs launched today:

A8-3870K: Four CPU cores, 3.0 GHz CPU base (unlocked), 100W TDP, 400 Radeon cores, 600 MHz GPU base (unlocked), 4 MB L2 cache

A8-3820: Four CPU cores, 2.5 GHz CPU base (2.8 GHz Turbo Core), 65W TDP, 400 Radeon cores, 4 MB L2 cache

A6-3670K: Four CPU cores, 2.7 GHz CPU base (unlocked), 100W TDP, 320 Radeon cores, 600 MHz GPU base (unlocked), 4 MB L2 cache

A6-3620: Four CPU cores, 2.2 GHz CPU base (2.5 GHz Turbo Core), 65W TDP, 320 Radeon cores, 4 MB L2 cache

A4-3420: Two CPU cores, 2.8 GHz CPU base, 65W TDP, 160 Radeon cores, 1 MB L2 cache

New Notebook APUs launched today:

A8-3550MX: Four CPU cores, 2.0 GHz CPU base (2.7 GHz Turbo Core), 45W TDP, 400 Radeon Cores, 4 MB L2 cache

A8-3520M: Four CPU cores, 1.6 GHz CPU base (2.5 GHz Turbo Core), 35W TDP, 400 Radeon Cores, 4 MB L2 cache

A6-3430MX: Four CPU cores, 1.7 GHz CPU base (2.4 GHz Turbo Core), 45W TDP, 320 Radeon Cores, 4 MB L2 cache

A6-3420M: Four CPU cores, 1.5 GHz CPU base (2.4 GHz Turbo Core), 35W TDP, 320 Radeon Cores, 4 MB L2 cache

A4-3330MX: Two CPU cores, 2.2 GHz CPU base (2.6 GHz Turbo Core), 45W TDP, 240 Radeon Cores, 2 MB L2 cache

A4-3320M:Two CPU cores, 2.0 GHz CPU base (2.6 GHz Turbo Core), 35W TDP, 240 Radeon Cores, 2 MB L2 cache

A4-3305M:Two CPU cores, 1.9 GHz CPU base (2.5 GHz Turbo Core), 35W TDP, 160 Radeon Cores, 1 MB L2 cache

E2-3000M: Two CPU cores, 1.8 GHz CPU base (2.4 GHz Turbo Core), 35W TDP, 160 Radeon Cores, 1 MB L2 Cache

The new AMD A-Series family of APUs improves the first generation of highly successful and revolutionary desktop and notebook processors, providing an outstanding experience for consumers seeking more responsive multitasking, long battery-life, vivid graphics, lifelike games, lag-free videos and the ultimate multimedia performance.

Desktop APUs in the component channel as well as systems based on the new AMD A-Series APUs will hit the retail market over the next several weeks.

Visitante
Este tópico está impedido de receber novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...

LANÇAMENTO!

eletronica2025-popup.jpg


CLIQUE AQUI E BAIXE AGORA MESMO!