Ir ao conteúdo

Posts recomendados

Postado
Eu sei, mas o Trinity terá dois módulos e não terá L3, é um chip diferente e sem amadurecerem bastante o processo, esses 3.6~4 GHz provavelmente é o que vão conseguir sem extrapolar o TDP.

Uai, o L3 consome 405mi de transistores e certamente consome uma parte considerável do TDP. O FX-4120 será lançado com TDP de 95W, ainda na revisão B2. O FX-8170 será lançado com 3,9GHz stock, indo a 4,5GHz no turbo (revisão B3). Um FX-4xxx chegaria a uns 4,2GHz stock tranquilo na revisão B3.

Um Trinity sem L3 pode chegar a uns 4,5GHz, provavelmente. Só que eles terão que adequar a frequência ao TDP se o consumo passar de 100W (pressupondo-se que a política de consumo seja a mesma). Como a AMD disse, a GPU do Trinity terá 50% a mais de eficiência elétrica. Podemos estimar o consumo da GPU dos Trinity aproximadamente em 20W. Acho que dê para chegar pelo menos nos 4,2GHz.

Postado
Uai, o L3 consome 405mi de transistores e certamente consome uma parte considerável do TDP. O FX-4120 será lançado com TDP de 95W, ainda na revisão B2. O FX-8170 será lançado com 3,9GHz stock, indo a 4,5GHz no turbo (revisão B3). Um FX-4xxx chegaria a uns 4,2GHz stock tranquilo na revisão B3.

Um Trinity sem L3 pode chegar a uns 4,5GHz, provavelmente. Só que eles terão que adequar a frequência ao TDP se o consumo passar de 100W (pressupondo-se que a política de consumo seja a mesma). Como a AMD disse, a GPU do Trinity terá 50% a mais de eficiência elétrica. Podemos estimar o consumo da GPU dos Trinity aproximadamente em 20W. Acho que dê para chegar pelo menos nos 4,2GHz.

Acredito que, nos desktops as GPUs consumam bem mais que 20W. Se não me engano, também prometeram ganhos no poder da GPU. Acredito que apenas a parte do die referente a GPU deva consumir uns ~50W, pois atualmente são 400Sps. Se for pra arriscar números, acho que o trinity pode vir com uns 480~640Sps - ou seus respectivos em VLIW4 -, sendo o segundo caso, apenas se as coisas estiverem realmente dando certo. Deixa 50W para os dois módulos.

Tudo depende dos melhoramentos do piledriver, mas acho que 2 módulos, mesmo sem o L3 @ 4.5Ghz talvez seja muito para ~50W

Postado
Acredito que, nos desktops as GPUs consumam bem mais que 20W. Se não me engano, também prometeram ganhos no poder da GPU. Acredito que apenas a parte do die referente a GPU deva consumir uns 40~50W, pois atualmente são 400Sps. Se for pra arriscar números, acho que o trinity pode vir com uns 480~640Sps, sendo o segundo caso, apenas se as coisas estiverem realmente dando certo. Deixa 50 a 60W para os dois módulos.

Sim, os Trinity certamente virão com mais unidades de processamento gráfico, porém virão com cerca de 50% a mais de eficiência elétrica na parte GPU.

Também deve-se levar em consideração de que rumores dão conta de que a AMD procurou a TSMC recentemente. Talvez os Trinity serão fabricados pela TSMC e, no caso, não se tem estimativa de qual seria a eficiência elétrica.

Postado
Sim, os Trinity certamente virão com mais unidades de processamento gráfico, porém virão com cerca de 50% de eficiência elétrica na parte GPU.

Também deve-se levar em consideração de que rumores dão conta de que a AMD procurou a TSMC recentemente. Talvez os Trinity serão fabricados pela TSMC e, no caso, não se tem estimativa de qual seria a eficiência elétrica.

Você confia na TSMC? :D

É de lá que sai placas em 40nm com 720Sps -e mais alguns desligados- com 86W de consumo - 6750. Se o chip for responsável por uns 50W do consumo da placa, considerando que a mesma ainda tem as memórias, a eficiência do CRT entre outros detalhes, até que dá pra ser mais otimista com o consumo na versão 32nm. Fico apreensivo com essa tal eficiência energética do VLIW4, que não ficou claro nas 6970, por exemplo.

Postado
Sim, os Trinity certamente virão com mais unidades de processamento gráfico, porém virão com cerca de 50% a mais de eficiência elétrica na parte GPU.

Também deve-se levar em consideração de que rumores dão conta de que a AMD procurou a TSMC recentemente. Talvez os Trinity serão fabricados pela TSMC e, no caso, não se tem estimativa de qual seria a eficiência elétrica.

TSMC...rs...

Seria pedir demais para regredirem para 32nm pra fabricar a Trinity.

TSMC tem 28nm pra produção em massa (e ainda não está 100% pois a Apple não arriscou) o que teria a AMD de reescrever o projeto, certo?

  • Membro VIP
Postado
Uai, o L3 consome 405mi de transistores e certamente consome uma parte considerável do TDP.

20% do chip, mas considere também a remoção de 3 links HTT e ele fica menor ainda. Essa do consumo do L3 eu nunca vi, tem certeza ?

O FX-4120 será lançado com TDP de 95W, ainda na revisão B2. O FX-8170 será lançado com 3,9GHz stock, indo a 4,5GHz no turbo (revisão B3). Um FX-4xxx chegaria a uns 4,2GHz stock tranquilo na revisão B3.

Um Trinity sem L3 pode chegar a uns 4,5GHz, provavelmente. Só que eles terão que adequar a frequência ao TDP se o consumo passar de 100W (pressupondo-se que a política de consumo seja a mesma). Como a AMD disse, a GPU do Trinity terá 50% a mais de eficiência elétrica. Podemos estimar o consumo da GPU dos Trinity aproximadamente em 20W. Acho que dê para chegar pelo menos nos 4,2GHz.

Os FX 6 e 4 são "sobras" de wafer, o consumo não é dos melhores, e seinão se o VLIW4 consome menos que o VLIW5.

  • Membro VIP
Postado

Nav, já tem FX-4xxx com clock padrão de 4,2GHz, o 4170.

Os FX 6 e 4 são "sobras" de wafer, o consumo não é dos melhores, e seinão se o VLIW4 consome menos que o VLIW5.

Hmm, o Barts pelo menos era, de certa forma, mais eficiente que o Cypress (consumo x desempenho).

Postado

A porção CPU e a GPU não precisam necessariamente consumir 50% da TDP cada. A soma do consumo máximo de cada pode ser superior à TDP, mas o gerenciamento de energia da APU pode privilegiar um ou outro.

Por exemplo, se a GPU em full load consome 60w e os núcleos em Full Load consomem 60w, mas a TDP é 100w. Em jogos (onde a GPU é mais importante) a APU pode limitar um pouco o clock da porção CPU para poder manter a GPU trabalhando em clock máximo.

Enquanto em aplicações 2D pesadas, quando a GPU está praticamente toda desligada (mesmo usando o Aero), a porção CPU pode usar uma fatia maior da TDP (que a GPU não está usando) para fazer Turbo em todos os núcleos.

  • Membro VIP
Postado
O Barts é VLIW5, VLIW4 é o Cayman. ;)

auhsuashasuhusha, é mesmo... Agora que você falou clareou aqui. :wacko:

Mas porque que o Barts era mais eficiente mesmo? Deu branco aqui e estou com preguiça de reler...

Então, é verdade, se formos ver o Cayman, também não acho que o VLIW4 vai mudar muita coisa no quesito consumo...

  • Curtir 1
  • Membro VIP
Postado
auhsuashasuhusha, é mesmo... Agora, que você falou clareou aqui. :wacko:

Mas porque que o Barts era mais eficiente mesmo? Deu branco aqui e estou com preguiça de reler...

Então, é verdade, se formos ver o Cayman, também não acho que o VLIW4 vai mudar muita coisa no quesito consumo...

A mágica do chip menor e melhorado. ;)

O VLIW4 é bacana mas é mais complexo, pelo que lembro o consumo caiu um pouco com ele, mas nada revolucionário, não no mesmo processo. Com 28 nm a coisa muda de figura.

  • Curtir 1
Postado
20% do chip, mas considere também a remoção de 3 links HTT e ele fica menor ainda. Essa do consumo do L3 eu nunca vi, tem certeza ?

Assuming that 8MB of L3 cache (6 bits per cell) consist of 405 million of transistors, it leaves around whopping 800 million of transistors to various input/output interfaces, dual-channel DDR3 memory controller as well as various logic and routing inside the chip.

Fonte: Xbit

  • Curtir 1
  • Membro VIP
Postado
Fonte: Xbit

Eu perguntei sobre o consumo que você disse ser alto e não foi citado no artigo.

Fala de muito I/O e só, sobre ocupar muito espaço no chip, pela imagem, o L3 é bem denso e não ocupa tanto espaço quanto parece.

  • Curtir 1
Postado
Eu perguntei sobre o consumo que você disse ser alto e não foi citado no artigo.

Fala de muito I/O e só, sobre ocupar muito espaço no chip, pela imagem, o L3 é bem denso e não ocupa tanto espaço quanto parece.

Mas o L3 roda na mesma frequência dos núcleos, logo creio que o consumo elétrico é quase proporcional, por quantidade de transistores, ao consumo dos núcleos.

Olha só o que eu encontrei no Real World:

Sandy Bridge has a single shared clock and power domain for the CPU cores, ring interconnect and L3 cache that targets dynamic 0.65V-1.05V operation at up to 3.4GHz (with a turbo boost to 3.8GHz). The GPU runs at up to 1.3GHz, with a separate 0.65V-1.05V dynamic power supply.

O cache L3 do Sandy parece consumir o mesmo de sua GPU (0,65-1,05V). A tensão de operação é dinâmica. O vCore padrão do Sandy é 1,2V, mas é normal oscilar entre 0,8 e 1,2V.

Com base nisto acredito que o L3 consuma no mínimo 10W.

  • Curtir 1
  • Membro VIP
Postado
Mas o L3 roda na mesma frequência dos núcleos, logo creio que o consumo elétrico é quase proporcional, por quantidade de transistores, ao consumo dos núcleos.

Um transistor pode consumir de dois modos, consumo estático e dinâmico,

O estático é o que ele sempre consome, é proporcional ao quadrado da tensão, "leakage" e tal, mas em geral é pequeno por transistor.

O dinâmico é o que ele consome quando muda de estado, é proporcional ao quadrado da tensão e ao clock (número de mudanças de estado), esse é o principal.

Caches não mudam de estado com frequência, então o consumo predominante neles é o estático, e o consumo estático é baixo, os 16MB de cache que o Bulldozer tem de L2 e L3 não devem consumir nem 10W, alias, esse é um dos motivos deles adorarem colocar mais cache em chips caros, caches consomem pouco então é uma forma fácil de aumentar a performance e performance por watt.

E no caso da GPU, pelo clock e tensão mais baixa que o núcleo principal ela deve consumir bem menos, não da para comparar com o processo da TSMC porque esse não é SOI.

Não encontrei o quote do Barts, enfim... Ele era mais eficiente porque era melhor balanceado, algo que também parece faltar no Bulldozer...

  • Curtir 2
Postado
O cache L3 do Sandy parece consumir o mesmo de sua GPU (0,65-1,05V). A tensão de operação é dinâmica. O vCore padrão do Sandy é 1,2V, mas é normal oscilar entre 0,8 e 1,2V.

Com base nisto acredito que o L3 consuma no mínimo 10W.

No Sandy Bridge, como o cache L3 funciona no clock dos núcleos, ele é alimentado pelo vcore.

O Sandy Bridge tem 3 power planes: núcleos, GPU e System Agent (controladora de memória e PCIe).

Os i5 e i7 LGA 1156 tinham apenas 2: núcleos e uncore (controladora de memória, cache L3 e PCIe).

Mas o i3 LGA 1156 já tinha 3 power planes (mais um motivo porque não entendo porque a Intel não lançou o Sandy Bridge no LGA 1156, as placas H55 já tinham os 3 power planes).

PS. as placas P67 também tem apenas 2 power planes: núcleos e system agent.

O i7 LGA 1366 é uma zona. Tem 2 power planes para o processador: núcleos e uncore (cache L3, controladora de memória e QPI).

Porém o próprio barramento QPI é alimentado pelo power plane do uncore (VTT), que também alimenta parte do X58 e ainda tem mais um pedaço que recebe alimentação de 3.3v que vem do conector ATX (24 pinos) e outro que compartilha alimentação com as memórias....

O Bulldozer, assim como o Phenom, tem 2: núcleos e CPU-NB (controladora de memória, HT e cache L3).

O Llano também tem dois: núcleos e o resto: GPU/controladora de memória/PCIe.

Ainda não ví nada concreto sobre o Trinity, mas é provável que tenha 3 também: núcleos, GPU e o controladora de memória/PCIe.

Por isso serão lançadas placas FM2. Essa divisão permitirá um melhor controle sobre o Turbo. Mas o Trinity poderá funcionar em placas FM1, porém com Turbo limitado.

Algo parecido aconteceu quando o primeiro Phenom saiu, em placas AM2 (não AM2+), por terem apenas um power plane pro processador inteiro, o gerenciamento de energia ficava limitado.

Alguns fabricantes optaram por baixar o clock do CPU-NB (para 1.6GHz) e deixar que o cool 'n quiet variasse o vcore (o mínimo era 1.1v, o que é suficiente para o CPU-NB trabalhar a 1.6GHz), para garantir melhor economia de energia (ao custo de um pouco de performance).

Lembro que a ASRock N68-S (e derivadas) era assim.

Outros optaram por fixar o vcore (assim o vcore não cai quando o processador está ocioso, apenas o clock é reduzido) e manter o CPU-NB a 2GHz para não perder performance.

Lembro que a Foxconn A6VMX era assim.

Isso tudo porque o CPU-NB não podia mudar de clock em funcionamento. No Bulldozer o clock do CPU-NB pode ser alterado em tempo real (finalmente!).

  • Curtir 2
  • Membro VIP
Postado
Mais problemas no Bulldozer, dessa vez afetando a estabilidade em vez do desempenho:

http://scalibq.wordpress.com/2011/10/19/amd-bulldozer-can-it-get-even-worse/

EDIT: Mas para ser justo, basta olhar a errata de qualquer CPU para ver que todos eles sempre tem vários bugs, e mesmo que este seja um bug no hardware, é possível que ele se manifeste apenas em pouquíssimos programas.

O cara disse que tem anos de overclock e nunca viu essa tela azul... :huh: Isso daí acontece direto se você deixar o vcore baixo e afrouxar o tempo de transição das voltagens entre P-states (ou tiver uma mobo "frouxa" :D), daí só abrir o cinebench MT e ver o crash ao tentar renderizar a motoca.

Postado

O Llano também tem dois: núcleos e o resto: GPU/controladora de memória/PCIe.

Ainda não ví nada concreto sobre o Trinity, mas é provável que tenha 3 também: núcleos, GPU e o controladora de memória/PCIe.

Por isso serão lançadas placas FM2. Essa divisão permitirá um melhor controle sobre o Turbo. Mas o Trinity poderá funcionar em placas FM1, porém com Turbo limitado...

E eu que achava que o fato do design das A75 terem sempre 2 fase extras era porque a GPU era alimentada separadamente do NB.

Tomara que não gere incompatibilidade entre MB A75 e Trinity.

Postado

O Bulldozer, assim como o Phenom, tem 2: núcleos e CPU-NB (controladora de memória, HT e cache L3).

Isso tudo porque o CPU-NB não podia mudar de clock em funcionamento. No Bulldozer o clock do CPU-NB pode ser alterado em tempo real (finalmente!).

Ziebert, o cache geralmente roda na frequência do processador, a controladora de memória do Bulldozer em 1866MHz e o HT dele a 5200MHz em sentido duplo, ou seja, 2600MHz operacionais.

O power plane do CPU-NB, no caso, não seria alusivo apenas à tensão de operação, visto que, como demonstrado, as frequências dos componentes envolvidos são diferentes? Ou você está querendo dizer que agora qualquer componente do CPU-NB pode ter sua frequência de operação alterada em tempo real? Ou ainda, que o CPU-NB teria uma espécie de clock-base e que cada um dos componentes envolvidos teria um multiplicador específico em relação a ele?

Qual seria a tensão de operação do CPU-NB do Bulldozer, alguém aí sabe?

Postado

Nav, no Bulldozer, assim como no Phenom, o CPU-NB tem seu próprio clock.

No Bulldozer é 2.2GHz para os processadores de 125w e 2GHz para os de 95w.

O cache L3 e o Hyper Transport trabalham ao clock do CPU-NB (portanto o HT trabalha a 4400GT/s, em vez de 5200GT/s).

Visitante
Este tópico está impedido de receber novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...

LANÇAMENTO!

eletronica2025-popup.jpg


CLIQUE AQUI E BAIXE AGORA MESMO!