Ir ao conteúdo

Desafio - Servidor Linux Ubuntu com ventoinhas disparadas ao ligar.


Carvalhoso

Posts recomendados

  • Membro VIP
Postado

Prezados,

Este caso consegui resolver esta semana, mas segue como desafio (depois posto a resposta) de coisas curiosas / diferentes que encontramos na área de manutenção de computadores.

Equipamento original: Servidor Rack 1U HP DL360 G7 com processador Xeon E5645, 6 GB (3 x 2GB) DDR3 ECC RDIMM, 2 fontes 460W.

Upgrades: 12 GB RAM (3 x 4GB) DDR3 ECC RDIMM, SSD OCZ Vertex 3 120GB.

Software instalado: Linux Ubuntu (reconheceu todo o hardware automaticamente, Debian não reconheceu a placa de rede, sem Windows Server para testar).

Problema: Equipamento funciona normalmente sem travar e nem diminuir o desempenho, na BIOS não apresenta problemas, mas logo após iniciar o sistema operacional todas as ventoinhas disparam e ficam em velocidade máxima (barulho extremamente alto, todas as ventoinhas dele são de 4cm, baulho de uma turbina funcionando). O painel acende a luz indicando "Over Temp". Fica com a ventoinha em velocidade máxima enquanto o computador estiver ligado.

Detalhes: BIOS configurada corretamente, tentativa de alterar parâmetros sem alterar o problema. Pelo software instalado (e sem instalar sofwares adicionais ao mínimo necessário - Servidor Banco de Dados) a carga do processador fica em 0,1%. O ambiente está frio (entre 20 e 25 graus), o ar que sai do computador está frio, todos os componentes e dissipadores estão frios (nem morno estavam). O problema aconteceu tanto com o Debian como com Ubuntu. Ao rodar um teste de memória (memtest) o problema também ocorria. Sem descrição de problemas semelhantes na internet.

E ai? Sugestões para o que pode ser e como resolver?

  • Membro VIP
Postado

Chutando:

1- update de BIOS (mas seria fácil demais..)

2- trocar os processadores.

3- Alterar a disposição dos pentes de memória.

4- Algum bug maluco no SO ou no kernel.

O Debian me pregou uma peça comoe ssa que você relatou, ele não reconheceu o controlador SATA, aí *****..

  • Membro VIP
Postado
Chutando:

4- Algum bug maluco no SO ou no kernel.

Dependendo da versão do Ubuntu e do kernel, uma delas saiu com um sério problema no kernel o qual faz o processamento subir e consequentemente, sistemas de refrigeração ficam loucos.

Alguns colegas comentaram isso no setor do folding, e como eu não havia atualizados meus Kernels para essa série problemática, não pude ver o problema.

  • Membro VIP
Postado

1 - Update de BIOS: Não tentei, não vi nada relacionado na internet. A BIOS era recente.

2 - Processador original do equipamento, chances mínimas de ser ele.

3 - Alteração de memória continuam com o mesmo resultado.

4 - Software foi descartado ao rodar o memtest (que roda fora de qualquer sistema operacional, por boot direto). Foi o que mais testei inicialmente, mudando versão, fazendo upgrade,...

  • Membro VIP
Postado

Uma das fontes estava bichada ?

Mas elas são redundantes e não paralelas, certo ?

A ventoinha é daquela tipo blower né ?

Esses 1 U são horrendos, aqui tem 6, mas só de enfeite.

  • Membro VIP
Postado

As duas fontes estão Ok. São reduntantes, funciona com qualquer uma ou com as duas ligadas.

A ventoinha é normal, São 3 conjuntos com 4 ventoinhas em cada, igual da foto:

For_HP_ProLiant_DL360_G6_Cooling_Fan.jpg

  • Membro VIP
Postado

Hm....

Fonte não é...

Memória não é...

BIOS (Obsoleta e / ou mal configurada) não é...

SO não é...

Outras coisas que citaram, não é... ehehhehe

Bem... talvez uma ligação incorreta das fans na MB?

Alguma configuração via painel / controlador de fans errada? (Acontece nos Dell direto por aqui)

Chutaria esses dois casos acima... foda é que sem "olhar", fica difícil "chutar". :)

  • Membro VIP
Postado

Meu chute é que por alguma condição mal configurada os fans se ativam, ou alguma opção que é "secretamente" ativada no BIOS pelo SO que dispara o processo barulhento.

Já estou sem ideias. :(

  • Membro VIP
Postado

Servidor Rack 1U HP Proliant DL360 G7 - Olha minha assinatura! :D

Seguinte, junto com teu servidor veio um DVD chamado SmartStart 8.xx. Inicie o servidor com ele , espere carregar (nesse meio tempo, conecte um pendrive), marque as opções de que leu os termos de contrato e tu cairá num menu. Nesse menu, procure por HP Insight Diagnostics. Entre nele, espere carregar e vai cair numa tela com várias abas. Vá na aba Logs e procure por IML.

Salve o IML no pendrive e me jogue a saída por gentileza....

  • Membro VIP
Postado
Servidor Rack 1U HP Proliant DL360 G7 - Olha minha assinatura! :D

Seguinte, junto com teu servidor veio um DVD chamado SmartStart 8.xx. Inicie o servidor com ele , espere carregar (nesse meio tempo, conecte um pendrive), marque as opções de que leu os termos de contrato e tu cairá num menu. Nesse menu, procure por HP Insight Diagnostics. Entre nele, espere carregar e vai cair numa tela com várias abas. Vá na aba Logs e procure por IML.

Salve o IML no pendrive e me jogue a saída por gentileza....

Ok. Amanhã quando for onde ele está faço isso. Hoje não estou perto dele.

Amanhã também aplicar a solução que encontrei, mas é 99% de chance de resolver o problema.

Ps.: Pra ajudar um pouco: o problema é bug de algum hardware, a parte do S.O. está ok. Devo resolver com atualização do software / bios / firmware do hardware.

  • Membro VIP
Postado

Geralmente, essas falhas são corrigidas com atualização de firmware. Porém, esse log, vai te mostrar em qual região do servidor e qual temperatura está. Com essa informação, dá uma olhada no código de erro.

Aproveita e baixa o Firmware CD da HP e a atualização de BIOS. Esse último, coloca num pendrive, inicie pelo DVD do firmware, escolha o modo interativo. Ao chegar na tela em que ele mostra as atualizações, veja se ele já possui uma versão mais nova para sua BIOS. Caso não, insira o pendrive e escolha a opção de adicionar um sumplemento.

Porém, é importante você pegar os logs do IML, já que, caso nada disso resolva, vai precisar abrir chamado na HP para troca da placa mãe.

  • Membro VIP
Postado

Chute:

- No SETUP de Placas HP's tem uma opção térmico e dá pra reduzir a rotação das ventoinhas.

- Ativar/Desativar o controle automático de rotação das ventoinhas no setup

  • Membro VIP
Postado
Fala sério... ele é próximo do divino... ele tem selo Chuck Norris de qualidade...

:lol:

Selo+Chuck+Norris.png

huahuhuahuahuahuahuahuahuahuahuaahuahuahuahuahuahu

Chute:

- No SETUP de Placas HP's tem uma opção térmico e dá pra reduzir a rotação das ventoinhas.

- Ativar/Desativar o controle automático de rotação das ventoinhas no setup

O problema até pode ser o controle de rotação das FANs. Porém, a própria placa mãe gerencia isso e testa a rotação delas ao ligar o servidor. Quando há um problema de rotação em uma delas, é dado um alarme no POST, avisando que uma FAN está com problemas e, dependendo do modelo do servidor, LED em Ambar aparece na frente da máquina ( No LED Healthy!).

  • Membro VIP
Postado

Pra ajudar um pouco mais (coisa que custei a ver, mas que ~e 80% da resposta):

Ao detectar o HD aparece uma mensagem de Over Temp junto as especificações do HD.

Ou seja, problema encontrado... mas qual a solução?

  • Membro VIP
Postado

Tens os logs do IML ? Fica mais fácil analisar com os códigos de erro e procurar um possível problema de fábrica.

Esses discos são sata ?

Se tu abrir um smart start, abrir o hp insight diagnostics, na primeira tela, ele tem um survey da máquina. Ali no menu, seleciona a opção de temperatura e nos diga se há regiões quentes pelo servidor!

  • Membro VIP
Postado
Tens os logs do IML ? Fica mais fácil analisar com os códigos de erro e procurar um possível problema de fábrica.

Esses discos são sata ?

Se tu abrir um smart start, abrir o hp insight diagnostics, na primeira tela, ele tem um survey da máquina. Ali no menu, seleciona a opção de temperatura e nos diga se há regiões quentes pelo servidor!

Esse servidor está em outra cidade. Ia lá hoje, mas por causa de um acidente na estrada voltei pra BH. Devo fazer isso na quinta-feira.

Sim, os HDs são SATA 3.

O cooler está montado ao contrário e joga o ar fervente pro HD ?

Cooler montado corretamente.

  • Membro VIP
Postado

Bom, existe uma outra ferramenta que é o HP Array diagnostics Utility. Esse cara também se encontra dentro do smart start, porém, ele é mais complicado. No log que ele gera, mostra a saúde dos discos. Se o disco estiver com problemas, esse ADU irá te avisar disso!

A ILO do servidor foi configurada ?

  • Membro VIP
Postado

Bem... pelo que entendi... os coolers estão disparando devido ao superaquecimento do HD.

Logo, se for um problema no HD em questão, basta trocá-lo...

Se não for um problema no HD, tem que ver se não é um problema no sensor, ou desabilitar a leitura da temperatura do hd. (O que não seria a melhor opção)

Abraço

Arquivado

Este tópico foi arquivado e está fechado para novas respostas.

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...