Ir ao conteúdo
  • Cadastre-se

Sistema Travando aos poucos


Posts recomendados

Bom dia,

 

Na empresa em que trabalho temos um servidor Dell Poweredge T410, instalado o Windows Server 2008 Enterprise que roda em RAID 5. Este servidor roda um banco de dados Informix, alguns compartilhamentos para um ERP funcionar e duas máquinas virtuais.

Trabalho aqui a 3 anos e nunca foi feita uma limpeza neste servidor desde que foi comprado, a mais tempo que isso, então resolvi fazer isto, abri o mesmo e dei uma boa limpada, mas acabei deixando a Fan(ventoinha) dos processadores mal conectada e a mesma não ficou ligando. O servidor trabalho de 6 a 10 dias com a Fan desligada, quando percebi logo a conectei corretamente, mas o servidor começou a apresentar um problema, a cada 2 dias e meio mais ou menos e começa a travar as aplicações, começa a desconectar os usuários do Windows 10 do banco de dados, depois os do Windows 7 e por final do XP, assim tambem acontece com os compartilhamentos, até que todos os serviços tenham parado de funcionar e ele trave de vez, só voltando a funcionar depois que reiniciado.

 

Eu usei o próprio programa do Windows para diagnosticar as memórias e não foi acusado problemas, o servidor tem 8Gb de memória(4x2Gb), ele tambem tem 2 processadores xeon, que cheguei até a trocar a pasta térmica como uma tentativa de solução.

 

Das ultimas vezes que o servidor travou eu abri o mesmo e verifiquei que não estava super aquecido dentro, nem os processadores estavam quente, então não sei se o problema ainda tem haver com aquecimento como provavelmente no inicio foi.

 

Eu não sei se tem como eu testar os processadores e os discos rigidos para verificar se o problema está em algum deles. Eu pensei em passar o hirens boot para verificar se tem algum setor defeituoso nos HD's mas pesquisando vi em algum forum que se existisse um setor defeituoso e o hirens boot bloqueasse ele, o array do RAID 5 poderia dar problema, então não testei por medo de piorar minha situação. Eu parti para verificar o sistema operacional, passei o AVG Business, chkdsk e sfc /scannow mas nada mostrou resultado.

 

Notei tambem que quando eu copio muitas coisas pesadas do servidor para outra máquina ele trava mais rápido, mesmo copiando via compartilhamento de outra máquina.

 

Gostaria de saber se tem alguma maneira de testar os periféricos do servidor sem o risco de prejudicar o sistema, pois o mesmo está em produção? 

Link para o comentário
Compartilhar em outros sites

Bom dia, a Dell tem um diagnostico de Hardware embutido na BIOS, mas sugiro entar em contato com o 0800 deles.

Entretanto se for como no seu relato alguma coisa falhou porque o sistema deveria ter dado sinais do aquecimento quando isso ocorreu, veja os logs de sistema. 6 a 10 dias de superaquecimento podem danificar muita coisa infelizmente, desde o processador a todos os componentes ao redor na placa-mãe.

O evento é grave. Desde já descarto problemas com HD e demais perifericos, o problema deve estar no processador e na MB.

Emergencialmente os HD's pode ser montados em uma estação comum para testes ou mesmo em substituição. Se for critico é melhor alertar a gerencia para uma substituição, é bem mais barato que parar a produção.

Link para o comentário
Compartilhar em outros sites

Então, no meu caso a Dell não dá mais suporte porque o servidor tem mais de 5 anos.

Sobre o diagnóstico, para este servidor PowerEdge eles tem um programa chamado DSET que diagnóstica os periféricos, eu já executei este programa, ele só acusou que a bateria da controladora RAID estava ruim, mas a mesma já foi substituida por uma nova.

 

Sobre o testes no HD, se houver setor defeituoso não corro o risco de perde o RAID 5 caso o hirens boot bloqueie ele?

E estou imaginando que o problema pode ser em algum dos processadores, por isto queria saber algum jeito de testar os dois, tipo algum jeito de colocar o pico a 100% e ver se ele trava no caminho ou algo do tipo.

 

Eu já estou fazendo fazendo a cotação de um mais novo para a troca, mas tenho certeza que isso só ocorrerá no inicio do ano que vem, então quero fazer de tudo para tentar resolver o BO deste em produção.

Link para o comentário
Compartilhar em outros sites

Pode descrever melhor o servidor? Se puder mande fotos, examinou a placa-mãe procurando indícios externos de algum componente ou trilha com defeito?

O que voce pode fazer é fazer um backup e restaurar em outa máquina, mas aí é que está a questão: terá performance igual ao servidor?

O travamento é esporádico? Quantas estações estão rodando esse banco de dados?

Outras considerações: você tem um ambiente com temperatura controlada? Se puder controlar a temperatura sugiro baixar a temperatura o máximo que puder, já fez essa experiencia?

Se já existe a possibilidae da troca, na minha opinião deve ser acelerada. E é para ontem!

Servidor de empresa é uma questão delicada, deve sempre ter uma solução de contingencia e fazer parte do planejamento estrategico.

Fui ver um vídeo sobre esse servidor e constatei que o dissipador de calor da CPU é passivo, o gabinete tem só uma ventoinha mesmo?

Link para o comentário
Compartilhar em outros sites

Crie uma conta ou entre para comentar

Você precisa ser um usuário para fazer um comentário

Criar uma conta

Crie uma nova conta em nossa comunidade. É fácil!

Crie uma nova conta

Entrar

Já tem uma conta? Faça o login.

Entrar agora

Sobre o Clube do Hardware

No ar desde 1996, o Clube do Hardware é uma das maiores, mais antigas e mais respeitadas comunidades sobre tecnologia do Brasil. Leia mais

Direitos autorais

Não permitimos a cópia ou reprodução do conteúdo do nosso site, fórum, newsletters e redes sociais, mesmo citando-se a fonte. Leia mais

×
×
  • Criar novo...