Intereting Posts

Диагностика незапланированных остановок

У меня проблема с сервером, который закрывается по какой-то неизвестной причине. Я проверяю журналы каждый раз, когда это происходит, и не может найти что-либо особого интереса, которое бы подсказывало, почему оно идет вниз.

Может ли кто-нибудь предложить что-нибудь, что я должен сделать, чтобы помочь диагностировать проблему?

Похоже на аппаратную проблему.

Вы добавили что-нибудь в систему? Например, RAM, новые графические процессоры, HDD, PCI-карты?

Физическое состояние:

  • Проверьте все кабели.
  • Проверьте установку ОЗУ.
  • Проверьте монтаж всех PCI.
  • Перезагрузите CPU (если ничего не работает).
  • Проверьте силовые кабели, как внешние, так и внутренние.

[Edit]: И как указано @vonbrand
Обеспечьте охлаждение и т. Д. И при необходимости очистите.

Если вы этого не сделаете, проверьте статус lm_sensors и, например, добавьте систему сигнализации для критических значений. Здесь вы также можете проверить состояние вентилятора – и, возможно, напряжения. Если показанные напряжения не отображаются, вы можете проверить, сообщает ли BIOS. Затем проверьте документы на вашем HW, чтобы уровни были правильными. См. Ниже для проверки вольтметра.


Обновить BIOS.

Ты говоришь:

[…] не может найти ничего особого интереса, который бы подсказывал, почему это происходит.

Но есть ли другие данные в

 /var/log/messages /var/log/debug /var/log/kern.log ... 

которые предлагают проблемы с системой при загрузке и т. д.?

У вас есть mcelog running ( Исключение проверки компьютера )? Если не установить его.

Проверьте данные SMART HDD с помощью smartmontools. Запустите memtest, stresstest и т. Д.

Проверьте dmesg во время выполнения тестов.

Используйте один из многих загрузочных компакт-дисков, например:

  • Hiren's BootCD
  • Конечный загрузочный компакт-диск

И запускайте тесты на них, которые вам подходят.

Если сервер сервера – в офсайдном месте, проверьте, нет ли дворника, использующего розетку электропитания, для зарядки его мобильного телефона.


[Edit2]: проверка блока питания.
Только дополнительная заметка о проверке блока питания. Проверка вне платы может быть хорошей, и в этом случае, если это ATX, вы должны помнить о том, что для включения питания (обычно зеленого) необходимо включить питание (обычно зеленый), чтобы включить блок питания -сцена. (С запасным проводом, скрепкой и т. Д.)

Затем вы можете измерить, поместив один вольтметр на землю (черный), а другой – на цветные. Затем, если вы читаете положительное значение вне диапазона ± 5% или отрицательное значение вне ± 10%, у вас обычно возникают проблемы. ( 4.1.4 Допуски напряжения ). 12 В было бы легче всего проверить, что должно быть в диапазоне от 11,40 до 12,60 вольт. На типичном ATX, который будет:

 * Yellow: +12 V; value ⊆ { 11.40 , …, 12.60 } * Red : + 5 V; value ⊆ { 4.75 , …, 5.50 } * Orange: + 3.3V; value ⊆ { 3.135, …, 3.465} * Brown : + 3.3V; value ⊆ { 3.135, …, 3.465} * Blue : -12 V; value ⊆ {-13.2 , …, -10.8 } 

Проверьте бумагу своего поставщика блока питания или более общую спецификацию и спецификацию материнской платы.