"Событие DegradedArray"

У меня есть RAID 1 на моем Raspi и получил почту, которую я не понимаю под названием «Событие DegradedArray on / dev / md0: my-host-name» и «Fail event on / dev / md0: my-host-name». Я получил 6 сообщений с бывшим предметом и 2 с последним.

Первый вид писем выглядит следующим образом:

Это автоматически созданное почтовое сообщение от mdadm, запущенного на моем имени-хоста

Событие DegradedArray было обнаружено на устройстве md / dev / md0.

С уважением, и т. Д.

PS Файл / proc / mdstat в настоящее время содержит следующее:

Личности: [raid1] md0: active raid1 sda1 [0] 124967936 блоки супер 1.2 [2/1] [U_] растровое изображение: 1/1 страницы [4KB], 65536KB кусок

неиспользуемые устройства:

Второй вид писем:

Это автоматически созданное почтовое сообщение от mdadm, запущенного на моем имени-хоста

Событие Fail было обнаружено на устройстве md / dev / md0.

Это может быть связано с компонентным устройством / dev / sdb1.

С уважением, и т. Д.

PS Файл / proc / mdstat в настоящее время содержит следующее:

Личности: [raid1] md0: active raid1 sdb11 (F) sda1 [0] 124967936 блоки супер 1.2 [2/1] [U_] растровое изображение: 0/1 страницы [0KB], 65536KB кусок

неиспользуемые устройства:

Я перезапустил свой Raspi, прежде чем узнавать об этих сообщениях. Это текущий статус RAID:

Личности: [raid1] md0: active raid1 sdb11 sda1 [0] 124967936 блоки супер 1.2 [2/2] [UU] растровое изображение: 0/1 страницы [0KB], 65536KB кусок

неиспользуемые устройства:

Я не касался Raspi или его дисков, когда произошло это событие. Однако я не могу исключить, что кто-то еще и, возможно, ослабил соединение одного из кабелей передачи данных.

Это случилось? Что-то еще произошло? Вернул ли RAID к нормальной работе или мне нужно что-то сделать?

Возможно, связано: Значение секретной информации о безопасности

Первое сообщение означает, что ваш массив RAID перешел в несогласованное состояние, потому что, по-видимому, диск sdb был обнаружен как сбой (второе сообщение). Текущее состояние похоже на восстановление массива, но вы можете проверить вывод smartctl --all /dev/sdb для получения текущего состояния работоспособности (который печатается перед параметрами диска и журнала ошибок) и проверить, параметры накопителя являются подозрительными (такие вещи, как « Reallocated Sector Count счет» или « Current Pending Sector указывают на потенциальную проблему), или если устройство имеет (новые) записи в журнале ошибок. Вы также можете проверить dmesg на сообщения, связанные с sdb .

Вы также можете, для дополнительной безопасности, удалить sdb1 из массива RAID и выполнить тест с помощью smartctl (например, smartctl -t short /dev/sdb для короткого теста или smartctl -t long /dev/sdb для более тщательного контрольная работа).

Обратите внимание, что для smartctl необходимо использовать -d <...> с параметром <...> который подходит вашему устройству. Обратитесь к этому списку поддерживаемых USB-устройств за правильным. Чтобы получить идентификаторы USB, вы можете использовать lsusb . Если ваше устройство отсутствует в списке, вы можете искать связанные устройства (например, того же поставщика или имеющие аналогичное имя).