Intereting Posts
Не удалось установить vim-плагины Как равномерно распределить tmux (1) разделенные панели? Создавать и использовать разреженный файл как непривилегированный пользователь Скрипт запуска для расшифровки домашнего каталога DD-WRT на WZR-HP-AG300H: хотите поддержку XFS; какая прошивка имеет ядро ​​3.8.13-1? Развернуть заполнители с одинаковыми именами в текстовом файле? Инвертировать цвет конкретного окна на linux mint Выполнение вставки вставки Vim для предложений Изменение корневой файловой системы от initramfs до JFFS2 Не удается удалить дубликаты пакетов из-за зависимостей Смущает смысл интерактивной и неинтерактивной оболочки при запуске скрипта Что вызывает этот экранный запрос «Экран, используемый <username> на host01.»? изменить 3-й символ в строке Ошибка при загрузке разделяемых библиотек после установки программы Файловая система Docker не имеет открытых файлов, но не может размонтировать

Понимание ошибок smartctl и жесткого диска

У меня есть пул raidz2 ZFS, и мои 2 диска начали выдавать ошибку ввода-вывода, и после этого zfs пометил их как неисправные. нажмите для журнала dmesg

Я удалил диски и провел на них тест. Smartctl говорит;

ДИСК 1 ” нажмите, чтобы перейти к полному журналу = Состояние работоспособности SMART: КАНАЛ ДАННЫХ УВЕЛИЧИВАЕТСЯ СКОРОСТЬ ОШИБКИ ДАННЫХ СЛИШКОМ ВЫСОКАЯ [asc = 5d, ascq = 32]
ДИСК 2 ” нажмите для полного журнала = SMART Health Status: ОБОРУДОВАНИЕ ОТКРЫВАЮЩИЙСЯ ОТКАЗ ОБЩИЙ ОТКАЗ ЖЕСТКОГО ДИСКА [asc = 5d, ascq = 10]

Я создал новый пул из «DISK 1» и запустил тест fio, но не обнаружил ошибок ввода-вывода на диске. Я не обнаружил ни одной ошибки, как предыдущая .. Диск работает нормально. Также я создал пул с 4 дисками, и использование диска тоже было нормальным.
Я пробовал этот тест в течение 4 дней, и я не столкнулся с ошибкой. Диск работает как остальные прямо сейчас.

fio --randrepeat=0 --ioengine=libaio --name=test --filename=/disktest/fiofile \ --bs=1024k --iodepth=64 --size=5T --readwrite=readwrite --rwmixread=60 --numjobs=20 

У меня мало вопросов;
1- Почему диск больше не выдает ошибку?
2- Если диск работает нормально, то почему это вызвало ошибку ввода-вывода в первом пуле?
3- Как лучше понять неисправность жесткого диска или нет?
4- Как мы можем сбросить счетчики ошибок жесткого диска?
5- диск это мусор или нет?

Диск прикреплен с; Контроллер -> LSI3008HBA -> 2x SAS-кабель -> “SC946ED-R2KJBOD” 2xExpander -> Многолучевые диски SAS.

  1. Некоторые неисправности могут приходить и уходить. Ничто не гарантирует, что вы будете предупреждены до того, как диск умрет, но если SMART начнет выплевывать ошибки, лучше не рисковать и просто заменить диск.
  2. Ошибки могут приходить и уходить, потому что иногда диск продолжает повторять проблемные области до тех пор, пока он не преуспеет (в этот момент он, как правило, попытается избежать повторного использования этой области, если сможет).
  3. Вы можете запустить длительное самотестирование SMART и / или чтение / запись для каждого используемого LBA (в ZFS есть процесс очистки (или повторное преобразование), который можно запустить). Однако будьте осторожны – это может привести к сбою диска навсегда …
  4. Ты не можешь
  5. Трудно сказать, но давайте скажем по-другому: сэкономленные деньги, если они не заменены, не стоят излишне риска внезапного сбоя?