в соответствии с SMART жестким диском не нарушена, но у меня есть ошибки в dmesg

Иногда у меня возникают странные проблемы с загрузкой моего компьютера (на котором работает Debian). Поэтому я выпустил команду «dmesg». На его выходе я увидел много ошибок. Однако, когда я запускаю расширенный тест SMART на жестких дисках (используя команду «smartctl -t long / dev / sda»), результатом является то, что мои диски не сломаны.

Что может быть причиной этих ошибок?

Вот ошибки:

(...) [ 505.918537] ata3.00: exception Emask 0x50 SAct 0x400 SErr 0x280900 action 0x6 frozen [ 505.918549] ata3.00: irq_stat 0x08000000, interface fatal error [ 505.918558] ata3: SError: { UnrecovData HostInt 10B8B BadCRC } [ 505.918566] ata3.00: failed command: READ FPDMA QUEUED [ 505.918579] ata3.00: cmd 60/40:50:20:5b:60/00:00:0b:00:00/40 tag 10 ncq 32768 in res 40/00:54:20:5b:60/00:00:0b:00:00/40 Emask 0x50 (ATA bus error) [ 505.918586] ata3.00: status: { DRDY } [ 505.918595] ata3: hard resetting link [ 506.410055] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300) [ 506.422648] ata3.00: configured for UDMA/133 [ 506.422679] ata3: EH complete [ 1633.123880] md: bind<sdb3> [ 1633.187966] RAID1 conf printout: [ 1633.187977] --- wd:1 rd:2 [ 1633.187984] disk 0, wo:0, o:1, dev:sda3 [ 1633.187989] disk 1, wo:1, o:1, dev:sdb3 [ 1633.188866] md: recovery of RAID array md0 [ 1633.188871] md: minimum _guaranteed_ speed: 1000 KB/sec/disk. [ 1633.188875] md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for recovery. [ 1633.188890] md: using 128k window, over a total of 1943618560k. [ 1634.167341] ata3.00: exception Emask 0x50 SAct 0x7f80 SErr 0x280900 action 0x6 frozen [ 1634.167353] ata3.00: irq_stat 0x08000000, interface fatal error [ 1634.167361] ata3: SError: { UnrecovData HostInt 10B8B BadCRC } [ 1634.167369] ata3.00: failed command: READ FPDMA QUEUED [ 1634.167382] ata3.00: cmd 60/00:38:00:00:6f/02:00:01:00:00/40 tag 7 ncq 262144 in res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error) [ 1634.167389] ata3.00: status: { DRDY } [ 1634.167395] ata3.00: failed command: READ FPDMA QUEUED [ 1634.167407] ata3.00: cmd 60/00:40:00:02:6f/02:00:01:00:00/40 tag 8 ncq 262144 in res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error) [ 1634.167413] ata3.00: status: { DRDY } [ 1634.167418] ata3.00: failed command: READ FPDMA QUEUED [ 1634.167429] ata3.00: cmd 60/00:48:00:04:6f/02:00:01:00:00/40 tag 9 ncq 262144 in res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error) [ 1634.167435] ata3.00: status: { DRDY } [ 1634.167439] ata3.00: failed command: READ FPDMA QUEUED [ 1634.167451] ata3.00: cmd 60/00:50:00:06:6f/02:00:01:00:00/40 tag 10 ncq 262144 in res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error) [ 1634.167457] ata3.00: status: { DRDY } [ 1634.167462] ata3.00: failed command: READ FPDMA QUEUED [ 1634.167473] ata3.00: cmd 60/00:58:00:08:6f/02:00:01:00:00/40 tag 11 ncq 262144 in res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error) [ 1634.167479] ata3.00: status: { DRDY } [ 1634.167484] ata3.00: failed command: READ FPDMA QUEUED [ 1634.167495] ata3.00: cmd 60/00:60:00:0a:6f/02:00:01:00:00/40 tag 12 ncq 262144 in res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error) [ 1634.167500] ata3.00: status: { DRDY } [ 1634.167505] ata3.00: failed command: READ FPDMA QUEUED [ 1634.167516] ata3.00: cmd 60/80:68:00:0c:6f/00:00:01:00:00/40 tag 13 ncq 65536 in res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error) [ 1634.167522] ata3.00: status: { DRDY } [ 1634.167527] ata3.00: failed command: READ FPDMA QUEUED [ 1634.167538] ata3.00: cmd 60/00:70:80:0c:6f/02:00:01:00:00/40 tag 14 ncq 262144 in res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error) [ 1634.167544] ata3.00: status: { DRDY } [ 1634.167553] ata3: hard resetting link [ 1634.658816] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300) [ 1634.672645] ata3.00: configured for UDMA/133 [ 1634.672696] ata3: EH complete [ 1637.687898] ata3.00: exception Emask 0x50 SAct 0x3ff000 SErr 0x280900 action 0x6 frozen [ 1637.687910] ata3.00: irq_stat 0x08000000, interface fatal error [ 1637.687918] ata3: SError: { UnrecovData HostInt 10B8B BadCRC } [ 1637.687926] ata3.00: failed command: READ FPDMA QUEUED [ 1637.687940] ata3.00: cmd 60/00:60:80:a7:af/02:00:02:00:00/40 tag 12 ncq 262144 in res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error) [ 1637.687947] ata3.00: status: { DRDY } [ 1637.687953] ata3.00: failed command: READ FPDMA QUEUED [ 1637.687965] ata3.00: cmd 60/00:68:80:a9:af/02:00:02:00:00/40 tag 13 ncq 262144 in res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error) [ 1637.687971] ata3.00: status: { DRDY } [ 1637.687976] ata3.00: failed command: READ FPDMA QUEUED [ 1637.687987] ata3.00: cmd 60/80:70:80:ab:af/01:00:02:00:00/40 tag 14 ncq 196608 in res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error) [ 1637.687993] ata3.00: status: { DRDY } [ 1637.687998] ata3.00: failed command: READ FPDMA QUEUED [ 1637.688009] ata3.00: cmd 60/00:78:00:ad:af/02:00:02:00:00/40 tag 15 ncq 262144 in res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error) [ 1637.688015] ata3.00: status: { DRDY } [ 1637.688020] ata3.00: failed command: READ FPDMA QUEUED [ 1637.688031] ata3.00: cmd 60/80:80:00:af:af/00:00:02:00:00/40 tag 16 ncq 65536 in res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error) [ 1637.688037] ata3.00: status: { DRDY } [ 1637.688042] ata3.00: failed command: READ FPDMA QUEUED [ 1637.688053] ata3.00: cmd 60/00:88:80:af:af/01:00:02:00:00/40 tag 17 ncq 131072 in res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error) [ 1637.688059] ata3.00: status: { DRDY } [ 1637.688064] ata3.00: failed command: READ FPDMA QUEUED [ 1637.688075] ata3.00: cmd 60/80:90:80:b0:af/00:00:02:00:00/40 tag 18 ncq 65536 in res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error) [ 1637.688081] ata3.00: status: { DRDY } [ 1637.688085] ata3.00: failed command: READ FPDMA QUEUED [ 1637.688096] ata3.00: cmd 60/00:98:00:b1:af/02:00:02:00:00/40 tag 19 ncq 262144 in res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error) [ 1637.688102] ata3.00: status: { DRDY } [ 1637.688107] ata3.00: failed command: READ FPDMA QUEUED [ 1637.688118] ata3.00: cmd 60/00:a0:00:b3:af/01:00:02:00:00/40 tag 20 ncq 131072 in res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error) [ 1637.688124] ata3.00: status: { DRDY } [ 1637.688129] ata3.00: failed command: READ FPDMA QUEUED [ 1637.688140] ata3.00: cmd 60/00:a8:00:b4:af/01:00:02:00:00/40 tag 21 ncq 131072 in res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error) [ 1637.688146] ata3.00: status: { DRDY } [ 1637.688154] ata3: hard resetting link [ 1638.179398] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300) [ 1638.192977] ata3.00: configured for UDMA/133 [ 1638.193029] ata3: EH complete [ 1640.259492] md: export_rdev(sdb1) [ 1640.326109] md: bind<sdb1> [ 1640.346712] RAID1 conf printout: [ 1640.346724] --- wd:1 rd:2 [ 1640.346731] disk 0, wo:0, o:1, dev:sda1 [ 1640.346736] disk 1, wo:1, o:1, dev:sdb1 [ 1640.346893] md: delaying recovery of md1 until md0 has finished (they share one or more physical units) [ 1657.987964] ata3.00: exception Emask 0x50 SAct 0x40000 SErr 0x280900 action 0x6 frozen [ 1657.987975] ata3.00: irq_stat 0x08000000, interface fatal error [ 1657.987984] ata3: SError: { UnrecovData HostInt 10B8B BadCRC } [ 1657.987992] ata3.00: failed command: READ FPDMA QUEUED [ 1657.988006] ata3.00: cmd 60/00:90:00:30:2e/03:00:09:00:00/40 tag 18 ncq 393216 in res 40/00:94:00:30:2e/00:00:09:00:00/40 Emask 0x50 (ATA bus error) [ 1657.988013] ata3.00: status: { DRDY } [ 1657.988022] ata3: hard resetting link [ 1658.479548] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300) [ 1658.493107] ata3.00: configured for UDMA/133 [ 1658.493147] ata3: EH complete [ 1670.547791] ata3: limiting SATA link speed to 1.5 Gbps [ 1670.547805] ata3.00: exception Emask 0x50 SAct 0x7f SErr 0x280900 action 0x6 frozen [ 1670.547812] ata3.00: irq_stat 0x08000000, interface fatal error [ 1670.547820] ata3: SError: { UnrecovData HostInt 10B8B BadCRC } [ 1670.547826] ata3.00: failed command: READ FPDMA QUEUED [ 1670.547839] ata3.00: cmd 60/80:00:00:1f:2e/01:00:0c:00:00/40 tag 0 ncq 196608 in res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error) [ 1670.547846] ata3.00: status: { DRDY } [ 1670.547852] ata3.00: failed command: READ FPDMA QUEUED [ 1670.547863] ata3.00: cmd 60/80:08:80:20:2e/00:00:0c:00:00/40 tag 1 ncq 65536 in res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error) [ 1670.547869] ata3.00: status: { DRDY } [ 1670.547875] ata3.00: failed command: READ FPDMA QUEUED [ 1670.547886] ata3.00: cmd 60/00:10:00:21:2e/02:00:0c:00:00/40 tag 2 ncq 262144 in res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error) [ 1670.547892] ata3.00: status: { DRDY } [ 1670.547896] ata3.00: failed command: READ FPDMA QUEUED [ 1670.547907] ata3.00: cmd 60/00:18:00:23:2e/02:00:0c:00:00/40 tag 3 ncq 262144 in res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error) [ 1670.547913] ata3.00: status: { DRDY } [ 1670.547918] ata3.00: failed command: READ FPDMA QUEUED [ 1670.547929] ata3.00: cmd 60/00:20:00:25:2e/01:00:0c:00:00/40 tag 4 ncq 131072 in res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error) [ 1670.547935] ata3.00: status: { DRDY } [ 1670.547940] ata3.00: failed command: READ FPDMA QUEUED [ 1670.547951] ata3.00: cmd 60/00:28:00:26:2e/02:00:0c:00:00/40 tag 5 ncq 262144 in res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error) [ 1670.547957] ata3.00: status: { DRDY } [ 1670.547961] ata3.00: failed command: READ FPDMA QUEUED [ 1670.547972] ata3.00: cmd 60/00:30:00:28:2e/02:00:0c:00:00/40 tag 6 ncq 262144 in res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error) [ 1670.547978] ata3.00: status: { DRDY } [ 1670.547987] ata3: hard resetting link [ 1671.039264] ata3: SATA link up 1.5 Gbps (SStatus 113 SControl 310) [ 1671.053386] ata3.00: configured for UDMA/133 [ 1671.053444] ata3: EH complete [ 2422.512002] md: md0: recovery done. [ 2422.547344] md: recovery of RAID array md1 [ 2422.547355] md: minimum _guaranteed_ speed: 1000 KB/sec/disk. [ 2422.547360] md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for recovery. [ 2422.547378] md: using 128k window, over a total of 4877312k. [ 2422.668465] RAID1 conf printout: [ 2422.668474] --- wd:2 rd:2 [ 2422.668480] disk 0, wo:0, o:1, dev:sda3 [ 2422.668486] disk 1, wo:0, o:1, dev:sdb3 [ 2469.990451] md: md1: recovery done. [ 2470.049986] RAID1 conf printout: [ 2470.049997] --- wd:2 rd:2 [ 2470.050003] disk 0, wo:0, o:1, dev:sda1 [ 2470.050009] disk 1, wo:0, o:1, dev:sdb1 [ 3304.445149] PM: Hibernation mode set to 'platform' [ 3304.782375] PM: Syncing filesystems ... done. [ 3307.028591] Freezing user space processes ... (elapsed 0.001 seconds) done. (...) 

    One Solution collect form web for “в соответствии с SMART жестким диском не нарушена, но у меня есть ошибки в dmesg”

    Во-первых, имейте в виду, что SMART, говорящий о том, что ваш диск здоров, не обязательно означает, что диск здоров. Отчеты SMART – это помощь , а не абсолютная правда.

    Если все, что вас интересует, это то, что нужно делать, а не почему, тогда не стесняйтесь прокручивать до последних нескольких абзацев; однако промежуточный текст скажет вам, почему я думаю, что я предлагаю правильный курс действий и как извлечь это из того, что вы опубликовали.

    С учетом сказанного давайте посмотрим, что говорит одна из этих ошибок.

     [ 1670.547805] ata3.00: exception Emask 0x50 SAct 0x7f SErr 0x280900 action 0x6 frozen [ 1670.547812] ata3.00: irq_stat 0x08000000, interface fatal error [ 1670.547820] ata3: SError: { UnrecovData HostInt 10B8B BadCRC } [ 1670.547826] ata3.00: failed command: READ FPDMA QUEUED [ 1670.547839] ata3.00: cmd 60/80:00:00:1f:2e/01:00:0c:00:00/40 tag 0 ncq 196608 in res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error) [ 1670.547846] ata3.00: status: { DRDY } [ 1670.547852] ata3.00: failed command: READ FPDMA QUEUED 

    (Надеюсь, у меня есть части, которые должны идти вместе, но вы получали пучок таких, так что все должно быть в порядке.)

    В Linux ata Wiki есть страница, объясняющая, как читать эти ошибки . В частности,

    • Значение status DRDY означает «Устройство готово. Обычно 1, когда все в порядке». Увидеть значение статуса DRDY совершенно нормально и ожидаемо.
    • SError имеет несколько значений компонентов, которые вы видите (в этом конкретном фрагменте):
      • UnrecovData «Ошибка целостности данных, интерфейс не восстановился»
      • HostInt "Внутренняя ошибка адаптера шины хоста"
      • 10B8B "произошла ошибка декодирования с 10b до 8b"
      • BadCRC "Ошибка CRC уровня BadCRC связи"

    10b8b, которое кодирует 8 бит как 10 бит, чтобы помочь как с синхронизацией сигнала, так и с обнаружением ошибок, используется на физическом кабеле, не обязательно на самом диске. Привод, скорее всего, использует другие формы кодирования FEC или ECC, и ошибка там обычно проявляется как некоторая форма ошибки ввода-вывода, вероятно, с значением error UNC («некорректируемая ошибка» – часто из-за плохих секторов на диске »), вероятно, с« ошибкой носителя »(« программное обеспечение обнаружило ошибку носителя ») в скобках в конце строки res . Это последнее не то, что вы видите, поэтому, хотя мы не можем полностью его исключить, это кажется маловероятным.

    «Link layer» – это физические кабели и трассировки печатной платы между собственным контроллером накопителя и чипом интерфейса дисковода (вероятно, часть южного моста на материнской плате вашего компьютера, но может быть расположена на борту HBA).

    Адаптер главной шины, также известный как HBA, представляет собой схему, которая подключается к оборудованию для хранения. Также в разговорной речи известен как «контроллер диска», термин, который является немного неправильным с современными системами. Наиболее заметной частью HBA обычно являются порты подключения, чаще всего в эти дни либо SATA, либо какой-то форм-фактор SAS.

    UnrecovData и HostInt основном говорят нам о том, что «что-то просто ужасно ошибочно, и не было никакого способа восстановить или не было предпринято попыток восстановления». Противоположным будет, вероятно, RecovData , что указывает на то, что произошла «ошибка целостности данных, но интерфейс восстановлен». (В стороне, я, вероятно, использовал бы HBAInt вместо HostInt , поскольку «хост» относится к HBA, а не всей системе.)

    Комбинация 10B8B и BadCRC , которые указывают на физический уровень связи, заставляет меня подозревать проблему с кабелями.

    Это подозрение также подтверждается тем фактом, что самотестирование SMART, которое является полностью внутренним для привода, за исключением отчетов о состоянии, не находит ошибок, которые, по мнению производителя, достаточно серьезны, чтобы гарантировать отчетность в результатах. Если накопитель испытывает проблемы с хранением или чтением данных, то, в частности, должен был сообщить о длительном самотестировании SMART.

    TL; DR:

    Первое, что я хотел бы сделать, – это просто отключить и снова подключить кабель SATA с обоих концов; он может быть слегка ослаблен, что приводит к потере электрического контакта с перерывами. Посмотрите, разрешит ли это проблему. Возможно, даже стоит сделать это на всех кабелях SATA на вашем компьютере, а не только на поврежденном диске. Если вы используете внебиржевой HBA, я бы также удалил и переустановил эту карту, главным образом потому, что это простая задача попробовать, пока вы уже возитесь с кабелями.

    В противном случае попробуйте выбросить и заменить кабель SATA, предпочтительно с помощью высококачественного кабеля. Кабель высокого качества будет немного дороже, но я считаю, что он обычно стоит небольших дополнительных расходов, если он помогает избежать головных болей, подобных этому. Никто не любит видеть ошибки в хранении памяти!

    Linux и Unix - лучшая ОС в мире.