Máy thỉnh thoảng hiển thị "lỗi bus ATA" và phải khởi động lại:
[24028.505239] ata1.00: ngoại lệ Emask 0x10 SAct 0x0 SErr 0x48d0002 hành động 0xe bị đóng băng
[24028.505249] ata1.00: irq_stat 0x08400040, lỗi giao diện nghiêm trọng, trạng thái kết nối đã thay đổi
[24028.505254] ata1: SError: { RecovComm PHYRdyChg CommWake 10B8B LinkSeq DevExch }
[24028.505258] ata1.00: lệnh không thành công: FLUSH CACHE EXT
[24028.505266] ata1.00: cmd ea/00:00:00:00:00/00:00:00:00:00/thẻ a0 20
res 50/00:18:50:6b:d9/00:00:eb:00:00/40 Emask 0x10 (lỗi bus ATA)
[24028.505269] ata1.00: trạng thái: { DRDY }
[24028.505276] ata1: liên kết khôi phục cài đặt gốc
[24032.757212] ata1: Liên kết SATA lên tới 6,0 Gbps (SStatus 133 SControl 300)
[24032.757615] ata1.00: cả hai IDENTIFY đều bị hủy bỏ, giả sử NODEV
[24032.757620] ata1.00: xác thực lại không thành công (errno=-2)
Nếu sau khi khởi động lại, tôi chạy smartctl -t ngắn /dev/sda
, smartctl -H /dev/sda
nói rằng nó đã qua.
Từ smartctl -a/dev/sda
:
Thuộc tính SMART cụ thể của nhà cung cấp với ngưỡng:
ID# ATTRIBUTE_NAME GIÁ TRỊ CỜ LOẠI THRESH XẤU NHẤT ĐƯỢC CẬP NHẬT KHI_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 100 100 016 Pre-fail Luôn - 0
2 Throughput_Performance 0x0005 136 136 054 Pre-fail Offline - 80
3 Spin_Up_Time 0x0007 253 253 024 Luôn thất bại trước - 176 (Trung bình 237)
4 Start_Stop_Count 0x0012 100 100 000 Old_age Luôn luôn - 233
5 Được phân bổ lại_Sector_Ct 0x0033 100 100 005 Luôn thất bại trước - 0
7 Seek_Error_Rate 0x000b 100 100 067 Luôn thất bại trước - 0
8 Seek_Time_Performance 0x0005 124 124 020 Pre-fail Ngoại tuyến - 33
9 Power_On_Hours 0x0012 091 091 000 Old_age Luôn luôn - 63994
10 Spin_Retry_Count 0x0013 100 100 060 Luôn thất bại trước - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Luôn luôn - 204
192 Power-Off_Retract_Count 0x0032 098 098 000 Old_age Luôn luôn - 2756
193 Load_Cycle_Count 0x0012 098 098 000 Old_age Luôn luôn - 2756
194 Nhiệt độ_Celsius 0x0002 142 142 000 Old_age Luôn luôn - 42 (Tối thiểu/Tối đa 23/52)
196 Được phân bổ lại_Event_Count 0x0032 100 100 000 Old_age Luôn luôn - 0
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Luôn luôn - 0
198 Ngoại tuyến_Không thể sửa được 0x0008 100 100 000 Old_age Ngoại tuyến - 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Luôn luôn - 0
Phiên bản nhật ký lỗi SMART: 1
Không có lỗi nào được ghi lại
Tôi biết rằng đôi khi (25% trường hợp) ổ cứng bị lỗi đột ngột và không bao giờ báo cáo bất kỳ sự cố nào trong SMART. Nhưng ở đây, tôi đã thấy lỗi. Có phải thực tế là SMART im lặng chứng tỏ rằng ổ cứng không phải là nguồn gốc của những lỗi này?
Phần cứng: Bo mạch chủ SuperMicro và ổ cứng NAS HGST Deskstar.