Điểm:0

Nếu một ổ đĩa cứng gây ra "lỗi xe buýt", các thuộc tính SMART của nó có hiển thị sự cố không?

lá cờ ng
MWB

Máy thỉnh thoảng hiển thị "lỗi bus ATA" và phải khởi động lại:

[24028.505239] ata1.00: ngoại lệ Emask 0x10 SAct 0x0 SErr 0x48d0002 hành động 0xe bị đóng băng
[24028.505249] ata1.00: irq_stat 0x08400040, lỗi giao diện nghiêm trọng, trạng thái kết nối đã thay đổi
[24028.505254] ata1: SError: { RecovComm PHYRdyChg CommWake 10B8B LinkSeq DevExch }
[24028.505258] ata1.00: lệnh không thành công: FLUSH CACHE EXT
[24028.505266] ata1.00: cmd ea/00:00:00:00:00/00:00:00:00:00/thẻ a0 20
                        res 50/00:18:50:6b:d9/00:00:eb:00:00/40 Emask 0x10 (lỗi bus ATA)
[24028.505269] ata1.00: trạng thái: { DRDY }
[24028.505276] ata1: liên kết khôi phục cài đặt gốc
[24032.757212] ata1: Liên kết SATA lên tới 6,0 Gbps (SStatus 133 SControl 300)
[24032.757615] ata1.00: cả hai IDENTIFY đều bị hủy bỏ, giả sử NODEV
[24032.757620] ata1.00: xác thực lại không thành công (errno=-2)

Nếu sau khi khởi động lại, tôi chạy smartctl -t ngắn /dev/sda, smartctl -H /dev/sda nói rằng nó đã qua.

Từ smartctl -a/dev/sda:

Thuộc tính SMART cụ thể của nhà cung cấp với ngưỡng:
ID# ATTRIBUTE_NAME GIÁ TRỊ CỜ LOẠI THRESH XẤU NHẤT ĐƯỢC CẬP NHẬT KHI_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000b 100 100 016 Pre-fail Luôn - 0
  2 Throughput_Performance 0x0005 136 136 054 Pre-fail Offline - 80
  3 Spin_Up_Time 0x0007 253 253 024 Luôn thất bại trước - 176 (Trung bình 237)
  4 Start_Stop_Count 0x0012 100 100 000 Old_age Luôn luôn - 233
  5 Được phân bổ lại_Sector_Ct 0x0033 100 100 005 Luôn thất bại trước - 0
  7 Seek_Error_Rate 0x000b 100 100 067 Luôn thất bại trước - 0
  8 Seek_Time_Performance 0x0005 124 124 020 Pre-fail Ngoại tuyến - 33
  9 Power_On_Hours 0x0012 091 091 000 Old_age Luôn luôn - 63994
 10 Spin_Retry_Count 0x0013 100 100 060 Luôn thất bại trước - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Luôn luôn - 204
192 Power-Off_Retract_Count 0x0032 098 098 000 Old_age Luôn luôn - 2756
193 Load_Cycle_Count 0x0012 098 098 000 Old_age Luôn luôn - 2756
194 Nhiệt độ_Celsius 0x0002 142 142 000 Old_age Luôn luôn - 42 (Tối thiểu/Tối đa 23/52)
196 Được phân bổ lại_Event_Count 0x0032 100 100 000 Old_age Luôn luôn - 0
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Luôn luôn - 0
198 Ngoại tuyến_Không thể sửa được 0x0008 100 100 000 Old_age Ngoại tuyến - 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Luôn luôn - 0

Phiên bản nhật ký lỗi SMART: 1
Không có lỗi nào được ghi lại

Tôi biết rằng đôi khi (25% trường hợp) ổ cứng bị lỗi đột ngột và không bao giờ báo cáo bất kỳ sự cố nào trong SMART. Nhưng ở đây, tôi đã thấy lỗi. Có phải thực tế là SMART im lặng chứng tỏ rằng ổ cứng không phải là nguồn gốc của những lỗi này?

Phần cứng: Bo mạch chủ SuperMicro và ổ cứng NAS HGST Deskstar.

djdomi avatar
lá cờ za
cho imho ổ đĩa sẽ thất bại trong thời gian gần
MWB avatar
lá cờ ng
MWB
@djdomi Tại sao? Nếu các lỗi đến từ chính ổ đĩa, thì SMART có nên nói gì không?
Điểm:2
lá cờ nc

Có nhiều thành phần giữa ổ cứng và hệ điều hành và bất kỳ thành phần nào trong số chúng đều có thể bị lỗi. Thông thường các lỗi bạn hiển thị là do lỗi trong ổ cứng.

Tuy nhiên, việc không ghi lại bất kỳ lỗi nào trong SMART có thể là dấu hiệu cho thấy bản thân ổ cứng vẫn hoạt động bình thường. Vì vậy, một trong những thành phần khác trong chuỗi có thể gặp sự cố.

Đây là một danh sách kiểm tra có thể giúp:

  • Đảm bảo rằng ổ đĩa được đặt đúng vị trí và tất cả các dây cáp được cắm hoàn toàn vào ổ đĩa.
  • Nếu ổ đĩa được cắm vào bảng mạch đứng, hãy đảm bảo rằng tất cả các dây cáp trên bảng mạch đứng được cắm chắc chắn.
  • Đảm bảo mọi cáp dữ liệu liên quan đều ở trong tình trạng tốt, không bị đứt, xoắn, xoắn cứng và căng
  • Đảm bảo rằng các cáp dữ liệu được đặt chắc chắn trong bo mạch chủ hoặc bộ điều khiển đĩa
  • Nếu bạn đang sử dụng bộ điều khiển bổ sung trên đĩa, hãy đảm bảo rằng nó được đặt đúng vị trí trong bo mạch chủ
  • Nếu nghi ngờ rằng bất cứ thứ gì không được lắp hoàn toàn (giả sử nó không được vặn vào và khó tháo ra), thì có thể giúp lắp lại nó bằng cách tháo nó ra, kiểm tra ổ cắm xem có bụi không và cắm lại, đảm bảo rằng nó đã được cắm hoàn toàn. ngồi.

Sau khi bạn đã kiểm tra tất cả những điều đó và lỗi vẫn xảy ra, thì cần thực hiện thêm các chẩn đoán để xác định thành phần nào ở trên bị lỗi. Nếu có thể, hoán đổi vị trí ổ đĩa hoặc hoán đổi cáp giữa các cổng của bo mạch chủ hoặc bộ điều khiển đĩa có thể giúp cách ly thêm. Bộ điều khiển đĩa có chip xấu cũng có thể gây ra sự cố như thế này, nhưng chỉ có thể chẩn đoán vấn đề này bằng cách hoán đổi với bộ điều khiển khác.

Cũng có thể hữu ích khi chạy chẩn đoán thực tế trên ổ đĩa (với smartctl -t ngắn chẳng hạn, sau đó đợi nó hoàn thành và kiểm tra với smartctl -a để xem nó đã hoàn thành hay có lỗi), chỉ để đảm bảo rằng nó thực sự không phải là ổ đĩa.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.