Điểm:0

Ổ đĩa bị lỗi hoặc vẫn có thể được sử dụng?

lá cờ ie

Tôi có ổ WD sau (3TB) đã gây ra sự cố cho tôi (tôi không thể truy cập bất kỳ tệp nào: ngay cả tệp ls lệnh trên nó gây ra sự chờ đợi không bao giờ kết thúc).

Dưới đây là một số chi tiết trên đĩa:

Đĩa /dev/sda: 2.7 TiB, 3000592982016 byte, 5860533168 cung
Kiểu đĩa: EZRX-00D8PB0
Đơn vị: cung từ 1 * 512 = 512 byte
Kích thước cung (logic/vật lý): 512 byte / 4096 byte
Kích thước I/O (tối thiểu/tối ưu): 4096 byte / 4096 byte
Loại nhãn đĩa: gpt

Thiết bị Bắt đầu Kết thúc Sector Kích thước Loại
/dev/sda1 2048 5860532223 5860530176 Hệ thống tệp Linux 2.7T

Sau sự cố này, tôi chạy một số thử nghiệm để khám phá loại sự cố nào đang ảnh hưởng đến nó. Ở bước đầu tiên, tôi chạy thử nghiệm ngắn trên đó Sudo smartctl -t ngắn /dev/sda điều đó cho tôi thấy lỗi sau:

=== BẮT ĐẦU ĐỌC PHẦN DỮ LIỆU THÔNG MINH ===
SMART Bản sửa đổi cấu trúc nhật ký tự kiểm tra số 1
Số Kiểm tra_Mô tả Trạng thái Thời gian sống còn lại (giờ) LBA_of_first_error
#1 Short offline Đã hoàn: đọc fail 90% 17480 8467144

Sau đó, tôi đã cố gắng lấy một số thuộc tính như được mô tả trong bài đăng khác này Hiểu đầu ra smartctl -a sử dụng Sudo smartctl -a /dev/sda. Tại đây, bạn có thể tìm thấy bảng thuộc tính và 5 nhật ký lỗi gần đây nhất:

Thuộc tính SMART Số sửa đổi cấu trúc dữ liệu: 16
Thuộc tính SMART cụ thể của nhà cung cấp với ngưỡng:
ID# ATTRIBUTE_NAME GIÁ TRỊ CỜ LOẠI THRESH XẤU NHẤT ĐƯỢC CẬP NHẬT KHI_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x002f 200 200 051 Luôn thất bại trước - 71
  3 Spin_Up_Time 0x0027 174 161 021 Luôn thất bại trước - 6266
  4 Start_Stop_Count 0x0032 100 100 000 Old_age Luôn luôn - 695
  5 Được phân bổ lại_Sector_Ct 0x0033 200 200 140 Luôn thất bại trước - 0
  7 Seek_Error_Rate 0x002e 200 200 000 Old_age Luôn luôn - 0
  9 Power_On_Hours 0x0032 077 077 000 Old_age Luôn luôn - 17481
 10 Spin_Retry_Count 0x0032 100 100 000 Old_age Luôn luôn - 0
 11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Luôn luôn - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Luôn luôn - 457
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Luôn luôn - 63
193 Load_Cycle_Count 0x0032 179 179 000 Old_age Luôn luôn - 64193
194 Nhiệt độ_Celsius 0x0022 122 101 000 Old_age Luôn luôn - 28
196 Được phân bổ lại_Event_Count 0x0032 200 200 000 Old_age Luôn luôn - 0
197 Current_Pending_Sector 0x0032 200 197 000 Old_age Luôn luôn - 356
198 Ngoại tuyến_Không thể sửa được 0x0030 197 197 000 Old_age Ngoại tuyến - 1691
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Luôn luôn - 0
200 Multi_Zone_Error_Rate 0x0008 196 196 000 Old_age Ngoại tuyến - 1691

Phiên bản nhật ký lỗi SMART: 1
Số lỗi ATA: 47 (nhật ký thiết bị chỉ chứa năm lỗi gần đây nhất)
        CR = Thanh ghi lệnh [HEX]
        FR = Đăng ký tính năng [HEX]
        SC = Thanh ghi số lượng khu vực [HEX]
        SN = Đăng ký số ngành [HEX]
        CL = Thanh ghi thấp xi lanh [HEX]
        CH = Thanh ghi cao xi lanh [HEX]
        DH = Thanh ghi thiết bị/đầu [HEX]
        DC = Thanh ghi lệnh thiết bị [HEX]
        ER = Thanh ghi lỗi [HEX]
        ST = Thanh ghi trạng thái [HEX]
Powered_Up_Time được đo từ khi bật nguồn và được in dưới dạng
DDd+hh:mm:SS.sss trong đó DD=ngày, hh=giờ, mm=phút,
SS=giây và sss=millisec. Nó "kết thúc" sau 49,710 ngày.

Đã xảy ra lỗi 47 khi thời gian bật nguồn của đĩa: 232 giờ (9 ngày + 16 giờ)
  Khi lệnh gây ra lỗi xảy ra, thiết bị đang hoạt động hoặc không hoạt động.

  Sau khi hoàn thành lệnh xảy ra, các thanh ghi là:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 0a 00 00 00 00

  Các lệnh dẫn đến lệnh gây ra lỗi là:
  CR FR SC SN CL CH DH DC Powered_Up_Time Lệnh/Feature_Name
  -- -- -- -- -- -- -- -- ------------------ ------------------ --
  e0 00 0a 00 00 00 00 00 04:00:17.522 CHỜ NGAY LẬP TỨC
  ef 03 46 00 00 00 a0 00 04:00:16.815 TÍNH NĂNG CÀI ĐẶT [Đặt chế độ truyền]
  ec 00 00 00 00 00 a0 00 04:00:16.815 NHẬN DẠNG THIẾT BỊ

Đã xảy ra lỗi 46 khi thời gian bật nguồn của đĩa: 232 giờ (9 ngày + 16 giờ)
  Khi lệnh gây ra lỗi xảy ra, thiết bị đang hoạt động hoặc không hoạt động.

  Sau khi hoàn thành lệnh xảy ra, các thanh ghi là:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 46 00 00 00 a0 Lỗi thiết bị; Lỗi: ABRT

  Các lệnh dẫn đến lệnh gây ra lỗi là:
  CR FR SC SN CL CH DH DC Powered_Up_Time Lệnh/Feature_Name
  -- -- -- -- -- -- -- -- ------------------ ------------------ --
  ef 03 46 00 00 00 a0 00 04:00:16.815 TÍNH NĂNG CÀI ĐẶT [Đặt chế độ truyền]
  ec 00 00 00 00 00 a0 00 04:00:16.815 NHẬN DẠNG THIẾT BỊ
  e1 00 0f 00 00 00 00 00 04:00:15.095 NGAY LẬP TỨC KHÔNG RỜI
  ef 03 46 00 00 00 a0 00 04:00:14.575 TÍNH NĂNG CÀI ĐẶT [Đặt chế độ truyền]
  ec 00 00 00 00 00 a0 00 04:00:14.575 NHẬN DẠNG THIẾT BỊ

Đã xảy ra lỗi 45 khi thời gian bật nguồn của đĩa: 232 giờ (9 ngày + 16 giờ)
  Khi lệnh gây ra lỗi xảy ra, thiết bị đang hoạt động hoặc không hoạt động.

  Sau khi hoàn thành lệnh xảy ra, các thanh ghi là:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 0f 00 00 00 00

  Các lệnh dẫn đến lệnh gây ra lỗi là:
  CR FR SC SN CL CH DH DC Powered_Up_Time Lệnh/Feature_Name
  -- -- -- -- -- -- -- -- ------------------ ------------------ --
  e1 00 0f 00 00 00 00 00 04:00:15.095 NGAY LẬP TỨC KHÔNG RỜI
  ef 03 46 00 00 00 a0 00 04:00:14.575 TÍNH NĂNG CÀI ĐẶT [Đặt chế độ truyền]
  ec 00 00 00 00 00 a0 00 04:00:14.575 NHẬN DẠNG THIẾT BỊ

Đã xảy ra lỗi 44 khi thời gian bật nguồn của đĩa: 232 giờ (9 ngày + 16 giờ)
  Khi lệnh gây ra lỗi xảy ra, thiết bị đang hoạt động hoặc không hoạt động.

  Sau khi hoàn thành lệnh xảy ra, các thanh ghi là:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 46 00 00 00 a0 Lỗi thiết bị; Lỗi: ABRT

  Các lệnh dẫn đến lệnh gây ra lỗi là:
  CR FR SC SN CL CH DH DC Powered_Up_Time Lệnh/Feature_Name
  -- -- -- -- -- -- -- -- ------------------ ------------------ --
  ef 03 46 00 00 00 a0 00 04:00:14.575 TÍNH NĂNG CÀI ĐẶT [Đặt chế độ truyền]
  ec 00 00 00 00 00 a0 00 04:00:14.575 NHẬN DẠNG THIẾT BỊ
  ef 03 46 00 00 00 a0 00 04:00:12.170 TÍNH NĂNG CÀI ĐẶT [Đặt chế độ truyền]

Đã xảy ra lỗi 43 khi thời gian bật nguồn của đĩa: 232 giờ (9 ngày + 16 giờ)
  Khi lệnh gây ra lỗi xảy ra, thiết bị đang hoạt động hoặc không hoạt động.

  Sau khi hoàn thành lệnh xảy ra, các thanh ghi là:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 46 00 00 00 a0 Lỗi thiết bị; Lỗi: ABRT

  Các lệnh dẫn đến lệnh gây ra lỗi là:
  CR FR SC SN CL CH DH DC Powered_Up_Time Lệnh/Feature_Name
  -- -- -- -- -- -- -- -- ------------------ ------------------ --
  ef 03 46 00 00 00 a0 00 04:00:12.170 TÍNH NĂNG CÀI ĐẶT [Đặt chế độ truyền]
  ec 00 00 00 00 00 a0 00 04:00:12.170 NHẬN DẠNG THIẾT BỊ
  e1 00 0f 00 00 00 00 00 04:00:10.445 NGAY LẬP TỨC KHÔNG RỜI
  ef 03 46 00 00 00 a0 00 04:00:09.925 TÍNH NĂNG CÀI ĐẶT [Đặt chế độ truyền]
  ec 00 00 00 00 00 a0 00 04:00:09.925 NHẬN DẠNG THIẾT BỊ

SMART Bản sửa đổi cấu trúc nhật ký tự kiểm tra số 1
Số Kiểm tra_Mô tả Trạng thái Thời gian sống còn lại (giờ) LBA_of_first_error
#1 Short offline Đã hoàn: đọc fail 90% 17480 8467144

SMART Bản sửa đổi cấu trúc dữ liệu nhật ký tự kiểm tra có chọn lọc số 1
 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
    1 0 0 Not_testing
    2 0 0 Not_testing
    3 0 0 Not_testing
    4 0 0 Not_testing
    5 0 0 Not_testing
Cờ tự kiểm tra có chọn lọc (0x0):
  Sau khi quét các khoảng đã chọn, KHÔNG đọc-quét phần còn lại của đĩa.
Nếu chức năng tự kiểm tra có chọn lọc đang chờ xử lý khi bật nguồn, hãy tiếp tục sau 0 phút trì hoãn.

Sau đó, tôi đã cố gắng kiểm tra trên LBA_of_first_error (8467144) và, sau một phần của hướng dẫn này, Tôi chạy Sudo sg_verify --lba=8467144 /dev/sda thu được đầu ra sau xác nhận với tôi rằng có lỗi phần cứng:

xác minh (10):
Định dạng cố định, hiện tại; Phím Sense: Lỗi trung bình
Ý nghĩa bổ sung: Lỗi Id CRC hoặc ECC
VERIFY(10) lỗi phần cứng hoặc phương tiện gần lba=0x8132c8

Ở bước cuối cùng, tôi đã cố gắng gán lại khối nhưng không thành công Sudo sg_reassign --address=8467144 /dev/sda:

CHẶN LẠI KHỐI: Yêu cầu bất hợp pháp, opcode không hợp lệ
sg_reassign không thành công: Yêu cầu bất hợp pháp, opcode không hợp lệ

Vì vậy, để tóm tắt, tôi đã bỏ lỡ một số bước trong cuộc điều tra đĩa này? Ổ đĩa của tôi đã chết hay vẫn có thể được sử dụng? Tôi không thể hiểu nếu có một số lỗi nghiêm trọng trong danh sách Thuộc tính SMART, bạn có thể giúp tôi hiểu nếu ổ đĩa có thêm lỗi không?

Brandon Xavier avatar
lá cờ us
Nếu nó được bảo hành, hãy thay thế nó. Nếu không, vứt bỏ nó. Khi một ổ đĩa bắt đầu báo lỗi, thật ngu ngốc khi cố gắng tiếp tục sử dụng nó.
Michael Hampton avatar
lá cờ cz
MỘT lỗi là đủ để RMA ổ đĩa, ngay cả khi chưa có thuộc tính SMART nào báo cáo lỗi (chúng sẽ sớm xảy ra! và khi đó thì đã quá muộn cho dữ liệu của bạn).
Timmy avatar
lá cờ ie
Thật không may, đĩa này có nhiều năm nên không có RMA :(

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.