Điểm:0

smartctl "Các thành phần trong danh sách lỗi đã phát triển" so với bộ điều khiển RAID "Đếm lỗi phương tiện"

lá cờ fr

Tôi đang sử dụng phần cứng RAID50 với bộ điều khiển PERC810 trong máy chủ của mình và gần đây tôi đã gặp phải một số liệu mà tôi không chắc chắn.Cho đến bây giờ, tôi đã sử dụng chỉ số smartctl "Các phần tử trong danh sách lỗi đã phát triển" như một gợi ý rằng ổ đĩa đang bị lỗi và cần được xóa, nhưng nếu tôi sử dụng perccli (hoặc storcli/megacli) thì ổ đĩa cũng hiển thị một chỉ số có tên "Phương tiện đếm lỗi." Vấn đề tôi gặp phải với điều này là, từ những gì tôi đã đọc về các số liệu này, về cơ bản chúng giống nhau - cả hai đều hiển thị các khu vực được phân bổ lại hoặc lỗi vật lý trên đĩa. Nhưng một số hdd của tôi đang hiển thị một số lớn hơn 0 tại Các thành phần trong danh sách lỗi đã phát triển, nhưng giá trị bằng 0 tại số lỗi Phương tiện và ngược lại.. Ví dụ đĩa này:

perccli /c0/e37/s7 hiển thị tất cả
Phiên bản CLI = 007.1327.0000.0000 Ngày 27 tháng 7 năm 2020
Hệ điều hành = Linux 4.19.0-0.bpo.9-AMD64
Bộ điều khiển = 0
Trạng thái = Thành công
Mô tả = Hiển thị thông tin ổ đĩa thành công.


Ổ đĩa /c0/e37/s7 :
================

--------------------------------------------- --------------------------
EID:Slt DID State DG Size Intf Med SED PI SeSz Model Sp Type 
--------------------------------------------- --------------------------
37:7 72 Onln 1 Ổ cứng 3.637 TB SAS N N 512B WD4001FYYG-01SL3 U -    
--------------------------------------------- --------------------------

EID=ID thiết bị bao vây|Slt=Số khe cắm|DID=ID thiết bị|DG=DriveGroup
DHS=Dự phòng nóng chuyên dụng|UGood=Tốt chưa định cấu hình|GHS=Dự phòng nóng toàn cầu
UBad=Xấu chưa định cấu hình|Sntze=Vệ sinh|Onln=Trực tuyến|Offln=Ngoại tuyến|Intf=Giao diện
Med=Loại phương tiện|SED=Ổ đĩa tự mã hóa|PI=Thông tin bảo vệ
SeSz=Kích thước ngành|Sp=Spun|U=Up|D=Down|T=Transition|F=Foreign
UGUnsp=UGood Không được hỗ trợ|UGShld=UGood được che chắn|HSPShld=Hotspare được che chắn
CFShld=Đã định cấu hình được bảo vệ|Cpybck=CopyBack|CBShld=Copyback Shielded
UBUnsp=UBad Không được hỗ trợ|Rbld=Xây dựng lại


Ổ đĩa /c0/e37/s7 - Thông tin chi tiết:
=================================================================

Ổ đĩa /c0/e37/s7 Trạng thái:
=======================
Bộ đếm lá chắn = 0
Số lỗi phương tiện = 38
Số lỗi khác = 118063
Nhiệt độ ổ đĩa = 41C (105,80 F)
Số lần thất bại dự đoán = 0
Cảnh báo S.M.A.R.T được gắn cờ bởi ổ đĩa = Không


Ổ đĩa /c0/e37/s7 Thuộc tính thiết bị:
==================================
SN = WMC1F0D41KD5
Id nhà sản xuất = WD      
Số kiểu = WD4001FYYG-01SL3
Nhà cung cấp NAND = NA
WWN = 50000C0F01F55DD1
Sửa đổi chương trình cơ sở = VR08
Số phát hành phần sụn = N/A
Kích thước thô = 3,638 TB [Khu vực 0x1d1c0beb0]
Kích thước ép buộc = 3,637 TB [0x1d1b00000 Sector]
Kích thước không bắt buộc = 3,637 TB [Khu vực 0x1d1b0beb0]
Tốc độ thiết bị = 6.0Gb/s
Tốc độ liên kết = 6.0Gb/s
Ghi bộ đệm = N/A
Kích thước khu vực logic = 512B
Kích thước khu vực vật lý = 512B
Tên trình kết nối = 01

nào cho thấy Số lỗi phương tiện = 3, nhưng khi tôi sử dụng smartctl cho cùng một đĩa:

smartctl -a -d megaraid,72 /dev/sdg
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-4.19.0-0.bpo.9-AMD64] (bản dựng cục bộ)
Bản quyền (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== PHẦN THÔNG TIN BẮT ĐẦU ===
Nhà cung cấp: WD
Sản phẩm: WD4001FYYG-01SL3
Bản sửa đổi: VR08
Tuân thủ: SPC-4
Dung lượng người dùng: 4.000.787.030.016 byte [4,00 TB]
Kích thước khối logic: 512 byte
Tốc độ quay: 7200 vòng / phút
Yếu tố hình thức: 3,5 inch
Id đơn vị logic: 0x50000c0f01f55dd0
Số sê-ri: WMC1F0D41KD5
Loại thiết bị: đĩa
Giao thức truyền tải: SAS (SPL-3)
Giờ địa phương là: Thứ Sáu ngày 28 tháng 1 14:14:51 2022 CET
Hỗ trợ SMART là: Có sẵn - thiết bị có khả năng SMART.
Hỗ trợ SMART là: Đã bật
Cảnh báo nhiệt độ: Đã bật

=== BẮT ĐẦU ĐỌC PHẦN DỮ LIỆU THÔNG MINH ===
SMART Tình trạng sức khỏe: OK

Nhiệt độ ổ đĩa hiện tại: 41 C
Nhiệt độ chuyến đi lái xe: 40 C

Công suất tích lũy theo thời gian, giờ:phút 60298:10
Sản xuất tuần 46 năm 2014
Số chu kỳ được chỉ định trong suốt thời gian tồn tại của thiết bị: 1048576
Số chu kỳ start-stop tích lũy: 18
Số lần tải-không tải được chỉ định trong suốt thời gian tồn tại của thiết bị: 1114112
Số chu kỳ tải-không tải tích lũy: 118
Các yếu tố trong danh sách lỗi phát triển: 0

Nhật ký bộ đếm lỗi:
           Lỗi được sửa bởi Total Correction Gigabyte Total
               Thuật toán đọc lại/lỗi ECC được xử lý không được xử lý
           nhanh | viết lại bị trì hoãn đã sửa các lỗi [10^9 byte]
đọc: 2538437 9298 76289 2547735 9392 215124.761 94
viết: 5550372 5405661 5407707 10956033 5405661 571404.363 0
xác minh: 184 0 0 184 0 352.277 0

Số lỗi không vừa: 202249

Nhật ký tự kiểm tra SMART
Num Đoạn trạng thái kiểm tra Thời gian sống LBA_first_err [SK ASC ASQ]
     Số mô tả (giờ)
#1 Bối cảnh dài Hoàn thành - 11 - [- - -]

Thời gian tự kiểm tra dài (kéo dài): 31120 giây [518,7 phút]

Nó cho thấy Các yếu tố trong danh sách lỗi phát triển: 0

Đây là một ví dụ khác trên cùng một máy chủ, chỉ khác hdd:

perccli /c0/e37/s4 hiển thị tất cả
Phiên bản CLI = 007.1327.0000.0000 Ngày 27 tháng 7 năm 2020
Hệ điều hành = Linux 4.19.0-0.bpo.9-AMD64
Bộ điều khiển = 0
Trạng thái = Thành công
Mô tả = Hiển thị Thông tin Ổ đĩa Thành công.


Ổ đĩa /c0/e37/s4 :
================

--------------------------------------------- --------------------------
EID:Slt DID State DG Size Intf Med SED PI SeSz Model Sp Type 
--------------------------------------------- --------------------------
37:4 63 Onln 1 Ổ cứng 3.637 TB SAS N N 512B WD4001FYYG-01SL3 U -    
--------------------------------------------- --------------------------

EID=ID thiết bị bao vây|Slt=Số khe cắm|DID=ID thiết bị|DG=DriveGroup
DHS=Dự phòng nóng chuyên dụng|UGood=Tốt chưa định cấu hình|GHS=Dự phòng nóng toàn cầu
UBad=Xấu chưa định cấu hình|Sntze=Vệ sinh|Onln=Trực tuyến|Offln=Ngoại tuyến|Intf=Giao diện
Med=Loại phương tiện|SED=Ổ đĩa tự mã hóa|PI=Thông tin bảo vệ
SeSz=Kích thước ngành|Sp=Spun|U=Up|D=Down|T=Transition|F=Foreign
UGUnsp=UGood Không được hỗ trợ|UGShld=UGood được che chắn|HSPShld=Hotspare được che chắn
CFShld=Đã định cấu hình được bảo vệ|Cpybck=CopyBack|CBShld=Copyback Shielded
UBUnsp=UBad Không được hỗ trợ|Rbld=Xây dựng lại


Ổ đĩa /c0/e37/s4 - Thông tin chi tiết:
=================================================================

Ổ đĩa /c0/e37/s4 Trạng thái:
=======================
Bộ đếm lá chắn = 0
Số lỗi phương tiện = 0
Số lỗi khác = 118060
Nhiệt độ ổ đĩa = 35C (95,00 F)
Số lần thất bại dự đoán = 0
Cảnh báo S.M.A.R.T được gắn cờ bởi ổ đĩa = Không


Ổ đĩa /c0/e37/s4 Thuộc tính thiết bị:
==================================
SN = WMC1F0D222KF
Id nhà sản xuất = WD      
Số kiểu = WD4001FYYG-01SL3
Nhà cung cấp NAND = NA
WWN = 50000C0F01352C35
Sửa đổi chương trình cơ sở = VR08
Số phát hành phần sụn = N/A
Kích thước thô = 3,638 TB [Khu vực 0x1d1c0beb0]
Kích thước ép buộc = 3,637 TB [0x1d1b00000 Sector]
Kích thước không bắt buộc = 3,637 TB [Khu vực 0x1d1b0beb0]
Tốc độ thiết bị = 6.0Gb/s
Tốc độ liên kết = 6.0Gb/s
Ghi bộ đệm = N/A
Kích thước khu vực logic = 512B
Kích thước khu vực vật lý = 512B
Tên trình kết nối = 01 


Ổ đĩa /c0/e37/s4 Chính sách/Cài đặt:
==================================
Vị trí ổ đĩa = DriveGroup:1, Span:1, Row:0
Vị trí bao vây = 0
Số cổng được kết nối = 0(path0) 
Số thứ tự = 2
Dự phòng ủy quyền = Không
Dự phòng khẩn cấp = Không
Số thứ tự sự kiện thất bại dự đoán cuối cùng = 0
Hoàn tất chẩn đoán thành công vào = N/A
Loại FDE = Không có
SED có khả năng = Không
Đã bật SED = Không
Bảo mật = Không
Có khả năng xóa mật mã = ​​Không
Hỗ trợ vệ sinh = Không được hỗ trợ
Đã khóa = Không
Cần chú ý EKM = Không
PI Đủ điều kiện = Không
Chứng nhận = Không
Khả năng cổng rộng = Không

Thông tin cổng:
================

-----------------------------------------
Trạng thái cổng Địa chỉ Linkspeed SAS        
-----------------------------------------
   0 Hoạt động 6.0Gb/giây 0x50000c0f01352c36 
   1 Đang hoạt động Không xác định 0x0                
-----------------------------------------


Dữ liệu điều tra = 
00 00 06 12 5b 01 10 02 57 44 20 20 20 20 20 20 
57 44 34 30 30 31 46 59 59 47 2d 30 31 53 4c 33 
56 52 30 38 57 44 2d 57 4d 43 31 46 30 44 32 32 
32 4b 46 20 20 20 20 20 00 00 00 a0 0c 40 20 c0 
04 60 04 c0 00 00 00 00 00 00 00 00 00 00 00 00 
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 

Ở đâu Số lỗi phương tiện = 0, nhưng smartctl:

smartctl -a -d megaraid,63 /dev/sdg
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-4.19.0-0.bpo.9-AMD64] (bản dựng cục bộ)
Bản quyền (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== PHẦN THÔNG TIN BẮT ĐẦU ===
Nhà cung cấp: WD
Sản phẩm: WD4001FYYG-01SL3
Bản sửa đổi: VR08
Tuân thủ: SPC-4
Dung lượng người dùng: 4.000.787.030.016 byte [4,00 TB]
Kích thước khối logic: 512 byte
Tốc độ quay: 7200 vòng / phút
Yếu tố hình thức: 3,5 inch
Id đơn vị logic: 0x50000c0f01352c34
Số sê-ri: WMC1F0D222KF
Loại thiết bị: đĩa
Giao thức truyền tải: SAS (SPL-3)
Giờ địa phương là: Thứ Sáu ngày 28 tháng 1 14:39:52 2022 CET
Hỗ trợ SMART là: Có sẵn - thiết bị có khả năng SMART.
Hỗ trợ SMART là: Đã bật
Cảnh báo nhiệt độ: Đã bật

=== BẮT ĐẦU ĐỌC PHẦN DỮ LIỆU THÔNG MINH ===
SMART Tình trạng sức khỏe: OK

Nhiệt độ ổ đĩa hiện tại: 35 C
Nhiệt độ chuyến đi lái xe: 40 C

Công suất tích lũy theo thời gian, giờ:phút 60299:24
Sản xuất tuần 46 năm 2014
Số chu kỳ được chỉ định trong suốt thời gian tồn tại của thiết bị: 1048576
Số chu kỳ start-stop tích lũy: 18
Số lần tải-không tải được chỉ định trong suốt thời gian tồn tại của thiết bị: 1114112
Số chu kỳ tải-không tải tích lũy: 118
Các yếu tố trong danh sách lỗi phát triển: 44

Nhật ký bộ đếm lỗi:
           Lỗi được sửa bởi Total Correction Gigabyte Total
               Thuật toán đọc lại/lỗi ECC được xử lý không được xử lý
           nhanh | viết lại bị trì hoãn đã sửa các lỗi [10^9 byte]
đọc: 4899063 1 1 4899064 1 215489.217 0
soạn: 6593514 494 496 6594008 499 571584.348 0
xác minh: 345 0 0 345 0 349.197 0

Số lỗi không vừa: 202287

Nhật ký tự kiểm tra SMART
Num Đoạn trạng thái kiểm tra Thời gian sống LBA_first_err [SK ASC ASQ]
     Số mô tả (giờ)
#1 Bối cảnh dài Hoàn thành - 11 - [- - -]

Thời gian tự kiểm tra dài (kéo dài): 31120 giây [518,7 phút]

trình diễn Các yếu tố trong danh sách lỗi phát triển: 44

Bạn có thể vui lòng giải thích sự khác biệt giữa hai chỉ số này và chỉ số nào sẽ sử dụng để xác định ổ đĩa bị lỗi không? Cảm ơn bạn.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.