Điểm:1

Kiểm tra sức khỏe trên NVMe

lá cờ us

Trên các máy chủ tôi có, với ổ cứng hoặc SSD, tôi có một cron chạy định kỳ:

/usr/sbin/smartctl --test=ngắn/dài/dev/sd1

(cho mỗi đĩa)

Trong khi nó chạy, nó chỉ nhìn vào đầu ra của /usr/sbin/smartctl -c /dev/sd1, lặp cho đến khi nó không còn chứa:

[0-9]+% của bài kiểm tra còn lại.

Và sau đó kiểm tra xem nó đã hoàn thành mà không có lỗi chưa:

( 0) Đã hoàn thành quy trình tự kiểm tra trước đó

Tuy nhiên, có vẻ như thông minh chưa hỗ trợ thử nghiệm NVMe kể từ phiên bản 7.0 và theo: https://www.smartmontools.org/wiki/NVMe_Support

Nó nói rằng

Daemon smartd theo dõi tình trạng (-H), số lỗi (-l error) và nhiệt độ (-W DIFF,INFO,CRIT)

nhưng những gì thực sự chạy các bài kiểm tra? Tôi không chắc liệu đầu ra của -H-l cập nhật trừ khi chúng tôi chạy thử nghiệm ngắn/dài hạn?

Tôi cũng đã đọc về nvme-cli, nhưng dường như tôi không tìm được cách chạy kiểm tra sức khỏe trên đĩa bằng nó.

Bất kỳ ý tưởng?

Sử dụng CentOS 7 tại đây.

Marcus Müller avatar
lá cờ pt
Tôi không *biết*, nhưng tôi sẽ ngạc nhiên nếu chạy bất kỳ thử nghiệm rõ ràng nào sẽ mang lại lợi thế kiến ​​thức rất lớn cho SSD – những thứ này ở một vị trí hoàn hảo để theo dõi sức khỏe của chính chúng, vì cân bằng hao mòn biết tần suất theo nghĩa đen từng phân đoạn bộ nhớ đã được sử dụng, *và* do mã sửa lỗi toàn diện vốn có của các thiết bị NVMe, bạn sẽ có được một bức tranh rất rõ về sự lão hóa của thiết bị chỉ đơn giản từ việc sử dụng hàng ngày.
Điểm:1
lá cờ ca

Tự kiểm tra SMART đã được hình thành cho các đĩa cơ học. SSD SATA hầu như phản ánh hoàn toàn hành vi ở cấp độ giao diện ổ cứng trước đó hỗ trợ tự kiểm tra như vậy nhưng thực tế không hoạt động nhiều khi bạn chạy nó. Các ổ đĩa NVMe đã loại bỏ hoàn toàn các quy trình tự kiểm tra SMART như vậy.

Đối với đĩa dựa trên flash, người ta thực sự nên theo dõi độ hao mòn của ô, số lượng khối dự phòng và các cung được phân bổ lại thay vì dựa vào các quy trình tự kiểm tra cũ không được hỗ trợ trên các ổ đĩa NVMe.

Nuno avatar
lá cờ us
Cảm ơn rất nhiều. Có ý nghĩa. Bạn có biết nếu tôi cứ để `smartd` chạy, nó có cho tôi biết bất kỳ sự cố đĩa NVMe nào thông qua các thông báo nhật ký hệ thống không? Tất cả những gì tôi muốn là yên tâm rằng tôi được bảo vệ và không cẩu thả :-)
shodanshok avatar
lá cờ ca
Theo như tôi biết, `smartd` cũng phải có khả năng theo dõi tình trạng của SSD NVMe để cảnh báo trong trường hợp ổ đĩa tự báo cáo trạng thái không khỏe mạnh.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.