Tôi có một số nhóm zfs và cứ sau khoảng một tháng trong quá trình hoạt động bình thường, nhóm chính sẽ bắt đầu xây dựng lại (trình phục hồi) với ổ đĩa dự phòng và ổ đĩa ngẫu nhiên. Khi nhìn vào dmesg, tôi thấy điều này:
[Thứ 4 ngày 24 tháng 11 13:20:37 năm 2021] kiểm toán: type=1400 kiểm toán(1637781634.835:321): apparmor="STATUS" operation="profile_replace" info="giống như hồ sơ hiện tại, đang bỏ qua" profile="unconfined" name= "snap.canonical-livepatch.hook.connect-plug-etc-update-motd-d" pid=2454976 comm="apparmor_parser"
[Thứ Tư ngày 24 tháng 11 13:20:38 năm 2021] loop27: đã phát hiện dung lượng thay đổi từ 0 thành 8
[Thứ Tư ngày 24 tháng 11 13:24:48 năm 2021] sde: sde1 sde9
[Thứ tư ngày 24 tháng 11 13:31:26 năm 2021] sdl: sdl1 sdl9
[Thứ Tư ngày 24 tháng 11 15:15:02 năm 2021] kauditd_printk_skb: 42 cuộc gọi lại bị chặn
Đây là ngày sau khi hệ thống khởi động do cập nhật phần mềm. Tôi đoán các thông báo cho sde và sdl chỉ ra rằng các ổ đĩa bằng cách nào đó đã rời khỏi hệ thống và được phát hiện lại? Khi khởi động, thông báo phân vùng được theo sau bởi thông báo đĩa đính kèm, đây không phải là trường hợp ở đây.
Tìm kiếm lý do. sde được kết nối với thẻ sas9201 và từ đó đến một hộp khác chứa tất cả các ổ đĩa đó. sdl được kết nối với bộ điều khiển MB. Lưu ý rằng dường như luôn có 2 ổ đĩa, trên các bộ điều khiển khác nhau cùng một lúc. Nó luôn luôn là các ổ đĩa khác nhau. 2 bộ điều khiển khác nhau.Bạn có muốn giả sử đi dây cáp hoặc thứ gì đó đơn giản, nhưng các bộ điều khiển khác nhau vào cùng một thời điểm và các ổ đĩa khác nhau mỗi lần không? Cũng dường như loại trừ vấn đề bộ điều khiển. Đây là một hệ thống đã được thiết lập hơn một năm và chỉ vài tháng trước đã bắt đầu thực hiện điều này.
Hệ thống hoạt động bình thường nếu không có vấn đề gì. Trục trặc, bất kể nó là gì, không gây ra gì ngoài nhóm zfs để xây dựng lại, không có gì bị mất và không có gì khác bị trục trặc. Đã kết nối với UPS, cả hệ thống và hộp mảng đĩa. Tôi không thấy thông báo nào khác trong tệp nhật ký cho biết bất kỳ sự cố nào, không có thông báo nào biến mất.
Đang mò bọ gì đó mà chả thấy. Đó là một vấn đề kỳ lạ. Không có lỗi lặn trên các ổ đĩa này, không có gì bất thường trong thông minh.
Tôi có thể làm gì để tiếp tục gỡ lỗi này không? Một cái gì đó để kích hoạt, hoặc cài đặt để thay đổi? Gợi ý?