Raid6 tốt hơn nhiều so với R5 + dự phòng nóng, vì gấp đôi số đĩa được phép hỏng cùng một lúc. Trên thực tế, dù sao thì đó cũng là một điều kinh dị với rất nhiều ổ đĩa nhưng sẽ ít kinh dị hơn R5;)
Bây giờ bạn có R5 trên 18 đĩa, vì vậy nếu bất cứ điều gì không thành công, bạn đang dựa vào việc đọc chính xác tất cả các cung từ 17 đĩa (do cách thức hoạt động của tổng CRC, bộ điều khiển cần đọc tất cả các cung trống và tất cả các cung đã sử dụng). Ngoài ra, một số đĩa này không ổn định và có thể đã bị lỗi.
Thông thường, ổ đĩa bị loại khỏi RAID vì nó cần nhiều thời gian hơn bình thường để đọc dữ liệu. Nhiều thời gian hơn bình thường thường là dấu hiệu cho thấy ổ đĩa của bạn sắp hỏng và nó có thể xuất hiện hoặc không xuất hiện trong SMART. Và đây có lẽ là "sự cố lạ" với các ổ đĩa bị lỗi mà sau này có thể được gắn lại vào mảng.
Gắn lại một ổ đĩa hoặc sử dụng nó có thể là một ý tưởng hay trên Raid 1/Raid10 chứ không phải trên một thiết lập mà bạn không có lợi nhuận. Trong trường hợp như của bạn, tôi cho rằng mảng đã chết, nếu không thì có lẽ nó sẽ xảy ra rất sớm.
Vì vậy, theo IMO, giải pháp sẽ là - sử dụng R10 với các ổ đĩa hỏng, hỏng này và hạn chế sử dụng tài nguyên bằng cách nào đó HOẶC sử dụng R6 với một ổ đĩa dự phòng để nó được xây dựng lại ngay lập tức sau khi một ổ đĩa bị mất. Sẽ tốt hơn nếu bạn có một số lưu giữ và xóa dữ liệu lịch sử nếu bạn có đủ ngân sách hơn là để mất mọi thứ.
Có lẽ bạn cần bắt đầu sửa nó càng sớm càng tốt. Nói chuyện với ông chủ và thông báo rằng bố cục đột kích này không phù hợp và có 3 lựa chọn:
- Tiếp tục ở R5 và mất tất cả trong tương lai không xa
- Xây dựng lại trong R10 và giới hạn dữ liệu được lưu trữ
- R6 + dự phòng có lẽ là một ý tưởng rất tồi, nhưng có lẽ bạn có thể thực hiện R6 mà không có dự phòng cho quá trình xử lý tạm thời này và R1 cho tất cả nội dung quan trọng (theo cách này, bạn sẽ không phải hy sinh quá nhiều dung lượng lưu trữ)
Trên thực tế, bạn rất may mắn vì nó vẫn hoạt động ...