Điểm:0

FAILED md RAID10, đầu ra khó hiểu

lá cờ in

Tôi đang thử nghiệm một mảng RAID10 tại đây với mdadm. Tôi muốn xem nó có thể chịu đựng được bao nhiêu thiết bị bị lỗi, thời gian xây dựng lại, v.v. Tại một thời điểm, tôi đã yêu cầu nó thực hiện đồng bộ lại trên 5 hoặc 6 thiết bị, sau đó tôi khởi động lại nó, Bây giờ nó đang hiển thị không hoạt động và tôi không chắc nó là gì đang làm hoặc làm thế nào để lấy lại.

Không có gì quan trọng ở đó và tôi chỉ có thể tạo lại nó, nhưng tôi muốn tìm hiểu xem đã xảy ra lỗi gì và liệu nó có thể được phục hồi hay không.

root@netcu1257-vs-02:~# cat /proc/mdstat Tính cách : [tuyến tính] [đa đường] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0 : không hoạt động sdz[19] sdy[ 18] sdx[17] sdw[16] sdv[15] sdu[14] sds[12] sdt[13] sdr[11] sdq[10](S) sdp[21] sdn[8] sdm[7] sdo [9] sdl[6] sdj[20](R) sdk[22](S) sdi[4](S) sdh[3] sdf[1] sde[0] sdg[2]
              257812572160 khối siêu 1.2
        root@netcu1257-vs-02:~# mdadm -D /dev/md0
        /dev/md0:
                   Phiên bản : 1.2
             Thời gian tạo : Thứ sáu ngày 29 tháng 10 13:59:41 năm 2021
                Cấp độ đột kích: đột kích10
             Kích thước Dev đã sử dụng: 18446744073709551615
              Thiết bị đột kích: 20
             Tổng số thiết bị : 22
               Kiên trì : Superblock là bền bỉ
    
           Thời gian cập nhật : Thứ hai ngày 8 tháng 11 09:59:42 2021
                 Trạng thái: đang hoạt động, KHÔNG THÀNH CÔNG, Chưa bắt đầu 
        Thiết bị đang hoạt động : 13
       Thiết bị làm việc : 22
        Thiết bị bị lỗi: 0
         Thiết bị dự phòng : 9
    
                Bố cục: gần = 2
            Kích thước khối: 512K
    
    Chính sách nhất quán : không rõ
    
                  Tên: netcu1257-vs-02:0 (cục bộ để lưu trữ netcu1257-vs-02)
                  UUID : c3418360:4fb5857c:eb952018:163a60c6
                Sự kiện : 85985
    
        Số Chính Nhỏ Nhỏ RaidDevice State
           - 0 0 0 đã xóa
           - 0 0 1 đã xóa
           - 0 0 2 đã xóa
           - 0 0 3 đã xóa
           - 0 0 4 đã xóa
           - 0 0 5 đã xóa
           - 0 0 6 đã xóa
           - 0 0 7 đã xóa
           - 0 0 8 đã xóa
           - 0 0 9 đã xóa
           - 0 0 10 đã xóa
           - 0 0 11 đã xóa
           - 0 0 12 đã xóa
           - 0 0 13 đã xóa
           - 0 0 14 đã xóa
           - 0 0 15 đã xóa
           - 0 0 16 đã xóa
           - 0 0 17 đã xóa
           - 0 0 18 đã xóa
           - 0 0 19 đã xóa
    
           - 65 112 17 bộ đồng bộ-B /dev/sdx
           - 8 64 0 xây dựng lại dự phòng /dev/sde
           - 8 208 8 bộ đồng bộ-A /dev/sdn
           - 65 80 15 bộ đồng bộ-B /dev/sdv
           - 8 176 6 đồng bộ set-A /dev/sdl
           - 65 48 13 bộ đồng bộ-B /dev/sdt
           - 8 144 5 xây dựng lại dự phòng /dev/sdj
           - 65 16 11 bộ đồng bộ-B /dev/sdr
           - 8 112 3 bộ đồng bộ-B /dev/sdh
           - 8 240 7 dự phòng xây dựng lại /dev/sdp
           - 65 128 18 bộ đồng bộ-A /dev/sdy
           - 8 80 1 bộ đồng bộ-B /dev/sdf
           - 8 224 9 xây dựng lại dự phòng /dev/sdo
           - 65 96 16 bộ đồng bộ-A /dev/sdw
           - 8 192 10 xây dựng lại dự phòng /dev/sdm
           - 65 64 14 bộ đồng bộ-A /dev/sdu
           - 8 160 - dự phòng /dev/sdk
           - 65 32 12 bộ đồng bộ-A /dev/sds
           - 8 128 - dự phòng /dev/sdi
           - 65 0 - dự phòng /dev/sdq
           - 65 144 19 bộ đồng bộ-B /dev/sdz
           - 8 96 2 dự phòng xây dựng lại /dev/sdg

Như bạn có thể thấy, tất cả các thiết bị của tôi (/dev/sd[e-z]) hiển thị như một phần của md0, tuy nhiên nó cũng hiển thị 20 thiết bị bị thiếu. Định dạng ban đầu của mảng là 20 thiết bị với 2 phụ tùng. Và mặc dù nó nói rằng nó đang được xây dựng lại, nhưng không có hoạt động nào trên đĩa và /proc/mdstat cũng chỉ ra điều tương tự.

Điều này có thể phục hồi được không? Và do mảng đang được xây dựng lại trước khi máy chủ được khởi động lại, tôi có thể làm gì để đảm bảo quá trình xây dựng lại sẽ tiếp tục và mảng vẫn hoạt động sau khi khởi động lại?

chỉnh sửa:

Tôi thấy tệp mdadm.conf của mình đã bị đặt sai trong /etc/. Tôi đã chuyển nó sang /etc/mdadm/ và khởi động lại, bây giờ mảng của tôi đang hiển thị dưới dạng RAID0, vẫn không hoạt động:

root@netcu1257-vs-02:~# mdadm -D /dev/md0
/dev/md0:
           Phiên bản : 1.2
        Cấp độ đột kích: đột kích0
     Tổng số thiết bị : 22
       Kiên trì : Superblock là bền bỉ

             Trạng thái: không hoạt động
   Thiết bị làm việc : 22

              Tên: netcu1257-vs-02:0 (cục bộ để lưu trữ netcu1257-vs-02)
              UUID : c3418360:4fb5857c:eb952018:163a60c6
            Sự kiện : 85985

    Số Lớn Nhỏ RaidDevice

       - 65 112 - /dev/sdx
       - 8 64 - /dev/sde
       - 8 208 - /dev/sdn
       - 65 80 - /dev/sdv
       - 8 176 - /dev/sdl
       - 65 48 - /dev/sdt
       - 8 144 - /dev/sdj
       - 65 16 - /dev/sdr
       - 8 112 - /dev/sdh
       - 8 240 - /dev/sdp
       - 65 128 - /dev/sdy
       - 8 80 - /dev/sdf
       - 8 224 - /dev/sdo
       - 65 96 - /dev/sdw
       - 8 192 - /dev/sdm
       - 65 64 - /dev/sdu
       - 8 160 - /dev/sdk
       - 65 32 - /dev/sds
       - 8 128 - /dev/sdi
       - 65 0 - /dev/sdq
       - 65 144 - /dev/sdz
       - 8 96 - /dev/sdg
Nikita Kipriyanov avatar
lá cờ za
Tôi nghi ngờ điều này sẽ xảy ra trên ServerFault. Trang web này nói về các vấn đề kinh doanh, không phải về các thử nghiệm gây tò mò với Linux. Tôi sẽ chuyển cái này sang Unix & Linux.
lá cờ in
Tại sao bạn cho rằng điều này không được sử dụng trong một doanh nghiệp? Doanh nghiệp nào bạn tham gia mà không thử nghiệm công nghệ trước khi đưa vào sản xuất?
Điểm:0

You need to re-add all the drives.

For all in set-A. then the same for set-B

mdadm --manage /dev/mdN -a /dev/sdX1

Before that try a simple

mdadm --assemble /dev/mdN /dev/sd? ...
Ярослав Рахматуллин avatar
https://www.thomas-krenn.com/en/wiki/Mdadm_recovery_and_resync
Nikita Kipriyanov avatar
lá cờ za
Họ có thể sẽ thấy thông báo về thiết bị đang bận nếu họ cố gắng làm theo lời khuyên của bạn. Bởi vì các thiết bị sẽ được thực hiện. Ngoài ra, nguồn thông tin được đề xuất là [wiki Linux RAID chính thức](https://raid.wiki.kernel.org/index.php/Linux_Raid#When_Things_Go_Wrogn)
lá cờ in
Cảm ơn. Tôi đã xem qua thông tin trên trang mdadm trong wiki nhưng chưa thấy trang Assemble Run. Tôi sẽ làm việc với thông tin tốt trên đó, cũng như trong câu trả lời này.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.