Điểm:3

e2fsck dọn dẹp một hệ thống tệp và sau đó vài phút (sau rất nhiều lần đọc) có lỗi

lá cờ us

Hệ thống tệp nằm trên LVM RAID5. Nó dường như đang hoạt động chính xác:

$ sudo pvs
[sudo] mật khẩu cho jrwren: 
  PV VG Fmt Attr PSize PFree 
  /dev/sda2 datavg lvm2 a-- <7,28t 2,80t
  /dev/sdb2 datavg lvm2 a-- <3,64t 0 
  /dev/sdc2 datavg lvm2 a-- <7,28t <7,28t
  /dev/sdd2 datavg lvm2 a-- <7,28t 0 
  /dev/sde2 datavg lvm2 a-- <7,28t 73,82g
  /dev/sdf1 datavg lvm2 a-- <3,64t 0 
  /dev/sdg2 datavg lvm2 a-- <7,28t 3,99t
  /dev/sdh2 datavg lvm2 a-- <447,11g 8,00m
  /dev/sdi2 datavg lvm2 a-- <9.10t 2.21t
 $ sudo lvs
  LV VG Attr LSize Pool Dữ liệu gốc % Meta% Nhật ký di chuyển Cpy%Sync Chuyển đổi
  lxd2 datavg -wi-ao---- 147.10g                                                    
  datavg được nhân đôi -wi-ao---- 300,00g                                                    
  m datavg Rwi-aor--- 3,52t 100,00          
  dữ liệu m3vg Rwi-aor--- 4,00t 100,00          
  mu datavg Rwi-aor--- 1,00t 100,00          
  dữ liệu nomirrorvg -wi-ao---- 2,20t                                                    
  dữ liệu ảnhvg Rwi-aor--- 200.00g 100.00          
  lưu trữ dữ liệuvg Rwi-aor--- 300.00g 100.00          
  storj datavg -wi-ao---- 1,00t                                                    
  t datavg Rwi-aor--- 6,00t 100,00          
  t2 datavg Rwi-aor--- 3,90t 100,00     

Tôi có một quy trình thực hiện nhiều lần đọc trên ổ đĩa logic có tên là m. Đây là thiết bị dm-12. Cuối cùng, nó chỉ chết với các thông báo hạt nhân sau.

Ngày 30 tháng 6 16:02:33 hạt nhân bị trì hoãn: [393661.035286] Lỗi EXT4-fs (thiết bị dm-12): ext4_find_extent:885: inode #191365192: com[68/1946]t main: pblk 765519712 tiêu đề/mức độ xấu: ma thuật không hợp lệ - ma thuật 0, mục 0, tối đa 0 (0), độ sâu 0 (0)                               
Ngày 30 tháng 6 16:02:33 hạt nhân bị trì hoãn: [393661.039726] Lỗi EXT4-fs (thiết bị dm-12): ext4_find_extent:885: inode #191365192: comm rtorrent chính: pblk 765519712 tiêu đề/mức độ xấu: phép thuật không hợp lệ - phép thuật 0, mục nhập 0, tối đa 0(0), độ sâu 0(0)                               
Ngày 30 tháng 6 16:02:33 hạt nhân bị trì hoãn: [393661.044175] Lỗi EXT4-fs (thiết bị dm-12): ext4_find_extent:885: inode #191365192: comm rtorrent chính: pblk 765519712 tiêu đề/mức độ xấu: phép thuật không hợp lệ - phép thuật 0, các mục nhập 0, tối đa 0(0), độ sâu 0(0)                               
Ngày 30 tháng 6 16:02:33 hạt nhân bị trì hoãn: [393661.048584] Lỗi EXT4-fs (thiết bị dm-12): ext4_find_extent:885: inode #191365192: comm rtorrent chính: pblk 765519712 tiêu đề/mức độ xấu: phép thuật không hợp lệ - phép thuật 0, mục nhập 0, tối đa 0(0), độ sâu 0(0) 
Ngày 30 tháng 6 16:02:33 hạt nhân bị trì hoãn: [393661.054717] Lỗi EXT4-fs (thiết bị dm-12): ext4_find_extent:885: inode #191365192: comm rtorrent chính: pblk 765519712 tiêu đề/mức độ xấu: phép thuật không hợp lệ - phép thuật 0, mục nhập 0, tối đa 0(0), độ sâu 0(0) 
Ngày 30 tháng 6 16:02:33 hạt nhân bị trì hoãn: [393661.060977] Lỗi EXT4-fs (thiết bị dm-12): ext4_find_extent:885: inode #191365192: comm rtorrent chính: pblk 765519712 tiêu đề/mức độ xấu: phép thuật không hợp lệ - phép thuật 0, mục nhập 0, tối đa 0(0), độ sâu 0(0) 
Ngày 30 tháng 6 16:02:33 hạt nhân bị trì hoãn: [393661.063736] Lỗi EXT4-fs (thiết bị dm-12): ext4_find_extent:885: inode #191365192: comm rtorrent chính: pblk 765519712 tiêu đề/mức độ xấu: phép thuật không hợp lệ - phép thuật 0, mục nhập 0, tối đa 0(0), độ sâu 0(0) 
Ngày 30 tháng 6 16:02:33 hạt nhân bị trì hoãn: [393661.066283] Lỗi EXT4-fs (thiết bị dm-12): ext4_find_extent:885: inode #191365192: comm rtorrent chính: pblk 765519712 tiêu đề/mức độ xấu: phép thuật không hợp lệ - phép thuật 0, mục nhập 0, tối đa 0(0), độ sâu 0(0) 
Ngày 30 tháng 6 16:02:33 hạt nhân bị trì hoãn: [393661.068773] Lỗi EXT4-fs (thiết bị dm-12): ext4_find_extent:885: inode #191365192: comm rtorrent chính: pblk 765519712 tiêu đề/mức độ xấu: phép thuật không hợp lệ - phép thuật 0, mục nhập 0, tối đa 0(0), độ sâu 0(0) 
Ngày 30 tháng 6 16:02:33 hạt nhân bị trì hoãn: [393661.071232] Lỗi EXT4-fs (thiết bị dm-12): ext4_find_extent:885: inode #191365192: comm rtorrent chính: pblk 765519712 tiêu đề/mức độ xấu: phép thuật không hợp lệ - phép thuật 0, mục nhập 0, tối đa 0(0), độ sâu 0(0) 

Tôi ngắt kết nối hệ thống tập tin và chạy e2fsck:

$ sudo e2fsck -p /dev/datavg/m
phim chứa một hệ thống tệp bị lỗi, hãy kiểm tra bắt buộc.
phim: Inode 118751237 có nút phạm vi không hợp lệ (blk 475078659, lblk 0)


phim: BẤT NGỜ BẤT NGỜ; CHẠY fsck THỦ CÔNG.
        (nghĩa là không có tùy chọn -a hoặc -p)
$ sudo e2fsck -y /dev/datavg/phim
e2fsck 1.45.7 (28-Jan-2021)
phim chứa một hệ thống tệp bị lỗi, hãy kiểm tra bắt buộc.
Vượt qua 1: Kiểm tra nút, khối và kích thước
Inode 177471496 có nút mở rộng không hợp lệ (blk 709943175, lblk 0)
Xa lạ? Vâng
...

Vượt qua 1E: Tối ưu hóa phạm vi cây
Pass 2: Kiểm tra cấu trúc thư mục
Pass 3: Kiểm tra kết nối thư mục
Vượt qua 4: Kiểm tra số lượng tham chiếu
Pass 5: Kiểm tra thông tin tóm tắt nhóm
Block bitmap differences:  -(709943175--709943176) -(868210688--868212735) -(868214784--868216831) -(868253696--868255743) -(868257792--868259839) -(868886528--868888575) -(868892672- -868894719) -(868896768--868898815) -(868900864--868902911) -(868904960--868907007) -(868909056--868911103) -(868913152--868917247) -(868921344--868923391) -(868925440-- 868927487) -(868929536--868931583) -(868933632--868935679) -(868937728--868939775) -(868941824--868943871) -(868945920--868947967) -(868950016--868954111) -(868958208--868960013 )-(869894144--869922573)
Sửa chữa? Vâng

Khối miễn phí được tính sai cho nhóm #21665 (24561, được tính=24563).
Sửa chữa? Vâng

Khối miễn phí được tính sai cho nhóm #26495 (28672, được tính=32768).
Sửa chữa? Vâng

Khối miễn phí được tính sai cho nhóm #26497 (18432, được tính=22528).
Sửa chữa? Vâng

Khối miễn phí được tính sai cho nhóm #26516 (22528, được tính=32768).
Sửa chữa? Vâng

Khối miễn phí được tính sai cho nhóm #26517 (16384, được tính=32768).
Sửa chữa? Vâng

Khối miễn phí được tính sai cho nhóm #26518 (16626, được tính=26624).
Sửa chữa? Vâng

Số khối miễn phí bị sai đối với nhóm #26547 (2290, được tính=30720).
Sửa chữa? Vâng

Số khối miễn phí bị sai (366951912, được tính = 367025158).
Sửa chữa? Vâng



phim: ***** HỆ THỐNG TẬP TIN ĐÃ ĐƯỢC SỬA ĐỔI *****
phim: 6896/236224512 tệp (20,8% không liền kề), 577868794/944893952 khối
$ sudo e2fsck -p /dev/datavg/phim
phim: sạch sẽ, 6896/236224512 tệp, 577868794/944893952 khối

Nó báo là clean nên mình remount và chạy lại phần mềm đọc.

Và vài phút sau:

Ngày 30 tháng 6 16:34:49 hạt nhân bị trì hoãn: [395595.309814] Lỗi EXT4-fs (thiết bị dm-12): ext4_find_extent:885: inode #191365190: comm rtorrent chính: pblk 765517692 tiêu đề/mức độ xấu: phép thuật không hợp lệ - phép thuật 0, mục nhập 0, tối đa 0(0), độ sâu 0(0) 
Ngày 30 tháng 6 16:34:49 hạt nhân bị trì hoãn: [395595.317838] Lỗi EXT4-fs (thiết bị dm-12): ext4_find_extent:885: inode #191365190: comm rtorrent chính: pblk 765517692 tiêu đề/mức độ xấu: phép thuật không hợp lệ - phép thuật 0, mục nhập 0, tối đa 0(0), độ sâu 0(0) 
Ngày 30 tháng 6 16:34:49 hạt nhân bị trì hoãn: [395595.320836] Lỗi EXT4-fs (thiết bị dm-12): ext4_find_extent:885: inode #191365190: comm rtorrent chính: pblk 765517692 tiêu đề/mức độ xấu: phép thuật không hợp lệ - phép thuật 0, mục nhập 0, tối đa 0(0), độ sâu 0(0) 
Ngày 30 tháng 6 16:34:49 hạt nhân bị trì hoãn: [395595.323418] Lỗi EXT4-fs (thiết bị dm-12): ext4_find_extent:885: inode #191365190: comm rtorrent chính: pblk 765517692 tiêu đề/mức độ xấu: phép thuật không hợp lệ - phép thuật 0, mục nhập 0, tối đa 0(0), độ sâu 0(0) 
Ngày 30 tháng 6 16:35:14 hạt nhân bị trì hoãn: [395619.785771] Lỗi EXT4-fs (thiết bị dm-12): ext4_find_extent:885: inode #191365190: comm rtorrent chính: pblk 765517692 tiêu đề/mức độ xấu: phép thuật không hợp lệ - phép thuật 0, mục nhập 0, tối đa 0(0), độ sâu 0(0) 
Ngày 30 tháng 6 16:35:14 trì hoãn hạt nhân: [395619.793135] Lỗi EXT4-fs (thiết bị dm-12): ext4_find_extent:885: inode #191365190: comm rtorrent chính: pblk 765517692 tiêu đề/mức độ xấu: phép thuật không hợp lệ - phép thuật 0, các mục 0, tối đa 0(0), độ sâu 0(0) 

Chuyện gì đang xảy ra ở đây? LVM có bị hỏng và nói dối tôi không? Có lệnh nào tôi có thể chạy để kiểm tra không? Tôi có nên chạy một badblocks (e2fsck -c) hay cái gì đó không?

Không có thông báo LVM tương ứng từ kernel. Tôi mong đợi lỗi LVM nếu các đĩa bên dưới gặp sự cố. Điều gì đang xảy ra?

cập nhật: ai đó đã yêu cầu đầu ra dmesg. Đó chính xác là những gì ở trên với các thông báo EXT4-fs. Các thông báo khác duy nhất trong đầu ra dmesg ngoài các thông báo khởi động tiêu chuẩn được lặp lại:

[527724.593062] RPTADDRS [3948921]: Segfault tại 7FFC7A7A50B5 IP 00007FD9F0F86820 SP 17 c0 c5 f8 77 c3 48 39 f7 0f 87 ab 00 00 00 0f 84 e5 fe ff ff c5 fe 6f 26 <c5> fe 6f 6c 16 e0 c5 fe 6f 74 16 c0 c5 fe 6f 7c 16 a0 c5 7e 6f 44
shodanshok avatar
lá cờ ca
Vui lòng hiển thị đầu ra của `dmesg`
jrwren avatar
lá cờ us
@shodanshok Tôi đã làm. Các lỗi hạt nhân ở ngay đó. Tôi sẽ cập nhật với rptaddrs segfaults.
Điểm:3
lá cờ cn

Hai lần điều này xảy ra với tôi, nguyên nhân là do lỗi phần cứng. Nguyên nhân cơ bản có thể:

  • cáp kết nối kém
  • cáp đĩa bị hỏng (xảy ra với tôi một lần)
  • giao diện SATA bị lỗi (Tôi có một giao diện đã ghi một khối 0 byte vào thiết bị đĩa của mình, chỉ một lần, nhưng sau đó tôi đã loại bỏ thẻ)
  • RAM kém (dữ liệu đệm bị hỏng)
  • quá nóng hoặc lỗi do ép xung
  • có lẽ ít khả năng hơn, lỗi phần cứng khác

Cả hai lần điều này xảy ra với tôi, tôi đều bị mất dữ liệu. Ngày nay, khả năng đó ít xảy ra hơn nhiều vì tôi sử dụng ZFS với các ảnh chụp nhanh được sao chép và cũng có các bản sao lưu băng ngoại tuyến.

Thực tế là bạn có thể fsck và sau đó lại thấy nó bị lỗi ngay sau đó thuyết phục tôi rằng đó là sự cố phần cứng. Tôi dự đoán rằng các khối được fsck ghi vào đĩa khi "khắc phục" sự cố có thể không (luôn luôn) làm cho nó không bị hỏng trên bề mặt đĩa.

Trước hết, hãy đảm bảo rằng các dây cáp hiện tại của bạn được đặt đúng vị trí và kiểm tra lại. Nếu điều đó không khắc phục được sự cố, hãy đọc tiếp:

Bạn có thể chứng minh đây là vấn đề với một đĩa thử nghiệm:

  1. Lấy hình ảnh hệ thống có khả năng khởi động trực tiếp, ví dụ: trên ổ USB. Không chuẩn bị cái này trên máy bị lỗi của bạn, vì có lẽ nó sẽ bị hỏng. Sử dụng một số máy khác hoặc mua thanh USB hệ thống Linux trực tiếp được tạo sẵn.
  2. Tắt nguồn hệ thống.
  3. Dán nhãn mọi đĩa cứng với cách nó được kết nối với giao diện SATA (ví dụ: cổng nào, v.v.)
  4. Ngắt kết nối các ổ đĩa và bảo quản chúng đúng cách (tức là trong các thùng chứa chống tĩnh điện chắc chắn). Không cắm chúng trở lại hệ thống cho đến khi bạn đã cách ly và khắc phục sự cố, bởi vì nỗ lực khắc phục sự cố của bạn với fsck đang làm cho nó tồi tệ hơn.
  5. Cắm một hy sinh đĩa chứa không có dữ liệu có giá trị nào mà bạn có thể ghi đè lên một cách an toàn
  6. Kiểm tra kỹ xem đĩa hy sinh của bạn và hình ảnh có thể khởi động trực tiếp (xem mục tiếp theo) có đúng không chỉ có thiết bị lưu trữ được kết nối với máy. Bạn cần tránh vô tình phân vùng đĩa có dữ liệu quý giá của mình trên đó hoặc chạy khối xấu trên một đĩa như vậy.
  7. Khởi động từ một hình ảnh hệ thống trực tiếp (ví dụ: hệ thống trực tiếp USB có thể khởi động)
  8. Phân vùng ổ đĩa thành một số lượng nhỏ các phân vùng, phân vùng đầu tiên là vài chục GB
  9. Chạy khối xấu -w -B (các -B đảm bảo rằng chúng tôi cũng sử dụng RAM) trên một phân vùng nhỏ (chọn một phân vùng nhỏ để quá trình kiểm tra không mất nhiều ngày)
  10. Nếu điều này không thành công, bạn có vấn đề về phần cứng; thử thay linh kiện xem có hết không
    1. ví dụ: tháo tất cả các mô-đun RAM trừ một mô-đun, xoay qua chúng để xác định cái nào bị hỏng
    2. ví dụ: thay đổi cổng SATA mà bạn kết nối, để xác định giao diện SATA hoặc bộ điều hợp kém
    3. ví dụ như giữ nguyên cổng SATA nhưng đổi cáp, để nhận biết cáp dởm
  11. Có thể các lỗi trong các thành phần hệ thống khác (thậm chí là bo mạch chủ bị lỗi hoặc PSU không đủ năng lượng) có thể gây ra sự cố
  12. Nếu bạn nghi ngờ RAM xấu, bạn có thể sử dụng memtest86 để kiểm tra nó. Bạn cũng có thể bỏ qua -B thay vào đó, hãy gắn cờ từ các khối xấu để sử dụng I/O trực tiếp, điều này sẽ làm giảm nhưng không loại bỏ việc sử dụng RAM.

Khi bạn đã xác định được phần cứng bị lỗi, hãy thay thế nó. Lý tưởng nhất là khôi phục bản sao lưu gần đây nhất của bạn trên đĩa mới (lưu ý rằng nếu bạn không thực sự cách ly và khắc phục sự cố, dữ liệu trên đĩa mới của bạn cũng sẽ bị hỏng).

Chỉnh sửa: bạn có thể downvote, nhưng nếu bạn quyết định làm như vậy, tôi sẽ đánh giá cao nếu bạn để lại nhận xét chỉ ra lý do tại sao câu trả lời này không hữu ích.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.