Điểm:1

Lỗi đĩa ZFS khi ghi

lá cờ ck

nhóm sao lưu ZFS của chúng tôi đang tạo ra lỗi đĩa lạ khi ghi dữ liệu. Nhóm này được sao chép qua DRBD trên máy chủ thứ hai có phần cứng giống hệt nhau cũng gặp lỗi tương tự. Đây là lý do tại sao tôi không nghĩ đó là vấn đề phần cứng.

Thiết lập như sau (trên cả hai máy chủ):

  • Máy chủ Debian 10 với thẻ điều khiển RAID Adaptec ASR 71605 ở chế độ HBA. Tất cả các đĩa được hiển thị dưới dạng đĩa RAW.
  • Có hai nhóm (tất cả các đĩa đều là SSD của trung tâm dữ liệu):
    1. RAID-Z3 sử dụng tám đĩa, hoạt động trơn tru
    2. MIRROR sử dụng hai đĩa, gặp lỗi đĩa
  • Mỗi nhóm có một ổ đĩa ZFS được tạo trên chúng (compression=lz4)
  • Các ổ đĩa được đồng bộ hóa với máy chủ thứ hai thông qua DRBD (giao thức C)
  • Thiết bị khối được DRBD hiển thị có khối lượng LVM trên đó được hiển thị với trình ảo hóa của chúng tôi thông qua iSCSI. Các trình ảo hóa (XCP-ng) quản lý đĩa của họ một cách minh bạch trên các ổ đĩa iSCSI.

Tất cả các đĩa trên nhóm được nhân đôi đã gặp phải các lỗi sau (không đồng thời nhưng tại các thời điểm khác nhau):

Ngày 10 tháng 11 18:00:09 kernel st41: [240970.603991] sd 0:1:8:0: [sdi] tag#977 FAILED Kết quả: hostbyte=DID_ABORT driverbyte=DRIVER_OK
Ngày 10 tháng 11 18:00:09 hạt nhân st41: [240970.603997] sd 0:1:8:0: [sdi] tag#977 CDB: Viết(10) 2a 00 a8 20 31 67 00 01 00 00
Ngày 10 tháng 11 18:00:09 kernel st41: [240970.604000] print_req_error: Lỗi I/O, dev sdi, sector 2820682087
Ngày 10 tháng 11 18:00:09 kernel st41: [240970.604065] zio pool=tank2 vdev=/dev/disk/by-id/ata-SAMSUNG_MZ7KH1T9HAJR-00005_S47PNA0R101407-part1 error=5 type=2 offset=1444188179968 size=131072 flags=180880
Ngày 10 tháng 11 18:00:10 kernel st41: [240970.675209] aacraid: Yêu cầu đặt lại bus máy chủ. SCSI treo?
Ngày 10 tháng 11 18:00:10 hạt nhân st41: [240970.675272] aacraid 0000:82:00.0: cmd nổi bật: midlevel-1
Ngày 10 tháng 11 18:00:10 hạt nhân st41: [240970.675275] aacraid 0000:82:00.0: cmd nổi bật: mức thấp-0
Ngày 10 tháng 11 18:00:10 hạt nhân st41: [240970.675278] aacraid 0000:82:00.0: cmd nổi bật: trình xử lý lỗi-0
Ngày 10 tháng 11 18:00:10 hạt nhân st41: [240970.675280] aacraid 0000:82:00.0: cmd nổi bật: firmware-0
Ngày 10 tháng 11 18:00:10 kernel st41: [240970.675283] aacraid 0000:82:00.0: cmd nổi bật: kernel-0
Ngày 10 tháng 11 18:00:10 kernel st41: [240970.675317] aacraid 0000:82:00.0: Loại đặt lại bộ điều khiển là 3
Ngày 10 tháng 11 18:00:10 kernel st41: [240970.675358] aacraid 0000:82:00.0: Phát hành đặt lại IOP
Ngày 10 tháng 11 18:00:45 kernel st41: [241005.856763] aacraid 0000:82:00.0: Đặt lại IOP thành công
Ngày 10 tháng 11 18:00:45 hạt nhân st41: [241005.879733] aacraid: Đã bật Giao diện Comm loại2
Ngày 10 tháng 11 18:00:54 kernel st41: [241014.950498] aacraid 0000:82:00.0: Lên lịch quét lại xe buýt

Bốn dòng đầu tiên của nhật ký ở trên xuất hiện nhiều lần với các cung và dữ liệu CDB Write(10) khác nhau, nhưng nếu không thì giống nhau. Điều này luôn xảy ra vào đầu giờ, chính xác là khi các tập lệnh sao lưu của chúng tôi bắt đầu ghi vào nhóm này.

Tôi đã thử cập nhật các gói ZFSonlinux, chương trình cơ sở của bộ điều khiển RAID và thử cắm các đĩa vào các khe khác nhau trên bảng nối đa năng. Báo cáo SMART của đĩa không hiển thị lỗi nào cả (và đĩa còn tương đối mới).

Vì điều này xảy ra trên cả hai máy chủ và với cả bốn đĩa nên tôi không nghĩ đó là sự cố phần cứng với đĩa hoặc bộ điều khiển RAID.

Sự khác biệt duy nhất về cấu hình giữa các đĩa trên cả hai nhóm mà tôi đã tìm thấy là các báo cáo ARCCONF Ghi bộ đệm: Đã bật (ghi lại) cho các đĩa pool được nhân đôi, nhưng Ghi bộ đệm: Đã tắt (ghi qua) cho các đĩa nhóm RAID-Z3. Tôi không thể thay đổi chế độ bộ nhớ đệm này vì ARCCONF cho biết ổ đĩa đang ở chế độ RAW và không hỗ trợ bộ nhớ đệm, vì vậy tôi không chắc liệu báo cáo cấu hình có đáng tin cậy hay không.

Tôi không biết phải làm gì bây giờ, mọi trợ giúp đều được đánh giá cao.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.