Điểm:0

Làm cách nào để kiểm tra thẻ Bộ điều khiển SAS của tôi?

lá cờ by

Mình đang cần test card Dell SAS Controller của mình. Tôi thấy quá nhiều lỗi khi cài đặt Raidz2, kể từ tháng 7 năm ngoái, có thể là sự thật. Cứ như thể hết ổ này đến ổ khác tiếp tục quay ngoài đường ray.

Tôi có một "dell" 9207-8l được cho là. Tôi đã nhận được nó từ ebay vào tháng 7/tháng 8 năm 2020. https://www.ebay.com/itm/132663136462 Tôi chưa bao giờ có thể vào cấu hình của nó. Nó báo nhấn Ctrl + C, để vào config. Tôi đã thử crtl trái và phải, cộng với c, cũng với C (viết hoa) vì viết hoa của nó. Nó nói sẽ nhập cấu hình sau khi thiết lập, nhưng không bao giờ có, chỉ cần vào thẳng bios nếu xóa đã được nhấn, hoặc khởi động khác.

Tôi chạy zfs-on-linux, trên rhelx64. Hôm qua lấy bánh. Tôi đã phải rút một số thiết bị 2TB (6) và tạo ra 3 LVM 3TB, để hỗ trợ hệ thống bị lỗi, trong khi trải qua một loại địa ngục RMA.

# trạng thái zpool                                                                               
hồ bơi: nas
trạng thái: XUỐNG trạng thái: Một hoặc nhiều thiết bị hiện đang được khôi phục lại. hồ bơi sẽ
        tiếp tục hoạt động, có thể ở trạng thái xuống cấp.
hành động: Đợi bộ giải mã hoàn tất.
  scan: resilver đang được tiến hành kể từ Thứ Tư, ngày 1 tháng 12, 05:41:15, 2021
        665G được quét ở tốc độ 24,5M/s, 640G được phát hành ở tốc độ 23,6M/s, tổng cộng 9,78T
        Đã hoàn trả 182G, hoàn thành 6,40%, còn 4 ngày nữa là 16:52:09
cấu hình:

        TÊN BANG ĐỌC VIẾT CKSUM
        nas ĐÃ XUỐNG 0 0 0
          radiz2-0 ĐÃ XUỐNG 0 0 0
            scsi-35000c50093a9052f ĐÃ XUỐNG 0 0 52 quá nhiều lỗi
            thay thế-1 GIẢM GIÁ 0 0 52
              scsi-35000c50084818db7 NGOẠI TUYẾN 0 0 0
              lvzfs2-lvzfsvol2 TRỰC TUYẾN 0 0 0 (phân giải)
            scsi-35000c50093a9182b DEGRADED 235 636 52 quá nhiều lỗi
            scsi-350000c0f01e5dabc ĐÃ XUỐNG 0 0 60 quá nhiều lỗi
            scsi-35000c5008491a803 ĐÃ XUỐNG 0 0 53 quá nhiều lỗi (đang phân giải)
            thay thế-5 ĐÃ XUỐNG 0 0 52
              scsi-35000c50084889cf3 NGOẠI TUYẾN 0 0 0
              lvzfs1-lzfsvol1 TRỰC TUYẾN 0 0 0 (phân giải)
            scsi-35000c50093a8dfe7 ĐÃ XUỐNG 0 0 52 quá nhiều lỗi
        phụ tùng
          lvzfs3-lvzfsvol3 CÓ SẴN

lỗi: Các lỗi vĩnh viễn đã được phát hiện trong các tệp sau:

        <siêu dữ liệu>:<0x0>
root@merlin ~$

Việc phục hồi này đã diễn ra trong một hoặc hai tháng qua, bằng cách này hay cách khác. Mọi thứ thực sự hoạt động tốt trong một thời gian ngắn, khi ổ đĩa tiếp theo bị lỗi hoặc một ổ đĩa bị lỗi đã biết trước đó (dd dev/zero'd), lại bị lỗi.

Nó thực sự khiến tôi phát điên và đồng thời khiến tôi sợ hãi, vì dữ liệu này là quan trọng nhất. Những bức ảnh gia đình của nó từ những năm 1970 trở về trước, v.v ...

Xin vui lòng giúp đỡ?

CHỈNH SỬA: Tôi đã thêm một nhận xét về những gì tôi thực sự sử dụng các ổ đĩa, tại đây https://www.reddit.com/r/audiophile/comments/bxw38m/bass_vibrations_and_computer_hard_drives/hnvbyj0/ vì tôi cũng lo ngại rằng HardHouse và Tidy Tracks đang làm rung chuyển các ổ đĩa với một vài loa siêu trầm. Sẽ xem xét chuyển máy chủ ra khỏi văn phòng, vào nhà để xe. Tôi cũng đã quản lý để tạo một nhóm zfs mới, sử dụng các cổng sata và ổ đĩa 2Tb cũ và chưa có sự cố nào. vẫn ở giữa địa ngục của bộ giải mã mặc dù tôi đã điều chỉnh và thậm chí đã chuyển một vài bộ dữ liệu sang nhóm khác.

root@merlin ~$ trạng thái zpool
  hồ bơi: bak
 trạng thái: TRỰC TUYẾN
  quét: không có yêu cầu
cấu hình:

        TÊN BANG ĐỌC VIẾT CKSUM
        nướng TRỰC TUYẾN 0 0 0
          ata-WDC_WD20EZRX-19D8PB0_WD-WCC4M0428332 TRỰC TUYẾN 0 0 0
          ata-WDC_WD2000FYYZ-01UL1B1_WD-WCC1P0891973 TRỰC TUYẾN 0 0 0

lỗi: Không có lỗi dữ liệu đã biết

  hồ bơi: nas
 trạng thái: XUỐNG
trạng thái: Một hoặc nhiều thiết bị hiện đang được khôi phục lại. hồ bơi sẽ
        tiếp tục hoạt động, có thể ở trạng thái xuống cấp.
hành động: Đợi bộ giải mã hoàn tất.
  quét: resilver đang được tiến hành kể từ Thứ Hai ngày 6 tháng 12 11:08:12 năm 2021
        7,84T được quét với tốc độ 37,5M/s, 7,84T được phát hành với tốc độ 37,5M/s, tổng cộng 9,78T
        Đã hoàn trả 3,39T, hoàn thành 80,16%, còn 0 ngày nữa 15:03:25
cấu hình:

cấu hình:

        TÊN BANG ĐỌC VIẾT CKSUM
        nas ĐÃ XUỐNG 0 0 0
          radiz2-0 ĐÃ XUỐNG 0 0 0
            scsi-35000c50093a9052f ĐÃ XUỐNG 0 0 0 quá nhiều lỗi
            thay thế-1 TRỰC TUYẾN 0 0 0
              scsi-35000c50084818db7 TRỰC TUYẾN 0 0 0 (phân giải)
              lvzfs2-lvzfsvol2 TRỰC TUYẾN 0 0 0 (phân giải)
            thay thế-2 GIẢM GIÁ 0 0 0
              17084797086424522076 UNAVAIL 0 0 0 là /dev/disk/by-id/scsi-35000c50093a9182b-part1
              scsi-350000c0f012efb7c TRỰC TUYẾN 0 0 0 (phân giải)
            scsi-350000c0f01e5dabc DEGRADED 0 0 0 quá nhiều lỗi (đang phân giải)
            scsi-35000c5008491a803 DEGRADED 0 0 0 quá nhiều lỗi
            thay thế-5 ĐÃ XUỐNG 0 0 0
              scsi-35000c50084889cf3 DEGRADED 0 0 0 quá nhiều lỗi (đang phân giải)
              lvzfs1-lzfsvol1 ĐÃ XUỐNG 0 0 0 quá nhiều lỗi (đang phân giải)
            scsi-35000c50093a8dfe7 ĐÃ XUỐNG 0 0 0 quá nhiều lỗi

lỗi: 2 lỗi dữ liệu, sử dụng '-v' cho danh sách

Xin cho biết, đã có lỗi tổng kiểm tra, nhưng những lỗi đó đã bị xóa sau khi khởi động lại.

Lỗi rất nhỏ, tôi thực sự ấn tượng về độ bền của ZFS, đó là lý do tại sao tôi tiếp tục sử dụng nó cho các bản sao lưu chính của mình. Tốt hơn là sao lưu vào đĩa đơn ..

Một sai lầm khác mà tôi đã mắc phải, tôi có 5 ổ đĩa mới ở đây gần một tuần rồi, nhưng tôi không thể sử dụng chúng cho đến khi các ổ đĩa LVM hoàn tất quá trình khôi phục lại, vì tôi rất gần với lỗi dữ liệu, nên tôi muốn nó hoàn thành trước, tự bắn vào đầu mình chân vì không đợi các ổ đĩa đến trong thư, trước khi tôi chạy thao tác thay thế đó một cách tùy tiện, không nhận ra rằng sẽ mất hàng tuần để hoàn thành tất cả các hoạt động khôi phục này. Điên khùng!

Tôi đã thực hiện một số phép toán về lưu trữ sông băng (0,004/GB), sẽ tốn 20 đô la tháng cho 5TB, không phải là một tùy chọn. Nếu tôi cần dữ liệu đó, hãy quên nó đi với chi phí đầu ra. Ngoài ra, tôi rất thích điều này, sử dụng ZFS trên máy chủ gia đình cho việc này. các ổ đĩa mảng trước đó đã được 8 năm tuổi, khi bị gỡ xuống và tôi chỉ sử dụng các ổ đĩa bị lỗi đã biết trên toàn bộ mảng và vẫn quản lý thành công z2 theo cách của mình. Tôi cho rằng một bộ ổ đĩa tân trang hoặc làm mới sẽ giải quyết được vấn đề này. Xin lỗi, đoán tôi đang trút giận, tôi muốn nghe thêm về những gì tôi có thể làm sai mặc dù ...

Nhân tiện, tôi đã yêu cầu công ty trả tiền (trong trường hợp này là deepdiscountserver) để thay thế ổ đĩa, các kiểu máy khác nhau. IBM không tân trang lại cho tôi nữa. sẽ kiểm tra HGST, vì chúng đã hoạt động tốt trong quá khứ đối với tôi.

Hãy yên tâm, một thẻ SAS mới sẽ được cung cấp nếu những thẻ đó đang có vấn đề, một khi sự điên rồ của người phục hồi này kết thúc, nếu nó xảy ra. Tôi sẽ phải thực hiện một bản sao lưu toàn bộ khác nếu không, việc này mất gần như thời gian của trình giải mã... Ít nhất thì tôi đã chuyển dữ liệu trực tiếp ra khỏi mảng rồi, vì vậy sẽ không xảy ra mất mát trừ khi tôi mất các ổ đĩa chính của mình, trên một hệ thống khác trong suốt thời gian đó cái này.... Tôi đoán tôi có thể nói, dữ liệu Cực kỳ Quan trọng, nhưng tôi vẫn có một bản sao của nó, nhưng hiện tại tôi có thể chịu lỗ. Làm rõ phần "quan trọng", Sẽ là KHẨN CẤP nếu mảng ZFS bắt đầu phát ra lỗi, bởi vì bệnh chỉ có một ổ đĩa ở đây và ở đó, chứa các bản sao chính..

Điểm:3
lá cờ cn

Mình đang cần test card Dell SAS Controller của mình.

Giản dị. Thay thế bằng một cái khác. Sau đó, bạn biết thẻ có vấn đề hay không.

Không có sẵn? Chúng ta có thể quay lại "tính chuyên nghiệp" và "các phương pháp hay nhất" trong quy tắc của trang web không? Yêu cầu một công ty làm điều đó (và trả tiền). Kiểm tra thay thế gần như là cách duy nhất (và chắc chắn là hiệu quả nhất) để đảm bảo rằng nó không phải là một bộ phận bị trục trặc.

vì dữ liệu này là quan trọng nhất. Ảnh gia đình của nó từ những năm 1970 và trước, v.v...

Bên cạnh đó là lạc đề ở đây ...

...điều đó KHÔNG QUAN TRỌNG ĐỐI VỚI BẠN. Tôi đi bằng cách "đặt tiền vào miệng". Nếu điều này SẼ quan trọng với bạn, nó sẽ được sao lưu. Ý tôi là, tôi đã học ở trường - hơn 30 năm trước - rằng sao lưu là điều cần suy nghĩ và bắt buộc. Vì vậy, đừng đi kèm với "quan trọng" khi cuối cùng bạn từ chối làm những gì mọi người làm với dữ liệu quan trọng. Bắt đầu triển khai sao lưu - xung quanh có rất nhiều dịch vụ chi phí thấp.

Brian Thomas avatar
lá cờ by
cảm ơn, việc thay thế không hoàn toàn hữu ích, tôi đã cân nhắc điều đó rồi, vợ đã chuẩn bị đón Giáng sinh rồi, chúng tôi đang nói về việc mất dữ liệu ở đây.. đôi khi bạn không thể mua được những thứ nếu bạn hiểu ý tôi.. Nhân tiện, đối với các bản sao lưu của bạn, đây là bản sao lưu!! Tôi đang chơi sớm, tôi không muốn mất dữ liệu chính của mình (trên một ổ đĩa) đồng thời tôi đang sửa mảng. Tôi luôn ngạc nhiên khi ai đó nói ném tiền vào nó. đã được xem xét, hãy tin tôi... Tôi đánh giá cao lời khuyên rằng không có cách nào khác hơn là thay thế nó, nhưng thực sự? Tôi sẽ phải phung phí... ouch...
lá cờ cn
"cảm ơn, việc thay thế không hoàn toàn hữu ích" - vâng, ok. Vì vậy, trong thế giới của bạn, có được một sơ đồ và phòng thí nghiệm điện tử và kiểm tra từng kết nối hàn VÀ chạy thiết bị kiểm tra logic trên tất cả các chip sẽ hữu ích? Cách chuyên nghiệp (bắt buộc theo quy tắc của trang web, cho dù nó có giúp bạn hay không) là cách hiệu quả: thay thế, kiểm tra, sau đó bạn BIẾT tìm ở đâu. Và nó rẻ hơn RẤT NHIỀU so với việc thực hiện một bài kiểm tra thực tế trong nhiều ngày với phòng thí nghiệm - sau đó chỉ để nhận ra rằng một sợi cáp là thứ tào lao. Hoặc nguồn điện của bạn. Đây thậm chí không phải là ném tiền vào nó - điều quan trọng, hãy chuẩn bị sẵn đồ thay thế.
lá cờ cn
Nếu đó là bản sao lưu của bạn, hãy kiểm tra thực tế và bắt đầu sử dụng các dịch vụ sao lưu. AWS, Azure, Backblaze có các dịch vụ khá tốt được đảm bảo hơn RẤT NHIỀU so với Raid dựa trên SAS cấp thấp.
Brian Thomas avatar
lá cờ by
trả một thuê bao hàng tháng thay thế? psshhh. Chia sẻ nó với dữ liệu lớn? psshhh.. Tôi đã làm trong lĩnh vực SRE rồi. Tôi giới thiệu với bạn, ZFS trên máy chủ gia đình như một bản sao lưu... Tôi khá tin rằng thẻ của nó bây giờ vì gần như tất cả các ổ đĩa đều hiển thị xấu. Im goig để đặt lại nó. Tôi cũng không nói về thử nghiệm trong phòng thí nghiệm, tôi đang hỏi liệu có cách nào khác dựa trên phần mềm để kiểm tra nó hay không, điều mà tôi có thể không biết.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.