Điểm:0

Máy chủ Fedora 34 gặp sự cố ngẫu nhiên cứ sau vài phút trên HP ProLiant DL380e G8

lá cờ ar

Rất tiếc, tôi đang gặp sự cố với máy chủ HP ProLiant DL380e G8 của mình chạy Fedora Server 34. Tôi nghi ngờ đây là lỗi bộ nhớ hoặc DIMM đang bị hỏng, tuy nhiên tôi không chắc.

Phản hồi rất được hoan nghênh!

tôi đã chạy nhật kýctl -r, trả về đầu ra sau trong liên kết PasteBin (một đoạn mã có vẻ khác thường): https://Pastebin.com/KPUZHceD

Tất cả trợ giúp và ý tưởng được đánh giá cao!

Trân trọng

Chỉnh sửa: Đáp lại bình luận của @Michael Hampton: Đầu ra được đăng ở đây:

<27>Ngày 7 tháng 9 17:03:51 mcelog: Vị trí: SOCKET:0 CHANNEL:3 DIMM:1 []
Ngày 07 tháng 9 17:03:51 turbo mcelog[1304]: Vị trí: Ổ CẮM:0 KÊNH:3 DIMM:1 []
Ngày 07 tháng 9 17:03:51 turbo mcelog[1303]: <27>Ngày 7 tháng 9 17:03:51 mcelog: số lượng lỗi bộ nhớ DIMM đã sửa vượt quá ngưỡng: 10 trong 24 giờ
Ngày 07 tháng 9 17:03:51 turbo mcelog[1303]: số lượng lỗi bộ nhớ DIMM đã sửa vượt quá ngưỡng: 10 trong 24h
Ngày 07 tháng 9 17:03:51 turbo mcelog[1304]: <27>Ngày 7 tháng 9 17:03:51 mcelog: Vị trí: SOCKET:0 CHANNEL:3 DIMM:1 []
Ngày 07 tháng 9 17:03:51 turbo mcelog[1304]: Vị trí: Ổ CẮM:0 KÊNH:3 DIMM:1 []
Ngày 07 tháng 9 17:03:51 turbo mcelog[1303]: <27>Ngày 7 tháng 9 17:03:51 mcelog: số lượng lỗi bộ nhớ DIMM đã sửa vượt quá ngưỡng: 10 trong 24h
Ngày 07 tháng 9 17:03:51 turbo mcelog[1303]: số lượng lỗi bộ nhớ DIMM đã sửa vượt quá ngưỡng: 10 trong 24 giờ
07 tháng 9 17:03:51 turbo mcelog[1067]: Nhà cung cấp CPUID Intel Family 6 Model 45 Bước 7
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MICROCODE 71a
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 2 SOCKETID 0
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: STATUS c80000c400800093 MCGSTATUS 0
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MemCtrl:
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Giao dịch: Lỗi đọc bộ nhớ
07 tháng 9 17:03:51 turbo mcelog[1067]: MCA: BỘ ĐIỀU KHIỂN BỘ NHỚ RD_CHANNEL3_ERR
07 tháng 9 17:03:51 turbo mcelog[1067]: Đăng ký MCi_MISC hợp lệ
07 tháng 9 17:03:51 turbo mcelog[1067]: Đã sửa lỗi
07 tháng 9 17:03:51 turbo mcelog[1067]: Lỗi tràn
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Trạng thái MCi:
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Trạng thái MCG:
07 tháng 9 17:03:51 turbo mcelog[1067]: TIME 1631027031 Thứ ba ngày 7 tháng 9 17:03:51 2021
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MISC d22131295c834800
07 tháng 9 17:03:51 turbo mcelog[1067]: CPU 1 BANK 11
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MCE 7
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Sự kiện phần cứng. Đây không phải là một lỗi phần mềm.
07 tháng 9 17:03:51 turbo mcelog[1067]: Nhà cung cấp CPUID Intel Family 6 Model 45 Bước 7
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MICROCODE 71a
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 3 SOCKETID 0
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: STATUS c80000c400800093 MCGSTATUS 0
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MemCtrl:
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Giao dịch: Lỗi đọc bộ nhớ
07 tháng 9 17:03:51 turbo mcelog[1067]: MCA: BỘ ĐIỀU KHIỂN BỘ NHỚ RD_CHANNEL3_ERR
07 tháng 9 17:03:51 turbo mcelog[1067]: Đăng ký MCi_MISC hợp lệ
07 tháng 9 17:03:51 turbo mcelog[1067]: Đã sửa lỗi
07 tháng 9 17:03:51 turbo mcelog[1067]: Lỗi tràn
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Trạng thái MCi:
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Trạng thái MCG:
07 tháng 9 17:03:51 turbo mcelog[1067]: TIME 1631027031 Thứ ba ngày 7 tháng 9 17:03:51 2021
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MISC d22131295c834800
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: CPU 13 NGÂN HÀNG 11
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MCE 6
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Sự kiện phần cứng. Đây không phải là một lỗi phần mềm.
07 tháng 9 17:03:51 turbo mcelog[1067]: Nhà cung cấp CPUID Intel Family 6 Model 45 Bước 7
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MICROCODE 71a
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 0 SOCKETID 0
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: STATUS c80000c400800093 MCGSTATUS 0
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MemCtrl:
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Giao dịch: Lỗi đọc bộ nhớ
07 tháng 9 17:03:51 turbo mcelog[1067]: MCA: BỘ ĐIỀU KHIỂN BỘ NHỚ RD_CHANNEL3_ERR
07 tháng 9 17:03:51 turbo mcelog[1067]: Đăng ký MCi_MISC hợp lệ
07 tháng 9 17:03:51 turbo mcelog[1067]: Đã sửa lỗi
07 tháng 9 17:03:51 turbo mcelog[1067]: Lỗi tràn
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Trạng thái MCi:
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Trạng thái MCG:
07 tháng 9 17:03:51 turbo mcelog[1067]: TIME 1631027031 Thứ ba ngày 7 tháng 9 17:03:51 2021
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MISC d22131295c834800
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: CPU 0 NGÂN HÀNG 11
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MCE 5
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Sự kiện phần cứng. Đây không phải là một lỗi phần mềm.
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Chạy trình kích hoạt `dimm-error-trigger' (người báo cáo: memdb)
07 tháng 9 17:03:51 turbo mcelog[1067]: Nhà cung cấp CPUID Intel Family 6 Model 45 Bước 7
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MICROCODE 71a
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 6 SOCKETID 0
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: STATUS c80000c400800093 MCGSTATUS 0
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MemCtrl:
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Giao dịch: Lỗi đọc bộ nhớ
07 tháng 9 17:03:51 turbo mcelog[1067]: MCA: BỘ ĐIỀU KHIỂN BỘ NHỚ RD_CHANNEL3_ERR
07 tháng 9 17:03:51 turbo mcelog[1067]: Đăng ký MCi_MISC hợp lệ
07 tháng 9 17:03:51 turbo mcelog[1067]: Đã sửa lỗi
07 tháng 9 17:03:51 turbo mcelog[1067]: Lỗi tràn
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Trạng thái MCi:
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Trạng thái MCG:
07 tháng 9 17:03:51 turbo mcelog[1067]: TIME 1631027031 Thứ ba ngày 7 tháng 9 17:03:51 2021
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MISC d22131295c834800
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: CPU 3 NGÂN HÀNG 11
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MCE 4
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Sự kiện phần cứng. Đây không phải là một lỗi phần mềm.
07 tháng 9 17:03:51 turbo mcelog[1067]: Nhà cung cấp CPUID Intel Family 6 Model 45 Bước 7
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MICROCODE 71a
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID và SOCKETID 0
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: TÌNH TRẠNG c801c00400800093 MCGSTATUS 0
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MemCtrl:
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Giao dịch: Lỗi đọc bộ nhớ
07 tháng 9 17:03:51 turbo mcelog[1067]: MCA: BỘ ĐIỀU KHIỂN BỘ NHỚ RD_CHANNEL3_ERR
07 tháng 9 17:03:51 turbo mcelog[1067]: Đăng ký MCi_MISC hợp lệ
07 tháng 9 17:03:51 turbo mcelog[1067]: Đã sửa lỗi
07 tháng 9 17:03:51 turbo mcelog[1067]: Lỗi tràn
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Trạng thái MCi:
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Trạng thái MCG:
07 tháng 9 17:03:51 turbo mcelog[1067]: TIME 1631027031 Thứ ba ngày 7 tháng 9 17:03:51 2021
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MISC d2213fa689118800
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: CPU 5 NGÂN HÀNG 11
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MCE 3
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Sự kiện phần cứng. Đây không phải là một lỗi phần mềm.
07 tháng 9 17:03:51 turbo mcelog[1067]: Nhà cung cấp CPUID Intel Family 6 Model 45 Bước 7
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MICROCODE 71a
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 5 SOCKETID 0
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: STATUS c801bd8400800093 MCGSTATUS 0
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MemCtrl:
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Giao dịch: Lỗi đọc bộ nhớ
07 tháng 9 17:03:51 turbo mcelog[1067]: MCA: BỘ ĐIỀU KHIỂN BỘ NHỚ RD_CHANNEL3_ERR
07 tháng 9 17:03:51 turbo mcelog[1067]: Đăng ký MCi_MISC hợp lệ
07 tháng 9 17:03:51 turbo mcelog[1067]: Đã sửa lỗi
07 tháng 9 17:03:51 turbo mcelog[1067]: Lỗi tràn
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Trạng thái MCi:
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Trạng thái MCG:
07 tháng 9 17:03:51 turbo mcelog[1067]: TIME 1631027031 Thứ ba ngày 7 tháng 9 17:03:51 2021
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MISC d2213f0649118800
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: CPU 14 NGÂN HÀNG 11
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MCE 2
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Sự kiện phần cứng. Đây không phải là một lỗi phần mềm.
07 tháng 9 17:03:51 turbo mcelog[1067]: Nhà cung cấp CPUID Intel Family 6 Model 45 Bước 7
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MICROCODE 71a
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 1 SOCKETID 0
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: TÌNH TRẠNG c801bec400800093 MCGSTATUS 0
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MemCtrl:
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Giao dịch: Lỗi đọc bộ nhớ
07 tháng 9 17:03:51 turbo mcelog[1067]: MCA: BỘ ĐIỀU KHIỂN BỘ NHỚ RD_CHANNEL3_ERR
07 tháng 9 17:03:51 turbo mcelog[1067]: Đăng ký MCi_MISC hợp lệ
07 tháng 9 17:03:51 turbo mcelog[1067]: Đã sửa lỗi
07 tháng 9 17:03:51 turbo mcelog[1067]: Lỗi tràn
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Trạng thái MCi:
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Trạng thái MCG:
07 tháng 9 17:03:51 turbo mcelog[1067]: TIME 1631027031 Thứ ba ngày 7 tháng 9 17:03:51 2021
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MISC d221196e09118800
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: CPU 12 NGÂN HÀNG 11
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MCE 1
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Sự kiện phần cứng. Đây không phải là một lỗi phần mềm.
07 tháng 9 17:03:51 turbo mcelog[1067]: Nhà cung cấp CPUID Intel Family 6 Model 45 Bước 7
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MICROCODE 71a
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 0 SOCKETID 0
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: STATUS c0107b4000010093 MCGSTATUS 0
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Giao dịch: Lỗi đọc bộ nhớ
07 tháng 9 17:03:51 turbo mcelog[1067]: MCA: BỘ ĐIỀU KHIỂN BỘ NHỚ RD_CHANNEL3_ERR
07 tháng 9 17:03:51 turbo mcelog[1067]: Đã sửa lỗi
07 tháng 9 17:03:51 turbo mcelog[1067]: Lỗi tràn
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: STATUS c0107b4000010093 MCGSTATUS 0
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Giao dịch: Lỗi đọc bộ nhớ
07 tháng 9 17:03:51 turbo mcelog[1067]: MCA: BỘ ĐIỀU KHIỂN BỘ NHỚ RD_CHANNEL3_ERR
07 tháng 9 17:03:51 turbo mcelog[1067]: Đã sửa lỗi
07 tháng 9 17:03:51 turbo mcelog[1067]: Lỗi tràn
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Trạng thái MCi:
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Trạng thái MCG:
07 tháng 9 17:03:51 turbo mcelog[1067]: TIME 1631027031 Thứ ba ngày 7 tháng 9 17:03:51 2021
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: CPU 0 NGÂN HÀNG 5
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: MCE 0
Ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: Sự kiện phần cứng. Đây không phải là một lỗi phần mềm.
ngày 07 tháng 9 17:03:51 turbo mcelog[1067]: mcelog: mcelog đã đọc: Lỗi đầu vào/đầu ra
Ngày 07 tháng 9 17:03:51 turbo kernel: ERST: [Cảnh báo phần sụn]: Phần sụn không phản hồi kịp thời.
07 tháng 9 17:03:51 kernel turbo: mce: [Lỗi phần cứng]: Các sự kiện kiểm tra máy được ghi lại
07 tháng 9 17:03:51 kernel turbo: mce: [Lỗi phần cứng]: Các sự kiện kiểm tra máy được ghi lại
07 tháng 9 17:03:51 kernel turbo: mce_notify_irq: 6 cuộc gọi lại bị chặn
Michael Hampton avatar
lá cờ cz
Tôi không thể nhìn thấy bất cứ điều gì bạn đưa vào pastebin. Có thể trang web của họ đang hoạt động. Trong mọi trường hợp, nó có thực sự quá dài để được đăng ở đây không? Chúng tôi muốn mọi thứ liên quan đến câu hỏi được đăng trong câu hỏi bất cứ khi nào có thể.
lá cờ br
Đó không phải là cấu hình được hỗ trợ.
jonasclaes avatar
lá cờ ar
@Chopper3 bạn có thể giải thích cho tôi tại sao không?
Michael Hampton avatar
lá cờ cz
Tôi nghĩ điều đầu tiên tôi sẽ làm là loại bỏ bộ nhớ bị lỗi. Nhật ký không xác định rõ ràng nó.
djdomi avatar
lá cờ za
`Location: SOCKET:0 CHANNEL:3 DIMM:1` xóa ram này chưa bao giờ thấy lỗi rõ ràng như vậy và @ chopper3 vui lòng giải thích Tôi không thấy vấn đề nào ở câu hỏi này ngay cả khi máy chủ khá cũ
lá cờ br
@jonasclaes vì ​​tất cả các máy chủ đều có danh sách các hệ điều hành được hỗ trợ và phiên bản được hỗ trợ và bạn có cấu hình không được hỗ trợ (https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=&cad =rja&uact=8&ved=2ahUKEwiN8NmwrO3yAhUMgVwKHTRiDxoQFnoECAsQAQ&url=https%3A%2F%2Fh20195.www2.hpe.com%2Fv2%2Fgetdocument.aspx%3Fdocname%3Dc04128166&usg=AOvVaw2CoUn_gMG6ueVHh8DAmk)ZE - trang
jonasclaes avatar
lá cờ ar
@Chopper3 tôi hiểu rồi. Tuy nhiên, RHEL là doanh nghiệp và Fedora là cộng đồng. Nhưng cảm ơn vì đã chỉ ra điều đó.
Điểm:0
lá cờ ar

Bài đăng này đã được khắc phục bằng cách tháo 2 thanh RAM bị lỗi khỏi máy chủ và gắn lại CPU, vì điều đó cũng không tiếp xúc tốt.

Cảm ơn vì sự giúp đỡ!

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.