Điểm:0

Lỗi phần cứng ở CPU hoặc RAM, phải làm sao?

lá cờ cn

Tôi có một máy chủ, thỉnh thoảng báo cáo Lỗi phần cứng cho hệ điều hành, nhưng nếu không thì chạy mà không có bất kỳ sự cố đáng chú ý nào.

Hôm nay tôi tìm thấy cái này khi đang đi ngang qua màn hình gắn trên nó.nhập mô tả hình ảnh ở đây

Bất cứ ai có thể cho tôi biết điều này có nghĩa là gì? Đây có phải là điều tôi cần phải lo lắng không? Có tệp nhật ký nào tôi có thể xem xét sâu hơn không? Vài tuần trước, tôi nhận thấy rằng một trong các thanh RAM không được hệ thống phát hiện, nó chỉ báo cáo 112 GB thay vì 128 GB. Bây giờ nó hiển thị chính xác mặc dù.

Để biết thêm thông tin, máy chủ này có các thành phần chính sau:

  • Supermicro MBD-H11DSi-NT-B
  • 2xAMD Epyc 7301
  • 128GB của Kingston Server Premier KSM26RD8/16HAI DDR4-2666 regECC
  • Unraid như hệ điều hành
Điểm:5
lá cờ cn

Bất cứ ai có thể cho tôi biết điều này có nghĩa là gì?

Bạn có một vấn đề về phần cứng cần được giải quyết - có thể là bộ nhớ. đánh máy MC15_STATUS[Hết|CE vào google, lần truy cập thứ hai là từ diễn đàn mở mà tôi cũng có thể hữu ích.

Đây có phải là điều tôi cần phải lo lắng không?

Chắc chắn rồi! Bỏ qua các lỗi phần cứng khi gặp nguy hiểm (dữ liệu) của bạn. Tôi sẽ ngừng sản xuất hệ thống đó mà không mất thời gian hỏi internet xem đây có phải là vấn đề mà tôi cần lo lắng hay không.

Sử dụng một cái gì đó như memtest86 để kiểm tra và chẩn đoán vị trí của vấn đề.

lá cờ cn
Chà, không có máy chủ "sản xuất" nào khác. Vì vậy, vâng. Cần đợi đến sau Giáng sinh cho đến khi tôi có thể tắt nó và chạy thử nghiệm trên nó.
Điểm:3
lá cờ za

Trong trường hợp của bạn, tôi đã đọc nhật ký sự kiện IPMI BMC, ví dụ: với ipmiutil sel. Nó sẽ hiển thị chi tiết về các lỗi, trong trường hợp của tôi, nó thậm chí còn hiển thị vị trí khe cắm bộ nhớ cụ thể nơi mô-đun bị lỗi cư trú.

lá cờ cn
Tôi chỉ có IPMITool, đối với tôi, không liệt kê bất kỳ sự kiện nào liên quan đến bộ nhớ.
Nikita Kipriyanov avatar
lá cờ za
Có IPMITool từ trang web Supermicro, rất thiếu tính năng. Thật tiếc là nó thậm chí còn không biết cách kết nối với *cục bộ* IPMI BMC qua SMBus.Ngoài ra còn có [gói`ipmitool`](https://github.com/ipmitool/ipmitool), giải thích sai thông báo nhật ký sự kiện (không giải mã chúng hoàn toàn hoặc thậm chí giải mã sai). Thông tin chính xác nhất về PSU và các sự kiện tình trạng phần cứng khác mà tôi chỉ có thể nhận được từ [`ipmiutil`](http://ipmiutil.sourceforge.net/) (nhưng, tôi phải thừa nhận, ipmitool dễ sử dụng hơn).

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.