Điểm:0

Máy chủ đóng băng ngẫu nhiên và chỉ khởi động với khởi động nguội

lá cờ cn

Tôi đang gặp phải một vấn đề cực kỳ kỳ lạ liên quan đến một máy chủ, nó bị đóng băng/treo ngẫu nhiên mà không có đầu ra trên máy chủ và không phản hồi với các phím ngắn và yêu cầu khởi động nguội, khi khởi động với khởi động nguội, không có lỗi nào trên màn hình khởi động.

Nó hoàn toàn không bị đóng băng khi tải nặng, với sự cố khoảng 9-20% cpu wheb, tải trung bình khoảng 2-5 (12 lõi cpu) và ram 128gb

Chúng tôi đã thử kiểm tra nhật ký, không có gì hiển thị như hoảng loạn hạt nhân hoặc bất kỳ thứ gì liên quan đến chính vấn đề đó.

Trong tất cả các lần đóng băng sau khi khởi động nguội, khi chúng tôi kiểm tra nhật ký, chúng tôi thấy máy gặt OOM bình thường giết chết các procces php (người dùng đạt đến giới hạn) nhưng không có gì quá lạm dụng, nhưng luôn ở trên OOM, Đôi khi, khi máy chủ đóng băng trong nhật ký, bạn sẽ thấy thời gian hiện tại và đôi khi giống như thời gian nó hiển thị sau thời điểm hiện tại của sự cố vài dòng từ ngày cũ hơn và bị treo.

Nhật ký không có gì có thể xác định có liên quan đến phần mềm hay tải nặng, chỉ hoạt động bình thường, đây là máy nâng cấp từ máy cũ, chạy ổn định bao năm.. Việc đóng băng là ngẫu nhiên, có thể là sau khi máy chủ hoạt động được một tuần, hoặc hai ngày hoặc ba tuần, v.v...

Ngoài ra, chúng tôi đã cố gắng giải nén kết xuất vmcore của máy chủ bị đóng băng nhưng vẫn không có gì bắt được ở đó.

Nó chỉ bị đóng băng mà không phải đầu ra màn hình, nhưng máy chủ vẫn chạy nhưng không thể đặt trước được, không thể truy cập ssh không có gì, còn kvm như tôi đã nói không hiển thị đầu ra nào trên màn hình.

Nó có thể liên quan đến phần cứng có thể bị lỗi? Vì hệ thống treo của tôi là do RAM bị lỗi?

Tôi vô cùng mất mát với vấn đề này .. Cảm ơn

Điểm:0
lá cờ nz
  1. Đảm bảo nhiệt độ tốt, CPU/RAM/CHIPSET/DISKS, tôi cho rằng bạn là người dùng linux vì OOM, hãy cài đặt cảm biến lm, và kiểm tra nhiệt độ với cảm biến chỉ huy.
  2. Đó là RAM của bạn, hãy chạy memtest86, lưu ý rằng quá trình kiểm tra đầy đủ trên 128GB có thể mất một tuần.
lá cờ cn
Vâng dựa trên Linux, bạn nghĩ nó liên quan đến nhiệt độ? Hay phần cứng? Tôi đã suy nghĩ lấy dữ liệu di chuyển máy chủ mới và sau đó chuyển nó sang giá đỡ cũ để loại trừ khả năng có phần cứng
Egidijus avatar
lá cờ nz
Nếu không có dấu hiệu rõ ràng trong phần mềm, thì rất có thể đó là phần cứng. Nhiệt độ là phần cứng (phần mềm không thể cảm nhận được cảm giác ấm áp).
lá cờ cn
Tôi thực sự nghi ngờ nó liên quan đến nhiệt độ vì máy chủ không tải nặng khi bị treo, tôi không nghĩ rằng cpu có thể đạt tới 95 degrro với tải cpu là 9% hoặc 20%, vì nó đạt được mức đó hàng ngày và chưa có gì
Điểm:0
lá cờ cn

Chúng tôi vừa chuyển sang một máy chủ khác, nhưng sau khi tìm kiếm rất nhiều và thử gỡ lỗi rất nhiều, có vẻ như sự cố phần cứng liên quan đến bo mạch chủ khi tôi kiểm tra trong một số diễn đàn liên quan đến bo mạch chủ từ asrock rack và cpus ryzen. Tôi quản lý để tìm một vài trường hợp xung quanh cùng một vấn đề ngay cả khi windows 10 hoặc máy chủ windows bị màn hình xanh chết chóc. vì bộ phận hỗ trợ hệ điều hành đã đề xuất trong trường hợp này là không thay đổi nhãn hiệu bo mạch chủ vì có thể gặp rủi ro khi bị từ chối khởi động và chuyển sang một máy chủ mới như chúng tôi đã làm. sau khi chúng tôi di chuyển sang máy chủ mới, tất cả các vấn đề đã được giải quyết. vì vậy tôi đoán nó liên quan đến vấn đề phần cứng chứ không phải phần mềm.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.