Máy chủ Ubuntu của tôi tự tắt hôm nay và sau khi xem /var/log/kern.log
đó là bởi vì nó quá nóng:
Ngày 8 tháng 9 07:00:22 ipc2-server kernel: [289498.255583] Hệ thống tệp QNX4 0.2.3 đã được đăng ký.
Ngày 10 tháng 9 20:04:00 ipc2-server kernel: [509336.574882] thermal thermal_zone1: đạt đến nhiệt độ tới hạn (100 C), đang tắt
Ngày 10 tháng 9 20:04:01 ipc2-server kernel: [509337.601860] thermal thermal_zone1: đạt đến nhiệt độ tới hạn (100 C), đang tắt
Điều này có vẻ ổn, ngoại trừ nó xảy ra ngoài hư không. nhìn tôi dữ liệu mạng nhật ký cho thấy nó đã tăng từ nhiệt độ ổn định 44°C đến 70° trong vòng 40 giây tại thời điểm máy chủ tắt (Đường cong màu đỏ dốc xuống từ 70° là trong thời gian máy chủ tắt):
Như bạn có thể thấy chỉ có hai cảm biến báo cáo thay đổi này và mức sử dụng CPU là 20% trước khi tắt máy chủ:
Sau đó, bạn có thể thấy mức tăng nhiệt bình thường do mức sử dụng CPU tăng lên khi tất cả các cảm biến nhiệt độ báo cáo mức tăng nhiệt.
Đây là lần đầu tiên điều này xảy ra với tôi và đưa ra một số câu hỏi.
- Có bất kỳ nhật ký nào khác mà tôi có thể sử dụng để điều tra sự cố này nhằm xác nhận đó là lỗi phần cứng hoặc quá nhiệt thực sự không?
- Cảm biến nhiệt độ bị hỏng theo thời gian có bình thường không?
- Họ có thể được thay thế nếu đó là trường hợp?
- Tôi có thể thay đổi hành vi của Ubuntu để nó tắt máy chủ nếu tất cả các cảm biến nhiệt độ đang báo cáo giá trị cao không?