Điểm:0

Ubuntu Server 20.04 đóng băng vài ngày một lần

lá cờ br

Giới thiệu ngắn

Kể từ một vài ngày, máy chủ vật lý của tôi cứ sau 2 hoặc 3 ngày lại bị đóng băng. Tôi đã thay thế tất cả phần cứng, bao gồm cả ổ đĩa và đã cài đặt Ubuntu mới.

Chi tiết & Kết quả

Không có may mắn cho đến nay khi tìm kiếm các tệp nhật ký:

  • Mọi tệp nhật ký syslog hoặc kernel đều hiển thị ^@^@^@^@^@^@^@^@^@^@^@^@ tại thời điểm đóng băng. Trước đó, không có hành vi đáng ngờ nào trong ít nhất 15 phút trước thời điểm đóng băng.
  • nhật ký tạp chí từ lần khởi động lại cuối cùng có thể được tìm thấy đây. Do mình chạy UFW nên hơi lằng nhằng. Các đóng băng xảy ra ở khoảng. 09:45h.
  • Tôi có máy chủ trong giám sát của tôi. Không có sự gia tăng CPU, RAM, DiskIO, Dung lượng ổ đĩa cũng như lưu lượng trên giao diện mạng ngay trước khi xảy ra tình trạng đóng băng. CPU, RAM và dung lượng ổ đĩa cũng không vượt quá giới hạn.
  • Khi máy chủ bị treo, tôi không thể làm gì trên bảng điều khiển nữa. Tôi cần khởi động lại máy chủ (khôi phục cài đặt gốc) để máy chủ hoạt động trở lại trong vài ngày.
Những gì tôi chạy trên máy chủ:
  • nginx
  • php-fpm
  • ấu trùng 8
  • uww
  • fail2ban
  • mysql 8
Các hành động tôi đã thực hiện, được tìm thấy trong các bài đăng tương tự:
  • Điều chỉnh RAM trống tối thiểu:
    • sysctl -w vm.min_free_kbytes=235929
    • sysctl -w vm.swappiness=5

Vì hầu hết các nhật ký hiển thị một số dấu hiệu ngẫu nhiên, tôi đánh giá cao bất kỳ trợ giúp nào về việc cần làm tiếp theo. Tôi không biết những gì khác tôi có thể kiểm tra. Cảm ơn cho bất kỳ lời khuyên và giúp cung cấp!

Điểm:1
lá cờ id
  1. Hãy thử các phiên bản nhân khác (nhân của các phiên bản Ubuntu khác, ví dụ: 18.04, 22.04, bản dựng nhân chính) và xem sự cố có còn tiếp diễn hay không. Nếu máy chủ của bạn không gặp sự cố với các phiên bản nhân khác, thì bạn đang xử lý một lỗi nhân ảnh hưởng đến ngày 20.04.
  2. Có vẻ như ngay cả khi hạt nhân nhận thấy lỗi, nó cũng không thể ghi vấn đề vào nhật ký hệ thống. Kiểm tra xem bạn có thấy hạt nhân hoảng loạn trên bảng điều khiển hay không, nhưng nếu màn hình bị tắt, bạn không thể bật lại với hạt nhân bị lỗi. Vì vậy, bạn nên tắt màn hình tắt do không hoạt động. Ngoài ra, bạn có thể thử sử dụng crashkernel (kump) để biết thêm thông tin về sự cố; hoặc bạn có thể chuyển hướng đầu ra của bàn điều khiển sang cổng nối tiếp và ghi nhật ký đầu ra bằng một thiết bị bên ngoài, nhưng thực tế tôi chưa bao giờ thử điều đó.
  3. Bạn cũng có thể kiểm tra các bản phát hành Ubuntu khác nhau hoàn toàn hoặc có thể là các bản phân phối Linux khác nhau, nhưng thường thì điều đó là không cần thiết (sự cố thường do nhân và trình điều khiển của nó gây ra, bản phân phối được xây dựng xung quanh nó hiếm khi có vấn đề). Bạn thậm chí có thể thử một hệ điều hành khác, chẳng hạn như FreeBSD hoặc Windows, để xem liệu máy tính có tiếp tục bị đóng băng hay không – nếu tình trạng đóng băng cũng xảy ra với các hệ điều hành khác, thì chắc chắn bạn đã gặp sự cố về phần cứng.
  4. Chạy kiểm tra để phát hiện các mô-đun RAM có thể bị lỗi. Memtest cần toàn quyền kiểm soát máy tính (bạn phải khởi động nó thay vì hệ điều hành của bạn), vì vậy máy chủ của bạn không thể hoạt động trong khi thử nghiệm đang chạy.
  5. Thật không may, lỗi phần cứng có thể khá ngấm ngầm khi không rõ vấn đề là gì. Tôi không biết bạn đã thay thế những gì, nhưng bạn thậm chí có thể có một bo mạch chủ, CPU hoặc PSU bị lỗi. Một khi máy tính của tôi cứ tắt ngẫu nhiên. Lúc đầu, tôi không biết nguyên nhân là gì nhưng sau đó hóa ra dây nguồn của tôi có vấn đề về tiếp xúc - thay thế nó đã hết vấn đề.
k304 avatar
lá cờ br
Cảm ơn vì đã trả lời. Tôi đã thay thế tất cả phần cứng (thực tế là máy chủ được lưu trữ tại một số công ty của Pháp, vì vậy họ nói với tôi rằng họ đã thay thế toàn bộ phần cứng). Bao gồm cả CPU, Mainboard, v.v. Vì vậy, có lẽ không phải là vấn đề phần cứng, họ đã tìm thấy RAM & Mainboard bị lỗi trong máy chủ cũ. Tôi đã thử các phiên bản kernel khác nhau. Và thậm chí đã cập nhật kernel gần đây vì đã có phiên bản mới hơn. Tôi sẽ xem `kdump` và xem nó sẽ báo cáo gì cho tôi.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.