Bạn cần phải suy nghĩ và phán đoán để hiểu môi trường của mình và lập kế hoạch năng lực. Máy chủ này đang hoạt động tốt có ý nghĩa gì đối với tổ chức? Gợi ý: người dùng quan tâm đến việc "nó chậm" chứ không phải việc sử dụng bộ nhớ hoặc CPU. Bạn có thể đẩy việc sử dụng đi bao xa mà vẫn có biên độ an toàn thích hợp?
Bạn dường như đang sử dụng liếc nhìn, một trình giám sát tài nguyên dựa trên psutil của Python. Thoạt nhìn (ha) nó có UX tốt, nguồn dữ liệu lành mạnh và cho bạn biết về các cảnh báo, thật tuyệt. Cảnh báo bộ nhớ mặc định là 50% 70% 90%, đối với tôi là khá bảo thủ và leo thang từ quá đủ đến liên quan đến áp lực bộ nhớ nặng nề. Kiểm tra xem điều này có hợp lý trong môi trường của bạn không, định cấu hình các ngưỡng khác nhau nếu cần.
Nhưng phần trăm của số liệu bộ nhớ là gì? Trên Linux, liếc nhìn đến psutil. psutil tính toán tổng số trừ có sẵn. Đó là một điều hợp lý để làm, bộ nhớ cache và những thứ có thể phục hồi dễ dàng khác được loại trừ khỏi tỷ lệ. Mặc dù có các tính toán dự phòng kế thừa cho các nhân cũ, nhưng cách đo lường này có thể khác nhau.
Trong các cảnh báo mức tiêu thụ bộ nhớ "cao" này, hãy thu thập dữ liệu thô /proc/meminfo
xuất và phân tích nó. Có thể tiêu thụ bộ nhớ tồn tại bên ngoài không gian địa chỉ của quá trình. Bao gồm các phân đoạn bộ nhớ dùng chung hoặc cấu trúc dữ liệu hạt nhân.
Máy chủ này là một hệ thống systemd chạy docker và một vài thứ khác. Nhận mức sử dụng bộ nhớ cho mỗi nhóm bằng cách chạy systemd-cgtop --order=bộ nhớ
và thống kê docker
Thông thường, số liệu thống kê theo nhóm sẽ dễ hiểu hơn so với việc tính toán nhiều quy trình trên hệ thống. Có thể các vùng chứa vẫn tồn tại, mặc dù hầu hết các quy trình của chúng đã dừng.