Điểm:0

Máy chủ Linux nrpe nagios giám sát trạng thái quy trình check_procs - cần thông tin, khi quy trình được khởi động lại

lá cờ mx

tôi cần được thông báo bởi nagios khi một quá trình trên máy chủ từ xa được khởi động lại.

Điều duy nhất tôi không biết làm là kiểm tra trạng thái quy trình của nó và cách thực hiện?

Bây giờ tôi đã nhận được lệnh nrpe trong máy chủ từ xa này: ./check_procs -c 1: -a "/usr/local/yyyprogram/sbin/XXXdaemon" -s Sl nhưng quá trình này phải hoạt động mọi lúc, có cơ chế riêng để khởi động lại và đây là điều duy nhất tôi cần biết - chính xác khi nào nó khởi động lại. Tôi nên thêm trạng thái nào của quy trình vào đây và cách nào - ví dụ -s SlRD là được? hay -s Sl -s R -s D được không? Có lẽ tôi có thể làm theo cách khác để có loại thông tin này: OK|CẢNH BÁO|CHƯA BIẾT|CẦN QUAN TRỌNGMỘT ? Trạng thái duy nhất OK đối với tôi là OK (có nghĩa là đang hoạt động).

Ngoài ra, làm cách nào để giám sát nó từ máy chủ nagios khác, tôi có nên kiểm tra điều này mỗi giây không? Khi dịch vụ khởi động lại, tôi có thể được thông báo sau một hoặc hai phút, nhưng làm sao để biết điều đó đã xảy ra mà không cần kiểm tra nhật ký? PID của dịch vụ này sau khi cơ chế khởi động lại khác với trước đây.

Làm cách nào tôi có thể chắc chắn rằng tất cả trạng thái được bao gồm trong dòng cấu hình lệnh nrpe?

Hãy giúp tôi:)

CHỈNH SỬA

root@server:/usr/local/nagios/libexec# ./check_procs -vv -a "/usr/local/yyyprogram/sbin/xxxdaemon"
CMD: /usr/bin/ps axwwo 'stat uid pid ppid vsz rss pcpu cgroup:256 comm args'
Đã khớp: uid=0 vsz=9412 rss=2804 pid=517515 ppid=1 jid=0 pcpu=0.20 stat=Sl etime= prog=xxxdaemon args=/usr/local/yyyprogram/sbin/xxxdaemon -d /usr/local/ yyychương trình/conf -b
 cgroup_hierarchy=(null)
Điểm:0
lá cờ cn

Đầu tiên và quan trọng nhất, nếu bạn quan tâm đến quá trình đã chạy trong bao lâu, check_procs không cung cấp chức năng đó như tôi có thể thấy từ -h cờ, vì vậy tôi không chắc tại sao bạn lại cho rằng điều đó xảy ra. Hay đó không phải là những gì bạn đang cố kiểm tra?

Nếu bạn muốn kiểm tra một tiến trình đã chạy trong bao lâu, bạn không cần plugin cho nó. Ví dụ này lấy PID của netdata, cung cấp cho bạn thời đại, greps để chỉ hiển thị số và sử dụng xargs để xóa khoảng trắng thừa xung quanh số:

$ ps -p $(pidof /usr/sbin/netdata) -o etimes | grep -E "[1-9].*" | xargs
65805

$ systemctl khởi động lại dữ liệu mạng

$ ps -p $(pidof /usr/sbin/netdata) -o etimes | grep -E "[1-9].*" | xargs
10

Tất cả những gì bạn phải làm là viết một tập lệnh shell để kiểm tra xem giá trị có thấp hơn một số nhất định hay không, nếu có vấn đề thoát 1, sau đó chạy tập lệnh đó qua NRPE từ Nagios.

Kamil Bu avatar
lá cờ mx
Không, tôi không cần thông tin nó đã chạy được bao lâu. Tôi cần biết và được nagios thông báo rằng nó đã khởi động lại. Và tôi không biết tôi nên theo dõi những cờ nào và cách nào để lấy thông tin này.
pzkpfw avatar
lá cờ cn
kiểm tra etimes sẽ cho bạn biết nó đã khởi động lại chưa và tôi chỉ cho bạn biết cách kiểm tra. Điều này không trả lời câu hỏi của bạn theo cách nào? Bạn đã thử những gì cho đến nay?

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.