tôi cần được thông báo bởi nagios khi một quá trình trên máy chủ từ xa được khởi động lại.
Điều duy nhất tôi không biết làm là kiểm tra trạng thái quy trình của nó và cách thực hiện?
Bây giờ tôi đã nhận được lệnh nrpe trong máy chủ từ xa này:Â ./check_procs -c 1: -a "/usr/local/yyyprogram/sbin/XXXdaemon" -s Sl
 nhưng quá trình này phải hoạt động mọi lúc, có cơ chế riêng để khởi động lại và đây là điều duy nhất tôi cần biết - chính xác khi nào nó khởi động lại. Tôi nên thêm trạng thái nào của quy trình vào đây và cách nào - ví dụ -s SlRD là được? hay -s Sl -s R -s D được không? Có lẽ tôi có thể làm theo cách khác để có loại thông tin này: OK|CẢNH BÁO|CHƯA BIẾT|CẦN QUAN TRỌNG
MỘT ? Trạng thái duy nhất OK đối với tôi là OK (có nghĩa là đang hoạt động).
Ngoài ra, làm cách nào để giám sát nó từ máy chủ nagios khác, tôi có nên kiểm tra điều này mỗi giây không? Khi dịch vụ khởi động lại, tôi có thể được thông báo sau một hoặc hai phút, nhưng làm sao để biết điều đó đã xảy ra mà không cần kiểm tra nhật ký? PID của dịch vụ này sau khi cơ chế khởi động lại khác với trước đây.
Làm cách nào tôi có thể chắc chắn rằng tất cả trạng thái được bao gồm trong dòng cấu hình lệnh nrpe?
Hãy giúp tôi:)
CHỈNH SỬA
root@server:/usr/local/nagios/libexec# ./check_procs -vv -a "/usr/local/yyyprogram/sbin/xxxdaemon"
CMD: /usr/bin/ps axwwo 'stat uid pid ppid vsz rss pcpu cgroup:256 comm args'
Đã khớp: uid=0 vsz=9412 rss=2804 pid=517515 ppid=1 jid=0 pcpu=0.20 stat=Sl etime= prog=xxxdaemon args=/usr/local/yyyprogram/sbin/xxxdaemon -d /usr/local/ yyychương trình/conf -b
cgroup_hierarchy=(null)