Điểm:0

Máy chủ từ xa dường như đã chết, cách khắc phục sự cố?

lá cờ us

Tôi có một máy chủ Ubuntu đang chạy từ xa trong một văn phòng khác. Nó chết đi mấy lần mà không hiểu nguyên nhân. Đó là một máy chủ yêu cầu dịch vụ bên ngoài thông qua api. Qua đã chết Ý tôi là nó vẫn chạy nhưng chỉ dừng hoạt động. Mạng của máy chủ dường như cũng ngoại tuyến và quét lan không tìm thấy.

Nó nằm sau một bộ định tuyến văn phòng và chạy kernel 18.04 4.15.0-147-generic. Không ai tại chỗ có tài khoản trên máy chủ này.

Đây là những gì tôi đã cố gắng.

  1. lần khởi động lại cuối cùng kết quả:
khởi động lại hệ thống boot 4.15.0-151-gen Thứ năm ngày 22 tháng 7 14:49 vẫn chạy
khởi động lại hệ thống khởi động 4.15.0-147-gen Thứ tư ngày 21 tháng 7 15:48 vẫn đang chạy
khởi động lại hệ thống khởi động 4.15.0-147-gen Thứ tư ngày 21 tháng 7 14:05 - 15:48 (01:43)
khởi động lại hệ thống khởi động 4.15.0-147-gen Thứ bảy ngày 17 tháng 7 18:24 - 15:48 (3+21:24)
khởi động lại hệ thống boot 4.15.0-147-gen Thứ 5 ngày 15 tháng 7 17:26 - 15:48 (5+22:22)

22 Th07 14:49 là một lần khởi động lại mà tôi đã yêu cầu nhân viên tại chỗ thực hiện. Mất điện vào ngày 21 tháng 7.

  1. /var/log/syslog
Ngày 22 tháng 7 09:08:50 localhost service_start.sh[946]: INFO:launcher:myjob kết thúc đầu ra cho 2.
Ngày 22 tháng 7 09:08:50 localhost service_start.sh[946]: INFO:launc Ngày 22 tháng 7 14:50:05 localhost systemd[1]: Bắt đầu Flush Journal để lưu trữ liên tục...
Ngày 22 tháng 7 14:50:05 localhost systemd[1]: Bắt đầu daemon siêu dữ liệu LVM2.
Ngày 22 tháng 7 14:50:05 localhost systemd[1]: Bắt đầu Tải/Lưu Hạt giống Ngẫu nhiên.
Ngày 22 tháng 7 14:50:05 localhost lvm[443]: 2 (các) ổ đĩa logic trong nhóm ổ đĩa "localhost-vg" được giám sát
Ngày 22 tháng 7 14:50:05 localhost systemd[1]: Đã bắt đầu Đặt bố cục bàn phím bảng điều khiển.
Ngày 22 tháng 7 14:50:05 localhost systemd-modules-load[436]: Đã chèn mô-đun 'iscsi_tcp'

Hệ thống đã ngoại tuyến sau khi 22 Th7 09:08:50. 22 Thg7 14:50:05 là khởi động lại được đề cập trước đó.

Có vẻ như hệ thống không được khởi động lại hoặc tắt máy nếu không sẽ có một số nhật ký chỉ ra điều đó. Và cũng không có lỗi hệ thống đăng nhập vào nhật ký hệ thống.

Có hai thiết lập công việc cron của người dùng để chạy cứ sau 5 và 10 phút và có các mục chạy cron trong syslog xung quanh 22 Th7 09:05:01 trước khi hệ thống trở nên chết xung quanh 22 Th7 09:08:50.

Hiện tại không có nhân viên kỹ thuật tại chỗ và tôi chỉ có thể truy cập máy chủ qua teamview từ một máy tính tại chỗ khác.

Tôi đã chạy htop và tải hệ thống nhẹ.

Tôi đang thua lỗ ngay bây giờ. Tôi nên kiểm tra những gì khác trong phiên teamview tiếp theo của mình?

Điểm:0
lá cờ br

Bạn có khá nhiều biến số khi mô tả vấn đề của mình, chủ yếu là cơ sở hạ tầng mạng tại vị trí lưu trữ máy chủ. Nếu đây là máy chủ của tôi, bước đầu tiên sẽ là ssh vào nó và thực hiện:

đuôi -f /var/log/syslog

Việc này hoặc giám sát một trong các tệp nhật ký khác có thể làm sáng tỏ nguyên nhân khiến máy chủ không phản hồi.

Vì bạn nói rằng máy chủ vẫn đang chạy mặc dù nó đã chết (không rõ điều đó có nghĩa là gì), điều này có nghĩa là kết nối mạng bị mất nên đó là điều tôi muốn tập trung theo dõi.

Bạn có thể thấy rằng cách nhanh nhất để giải quyết vấn đề này là khắc phục sự cố này tại chỗ thông qua mạng LAN cục bộ.

lá cờ us
Nó cảm thấy chết vì nó có vẻ ngoại tuyến khi đang làm teamview. Tôi không thể ping nó hoặc ssh với nó. Nó đã trực tuyến trở lại sau khi khởi động lại. Tôi sẽ thiết lập sar để theo dõi hệ thống, đó là một điều tôi sẽ thử. Tôi ước mình có thể kết nối màn hình với máy chủ..
jones0610 avatar
lá cờ br
Câu trả lời của tôi là làm chính xác điều đó: ssh vào máy chủ từ bất kỳ vị trí nào trong khi máy chủ vẫn hoạt động bình thường. Xem liệu nhật ký hệ thống có bắt được bất cứ điều gì cho thấy có vấn đề hay không. Từ mô tả ban đầu của bạn, tôi cho rằng đã có điều gì đó xảy ra gây mất kết nối mạng.... điều này có thể hoặc không phải do sự cố máy chủ hoặc chỉ là do điều gì đó đang diễn ra tại trang web lưu trữ. Nếu câu trả lời của tôi giúp bạn khắc phục sự cố này, tôi đánh giá cao việc bình chọn.
lá cờ us
xin lỗi đã đi làm xa trong một tuần. Tôi đã sao lưu nhật ký hệ thống. dựa trên các bản ghi được ghi lại trước và sau khi sự cố xảy ra, nó trông giống như một khoảng trống. không có gì ở giữa xảy ra. Như đã đề cập trước đây, tôi sẽ triển khai một hệ thống giám sát để hỗ trợ khắc phục sự cố này.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.