Cách đây một thời gian, một sự cố lạ đã xảy ra trong cụm kubernetes của chúng tôi. Chúng tôi có một mạng chứa các máy chủ windows (máy chủ web, máy chủ thư, v.v.) và cụm kubernetes chạy Rancher v2.6.0.
Cụm đang giao tiếp với máy chủ windows thông qua các yêu cầu http và smtp/imap để gửi và đọc email. Hiện tại, các yêu cầu http ngẫu nhiên không thành công với thông báo lỗi không có đường đến máy chủ
. Nó dường như chỉ giới hạn ở các kết nối trong mạng và không ảnh hưởng đến các yêu cầu đối với apis của bên thứ ba. Và lỗi không phải lúc nào cũng xảy ra. Rất nhiều yêu cầu được thực hiện mà không gặp bất kỳ sự cố nào và một số không thành công. Tôi đã triển khai chính sách thử lại để thử lại cùng một yêu cầu vài giây sau đó và đôi khi nó hoạt động trong lần thử lại đầu tiên, đôi khi là lần thứ hai và đôi khi không hoạt động.
Tôi đã cố gắng tìm giải pháp trên google nhưng tôi không thể tìm ra bất kỳ điều gì, đặc biệt là vì chỉ một phần trăm trong số tất cả các yêu cầu bị ảnh hưởng.
Quản trị viên hệ thống của chúng tôi duy trì mạng và máy chủ windows không thể xác định bất kỳ sự cố nào hoặc thậm chí không thể nhìn thấy các yêu cầu. Vì vậy, tôi đoán là các yêu cầu không rời khỏi cụm .. nếu điều đó hợp lý.
Thật không may, cụm kubernetes từng được duy trì bởi một đồng nghiệp hiện không còn khả dụng nữa. Tôi rất biết ơn những gợi ý về nơi bắt đầu tìm kiếm giải pháp.