Điểm:1

AWS Application Load Balancer gỡ bỏ ứng dụng ASP.NET

lá cờ ng

Tôi có một Bộ cân bằng tải ứng dụng AWS được định cấu hình với EC2 và một nhóm tự động thay đổi quy mô. Phiên bản EC2 chạy máy chủ web Windows+IIS. Máy chủ Web kết nối với cơ sở dữ liệu.

Trong một số trường hợp (2 tháng một lần), Kiểm tra tình trạng cho ALB bắt đầu phát hiện ứng dụng là không lành mạnh và gỡ bỏ các phiên bản EC2. Luôn có ít nhất 2 phiên bản đang chạy và điều này xảy ra với tất cả các phiên bản cùng một lúc.Tôi đang cố gắng hiểu tại sao điều này lại xảy ra và tôi không thể tìm thấy bất kỳ nhật ký hữu ích hoặc dấu hiệu nào cho biết điều này đến từ đâu.


Xem cách các phiên bản đột ngột giảm xuống 0 vào ngày 6/12:

trong trường hợp dịch vụ

Phóng to lên:

trong trường hợp dịch vụ, phóng to

Các phiên bản EC2 bị chấm dứt dưới dạng:

lý do chấm dứt

Kiểm tra tình trạng được định cấu hình để ping một trang không không phải truy vấn cơ sở dữ liệu, do đó, nút cổ chai trong cơ sở dữ liệu dường như không phải là nguyên nhân có thể xảy ra.

Khi điều đó xảy ra, thời gian phản hồi tăng vọt:

thời gian phản hồi yêu cầu

Và cũng như được đo bằng NewRelic:

thời gian đáp ứng newrelic

Lưu ý một số điều:

  • tất cả các giai đoạn của phản hồi đều chậm hơn (thời gian Redis, thời gian .NET, v.v.)
  • nó xảy ra với tất cả các máy chủ cùng một lúc, vì vậy không có khả năng xảy ra sự cố với bên trong máy chủ
  • nó luôn xảy ra ngoài giờ làm việc khi tải thấp

Cấu hình Auto-Scaling:

Công suất tối thiểu=2
Công suất tối đa=15
Phân phối phiên bản = 50% Theo yêu cầu, 50% Spot
Bao gồm dung lượng cơ sở Theo yêu cầu=Chỉ định 1 phiên bản đầu tiên là Theo yêu cầu
Chiến lược phân bổ theo yêu cầu=Được ưu tiên
Chiến lược phân bổ giao ngay=Giá thấp nhất - đa dạng hóa trên 10 nhóm giá thấp nhất
Tái cân bằng công suất=Tắt
Instance scale-in protection=Không được bảo vệ khỏi scale-in
Chính sách chấm dứt=Mặc định
Thời gian hồi chiêu mặc định = 300

Cấu hình nhóm mục tiêu:

Giao thức=HTTPS
Đường dẫn=/đường dẫn/đến/đăng nhập/trang
Port=Cổng giao thông
Ngưỡng khỏe mạnh = 2 lần kiểm tra sức khỏe thành công liên tiếp
Ngưỡng không lành mạnh = 4 lần kiểm tra sức khỏe liên tiếp không thành công
Thời gian chờ = 20 giây
Khoảng thời gian = 25 giây
Mã thành công=200
Tim avatar
lá cờ gp
Tim
Nó có thể giống như Windows Update khởi động lại máy chủ sau khi thực hiện vá lỗi không? Để giảm thiểu điều đó, bạn có thể tăng ngưỡng không lành mạnh để giúp các phiên bản có thêm thời gian phục hồi. Tôi tự hỏi liệu bạn có thể bố trí xen kẽ thời gian cập nhật cửa sổ để một phiên bản vẫn hoạt động bình thường hay không. Để chẩn đoán thêm, cách dễ nhất là bằng cách nào đó "cách ly" các máy chủ không đạt kiểm tra sức khỏe để kiểm tra thủ công. Đẩy nhật ký máy chủ vào Nhật ký Cloudwatch có thể hữu ích miễn là nhật ký được đẩy kịp thời.
lá cờ ng
Cảm ơn. Làm thế nào để làm điều đó? Nó không xảy ra thường xuyên và khi nó xảy ra, các trường hợp sẽ bị chấm dứt ngay lập tức ngay khi chúng trở nên không lành mạnh.
Tim avatar
lá cờ gp
Tim
Tôi không biết làm thế nào để làm điều đó, tôi sẽ phải thực hiện một số nghiên cứu mà bạn có thể xem xét. Điều đầu tiên cần làm là thay đổi hình ảnh của bạn để đẩy nhật ký vào nhật ký Cloudwatch càng nhanh càng tốt, theo cách đó ít nhất bạn có thể thấy máy chủ đang làm gì trước khi kiểm tra tình trạng không thành công. Tôi sẽ đẩy các cửa sổ và nhật ký ứng dụng.
lá cờ cn
Với lý do là "tắt máy do người dùng bắt đầu", điều này nghe giống như một bản cập nhật windows hoặc điều gì đó khác đang xảy ra. Hoặc một số tác vụ đã lên lịch khác - bạn có đang làm việc trong một tài khoản thuộc tổ chức AWS có thể có nội dung đang chạy không? Chủ nhân cuối cùng của tôi có một số lambdas sẽ tắt các phiên bản dựa trên thẻ...
lá cờ ng
Không có thứ nào khác đang chạy có thể ảnh hưởng đến AFAIK đó. Windows Update có thể xảy ra nếu tất cả các phiên bản được cập nhật cùng một lúc, nhưng vì một số phiên bản mới được tạo cũng bị lỗi (cho đến 30 phút sau khi tất cả đột nhiên bắt đầu hoạt động), nên có vẻ như rất khó xảy ra.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.