Điểm:2

Lỗi định kỳ của Google App Engine

lá cờ in

Gần đây, chúng tôi đã nhận thấy rằng dự án Google App Engine của chúng tôi gặp lỗi định kỳ cứ sau 25 giờ 10 phút (1510 phút) trong ba ngày liên tiếp mà không có lý do rõ ràng.

Trong sự cố, chúng tôi đã thấy các yêu cầu không thành công với mã 499 (Yêu cầu đã đóng của ứng dụng khách) sau thời gian yêu cầu rất dài (10 giây). Các yêu cầu thường mất vài trăm mili giây hoặc đôi khi là 2-3 giây, nhưng không bao giờ gần 10 giây. Vào thời điểm đó, chúng tôi không nhận thấy bất kỳ sự gia tăng nào về lưu lượng truy cập và chúng tôi không có bất kỳ công việc nền nào đang chạy. Tất cả CPU và bộ nhớ đều ổn cho đến khi sự cố bắt đầu, sau đó CPU tăng lên một chút (ví dụ: từ khoảng 10% lên 60%) và thậm chí kích hoạt mở rộng quy mô tạm thời từ 3 lên 5 máy chủ.

Dự án là API nhanh của Python hình ảnh được triển khai trong môi trường linh hoạt, tối thiểu 3, tối đa 12 máy chủ tại thời điểm đó.

Ví dụ về lỗi từ nhật ký

Thời điểm xảy ra những sự cố này rất thú vị vì chúng xảy ra gần như chính xác cách nhau 25 giờ 10 phút. Chúng tôi đã có một vài triển khai trong những ngày này vào các thời điểm khác nhau, không có mối tương quan nào với thời gian hoạt động của máy chủ.

Dấu thời gian bên dưới là theo giờ UTC:

2021-11-17 17:43
2021-11-18 18:53
2021-11-19 20:03

Có ai thấy điều gì tương tự xảy ra trên Google App Engine hoặc có lẽ với hình ảnh API nhanh được đề cập không?

Điểm:0
lá cờ us

Tuy nhiên các 499 mã trạng thái HTTP chỉ ra rằng khách hàng đã đóng yêu cầu. Một lý do có thể cho điều đó là khách hàng của bạn đã bị ngắt kết nối vào các khung thời gian mà bạn chỉ định.

Tôi khuyên bạn nên kiểm tra xem các phiên bản linh hoạt của Máy ứng dụng của bạn có hoạt động tốt vào những thời điểm đó hay không bằng cách kiểm tra nhật ký Cloud Logging và đặc biệt là kiểm tra sức khỏe, bạn cũng sử dụng bảng điều khiển App Engine để xem liệu các phiên bản có được điều chỉnh với mức sử dụng CPU hoặc RAM cao hay không. Nhưng vấn đề này dường như nằm ở phía máy khách, vì vậy nếu có thể đáng để kiểm tra trạng thái từ nơi bạn đưa ra yêu cầu.

Tôi cũng chia sẻ tài liệu này về khắc phục lỗi phân phát linh hoạt của Máy ứng dụng mà tôi tin rằng nó có thể hữu ích cho bạn.

robert avatar
lá cờ in
Cảm ơn bạn vì câu trả lời. 499 không phải là nguyên nhân, mà là tác dụng phụ. Các máy khách bị ngắt kết nối khi các yêu cầu của họ hết thời gian chờ, vì các phản hồi đột ngột không được gửi lại. Những GET 499 mà bạn thấy là từ kiểm tra sức khỏe và cũng đã hết thời gian. Chúng tôi đã điều tra Nhật ký đám mây và tất cả các số liệu có thể có trong GCP và hoàn toàn không tìm thấy mối tương quan nào mà chúng tôi có thể tìm thấy. Mối tương quan duy nhất là về thời gian, nó xảy ra chính xác 1510 phút cách nhau 3 ngày liên tiếp, giống như trong lịch trình.
robert avatar
lá cờ in
Tôi cũng đã đi vào ngõ cụt với Trình theo dõi vấn đề của Google, họ đã đề xuất gửi yêu cầu hỗ trợ, điều mà chúng tôi có thể cần thực hiện sau cùng nếu chúng tôi không thể tìm thấy bất kỳ điều gì khác.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.