Chúng tôi có một triển khai được định cấu hình với HPA dựa trên chỉ số CPU. Nó có thể hoạt động tốt trong nhiều ngày, tăng và giảm tỷ lệ nhóm. Và sau đó tại một số điểm, có vẻ như nó bỏ qua số liệu và chia tỷ lệ cho một số nhóm nhỏ. Thông thường, chúng tôi giải quyết vấn đề này bằng cách đặt thủ công số lượng nhóm tối thiểu có thể xử lý lưu lượng. Và sau một hoặc hai giờ, nó bắt đầu mở rộng trở lại.
Đây là kết quả của kubectl mô tả hpa
lệnh tại thời điểm khi autoscaler không hoạt động đối với chúng tôi:
Tên: my-router-hpa
Không gian tên: mặc định
Nhãn: nhãn1=nhãn1
nhãn2=nhãn2
Chú thích: <không có>
Tạo Dấu thời gian: Thứ tư, ngày 15 tháng 9 năm 2021 12:19:16 +0000
Tham khảo: Triển khai/my-router-v001
Số liệu: ( hiện tại / mục tiêu )
cpu tài nguyên trên các nhóm (theo phần trăm yêu cầu): 188% (943m) / 85%
Bản sao tối thiểu: 10
Bản sao tối đa: 100
Nhóm triển khai: 10 hiện tại / 10 mong muốn
Điều kiện:
Loại Trạng thái Lý do Thông báo
---- ------ ------ -------
Kích thước đề xuất của AbleToScale True ReadyForNewScale khớp với kích thước hiện tại
ScalingActive True ValidMetricFound, HPA đã có thể tính toán thành công số lượng bản sao từ mức sử dụng tài nguyên cpu (phần trăm yêu cầu)
ScalingLimited True TooFewReplicas số bản sao mong muốn nhỏ hơn số bản sao tối thiểu
Sự kiện:
Nhập Lý do Tuổi từ Tin nhắn
---- ------ ---- ---- -------
Bình thường Thành côngRescale 60m theo chiều ngang-pod-autoscaler Kích thước mới: 15; lý do: sử dụng tài nguyên cpu (phần trăm yêu cầu) trên mục tiêu
Bình thường Thành côngRescale 50m (x2 trên 158m) vertical-pod-autoscaler Kích thước mới: 8; lý do: sử dụng tài nguyên cpu (phần trăm yêu cầu) dưới mục tiêu
Bình thường Thành côngRescale 48m theo chiều ngang-pod-autoscaler Kích thước mới: 7; lý do: sử dụng tài nguyên cpu (phần trăm yêu cầu) dưới mục tiêu
Bình thường Thành côngRescale 43m (x2 trên 105m) vertical-pod-autoscaler Kích thước mới: 8; lý do: sử dụng tài nguyên cpu (phần trăm yêu cầu) trên mục tiêu
Bình thường Thành côngRescale 43m theo chiều ngang-pod-autoscaler Kích thước mới: 12; lý do: sử dụng tài nguyên cpu (phần trăm yêu cầu) trên mục tiêu
Bình thường Thành côngRescale 37m (x2 trên 48m) vertical-pod-autoscaler Kích thước mới: 6; lý do: sử dụng tài nguyên cpu (phần trăm yêu cầu) dưới mục tiêu
Bình thường Thành côngRescale 34m (x2 trên 47m) vertical-pod-autoscaler Kích thước mới: 5; lý do: sử dụng tài nguyên cpu (phần trăm yêu cầu) dưới mục tiêu
Bình thường Thành côngRescale 29m (x2 trên 46m) vertical-pod-autoscaler Kích thước mới: 4; lý do: sử dụng tài nguyên cpu (phần trăm yêu cầu) dưới mục tiêu
Bình thường Thành côngRescale 28m theo chiều ngang-pod-autoscaler Kích thước mới: 2; lý do: sử dụng tài nguyên cpu (phần trăm yêu cầu) dưới mục tiêu
Bình thường Thành côngRescale 16m (x2 trên 106m) vertical-pod-autoscaler Kích thước mới: 1; lý do: sử dụng tài nguyên cpu (phần trăm yêu cầu) dưới mục tiêu
Bình thường Thành côngRescale 15m theo chiều ngang-pod-autoscaler Kích thước mới: 5; lý do: sử dụng tài nguyên cpu (phần trăm yêu cầu) trên mục tiêu
Bình thường Thành côngRescale 13m (x2 trên 148m) vertical-pod-autoscaler Kích thước mới: 10; lý do: sử dụng tài nguyên cpu (phần trăm yêu cầu) trên mục tiêu
Bình thường Thành côngRescale 13m (x3 trên 123m) vertical-pod-autoscaler Kích thước mới: 16; lý do: sử dụng tài nguyên cpu (phần trăm yêu cầu) trên mục tiêu
Bình thường Thành côngRescale 8m3s (x2 trên 129m) vertical-pod-autoscaler Kích thước mới: 10; lý do: sử dụng tài nguyên cpu (phần trăm yêu cầu) dưới mục tiêu
Nó báo cáo số liệu: "188% (943m) / 85%. Nhưng sự kiện cuối cùng đang nói "dưới chỉ tiêu".
Bạn có thể giúp tôi hiểu hành vi của GKE autoscaler hoặc đề xuất cách gỡ lỗi không?