Điểm:1

Tác nhân số liệu GKE ghi nhật ký nhiều lỗi

lá cờ cn

Chúng tôi đã tạo cụm GKE và chúng tôi đang gặp lỗi từ gke-metrics-agent. Các lỗi xuất hiện cứ sau 30 phút. Nó luôn luôn giống nhau 62 lỗi.

Tất cả các lỗi đều có nhãn k8s-pod/k8s-app: "gke-metrics-agent".

lỗi đầu tiên là:

lỗi exporthelper/queued_retry.go:245 Xuất không thành công. Thử bật tùy chọn cấu hình retry_on_failure. {"kind": "exporter", "name": "googlecloud", "error": "rpc error: code = DeadlineExceeded desc = Thời hạn đã hết trước khi hoạt động có thể hoàn tất."  

Lỗi này được theo sau bởi các lỗi này theo thứ tự

  • "go.opentelemetry.io/collector/exporter/exporterhelper.(*retrySender).send"
  • "/go/src/gke-logmon/gke-metrics-agent/vendor/go.opentelemetry.io/collector/exporter/exporterhelper/queued_retry.go:245"
  • go.opentelemetry.io/collector/exporter/exporterhelper.(*metricsSenderWithObservability).send
  • /go/src/gke-logmon/gke-metrics-agent/vendor/go.opentelemetry.io/collector/exporter/exporterhelper/metrics.go:120

Có cca 40 lỗi như thế này. Hai lỗi nổi bật là:

- lỗi exporthelper/queued_retry.go:175 Xuất không thành công. Thả dữ liệu.Hãy thử kích hoạt send_queue để tồn tại những lỗi tạm thời. {"kind": "exporter", "name": "googlecloud", "dropped_items": 19}"

- cảnh báo batchprocessor/batch_processor.go:184 Người gửi không thành công {"kind": "processor", "name": "batch", "error": "rpc error: code = DeadlineExceeded desc = Thời hạn đã hết trước khi thao tác có thể hoàn tất."} "

Tôi đã cố gắng tìm kiếm những lỗi đó trên google nhưng tôi không thể tìm thấy gì. Tôi thậm chí không thể tìm thấy bất kỳ tài liệu nào về gke-metrics-agent.

Những điều tôi đã thử:

  • kiểm tra hạn ngạch
  • cập nhật GKE lên phiên bản mới hơn (phiên bản hiện tại là 1.21.3-gke.2001)
  • cập nhật các nút
  • vô hiệu hóa tất cả các quy tắc tường lửa
  • cấp tất cả quyền cho các nút k8s

Tôi có thể cung cấp thêm thông tin về cụm kubernetes của chúng tôi nhưng tôi không biết thông tin nào có thể quan trọng để giải quyết vấn đề này.

Srividya avatar
lá cờ cn
**âVượt quá thời hạnâ** là [sự cố đã biết](https://github.com/census-ecosystem/opencensus-go-exporter-stackdriver/releases/tag/v0.13.6) và bắt đầu từ Kubernetes 1.16, các chỉ số được gửi đến Giám sát đám mây thông qua tác nhân GKE Metrics được xây dựng dựa trên [Open Telemetry](https://opentelemetry.io/). Bạn có thể cung cấp chi tiết về phiên bản bạn đang sử dụng cho trình xuất OpenCensus và kiểm tra bằng cách cập nhật phiên bản trình xuất OpenCensus làm tăng thời gian chờ và cho tôi biết liệu nó có hoạt động không?
Melchy avatar
lá cờ cn
Cảm ơn vì sự trả lời. Có vẻ như tôi không biết cách cập nhật trình xuất OpenCensus. Tôi đã tìm thấy gke-metrics-agent pod trong kubernetes và tôi đã cố gắng thay đổi chú thích components.gke.io/component-version: 0.6.0 thành 0.13.6. Điều này đã khởi động lại các nhóm nhưng lỗi là kiểu dáng. Mình cũng đã thử chuyển giám sát sang mở đo từ xa nhưng không biết làm thế nào. Có thể thiết lập điều này bằng cách sử dụng địa hình không? Tôi chỉ tìm thấy cài đặt theo dõi_dịch vụ được đặt thành theo dõi.googleapis.com/kubernetes theo mặc định.
Srividya avatar
lá cờ cn
Bạn có thể kiểm tra liên kết này để biết bản cập nhật của trình xuất [OpenCensus](https://github.com/census-ecosystem/opencensus-go-exporter-stackdriver/releases/tag/v0.13.6) và [OpenTelemetry](https:/ /github.com/GoogleCloudPlatform/opentelemetry-operations-java) hoạt động trên đám mây của Google?
Maciek Leks avatar
lá cờ kw
Nó đã kết thúc như thế nào? Tôi quan sát hành vi tương tự với 1.20.10-gke.301.
Melchy avatar
lá cờ cn
Tôi vẫn không biết phải làm gì. Tôi đã kiểm tra liên kết đến OpenCensus và tôi có thể thấy rằng có phiên bản mới nhưng tôi vẫn không biết làm thế nào để cập nhật nó. Có lẽ tôi nên xóa trình xuất mặc định và tạo trình xuất tùy chỉnh với phiên bản mới?
Điểm:1
lá cờ cn

Đã quá hạn chótâ là sự cố đã biết, các chỉ số được gửi tới Giám sát đám mây thông qua tác nhân GKE Metrics được xây dựng dựa trên Open Telemetry. Hiện tại có hai cách giải quyết như sau để giải quyết vấn đề:

1.Cập nhật hết giờ.

Kể từ khi Phiên bản mới bao gồm một thay đổi làm tăng thời gian chờ mặc định từ 5 lên 12 giây. Vì vậy, bạn có thể cần xây dựng lại và triển khai lại khối lượng công việc với phiên bản mới có thể khắc phục lỗi rpc này.

2.Để sử dụng các phiên bản GKE cao hơn, sự cố này đã được khắc phục với các phiên bản gke-metrics-agent: 1.18.6-gke.6400+ 1.19.3-gke.600+ 1.20.0-gke.600+.

Chandra Kiran Pasumarti avatar
lá cờ fr
@Melchy, Nếu bạn nghĩ rằng câu trả lời trên đã giúp ích cho bạn, vui lòng cân nhắc việc chấp nhận nó (âï¸).
Điểm:0
lá cờ cn

Nếu bạn vẫn nhìn thấy những lỗi đó, vui lòng xem lại số liệu của bạn. chủ yếu kubernetes.io/container/... số liệu cho các vùng chứa chạy trên cùng một nút với tác nhân gke-metrics-agent ghi lại các lỗi. Bạn có thấy những lỗ hổng trong các số liệu không nên có không?

Lỗi vượt quá ngữ cảnh thỉnh thoảng có thể xảy ra, nhưng không nên xảy ra với số lượng lớn. Nó có thể là sự cố mạng hoặc chỉ là những lỗi không thường xuyên. Bạn có bất kỳ chính sách mạng/quy tắc tường lửa nào có thể ngăn tác nhân gke-metrics nói chuyện với Giám sát đám mây không?

Rất tiếc, bạn không thể tự mình cập nhật phép đo từ xa bên trong gke-metrics-agent. Phiên bản cụm mới hơn cũng có thể hữu ích vì nó cập nhật tác nhân, vì vậy hãy thử nâng cấp cụm của bạn nếu có thể. Nếu sự cố ảnh hưởng đến các chỉ số của bạn, hãy liên hệ với bộ phận hỗ trợ.

Melchy avatar
lá cờ cn
Xin chào, cảm ơn vì phản hồi của anh ấy, tôi không thấy lỗi nữa. Sau khi cập nhật cụm k8s và đợi cca một tuần, các lỗi đột nhiên biến mất. Tôi không biết tại sao.
kwiesmueller avatar
lá cờ cn
Sau đó, bạn có thể đã nhận được phiên bản gke-metrics-agent mới có bản sửa lỗi.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.