Điểm:0

Máy chủ số liệu đang ở trong CrashLoopBackOff với bản cài đặt MỚI của rke

lá cờ th

Tôi đã cài đặt ít nhất 10 lần trong một ngày qua, nhưng lần nào cũng như vậy Mọi thứ đều chạy tốt nhưng máy chủ số liệu nằm trong CrashLoopBackOff

những gì tôi hiểu phần bên dưới bị thiếu trong tệp YAML của nhóm và cần thêm vào Triển khai.

Tôi chưa quen với Kubernetes, tôi có 2 câu hỏi

  1. Tôi đang sử dụng rke để cài đặt cụm trang trại, vậy tại sao cài đặt dưới đây sẽ bị thiếu trong các nhóm để khởi động máy chủ số liệu?

    Lệnh: /metrics-server
    --cert-dir=/tmp
    --secure-port=4443
    --kubelet-preferred-address-types=InternalIP
    --kubelet-không an toàn-tls

  2. cách tốt nhất để thêm những dòng đó là gì, tôi còn khá mới nên cần một số hướng dẫn

Thông tin cụm:

Phiên bản Kubernetes:
[rke@rke19-master1 ~]$ kubectl nhận các nút
TÊN TÌNH TRẠNG VAI TRÒ TUỔI PHIÊN BẢN
192.168.0.56 Mặt phẳng điều khiển sẵn sàng,etcd 17m v1.19.10
192.168.0.57 Mặt phẳng điều khiển sẵn sàng,etcd 17m v1.19.10
192.168.0.58 Mặt phẳng điều khiển sẵn sàng,etcd 17m v1.19.10
192.168.0.59 Công nhân sẵn sàng 17m v1.19.10
192.168.0.60 Công nhân sẵn sàng 17m v1.19.10
[rke@rke19-master1 ~]$

[rke@rke19-master1 ~]$ kubectl get pods metrics-server-5b6d79d4f4-ggl57 -n kube-system -o yaml

phiên bản api: v1
loại: Vỏ
metadata:
  chú thích:
    cni.projectcalico.org/podIP: 10.42.4.3/32
    cni.projectcalico.org/podIPs: 10.42.4.3/32
  tạoDấu thời gian: "2021-08-16T23:00:42Z"
  GenerName: số liệu-máy chủ-5b6d79d4f4-
  nhãn:
    ứng dụng k8s: máy chủ số liệu
    pod-template-hash: 5b6d79d4f4
  Trường được quản lý:
  - phiên bản api: v1
    loại trường: TrườngV1
    các trườngV1:
      f: siêu dữ liệu:
        f:generateName: {}
        f:nhãn:
          .: {}
          f:k8s-app: {}
          f:pod-template-hash: {}
        f:ownerTham khảo:
          .: {}
          k:{"uid":"fb15b257-4a9d-478b-b461-8b61c165e3db"}:
            .: {}
            f:apiVersion: {}
            f:blockOwnerDeletion: {}
            f: bộ điều khiển: {}
            f: loại: {}
            f:tên: {}
            f:uid: {}
      f: thông số kỹ thuật:
        f:mối quan hệ:
          .: {}
          f:nodeAffinity:
            .: {}
            f:requiredDuringDuringSchedulingIgnoredDuringExecution:
              .: {}
              f:nodeSelectorĐiều khoản: {}
        f: thùng chứa:
          k:{"tên":"máy chủ số liệu"}:
            .: {}
            f:args: {}
            f:hình ảnh: {}
            f:imagePullPolicy: {}
            f:livenessProbe:
              .: {}
              f:failureThreshold: {}
              f:httpNhận:
                .: {}
                f: đường dẫn: {}
                f: cổng: {}
                f: lược đồ: {}
              f:periodSeconds: {}
              f:successThreshold: {}
              f:timeoutSeconds: {}
            f:tên: {}
            f: cổng:
              .: {}
              k:{"containerPort":4443,"giao thức":"TCP"}:
                .: {}
                f:containerPort: {}
                f:tên: {}
                f: giao thức: {}
            f:readinessThăm dò:
              .: {}
              f:failureThreshold: {}
              f:httpNhận:
                .: {}
                f: đường dẫn: {}
                f: cổng: {}
                f: lược đồ: {}
              f:periodSeconds: {}
              f:successThreshold: {}
              f:timeoutSeconds: {}
            f: tài nguyên: {}
            f: securityBối cảnh:
              .: {}
              f:readOnlyRootFilesystem: {}
              f:runAsNonRoot: {}
              f:runAsUser: {}
            f:terminationMessagePath: {}
            f:terminationMessagePolicy: {}
            f:volumeMount:
              .: {}
              k:{"mountPath":"/tmp"}:
                .: {}
                f:mountPath: {}
                f:tên: {}
        f:dnsPolicy: {}
        f:enableServiceLinks: {}
        f:priorityClassName: {}
        f:restartPolicy: {}
        f:schedulerName: {}
        f: securityContext: {}
        f:serviceAccount: {}
        f:serviceAccountName: {}
        f:terminationGracePeriodSeconds: {}
        f: dung sai: {}
        f: tập:
          .: {}
          k:{"tên":"tmp-dir"}:
            .: {}
            f:emptyDir: {}
            f:tên: {}
    quản lý: kube-controller-manager
    hoạt động: Cập nhật
    thời gian: "2021-08-16T23:00:42Z"
  - phiên bản api: v1
    loại trường: TrườngV1
    các trườngV1:
      f: siêu dữ liệu:
        f: chú thích:
          .: {}
          f:cni.projectcalico.org/podIP: {}
          f:cni.projectcalico.org/podIPs: {}
    quản lý: calico
    hoạt động: Cập nhật
    thời gian: "2021-08-16T23:00:47Z"
  - phiên bản api: v1
    loại trường: TrườngV1
    các trườngV1:
      f:tình trạng:
        f: điều kiện:
          k:{"type":"ContainersReady"}:
            .: {}
            f:lastProbeTime: {}
            f:lastTransitionTime: {}
            f:tin nhắn: {}
            f:lý do: {}
            f: trạng thái: {}
            f:type: {}
          k:{"type":"Khởi tạo"}:
            .: {}
            f:lastProbeTime: {}
            f:lastTransitionTime: {}
            f: trạng thái: {}
            f:type: {}
          k:{"loại":"Sẵn sàng"}:
            .: {}
            f:lastProbeTime: {}
            f:lastTransitionTime: {}
            f:tin nhắn: {}
            f:lý do: {}
            f: trạng thái: {}
            f:type: {}
        f:containerStatuses: {}
        f:hostIP: {}
        f:giai đoạn: {}
        f:podIP: {}
        f:podIP:
          .: {}
          k:{"ip":"10.42.4.3"}:
            .: {}
            f:ip: {}
        f:startTime: {}
    quản lý: kubelet
    hoạt động: Cập nhật
    thời gian: "2021-08-16T23:00:54Z"
  tên: số liệu-máy chủ-5b6d79d4f4-ggl57
  không gian tên: hệ thống kube
  chủ Tham khảo:
  - apiVersion: ứng dụng/v1
    blockOwnerDeletion: true
    bộ điều khiển: đúng
    loại: Bản sao
    tên: số liệu-máy chủ-5b6d79d4f4
    uid: fb15b257-4a9d-478b-b461-8b61c165e3db
  resourceVersion: "5775"
  selfLink: /api/v1/namespaces/kube-system/pods/metrics-server-5b6d79d4f4-ggl57
  uid: af8d4e07-aa3f-4efe-8169-feb37cfd97df
thông số kỹ thuật:
  sự giống nhau:
    nút mối quan hệ:
      bắt buộcDuringDuringSchedulingIgnoredDuringExecution:
        nútSelectorĐiều khoản:
        - biểu thức khớp:
          - khóa: beta.kubernetes.io/os
            toán tử: NotIn
            giá trị:
            - các cửa sổ
          - khóa: nút-role.kubernetes.io/worker
            toán tử: Tồn tại
  hộp đựng:
  - lập luận:
    - --cert-dir=/tmp
    - --secure-port=4443
    - --kubelet-không an toàn-tls
    - --kubelet-preferred-address-types=InternalIP
    - --logtostderr
    hình ảnh: 192.168.0.35:5000/rancher/metrics-server:v0.3.6
    imagePullPolicy: IfNotPresent
    livenessProbe:
      failThreshold: 3
      httpNhận:
        đường dẫn: /livez
        cổng: https
        lược đồ: HTTPS
      chu kỳGiây: 10
      ngưỡng thành công: 1
      thời gian chờGiây: 1
    tên: máy chủ số liệu
    cổng:
    - Cảng container: 4443
      tên: https
      giao thức: TCP
    sẵn sàngThăm dò:
      failThreshold: 3
      httpNhận:
        đường dẫn: /readyz
        cổng: https
        lược đồ: HTTPS
      chu kỳGiây: 10
      ngưỡng thành công: 1
      thời gian chờGiây: 1
    tài nguyên: {}
    bối cảnh bảo mật:
      readOnlyRootFilesystem: đúng
      runAsNonRoot: đúng
      runAsUser: 1000
    terminationMessagePath: /dev/termination-log
    chấm dứtMessagePolicy: Tập tin
    khối lượngMount:
    - đường dẫn gắn kết: /tmp
      tên: tmp-dir
    - mountPath: /var/run/secrets/kubernetes.io/serviceaccount
      tên: số liệu-máy chủ-token-78b6h
      chỉ đọc: đúng
  dnsPolicy: ClusterFirst
  enableServiceLinks: đúng
  tên nút: 192.168.0.59
  preemptionPolicy: PreemptLowerPriority
  ưu tiên: 2000000000
  priorityClassName: hệ thống-cụm-quan trọng
  restartPolicy: Luôn luôn
  tên bộ lập lịch: bộ lập lịch mặc định
  bảo mậtContext: {}
  serviceAccount: máy chủ số liệu
  serviceAccountName: máy chủ số liệu
  chấm dứtGracePeriodSeconds: 30
  dung sai:
  - hiệu ứng: NoExecute
    toán tử: Tồn tại
  - hiệu ứng: NoSchedule
    toán tử: Tồn tại
  khối lượng:
  - trốngDir: {}
    tên: tmp-dir
  - tên: số liệu-máy chủ-token-78b6h
    bí mật:
      chế độ mặc định: 420
      secretName: số liệu-máy chủ-mã thông báo-78b6h
trạng thái:
  điều kiện:
  - LastProbeTime: null
    lastTransitionTime: "2021-08-16T23:00:43Z"
    trạng thái: "Đúng"
    loại: Đã khởi tạo
  - LastProbeTime: null
    lastTransitionTime: "2021-08-16T23:00:43Z"
    thông báo: 'các thùng chứa có trạng thái chưa sẵn sàng: [máy chủ số liệu]'
    lý do: ContainerNotReady
    trạng thái: "Sai"
    loại: Sẵn sàng
  - LastProbeTime: null
    lastTransitionTime: "2021-08-16T23:00:43Z"
    thông báo: 'các thùng chứa có trạng thái chưa sẵn sàng: [máy chủ số liệu]'
    lý do: ContainerNotReady
    trạng thái: "Sai"
    loại: Containersẵn sàng
  - LastProbeTime: null
    lastTransitionTime: "2021-08-16T23:00:43Z"
    trạng thái: "Đúng"
    loại: PodScheduled
  containerStatus:
  - containerID: docker://344c587a7edd3abed035c12bfc16b9dbd0da3f26ba9101aa246bf4793648d380
    hình ảnh: 192.168.0.35:5000/rancher/metrics-server:v0.3.6
    imageID: docker-pullable://192.168.0.35:5000/rancher/metrics-server@sha256:c9c4e95068b51d6b33a9dccc61875df07dc650abbf4ac1a19d58b4628f89288b
    trạng thái cuối cùng:
      chấm dứt:
        containerID: docker://e28b6812965786cd2f520a20dd2adf6cbe9c6a720de905ce16992ed0f4cd7c9e
        mã thoát: 2
        đã hoàn thànhTại: "2021-08-16T23:21:47Z"
        lý do: Lỗi
        startedAt: "2021-08-16T23:21:18Z"
    tên: máy chủ số liệu
    sẵn sàng: sai
    khởi động lạiCount: 12
    bắt đầu: đúng
    tiểu bang:
      đang chạy:
        startedAt: "2021-08-16T23:26:52Z"
  IP máy chủ: 192.168.0.59
  giai đoạn: Chạy
  podIP: 10.42.4.3
  podIP:
  - IP: 10.42.4.3
  qosClass: BestEffort
  startTime: "2021-08-16T23:00:43Z"


[rke@rke19-master1 ~]$ kubectl description pods metrics-server-5b6d79d4f4-ggl57 -n kube-system
Tên: số liệu-máy chủ-5b6d79d4f4-ggl57
Không gian tên: hệ thống kube
Ưu tiên: 2000000000
Tên lớp ưu tiên: system-cluster-critical
Nút: 192.168.0.59/192.168.0.59
Thời gian bắt đầu: Thứ ba, ngày 17 tháng 8 năm 2021 00:00:43 +0100
Nhãn: k8s-app=metrics-server
                      pod-template-hash=5b6d79d4f4
Chú thích: cni.projectcalico.org/podIP: 10.42.4.3/32
                      cni.projectcalico.org/podIPs: 10.42.4.3/32
Tình trạng: Đang chạy
IP: 10.42.4.3
IP:
  IP: 10.42.4.3
Được kiểm soát bởi: ReplicaSet/metrics-server-5b6d79d4f4
Hộp đựng:
  số liệu-máy chủ:
    ID vùng chứa: docker://74ea122709aefc07b89dcbd3514e86fdff9874627b87413571d1624a55c32baa
    Hình ảnh: 192.168.0.35:5000/rancher/metrics-server:v0.3.6
    ID hình ảnh: docker-pullable://192.168.0.35:5000/rancher/metrics-server@sha256:c9c4e95068b51d6b33a9dccc61875df07dc650abbf4ac1a19d58b4628f89288b
    Cổng: 4443/TCP
    Cổng máy chủ: 0/TCP
    lập luận:
      --cert-dir=/tmp
      --secure-port=4443
      --kubelet-không an toàn-tls
      --kubelet-preferred-address-types=InternalIP
      --logtostderr
    Trạng thái: Chờ đợi
      Lý do: CrashLoopBackOff
    Trạng thái cuối cùng: Đã chấm dứt
      Lý do: Lỗi
      Mã thoát: 2
      Bắt đầu: Thứ ba, ngày 17 tháng 8 năm 2021 00:27:18 +0100
      Hoàn thành: Thứ ba, ngày 17 tháng 8 năm 2021 00:27:47 +0100
    Sẵn sàng: Sai
    Số lần khởi động lại: 13
    Sống động: http-get https://:https/livez delay=0s timeout=1s period=10s #success=1 #failure=3
    Sẵn sàng: http-get https://:https/readyz delay=0s timeout=1s period=10s #success=1 #failure=3
    Môi trường: <không>
    gắn kết:
      /tmp từ tmp-dir (rw)
      /var/run/secrets/kubernetes.io/serviceaccount từ metrics-server-token-78b6h (ro)
Điều kiện:
  Loại Trạng thái
  Khởi tạo đúng
  Sẵn sàng Sai
  ContainerSẵn sàng Sai
  PodScheduled True
tập:
  tmp-dir:
    Loại: EmptyDir (một thư mục tạm thời chia sẻ thời gian tồn tại của nhóm)
    Trung bình:
    SizeLimit: <bỏ đặt>
  số liệu-máy chủ-mã thông báo-78b6h:
    Loại: Bí mật (một tập được điền bởi một Bí mật)
    Tên bí mật: số liệu-máy chủ-mã thông báo-78b6h
    Tùy chọn: sai
Lớp QoS: BestEffort
Bộ chọn nút: <none>
Dung sai: :NoExecuteop=Tồn tại
                 :NoScheduleop=Tồn tại
Sự kiện:
  Nhập Lý do Tuổi từ Tin nhắn
  ---- ------ ---- ---- -------
  Bộ lập lịch mặc định 28 phút theo lịch trình bình thường Đã gán thành công kube-system/metrics-server-5b6d79d4f4-ggl57 cho 192.168.0.59
  Kéo bình thường 28m kubelet Hình ảnh kéo "192.168.0.35:5000/rancher/metrics-server:v0.3.6"
  Kéo bình thường 28m kubelet Đã kéo thành công hình ảnh "192.168.0.35:5000/rancher/metrics-server:v0.3.6" trong 4.687484656s
  Cảnh báo Thăm dò mức độ sẵn sàng kubelet 28m không lành mạnh không thành công: Nhận "https://10.42.4.3:4443/readyz": vượt quá thời hạn ngữ cảnh (Client.Timeout vượt quá trong khi chờ tiêu đề)
  Cảnh báo Thăm dò Liveness kubelet 28m không lành mạnh không thành công: Nhận "https://10.42.4.3:4443/livez": net/http: yêu cầu bị hủy trong khi chờ kết nối (Client.Timeout đã vượt quá trong khi chờ tiêu đề)
  Cảnh báo Thăm dò mức độ sẵn sàng kubelet 27m không lành mạnh không thành công: Nhận "https://10.42.4.3:4443/readyz": quay số tcp 10.42.4.3:4443: kết nối: kết nối bị từ chối
  Cảnh báo Không lành mạnh 27m (x5 trên 28m) kubelet Thăm dò mức độ sẵn sàng không thành công: Thăm dò HTTP không thành công với mã trạng thái: 404
  Cảnh báo Không lành mạnh kubelet 27m (x5 trên 28m) Thăm dò Liveness không thành công: Thăm dò HTTP không thành công với mã trạng thái: 404
  Giết bình thường 27m (x2 trên 27m) kubelet Máy chủ số liệu vùng chứa không thăm dò được hoạt động, sẽ được khởi động lại
  Đã tạo bình thường 27m (x3 trên 28m) kubelet Đã tạo container metrics-server
  Bắt đầu bình thường 27m (x3 trên 28m) kubelet Bắt đầu container metrics-server
  Bình thường Đã kéo 8m14s (x10 trên 27m) kubelet Container image "192.168.0.35:5000/rancher/metrics-server:v0.3.6" đã có trên máy
  Cảnh báo BackOff 3m15s (x97 trên 25m) kubelet Back-off khởi động lại container không thành công
[rke@rke19-master1 ~]$



[rke@rke19-master1 ~]$ ^C
[rke@rke19-master1 ~]$ kubectl log metrics-server-5b6d79d4f4-ggl57 -n kube-system
I0816 23:27:20.011598 1 secure_serving.go:116] Phục vụ an toàn trên [::]:4443
[rke@rke19-master1 ~]$
Điểm:1
lá cờ hk
SYN

Các Không thành công với mã trạng thái: 404 thông báo cho biết bạn đang truy vấn một địa chỉ không tồn tại.

Chúng tôi có thể thấy bạn đang kéo một số thẻ v0.3.6 của hình ảnh máy chủ số liệu. Và mặc dù nó đến từ chủ trang trại, chúng tôi có thể cho rằng họ gắn bó với phiên bản ngược dòng.

Kiểm tra các thay đổi trong thượng nguồn, chúng ta có thể thấy rằng /livez/sẵn sàng đã được giới thiệu trong v0.4.0, xem: https://github.com/kubernetes-sigs/metrics-server/releases/tag/v0.4.0

Tôi khuyên bạn nên thử truy vấn /healthz URL đã bị xóa khỏi v0.4.0. Hoặc thay đổi đầu dò httpGet của bạn cho đầu dò tcpSocket. Hoặc: thử nâng cấp máy chủ số liệu lên bản phát hành gần đây?

alammd avatar
lá cờ th
Hi, nhờ các phản ứng, Tôi sẽ thử với phiên bản mới hơn của máy chủ số liệu, sẽ cập nhật rất nhiều, tuy nhiên, làm thế nào để tôi làm điều này? "Tôi khuyên bạn nên thử truy vấn URL /healthz, URL này đã bị xóa khỏi v0.4.0. Hoặc thay đổi đầu dò httpGet của bạn cho đầu dò tcpSocket"
SYN avatar
lá cờ hk
SYN
Kiểm tra Triển khai máy chủ số liệu trong kube-system. Nếu bạn không tìm thấy, thì chúng tôi biết rằng có một Bộ bản sao (như được hiển thị trong Tham khảo chủ sở hữu Pod của bạn). Chỉnh sửa livenessProbe và readyProbe. Bạn nên tìm một đường dẫn: thay thế chúng bằng `/healthz`. Hoặc thay thế phương thức thăm dò `httpGet`, bằng `tcpSocket`, trong đó chỉ yêu cầu đối số `port` / không cần phải đi xa hơn bắt tay TCP, sẽ không quan tâm đến việc máy chủ của bạn đàm phán HTTP thích hợp và không trả về với một mã lỗi.
alammd avatar
lá cờ th
Chào Tuyệt!!! Cảm ơn thay đổi /healthz nó hoạt động ~ Nhưng tại sao mặc định nó nhìn vào cái mòn ... nó có phải là bản sửa lỗi cho v0.3.6 từ sản phẩm không?
SYN avatar
lá cờ hk
SYN
IDK. Chắc chắn, đã xảy ra lỗi, thẻ hình ảnh hoặc định nghĩa triển khai. Bạn có thể liên hệ với Rancher, trên GitHub, báo cáo sự cố của bạn (chọn một repo tùy thuộc vào cách cụm của bạn được triển khai - thẻ hình ảnh cho thấy họ chịu trách nhiệm về việc này)
Điểm:0
lá cờ id

Tôi đã tìm thấy thời gian chờ thăm dò trên máy chủ số liệu quá tích cực:

        sẵn sàngThăm dò:
          failThreshold: 3
          httpNhận:
            đường dẫn: /readyz
            cổng: https
            lược đồ: HTTPS
          chu kỳGiây: 10
          ngưỡng thành công: 1
          thời gian chờGiây: 1
        livenessProbe:
          failThreshold: 3
          httpNhận:
            đường dẫn: /livez
            cổng: https
            lược đồ: HTTPS
          chu kỳGiây: 10
          ngưỡng thành công: 1
          thời gian chờGiây: 1

Điều xảy ra là máy chủ số liệu trả về "ok" trên cả livez và readyz nhưng yêu cầu mất hơn một giây để xử lý:

$ time curl -k https://SNIPPED:4443/livez
Vâng
thực 0m3.081s
người dùng 0m0.031s
hệ thống 0m0.005s
$ time curl -k https://SNIPPED:4443/readyz
Vâng
thực 0m3.206s
người dùng 0m0.020s
hệ thống 0m0.013s

Vì 3 giây lớn hơn 1 giây nên nó không "trực tiếp" và không "sẵn sàng". Tôi không biết tại sao phải mất 3 giây để phản hồi nhưng đây là vấn đề cốt lõi khiến CrashLoopBackOff lại xảy ra.

Cách để khắc phục sự cố này là sửa đổi thời gian chờ thành 5 giây hoặc 10 giây. Sử dụng kubectl chỉnh sửa số liệu-máy chủ -n kube-system để sửa đổi nó tại chỗ.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.