Tôi gặp sự cố, một trong các bản sao bị kẹt ở trạng thái Đang chờ xử lý.
Vấn đề: Sau một lần triển khai khác, một trong các bản sao mới được xếp chồng lên nhau và tôi có một nút trống đáp ứng tất cả các yêu cầu cần thiết.
Triển khai chứa nodeSelector và các yêu cầu về mối quan hệ:
thông số kỹ thuật:
sự giống nhau:
podAntiAffinity:
bắt buộcDuringDuringSchedulingIgnoredDuringExecution:
- bộ chọn nhãn:
matchExpressions:
- phím: ứng dụng
toán tử: Trong
giá trị:
- giải nén tầm nhìn-api
khóa cấu trúc liên kết: "kubernetes.io/hostname"
nútChọn:
kiểu cài đặt: gpu
và có 3 nút có nhãn phù hợp
ip-10-0-11-16.ec2.internal Sẵn sàng <none> 114d v1.18.3 beta.kubernetes.io/arch=amd64,beta.kubernetes.io/instance-type=g3.4xlarge,beta.kubernetes.io /os=linux,failure-domain.beta.kubernetes.io/region=us-east-1,failure-domain.beta.kubernetes.io/zone=us-east-1b,insttype=gpu,kubernetes.io/arch =amd64,kubernetes.io/hostname=ip-10-0-11-16,kubernetes.io/os=linux,node.kubernetes.io/instance-type=g3.4xlarge,topology.ebs.csi.aws.com /zone=us-east-1b,topology.kubernetes.io/region=us-east-1,topology.kubernetes.io/zone=us-east-1b
ip-10-0-11-206.ec2.internal Sẵn sàng <none> 342d v1.18.3 beta.kubernetes.io/arch=amd64,beta.kubernetes.io/instance-type=g3.4xlarge,beta.kubernetes.io /os=linux,failure-domain.beta.kubernetes.io/region=us-east-1,failure-domain.beta.kubernetes.io/zone=us-east-1b,insttype=gpu,kubernetes.io/arch =amd64,kubernetes.io/hostname=ip-10-0-11-206,kubernetes.io/os=linux,node.kubernetes.io/instance-type=g3.4xlarge,topology.ebs.csi.aws.com /zone=us-east-1b,topology.kubernetes.io/region=us-east-1,topology.kubernetes.io/zone=us-east-1b
ip-10-0-11-44.ec2.internal Sẵn sàng <none> 114d v1.18.3 beta.kubernetes.io/arch=AMD64,beta.kubernetes.io/instance-type=g3.4xlarge,beta.kubernetes.io /os=linux,failure-domain.beta.kubernetes.io/region=us-east-1,failure-domain.beta.kubernetes.io/zone=us-east-1b,insttype=gpu,kubernetes.io/arch =amd64,kubernetes.io/hostname=ip-10-0-11-44,kubernetes.io/os=linux,node.kubernetes.io/instance-type=g3.4xlarge,topology.ebs.csi.aws.com /zone=us-east-1b,topology.kubernetes.io/region=us-east-1,topology.kubernetes.io/zone=us-east-1b
Và đây là mô tả về nhóm đang chờ xử lý
Cảnh báo FailedScheduling <unknown> default-scheduler 0/13 nút khả dụng: 1 (các) nút không khớp với mối quan hệ/phản đối mối quan hệ nhóm, 1 nút không đáp ứng các quy tắc chống mối quan hệ nhóm hiện có, 1 nút ( s) có dấu vết {node.kubernetes.io/disk-pressure: }, khiến nhóm không chịu được, 10 nút không khớp với bộ chọn nút.
Và mô tả nút trống cũng vậy
Tên: ip-10-0-11-44.ec2.internal
Vai trò: <không có>
Nhãn: beta.kubernetes.io/arch=amd64
beta.kubernetes.io/instance-type=g3.4xlarge
beta.kubernetes.io/os=linux
fail-domain.beta.kubernetes.io/region=us-east-1
fail-domain.beta.kubernetes.io/zone=us-east-1b
insttype=gpu
kubernetes.io/arch=amd64
kubernetes.io/hostname=ip-10-0-11-44
kubernetes.io/os=linux
node.kubernetes.io/instance-type=g3.4xlarge
cấu trúc liên kết.ebs.csi.aws.com/zone=us-east-1b
topology.kubernetes.io/region=us-east-1
topology.kubernetes.io/zone=us-east-1b
Chú thích: csi.volume.kubernetes.io/nodeid: {"ebs.csi.aws.com":"i-00919faca1e45926f","efs.csi.aws.com":"i-00919faca1e45926f"}
flannel.alpha.coreos.com/backend-data: {"VtepMAC":"ce:02:a2:a2:5e:a7"}
flannel.alpha.coreos.com/backend-type: vxlan
flannel.alpha.coreos.com/kube-subnet-manager: đúng
flannel.alpha.coreos.com/public-ip: 10.0.11.44
nút.alpha.kubernetes.io/ttl: 0
volume.kubernetes.io/controller-managed-attach-detach: true
CreationTimestamp: Fri, 26 Mar 2021 08:54:41 +0000
Vết nhơ: <không có>
Không thể lên lịch: sai
Cho thuê:
Chủ sở hữu ID: ip-10-0-11-44.ec2.internal
Thời gian có được: <bỏ đặt>
Thời gian gia hạn: CN, 18/07/2021 11:52:59 +0000
Điều kiện:
Loại Trạng thái LastHeartbeatTime LastTransitionTime Lý do Tin nhắn
---- ------ ----------------- ------------------ ----- - -------
MemoryPressure False Sun, 18 Jul 2021 11:51:26 +0000 Sat, 17 Jul 2021 14:00:36 +0000 KubeletHasSufficientMemory kubelet có đủ bộ nhớ khả dụng
DiskPressure False Sun, 18 Jul 2021 11:51:26 +0000 Sat, 17 Jul 2021 14:00:36 +0000 KubeletHasNoDiskPressure kubelet không có áp suất đĩa
PIDPressure False Sun, 18 Jul 2021 11:51:26 +0000 Sat, 17 Jul 2021 14:00:36 +0000 KubeletHasSufficientPID kubelet có đủ PID
Ready True Sun, 18 Jul 2021 11:51:26 +0000 Sat, 17 Jul 2021 14:00:38 +0000 KubeletReady kubelet đang đăng trạng thái sẵn sàng. Đã bật AppArmor
Địa chỉ:
IP nội bộ: 10.0.11.44
Tên máy chủ: ip-10-0-11-44.ec2.internal
InternalDNS: ip-10-0-11-44.ec2.internal
Dung tích:
có thể đính kèm-khối lượng-aws-ebs: 39
bộ vi xử lý: 16
lưu trữ tạm thời: 60923672Ki
Hugepages-1Gi: 0
Hugepages-2Mi: 0
bộ nhớ: 125709124Ki
quả: 110
phân bổ:
có thể đính kèm-khối lượng-aws-ebs: 39
bộ vi xử lý: 16
lưu trữ tạm thời: 56147256023
Hugepages-1Gi: 0
Hugepages-2Mi: 0
bộ nhớ: 125606724Ki
quả: 110
Thông tin hệ thống:
Mã máy: 94c328b1fcaf4999b5de9f749ac998b8
UUID hệ thống: ec2c3806-d842-c53f-e93f-cf9059701bdd
ID khởi động: 469aa16e-80f3-470b-9451-06078a78fa96
Phiên bản hạt nhân: 5.4.0-1051-aws
Hình ảnh hệ điều hành: Ubuntu 18.04.4 LTS
Hệ điều hành: linux
Kiến trúc: amd64
Phiên bản thời gian chạy vùng chứa: docker://18.9.7
Phiên bản Kubelet: v1.18.3
Phiên bản Kube-Proxy: v1.18.3
PodCIDR: 10.244.8.0/24
PodCIDR: 10.244.8.0/24
ID nhà cung cấp: aws:///us-east-1b/i-00919faca1e45926f
Nhóm không kết thúc: (tổng cộng 8)
Không gian tên Tên Yêu cầu CPU Giới hạn CPU Yêu cầu bộ nhớ Giới hạn bộ nhớ TUỔI
--------- --------- --------- ---------- --------------- ------------- ---
kube-system ebs-csi-controller-5b64f64f64-x97ng 0 (0%) 0 (0%) 0 (0%) 0 (0%) 24d
kube-system ebs-csi-node-2rwm4 0 (0%) 0 (0%) 0 (0%) 0 (0%) 114d
kube-system
hệ thống kube kube-flannel-ds-amd64-9xkjg 100m (0%) 100m (0%) 50Mi (0%) 50Mi (0%) 114d
hệ thống kube kube-proxy-nrjmh 0 (0%) 0 (0%) 0 (0%) 0 (0%) 114d
hệ thống kube traefik-9mpzr 500m (3%) 1 (6%) 500Mi (0%) 800Mi (0%) 24d
giám sát nút-xuất khẩu-gj2qw 112m (0%) 270m (1%) 200Mi (0%) 220Mi (0%) 114d
giám sát prometheus-operator-6f98f66b89-dnjqd 100m (0%) 200m (1%) 100Mi (0%) 200Mi (0%) 24d
Nguồn lực được phân bổ:
(Tổng số giới hạn có thể trên 100 phần trăm, tức là, đã cam kết quá mức.)
Giới hạn yêu cầu tài nguyên
-------- -------- ------
cpu 812m (5%) 1570m (9%)
bộ nhớ 850Mi (0%) 1270Mi (1%)
lưu trữ tạm thời 0 (0%) 0 (0%)
Hugepages-1Gi 0 (0%) 0 (0%)
Hugepages-2Mi 0 (0%) 0 (0%)
có thể đính kèm-khối lượng-aws-ebs 0 0