Tôi đã làm theo điều này hướng dẫn chính thức để cho phép cụm k8s kim loại trần có Quyền truy cập GPU. Tuy nhiên tôi đã nhận được lỗi trong khi làm như vậy.
Kubernetes 1.21 chứa 1.4.11 và Ubuntu 20.04.3 LTS (GNU/Linux 5.4.0-91-generic x86_64).
Nvidia Driver được cài đặt sẵn trên System OS với phiên bản 495 Headless
Sau khi dán cấu hình sau vào bên trong /etc/containerd/config.toml
và thực hiện khởi động lại dịch vụ, containerd sẽ không khởi động được với thoát 1
.
chứa Config.toml
nhật ký hệ thống đây.
# vị trí dữ liệu liên tục
gốc = "/var/lib/containerd"
# thông tin trạng thái thời gian chạy
trạng thái = "/ run/containerd"
# Kubernetes không sử dụng trình quản lý khởi động lại containerd.
bị vô hiệu hóa = ["khởi động lại"]
# CẤU HÌNH NVIDIA BẮT ĐẦU TẠI ĐÂY
phiên bản = 2
[bổ sung]
[plugin."io.containerd.grpc.v1.cri"]
[plugin."io.containerd.grpc.v1.cri".containerd]
default_runtime_name = "nvidia"
[plugins."io.containerd.grpc.v1.cri".containerd.runtimes]
[plugin."io.containerd.grpc.v1.cri".containerd.runtimes.nvidia]
đặc quyền_không có_host_devices = sai
runtime_engine = ""
runtime_root = ""
runtime_type = "io.containerd.runc.v2"
[plugin."io.containerd.grpc.v1.cri".containerd.runtimes.nvidia.options]
BinaryName = "/usr/bin/nvidia-container-runtime"
# CẤU HÌNH NVIDIA KẾT THÚC TẠI ĐÂY
[gỡ lỗi]
cấp = ""
[grpc]
max_recv_message_size = 16777216
max_send_message_size = 16777216
[plugins.linux]
shim = "/usr/bin/containerd-shim"
thời gian chạy = "/usr/bin/runc"
Tôi có thể xác nhận rằng Trình điều khiển Nvidia phát hiện GPU (Nvidia GTX 750Ti) bằng cách chạy nvidia-smi
và nhận được đầu ra sau
+--------------------------------------------- ----------------------------- +
| Phiên bản trình điều khiển NVIDIA-SMI 495.44: 495.44 Phiên bản CUDA: 11.5 |
|-------------------------------------+----------------- -----+----------------------+
| Tên GPU Persistence-M| Bus-Id Disp.A | Dễ bay hơi Uncorr. ECC |
| Fan Temp Perf Pwr:Sử dụng/Giới hạn| Sử dụng bộ nhớ | GPU-Util Compute M. |
| | | MIG M. |
|=================================================== =====+======================|
| 0 NVIDIA GeForce ... Tắt | 00000000:02:00.0 Tắt | Không áp dụng |
| 34% 34C P8 1W/38W | 0MiB / 2000MiB | 0% mặc định |
| | | Không áp dụng |
+------------------------------------+----------------- -----+----------------------+
+--------------------------------------------- ----------------------------- +
| Quy trình: |
| GPU GI CI Loại PID Tên quy trình Bộ nhớ GPU |
| ID ID Sử dụng |
|================================================= ============================|
| Không tìm thấy quy trình đang chạy nào |
+--------------------------------------------- ----------------------------- +
sửa đổi config.toml đã làm cho nó hoạt động.