Điểm:1

Làm cách nào để tạo GPU trong máy ảo Ubuntu 20.04 hoàn toàn mới có thể sử dụng được?

lá cờ in

Tôi đã cố gắng cả ngày để GPU (v100) này hoạt động trên máy ảo Ubuntu mới. Tôi đã thử cài đặt trình điều khiển và khởi động lại, cũng như xóa/gỡ cài đặt mọi thứ liên quan đến nvidia nhưng dường như không có thứ nào trong số này hoạt động.

Đặc biệt tôi đã chạy cái này cụ thể:

cập nhật phù hợp;
apt cài đặt bản dựng cần thiết;

sudo add-apt-repository ppa: trình điều khiển đồ họa
Sudo apt cài đặt ubuntu-drivers-common
thiết bị trình điều khiển Ubuntu
sudo apt-get cài đặt nvidia-driver-460
Sudo khởi động lại ngay bây giờ

Sau đó, đôi khi có vẻ như nvidia-smi đang hoạt động (khi viết câu hỏi này thì không phải vậy nên tôi không thể sao chép, dán những gì được nói khi nó hoạt động) nhưng khi nó không hoạt động thì nó báo như sau:

(tổng hợp) miranda9@miranda9:~$nvidia-smi
Không thể xác định tay cầm thiết bị cho GPU 0000:00:06.0: Lỗi không xác định

bất kỳ trợ giúp được đánh giá cao.

Lưu ý rằng tôi cũng không có quyền truy cập vào tệp vmx của máy ảo nên câu hỏi và câu trả lời này là vô ích/vô nghĩa đối với tôi: https://forums.developer.nvidia.com/t/nvidia-smi-reports-unable-to-determine-the-device-handle-for-gpu/46835

Ngoài ra, tôi đã cố gỡ cài đặt mọi thứ khỏi nivida và cài đặt lại bằng:

Sudo apt-get --purge xóa "*nvidia*"
sudo /usr/bin/nvidia-gỡ cài đặt

sau đó

cập nhật phù hợp;
apt cài đặt bản dựng cần thiết;

sudo add-apt-repository ppa: trình điều khiển đồ họa
Sudo apt cài đặt ubuntu-drivers-common
thiết bị trình điều khiển Ubuntu
sudo apt-get cài đặt nvidia-driver-460
Sudo khởi động lại ngay bây giờ

nhưng điều đó dường như không làm việc


Thông tin thêm trong trường hợp nó giúp:

(tổng hợp) miranda9@miranda9:~$ lsb_release -a
Không có mô-đun LSB nào khả dụng.
ID nhà phân phối: Ubuntu
Mô tả: Ubuntu 20.04.2 LTS
Phát hành: 20.04
Tên mã: tiêu cự

Mà còn:

(tổng hợp) miranda9@miranda9:~$python
Python 3.9.5 (mặc định, ngày 4 tháng 6 năm 2021, 12:28:51) 
[GCC 7.5.0] :: Anaconda, Inc. trên linux
Nhập "trợ giúp", "bản quyền", "tín dụng" hoặc "giấy phép" để biết thêm thông tin.
>>> đèn pin nhập khẩu
>>> torch.cuda.is_available()
/home/miranda9/miniconda3/envs/synthesis/lib/python3.9/site-packages/torch/cuda/__init__.py:52: Cảnh báo người dùng: Khởi tạo CUDA: Lỗi không mong muốn từ cudaGetDeviceCount(). Bạn đã chạy một số hàm cuda trước khi gọi NumCudaDevices() có thể đã báo lỗi chưa? Lỗi 101: thứ tự thiết bị không hợp lệ (Được kích hoạt nội bộ tại /opt/conda/conda-bld/pytorch_1623448238472/work/c10/cuda/CUDAFunctions.cpp:115.)
  trả lại ngọn đuốc._C._cuda_getDeviceCount() > 0
Sai

Theo yêu cầu của nhận xét:

# lspci
00:00.0 Cầu máy chủ: Intel Corporation 440FX - 82441FX PMC [Natoma] (rev 02)
00:01.0 Cầu nối ISA: Tập đoàn Intel 82371SB PIIX3 ISA [Natoma/Triton II]
00:01.1 Giao diện IDE: Intel Corporation 82371SB PIIX3 IDE [Natoma/Triton II]
00:01.2 Bộ điều khiển USB: Intel Corporation 82371SB PIIX3 USB [Natoma/Triton II] (rev 01)
00:01.3 Cầu nối: Intel Corporation 82371AB/EB/MB PIIX4 ACPI (rev 01)
00:02.0 Bộ điều khiển tương thích VGA: Cirrus Logic GD 5446
00:03.0 Bộ điều khiển lưu trữ SCSI: XenSource, Inc. Thiết bị nền tảng Xen (rev 01)
00:05.0 Thiết bị ngoại vi hệ thống: XenSource, Inc. Thiết bị PCI Citrix XenServer dành cho Windows Update (rev 01)
00:06.0 Bộ điều khiển 3D: Tập đoàn NVIDIA GV100GL [Tesla V100 PCIe 16GB] (rev a1)

vm khác:

$ lspci
00:00.0 Cầu máy chủ: Intel Corporation 440FX - 82441FX PMC [Natoma] (rev 02)
00:01.0 Cầu nối ISA: Tập đoàn Intel 82371SB PIIX3 ISA [Natoma/Triton II]
00:01.1 Giao diện IDE: Intel Corporation 82371SB PIIX3 IDE [Natoma/Triton II]
00:01.2 Bộ điều khiển USB: Intel Corporation 82371SB PIIX3 USB [Natoma/Triton II] (rev 01)
00:01.3 Cầu nối: Intel Corporation 82371AB/EB/MB PIIX4 ACPI (rev 01)
00:02.0 Bộ điều khiển tương thích VGA: Cirrus Logic GD 5446
00:03.0 Bộ điều khiển lưu trữ SCSI: XenSource, Inc. Thiết bị nền tảng Xen (rev 01)
00:05.0 Thiết bị ngoại vi hệ thống: XenSource, Inc. Thiết bị PCI Citrix XenServer dành cho Windows Update (rev 01)
00:06.0 Bộ điều khiển 3D: Tập đoàn NVIDIA GV100GL [Tesla V100 PCIe 16GB] (rev a1)

Tài nguyên tôi đã tìm kiếm trợ giúp:

ChanganAuto avatar
lá cờ us
Trong một máy ảo, phần cứng được ảo hóa. Bạn không sử dụng GPU Nvidia thực sự, hệ điều hành máy chủ.
lá cờ cc
Hãy xem kết quả của Google về máy ảo nvidia gpu passthru
Charlie Parker avatar
lá cờ in
@ubfan1 chỉ để đảm bảo rằng tôi đã tìm đúng chỗ. Tôi cần google `passthru` chứ không phải `passthrough`? ví dụ. google `máy ảo nvidia gpu passthru` - phải không?
lá cờ cc
"passthru" xuất hiện như một lựa chọn ban đầu khi tôi bắt đầu nhập, vì vậy tôi đã chọn nó. GPU của tôi quá cũ để nó hoạt động với tôi, vì vậy tôi đã không kiểm tra thêm.
Charlie Parker avatar
lá cờ in
quan tâm để xây dựng các downvote?
Charlie Parker avatar
lá cờ in
@NateT vâng, tôi rất vui. Xem cập nhật cho câu hỏi. Tuy nhiên, tôi nghi ngờ rằng chỉ cần xóa mọi thứ khỏi nvidia rồi cài đặt lại bằng cách khởi động lại sẽ hoạt động nhưng nỗ lực của tôi để làm điều đó không thành công.
Irsu85 avatar
lá cờ cn
Bạn cần sử dụng thông qua PCIe và 2 gpu vật lý trong máy tính của mình để thực hiện công việc này. Bạn cũng cần một màn hình thứ hai được kết nối với gpu thứ hai. Đối với các lệnh thực tế, v.v., hãy thử sử dụng https://pve.proxmox.com/wiki/PCI(e)_Passthrough
Nate T avatar
lá cờ it
Bạn đã sử dụng hình ảnh nào cho VM. Như trong tên hình ảnh đầy đủ? Số lượt phản đối có thể là do VM không có GPU.Tôi cho rằng ý của bạn là "làm thế nào để vm sử dụng GPU máy chủ"? Nhân tiện, tôi không phải là tôi, tôi chỉ dv trong những tình huống khắc nghiệt. Tôi quá nghèo. XD
Điểm:0
lá cờ zw

một máy ảo mô phỏng một cạc đồ họa, do đó, nó phải minh bạch đối với hệ thống khách mà bạn có thẻ gốc trên hệ thống Máy chủ của mình. Máy ảo dùng để "chia sẻ" tài nguyên - trái ngược với một hệ thống thực có quyền truy cập trực tiếp vào phần cứng của nó. Vì vậy, sẽ không có ý nghĩa gì khi cài đặt trình điều khiển Nvidia trên hệ thống máy chủ. Bạn có thể kiểm tra điều này bằng cách kiểm tra trình điều khiển hiện tại trong máy ảo của mình:

inxi -G

(được thực thi trong một thiết bị đầu cuối) sẽ hiển thị cho bạn trình điều khiển VM/oracle, không phải thẻ gốc của bạn.

Có thể đạt được đầu ra đồ họa hiệu suất cao bằng các chỉnh sửa và thủ thuật, nhưng máy ảo không dành cho công việc như thế này....

Charlie Parker avatar
lá cờ in
xin chào, cảm ơn vì phản hồi, đó là thông tin! Tôi không có quyền truy cập vào hệ thống máy chủ. Tôi yêu cầu một máy ảo và tôi có một máy ảo để sử dụng. Tôi có thể sudo trong đó nhưng tất nhiên tôi đang ở trong VM. Bạn nghĩ tại sao cách tôi cài đặt trình điều khiển không hoạt động? Chính xác thì điều gì đang xảy ra sai theo ý kiến ​​​​của bạn?
kanehekili avatar
lá cờ zw
OK, vậy là VM đang ở trên một máy chủ từ xa. `inxi -G` nói gì trên "máy ảo từ xa" của bạn? Nếu nó không tồn tại, hãy thử với `sudo apt install inxi`

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.