Mỗi lần tôi chạy nvidia-smi
trên hệ thống máy tính mới của chúng tôi, tôi gặp loại lỗi này trong nhật ký hệ thống. Thường thì một vài trong số họ trong một nhóm:
Ngày 25 tháng 2 13:35:02 kernel xxxx: [77419.656602] Lỗi ACPI BIOS (lỗi): Tạo đối tượng có tên không thành công [\_SB.PC00.PEG1.PEGP._DSM.USRG], AE_ALREADY_EXISTS (20210331/dsfield-184)
Ngày 25 tháng 2 13:35:02 kernel xxxx: [77419.656612] Lỗi ACPI: AE_ALREADY_EXISTS, lỗi CreateBufferField (20210331/dswload2-477)
Ngày 25 tháng 2 13:35:02 hạt nhân xxxx: [77419.656616]
Ngày 25 tháng 2 13:35:02 kernel xxxx: [77419.656618] Không có biến cục bộ nào được khởi tạo cho Phương thức [_DSM]
Ngày 25 tháng 2 13:35:02 hạt nhân xxxx: [77419.656618]
Ngày 25 tháng 2 13:35:02 xxxx kernel: [77419.656619] Đối số đã khởi tạo cho Phương thức [_DSM]: (4 đối số được xác định cho lệnh gọi phương thức)
Ngày 25 tháng 2 13:35:02 xxxx kernel: [77419.656620] Arg0: 000000007cd03195 <Obj> Bộ đệm(16) 75 0B A5 D4 C7 65 F7 46
Ngày 25 tháng 2 13:35:02 xxxx kernel: [77419.656628] Arg1: 0000000012ece7a2 <Obj> Số nguyên 0000000000000102
Ngày 25 tháng 2 13:35:02 xxxx kernel: [77419.656632] Arg2: 000000009179cfcc <Obj> Số nguyên 0000000000000010
Ngày 25 tháng 2 13:35:02 xxxx kernel: [77419.656635] Arg3: 000000002ecdce5a <Obj> Bộ đệm (4) 00 10 52 44
Ngày 25 tháng 2 13:35:02 hạt nhân xxxx: [77419.656639]
Ngày 25 tháng 2 13:35:02 kernel xxxx: [77419.656641] Lỗi ACPI: Phương thức hủy bỏ \_SB.PC00.PEG1.PEGP._DSM do lỗi trước đó (AE_ALREADY_EXISTS) (20210331/psparse-529)
Điều tương tự cũng xảy ra khi một snmpd
quá trình truy vấn định kỳ các tham số GPU.
Bất kỳ ý tưởng tại sao điều này sẽ được?
đầu ra của nvidia-smi
có vẻ đúng, nhưng tôi hơi bối rối liệu những lỗi nhật ký hệ thống đó có quan trọng không. Tôi đã cập nhật BIOS với phiên bản mới nhất chỉ mới vài ngày. Dưới đây là thông tin về hệ thống được đề cập:
$ inxi -Fxz
Hệ thống: Hạt nhân: 5.13.0-30-generic x86_64 bit: 64 trình biên dịch: N/A Bảng điều khiển: tty 0 Bản phân phối: Ubuntu 20.04.4 LTS (Focal Fossa)
Máy: Loại: Máy tính để bàn Hệ thống: Sản phẩm Alienware: Alienware Aurora R13 v: N/A serial: <filter>
Mobo: Kiểu máy Alienware: 0C92D0 v: A00 sê-ri: <bộ lọc> UEFI: Alienware v: 1.0.12 ngày: 25/01/2022
CPU: Cấu trúc liên kết: Mô hình 10 lõi: Intel Core i7-12700KF thế hệ thứ 12 bit: 64 loại: MT MCP vòm: N/A Bộ đệm L2: 25,0 MiB
cờ: avx avx2 lm nx pae sse sse2 sse3 sse4_1 sse4_2 ssse3 vmx bogomips: 144383
Tốc độ: 893 MHz tối thiểu/tối đa: 800/6300 MHz Tốc độ lõi (MHz): 1: 890 2: 900 3: 843 4: 891 5: 800 6: 818 7: 873 8: 894
9: 958 10: 925 11: 909 12: 900 13: 891 14: 901 15: 881 16: 909 17: 891 18: 1182 19: 884 20: 913
Đồ họa: Thiết bị-1: Nhà cung cấp NVIDIA: Trình điều khiển Dell: nvidia v: 510.47.03 bus ID: 01:00.0
Hiển thị: máy chủ: trình điều khiển X.org 1.20.13: fbdev,nouveau unloaded: modesetting,vesa tty: 136x50
Thông báo: Không có dữ liệu đồ họa nâng cao trong bảng điều khiển. Hãy thử -G --display
Âm thanh: Thiết bị-1: Nhà cung cấp Intel: Trình điều khiển Dell: snd_hda_intel v: ID bus nhân: 00:1f.3
Thiết bị-2: Nhà cung cấp NVIDIA: Trình điều khiển Dell: snd_hda_intel v: ID bus kernel: 01:00.1
Máy chủ âm thanh: ALSA v: k5.13.0-30-generic
Mạng: Thiết bị-1: Nhà cung cấp Realtek: Trình điều khiển Bigfoot Networks: r8169 v: kernel port: 3000 bus ID: 03:00.0
NẾU: trạng thái enp3s0: tốc độ lên: 1000 Mb/giây song công: mac đầy đủ: <bộ lọc>
Thiết bị-2: Nhà cung cấp Intel: Trình điều khiển Bigfoot Networks: iwlwifi v: kernel port: 3000 bus ID: 04:00.0
NẾU: trạng thái wlp4s0: down mac: <filter>
IF-ID-1: trạng thái docker0: tốc độ lên: song công 10000 Mbps: mac không xác định: <bộ lọc>
IF-ID-2: trạng thái veth4f6068a: tốc độ lên: song công 10000 Mbps: mac đầy đủ: <bộ lọc>
Ổ đĩa: Bộ nhớ cục bộ: tổng: 1,84 TiB đã sử dụng: 131,29 GiB (7,0%)
ID-1: /dev/nvme0n1 kiểu máy: KXG70ZNV1T02 NVMe KIOXIA Kích thước 1024GB: 953,87 GiB
ID-2: /dev/sda nhà cung cấp: Toshiba model: DT01ACA100 size: 931,51 GiB temp: 35 C
Phân vùng: ID-1: / size: 904,82 GiB đã sử dụng: 131,20 GiB (14,5%) fs: ext4 dev: /dev/nvme0n1p2
ID-2: kích thước hoán đổi-1: 11,00 GiB đã sử dụng: 65,2 MiB (0,6%) fs: hoán đổi dev: /dev/nvme0n1p3
Cảm biến: Nhiệt độ hệ thống: cpu: 32,0 C mobo: N/A
Tốc độ quạt (RPM): N/A
Thông tin: Quy trình: 456 Thời gian hoạt động: 21 giờ 41 phút Bộ nhớ: 62,60 GiB đã sử dụng: 2,92 GiB (4,7%) Ban đầu: systemd runlevel: 5 Trình biên dịch:
gcc: 9.3.0 Shell: bash v: 5.0.17 inxi: 3.0.38
GPU là NVIDIA RTX 3080 10GB. Hệ thống được triển khai trong phòng máy chủ không màn hình, không chuột, không bàn phím. Các thông báo hiển thị theo cùng một cách ngay cả khi tôi kết nối màn hình/chuột/bàn phím. Không khác nhau.
Tôi đã cố gắng tìm thêm thông tin về vấn đề này nhưng không gặp may. Tôi thậm chí không chắc liệu việc thử sửa lỗi này có quan trọng hay không hay tôi nên báo cáo với ai trong trường hợp đó là một lỗi thực sự.
--
bogdan