Gần đây tôi đã cập nhật cụm của mình lên Vmware Esxi 7.0 Update 3.
Vài ngày sau, máy ảo bắt đầu đóng băng một cách ngẫu nhiên.
Không có thông báo nào được hiển thị trên màn hình. Trong các sự kiện vm tôi thấy thông báo này:
Trong (05) vcpu-0 - NVME-VMM: Đặt lại mức bộ điều khiển thông qua chuyển đổi bit CC.EN trên nvme0
Trong (05) vcpu-0 - NVME-CORE: Thực hiện thiết lập lại một phần bộ điều khiển và hàng đợi.
Trong (05) vcpu-1 - NVME-VMK: nvme0:0: Bỏ qua hoàn thành [ignoreCmp=0].
Trong (05) vcpu-8 - NVME-VMM: Chuông cửa CQ#8 không mong muốn ghi: prevHead=46, newHead=47, size=256, inflight=0
Trong (05) vcpu-0 - Vix: [vmxCommands.c:7182]: VMAutomation_HandleCLIHLTEEvent. Không làm gì cả.
Trong(05) vcpu-0 - MsgHint: msg.monitorevent.halt
In(05)+ vcpu-0 - CPU đã bị vô hiệu hóa bởi hệ điều hành khách. Tắt nguồn hoặc đặt lại máy ảo.
Trong máy ảo tôi không thấy bất kỳ lỗi nào được báo cáo.
Ngoại trừ điều này bật lên vào khoảng thời gian máy bị khóa.
kernel: [28667.084637] nvme nvme0: I/O 197 QID 14 hết thời gian chờ, hủy bỏ
kernel: [28667.084716] nvme nvme0: Trạng thái hủy bỏ: 0x0
kernel: [28697.292556] nvme nvme0: I/O 197 QID 14 hết thời gian chờ, đặt lại bộ điều khiển
kernel: [28697.356676] nvme nvme0: 15/0/0 hàng đợi mặc định/đọc/thăm dò ý kiến
Máy ảo được cấu hình với bộ điều khiển nvme và đĩa ảo được đặt trên ổ đĩa được ánh xạ tới bộ lưu trữ nvme qua nvme qua kênh cáp quang.
Sau khi hạ cấp phiên bản Esxi trở lại 7.0 Update 2d, các vấn đề đã biến mất.
Vmware cho tôi biết nó có thể liên quan đến lỗi kernel.
Điều gì có thể là vấn đề?