Điểm:3

Đâu là chỉ số tốt nhất cho các phiên bản GPU tự động thay đổi quy mô để suy luận máy học trên đám mây?

lá cờ ps

Chúng tôi có một API trong AWS với một phiên bản GPU có chức năng suy luận. Chúng tôi có thiết lập tự động mở rộng quy mô với số lượng phiên bản tối thiểu và tối đa, nhưng không chắc chắn chỉ số nào (mức sử dụng GPU/CPU, mức sử dụng RAM, độ trễ trung bình, v.v.) hoặc tổ hợp chỉ số nào sẽ được sử dụng để xác định thời điểm phiên bản mới dụ cần được khởi chạy để theo kịp các yêu cầu đến.

Có phương pháp hay nhất nào liên quan đến chỉ số nào nên được sử dụng trong trường hợp này không? Suy luận trong trường hợp của chúng tôi rất chuyên sâu về GPU.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.