Hiện tại, tôi đã gặp sự cố gấp 4 lần máy chủ AWS ERP do bộ nhớ dường như đã sử dụng tối đa và hệ thống về cơ bản sẽ chết với 100% CPU và không có [ít] RAM khả dụng.
Ubuntu 18.04.5 LTS (GNU/Linux 5.4.0-1060-aws x86_64) (AWS AMI)
Ba lần điều này xảy ra ở giữa một hành động GitHub. Hành động đang thực hiện nhập cơ sở dữ liệu và sau đó là thông báo chậm. Do đó, bạn sẽ nghĩ rằng đó là một trong những bước gây ra sự cố, nhưng điều kỳ lạ là tất cả các bước đều hoàn thành bình thường. Cơ sở dữ liệu vẫn ổn và thông báo chậm đã được đẩy.
Bản thân GitHub đã mất kết nối với trình chạy và bộ nhớ ảo đã tăng vọt ngay cả sau khi hành động đã hoàn thành.
Lần thứ tư điều này xảy ra trong khi KHÔNG CÓ GÌ đang chạy. Trên thực tế, máy chủ không hoạt động mà không có gì xảy ra.Tuy nhiên, tôi không có bất kỳ nhật ký hoặc ảnh chụp màn hình "trên cùng" nào về ĐÓ, nhưng tôi đã bắt gặp nó trong một lần:
Vì vậy, hệ thống là một AWS VM với 4G RAM. Lưu ý rằng tôi tin rằng SI thiết lập hệ thống này được định cấu hình không có không gian hoán đổi. Điều này được cho là đúng [rất được cho là] đối với một máy chủ, theo nghĩa là nếu có rò rỉ bộ nhớ, bạn muốn hệ thống báo hết bộ nhớ và thực hiện hành động khắc phục, vì với rò rỉ bộ nhớ thì cuối cùng bạn cũng sẽ chết.
Trước mắt, tôi được yêu cầu tăng gấp đôi RAM. Điều này hơi không cần thiết vì đây là một hệ thống được tải rất nhẹ (thường chỉ chạy với khoảng 2G RAM được sử dụng khi thực hiện một công việc hàng loạt nặng), và thành thật mà nói, nếu GitHub Runner.Worker sử dụng tối đa 7GB RAM trên hệ thống 4GB, tại sao nó sẽ không đạt tối đa 16GB RAM trên máy ảo 8GB, nhưng chúng tôi sẽ xem liệu nó có gặp sự cố lần nữa không. Tôi không phản đối việc thay đổi cấu hình trao đổi của TFG, nhưng tôi không chắc đó là cách khắc phục
Tôi đã báo cáo điều này với GitHub, nhưng sau hơn 3 tuần không hành động, tôi nghĩ rằng mình nên kiểm tra tại đây và xem có ai có bất kỳ ý tưởng hoặc cách khắc phục nào không.
Cảm ơn bạn,
== John ==