Bối cảnh: Tôi đang sử dụng thành công rsync để tạo các bản sao lưu từ xa và gia tăng hàng ngày bằng cách sử dụng cờ --link-dest "referenceBackup", để khi tạo bản sao lưu mới, chỉ một tham chiếu mới được tạo cho một tệp hiện có và chưa sửa đổi.
vấn đề: Một số thư mục chứa rất nhiều tệp nhỏ (hàng trăm nghìn) và thậm chí việc tối ưu hóa --link-dest cũng không ... "tối ưu". Hầu hết các "tệp nhỏ" đó có thể là tệp nguồn, đầu ra được biên dịch "*.o" nhỏ, ... việc tạo tham chiếu enode mới cho từng tệp trong số hàng trăm nghìn tệp tiêu thụ tài nguyên hệ thống tệp. Ví dụ: đối với thư mục tham chiếu 20 Gigabyte với hơn 250.000 tệp, bản sao lưu gia tăng sử dụng khoảng 100Mb (0,05%) dung lượng bổ sung (ngay cả khi chỉ có 40 kilobyte dữ liệu được thay đổi).
Câu hỏi: Tôi biết chắc chắn rằng các thư mục đầy đủ và các cây con thư mục sẽ luôn chứa hầu hết "hàng trăm nghìn" tệp nhỏ giống nhau (có thể chỉ với 10 hoặc 20 sửa đổi) và tôi chỉ tự hỏi liệu có chiến lược sao lưu tối ưu hóa nào tốt hơn trong trường hợp như vậy không ( khi so sánh với --link-dest ...). Đó là, tôi chỉ muốn tạo một "diff" của thư mục hiện có trong bản sao lưu gia tăng mới, thậm chí cố gắng tạo một tham chiếu mới đến enode cho 99% tệp hiện có. Là những một số loại lớp phủ hệ thống tệp (giống như docker) ứng dụng hoặc mô hình?