Nó phụ thuộc vào kiểu truy cập dữ liệu: Ceph có thể lưu trữ dữ liệu dưới dạng thiết bị khối (RBD), dưới dạng kho lưu trữ đối tượng S3 (RGW) hoặc dưới dạng hệ thống tệp (CephFS). Tôi giả sử CephFS ở đây như bạn đã đề cập và Gluster, cả hai đều là bản tóm tắt của hệ thống tệp.
Trong cấu hình ba nút, Ceph sẽ có một hoặc nhiều daemon OSD chạy ở mỗi trang (một trên mỗi ổ đĩa). Dữ liệu được phân thành dải trên các OSD trong cụm và ứng dụng khách CephFS của bạn (nhân, FUSE hoặc Windows) sẽ truy cập theo thuật toán vào đúng nút để lưu trữ dữ liệu, không cần cổng. Điều này được thực hiện như thế nào thì còn lâu mới giải thích được, nhưng về cơ bản, nó là một ánh xạ bảng băm phân tán với dữ liệu bổ sung được lưu giữ phía máy chủ trong các trình nền MON.
Đường dẫn dữ liệu của CephFS thẳng, từ máy khách của bạn đến OSD, không có cổng xen kẽ.
Hệ thống tệp sử dụng một loại trình nền bổ sung, MDS, lưu trữ siêu dữ liệu hệ thống tệp của bạn. Nếu thao tác hệ thống tệp của bạn thực hiện thay đổi hệ thống tệp (ví dụ: tạo một thư mục), thì MDS sẽ được truy cập thay vì OSD.
Tuy nhiên, cụ thể đối với trường hợp sử dụng dự định của bạn, Ceph là một hệ thống lưu trữ đồng bộ và hiệu suất của nó sẽ giảm khi bạn kéo dài khoảng cách giữa các nút. Thông thường, bạn nên giữ cấu hình kéo dài trong vòng 10 mili giây độ trễ khứ hồi giữa các nút. Nói cách khác, các cụm Ceph thích sống trong một trung tâm dữ liệu, nhưng bạn có thể trải dài chúng ra khắp một thành phố hoặc một số quốc gia nhỏ nếu bạn có liên kết rất tốt.