Điểm:0

Mất quyền riêng tư có phải là một biến ngẫu nhiên không?

lá cờ us

Sách “chuẩn” (Dwork & Roth, 2014) định nghĩa Privacy loss như sau (p. 18)

Số lượng

$$ \mathcal{L}^{(\xi)}_{\mathcal{M}(x) || \mathcal{M}(y)} = \ln \left( \frac{\Pr[\mathcal{M}(x) = \xi]}{\Pr[\mathcal{M}(y) = \xi]} \đúng) $$

là quan trọng đối với chúng tôi; chúng tôi gọi nó là mất quyền riêng tư phát sinh bằng cách quan sát $\xi$. [...] Như mọi khi, không gian xác suất vượt quá số tiền của cơ chế $\mathcal{M}$.

Vì vậy, nó không nói rằng đó là một biến ngẫu nhiên.

Theo quan điểm của tôi, nó chỉ là một chức năng có giá trị thực $\mathcal{L}: (\mathcal{M} \times x \times y \times \xi) \to \mathbb{R}$ vì nó xuất ra nhật ký tỷ lệ của hai xác suất (các số betw. 0 và 1).

"Không gian xác suất vượt quá số tiền" hơi khó hiểu, nhưng tôi đoán họ đề cập ở đây đến $\Pr[.]$ chức năng, kể từ khi $\mathcal{M}$ là mật độ xác suất hoặc phân phối rời rạc.

Tuy nhiên, ở nhiều nơi tôi đã gặp biến ngẫu nhiên mất quyền riêng tư, ví dụ. đây:

Abadi, M., Chu, A., Goodfellow, I., McMahan, H. B., Mironov, I., Talwar, K., & Zhang, L. (2016). Học sâu với quyền riêng tư khác biệt. Kỷ yếu của Hội nghị ACM SIGSAC 2016 về Bảo mật Máy tính và Truyền thông, 308–318. https://doi.org/10.1145/2976749.2978318

Mất quyền riêng tư là một biến ngẫu nhiên phụ thuộc vào tiếng ồn ngẫu nhiên được thêm vào thuật toán. [...] Thay vào đó, chúng tôi tính toán các khoảnh khắc nhật ký của biến ngẫu nhiên mất quyền riêng tư, biến này được tổng hợp tuyến tính. Sau đó, chúng tôi sử dụng các khoảnh khắc bị ràng buộc, cùng với bất đẳng thức Markov tiêu chuẩn, để có được ràng buộc đuôi, đó là sự mất quyền riêng tư theo nghĩa của sự riêng tư khác biệt.

Hoặc tại đây:

http://www.gautamkamath.com/CS860notes/lec5.pdf

Định nghĩa 2. Cho $Y$$Z$ là hai biến ngẫu nhiên. Biến ngẫu nhiên mất quyền riêng tư $\mathcal{L}_{Y||Z}$ Là [...]

Câu hỏi của tôi là: Nếu mất quyền riêng tư là một biến ngẫu nhiên, thì nó phải có phân phối xác suất tương ứng, nghĩa là lấy tích phân thành 1. Nhưng đây dường như không phải là trường hợp chung của nhật ký tỷ lệ của hai tệp PDF (Laplace, Gaussian ) hoặc phân phối rời rạc (cơ chế lũy thừa, v.v.). Nó cũng không bao giờ được đề cập như một điều kiện để mất quyền riêng tư.

Vì vậy: Tôi đang thiếu một cái gì đó hay nó chỉ là một cái tên gây hiểu lầm (sai về mặt ngữ nghĩa)?

kodlu avatar
lá cờ sa
Lưu ý rằng đây là một chức năng cổ điển từ lý thuyết xác suất, có từ ít nhất là đầu thế kỷ 20, khả năng log.
Daniel S avatar
lá cờ ru
@kodlu Tôi nghĩ Good và Turing là những người đầu tiên dọn dẹp và chính thức hóa việc sử dụng logarit. Khảo sát của chính Good về sự phát triển của cái mà ông gọi là "trọng lượng của bằng chứng" rất đáng đọc: https://www.waterboards.ca.gov/water_issues/programs/tmdl/docs/303d_policydocs/207.pdf
John Doe avatar
lá cờ us
Cảm ơn, nhưng tôi không hiểu tại sao khả năng đăng nhập bằng cách nào đó lại liên quan đến việc mất quyền riêng tư ở đây... Tôi biết điều đó từ việc học máy để nhận xác suất dữ liệu dựa trên các tham số của mô hình (và lấy nhật ký hoặc âm để tính toán dễ dàng hơn, chẳng hạn như giảm thiểu ).
Điểm:1
lá cờ ru

Đó là một chức năng quan sát của bạn $\xi$, vì vậy nếu bản thân quan sát của bạn được rút ra từ phân phối xác suất hợp lý (ví dụ: để các quan sát là giá trị không thể cho $M(x)$$M(y)$ không xảy ra), nó là một biến ngẫu nhiên. Thông thường, chúng tôi xem xét trường hợp các quan sát được lấy từ khớp phân phối hoặc $M(x)$ hoặc $M(y)$. Lưu ý rằng bản thân hàm này không đại diện cho phân phối xác suất và do đó không cần tính tổng/tích phân thành 1.

Một ví dụ có thể giúp đỡ ở đây. Giả sử tôi có 2 con xúc xắc bốn mặt, một trong số đó (giả sử die $x$) tạo ra 1, 2, 3, 4 với xác suất lần lượt là 1/4, 1/4, 1/6, 1/3 và cái còn lại (giả sử die $y$) tạo ra chúng với xác suất lần lượt là 1/4, 1/4, 1/3, 1/6. Đang lấy $\xi$ như số được tung bởi một con súc sắc và sử dụng logarit trong cơ số 2, sau đó $\mathcal L(\xi)$ nhận ba giá trị có thể theo $\mathcal L(1)=0$, $\mathcal L(2)=0$, $\mathcal L(3)=-1$$\mathcal L(4)=1$.

Nếu con súc sắc lăn là chết $x$ sau đó $\mathbb P(\mathcal L(\xi)=0)=1/2$, $\mathbb P(\mathcal L(\xi)=-1)=1/6$$\mathbb P(\mathcal L(\xi)=1)=1/3$. Chúng tôi xác nhận rằng các xác suất có tổng bằng 1.

Tương tự như vậy nếu con súc sắc lăn là chết $y$ sau đó $\mathbb P(\mathcal L(\xi)=0)=1/2$, $\mathbb P(\mathcal L(\xi)=-1)=1/3$$\mathbb P(\mathcal L(\xi)=1)=1/6$.

Lưu ý rằng mức độ mất quyền riêng tư dự kiến ​​trong trường hợp đầu tiên là 1/6 và trong trường hợp thứ hai là -1/6. Trong cả hai trường hợp, nó là thước đo thông tin dự kiến ​​(tính bằng bit) ủng hộ niềm tin rằng $x$ chết đã được cuộn đạt được trên mỗi lần cuộn chết.

John Doe avatar
lá cờ us
Cảm ơn vì ví dụ! Vì vậy, nó *là* một biến ngẫu nhiên, thực sự! Nó chuyển đổi số thực thành số thực (tham số $\xi$) và được phân phối theo $\mathcal{M}(x)$.
John Doe avatar
lá cờ us
... điều này bây giờ cũng có ý nghĩa khi một người cần tính toán các phân kỳ (như trong ví dụ của bạn = không phải nó chỉ là một phân kỳ KL sao?)
Daniel S avatar
lá cờ ru
Kỳ vọng về sự mất quyền riêng tư khi $\xi$ được lấy mẫu từ $M(x)$ thực sự là phân kỳ KL. Tất nhiên, một biến ngẫu nhiên chứa nhiều thông tin hơn kỳ vọng của nó.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.