Điểm:2

Trích xuất ngẫu nhiên từ nguồn Santha-Vazirani (bán ngẫu nhiên)

lá cờ us

Trong một nhiệm vụ để hiểu rõ hơn về trình trích xuất ngẫu nhiên (trong bối cảnh xử lý hậu kỳ TRNG), tôi đã đọc một số bài báo về Máy chiết von NeumannNguồn Santha-Vazirani (SV-). Bộ trích xuất von Neumann là một thuật toán đơn giản hoạt động trên các nguồn độc lập, thiên vị, chẳng hạn như một đồng xu thiên vị. Tuy nhiên, các nguồn ngẫu nhiên vật lý có sẵn là không hoàn hảo và bị sai lệch và tương quan. Santha và Vazirani định nghĩa một nguồn như vậy, được gọi là nguồn SV.

Bài báo Santha-Vazirani rõ ràng chứng minh rằng không thể (một cách xác định) trích xuất một bit ngẫu nhiên gần như thống nhất từ ​​nguồn SV. Tôi không có nền tảng toán học cần thiết để hiểu biểu diễn, nhưng tuyên bố này thực sự làm tôi bối rối. Ví dụ: tôi mong đợi một hàm băm tạo ra các bit ngẫu nhiên đồng nhất từ ​​nguồn SV.

Cuộc biểu tình này thực sự có ý nghĩa gì? Có thể tạo TRNG tốt từ một (điều này không áp dụng cho một số) nguồn tương quan và sai lệch không?

Paul Uszak avatar
lá cờ cn
Tôi không quan tâm đến việc mọi người đổi tên các nguồn thường được biết đến theo tên của họ. Bỏ qua _"SV"_ và chỉ gọi nó là "tương quan" như những người khác vẫn làm.
Điểm:2
lá cờ cn

Tuy nhiên, các nguồn ngẫu nhiên vật lý có sẵn là không hoàn hảo và bị sai lệch và tương quan.

Không, họ không phải. Các nguồn không thực sự tạo ra bất kỳ entropy nào. Không có. Hãy tưởng tượng một diode Zener hoặc mạch dao động vòng trước mặt bạn. Họ chỉ ngồi đó tìm mạch.

Các người quan sát tạo ra entropy khi lấy mẫu nguồn. Nguồn thì không. Điều này dẫn đến khái niệm về $ (\epsilon, \tau) $-entropy trên một đơn vị thời gian, trong đó "$ (\epsilon, \tau) $-entropy là lượng thông tin được tạo ra trong một đơn vị thời gian, ở các tỷ lệ khác nhau $\tau$ thời gian và $\epsilon$ của các vật quan sát." Tỷ lệ lấy mẫu và độ phân giải hiệu quả. Điều đó có nghĩa là người quan sát có thể thay đổi vô hạn tốc độ entropy của nguồn theo quyết định của họ, bằng cách thay đổi một trong hai $\tau$ hoặc $\epsilon$.

Điều này sau đó tiếp tục dẫn đến một vấn đề hai mặt không đối xứng: Làm thế nào để chúng ta đo lường $H_{\infty}$ cho các nguồn tương quan? Có hai giải pháp không đối xứng: -

  1. Cố gắng xác định $H_{\infty}$ cho một nguồn tương quan với độ chắc chắn rất thấp.

  2. điều chỉnh của bạn $ (\epsilon, \tau) $ chế độ lấy mẫu để tạo ra dữ liệu không tương quan với độ chắc chắn cao.

Hầu như không ai làm #1, và thậm chí NIST có nói nó gần như là không thể (nhận xét không được bảo vệ của Kerry McKay). Tôi không thể tưởng tượng những gì $H_{\infty}$ có nghĩa là thực tế trong một kịch bản tương quan. Vì vậy, làm # 2 như đa số áp đảo làm, có được $H_{\infty}$ như $-\log_2{(p_{\text{max}})}$ và giải nén.

Vì vậy nó có thể tạo một TRNG tốt từ một sai lệch và tương quan nguồn.

Bài báo Santha-Vazirani rõ ràng chứng minh rằng không thể (một cách xác định) trích xuất một bit ngẫu nhiên gần như thống nhất từ ​​nguồn SV.

Không hẳn. Nó thực sự nói " ngược lại, chúng tôi chứng minh rằng không có thuật toán nào có thể trích xuất ngay cả một bit không thiên vị từ một nguồn bán ngẫu nhiên (trên thực tế, không tốt hơn 1 - $\delta$ hơi thiên vị). " Đây là kiến ​​​​thức đã được thiết lập và xuất hiện trong tất cả các loại giấy tờ 'trình trích xuất'. Điều đó đơn giản có nghĩa là bất kỳ tính ngẫu nhiên được trích xuất nào sẽ luôn có 1 - $\delta$ Thiên kiến. NIST chỉ khuyên bạn nên giữ nó bên dưới $2^{-64}$ đó là dễ dàng.


Tham khảo: Pierre Gaspard và Xiao-Jing Wang, Ồn ào, hỗn loạn và $ (\epsilon, \tau) $-entropy trên một đơn vị thời gian, PHYSICS REPORTS (Phần Ôn tập về Thư Vật lý) 235, Số 6 (1993) 291–343. Bắc-Hà Lan.

DurandA avatar
lá cờ us
Cảm ơn. Tôi bắt đầu đọc tài liệu tham khảo Gaspard-Wang. Trong trường hợp tín hiệu được lấy mẫu kỹ thuật số, $\epsilon$ có phải là không gian ký hiệu (ví dụ: 2 cho tín hiệu nhị phân) không?
Paul Uszak avatar
lá cờ cn
@DurandA Tôi nghĩ rằng họ đã để nó mơ hồ vì nó có thể là một vài điều. Nó có thể là độ phân giải ADC tính bằng bit hoặc có thể tính bằng milivôn (tất nhiên những thứ này có liên quan). Trong một cái gì đó giống như `haveged` TRNG, nó là số giá trị bit. Về cơ bản, đó là thứ mà bạn _"quan sát_", tức là đo lường (đó không phải là thời gian vì đó là $\tau$).
DurandA avatar
lá cờ us
Bây giờ tôi hiểu rõ hơn nhận xét của bạn về việc lấy mẫu tần số cao của nguồn tương quan trong [câu hỏi liên quan] của tôi(https://crypto.stackexchange.com/q/92020/39499).
Paul Uszak avatar
lá cờ cn
@DurandA Vâng. Hãy tưởng tượng ném một con súc sắc công bằng cứ sau 10 giây. Lấy mẫu với tốc độ 1 mẫu/giây và bạn có mối tương quan gần như hoàn hảo. Nhưng hãy lấy mẫu cứ sau 11 giây và bạn có một nguồn không tương quan. Và việc bạn đi chậm hơn trong trường hợp sau không thực sự quan trọng, vì trong trường hợp trước, tỷ lệ entropy của bạn dù sao cũng sẽ rất thấp do tự tương quan.
DurandA avatar
lá cờ us
"_chúng tôi cho thấy rằng không có thuật toán trích xuất bit nào tốt đồng đều cho mọi phân phối bán ngẫu nhiên với tham số $\delta$_": làm thế nào điều này có thể áp dụng cho các hàm băm?
Paul Uszak avatar
lá cờ cn
@DurandA Tôi không thể về mặt toán học - Tôi là một anh chàng thích thử nghiệm.Có rất nhiều bài viết về toán học. Nhưng các hàm băm là xác định. Bản thân họ không giới thiệu entropy. Hãy tưởng tượng một hàm băm 8 bit được cung cấp bởi entropy thô 8 bit bị sai lệch (được thiên vị sao cho tất cả các giá trị> 63). Mặc dù miền đầu ra thoạt nhìn sẽ được trải đều, nhưng nó sẽ thiếu một phần tư giá trị có thể có vì nó là ánh xạ 1: 1 (thực tế là phép chiếu nhưng bỏ qua điều đó). Bạn có thể giảm $\delta$, nhưng không thể giảm xuống mức 0 tuyệt đối.
DurandA avatar
lá cờ us
Tôi đã không nhận ra rằng việc sử dụng đầu vào sai lệch dài hơn, ví dụ: băm 1 Mb dữ liệu ngẫu nhiên tương quan và sai lệch thành 256 bit sẽ không tạo ra đầu ra đồng nhất mà gần như đồng nhất. Phần trình diễn chỉ áp dụng cho dữ liệu ** và dữ liệu tương quan ** sai lệch phải không? Mặt khác, dữ liệu có thể được xử lý trước bằng bộ trích xuất von Neumann. Cảm ơn bạn đã dành thời gian.
Paul Uszak avatar
lá cờ cn
@DurandA Tôi đã dành thời gian nghiên cứu TRNG và tôi tin rằng phương pháp dễ nhất (và an toàn nhất) là điều chỉnh chế độ lấy mẫu của bạn $(\epsilon, \tau)$ để các mẫu của bạn không tương quan với nhau. vN sau đó trở nên không liên quan.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.