Điểm:3

Làm cách nào để sử dụng chính xác Chỉ số trùng khớp trong Cyphertext?

lá cờ au

Tôi đã tiếp xúc với một bản mã, đó là:

        KCCPKBGUFDPHQTYAVINRRTMVGRKDNBVFDEDTDGILTXRGUD
        DKOTFMBPVGEGLTGCKQRACQCWDNAWCRXIZAKFTLEWRPTYC
        QKYVXCHKFTPONCQQRHJVAJUWETMCMSPKQDYHJVDAHCTRL
        SVSKCGCZQQDZXGSFRLSWCWSJTBHAFSIASPRJAHKJRJUMV
        GKMITZHFPDISPZLVLGWTFPLKKEBDPGCEBSHCTJRWXBAFS
        PEZQNRWXCVYCGAONWDDKACKAWBBIKFTIOVKCGGHJVLNHI
        FFSQESVYCLACNVRWBBIREPBBVFEXOSCDYGZWPFDTKFQIY
        CWHJVLNHIQIBTKHJVNPIST

Tuy nhiên, khi tôi thử áp dụng IC (chỉ số trùng hợp), tôi không hiểu tại sao lại sử dụng

        Cột 2 3 4 5 6 7 8
        1 0,044 0,064 0,049 0,057 0,079 0,050 0,056
        2 0,0524 0,056 0,054 0,057 0,097 0,062 0,062
        3 0,057 0,049 0,048 0,066 0,063 0,057
        4 0,060 0,049 0,082 0,061 0,063
        5 0,057 0,060 0,064 0,062
        6 0,090 0,064 0,068
        7 0,061 0,063
        8 0,077

với thực tế là chúng ta biết rằng HJV xảy ra 5 lần ở trên với khoảng cách giữa các lần xuất hiện bằng 18, 138, 54 và 12. Giả sử kích thước của khóa là 6, tôi tiếp tục không hiểu bảng trên.

Điểm:2
lá cờ ru

Các chỉ số trùng hợp là thước đo mức độ khác nhau của một tập hợp các chữ cái so với một tập hợp ngẫu nhiên dựa trên số lần lặp lại. Đối với một bảng chữ cái gồm 26 chữ cái, một tập hợp các chữ cái hoàn toàn ngẫu nhiên sẽ có chỉ số trùng hợp về $1/26\xấp xỉ 0,038$, đối với văn bản tiếng Anh, chỉ số trùng hợp là khoảng 0,067 (một số nguồn không chuẩn hóa chỉ số và thay vào đó sẽ sử dụng giá trị 1 cho ngẫu nhiên và khoảng 1,73 cho tiếng Anh).

Nếu chúng ta nhìn vào bảng, mọi thứ có vẻ cao hơn một chút so với ngẫu nhiên, nhưng cột thứ sáu dường như chứa đầy các giá trị có chỉ số trùng hợp tương tự hoặc lớn hơn với tiếng Anh (văn bản có thể được tạo ra để giúp phân tích mật mã). Cách tạo bảng là sử dụng tiêu đề cột, văn bản được chia thành số cột đó. Sau đó, lần lượt nhìn xuống từng cột, sự trùng hợp giữa các cặp chữ cái được sử dụng để tính chỉ số. Vì vậy, ví dụ để tạo cột thứ sáu của bảng, chúng tôi viết

KCCPKB
GUFDPH
QTYAVI
NRRTMV
GRKDNB
VFDETD
GILTXR
GUDDKO
TFMBPV
GEGLTG
CKQRAC
QCWDNA
WCRXIZ
AKFTLE
WRPTYC
QKYVXC
HKFTPO
NCQQRH
JVAJUW
ETMCMS
PKQDYH
JVDAHC
TRLSVS
KCGCZQ
QĐZXGS
FRLSWC
WSJTBH
CHÂU PHI
PRJAHK
JRJUMV
GKMITZ
HFPDIS
PZLVLG
WTPLK
KEBDPG
CEBSHC
TJRWXB
AFSPEZ
QNRWXC
VYCGAO
NWDDDKA
CKAWBB
IKFTIO
VKCGGH
JVLNHI
FFSQES
VYCLAC
NVRWBB
IREPBB
VFEXOS
CDYGZW
PFDTKF
QIYCWH
JVLNHI
QIBTKH
JVNPIS
t

và để tính toán mục nhập trong cột thứ sáu, hàng thứ hai của bảng, chúng tôi đi xuống tìm kiếm thứ hai lặp lại RR, CC, RR, EE, KK, KK, nhiều hơn đáng kể so với những gì chúng tôi mong đợi đối với danh sách 56 chữ cái (trong đó trung bình chúng tôi mong đợi 2,15 lần lặp lại cho một bộ sưu tập ngẫu nhiên). Tương tự, đếm các lần lặp lại ở khoảng cách 2, 3, v.v. chúng ta có thể tổng hợp chúng thành một ước tính cho chỉ số trùng khớp cho mỗi cột. Ví dụ: trong cột 2, chúng tôi thấy 5 C, 2 D, 3 E, 8 F, 3 Is, 1 J, 9 K, 1 N, 8 R, 1 S, 3 T, 2 Us, 6 V, 1 W, 2 Ys và 1 Z (và không có chữ cái nào khác). Điều này có nghĩa là nếu chúng ta đếm các cặp lặp lại, thì có 10 cặp C, 1 cặp D, 3 cặp E, 28 cặp F, 3 cặp Is, 36 cặp K, 28 cặp R, 3 cặp T. , 1 cặp Hoa Kỳ, 15 cặp V và 1 cặp Y (và không có cặp nào khác) trong tổng số 129 cặp tổng số lặp lại của chúng tôi trong số 1540 cặp có thể có. Chia 129 cho 1540 sẽ cho chỉ số mẫu cột là 0,0838 (Tôi không chắc cách tính 0,097 trong bảng nhưng 0,0838 vẫn cao hơn đáng kể so với 1/26). Các tính toán tương tự cho phần còn lại của các mục trong cột sáu của bảng cho 0,0649, 0,0838, 0,0494, 0,0649, 0,0429, 0,0733. Ngược lại tính toán của chúng tôi khi chúng tôi chia thành bảy cột là 0,0319, 0,0443, 0,0434, 0,0408, 0,0443, 0,0443, 0,0408 và năm cột là 0,0439, 0,0443, 0,0325, 0,0353 và 0,0430. Cột sáu rõ ràng nổi bật.

Các cột khác hiển thị là cao hơn ngẫu nhiên đối với các hiệu ứng ít rõ rệt hơn của mật mã Vigenère, nhưng cột 6 của bảng nổi bật. Điều này cho chúng tôi biết rằng độ dài khóa có thể là 6. Chúng tôi có thể kiểm tra thêm điều này bằng cách đếm số lượng biểu đồ của các cột ở trên và thấy rằng chúng trông giống như các ca của cùng một bảng chữ cái.

Có thể mở rộng bảng ra ngoài 8 cột, nhưng chúng tôi thấy mình phải xử lý các tập hợp chữ cái ngắn hơn để tính toán chỉ mục của mình.Có nhiều kiểm tra thống kê hiệu quả hơn có thể được sử dụng trên các tập hợp các chữ cái, nhưng chỉ số trùng khớp khá dễ tính toán bằng tay và mắt và do đó rất phổ biến với các nhà phân tích mật mã thủ công.

João Víctor Melo avatar
lá cờ au
Bạn có thể hiển thị rõ ràng dữ liệu và phép tính bạn đang xử lý không?
Daniel S avatar
lá cờ ru
Bạn có thể cho tôi biết bảng trong câu hỏi của bạn đến từ đâu không? Tôi muốn liên hệ nó với phương pháp được sử dụng ở đó.
João Víctor Melo avatar
lá cờ au
https://www.cise.ufl.edu/~mssz/Class-Crypto-I/Homework/Homework-1.html
João Víctor Melo avatar
lá cờ au
Bạn có ý nghĩa gì bởi cặp lặp lại?
Daniel S avatar
lá cờ ru
Một cặp lặp lại là một cặp chữ cái giống hệt nhau trong cùng một cột.
João Víctor Melo avatar
lá cờ au
Bạn nói có 5C và sau khi bạn nói có 10 cặp C?
Daniel S avatar
lá cờ ru
Có, vì có $({5\atop 2})=10$ cách để chọn 2 trong số 5 thứ.

Đăng câu trả lời

Hầu hết mọi người không hiểu rằng việc đặt nhiều câu hỏi sẽ mở ra cơ hội học hỏi và cải thiện mối quan hệ giữa các cá nhân. Ví dụ, trong các nghiên cứu của Alison, mặc dù mọi người có thể nhớ chính xác có bao nhiêu câu hỏi đã được đặt ra trong các cuộc trò chuyện của họ, nhưng họ không trực giác nhận ra mối liên hệ giữa câu hỏi và sự yêu thích. Qua bốn nghiên cứu, trong đó những người tham gia tự tham gia vào các cuộc trò chuyện hoặc đọc bản ghi lại các cuộc trò chuyện của người khác, mọi người có xu hướng không nhận ra rằng việc đặt câu hỏi sẽ ảnh hưởng—hoặc đã ảnh hưởng—mức độ thân thiện giữa những người đối thoại.