Các chỉ số trùng hợp là thước đo mức độ khác nhau của một tập hợp các chữ cái so với một tập hợp ngẫu nhiên dựa trên số lần lặp lại. Đối với một bảng chữ cái gồm 26 chữ cái, một tập hợp các chữ cái hoàn toàn ngẫu nhiên sẽ có chỉ số trùng hợp về $1/26\xấp xỉ 0,038$, đối với văn bản tiếng Anh, chỉ số trùng hợp là khoảng 0,067 (một số nguồn không chuẩn hóa chỉ số và thay vào đó sẽ sử dụng giá trị 1 cho ngẫu nhiên và khoảng 1,73 cho tiếng Anh).
Nếu chúng ta nhìn vào bảng, mọi thứ có vẻ cao hơn một chút so với ngẫu nhiên, nhưng cột thứ sáu dường như chứa đầy các giá trị có chỉ số trùng hợp tương tự hoặc lớn hơn với tiếng Anh (văn bản có thể được tạo ra để giúp phân tích mật mã). Cách tạo bảng là sử dụng tiêu đề cột, văn bản được chia thành số cột đó. Sau đó, lần lượt nhìn xuống từng cột, sự trùng hợp giữa các cặp chữ cái được sử dụng để tính chỉ số. Vì vậy, ví dụ để tạo cột thứ sáu của bảng, chúng tôi viết
KCCPKB
GUFDPH
QTYAVI
NRRTMV
GRKDNB
VFDETD
GILTXR
GUDDKO
TFMBPV
GEGLTG
CKQRAC
QCWDNA
WCRXIZ
AKFTLE
WRPTYC
QKYVXC
HKFTPO
NCQQRH
JVAJUW
ETMCMS
PKQDYH
JVDAHC
TRLSVS
KCGCZQ
QĐZXGS
FRLSWC
WSJTBH
CHÂU PHI
PRJAHK
JRJUMV
GKMITZ
HFPDIS
PZLVLG
WTPLK
KEBDPG
CEBSHC
TJRWXB
AFSPEZ
QNRWXC
VYCGAO
NWDDDKA
CKAWBB
IKFTIO
VKCGGH
JVLNHI
FFSQES
VYCLAC
NVRWBB
IREPBB
VFEXOS
CDYGZW
PFDTKF
QIYCWH
JVLNHI
QIBTKH
JVNPIS
t
và để tính toán mục nhập trong cột thứ sáu, hàng thứ hai của bảng, chúng tôi đi xuống tìm kiếm thứ hai lặp lại RR, CC, RR, EE, KK, KK, nhiều hơn đáng kể so với những gì chúng tôi mong đợi đối với danh sách 56 chữ cái (trong đó trung bình chúng tôi mong đợi 2,15 lần lặp lại cho một bộ sưu tập ngẫu nhiên). Tương tự, đếm các lần lặp lại ở khoảng cách 2, 3, v.v. chúng ta có thể tổng hợp chúng thành một ước tính cho chỉ số trùng khớp cho mỗi cột. Ví dụ: trong cột 2, chúng tôi thấy 5 C, 2 D, 3 E, 8 F, 3 Is, 1 J, 9 K, 1 N, 8 R, 1 S, 3 T, 2 Us, 6 V, 1 W, 2 Ys và 1 Z (và không có chữ cái nào khác). Điều này có nghĩa là nếu chúng ta đếm các cặp lặp lại, thì có 10 cặp C, 1 cặp D, 3 cặp E, 28 cặp F, 3 cặp Is, 36 cặp K, 28 cặp R, 3 cặp T. , 1 cặp Hoa Kỳ, 15 cặp V và 1 cặp Y (và không có cặp nào khác) trong tổng số 129 cặp tổng số lặp lại của chúng tôi trong số 1540 cặp có thể có. Chia 129 cho 1540 sẽ cho chỉ số mẫu cột là 0,0838 (Tôi không chắc cách tính 0,097 trong bảng nhưng 0,0838 vẫn cao hơn đáng kể so với 1/26). Các tính toán tương tự cho phần còn lại của các mục trong cột sáu của bảng cho 0,0649, 0,0838, 0,0494, 0,0649, 0,0429, 0,0733. Ngược lại tính toán của chúng tôi khi chúng tôi chia thành bảy cột là 0,0319, 0,0443, 0,0434, 0,0408, 0,0443, 0,0443, 0,0408 và năm cột là 0,0439, 0,0443, 0,0325, 0,0353 và 0,0430. Cột sáu rõ ràng nổi bật.
Các cột khác hiển thị là cao hơn ngẫu nhiên đối với các hiệu ứng ít rõ rệt hơn của mật mã Vigenère, nhưng cột 6 của bảng nổi bật. Điều này cho chúng tôi biết rằng độ dài khóa có thể là 6. Chúng tôi có thể kiểm tra thêm điều này bằng cách đếm số lượng biểu đồ của các cột ở trên và thấy rằng chúng trông giống như các ca của cùng một bảng chữ cái.
Có thể mở rộng bảng ra ngoài 8 cột, nhưng chúng tôi thấy mình phải xử lý các tập hợp chữ cái ngắn hơn để tính toán chỉ mục của mình.Có nhiều kiểm tra thống kê hiệu quả hơn có thể được sử dụng trên các tập hợp các chữ cái, nhưng chỉ số trùng khớp khá dễ tính toán bằng tay và mắt và do đó rất phổ biến với các nhà phân tích mật mã thủ công.