Trong số các phương pháp đảm bảo ATTT thì phưcnig pháp mật mã hóa Cryptography được sử dụng rộng rãi và dảm bảo an toàn nhất.. Tuy nhiên phương pháp mật mã hóa cũng có những yếu điểm qua
Trang 1TS HỔ VÁN CANH, TS NGUYỄN VIẾT THÊ
Trang 2Trong số các phương pháp đảm bảo ATTT thì phưcnig pháp mật
mã hóa (Cryptography) được sử dụng rộng rãi và dảm bảo an toàn nhất Tuy nhiên phương pháp mật mã hóa cũng có những yếu điểm quan trọng là nếu phương pháp mật mã hóa không tốt (mặc dù việc quản lý khóa mã được giả thiết là an toàn) thì rất nguy hiểm Vậy làm thế nào để đánh giá được chất lượng của một hệ mật mã là tốt? Có nhiều phương pháp đánh giá chất iượng cùa một hệ mật như phương pháp Entropy của Shannon, nhưng phương pháp tổt nhất và là trực quan nhất, đố là phương pháp phân tích trực tiếp bản mã khi không có khóa mã trong tay mà người ta thường gọi là thám mS (Cryptanalysis) Đây là một bộ môn mới đ i ^ công khai hóa trong thời gian gần đầy
Đê bước đầu làm quen với môn "nghệ thuật" này, NXB Thông tin và Truyền thông đã xuất bản cuốn sách ^Nhộp môn phân tích thông tin
cỏ bio mật** giới thiệu đến bạn dọc Đây là phương pháp đảm bảo
Trang 3ATTT lâu đời nhất, quan trọng nhất và được nghiên cứu phát triểr
ngày càng rộng rãi N ó đã trở thành m ột ngành khoa học được gọi lỉ
khoa học về phân tích mật mâ (Cryptanalysis).
Cuốn sách được TS Hồ Văn Canh và TS Nguyễn Viết Thể tổng hợp và biên soạn từ nhiều kết quả nghiên cứu khoa học đã được côti|
bổ cùng với kinh nghiệm tích iuỹ được sau 30 năm tỉm tòi, nghiên cún
và trực tiếp giảng dạy của các tác giả Cuốn sách gồm 7 chương;
Chương / ; Khái niệm về mã thám
Chương 2: Một sổ kiến thức bồ trợ
Chương 3: Các bước cơ bàn để tiến hành thám mã
Chương 4: Thực hành phán tích một số luật mõ thuộc hệ mội
truyền thống
Chương 5: Một số phương pháp thám mõ dữ liệu DES
Chương 6: Mật mõ công khai và phương pháp thám mõ
Chương 7: Phương pháp tẩn công RSA không cần phán tích nhân tử.
Hy vọng cuốn sách sẽ thực sự hừu ích đối với các kỳ sư, kỹ thuật viên, cán bộ giảng dạy và sinh viên ngành Công nghệ Thcng tin, Điện
tử Viễn thông, Ngành Mật mã khi thực hiện đề tài, đồ án, các dự án, cùng như tix>ng giảng dạy, học tập Ngoài ra, cuổn sách cùng ià tái liệu tham khảo bể ích cho bạn đọc quan tâm tới lĩnh vực này.
Nhà xuẩt bản xin giới thiệu cùng bạn đọc và rất tnong nhận dược ý kiến đỏng gỏp của quý vị Mọi ỷ kiến dỏng gốp xin gửi về Nhà xuất
bản nông tín và Trụyền thông • 18 Nguyễn Du, Hà Nội
Trán trọng cảm ơn./.
N X B THÔNG TIN VÀ TRUYỀN THÔNG
Trang 4Chương 1
KHẤi NIỆM VỂ MA THÀM
1.1 MỞ ĐẦU
T rong phần trìn h b à y này, ch ú n g ta tạm p h ân m ã đổi
xứ n g làm h a i phần, m ật m ă cổ điển và m ật m ă "hiện đại", ở
đ â y ch ú n g ta ph ân b iệt k h á i niệm "hiện đại" tron g hệ th ố n g
m ật m ã đối xứng được d ừ n g trong cuốh sá ch n à y với k h á i
n iệm "hiện đại" trong h ệ m ật m ã bất đối xứng T rong phạm v i
cu ố n sách này, ta hiểu m ật m ã "hiện đại" là hệ mật khoá đổi xứng nhưng nó đã p h á t triển ở mức cao, đặc b iệt ỉà tự động
h oá trong việc m ã dịch M ật m ã n à y h iện n a y đ a n g p h á t triển
m ạnh như m ật m ã với k h o á th u ật to á n D E S; 3D ES; IDEÂ; FEAL; AES,.„ C hính v ì vậy, ch ú n g ta gọi m ật m ã như vậy là mật m ã h iện đại Còn m ật m ã cổ điển ỉà m ật m ã được m ã/dịch bằng thù công, mật m ã ỉoạỉ n à y ra đòi sớm nhất, nó được sử dụng, p h á t triển lâ u đòi v à đến n a y nó chi tồn tại ở m ột số nước đ an g p h á t triển v à cũng chỉ trong m ột phạm v ỉ hẹp, ồ
n h ũ n g nời kh ó k h ă n tro n g ứ n g d ụ n g công n g h ệ đ ỉện /đ ỉện từ (ví dụ tron g ỉực lượng q u â n sự hoạt động p h â n tán , tron g
v ù n g nông thôn, rừng n ú i hoặc trong các đcfn vị tìn h báo.«)
T u y n h iên , ch ín h mật m ă ỉoại n à y lại ỉà nền tản g cho sự p h á t triển của m ật m ã h iện đại (th eo n g h ĩa của cuốn sách này).
Trang 5Nhập môn Phân tỉch thông tin có hào mật
C hính vì vậy, v iệc n g h iên cứu thám mở đ iện m ã c ủ a m ật
m ã cổ đ iển có ý n g h ĩa qu an trọng phục vụ việc nghiên cứu
th á m mỏ các h ệ th ô n g m ật m ă hiện đại Trên cơ sỏ đó góp phần tă n g cưòng độ an toàn cho các hệ m ật m ã hiện đại,
nh ằm góp phần bảo v ệ an n inh thông tin trong tìn h hình mới.
V ề m ật m â cổ đ iển th ì có rất nhiều loại N goài ra cũng có
rấ t n h iề u loại b iến th ể củ a ch ú n g nhằm ỉàm tă n g độ an toàn cho m ậ t m ã D o đó, c h ú n g tôi không đ ề cập h ết tấ t cả các loại
m ậ t m ã cổ đ iển cù n g các b iến th ể của ch ú n g m à ch ỉ trình bày
m ột s ố lo ạ i đ iển h ìn h n h ấ t đã và đang được d ù n g mà có
n h ữ n g ỉoại v ẫ n d ù n g cho đến hôm nay.
1.2 CÁC THUẬT NGỮ cd BẢN VỀ MẬT MẲ VÀ MÂ THÁM
t.2 1 Mật mã (Cryptography)
M ật m ã là tập hợp m ọi phưdng pháp (hoặc quy tác) biến đổi n à o đó nh ằm ch u y ển các th ông báo (m essa g es) dưới dạng
n h ậ n thức đưỢc nội d u n g (như chữ viết, tiế n g nói, hinh vẽ,
h ỉn h ả n h ,_ ) th à n h d ạ n g bí m ậ t m à n h ũ n g người ngoài cuộc
k h ôn g h iểu được n ội d u n g nếu họ không b iết được phưdng pháp (hoặc quy tắc) b iến đổi đó.
Cồn m ậ t m ã học (CrỊrptology) ià m ột bộ m ôn khoa học
ch u y ên n g h iên cứu v ề m ộ t m ã và m ã th ám
1.2.2 Bẳn rõ (Plain text)
T a h iể u bẳn rõ tú c là m ột bản th ô n g báo có m ang nội
d u n g th ô n g tin m à ngư òỉ đọc có th ể h iểu được nó nói cái gì
Trang 6Chương ỉ: Khái niệm về mã thảm
hoiặc là nó có ý n g h ĩa rõ ràng B ản rõ (bản th ô n g báo) có th ể
t ồ n tạ i dưới dạng chữ v iế t, tiế n g nói, h ìn h vẽ, biểu b ả n g ,
tư tíng ứ n g ta sẽ có k h á i n iệm m ã ký tự, m ã th oại, m ă fax, m ã
d ữ liệu
B ản rõ th ư òng được b iểu d iễn (viết) dưới d ạ n g m ột dây
c á c chữ cái th eo quy tắ c cú ph áp n ào đó hoặc k ý h iệu th u ộc
b ả n g chữ c á i »í / h ữ u h ạ n được xác đ ịnh trước Đ ể d ễ trìn h
b à y , ta k ý hìế\x»yíí là k h ô n g g ia n các bản rõ (m essa g e space)
V í dụ: •/(( có th ể là gồm các d ãy n h ị phân, các v á n b ản tiế n g
V iệ t, hoặc m ã chương tr ìn h m áy tính™
1 2 3 B ản m ã (C ip h e r te x t)
B ản m ã th ư òng c ũ n g được b iểu d iễn dưới d ạ n g m ột d ăy
c á c ký h iệu có th ể cũ n g th u ộ c ♦*/ n h ư n g k h ông th eo m ột quy
tắ c cú pháp nào cả N gười ta nói rằ n g đó ỉà d ăy n g ẫ u n h iên
T a ký h iệu tập tấ t cả b ản m â ứ n g vối các b ản rõ m là ^
C hú ý ràng các ký h iệ u củ a c € ^ c ó th ể k h ôn g thuộc
1.2.4 Phép biến d â mã/dịch (Encrytion/decryption
Transíormations)
T rong việc tạo ra b ả n m ã từ bản rõ, ngưòi ta cầ n đến h a i
y ế u tô' là: các th a m sô' v à m ột q u y tắc m ã/dịch T ham số đó
n gư òi ta gọi ỉà k hoá m ã/d ịch (k ey seed) T ập tấ t cả các kh oá (m ầ m khoá) đó tạo th à n h m ột k h ô n g g ia n k h oá v à được k ỷ
h iệ u là •'/{. Còn m ột q u y tắ c m ã là m ột á n h xạ từ k h ôn g g ia n
• 4( vào k h ôn g g ia n ^ p h ụ th u ộc vào m ột kh oá cho trước
T a k ý h iệu nó là Egt >41 ^ với e 6 Á n h xạ n à y p h ả i là
Trang 7so n g á n h (án h xạ lê n và 1 - 1) và á n h xạ ngược của ánh xạ Eg được gọi là quy tắc dịch (T ranslation) tức là quy tắc biến đổi
b ản m ã c € ^ th à n h bản rõ tưdng ứ ng m 6 -yií được ký h iệu
là Dj, d đ ây d e Các khoá m ã e và khoá dịch d tạo th à n h
m ột cặp k h oá m ã/dịch v à được v iế t là (e, d) Chú ý rằng e và
d có th ể trù n g nhau.
- Q uá trìn h áp d ụ n g phép biến đổi bản rõ m € > th à n h
b ả n m ã tư dng ứ n g c € ^ được gọi là mã hoá.
- Q uá trìn h áp d ụ n g phép b iến đổi vào bản mã đ ể tạo ra bản rõ m tương ứ ng được gọi là g iả i m ã (decryption
hoặc decipherin^.
- Lược đồ m ã h o á (enryption scbeme) là gồm tập hỢp tấ t
c ả h à m m ã hoá Eg ứ n g vói m ỗi e € và t ấ t cả h àm giả i m ã
ứ ng với d 6 H àm và Ee ph ải th oả m ãn h ệ thức;
Dj= Ee * với V (e.d) 6 >ír X
Tức là m = Dd (c) = Ee (E (m))
N h ư v ậ y đ ể người n h ậ n (tích thực dịch đưđc bản m ã từ ngư òi gử i tới th ì đường n h iên người n h ậ n p h ẳ i cố khoá dịch d
v à qu y tắc dịch Dj V iệc n à y có th ể thực h iệ n được bằn g sự trao đổi khoá giữ a 2 bên, ta ký h iệu 2 b ên đó là Â và B
T ron g m ậ t m ã cổ đ iển tru y ền thống, việc trao đổi này phải được đảm bảo b í m ậ t kh ông đ ể cho b ất kỳ m ột đối tác c (đôi
tá c th ứ 3) nào biết V ì khoá m ã q u y ết đ ịn h đến độ an toàn mẠt m ã T rong ỉú c đó th u ậ t toán m ã/dịch thư ờng đơn giản và được q u y ưóc trưốc giữ a h a i b ên A v à B,
Trang 8_ ^
Chương 1: Khái niệm vê mã thảm
1 2 5 Mẳ thám
Quá trìn h khôi phục lại bản rõ hoặc k h o á khi ch ỉ có bản
m ã tương ứ n g cho trưốc được gọi là th á m m ã N gư òi làm công
tá c thám m ã được gọi là ngưòi m ã th á m (Cryptanalysist) h a y
lạ i phụ thuộc vào trìn h độ khoa học v à cô n g n g h ệ củ a nước
đó Nước nào có trìn h độ k h o a học công n g h ệ c à n g cao th ì k h ả
n ă n g của công tác th á m m ã nói riên g, tìn h báo đ iện tử nói
c h u n g c à n g m ạnh.
1 2 6 Nhóm báo khoá (Label)
Trong các h ệ m ậ t m ã tru y ền th ống, k h i bản m ã được chuyển từ nơi gử i đ ến ndi n h ậ n th ì đương n h iên nơi n h ậ n
p h ải có khoá m ã đ ể dịch Các khoá m ã và k h oá dịch m ã được
ch u yển cho n h au trước lúc b ắ t đầu th ố h g n h ấ t vổi n h au (giữa nơi gử: A và ndi n h ậ n đích thự c B) v ề v iệc liê n lạc N h ư n g sô" lượng các khoá m ă/dịch th ư ò n g là rất n h iều , do vậy đ ể 2 b ên
A và B th ổ h g n h ấ t với n h a u họ p h ải th ô n g báo cho n h a u b iết búc điện m ă cụ th ể được m ã từ kh oá nào, th ô n g báo khoá nào được sử dụng, ngư òi t a th ư ò n g gh i tê n k h o á hoặc s ế h iệu củ a khoá mă th à n h từ n g nh óm n g a y tron g b ả n m ã rồi gử i đến nơi
n h ậ n đích thực T ên k h oá hoặc 8ấ h iệu củ a khoá đó được gọi
là nhóm báo khoá C ăn cứ v ào nhóm báo kh oá, m ật m ã v iê n
Trang 9s ẽ xác đ ịn h được k h o á m ã - khoá dịch tưđng ứng Đ ể đôl phó vối các cơ q u an m ã th á m có th ể ph át h iện ra nhóm báo k h oá
v à từ đó dự đoán được ỉu ậ t m ă và n h ữ n g bản m ã trù n g kh oá,
nh óm báo khoá trưóc lúc cho vào bản m ã đã được mã hoá
th eo quy tắ c n ào đó do 2 bên A và B th oả th u ậ n trước.
1.3 ĐẶC TRƯNG C0 BẢN CỦA BẢN Rỗ
Đ ể n g h iên cứu th á m mỗ được các bản mã tru yền thổhg, người m ã th á m p h ả i n g h iê n cứu các đặc trưng cơ bản của bản
rõ Đ ó là qu y lu ậ t tầ n số, quy lu ậ t trù n g lặp, quy lu ậ t v à n
ph ong, N ói m ột cá ch khác trong m ọi ngôn ngữ tự n h iên đều
có n h ữ n g đặc trư n g b ấ t b iến m à m ã thám v iên cần nắm vữ n g
đ ể phục vụ việc p h â n tích các bản mã.
Đệ tiện, vịệẹ thẹo, dõi, n g h iện cứụ y ề sạu m à v ẫ n k h ôn g
m ấ t tín h tổ n g quát, ch ú n g ta d ù n g tiế n g A nh làm đối tượng
n g h iê n cứu tron g to à n bộ cuôn sá ch này.
1.3.1 Tần số (Prequency)
N gư òi ta đ ịn h n g h ĩa tầ n s ố x u ấ t h iện m ột ký tự, m ột
nh óm k ý tự, m ột từ h a y m ột vầ n trong m ột vá n bản là sô'
lầ n x u ấ t h iệ n củ a k ý tự, nhóm ký tự, từ, vần đó trong vàn bản đã cho.
N gư òi ta có th ể tín h tầ n s ố từ m ột hoặc n h iều vă n bản (th ôn g báo) củ a m ột ỉoại ngôn ngữ nào đó để rú t ra nh ữ ng
q u y ỉu ậ t riên g củ a n g ô n ngữ đó Có n h iều ỉoại tần s ố như:
T ần s ố từ n g k ý tự (tầ n sô' đđn), tầ n s ố từ n g cặp 2 ký tự (tần
Trang 10s ố bộ đôi) N g a y tầ n sô' bộ đôi c ũ n g có n h iều cách tín h kh ác
tự đứng đầu từ, tầ n sô' ký tự đứng CUÔI từ.
M ột điểm cần lư u ý: m ỗi loại ngôn ngữ tự n h ỉên kh ác
n h a u có các tầ n sô' k h ô n g g iế n g n h a u N g a y trong m ột ngôn ngữ các loại v ă n bản có tín h c h ấ t v ă n học sẽ có các tầ n s ố
kh ông h oàn to à n g iế n g nh au N h ữ n g tín h ch ấ t đó ngưòi ta gọi là các đặc trư n g n gôn ngữ.
Ta lư u ý rằng, các vá n bản khác n h a u thường có độ dài (sô' lượng các k ý tự tron g vă n bản đó) khác nhau D o đó k h á i
n iệm tầ n số n h ư đ ịn h n g h ĩa tr ên có n h iều trưòng hỢp rất khó tron g thự c h à n h Vì v ậ y người ta đ ư a ra k h á i n iệm tầ n số
tương đối (tần su ấ t - rela tiv e frequency) T ần su ấ t củ a m ột
ký tự X n ào đó trong v ă n bản là s ố lầ n x u ấ t h iện ký tự đó ch ia cho độ d ài củ a văn b ả n đó Còn tầ n s u ấ t bộ đôi móc xích xy nào đó tron g m ột v ă n bản là s ố lầ n x u ấ t h iện bộ đôi đó có trong v ă n bản ch ia cho độ dài củ a v ă n bản trừ đi m ột V í dụ, giả sử v ă n bản có độ d ài n, k h i đó s ố lượng bộ đôi móc xích là
n - 1, n ếu sô' lầ n x u ấ t h iệ n cặp “n h ” là m lầ n th ì tần s u ấ t củ a cặp “n h ” sẽ là m „h/(n-l) S a u đ ây là k ế t q u ả tín h toán các tầ n
Trang 1112 Nhập môn Phân tich thông tin cỏ bảo mật
s ố đơn tiế n g V iệt th eo th ứ tự; kh ông dấu, có dấu v iế t th eo
k iểu đ iện báo và có d ấu th ô n g thường Do tiế n g V iệt khá phức tạp n ên việc tín h tầ n sô bộ đôi móc xích của ch ú n g sẽ được thự c h iện trong m ột tà i liệu th am khảo riêng T ại đó ta
ch ỉ lập b ả n g k ết quả tín h tầ n sô' bộ đôi móc xích cho tiến g
V iệt có dấu Các b ả n g kh ác sẽ được su y ra từ b ản g đó (Xem
Trang 12Chương 1: Khái niệm về mã thám 13
Trang 1314 Nhập môn Phân tích thông Un có bào mật
?4?2Ọ 23011 61255 17071 16767 152
0.0401 0.0670 0.0594
0.0002
0.0088 0.0123 0.0174 0.0956 0.0885 0.0150 0.0059 0.0382 0.0546 0.0544 0,0571 0.0177 0.0471 0.0131 0.0129
tầ n sô' th ì quy lu ậ t tr ù n g lặp rất cần th iế t và có th ể nói chúng
k h ôn g th ể th iếu đôl với công tác thám m ă truyền thống.
Trang 14Ví dụ: T rù n g lặp đoạn (trù n g lặp bộ 10)
c u a n h a n d a n c u a n h a n d a n
1.3.3 Vân phong (Quy luật hành vãn trong văn bản)
T rong th ự c tế , các loại v ă n bản khác n h a u đ ều có v ă n
p h o n g k h ô n g g iô n g n h a u do th ó i qu en củ a từ n g ngư òỉ so ạ n
th ả o ra vă n b ả n đó Đ â y cũ n g là quy lu ậ t đ án g lưu ý trong việc
th á m m ă Các d ạn g v ă n phong ở đây, đáng lưu ý n h ấ t gồm:
a Dạng đầu văn bản (gọi là quy luật đầu điện)
Ví dụ: C ông đ iệ n số , báo cáo số , phúc đáp C ông v ă n
s ô ' k í n h gử i ô n g cán cứ C ông v ă n số
b Dạng thân văn bản (quy luật thân điện)
+ V ăn b ả n th ư ò n g có ch ia th eo từ n g m ục hoặc không
c h ia th eo m uc.
+ N ội d u n g v ă n b ản có kh ác n h a u tù y th eo từ n g loại nội
d u n g như: n g oại giao, tìn h báo, qu ân sự, k in h tế, ch ín h trị,
c Dạng cuứ vãn băat (quy iuật OIỔI điện)
V iệc k ế t th ú c m ột v ă n b ản th ư òng cũ n g có n h ũ n g quy
lu ật: Các v ă n b ả n k h á c n h a u ỏ m ỗi ngưòỉ so ạ n th ả o vă n bản
k h á c n h a u s ẽ có q u y lu ậ t k h ác nhau.
Ví dụ: K ết th ú c m ột đoạn v ă n bản th ư ò n g có chữ stop, stopend ; câu chào: S a la m v à sau cù n g là tê n , chức vụ, cấp bậc c ủ a ngưòi gử i th ô n g báo Đ ây cũ n g ỉà n h ữ n g th ô n g tin
có k h i r ấ t q u a n trọ n g g iú p n h à m ã th á m th à n h công trong
n h iệ m v ụ củ a m ìn h.
Trang 151.3.4 Quy iuật tình huốiig
N h ư đã được trìn h bày ỏ phần trước, th á m mâ là tìm m ọi
b iện pháp có th ể đ ể kh ôi phục lạ i bản rõ và/h oặc khoá mã từ
m ột s ố b ả n m ã cho trưóc Đ iều n ày cho th ấ y th ám mã là m ột
lo ạ i côn g việc cực k ỳ khó k h ă n và phức tạp, nó vừa m an g tín h khoa học lạ i v ừ a m an g tín h n g h ệ th u ậ t Rõ ràng rằn g khoa học v ề m ậ t m ã c à n g p h át triển th ì k ỹ th u ậ t thám m ã
c à n g gặp n h iều k h ó k h ăn
Đ ể ch ốh g lạ i v iệ c th á m mã của đôi phương, các nhà sả n
x u ấ t m ậ t m ã p h ả i th iế t k ế các th u ậ t toán m ã hoá và các ỉoại
k h oá m ã sao cho các th ô n g tin v ề k h oá m ã v à bản rõ không lộ
rõ tr ên bản m ã T u y n h iê n do đặc đ iểm củ a m ật mã và việc
p h â n cấp sử dụ ng, n ê n m ật m ã trên thực t ế luôn chứa đựng
n h ũ n g in â ú th ú ẫ h h ộ i tạ i inà các h h à lủ ã th â m vẫn có th ể
dự a vào đó k h a i th ác, k h ám phá Đó ỉà:
a Trình độ về mật mã ở các nưâc khác nhau là khác nhau. H iện n a y , b ên cạ n h n h ữ n g nước có cô n g n gh ệ bảo m ật (mẬt m ã) r ấ t h iệ n đ ạ i, v ẫ n còn k h ôn g ít nưổc ỉạỉ sử dụ ng m ật
Trang 16ca o n h ư ng trìn h độ củ a n h ữ n g ngưòi sử d ụ n g lạ i kh ông
tư ơ n g xứ n g và hđn t h ế nữ a n h ữ ng người sử d ụ n g th ư òng có
x u h ư ớ n g m uốh đơn g iả n hoá công việc cù a m inh, v à ch ín h vì
v ậ y họ đã vi ph ạm các qui tắc đảm bảo a n to à n cho m ậ t m ã
đư ọc các bản m ã ch ỉ v iệc từ khoá đó m à dịch b inh thưdng.
d Độ dư ngôn ngữ c ũ n g là m ột quy lu ậ t rất q u an trọn g
c ủ a ngôn ngữ tự n h iên Đ ộ dư ngôn ngữ tồn tạ i tron g ch ín h
b ả n m ã của n h iều lu ậ t m ã khác n h au , đặc b iệ t là trong hệ
m ậ t m ã tru y ền thống.
e Tiêu chuẩn bản rõ: ch ín h là quy lu ậ t bản rõ được th ể
h iệ n qua quy lu ậ t tầ n số, quy lu ậ t trù n g lặp Đ â y là m ột
y ế u tố trọng y ếu giú p cho n h à m ă th ám th à n h công không
n h ữ n g đôi vói m ậ t m ã tr u y ề n th ố n g m à cả đôi với m ật m â
k h a á đôi xứ ng n ói c h u n g (như m ã D E S, IDEÂ, Â E S )
1.3.5 Khái niệm tiêu chuẩn bản rõ
T iêu ch u ẩ n b ả n rõ ỉà m ột th à n h p h ầ n k h ôn g th ể th iế u đốỉ với công tác th ám m ã, đặc b iệt ỉà th á m m ã h iện đại V ậy
t iê u ch u ẩn bản rõ là gì? T a b iết rằn g các n gôn ngữ tự n h iên
đ ề u có quy lu ậ t ch u n g n h ấ t đó ỉà quy ỉu ậ t tầ n sô' v à qui ỉu ậ t
tr ù n g lặp H ai quy lu ậ t n à y đã bị biến m ấ t đôi với bản m ã.
Trang 17có th ể b iế t được t ấ t cả k h ả n ă n g có th ể của khoá Từ đó,
n gư òi ta th ử ch o đ ầ u v ào là b ả n m ã v à "khoá” (dự đoán) lấ y tro n g k h ô n g g ia n k h o á rồi dịch th ử K ết quả đầu ra sẽ là m ột
d ã y n à o đó (có t h ể đọc được có n g h ĩa cũ n g có th ể kh ông có
n g h ĩa g ì cả) m à ta v ẫ n gọi là “b ả n rõ” N h ư n g bản rõ này nói
c h u n g ỉà ch ư a th ể h iệ n được q u y lu ậ t tầ n s ố và trù n g ỉặp N ó
c h ỉ th ể h iệ n được q u y lu ậ t tầ n s ố v à trù n g lặp nếu khoá m à
ta đưa v à o là đ ú n g h o ặ c có s a i c ũ n g chỉ sa i muột vài ký tự m à
th ô i N h ư n g là m cá ch n à o đ ể b iế t được quy lu ậ t tầ n s ố và
tr ù n g lặ p được t h ể h iệ n tr ên ‘l) ả n rõ” mà ta vừa tạo ra (từ
k h o á v à b ả n m ã b a n đ ầ u (gọi là b ả n m ã gốc))? Do số ỉiệu
k h o á đư a v à o ỉà r ấ t ỉố n n ên d ừ n g m ắ t th ư òn g đ ể quan sá t
x e m “b ả n rõ” n à o th ể h iệ n được q u y lu ậ t tầ n s ố và trù n g lặp
ỉà k h ô i^ k h ả th i v ề m ặ t th ò i g ia n tìm kiếm
T iê u c h u ẩ n b ả n FÕ giú p ta tự đ ộn g xác đ ỉnh “bẳn rõ” nào
t h ể h iệ n q u y lu ậ t tầ n 8Ố v à tr ù n g lặp , “bản rõ” nào không
N h ò tiê u c h u ẩ n b ả n rõ n h à m ã th á m có th ể p h ân kh ông g ia n
k h o á th à n h h a i n h óm , m ột n h óm ch o phép tạo ra được “bản rõ” có q u y ỉuẠt tầ n 8Ô' v à trù n g ỉặp , m ộ t nhóm gồm các khoá
cò n ỉại T ron g th ự c tế , nh óm gổm các khoá ch o phép tạo ra
Trang 18“b ả n rõ” có q u y lu ậ t (ta gọi là b ả n rõ có n g h ĩa ) là r ấ t ít so với
nh óm còn lại T ừ đó c h ú n g ta tiế n h à n h k iểm tra tiế p và k ế t hđp với m ắt thư òng, c h ú n g ta g iả i ra đưỢc b ả n rõ ban đ ầu (bản rõ gốc) cầ n tìm và k h oá m à ta m on g m u ốh.
Có n h iề u phương ph áp k h á c n h a u đ ể tạ o ra các “tiê u
c h u ẩ n bản rõ” khác n h a u D o k h ô n g g ia n k h o á th ư ò n g rấ t lớn, n ên cần có m ột tiê u c h u ẩ n b ả n rõ, có tốc độ tín h to á n
cà n g n h a n h và cà n g c h ín h xác c à n g tốt, tro n g đó tốc độ tín h
to á n được ưu tiê n sô' 1.
Trang 20th u y ế t n h ận dạng; lý th u y ế t a u to m a t , so n g tr o n g p h ạm v i
c u ố h sách có tín h c h ấ t n h ập m ôn, rấ t k h ó cho v iệc đưa đ ầ y
đù cá c k iến thức to á n học vào T rong p h ạ m v i ch ư đ n g n à y các
iý th u y ế t cờ b ản được trìn h b à y r ấ t tó m ỉược ch ủ y ế u đ ể p h ụ c
vụ y ê u cầu p h â n tíc h m ậ t m ã (m ă th á m -c r 3rptan alysis)
Trang 21Định n^ĩa 2: Cho trước h a i đ ại lượng n gẫu n h iên X và Y
n h ậ n g iá trị lầ n lượt trong tập hữ u h ạ n là x j = và
yn) K hi đó độ b ấ t địn h đồng th ò i của h ai biến ngẫu
n h iê n X và Y được đ ịnh n gh ĩa là:
H ( X , Y ) = - Ị ; p ị l 0 g p i j
' j
T rong đó p , = p (X = Xi, Y = yj)
Định nghĩa 3: Đ ộ b ất đ ịnh (E ntropy) có đ iều k iện củ a đại
lư ợng n gẫu n h iê n X vổi đ iều k iện Y = y là;
L iên q u an đ ến E ntropy người ta còn đưa ra k h á i niệm
th ô n g tin tưdng hỗ được đ ịn h n g h ĩa n h ư sau:
Trang 22Chương 2: Một số kiến thức bổ trợ 23
Định nghĩa 5: T h ô n g tin tưdng hỗ cùa X và Y được định
n g h ĩa bởi: I(X, Y) = H (X) - H (X/Y)
Và ngoài ra n ếu z cũ n g là đại ỉượng n g ẫ u n h iên ròi rạc
hữ u h ạ n thì: I(X, Y, Z) = H(5ƠZ) - H (X/Y, Z)
Định nghĩa 6: T h ô n g tin tưdng hỗ có đ iều k iện củ a cặp
đ ại lượng n g ẫ u n h iê n X, Y ch o trưốc z là:
Trang 2324 Nhập môn Phân tich thông tin có bào mật
S a u đ ây ch ú n g ta ỉấ y m ột vài v í dụ đơn giản:
Ví dụ 1: Giả sử ta có bảng chữ cái gồm 3 chữ cái là A, B, c
với xác su ấ t tướng ứ n g P(A) = 9/27, P(B) = 16/27 và P(C) = 2/27
B ả n g xác s u ấ t Pi(j) có đ iều kiện của j ch o trưỏc th eo i được cho sa u đây:
Trang 24E n trop y có đ iều k iệ n tr o n g đ ịnh n gh ĩa 3 Trưỏc h ế t ta x é t
b ả n g tầ n sô" bộ đôi m óc x ích T iến g A nh (b ản g ph ụ lục PL 1.5).
Trang 2526 Nhập môn Phần tích thông tin có bảo mật
26
Ta có: H ( X ) = - ^ p Ị x j / Y = a Ị l o g P ( x j / Y = a]
i=i
T rong đó: X j € | a , z , i = l , 2 6
Do k h ô n g b iết được các xác su ấ t n ên ta th a y các tham sô
đo b ằ n g ưốc lượng (không chệch) củ a chún g, để đơn giản ta
k ý h iệu p ( x j / Y = a ) = Pax • H ay n gắn gọn hơn là Paj, ta có:
P j , 0 = 0 , 0 0 5 0 p 2 2 = 0 ,0 3 1 4 P3.,, = 0 ,0 0 7 5 p,.23 =0,0100 Pa.l2 =0.0779 p 24 = 0 ,0 0 1 3
p, ,3 = 0 ,0 2 8 9 p, 25 =0,0013
p ,, 4 = 0 ,2 0 9 8 p 26 =0,0013
Trang 26V ậy độ b ất đ ịn h (tức độ k h ôn g xác định) củ a X k h i cho trước
ký tự b bé hơn n h iều so vói độ b ất địn h cù a X k h i cho trưỏc a
Đ iều n à y có ngh ĩa là n ếu cho trưốc chữ cái b th ì k h ả n ân g đoán n h ậ n ký tự n g a y sa u b sẽ dễ d à n g hơn n h iều so với cho trưóc chữ cái a.
B ây giò ch iin g ta chuyển sa n g m ột v í dụ cụ th ể hơn G iả sử
ta có bản th ôn g báo M = m jin2.~miM Trong đó mị e {a, b, c , - , z} Tiếp theo, ta giả th iế t rằng ký tự thứ i (i e {a, b, c,.~, z}) x u ấ t
h iện vói xác su ấ t là Pị Khi đó ta có NPị là s ố lần x u ấ t hiện ký
tự i trong bản thông báo độ dài N , i € {a, b, c, ,z} K hi đó xác
(2.3)
Trang 2728 Nhập môn Phân tích thông tin có bào mật
Lấy logarỉt cả h a i v ế của đ ẳn g thức (2.3), ta có:
-Do đó, H xấp x ỉ ỉo g a rit ngh ịch đảo xác su ấ t đồng thòi của
d ã y các ký tự độ d ài N ch ia cho N, ta có các định lý sau đây:
Định lý 1: Với m ọi e, ô > 0 cho trước bé tù y ý có tồn tại
m ột No sao cho các d â y (các th ôn g báo) b ất kỳ độ dài N > No
Trang 28T ổn g I được lấ y trên tấ t cả các d ãy B, v Ẩ i =
N hư v ậ y Gvj là h àm đơn đ iệu giảm th eo N v à hđn nữa
lim G n = H
N-»+=c
Định lý 3: G iả sử gọi P(Bj, Sj) là xác s u ấ t x u ấ t hiện dăy Bj
m à tiếp n g a y sa u nó là k ý tự Sj và Pg (Sj) = P ( B| , S j) / P(Bj) là xác s u ấ t có đ iều k iên củ a S; vói điểu k iên đã cho BịJ • *
Đặt: F ^ = - Ị ; p ( B i , S j ) l o g P B , ( S i )
ở đây tổ n g E được lấ y trên tấ t cả các kh ôi (dăy) Bj độ dài
từ 1 -i- N -1 và trên tấ t cả các ký tự Sj K hi đó Fn là hàm đơn điệu giảm th eo N.
T rong đó P(i, j) là xác su ấ t x u ấ t h iệ n cặp ký tự (i, j) còn Pị(j)
là xác su ấ t x u ấ t h iện k ý tự j cho trước ký tự i Còn Pị là xác
s u ấ t x u ấ t h iệ n ký tự i.
Trong th ự c t ế F ch ín h là E ntropy xấ p x ỉ cấp th ứ N đôl vối mỗi n gu ồn tin nh ư đã nói ỏ trên , tứ c F n là xấp xỉ E ntropy
Trang 29có điểu k iện của ký tự th ứ N khi đã b iết N -1 ký tự đứng n gay trước đó.
T rên đây là m ột s ố k ết quả ch ín h phục vụ việc thám m ã
củ a các hệ m ậ t tru yền th ố n g và cho cả m ã khối.
2.3 GIẢI BÀI TOÁN PHÂN LỞP CÁC ĐỐI TƯỢNG VÀ ỨNG DỤNG
VÀO CÔNG TÁC THÁM MÀ
2.3.1 Đặt bài toán thứnhẩt
G iả sử A ị, Aị, , A k là m ột ph ân hoạch kh ông gian R", tức
Trang 30Chương 2: Một số kiến ihửc bổ trợ 31
Đ ể g iả i q u yết bài toán này, trước h ế t ta x é t bài toán
p h â n hoạch tù y ý Aj, A,, , Aị( (K > 2 cho trước) T iếp th eo ta
ký h iệu z„ là tổn th ấ t gây ra, do thực t ế là X € Aj n h ư n g ta lạ i
g á n X 6 A, vối i ị j
Rõ rà n g rằng z,i ~ 0
'1 khi i?tj' tức là: z
Trang 3132 Nhập môn Phân tích thông tin cỏ bão mật
Vì v ậy n ếu vói íli, Zjj (với i, j = 1, 2 , ,K) cho trước th ì L
ch ỉ p h ụ th uộc vào các Aj, i = 1, 2 ,.„,K Do đó, ta ký hi ệu
L — L(Aị, Â2, Aị()
V ấn đề đ ặ t ra là:♦
H ây xây dựng m ột ph ân h o ạ ch Aj*, A 2*, , Ak* củ a R"
sa o cho L* = L(Aj*, A 2*,." Aịị*) < L(Ai, A 2VM An) Vối mọi
pbâxi hoạch.tùy.ý; Ai, As .AKcủaR".
B ổ đề sa u đây g iả i q u yết b à i to á n vừ a nêu.
Bố 4ề: G iả sử Aj*, A2*, , Ak* (vói K > 2 ) là một phân hoạch nào đó th u ộc k h ôn g gian ơ c l i t R" sao cho:
Trang 3334 Nhập môn Phăn tích thông tin có báo mật
T rư òn g hỢp có tồ n tạ i tV t mà:
n ,.P ,.( x ) > n j P j ( x ) Vj =
T h ì ta q u y ước ch ọn c h ỉ s ố cực đ ại và g á n ch o X thuộc lớp A*
có c h ĩ sô" cực đ ạ i đó N ó i ch u n g , nếu K > 3 th ì trong trường hợp cụ th ể n à y q u y ết đ ịn h củ a ta chưa chắc đã ch ín h xác m à
Trang 3536 Nhập môn Phân tich thông tin có bảo mật
V ậy X € Aj* n ếu và ch ỉ nếu b ất đ ẳn g thứ c (2.17) x ảy ra,
tr á i lạ i th ì X € Aá* Đ ặ c b iệt nếu rii = ỉlị có k ết quả đdn
ch ú n g ta ch ỉ n h ậ n được tập các dữ liệ u tron g tay, v í dụ ta chỉ
n h ậ n được m b ản m ã V ấn đề là ỉàm cách n à o đ ể ph ân m bản
Trang 36rà n g tron g trưồng hợp này, ch ú n g ta k h ôn g được b iết trước v ề
p h ân b ố x á c s u ấ t của ch ú n g , ỏ đây có h a i trưòng hợp x ả y ra:
i T rường hđp đã b iế t trưốc sô" lớp đưỢc ph ân (tức là b iết trưóc s ố K)
ii T rường hỢp sô' k ch ư a được cho trưỏc.
S a u đ â y ch ú n g ta trìn h b ày cách g iả i b ài toán cho trưòng hợp vừa n êu
2.3.2.1 Phương pháp giải bài toán trong trường hợp
cho tnẩớc sô' lớp K (K <n)
M ục tiê u củ a phương ph áp n à y ỉà đưa các đôl tượng “g ầ n gũi” n h a u n h ấ t vào m ột lớp V ậy v ấ n đ ề đ ặt ra là; n h ư t h ế
n à o được xem ỉà gầ n gũ i, ta có các đ ịn h n g h ĩa sa u đây:
Định nghĩa 1: Cho trưốc G là m ột tập h ữ u hạn, khác rỗng
G c R"’ G iả sử X j, Xj e G, tứ c là:
Xj — ( Xj t, X i 2 , , Xim)
X j — ( X j | , X j 2 , , X jm )
Chương 2: Một số kiến thức bổ trợ ^
Trang 37Khoảng cách giữa hai đôi tượng Xị, Xj là một ánh xạ:
S: G X G - > R = (-00, +00)
S a o cho th ỏa m ãn 3 điều k iện sa u đây:
i S (xj,X jỊằO VXj X j € G dấu “=” đạt được chỉ khi i = j
i, j = 1, 2 ,._, K
ii s ( x i , x j ] = s ( x j , x j | V i,j =1, 2, (tính chất đốỉ xứng) iii s ( x i , x j ) < s ( x j , x | ) + s ( x | , x j ) V iJ , 1 =1, 2,
Định n^ĩa 2: G iả sử Gt ỉà h ai tập con từ y ý khác rỗng, k h ỉ đó k h oản g cách giữ a h a i tập hợp G(, Gf được định
n g h ĩa là:
S<G„G,.) = ; ^ ỵ ỵ s ( x | x j ) (2.18)
" t " t * X ị € G , X j € G ,
T rong đổ n,,n(< ỉầ n ỉượt là lực ỉượng của
T rên cd sỏ k h o ả n g cách đã được định n gh ĩa ồ trên ta có
cô n g cụ đ ể g ỉẳ ỉ b ài toán ph ân Iđp cho trưòng hdp sô' ỉớp K cho trước n h ư sau:
Trang 38Rõ r à n g việc đ ặ t n h ư v ậ y G„ th ỏ a m ân là m ột p h ân hoạch củ a tập G.
B ây giò g iả sử tạ i bước th ứ 1 tậ p hđp G đã được ph ân
h oạch th à n h tậ p con th ỏ a m ãn đ iều k iện đ ặt v à
G|t là đ áp sô"của b ài to á n N ếu K® = K th ì
N h ư v ậ y độ ch ín h xác củ a th u ậ t toán n à y p h ụ th u ộc v ào việc
x â y d ự n g “k h o ả n g cách ” s giữ a h a i đối tượng H iện n a y có
n h iề u “k h o ả n g cách” đ ã đưỢc x â y dựng, sa u n à y ch ứ n g ta đưa
ra m ột k h oản g cách đ ể ứ n g d ụ n g trong thự c h àn h Đ ây gỉò
ch ú n g ta p h á t b iểu (k h ôn g chứ ng m inh) m ột s ế b ể đ ề sa u đây:
BỔ đề 1:
Đ iề u k iện đ ể p h â n lớp th e o th u ậ t to á n tr ên tôi ư u là:
max
Trang 3940 Nhập môn Phân tich thông íin có hào mật
T rong trư òn g hỢp n ày n = 3 và m = 4
H ãy phân hoạch tập G th àn h hai ỉốp Gi, G2 sao cho Gị # 0 ,
1, 2 v à G | u G s ^ G v à s a i s â í c ủ a p h â n ỉ ớ p l à t ô i ư u
ứ n g d ụ n g lý th u y ế t vừ a trìn h bày, ta có:
Trang 40D ễ th ấy k h oản g cá ch được đ ịnh n gh ĩa n h ư trên th ỏa m ãn
3 tiê n đề đă được n êu ỏ tr ên v ể k h oản g cách.
Tiên đề 1 (điều k iệ n 1):