Tìm hiểu một số thuật toán mã hóa dữ liệu và ứng dụng

Ưu điểm lớn nhất của các hệ mã hóa là có thể đánh giá được độ phức tạp của tính toán mà “kẻ địch” phải giải quyết bài toán để có thể lấy được thông tin của dữ liệu.. Mỗi khóa khác nhau c

Trang 1

TRƯỜNG ĐẠI HỌC VINH KHOA CÔNG NGHỆ THÔNG TIN

ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC

Đề tài:

TÌM HIỂU MỘT SỐ THUẬT TOÁN MÃ

HÓA DỮ LIỆU VÀ ỨNG DỤNG

VINH – 2011

Trang 2

LỜI CẢM ƠN

Em xin gửi lời cảm ơn chân thành tới quý thầy cô giáo khoa Công Nghệ

Thông Tin, trường Đại học Vinh nói chung và thầy cô giáo trong bộ môn Hệ

Thống Thông Tin nói riêng, đã giúp đỡ, tạo điều kiện cho em trong suốt quá

trình làm đề tài

Đặc biệt em xin chân thành cảm ơn thầy giáo ThS Cao Thanh Sơn, người

đã giúp đỡ, chỉ bảo, hướng dẫn tận tình cho em trong quá trình làm đề tài

Trong thời gian làm việc với thầy, em không những học hỏi được nhiều kiến

thức bổ ích về các phương pháp mã hóa và tầm quan trọng của mã hóa dữ liệu

trong thời đại ngày nay mà còn học được tinh thần làm việc, thái độ nghiên

cứu khoa học nghiêm túc của thầy

Xin gửi lời cảm ơn chân thành đến gia đình, cha mẹ và bạn bè vì đã luôn

là nguồn động viên to lớn, giúp đỡ con vượt qua những khó khăn trong suốt

quá trình làm việc

Mặc dù em đã cố gắng hoàn thành đề tài với tất cả nổ lực của bản thân

nhưng chắc chắn sẽ không tránh khỏi những thiếu sót Em kính mong nhận

được sự cảm thông và tận tình chỉ bảo của quý thầy cô và các bạn

Một lần nữa, em xin chân thành cảm ơn và luôn mong nhận được sự đóng

góp quý báu của tất cả mọi người

Ngày 20 tháng 5 năm 2011 Sinh viên thực hiện

Trang 3

MỤC LỤC

LỜI CẢM ƠN

MỤC LỤC 3

MỞ ĐẦU 5

CHƯƠNG 1: TỔNG QUAN VỀ HỆ MẬT MÃ 7

1.1 Khái niệm về mã hóa thông tin 7

1.1.1 Khái niệm 7

1.1.2 Vai trò của mã hóa 7

1.1.3 Các thành phần của hệ mã hóa 8

1.2 Tiêu chuẩn để đánh giá hệ mã hóa 8

1.2.1 Độ an toàn của thuật toán 8

1.2.2 Tốc độ mã hóa và giải mã 9

1.2.3 Phân phối khóa 9

-1.3 Khóa 9

1.3.1 Khái niệm 9

1.3.2 Ví dụ 9

1.4 Phân loại các thuật toán mã hóa 10

1.4.1 Phân loại theo các phương pháp 10

1.4.2 Phân loại theo số lượng khóa 11

CHƯƠNG 2: MỘT SỐ PHƯƠNG PHÁP MÃ HÓA CỔ ĐIỂN 14

2.1 Hệ mã hóa thay thế 14

2.1.1 Hệ mã hóa CEASAR 14

2.1.2 Hệ mã hóa VIGENERE 15

-2.2 Hệ mã hóa hoán vị 17

2.2.1 Đảo ngược toàn bộ bản rõ 17

2.2.2 Mã hóa theo mẫu hình học 17

2.2.3 Đổi chỗ cột 18

2.2.4 Hoán vị các ký tự của bản rõ theo chu kì cố định 19

CHƯƠNG 3: MỘT SỐ THUẬT TOÁN MÃ HÓA HIỆN ĐẠI 20

3.1 Thuật toán mã hóa DES 20

3.1.1 Lịch sử ra đời 20

3.1.2 Mô tả thuật toán DES 20

3.1.3 Giải mã DES 30

3.1.4 Độ an toàn của thuật toán 30

-3.2 Thuật toán mã hóa RSA 31

2.2.1 Khái quát về RSA 31

3.2.2 Mô tả về thuật toán 31

3.2.3 Một số phương pháp tấn công 35

3.2.4 Đánh giá thuật toán 37

3.3 Thuật toán mã hóa MD5 37

3.3.1 Hàm băm MD5 37

3.3.2 MD5 40

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 49

1 Kết quả đạt được 49

2 Hướng phát triển 49

3 Kết luận 50

TÀI LIỆU THAM KHẢO 51

Trang 4

-DANH MỤC VIẾT TẮT, THUẬT NGỮ

(tiêu chuẩn xử lý thông tin liên bang)

Trang 5

DANH MỤC HÌNH VẼ

Hình 1.1: Mô hình mã hóa 7

Hình 1.2: Mô hình mã hóa khóa bí mật 10

Hình 1.3: Mô hình mã hóa khóa công khai 11

Hình 2.1: Hình vuông Vigenere 15

Hình 3.1: Sơ đồ tổng quát mã hóa DES 20

Hình 3.2: Sơ đồ tạo khóa 21

Hình 3.3: Biểu diễn dãy 64 bit x chia thành 2 thành phần L 0 ,R 0 23

Hình 3.4: Sơ đồ chi tiết một vòng 23

Hình 3.5: Sơ đồ hoạt động của hàm f 24

Hình 3.6: Hoán vị mở rộng 25

Hình 3.7: Sơ đồ thuật toán RSA 32

Hình 3.8: Mô hình một vòng 38

Hình 3.9: Sơ đồ vòng lặp của MD5 40

Hình 3.10: Sơ đồ khối tổng quát 44

Hình 3.11: Sơ đồ xử lý 512 bit 46

Hình 3.12: Ứng dụng MD5 trong đăng ký bản quyền công ty 48

Trang 6

MỞ ĐẦU

Lí do chọn đề tài

Trong những năm gần đây, mạng Internet đã trở thành nền tảng chính cho

sự trao đổi thông tin trên toàn cầu Có thể thấy một cách rõ ràng là Internet đã

và đang tác động lên nhiều mặt của đời sống chúng ta từ việc tìm kiếm thông

tin, trao đổi dữ liệu đến việc hoạt động thương mại, học tập nghiên cứu và

làm việc trực tuyến Nhờ Internet mà việc trao đổi thông tin cũng ngày càng

tiện lợi, nhanh chóng hơn, khái niệm thư điện tử (email) cũng không còn mấy

xa lạ với mọi người

Tuy nhiên trên môi trường truyền thông này, ngoài mặt tích cực Internet

cũng tiềm ẩn những tiêu cực của nó đối với vấn đề bảo vệ thông tin

Do đó, những yêu cầu được đặt ra đối với việc trao đổi thông tin trên

mạng:

 Bảo mật tuyệt đối thông tin trong giao dịch

 Đảm bảo tính toàn vẹn của thông tin

 Chứng thực được tính đúng đắn về pháp lí của thực thể tham gia

trao đổi thông tin

 Đảm bảo thực thể không thể phủ nhận hay chối bỏ trách nhiệm của

họ về những hoạt động giao dịch trên Internet

Mã hóa thông tin là một ngành quan trọng và có nhiều ứng dụng trong đời

sống xã hội Ngày nay các ứng dụng mã hóa và bảo mật thông tin đang được

sử dụng ngày càng phổ biến hơn trong các lĩnh vực khác nhau trên Thế giới,

từ các lĩnh vực an ninh, quân sự, quốc phòng… Cho đến các lĩnh vực dân sự

như thương mại điện tử, ngân hàng…

Trong đề tài này tôi tìm hiểu một số phương pháp mã hóa đang được sử

dụng rộng rãi hiện nay

Cấu trúc khóa luận như sau:

 Chương 1: Tổng quan về hệ mật mã

 Chương 2: Một số phương pháp mã hóa cổ điển

 Chương 3: Một số thuật toán mã hóa hiện đại

Trang 7

CHƯƠNG 1: TỔNG QUAN VỀ HỆ MẬT MÃ

1.1 Khái niệm về mã hóa thông tin

1.1.1 Khái niệm

Mã hóa thông tin là chuyển đổi thông tin từ dạng rõ (dạng đọc được) sang

dạng mờ (dạng không thể đọc được) và ngược lại Nhằm mục đích ngăn chặn

nguy cơ truy cập thông tin truyền đi trên mạng một cách bất hợp pháp Thông

tin sẽ được truyền đi trên mạng dưới dạng mờ và không thể đọc được với bất

kỳ ai cố tình muốn lấy thông tin đó

Khi chúng ta có nhu cầu trao đổi thông tin, thì Internet là môi trường

không an toàn, đầy rủi ro và nguy hiểm, không có gì đảm bảo rằng thông tin

mà chúng ta truyền đi không bị đọc trộm trên đường truyền Vì vậy mã hóa là

biện pháp giúp ta bảo vệ chính mình cũng như thông tin mà ta gửi đi [1, 2, 7]

Ngoài ra mã hóa còn đảm bảo tính toàn vẹn của dữ liệu

1.1.2 Vai trò của mã hóa

Các hệ mã hóa phải thực hiện được các vai trò sau

 Các hệ mã hóa phải che dấu được nội dung của văn bản rõ (PlainText)

để đảm bảo sao cho chỉ người chủ hợp pháp của thông tin mới có

quyền truy cập thông tin, hay nói cách khác là chống truy cập không

đúng quyền hạn

 Tạo các yếu tố xác thực thông tin, đảm bảo thông tin lưu hành trên hệ

thống đến người nhận hợp pháp xác thực

 Tổ chức các sơ đồ chữ ký điện tử, đảm bảo không có hiện tượng giả

mạo, mạo danh để gửi thông tin trên mạng

Ưu điểm lớn nhất của các hệ mã hóa là có thể đánh giá được độ phức tạp

của tính toán mà “kẻ địch” phải giải quyết bài toán để có thể lấy được thông

tin của dữ liệu Tuy nhiên mỗi hệ mã hóa đều có một số ưu và nhược điểm

khác nhau, nhưng nhờ đánh giá được độ phức tạp tính toán, mức độ an toàn

của mỗi hệ mã hóa mà ta có thể ứng dụng cụ thể tùy theo yêu cầu về độ an

toàn [1, 2, 3]

Trang 8

1.1.3 Các thành phần của hệ mã hóa

Một hệ mã hóa là một bộ 5 (P, C, D, K, E) thõa mã các điều kiện sau

- P là một tập hợp hữu hạn các bản rõ (PlainText), nó còn được gọi là

không gian bản rõ

- C là tập hợp hữu hạn các bản mã (CipherText), nó còn được gọi là

không gian bản mã Mỗi phần tử của C có thể nhận được bằng cách áp

dụng phép mã hóa Ek lên một phần tử của P

- K là tập hợp hữu hạn các khóa hay còn gọi là không gian khóa Đối

với mỗi phần tử k của K được gọi là một khóa (Key) Số lượng của

không gian khóa phải đủ lớn để “kẻ địch” không đủ thời gian để thử

mọi khóa (phương pháp vét cạn)

- E và D lần lượt là tập luật mã hóa và giải mã Với mỗi k của K có

một quy tắc mã hóa ek: PC và một quy tắc giải mã tương ứng dk €

D Mỗi ek: PC và dk: CP là những hàm mà: dk(ek(x))=x với mọi

bản rõ x € P

Hình 1.1: Mô hình mã hóa

1.2 Tiêu chuẩn để đánh giá hệ mã hóa

1.2.1 Độ an toàn của thuật toán

Nguyên tắc đầu tiên trong mã hoá là “Thuật toán nào cũng có thể bị phá

vỡ” Các thuật toán khác nhau cung cấp mức độ an toàn khác nhau, phụ thuộc

vào độ phức tạp để phá vỡ chúng Tại một thời điểm, độ an toàn của một thuật

toán phụ thuộc [1, 7]

o Nếu chi phí hay phí tổn cần thiết để phá vỡ một thuật toán lớn hơn

giá trị của thông tin đã mã hóa thuật toán thì thuật toán đó tạm thời

được coi là an toàn

Trang 9

o Nếu thời gian cần thiết dùng để phá vỡ một thuật toán là quá lâu thì

thuật toán đó tạm thời đƣợc coi là an toàn

o Nếu lƣợng dữ liệu cần thiết để phá vỡ một thuật toán quá lớn so với

lƣợng dữ liệu đã đƣợc mã hoá thì thuật toán đó tạm thời đƣợc coi là

an toàn

1.2.2 Tốc độ mã hóa và giải mã

Khi đánh giá hệ mã hóa phải chú ý đến tốc độ mã hóa và giải mã Hệ mã

hóa tốt thì thời gian mã hóa và giải mã nhanh

1.2.3 Phân phối khóa

Một hệ mã hóa phụ thuộc vào khóa, khóa này đƣợc truyền công khai hay

truyền bí mật Phân phối khóa bí mật thì chi phí sẽ cao hơn so với các thuật

toán mã hóa khóa công khai Vì vậy đây cũng là một tiêu chí khi lựa chọn hệ

mã hóa

1.3 Khóa

1.3.1 Khái niệm

Một khóa mã hóa là một phần thông tin đặc biệt đƣợc kết hợp với một

thuật toán để thi hành mã hóa và giải mã Mỗi khóa khác nhau có thể tạo

ra các văn bản mã hóa khác nhau, nếu không chọn đúng khóa thì không

thể mở đƣợc tài liệu đã mã hóa trên, cho dù biết đƣợc thuật toán trên dùng

thuật toán mã hóa gì, sử dụng khóa càng phức tạp thì độ an toàn của dữ

liệu càng lớn [1, 2, 7]

1.3.2 Ví dụ

Mã hóa nội dung của một bức thƣ với khóa là “Thay thế mỗi ký tự xuất

hiện trong bức thƣ bằng ký tự đứng thứ 3 sau nó” Cùng thật toán trên nhƣng

sử dụng khóa là “Thay thế mỗi ký tự xuất hiện trong bức thƣ bằng ký tự đứng

thứ 4 sau nó” Nhƣ vậy kết quả của một bức thƣ có nội dung nhƣ nhau sau khi

sử dụng hai khóa khác nhau sẽ có hai bản mã khác nhau

Trang 10

1.4 Phân loại các thuật toán mã hóa

1.4.1 Phân loại theo các phương pháp

1.4.1.1 Mã hoá cổ điển

Xuất hiện trong lịch sử, thuật toán sử dụng khóa đơn giản, dễ hiểu Là

phương pháp mà từng ký tự (hay từng nhóm ký tự) trong bản rỏ được thay thế

bằng một ký tự (hay nhóm ký tự) khác tạo nên bản mã [1, 7] Bên nhận chỉ

cần đảo ngược lại trình tự thay thế trên thì sẽ nhận được bản rõ ban đầu

Mã hóa cổ điển có hai phương pháp nổi bật là: Mã hóa thay thế và mã hóa

hoán vị

Các hệ mã hóa thường được sử dụng trong lịch sử là: Hệ mã hóa Ceasar,

Vigenere, Hill…

1.4.1.2 Mã hóa đối xứng

Mã hóa đối xứng hay mã hóa chia sẻ khóa là mô hình mã hóa hai chiều, có

nghĩa là tiến trình mã hóa và giải mã đều dùng chung một khóa Khóa này

được chuyển giao bí mật giữa hai đối tượng tham gia giao tiếp Khóa này có

thể được cấu hình trong Software hoặc được mã hóa trong Hardware Mã hóa

đối xứng thực hiện nhanh nhưng có thể gặp rủi ro nếu khóa bị đánh cắp [1, 7]

Một số thuật toán mã hóa đối xứng nổi tiếng như: DES, AES, RC2, RC4,

RC5, RC6…

Ngoài ra còn một số thuật toán như: Skipjact, Blowfish, CATS-128

1.4.1.3 Mã hóa bất đối xứng

Mã hóa bất đối xứng là mô hình mã hóa hai chiều sử dụng một cặp khóa là

khóa chung (Public Key) và khóa riêng (Private Key) Trong đó khóa chung

Public Key có thể được công bố rộng rải Thông thường thông tin được người

gửi sử dụng khóa Public Key để mã hóa và gửi đi Người nhận thông tin sẽ

dùng khóa Private Key để giải mã Khóa Private Key chỉ do một người giữ do

đó các phương pháp mã hóa bất đối xứng đảm bảo tính bí mật hơn Một điều

quan trọng của phương pháp mã hóa này là cặp khóa Public Key và Private

Key phải tương đồng nhau Có nghĩa là chỉ có Private Key trong cùng một

cặp khóa mới có thể giải mã được dữ liệu đã mã hóa bởi khóa Public Key

tương ứng [1, 2, 7]

Trang 11

Thuật toán mã hóa bất đối xứng nổi tiếng và được sử dụng nhiều nhất hiện

nay là RSA

Ngoài ra còn một số thuật toán khác như: Hellman, Elgamal…

1.4.1.4 Mã hóa hàm băm

Là cách thức mã hóa một chiều tiến hành biến đổi bản rõ thành bản mã mà

không bao giờ giải mã được Người ta ví loại mã hóa này như một củ hành

được băm nhuyễn thì sẽ không bao giờ tái tạo lại được củ hành ban đầu

Trong xử lý hàm băm, dữ liệu đầu vào có thể khác nhau về độ dài, nhưng

độ dài của xử lý băm luôn xác định Hàm băm được xử lý trong mô hình xác

Mã hóa khóa bí mật là thuật toán mà tại đó khóa giải mã có thể được tính

toán từ khóa mã hóa [1, 2, 7] Trong rất nhiều trường hợp khóa mã hóa và

khóa giải mã là giống nhau Thuật toán này yêu cầu người gửi và người nhận

thõa thuận một khóa trước khi thông tin được gửi đi và khóa này phải đảm

bảo tính bí mật Độ an toàn của thuật này phụ thuộc nhiều vào độ bí mật của

khóa, nếu để lộ khóa thì thì bất kì người nào cũng có thể mã hóa và giải mã

Trang 12

Mã hóa khóa bí mật thường được sử dụng cho các trường hợp dễ chuyển

khóa Tức là người nhận và người gửi có thể trao đổi khóa cho nhau an toàn,

khó bị kẻ khác tấn công Thường dùng để trao đổi trong văn phòng

Một số vấn đề liên quan

 Các phương pháp mã hóa khóa bí mật đòi hỏi người mã hóa và người

giải mã phải cùng chung một khóa hoặc là có thể biết khóa của nhau,

khi đó khóa phải được giữ bí mật tuyệt đối Do đó kẻ địch dễ dàng xác

định được một khóa nếu biết khóa kia

 Phương pháp này không đảm bảo được sự an toàn nếu có xác suất

cao khóa người gửi bị lộ Khóa phải được gửi đi trên kênh an toàn nếu

kẻ địch tấn công trên kênh này có thể phát hiện ra khóa

 Vấn đề quản lý và phân phối khóa là khó khăn và phức tạp, người gửi

và người nhận phải thống nhất với nhau về khóa việc thay đổi khóa là

khó khăn và dễ bị lộ

1.4.2.2 Mã hóa khóa công khai

Mã hóa khóa công khai là các thuật toán sử dụng khóa mã hóa và khóa

giải mã là hoàn toàn khác nhau Hơn nữa khóa giải mã không thể tính toán

được từ khóa mã hóa [1, 2, 7]

Khác với mã hóa khóa bí mật, khóa mã hóa của thuật toán mã hóa công

khai được công bố rộng rãi Một người bất kì có thể sử dụng khóa công khai

để mã hóa thông tin, nhưng chỉ có người nhận thông tin có khóa giải mã phù

hợp với khóa mã hóa để giải mã thông tin đó

Mô hình mã hóa khóa công khai

Hình 1.3: Mô hình mã hóa khóa công khai

Trang 13

Trong đó :

Khóa mã hóa không thể giống khóa giải mã

Khóa giải mã không thể đƣợc tính từ khóa mã hóa

Một điều đặc biệt của loại mã hóa này là cả khóa công khai và bản mã có

thể đƣợc gửi đi trên kênh không an toàn mà thông tin vẫn không hoặc khó bị

đọc trộm dù biết đƣợc khóa mã hóa

Chính vì mức độ an toàn cao nên mã hóa khóa công khai đƣợc sử dụng

trên mạng công khai Internet Mã hóa khóa công khai có nhiều ứng dụng quan

trọng trong các hệ thống lớn

Trang 14

CHƯƠNG 2: MỘT SỐ PHƯƠNG PHÁP MÃ HÓA CỔ ĐIỂN

2.1 Hệ mã hóa thay thế

2.1.1 Hệ mã hóa CEASAR

Hệ mã hóa CEASAR là một ví dụ điển hình cho hệ mã hóa thay thế Nó

làm việc trong bảng chữ cái tiếng Anh 26 ký tự [1, 7] Ceasar sử dụng các số

nguyên thay cho các ký tự, đánh số các ký tự trong bảng chử cái theo thứ tự

bảng sau

Các phép toán số học được thực hiên trên Modul 26 (có nghĩa là 26 tương

ứng với 0, 27 tương ứng với 1, 28 tương ứng với 2,…, 79 = 26x3 + 1 tức 79

tương ứng với 1)

Hệ CAESAR sử dụng thuật toán mã hóa Ek, trong đó mỗi ký tự được thay

thế bởi một ký tự khác được xác định bằng cách dịch ký tự cần mã hóa sang

phải k bước theo modul 26

Ek() = ( + k) MOD 26

Với  là một ký tự, 0  k  26, MOD là phép chia lấy phần dư

Thuật toán giải mã tương ứng Dk là lùi lại k bước trong bảng chữ cái theo

modul 26

Dk() = ( - k) MOD 26 Không gian khóa của hệ CEASAR bao gồm 26 số: 0, 1, 2, …, 25

Ví dụ: Với k = 3, A được thay bằng D, B được thay bằng E,…, W được

thay bằng Z,…, Y được thay bằng B và Z được thay bằng C Ta có:

Bảng chữ cái gốc

Bảng chữ cái dùng để mã hóa

Trang 15

Trong trường hợp này bản rõ “DAI HOC VINH” được mã hóa thành

“GDL KRF YLQK”, (Chú ý: Các ký tự trống trong bảng mã được bỏ đi để

đảm bảo tính an toàn)

Thêm một vài ví dụ minh họa:

E25(IBM) = HAL, E6(MUPiD) = SAVOJ

E3(HELP) = KHOS, E1(HOME) = IPNF

Hệ CEASAR là hệ mã hóa cũ và không an toàn vì không gian khóa của nó

rất nhỏ, do đó có thể thám mã theo phương pháp vét cạn Khóa giải mã có thể

tính ngay ra được từ khóa mã hóa Do chỉ có 26 khóa nên ta có thể thử lần

lượt các khóa cho đến khi tìm được khóa đúng

2.1.2 Hệ mã hóa VIGENERE

Hệ mã hóa này được đặt theo tên của một nhà mật mã người Pháp Blaise

De Vigenere (1523 – 1596) [1, 7]

Vinegere cũng giống như Caesar, nhưng ở đây khóa được thay đổi theo

từng bước Hình vuông VIGENERE được sử dụng để mã hóa và giải mã

Trang 16

Mỗi cột của hình vuông Vigenere có thể xem nhƣ là một hệ CEASAR, với

các khóa: 0, 1, 2, , 25 Để mã hóa thì bản rõ đƣợc đọc từ các hàng và khóa

đƣợc đọc từ các cột

Trang 17

Ví dụ: Mã hóa bản “DAI HOC VINH” với từ khóa “ KHOA KINH TE”

Đầu tiên ta tìm điểm giao của hàng D cột K ta được N, tiếp tục ta tìm điểm

giao của hàng A cột H ta được H Cứ như vậy ta được bản mã là “ NHW

HYK IPGL” Ta sẽ thu được bản mã tưng tự nếu ta đọc bản rõ tưng ứng với

cột và khóa đọc tưng ứng với hàng Muốn giải mã thông tin vừa mã hóa trên

ta thực hiện bằng cách, ta nhìn vào hàng nào chứa N trong cột K, ta tìm được

chữ D, tương tự nhìn vào hàng nào chứa H trong cột H, ta tìm được chữ A

Cứ như vậy ta sẽ tìm được bản rõ là “DAI HOC VINH”

Trong ví dụ trên thì độ dài bản rõ bằng độ dài khóa Nhưng trong thực tế

độ dài bản rõ thường dài hơn rất nhiều so với khóa Như vậy để mã hóa hay

giải mã thì ta phải áp dụng từ khóa một cách tuần hoàn Nghĩa là từ khóa

được lặp đi lặp lại nhiều lần sao cho các ký hiệu trong bản rõ phải được đọc

hết

Ta thấy rằng trong hệ mã hóa VIGENERE, với khóa có độ dài d thì sẽ có

26d khóa hợp lệ Vì vậy chỉ cần với giá trị d nhỏ thì phương pháp thám mã vét

cạn cũng đòi hỏi khá nhiều thời gian

2.2 Hệ mã hóa hoán vị

Hệ mã hóa hoán vị hay còn gọi là hệ mã hóa đổi chỗ Là hệ mã hóa mà

các ký tự của bản rõ vẫn được giữ nguyên, nhưng thứ tự của chúng được đổi

chỗ vòng quanh [1, 7]

Phương pháp này có các kỹ thuật mã hóa sau

2.2.1 Đảo ngược toàn bộ bản rõ

Nghĩa là bản gốc được viết theo thứ tự ngược lại từ sau ra trước, để tạo bản

mã Đây là phương pháp mã hóa đơn giản nhất vì vậy không đảm bảo an toàn

Ví dụ: PlainText SECURE EMAIL

Bản mã: LIAMEERUCES

2.2.2 Mã hóa theo mẫu hình học

Bản gốc được sắp xếp lại theo một mẫu hình học nào đó, thường là một

mảng hoặc ma trận hai chiều

Trang 18

Ví dụ: Bản rõ “KHOA CONG NGHE THONG TIN” được viết theo ma

trận 4x5 như sau:

Nếu lấy các ký tự ra theo số thứ tự cột 3, 1, 4, 2, 5 thì ta thu được bản mã

“OGTTKOHNANHIHNEGCGON”

2.2.3 Đổi chỗ cột

Đầu tiên biểu diễn các ký tự trong ban rõ thành dạng hình chữ nhật theo

cột, sau đó các cột được sắp xếp lại và các chữ cái được lấy ra theo hàng

ngang

Ví dụ: Bản rõ là “KHOA CONG NGHE THONG TIN” được viết dưới

dạng ma trận 4x5 theo cột như sau:

Vì có 5 cột nên ta có thể sắp xếp lại theo 5!=120 cách khác nhau Để tăng

độ an toàn có thể chọn một trong các cách sắp xếp lại đó

Nếu ta chuyển vị trí các cột theo các cột theo thứ tự 3, 5, 2, 4, 1 Rồi lấy

các ký tự ra theo hàng ngang ta sẽ được bản mã là:

“NGCTKGTOHHHINOOENGNA”

Lưu ý: Các ký tự cách trống được bỏ đi

Trang 19

2.2.4 Hoán vị các ký tự của bản rõ theo chu kì cố định

Nếu hàm f là một hoán vị của một khối gồm d ký tự thì khóa mã hóa được

biểu diễn bởi K(d, f)

Do vậy, bản rõ:

M=m1m2 mdmd+1 m2d Với mi là các ký tự, và bản mã sẽ được mã hóa thành:

Ek(M)= mf(1)mf(2)…mf(d)md+f(1)…md+f(d) Trong đó mf(1)mf(2)…mf(d) là một hoán vị của m1m2 md

Ví dụ: Mã hóa bản rõ “BAO MAT” chọn d=6 và f hoán vị dãy i= 123456

thành f(i)=351462

Theo bảng trên ta thấy ký tự đầu sau khi hoán vị chuyển đến vị trí thứ 3,

ký tự thứ 2 chuyển tới vị trí thứ 5, ký tự thứ 3 chuyển tới vị trí thứ 1,… Như

vậy sau khi mã hóa ta thu được bản mã là “OABMTA”

Nếu kích thước bản rõ lớn hơn nhiều so với d thì ta sẽ phải chia bản rõ

thành các khối d ký tự và tiến hành mã hóa theo từng khối Ví dụ:

Bản rõ “KHOA CONG NGHE THONG TIN”, giả sử d = 6, và f hoán vị

dãy i = 12345 thành f(i) = 35142

Ta thu được bản mã “OCKAHGGONNTOHHETNIG”

Trang 20

CHƯƠNG 3: MỘT SỐ THUẬT TOÁN MÃ HÓA HIỆN ĐẠI

3.1 Thuật toán mã hóa DES

3.1.1 Lịch sử ra đời

Khoảng những năm 1970, tiến sĩ Horst Feistel đã đặt nền móng đầu tiên

cho chuẩn mã hóa DES với phương pháp mã hóa Feistel Cipher Vào năm

1976 Cơ quan Bảo mật quốc gia Hoa Kỳ (NSA) đã công nhận DES dựa trên

phương pháp Feistel là chuẩn mã hóa dữ liệu Kích thước khóa ban đầu của

DES là 128 bit nhưng tại bản công bố FIPS kích thước được rút xuống 56 bit

để tăng tốc độ xử lý và đưa ra các tiêu chuẩn thiết kế một chuẩn mã hóa dữ

liệu [4, 6]

Nội dung phương pháp mã hóa DES

DES thực hiện mã hóa dữ liệu qua 16 vòng lặp mã hóa, mỗi vòng sử dụng

một khóa chu kỳ 48 bit được tạo ra từ khóa ban đầu có độ dài 56 bit DES sử

dụng 8 bảng hằng số S-box để thao tác

3.1.2 Mô tả thuật toán DES

3.1.2.1 Sơ đồ tổng quát

Phương pháp DES mã hóa khối thông tin x có độ dài 64 bit với khóa k có

độ dài 56 bit thành khối y có độ dài 64 bit

Nền tảng để xây dựng khối của DES là sự kết hợp đơn giản của các kỹ

thuật thay thế và hoán vị bản rõ dựa trên khóa, đó là vòng lặp DES sử dụng

16 vòng lặp áp dụng cùng một kiểu kết hợp các kỹ thuật trên khối bản rõ

Thuật toán chỉ sử dụng các phép toán số học và logic thông thường trên

các số 16 bit, vì vậy nó dễ dàng thực hiện vào những năm 1970 trong điều

kiện về công nghệ phần cứng lúc bấy giờ

Sơ đồ tổng quát :

Trang 21

Hình 3.1: Sơ đồ tổng quát mã hóa DES

K16

L15=R14 R15=L14(R14,K15)

PlaintextIP

Trang 22

Quá trình có 16 vòng thực hiện giống nhau trong quá trình xử lý Ngoài ra

có hai lần hoán vị đầu IP và cuối IP-1, hai hoán vị này được sử dụng với mục

đích đưa thông tin vào và lấy thông tin ra

Muốn vào vòng mã hóa thì khối thông tin x ban đầu 64 bit được chia làm

hai khối, mỗi khối 32 bit Hàm f làm biến đổi một nữa của khối đang xử lý

với một khóa con tương ứng với vòng mã hóa

Trong đầu ra của hàm có hàm f được kết hợp với nửa khối còn lại bằng

phép toán XOR, và hai phần được trao đổi để xử lý trong chu trình kế tiếp

Cứ thực hiện các vòng như vậy cho tới vòng cuối cùng thì hai phần không

bị tráo đổi nữa, chính vì điều này mà quá trình mã hóa và giải mã là giống

nhau

3.1.2.2 Tạo khóa

Quá trình mã hóa được thực hiện 16 vòng, mỗi vòng cần một khóa Như

vậy từ khóa ban đầu tạo ra 16 khóa con cho 16 vòng lặp tương ứng

Sơ đồ quá trình tạo khóa

Hình 3.2: Sơ đồ tạo khóa

Trang 23

Theo sơ đồ ta thấy đầu tiên khóa K có độ dài 64 bit, sau đó đƣợc giảm

xuống 56 bit bằng cách loại bỏ 8 bit chẵn lẻ Sự loại bỏ đƣợc thực hiên khi đi

qua PC1

Bảng PC1 :

Nhƣ vậy các bit ở vị trí 8, 16, 24, 32, 40, 48, 56, 64 bị loại bỏ 56 bit thu

đƣợc chia làm hai phần, mỗi phần 28 bit, các phần đƣợc xử lý độc lập nhau

Các phần này đƣợc dịch 1 hay 2 bit là phụ thuộc vào vòng đó Số bit dịch

đƣợc cho trong bảng sau

Sau khi dịch bit, 56 bit này đƣợc chọn ra 48 bit Bởi vì sự thực hiện đổi

chỗ thứ tự các bit nhƣ là sự lựa chọn một tập con các bit, nó còn đƣợc gọi là

hoán vị nén hoặc hoán vị lựa chọn Sự thực hiện này cung cấp một tập hợp

các bit cùng cỡ với đầu ra của hoán vị mở rộng Bảng PC2 định nghĩa hoán vị

nén (cũng gọi là hoán vị lựa chọn) Ví dụ, bit ở vị trí 33 của khóa đƣợc dịch

chuyển tới vị trí 35 của đầu ra và bit ở vị trí 8 của khóa bị bỏ qua

Bảng PC2( hoán vị nén)

Nhƣ vậy sau khi đi qua PC2 còn lại 48 bit, 48 bit này sẽ đƣợc sử dụng làm

khóa K1 để sử dụng trong vòng mã hóa

Hai phần, mỗi phần 28 bit sau khi đƣợc dịch bit ở lần thứ nhất, tiếp tục

dịch bit ở lần thứ 2 và qua bảng PC2 để hoán vị nén 48 bit và làm K2

Quá trình cứ tiếp tục nhƣ vậy ta thu đƣợc 16 khóa K (i=1…16)

Trang 24

3.1.2.3 Hoán vị khởi đầu

Mục đích của hoán vị khởi đầu là đổi chỗ các bit của khối dữ liệu vào

thông qua bảng IP Nó không ảnh hưởng đến sự an toàn của DES

Với khối dữ liêu vào x 64 bit cho trước, một xâu bit x0 sẽ được xây dựng

bằng cách hoán vị các bit của x theo phép hoán vị cố định ban đầu IP Ta viết

x0=IP(x)=L0R0 trong đó L0 gồm 32 bit đầu và R0 gồm 32 bit cuối

x0Hình 3.3: Biểu diễn dãy 64 bit x chia thành 2 thành phần L 0 ,R 0

Bảng hoán vị khởi đầu IP

3.1.2.4 Mã hóa chi tiết một vòng

Quá trình xử lý các vòng là giống nhau, ta xét quá trình xử lý của một

Trang 25

Hàm f có hai tham số là Ri-1 và Ki Được thực hiện theo sơ đồ sau :

Hình 3.5: Sơ đồ hoạt động của hàm f

Ri-1 được mở rộng từ 32 bit thành 48 bit nhờ sự thay đổi thứ tự của các bit

bằng cách lặp lại một số bit nào đó, nó được hiểu như là một sự hoán vị mở

rộng

Để xác định ở đầu vào có 32 bit, bit nào được lặp lại và xuất hiện tại vị trí

nào của đầu ra 48 bit người ta xác định như sau:

Đầu vào có 32 bit chia làm 8 bộ, mỗi bộ có 4 bit Bit đầu tiên và bit cuối

cùng của mỗi bộ tương ứng với 2 bit của khối dữ liệu ra, trong khi bit thứ 2 và

bit thứ 3 của mỗi bộ tương ứng với một bit ở khối dữ liệu ra Ví dụ, bit ở vị trí

thứ 3 của khối dữ liệu vào được chuyển tới vị trí thứ 4 trong khối dữ liệu ra,

bit thứ 8 trong khối dữ liệu vào thì được chuyển tới vị trí 11 và 13 trong khối

dữ liệu ra

Định dạng
Số trang	51
Dung lượng	0,99 MB