Hinh I Quá trình nén vá giải nén thông tin Hình 2 Quả trình mã hóa và giải mã Hình 3 Mô tình hễ thông mà hoá khoá bí một Hinh 4 Mô hình hệ thêng mã hoà với khoả công khái Tình 5 Quy trìn
Trang 1NGHIÊN CCU PHOI HOP CAC PHUONG PHAP NEN
THONG TIN, MA HOA THONG TIN, GIAU THONG TIN
DE XAY DUNG UNG DUNG GIAU TIN TRONG MOI
TRUONG DA PHUONG TIEN
LUẬN VĂN THẠC SĨ
Hà Nội - 2009
Trang 2NGHIÊN CCU PHOI HOP CAC PHUONG PHAP NEN
THONG TIN, MA HOA THONG TIN, GIAU THONG TIN
DE XAY DUNG UNG DUNG GIAU TIN TRONG MOI
TRUONG DA PHUONG TIEN
Ngành: Công nghệ Thông tin
Chuyên ngành: Công nghệ phần mềm
Mã số ó0 48 10
LUẬN VĂN TIIẠC SĨ
NGƯỜI HƯỚNG DẪN KHOA HOC
5 Hỗ Văn Hương
Hà Nội - 2009
Trang 3
3
LOI CAM DOAN
Tôi xin cam đoan kết quả đạt được trong luận văn là sản phẩm của riêng
cá nhân, không sao chép lại của người khảo Treng toàn bộ nội dung của hiện văn, những điển được trình bày hoặc là của cá nhân hoặc là được tổng hợp từ nhiều
nguồn tài liệu Tắt cá các tải liệu tham kháo đều có xuất xử rõ ràng và được trích din
Trang 44
LOT CAM ON
Lời dầu tiền, tôi xin bảy tổ lòng biết ơn sâu sắc dẫn T8 Hồ Văn Hương Ban
cơ yếu Chính phủ, người đã tận tỉnh hưởng dẫn, chỉ bảo và giúp đỡ tồi trong suốt quá
trình nghiên cứu và hoàn thành luận vẫn này,
Tôi xin chân thành cảm on các thây cỗ giáo trường Dại học Công nghệ - DHIQG
Hà Nội đã giáng dạy vả cùng cấp chợ chúng tôi những kiến thức rất bỏ ích trong, thời gian học cao học, giúp tôi cỏ nên tăng trị thức để phục vụ nghiên cửu khoa học sau
nay,
Tôi cũng xin cảm on Lãnh đạo và đẳng nghiệp tại đơn vị đã tạo điêu kiện và
giúp đỡ tôi trong suốt quả trình nghiên cửu và hoàn thành luận văn
Tôi cũng xin bảy tô lòng cảm ơu đến gia đình và bạn bè, những người luôn
quan lâm, động viên và khuyến khích tôi
Hà Nội, ngày thông 11 năm 2009
Tiọc viên
Lê Mạnh Thắng
Trang 55
MUC LUC
LOI CAM DOAN
LOI CAM ON
TONG QUAN VỀ NÊN, MÃ HOÁ V¿
1.1 Tổng quan về nén thông tin
1.1.1 Nhận thúc clnmg
1.1.1.1 Một số Khải niệm cơ bản
1.112 C “hông số chan tọng của nén “
.1.2 Nguyên tắc của nén dữ liêu
1.3 Phân loại phương pháp nén
1.3.1 Theo nguyên lý nén
1.1.3.2 Theo cách thức thực hiện nên
1.1.3.3 Phản loại dựa vào triết lý của sự mã hoá
1.1.3.4 Cách phân loại của Aril.K.lain
1.4 Các kỳ thuật nén thông tin
1.14.1.- Nén không mất ruát thông tin
1.5 Ứng dụng cúa nén thông tín nàn nhai T7
1.2 Mã hoá thông tin
1.2.3.2 Hệ mã hoá khoá công khai A
1.2.33, Két hop hệ mã hoá khoá bị mật và hệ mã hoà khoa công khưi
1.3 Sơ lược vệ giầu tín mát
13.1 Cáo khái niêm cơ bản
1.3.1.1 Khái mệm giấu tin mật
1.3.1.2 Các thành phân của hệ giấu tin mật
1.3.2 Tỉnh chất của giấu tin mật “
1.3.3 Ứng dụng của giấu tin mat
2.1.1 Tỉnh chất cơ bản của tín higu aim thanh
2.1.2 Biểu điễn âm thanh số
2.1.3 Mén âm thanh
2.13.1 Tượng Lử hỏa phi tuyển
2.1.3.3 Kỹ thuật nén sử đụng tính chất lọc (masking): Âm thanh MPEG 34
Trang 6
2.1.4 Giấu tín mật trong âm thanh số 35
2.24.1 Gian bin mal Long anh den tring Ay
2.2.42 Giấu nung à ảnh màu
3.1 Vì sao phải kết hợp miên thông lin, mi hod théng lin và giấu tia miệt
3.2, Tình hình nghiên cứu, ứng đụng giầu tin mật hiện may
3.2.1 Một số kỹ thuật và phân mềm giáu tin mat trên thị trường,
3.2.2 Giâu tin mật và như cầu liên lạc bí mật trong công tác An nin Quoc phòng ở Việt
Nam 55
3.3 Giải phap dé xual ee
3.3.1 Mục tiêu, yêu câu
3.3.2 Giải pháp
3.4 Xây đựng và cài đặt ứng đụng
3.4.1 Yêu cân xây dựng
3.4.2 Lựa chọn giải pháp kỹ thuật cho ứng dụng
3.4.2.1 Lựa chọn mỗi trưởng và phương tiện truyền
3.42.2 Xây dưng cơ sở dữ liệu vật mang
3.4.2.3 Lựa chọn kỹ thuật nến
3.4.2.4, Tư chợn phương pháp ¡nã hoá
3.4.2.5 Lựa chọn giải thuật giầu tin
Lua chọn môi irường xây dựng,
Trang 7VIET TAT TU GOC NGHIA TIENG VIET
Ap dung gin that DES 3
3DES Triple Data Enerylien Standard | OP đụng B0 tải Là 3 lên cho mỗi khối đữ liệu
Chuyển đổi từ tin hid
ADC Analog to Digital Converter puyen GÓI tý HH nếu
Tương tự sang tin liệu số
‘AES ‘Advanced Eneryption Standard | Hệ mật mã tiên tiến
lộ chuyển đổi từ tin hiệu
DAC Digital to Analog Converter A.——
số sang tín hiệu tương tự
ber Discrete Cosine ‘lransform Hiển đổi Côsi rời rạc
DES Tata Eneryption Standard Hệ mật mã chuân
Diflerential pulse code : a
DPCM madulatien : Điều xung mã vị phân
HVS Human Vision System người & thong Tak pie cua con
JPhG Joint Photographic Experts Ảnh nén cỏ mất mát thông
Cáo thuật toán nén không
171, ; Abraham Lempel, Jacob Ziv mat mát thông tin do i ô LZ78 Abraham Lempel, Jacob Ziv
để xuất năm 1977 va 1978
Mét phaong phap nén duce 1ZW Lempel — Zip, Welch phat minh bởi Lempel - Zip
va Welch : Xỹ thuật nén sử đụng ch
MNPS Microcom Network Protocol § modem Mngt nen #U chng cho
POM Pulse-code modulation Điều biện mã xung
adralure Ampliude Sas
QAM Quadrature Anyplitud Điều chế biên độ trực giao
Trang 8
RLC Rum Length Codmg Mã hóa loại đái
RSA
Run Length Encoding
Ron Rivest, Adi Shamir, Len
Mã hóa loạt dài
Thuật toán mã hỏa khỏe tông khai do 3 tác giả Ron
Rivest, Adi Shamir, Len
Adlsman đã xuất
Trang 9
Hinh I Quá trình nén vá giải nén thông tin
Hình 2 Quả trình mã hóa và giải mã
Hình 3 Mô tình hễ thông mà hoá khoá bí một
Hinh 4 Mô hình hệ thêng mã hoà với khoả công khái
Tình 5 Quy trình trao đối khoá tí mật sử đựng hệ mã hoá khoá công khai
Hình 6 Phân cấp các lĩnh vực nghiền cửu của ngành một mã học
Hình 7 Các nhânh của giẫu tin
Trình 8 Sơ đồ chung của lệ giấu tin mal
Hình 9 Cân nhấc giữa chất lượng, đưng lượng và tin bền vững
Hình10 | Sóng âmthanh
Tink 11 Biểu điển âm thanh số
Hinhl2 | Các bước lượng tir hod
Hình13 | Lượng tỉhoả phi tuyển
Hình 14 Ma hoa dự báo
HinhlS | Lược đồgiâutinphía người gúi
Hình l6 Large dé tách tin phía người nhận
Hình 17 Sơ đô phan cáp các lớp giải thuật mã hoá khoả bí mật trong NET
Framework Hinh 18 [ Sơ đồ phân cấp các lớp giải thuật mã hoá khoả công khai trong NET
Framework Hinh 19 - | Sơ đồ tínhtoanhiệu quả nhúng trên từng vật mang
Hinh20 | Sơ đô giẫu1im mật theo giải thuật E5
Hình 21 Giao điện chính của phần mm
Hinh22 | Tạo ngẫu nhiên cặp khỏa công Khaibi mật
Tinh 23 | Sơ đồ khối quá tinhgiẫutintheo giải thuật F5
Hình 24 Val mang tit nhat duge hee chon
Hinh 25 _| Tach tin mat tir vat mang tin
Tinh 26 | Bang két qua thuc nghiém
Trang 10lô
MO DAU
Cuộc cách mạng thông tin kỹ thuật số đã dem lại những thay dỗi sâu sắc cho xã hội và trong cuộc sống con người Bên cạnh những, thuận lợi ma thông tia kỹ thuật số
trang lại cũng nãy sinh những thách thức và cơ hội cho quá trình đổi mới Sự ra đời
những phần rêm có tính năng rãi mạnh, các thiết bị mới như ruáy ảnh kỹ thuật số, mấy quét chất lượng cao, may in, máy gÌủ âm kỹ thuật đã giúp người dùng cô thể
sang tao, xử lý và thưởng thúc các đứ liệu đa phương tiện Mạng Internet toản cầu trở thành một xã hội ảo, nơi diễn ra quá trình trao đổi thông tin trong mọi lĩnh vục chính
trị, quân sự, quốc phòng, kinh tế, thương mại Và chính trong môi trường mở và tiện
nhi như thế đã xuất hiện những vẫn nạn, tiêu cực đang rất cân đến các giải pháp hữu hiệu cho vẫn đẻ an toản thông tin như nạn ăn cắp bản quyền, nạn xuyên tạc thing tin,
truy nhập thông lin trái phép
Nhiều phương pháp bảo vệ thông tin đã được đưa rõ trong đồ phương pháp dùng mật mã học là gidi pháp được ứng dụng rộng rấi nhái Các hệ một 1uã đã được
Thất triển nhanh chóng và được ứng đụng rất phổ biển cho đến tận ngày nay Sử dụng,
các hệ này, thông tin ban đâu sẽ được má hoá thành các ký hiệu vô nghĩa, sau đó sẽ
được lấy lại thông qua việc giải mã nhờ khoá của hệ mã Dã có rất nhiều những hệ mã
phức tạp được sử dụng, bao gồm các lệ mã hóa khỏa đối xứng như DHS, 3-DH8, AES,
hệ mã hóa khỏa công khai như RSA Phuong pháp mật mã hoá đã được chúng minh
là rất hiệu quả và có nhiều ứng dưng trong thực ti
Một phương pháp khác đang được nghiên cứu và ứng dụng rất mạnh mố ở
nhiều nước trên thể giới đó là phương pháp giấu tím mật Trong khi phương pháp mã
hoá nhằm bảo vệ nội dung của théng tin thi phương pháp giâu tin mật lại che giân sự
có mặt của thông tin bằng cách giâun thông tin này vào thông tin khác Đây 14 phương pháp mới và phức tạp, được xem như mệt công nghệ chia khoá cho vận để bảo vệ bản
quyền, nhận thực thông tin vả kiểm soát truy cập ứng, dụng trong an toản và báo mật thông tin Nhiễu kỹ thuật giấu tin mật đã được nghiên cứu vả ứng dụng trên nhiều định
dạng đa phương tiện khác nhau như âm thanh số , ảnh số và video số
Có thể nói, phương pháp mã hóa và phương pháp giầu tín mật đều có những tm,
nhược điểm nhất định Trên thực tẾ, người ta đã áp dụng cả hai phương pháp nay dé giúp cho việc đảm bảo an toàn thông tin khi trao đối Để tăng đung lượng thông tin được trao đối, người ta cũng thường kết hợp thêm các kỹ thuật nén théng tin
Trong phạm vi luận văn này, chúng tôi tập trung nghiên cứu một số nội đụng cơ
bản của các kỹ thuật nén thông tin, mã hoá thông tin, giấu tin mật trong dữ liệu đa phương tiện, trên cơ sở đỏ nghiên cứu phối hợp các phương pháp này để xây dựng ứng
Trang 11quan của cáo kỹ thuật này
Chương 2: Môi trường đa phương tiện và khả năng giấu tin Dề có thể thực
hiện các kỹ thuật nén, mã hoá vẻ giấu tia mật trong môi trường, đa phương tiện thì vẫn
đẻ đặt ra là cần tim hiểu cầu trúc, đặc điểm và tính chất của các định dạng trong mỗi
trường da phương tiện Chương nay tap trung trinh bay cac khai miém co ban, dic
điểm, tỉnh chất, và các kỹ thuật nén được áp dụng đối với các đình dang phd bién như ảnh số, âm thanh số và video số cũng như phương pháp giấu lin mit trong ede dinh
dang nay
Chương 3: Phối hợp các phương pháp nén, mã hoá và giấu tin mật để xây
dựng ứng dụng cho liên lạc bí mật Trên cơ sở phân tích những tru điểm, hạn chế của
từng kỹ thuật để phối hợp các phương pháp trên xây dựng mô hình giúp cho việc liên lạc, trao đổi thông ti có bảo mật trên mạng công khai M6 hinh dé suit con sử dụng,
cơ sở dữ liệu vật mang, để có thể chọn những vật rang “phủ hợp nhất” với một thông, điệp mật nhất định, gdp phan làm giảm thiểu nguy cơ mất øn nĩnh an toàn thông tit Đây là một điểm cải tiến số với các phan mém hiện có rên thị trường hiện nay Ứng
dụng được xây đựng dựa trên kỹ thuật nén không mất mái thông tin ZTP, hệ rnấ hoá công khai RSA và giải thuật F5 để giảu thông tin trong ảnh IPEG Cơ sở đữ liện vật
mang bao gồm các ảnh được download ngẫu nhiên trên mang Internet
Trang 12do vậy lương thông tin thu được sau nén thường nhỏ hơn đữ liêu gộc rất nhiều
Nền dữ liệu phố biển vỉ hai lý do
~ Do nhủ câu lưu trữ đữ liệu: lượng thông tìn cần lưu trữ ngày cảng lớn nên nêu
không có cách thức tỏ chức thì sẽ vượt quá dung lượng của các thiết bị nhớ Nén đữ liệu có tác dụng làm giảm dưng lượng thông tin cần lưu trữ
- Do yéu câu truyền đữ liệu: dữ liêu lớn sẽ làm chậm tốc độ truyền dữ liệu Do
vậy, nảy sinh nhu cầu nén thông tin để tăng tốc đô truyền Ví dụ, khi lướt web hoặc
khi download file
Quá trình nén và quá trình giải nén như sau:
Hình 1: Quá trình nến và giải nén thông tin
Ngoài thuật ngữ “nén dữ liệu hay dafa compression”, người ta còn cỏ tên gọi khac “ma hod nguén — source coding” hay “giảm độ dư thừa” Đó là bởi vì các ký
hiệu đầu vào (có thẻ là các bít, các mã ASCIL, cae byte, cae mau audio hoặc các giá trị
điểm ảnh) được phát ra bởi một nguồn thông tin nảo đó vả phải được mã hoá trước khi
gửi tới đích
Từ hơn hai thập ky nay, cỏ rất nhiều kỹ thuật nén đã được công bó trên các tài liệu, các phân mềm nén đữ liêu đã xuất hiện ngày cảng nhiều trên thị trường Tuy
nhiên, chưa có phương pháp nén nào được coi là phương pháp van năng vì nỏ phụ
thuộc vào nhiều yếu tổ và bản chất của dữ liêu gốc
1.1.1.2 Các thông số quan trọng của nén
= Ty Ié nén (compression ratio) : Ty 1é nén là một trong các đặc trưng quan
Trang 1313
trọng nhất của mọi phương pháp nén, Nhún chung, có thể dịnh nghĩa tý lệ nén như sau:
Kích thước của dữ liệu đầu ra
1c yh nea SO Rich thức của đề liệu đầu vào
1ÿ lệ nén có thể dược tỉnh theo bpb (bịt per bí Trong nén ảnh thì bọb cũng cỏ nehia la “bits per pixel”; trong các phương pháp nén vẫn bản, người ta thường dễ cập
dén bpe (bits per character)
-_ Nhân tổ nén (compression factor} : là nghịch đảo của tỷ lệ nén Nhân tô
nén được tinh theo công thức sau:
Tích thưặc của dữ liệu đầu vào
Kich thir: cha d¥ liệu ¿đầu ra
-_ Hiệu suất nén: được tỉnh theo cổng thức
Hiệu suất nén — 100 x (1- Tỷ lệ nén) %
Tuy nhiên, cũng phải thây rằng những chỉ số của một phương pháp nén chỉ có giá
trị với chính sự nén đó, vi hiệu quả của nén còn phụ thuộc vào kiểu đữ liệu định nén
'Tÿ lệ nén cũng, chí lá một trong các đặc trưng cơ bán của phương pháp néa Nhiều khi
tý lệ nẻn cao cũng chưa thể nói rằng phương pháp nén đó là hiệu quá hơn các phương,
pháp khác, vì còn các chí phú kháe như thời gian, khỏng gian vá thậm chí cả dộ phức
tạp lính toán nữa Thí dụ nhủ nên phục vụ ương truyền dữ liệu: vấn để đặt ra là hiệu quả nên có tương hợp với đường truyền khong
Cũng cần phân biệt nén dữ liệu với nén băng truyền Mục dich chỉnh của nén là
làm giám lượng thông tin dư thừa và dẫn tới giảm kích thước dữ liệu Tuy vậy, đổi khi
quá trình nén cũng làm giảm băng truyền tín hiệu số hoá thấp hơn sơ với truyền tin
liệu lương tự
1.1.2 Nguyễn tắc của nếu dữ liệu
Các nguyên lắc, kỹ thuật và giải Huuật để nến các loại dữ liệu khác nhau được hái triển bởi nhiều người, và đều dựa trên các khái niệm về thống kê, biến đổi Fouricr
và các dạng biển đối kháe
Có nhiều phương pháp nén dữ liệu Chúng dựa trên các ý tưông khéc nhau đẻ phủ
hợp với các loại đữ liệu khác nhau và tao ra các kết quả khác nhau, nhưng tất cã đều
dua trên củng một nguyên tắc là nén đỡ liệu bằng cách loại bỏ dư thửa từ dữ liệu gốc
trong file nguân Các để liệu không ngẫu nhiên đều có một câu trúc nhảt định va cau
trúc này có thế được khai thác đề thu được biếu điễn nhỏ hơn của đữ liên, một biểu
điễn trong đó không có câu trúc có thẻ nhận thức được
Vi du, trong văn bản tiếng Anh, ký tự E xuất hiện thường xuyên trong khi ký tự Z,
Trang 1414
lại rất it khi xuất hiện Đây gọi lả loại dư thửa bảng chữ cái Để thực hiện nén, người ta thực hiện gắn các mã kích thước thay đối cho các chữ cái, với E nhận mã ngắn nhàt và
7, nhận mã đại nhất Một loại dư thừa khác là đư thừa theo ngữ cảnh, ví dụ rửuz chứ cái
Q hau như luôn được theo sau bởi chữ cái U
Ý tưởng của nén bằng cách giảm bớt dư thừa gợi ý dưa ra luật chung của nén dữ
liệu: “gán các mã ngắn hơn cho các xự kiện chung (các sumbol hoặc các phrase) va
phương pháp mã hoá Huffman
- Sự lập lại của các ký tự
Trong một số tình huống (ví đụ như trong ảnh sẽ), một ký hiệu (bít “0” hay bịt
“1") 66 thé được lặp đi lặp lại một số lần Kỳ thuật nén đủng trong trường hợp này là
thay đấy lặp đỏ bởi đây mới gồm 2 thành phần: số lần lặp va ky hiệu ding dé ma
Phương pháp mã hoá kiến này có tên 14 mã hoá loạt đài RUC
- Những mẫu sử: dụng tần suất
Có thể có dãy ký hiệu não đỏ xuất hiện với tần suất tương đối cao Do vay, co thé
ma hoa béi it bit hon Day 1a cg sd cua phương pháp mô hoá kiểu từ điễn do Lempel
Ziv dua ra va co cai tién vao nm 1977, 1978 va do dé cé tén goi LZ77, LZ78 Nam
1984, Ley Welch da cai tiến hiệu quả hơn và đặt tên là L⁄W (Lempel-Ziv-Weleh)
- Dộ dư thừa vị trí
Do sự phụ thuộc lấn nhau của dữ liệu, đôi khi biết được ký hiệu (giá tr) xuất hiện tại một vị trí, đồng thời có thể đoán trước được sự xuất hiện của các giá trị ở các vị trí
khác nhau một cách phủ hợp Chẳng lưm, ảnh biểu điển trong một lưới hai chiều, một
số điểm ở hàng đọc trong một khối đữ liệu lại xuất hiện trong cùng một vị trí của các hàng khác nhau Do vậy, thay vi lưu trữ đữ liệu, ta chỉ cân lưu trữ vị trí hàng và cột
Phương pháp nén đựa trên sự đư thừa này gọi là phương pháp mã hoá dự đoán
Ngoài ra còn có cách phân loại độ dư thừa khác
- Dư thừa về không gian bay tương quan về không gian
Tên trong một ảnh đơn hoặc một Írarne đơn lễ của viđeo số có những lương quan
đáng kế giữa cac mau liền kế (các pixel) và kết quả là sẽ có những dư thừa về không
Trang 1515 gian trong, dữ liệu
- Dư thừa về trải phế hay tương quan vé trai phi
Đôi với dữ liệu thu dược từ nhiều nguồn (multiple cameras), sẽ có những tương, quan đáng kế trong các mẫu tir các nguồn Tương quan này dược coi như là những, tương quan về trải phố và đần tới những dư thừa trong dữ liệu
- Dư thừa về mặt flrời gian hay tương quau theo thời gian
Đổi với dữ liệu về thời gian (chẳng hạn như audio và video) có những tương,
quan đáng kế trong các phân đoạn (segrnenQ thời gian khác nhau Đây được coi như
tương quan theo thời gian và dan đến các dư thừa về thời gian trong đít liệu
Ý tưởng cốt lõi trong bất kỳ kỹ thuật nén tảo cũng là giảm số mẫu có tương
quan cao thành các mẫn biểu điễn thấp hơn trong nhóm khác nhau của các trâu
tương quan để có thế giảm bót các dư thưa về dữ liệu và vì vậy giãm kích thước của
dữ liệu
Nguyễn tắc của việc néu bằng cách loại bó dư thừa cũng trả lời cho cảu hỏi:
“Vi sao mit file da nén khang thé duoc nén thém nita?”
Khi một file dược nén lần dâu thì các dữ liệu dư thừa của nó được loại bỏ Do
vậy, khi tiếp tục nén thêm thì không có đữ liệu dự thừa nào dược loại bỏ Cũng có thể
trả lời cho câu hồi trên bằng cách giả đính nếu có thể nén cá
file đã niên thủ file nay sé được giêm kich thuốc và việc nén này có thể được Tập đi lặp lại cho đến kich thước 1
tbyte hoặc thâm chí 1 bút Tất nhiên, điều này là vô lý vì mét byte đơn lẽ không thé
chửa thông tin hiện có trong một file lớn tuỷ Ý:
1.1.3 Phân loại phương pháp nén
Có nhiều cách phân loại các phương pháp nén khác nhau
1.13.4 Theo nguyên l nén
- Nén chính xác hay nén không mắt mát thông tin: Bao gồm cáo phương pháp nén mA sau khi giái nén ta thu được chính xác dữ liệu gốc Nén loại nảy được yêu cầu đổi với lưu trữ và truyền vật lý Các giải thuật loại nảy thường dựa vào thay thế các mẫu lặp lại với các ký hiệu đặc biệt mà không quan tâm đến ý nghĩa luồng bịt (mã hoá
entropy — entropy encoding)
- Nén có mất mát thông tin: bao gồm các phương pháp mà sau khi giải nén ta không tim được dữ liệu như bản gốc Trong nén ảnh, người ta gọi là các phương pháp
“tâm lý thị giác” Các phương pháp này lợi dụng tinh chat cia mat người, chấp nhận một số van xoắn trong ảnh khi khôi phục lại Lất nhiên, các phương pháp này chỉ có hiệu quả khi ma độ vặn xoắn là chấp nhận dược bằng mắt thường hay với một dung sai
ảo đó Các phương pháp nén loại này rất hữu ích đối với việc lưu trú và truyền lãi
audio, video và ảnh tĩnh trên các mạng có bằng thông hạn chế
Trang 161ó 1.1.3.2 Theo cách thức thực hiện nén
- Cáo phương pháp không gian: cáo phương pháp thuộc họ này thực hiện nén
bằng cách tác động trực tiếp lên việc lẫy mẫu của ảnh trong miễn không giam
- Phương pháp sử dụng biến đổi: gồm các phương pháp tác động lên sự biến đổi
của ảnh gốc rà không tác đông trực tiếp như họ các phương pháp khác
1.1.3.3 Phân loại dựa vàu triết lý của sự mã hoá
- Các phương pháp nén thế hệ thứ nhất: gồm các phương pháp mà mức đồ tính toán là đơn giãn: ví du như việc lây mẫu, gản từ mã
- Cáo phương pháp nén thế hệ thứ hai: dựa vào mức độ bäo hoả của tý lệ nén
1.L3.4 Cách phân loại của AnilK.Jain
- Phương pháp điểm
- Phương pháp dự đoán
- Phương pháp dựa vào biển đổi
- Các phương pháp tố hợp (Hybrid)
1.1.4 Các kỹ thuật nên thông tin
1.1.4.1 Nén không mất mát thông tin
Trong nén đỡ liệu không mắt mát, tính nhất quản của đữ liệu được bảo toản Dữ liêu géc vả dữ liệu sau khi nén và giải nén hoàn toàn giống nhau bởi vỉ trong các
phương pháp này, các giải thuật nền và giải nên là đão ngược của nhau: không có thân
đữ liệu mào bị rất ruát trong Hến trình nén và giải nén Dữ liệu dư thừa được loại hỗ trong nén và được bố sung trong quá trình giải nén Các phương pháp nén không mất
mát thường được sử đụng khi không muốn mắt znát một chút dữ liệu nào
TẤI cả các phương pháp nén không mất mắt thông tín hoạt động bing cach xác
định một số khía cạnh của không ngẫu nhiên (dư thừa) trong dữ Hiệu đầu vào, và bằng
cách biển điển các đữ liệu ngẫu nhiên đỏ theo một cách hiệu quả
Có it nhất 2 cách mà đỡ liệu có thể không ngẫu nhiên:
- Một số ký hiệu được sử đụng nhiều hơn những ký hiệu khác Ví dụ, hong văn
ban tiếng Anh thì các khoảng trắng và chữ cái E phổ biên hơn nhiều so với các dau
châm và chữ cái Z,
- Có nhiều mẫu bên trong đữ liệu, các kết hợp của các ky hiệu nhật định xuất
hiện nhiều hơn các kết hợp khác Nếu một phương pháp nén có thể xác định các mẫu
lắp đó, nó có thể biển điển chúng theo một cách thúc hiệu quả hơn
Các phương pháp nén không mắt mát thông tin tiêu biểu là;
- Ma hoa loal dai (Run Length Encoding)
Trang 1717
- Ma hoa Huffman (Huffman Coding)
- Mã hoá Shannon-Fana (Shannon-Fano Coding}
- Các phương phap LZ78, LZH, LZW
1.1.4.2 Nén co mit mat théng tin
Trong nhiều trường hợp, mắt và lãi của con người không thé phan bist cdc thay đổi nhồ Trong các trường hợp này, có thể sử dụng phương pháp nén có mất mái Các
e thông tău dư thừa đơn lẽ Thông
thường, phương pháp nén này liên quan đến hàng loạt các phép biển đối đữ liệu của
các giải thuật nén, từ một miễn này sang một miễn khác (ví đụ như miễn tần số trong, biến đổi Fourier) mà không chủa tất cả các thuật ngữ biển đổi kết quả và vi vay mat một số thông tin
Các giải thuật tiêu biểu của nén có mắt mát thông tin là:
- Ma hoá khác biệt: lưu trữ các khác biệt giữa các mẫu dữ liệu liên mạch sử dụng,
một số giới bạn các bịt,
- Biến đỗi Cosine rai rac (DCT): được áp đụng cho dữ liện anh
- Tượng hoá vectø
- Nén IPEG
- Nén MPHG
1.1.5 Ứng dụng của nén thông tin
Trong các lĩnh vực của công nghệ thông tin — viễn thông hiện nay, việc truyền tải
thông tin đá la một công việc xây ra thường xuyên Tuy nhiên luong thong tm duce
truyễn tải đi Hường rãi lớn, điêu này gây khó khăm cho công việc truyền tải vì nó làm
tốn tài nguyên mạng, tiêu phí khả năng, của hệ thống Đề giải quyết được những vấn:
đề đó, các phương pháp nén đã ra đời và ngày cảng được ứng dụng rộng rãi
Thông thường, hầu hết các lập tìm trong máy tính có rất nhiều thông in dư thừa,
việc thực hiện nén tập tin thực chất là mã hoá lại các tập tin để loại bổ các thông tin du
thừa Nhìn chưng không thể có phương phái nén (ng quát nào cho kết quả tốt đối với
tất cả các loai tap tin Kỹ thuật nén tập tìn thường được áp dụng cho các Tập tin văn
bản (trong đó có một số kí tự nào đó eé xác suất xuât hiện nhiều hơn các kí tự khác), các tập tin ảnh bitmap (mà có thế oó những mảng lớn đẳng nhật), các tập tin đừng để
Trang 18truyền tu lương đổi chậm Để lãng tắc độ truyền ta có thế dùng nhiều phương pháp
như sử đựng kỹ thuật điêu chế pha nhiều mức, điều chê QAM, TCM
Nén dữ liệu trước khi truyền di cũng là một trong các phương pliáp nhằm tầng tốc rên dữ liệu rong các modem hiện dại, việc thực hiện nén đữ liệu trước khi
dược thực hiện ngay trong modem theo các giao thúc V42bis, MNPS
Phương pháp này đòi hỏi bai modetn phải có cũng một giao thức nén dữ liệu, điều này
nhiều khi khó thoả mãn
Có một phương pháp khác là thực hiện nén các tập túi ngay lại các máy vi tính trước khi truyền đi, tại các máy tính nhận, các tập tin lại được giải nén để phục hỗi lại dang ban dâu Phương pháp này có ưu điểm là bên phát và bên thụ chỉ cân có chúng
phần mềm nén và giải nén, ngoài ra còn có thể áp dụng được để truyền đữ liệu qua các modem khéng hỗ trợ nén đữ liệu hoặc truyền đữ liệu trực tiếp qua cổng COM của máy
tính Nhược điểm của phương pháp này là các máy vị tình phải tốn thêm thời gian nén
và giải nén, nhưng do sự phát triển nhanh chóng của các bộ vi xử lý mã thời gian thựo
hiện nén vả giải nén được giảm nhỏ hơn rất nhiều thời gian đề truyền đữ liệu
1.2 Mã hoá thông tin
1.2.1 Sơ lược về lịch sử mật mã học
Mật mã học nghiên cứu các kỹ thuật toán học nhằm cung cắp các dịch vụ báo
vệ thông tin Đây là ngành khoa học quan ọng, có nhiều ứng dung trong đời sống xã
hội
Khoa hee mật mã đã ra đời từ hàng nghìn năm Tuy nhiên, trong suốt nhiều thế
ký, các kết quả của lĩnh vực nảy bầu nhu không được ửng, dụng trong các lĩnh vue din
hội, trong dỏ phải kể dến rất nhiều những ứng dụng trong lĩnh vực dân sự, thương,
mại Cáo ứng dụng mã hóa thông tin cá nhân, trao đổi thông tin kinh doanh, thực hiện các giao dich điện tử qua mạng đã trở nên gẫn gíii và quen thuộc với mọi người
Trang 1919 Củng với đỏ, các nghiên cửu và ứng đụng của mật mỡ học ngày cảng trổ nên đa dạng hơn, mỡ ra nhiều hướng nghiên cứu chuyên sôu vào từng lính vực ứng dụng cụ
thể với những đặc trưng riêng, Ứng dụng của khoa học ruật xố không chỉ đơn thuần là
mã hóa và giải mã thông tin mà côn bao gồm nhiều vẫn để khác nhau cân được nghiên
cứu và giải quyết, ví đụ như chứng thực nguồn gốc nội dung thông tin (kỹ thuật chit ky
điện tử), chứng nhận tính xác thực về người sở hữu mã khóa (chứng nhận khỏa công,
khai), các quy trình giúp trao đổi thông tin và thục hiện giao dịch điện tử an toàn trên
mang,
Các ứng dụng của mật mã học vả khoa học bảo vệ thông tin rất da dang va phong phú; tùy vào tính đặc thủ của mỗi hệ thông bảo vệ thông tin mà ứng đụng sẽ có
các tỉnh năng với đặc trưng riêng,
Những kết quả nghiên cửu về mật mã cũng đã được đưa vào trong các hệ thống
hệ
phức tạp hơn, kết hợp với những kỹ thuật khác để đáp ứng yêu cầu da dang of
thống ứmg dựng khác nhau trong thực tế, ví dụ như hệ thống bô phiêu bấu cử qua
mạng, hệ thống đảo tạo từ xa, hệ thông quan ly an ninh của các don vị với hướng tiếp
cận sinh trắc học, hệ thẳng cưng cấp địch vụ đa phương tiện trên mạng với yêu cầu cưng cấp địch vụ và bảo vệ bản quyền sở hủu trí tuệ đối với thông tin số
1.2.2 Các khái niệm cơ bản
1.2.2.1 Khái niệm mật mã
Theo nghĩa lẹp, “mật mấ” chủ yếu dùng để bảo mật dũ liệu, người ta quan
niệm: Mật mã học là khoa bọc nghiên cứu một mã, bao gồm: Tựø mỡ và Phân tích
mã
Phân tích mã là kỹ thuật, nghệ thuật phân tích mật mã, kiểm tra tỉnh bảo mậi
của nó hoặc phá vỡ sự bi mi eta nd Phan lich ma con goi la Thame mi
Theo nghia rang, “mgt ma” 14 mét trong những công cụ hiệu qua bao dam an
toàn thông tin nói chung: ão mét, bao toan, xdc thirc, chéng chỗi ciii,
1.2.2.2 Khái niệm mã hoá thông tín
- Afã bóa là quả trình chuyển thông tim có thể đọc được (gọi là Đấn zð) thánh thông tin “khé” thể đọc được theo cách thông thường (gọi lá Jãn zmẩ)
Đây là một trong những kỹ thuật để bảo mật thông tr
- Giải mã là quả trình chuyên thông tin ngược lại, từ Bến znữ thánh Ban rd
- Thuật toàn mã hóa hay giải mã là thủ tục tính toàn đề mã hỏa hay giải mã
- hóa mũ hôn là một giả trị làna cho thuật toán mã hóa thực hiện theo cách riêng, biệt sinh ra bán rõ Thông thường khóa cảng lớn (dộ dài và tỉnh ngẫu nhiên của khoá
cảng lớn) thì bản mã cảng an loàn Phạm vì giá trị có thế có của khỏa được gọi là
Không gian khóa
Trang 2020
- Hệ mã bóu là lập các thuật toán, các khỏa nhằm che giấu thông tí, cũng như
lam cho ré no
Hệ mã hoá được định nghĩa là bộ năm (P., C, K, E, D), trong đó
Với khoá giải ma kd © K, có bảm giải mã đạa © D, đục Ơ ›P, sao cho
cea(ene(x))-x, Vai mọi x = P.O day x được gọi là bản rõ, ew(%x) được gọi là bần mã
Quá trình mã hoá và giải mã:
Hình 2: Quá trình mã lúu và gidi ma
Người gửi tin GŒ muốn gửi bản tín I cho người nhận N Để dam bao bi mat, G
mé hoa ban tin bằng khoá lập mã ke, nhận dược bản mã e„(Ä), sau dé giti cho N Tin
có thể trộm bản mã e¿,(T) nhưng cũng “kad” dẻ hiểu được bản tin gốc T nếu không
só khoả giải mã kủ
Người nhận N nhận được bán mâ, họ dùng khoả giải mã kd đề giải mã ey,(1) và
nhận được bán tin gốc †=dua(ex.CL})
1.2.3 Phân loại hệ mật mã
Hiện có 2 loại hệ mat mã chính: zã hoá khoá bí mật và mã hoá khoá công khai
1.2.3.1 Hệ mã hoá khoá bí mật
Trong hệ thống mã hóa khoá bí mật, quả trình mã hỏa và giải mã một thông điệp
sử dụng cùng một mã khỏa gọi là khỏa bí mặt (socret kcy) hay khóa dối xứng
(symmetric key) Do đó, van dễ bảo mật thông tin dã mã hỏa hoàn toàn phụ thuộc vào
việc giữ bí mật nổi dụng của mã khóa đã được sử dụng,
'rước đây, phương pháp mã hỏa chuẩn 2H5 được coi là tiêu chuẩn của hệ mã
hóa khỏa bí mật Tuy nhiên, với tốc độ và khá năng xử lý ngày cảng được nâng cao:
của các bộ vị xứ lý hiện nay, phương pháp mã hỏa I2HS đã trở nên không, an toản trong,
bảo một thông tim Đo đó, Viện Tiêu chuẩn và Công nghệ Quốc gia Hoa Kỳ đã quyết
Trang 2121
định chọn một chuân mã hỏa mới với đồ an toàn cao nhằm phục vụ nhu cầu bảo mật
thông tin liên lạc của chính phủ Hoa Kỷ cũng như trong các ứng dụng dân sự Thuật toan Rijndael do Vincent Rijmen va Joan Daeman đã được chỉnh thức chọn trở thành
chuẩn mã hỏa nang cao AES tir 02 thang 10 năm 2000
boa bist
Thông điệp Mihóa Thôngđiếp Giúmà — Thôngđp
gud đ mã liỏa i gai ma
Hinh 3: M6 hinh hé thang ma hoa khoa bi mat
Hé ma hoa khoa bí mật cỏ đặc điểm sau:
- Ưu điểm: Hệ mã hoá khoá bí mật mã hoá va giải mã nhanh hơn Hệ mã hoá
khoá công khai
- Hạn chế
+ Mã hoá khỏa bỉ mật chưa thật an toàn với lý do sau: người giải mã vả người mã
hoa phai co chung một khoá Khoa phải được giữ bí mật tuyệt đối, vì biết khoá nảy đề
xác định được khoá kia vả ngược lại
+ Vấn đề thỏa thuận và quản lý khoá chung là khó khăn và phức tap Người gửi
và người nhận phải luôn thông nhất với nhau vẻ khoá Việc thay đổi khoả là rất khỏ và
dễ bị lộ, Khỏa chung phải được gửi cho nhau trên kênh an toan
Mặt khác, khi người lập mã và người giải mã cùng biết chung một bí mật thì cảng khỏ giữ bị mật
Hệ mã hoá khoá bí mật thường được sử dụng trong môi trường mà khoá chung cỏ
thé dé dang trao chuyên bí mật, chẳng hạn trong củng một mạng nội bộ vả đề mã hoa
những bản tín lớn vì tốc độ mã hoá và giải mã nhanh hơn hệ mã hoá khoá công khai
1.2.3.2 Hệ mã hoá khoá công khai
Nếu như vẫn đề khó khăn đặt ra đổi với các phương pháp mã hỏa khoá bi mật
chính là bai toán trao đổi mã khỏa thì ngược lại, các phương pháp mã hỏa khỏa công khai giúp cho việc trao đổi mã khỏa trở nên dễ dàng hơn Nội dung của khỏa công khai
(public key) khong can phải giữ bỉ mật như đổi với khỏa bỉ mật trong các phương pháp
mã hỏa bí mật Sử dụng khỏa công khai, chúng ta cỏ thẻ thiết lập một quy trình an toan
để truy đổi khóa bí mật được sử dụng trong hệ thông mã hóa khoá bí mật
Trong những nam gan đây, các phương pháp mã hóa khóa công khai, đặc biệt lá
Trang 2222
phương pháp RSA, được sử dụng ngày cảng nhiêu trong các ứng dụng mã hóa trên thẻ
giới và có thể xem như đây là phương pháp chuẩn được sử dụng phố biển nhất trên
Internet, img dụng trong việc bảo mật thông tin liên lạc cũng như trong lĩnh vực thương mại điện tử
Có thể định nghĩa hệ mã hoá công khai như sau:
Hệ mã hoá công khai (Hệ mã hoá khoá phi đối xứng): lá hệ mã hoá cỏ khoả lập mã và khoá giải mã khác nhau (ke khác #4) Hệ mã hoá này được gọi là Hệ mã hoá khoá công khai vỉ:
~ Khoá lập mã cho công khai, gọi là khoá công khai
- Khoa giải mã: giữ bi mật, còn gọi là khoả riêng hay khoá bí mật
Một người bắt kỳ có thể dùng khoá công khai để mã hoá bản tin nhưng chỉ có
người nảo cỏ đúng khoá giải mã thì mới có khả năng đọc được bản rõ Hệ mã hoá công,
khai hay cỏn gọi là hệ mã hoá phi đối xứng được Diffie và Helhman phát minh vào nam 1970
khóa công công khóa riêng
peep
Mã hỏa Thông điệp, Giải mã — Thông điệp
đã mã hóa được giải mã
Hình 4: Mô hình hệ thống mã hoá với khoá công khai
Hệ mã hoá khoả công khai có đặc diem sau:
- Ve wm diem
+ Hệ mã hoá công khai cỏ thuật toán được viết một lần, công khai cho nhiều lân
dùng, cho nhiều người dùng mà họ chỉ cản giữ bí mật khoá riêng của mình
+ Khi biết các tham số ban đầu của hệ mã hoá, việc tỉnh ra cặp khoả công khai va
bỉ mật phải là “đế” tức là trong thời gian đa thức
Người gửi có bản rõ P vả khoá công khai thi “đế” tạo ra bản mã C
Người nhận có bản mã C và khoá bí mật thi “đế” giải được thành bản rõ P
+ Người mã hoá dùng khoá công khai, người giải mã giữ khoả bi mật Khả năng
Trang 23- Vẻ hạn chế: hệ mã hoá công khai có quá trình mã hoá và giải unã chậm hơn hệ
nã hoá khoá đổi xứng
Hệ mã hoả khoá công khai thường được sử dụng chủ yếu trên các mạng, công, khai như Internet, khi mà việc trao chuyên khoa bi mat tong déi khỏ khăn
Tặc trưng nổi bật của hệ mã hoá khoá công khai là khoá công khai và bản mã đều
có thể gửi đi trên một kênh truyền tỉn không an foàn Có biết cả khoá công khai và bản mnã thì thám mã cũng không dễ khám phả bản rễ Nhưng vi có tốc độ mã hoá và giải mã chậm nên hệ mã hoá khoá công khai chí dùng để mã hoả những bán tin ngắn,
ví dụ như mã hoá khoá bí mật gửi di
12.3.3 Kết hợp hệ mã hoà khoá bí mật và hệ mã hoá khoá công khai
Các phương pháp mã hóa khoả bí mật có ra điểm xử lý rất nhanh so với các phương pháp mã hóa khóa công khai Do khóa đdịng để mã hóa cũng dược dụng để
giải mã nên cần phâi giữ bí mật nội dung của khỏa và mã khóa được gợi là khỏa bí
mật Ngay cả trong trường hợp khóa được trao đổi trục tiếp thì mã khỏa này vẫn có
khả năng bị phát hiện Vấn để khó khăn đặt ra đổi với các phương pháp mã hóa này
chính là bài toán trao đổi mã khóa
Ngược lại, các phương pháp mã hóa khỏa công khai giúp cho việc trao đổi mã
khỏa trở nên dễ
như đổi với khóa bí mật trong các phương pháp mã hóa khoá bí mật dàng hơn Nội dung của khỏa công khai không cần phải giữ bỉ mật
Sử dụng khóa công khai, mã khóa bí mật cô thể được trao dói an toàn theo quy
trình trong hình về dưới dây:
Trang 241.3 Sơ lược về giấu tin mat
1.3.1 Các khái niệm cơ bản
1.3.1.1 Khải niệm giấu tin mật
Giấu tin là nghệ thuật nhúng mẫu tỉn mật vào một vật mang tin khác
Hình 6: Phâu cấp các lĩnh vực nghiêu cứu của ngành mật ruã học
Giấu tì và mật mã tay củng có một mục dích là không đẻ đối phương phát hiện
ra từ cân giấu nhưng chúng có một số đặc điểm khác biệt sau:
- Mật mã là giấu đi ý nghĩa của thông tin
- Giấu tản là giẫu di sự luện điện của thông lim Về ban chat, giấu tin gần với ném:
dữ liệu hơn
Thuy dn sé va giấu tin:
Trong lĩnh vục bảo mậi, giấu tìn được phân nhánh như sau:
Iiferraatioe híđíng
|
Wihiyrmutrkink: Fingerprinting imrnnic Pure
Hình 7: Các nhành của giấu tim
Thấy dn (Water marking) 14 Tinh vực nghiên cứu việc nhúng thông tin phục vụ
Trang 2525
mật vao một mồi trường phủ Trong quá trình giẫu tin, đề tăng tính bảo mật, người ta
có thê dùng một khoá viết mật, khi đỏ người ta nói vé Intrinsic Steganography (giau tin có xử lý) Để giải mã người dùng cũng phải có khoá viết mật đỏ Khoá nảy có thể không phải lả khoa ding de lap mat ma mau tin, vi duno co thé la khoa dé sinh ra ham băm phục vụ rải tin vào môi trường phủ Ngược lại nêu không dủng khoả viết mật thì
người ta chỉ giảu tin đơn thuân vảo môi trường phủ thì khi đỏ người ta nói về Pure
Steganography (giau tin don thuan)
Xét về tính chất thuỷ ấn giỏng giấu tin ở chỗ tìm cách nhúng thông tin mật vào một môi trường Tuy nhién xét vẻ bản chất thì thuỷ ân có những nét khác ở một số điểm:
~ Mục tiêu của thuỷ ân là nhúng thông tin không lớn thường là biểu tượng, chữ
ký hay các đánh dâu khác vào môi trường phủ nhằm phục vụ việc xác nhận bản quyền
~ Khác với giấu tin ở chỗ giấu tin sau đó cần tách lại tin còn thuỷ ấn tìm cách biển tin giâu thành một thuộc tính của vật mang
~ Chỉ tiêu quan trọng nhất của một thuỷ ân là tỉnh bên vững, của giấu tin là dung, lượng giau
~ Điểm khác nữa giữa thuỷ ấn và giấu tin là thuỷ ấn có thể võ hình hoặc hữu hình
trên vật mang
1.3.1.2 Các thành phần của hệ giấu tin mật
Các thành phần chính của một hệ giầu tin mật gồm có:
- Mẫu tin mật có thẻ lả văn bản, hình ảnh hay tệp tin tuỷ ý (âm thanh số, video
số), vỉ trong quả trình giảu tin, chủng đều được chuyên thành các chuôi bit
- Môi trường sẽ chứa tin mật: thường lả ảnh, nên gọi là ảnh phủ hay ảnh góc
Ngoài ra còn có thê là âm thanh số, video số, văn ban
- Khoa K: khoá viết mật, tham gia vảo quả trình giâu tin đề tăng tính bảo mật
- Môi trường đã chứa tin mật là môi trường chửa tin mật sau khi đã được nhúng tin mật vào Trong trường hợp môi trường ảnh thi gọi lả ảnh mang
Trang 2626
Xét theo góc dộ toàn học, có thể định nghĩa một lược dễ giấu tin như sau
Goi K, là một khoả viết mật (stego key) được xác định từ một tập K của tất cả các khoả viết mật, M là tập tất cá các thông điệp có thể được nhúng và © là tập tất cä các vật mang có thể, Khi đó, một lược đỗ giấu tin được thiết lập bởi 2 ánh xạ, anh xa những #2nb và ảnh xạ trích xuất “xế:
Emb: Ö x€ x M— €
Ext: 2 M,
sao cho Ext(Emb(c.K,,m))=m véi tal ci ¢ thude C va K, thude K va m thude M Vat mang s=Emh(c,K,,m) duge goi la slego Data
1.3.2 Tinh chất của giấu tin mat
Giấu Lin mat 18 mdt lĩnh vực mới, đã và đang được nghiên cứu, daze nyghiém theo
nhiều phương pháp khác rau Để đánh giá chải lượng của một phương pháp gidu tin
TnẬI, người ta thường dựa vào các tiêu chí sau:
a) Dim bio tinh vé hinh
Giấu tin mật sẽ làm biến đổi vật mang tỉn Tính võ hình thể hiện mức độ bì biến đổi của vật mang Phương pháp giấu tin mặt tốt sẽ làm cho thông tỉn cần giấu trở lên
vô hình trên vật mang, túc là làm người dùng khó có thể nhận ra trong vật mang có ẩn chủa thông tin mật Tuy nhiên, thực tế không phải lúc nào người ta cũng cố gắng để đạt dược tình vô binh cao nhất Vì dụ trong truyền hình, người ta gắn hình ảnh mỡ gọi
là thuỷ ấn dễ bảo vệ bản quyền ban tin
b) Khả năng chẳng giả mạo
Mục dich của giấu tin mật là dễ truyền di thông tin mật Nếu không thể do thám tin mật thì kể địch cũng có từ cách lam sai lac tin mal, lam giả lav tin mal dé gay bat
lợi cho đổi phương Một phương pháp giấu tin tốt phải đảm bao tin mat không bị tắn công một cách chủ động trên cơ sở những hiểu biết vẻ thuật toán nhúng tin (nhưng
khảng biết khoá giấu tin) va cé vat mang
Đôi với lĩnh vụ thủy ấn sé thi kha ning chống giá mạo là yêu cầu vỗ cũng quan
trọng vì có như vậy mới bảo vệ được bản quyền, mình chứng tính phúp lý của sân
phẩm
©) Dung lượng nhúng
Dung lugng gian được tính bằng lý lệ của lượng tỉn cần giấu so vái kích thước của vật mang tin Các phương pháp nay đếu cố gắng giấu được cảng nhiền tin cảng TẾ nhưng vẫn giữa được bí mật Tuy nhiên trong thực tế người ta luôn phải cân nhắc giữa đụng lượng và các chỉ tiêu khác như tính vô hình, tính bên vững (n định)
Trang 27vậy
e) Độ phức tạp tỉnh toàn
Chỉ tiêu độ phức tạp trong giấu tin va tach tin cũng là một yêu tổ quan trọng trong
đánh giá các phương pháp giẫu tin mật Yêu câu về độ phức tap tinh toán phụ thuộc
vào từng ứng đụng Vi đụ một ứng dụng tạo thuỷ ân đê đánh đấu bản quyền cẳn phải
có độ phúc tạp tính toán cao thi mei dim báo chịu được sự tắn công của nhiều tin tặc
nhằm phá huỹ thuỷ ân
1.3.3 Ứng dụng của giấu tin mat
1.3.3.1 Liên lục bí mật
Trong ma hod, bân mã của tin mật có thế gây ra sự chủ ý của tin tặc nhìmg tin mật được giâu vào trong môi trường nào đó rồi gửi đi trên mạng máy tính thì it gây ra
sự chủ ý của tin tặc Dó là một ứng dựng của giấu tín
fin mậi trên
Hiện may người is phổi hợp đồng thời nhiều giải pháp
mạng công khai Đầu tiên lim mộ được nén lại, sau đó được mã hoá, cuối cùng giảu
bản rnã vào một Irường nào đỏ
1.3.3.3 Bảo vệ bản quyền
- Thuỷ Ấn:
+ Một biểu tượng bí mật gọi lá thuỷ ấn được nhúng vao trong một tải liệu (hình
ảnh, âm thanh ) đẻ xác nhận quyền sở hữu tải liệu
+ Thưỷ ấn được đính lên tranh ảnh khi bán hoặc phân phối, thêm vào đỏ có thể gim một nhãn thời gian để chống giá tạo
Trang 2828
+ Thuỷ ấn cũng được đùng để phát hiện xem các sản phẩm có bị sửa đổi hay không Việc phát hiện thuy ấn được thực hiện bằng thông kê, so sanh d6 tuong quan
hoặc bằng cách đo đạc xác định chất lượng của thuỷ ấn trong vặt mang,
- Diễm chỉ số : tương tự như số seri của phần mềm Diễm chi sé ding đề truyền thông tin về người nhận sản phẩm số (không phái chủ sở hữu) nhằm chứng thực ban sao duy nhất của sản phẩm
- Gần nhãn: Tiêu đề, chú giải, nhăn thời gian có thể được những vào sẵn phim
số Gắn tên người lên ảnh của họ, gắn tên địa phương lên bản đỏ, Khi đó nếu sao chép sản phẩm thì cũng sẽ sao chép cả thông tin đã nhúng vào nó Chủ sở hữu của sản phẩm, người có khoá viết mật có thê tách ra và xem các chủ giải
Trang một cơ sở đữ liệu ảnh, người ta có thể nhứng các từ khoá để các động cơ tìm kiếm co thế tìm nhanh một bức ảnh nào đó Nêu là mệt khung ảnh cho cả một đoạn phim, người ta có thé gan ca thời điễm diễn ra sự kiện để đồng bộ hình ảnh với
âm thanh Mgười ta cũng có thể gán số lằu mả hình ảnh được xem để tỉnh tiền thanh
toán
1.3.4 Kỹ thuật tấn công hệ giấu tin mật
ấn cỏng một hệ giảu tia mật dược gọi là sicganalysis Đé lả các phương pháp
để phát hiện, phá huỷ, trích rút hay sửa dỗi thông tia mật Việc nghiên cứu các biện
pháp
kế tắn công sẽ hữu ích cho việc thiết kế anội hệ ấn giáu thông tăm tối
Việc tân công được coi là thành công hay không tuỷ theo ứng dụng Di với liên
lac bi mat, việc phát hiện và chúng minh được một vật có chứa tin mật được coi là
thành công Đối với bảo vệ bản quyền hay chống giả mạo thi việc tấn công được coi là thành công nêu không chỉ phát hiện ra thuy ấn mà còn phá huỹ hay sửa đối nó nhưng,
không làm giảm chỗt hượng của vật trang,
géc (original object) va vat mang tin
- Riét cd Lin gidu trong val wang tin
- Biét thudt toan gidu tin
- Biết thuật toan trich (tach) tin mat
Có nhiều phương pháp để thám tin Thám tin có thể phát hiện thủy an hay tin
Trang 2929
mật bằng cách phân tich các trạng thải, vi dụ với ảnh có thể thảm tin bằng cach phan tích vùng nhiễu quá mức trên ảnh Tin tặc kinh nghiệm có thể nhận thấy các vùng nhiễu mày bằng uất thường, Nếu biết được vậi mang góc thả việc thám tim còn đơn
giản hơn nữa, vị khi đó có thể so sánh anh mang tin với ảnh gốc để tách nhiễu Nếu
thám tin biết được có tỉn ấn giấu, người ta có thế tạo ra các cặp ảnh góc và ảnh mang,
dé phân tích và xem xét liệu ảnh dang tim hiểu có mang đâu ân của chữ ký hay tin mật
trong ảnh thì việc phá tỉn mật chỉ đơn thuản là thay đối lại các bit này, như vậy ảnh
mang tin trở về trạng thái ban đầu
Phá tìn mật đối với các phương pháp giểu lin mật mã vẫn giữ nguyễn vật mang 1A
giúp cho việc phá huý thủy ấn mà vẫn giữ dược nội dung vật mang,
‘Néu biét tin mat va vat mang tin thi co hdi pha tin mat sé cao hon
TNếu biết thuật toán giấu tín thì kế thám tím có thể đồng nó thử giấu tín lên nhiều
vật mang khác nhu, qua đó dùng phương pháp thông kê để lim ra các quy luật gây
Trhiều cũng whit ding nó để kiếm thử xern một vật có mang tìn tuậi hay không,
1.4 Kết chương
+ khải niệm, tính chất
Chương 1 để trình bảy môi số nội dụng cơ bản, bao gồm c¡
và ứng dụng của cáu kỹ thuật nén thông tin, mé hed thang lin và giấu tin tật Qua nội
đụng vừa trình bày, có thể thấy các kỹ thuật này rất đều có tác đụng biển đối thông tin
sang dang khác, giúp cho việc truyền tãi thông tin trên mạng và oỏ nhiều ímg dụng,
trên thực tế Trong khi kỹ thuật nén thông tin có tác dung lam giảm lượng thông tin
truyền tái tiên mạng, kỹ thuật mã hoá thông tia đấm báo an toàn cho thông tin trao đổi thị kỹ thuật giấu tin mật có táo dụng che giấu hoạt động trao đôi thông tìì bằng cách
giấu thông tin trên vật mang Về bản chất, kỹ thuật nén thông tin vá giấu tim mat
giống nhau hơn Việc kết hợp cáo phương pháp này sé được trình bảy trong các chương sau
Chương tiếp theo sẽ giới thiệu một số kiểu dữ liệu đa phương tiện phổ biến, bao gồm âm thanh số, ảnh số và video số, và khả năng giấu ti mật áp đụng, trên các định: dang nay
Trang 3030
CHƯƠNG 2
MOI TRUONG DA PHƯƠNG TIỆN VÀ KHẢ NĂNG GIAU TIN
2.1 Âm thanh số
2.1.1 Tính chất cơ bắn của tín hiệu âm thanh
Tham số cơ ban nhất để đo tín hiệu âm thanh là tần số, Khi tân số đao động của không khi đạt mức từ 20 đến 20000 ITz thì tai người có thể nghe thấy âm thanh
Ngoài ra, âm thanh cỏn cỏ thể được đo thêng qua một tham số khác, đỏ là biên
độ Biên dé biến đỗi làm âm thanh êm nhẹ hay ẩm ï Dải dộng mả con người nghe
dược là rất rộng: giới hạn dưới là ngưỡng nghe dược và giới hạn trên là ngưỡng dau (pain) Ngưỡng nghe được của dạng sóng hình sin 1-kHy 14 0.000283 dyne/em?2 (1 dyn — 10-5N, 1 dyn/em2~0.1 Pa — 9.8693 x 10-7 aIm)
Biên độ của đang sóng hình sim có thể tăng từ ngưỡng nghe được theo hệ số từ
100000 đến 1000000 trước khi đạt tới ngưỡng đau Rất khó khăn làm việc với đải biên
độ quá lớn, cho nên biên độ của âm thanh thường được biểu diễn bằng decibel (40)
Che trước hai dạng sóng có biển độ đỉnh là X và Y, thước đo sự chênh lệch tính
bằng dB của hai biển độ này sẽ lá đB=20loa10CXZY)
Nếu ngưỡng nghe dược của tín hiệu 1-kHz (như nói trên dây) là 0.000283
dyne/cm2, được sử dụng làm tham chiếu cho 0 dB thì ngưỡng dau của hàu hết tai
tp suất Âmn thanh khoảng 100 dén 120 dB
mức âm (hanh xung quanh ruả lai người nghe thấy được mô 1ã bằng,
người đại tới rmỊ
Tóm |;
thuat ngit decibel (dB), là tỷ lệ với âm thanh yên lặng nhải mà có thể nghe được
Sóng âm thanh là liên tục theo thời gian và biên độ: nó thay đổi theo thời gian và
tiên độ có giá trị trong khoảng nghe thấy được, Inh L0 là thí đụ sóng âm thanh
Time
Amplitute
Hình 1: Sáng âm thanh
2.1.2 Biểu diễn âm thanh si
Dang sóng âm thanh liên tục được chuyển sang tin hiệu điện liên tục bằng microphone, Thi dy, dạng sông âm thanh trên hình 11 sẽ chuyển đổi thanh tin hiệu
điện có cùng hình đạng Tin hiệu điện thường đo bằng vốn Loại tin hiệu với biên độ
và thời gian liên tục được gọt là tín hiệu tương tự.
Trang 31‘ink 11: Biểu diễn ân thanh sé
Để xử lý và truyền tải tín hiệu âm thanh bing may tỉnh thi chúng phải được chuyển dỗi tín hiệu diện liên tục thành tím hiệu số theo ba bước ADC: lây mẫu, lượng
Thía đầu ra, sau biến đối số - trong tu, các tần số cao có thế xuất hiện do các
thước lây mẫu và lượng tử hóa Cáo tín hiệu trơn được thay thế bởi đấy các ham bude
và nó có thể chứa mọi tản số khác nhau Do vậy, thường sử đụng bộ lọc thông thấp
(cho tản số thấp đi qua) ở đầu ra của bộ biến đổi số - tương tự
Lay mau (Sampling)
Quá trình chuyén đối thời gian liên tục thành giá trị rời rạc được gọi là lầy mẫu
Hình 11 (b) và (G) chí ra tiển trình lẫy mẫu Trục thời gian phan chủa thành các khoáng,
có định Thu nhận giá trị của tin hiệu tương tự tại mỗi điểm đâu khoáng thời gian Khoáng thời gian này được xác định bởi một xung đồng hổ Tản số của đồng hỗ được
gọi là tẩn số mẫu hay tốc độ lây mẫu Giá trị mẫu vẫn là giá trị tương bự trong biên đệ:
Trang 323
nẻ có giá trị bất kỷ trong đái liên tục Nhưng giả trị mẫu lại ở trong khoảng thời gian
TỜi rạc: trong mỗi đôi, mẫu chỉ có mội giá trị
Lugng tit hoa (Quantization)
Tiền trình chuyền déi gia tri mẫu liên tục thành giá trị rời rạc dược gọi là lượng tử hóa Tiên trình này chia day tín hiệu thành số khoảng cổ định Mỗi khoảng có cùng,
4 được gán môi giá trị Trên hình 11
8 Mỗi mẫu sẽ thuộc một khoảng và được gám giá trị khoảng Trong di du nay, gid trị
mẫu chỉ có thế là số nguyên từ 0 đền § IIai mẫu có giá trị khác nhau trước khi lượng
¡ sau khi lượng tử hóa Kích thước khoảng,
lượng tử hóa được gọi là bước lượng tử hóa
dé mã hỏa Vậy, mỗi mắu dược biểu điển 3 bịt Dấy số nhị phân sau dây biểu diễn tín
hiệu tương tự của thí dụ trên hình 10
Khi muốn xây đựng lại tín hiệu tương tự, ta phải sử dụng DAC Hình 13 chỉ ra
tiền trình cửa DAC
Các giá trị lượng tủ hóa được xác định trên cơ sở biểu diễn số và bước lượng tử
Kết quả ta có đây các tín hiệu bước như hình 12(b) Sau đó che các tin hiệu bước này
qua bộ lọc thông thấp đề tái tạo xấp xỉ tín hiệu tương tự gốc như hình 12 (e) Ta nói rằng xắp xỉ tín hiệu gốc là tái tạo bởi vi tín hiệu tái tạo không hoàn toàn giảng tin hiệu gốc do sai số của lượng tử hóa của tiến trinh ADC
Tình 12: Các bước lượng từ hoá
Trang 3333 Nguyễn lý hoạt dộng của DAC và ADC mồ tả ở đây dược áp dụng cả cho tin hiệu video va loại tín biệu khác
Trong tiến trình ADC, nhiệm vụ xác định tốc độ lấy mẫu và ting số mức lượng
tú hóa cho cáo tín hiệu Lương tự khác nhau và cho các ứng dụng khác nhau là rat quan
trọng
2.1.3 Nên âm thanh
Dé thuan tiện trong việc lưu trữ và truyền tải âm thanh, người ta áp dung các phương pháp nén nhằm rnục đích giảm dung lượng để biểu điễn âm thanh Một số phương pháp nén âm thanh tiêu biểu bao gồm các ky thuật mã hóa âm thanh thiết kế chơ tiếng nói (băng thông âm thanh khoảng 3.4 kHz, cực dai 7 kHz) va
âm thanh tổng quát, sứ dung chung cho dén dai tin sd nghe được là 20 kHz
ÿ thuật nén
2.1.3.1 Tượng tử hóa phi tuyển
Đây là kỹ thuật mã hóa âm thanh thiết kế cho tiếng nói Trong lượng tử hóa dồng, nhất thủ các tin hiệu âm thanh, kích thước các bước lượng tử hóa sử dung trong tiến
trinh ADC là như nhan, không quan tâm đến cường độ tín hiệu (hình 13) Trong hình
13, A là kích thước bước lượng tử hóa Gọi MI là tổng só mức lượng tử hỏa Số bịt cần
để mã hỏa Mi uức làn log
Hình 13: Lượng tử hoà ple buy
2.1.3.2 Ma héa du bao (Predictive Coding)
Nhắc lại, việc sinh ra tín hiệu số nhờ lấy mãu và lượng ti hoa cho âm thanh thi
dược gợi là biển diệu xung mi (PCM), ‘Thay cho vige mi hoa gia ti cia mau (sample) dang truyền tải, mã hóa dự bảo dược sử dụng nhằm thực hiện mã hỏa hiệu giữa dự báo
ty (hay lỗi dụ báo) được lượng tử
hoa va wa héa thi lược đồ mã hỗa dự báo được gọi lá bién digu xung md vi sai DPCM
Trang 3434
Đây là một biến thể ciia PCM, Néu tin hiệu phụ thuộc thời gian có một vài nhất quản
theo thời gian thí tín hiệu sai số có được bằng cách lấy giả trị mẫu hiện hảnh Irù đi giá
trị nnầu trước đó sẽ có lược đỗ rnà giá trị cực đại của chúng gần giá trị Ô hơn
2.1.3.3 Kỹ thuật nén sử dụng tính chất lọc (masking): Âm thanh MPEG
Kỹ thuật nên sử dụng tink chất lọc là kỹ thuật nén âm thanh tổng quái, sử dụng
cho đâi tấn số nghe được Một ãm thanh có thể
khi đẻ được gọi là masking Có thé che chin (masking) toan bộ hay mệt phần âm thanh khác
‘Vi âm thanh bị che chắn là không nghe thấy, đo vậy có thẻ loại bỏ nó mà không,
ảnh hưởng chất lượng, âm thanh Đó là chiến lược sử dụng trong, chuẩn quốc tế âm
thanh MPHG
MPHG-Audio là chuẩn nén am thanh tổng quát Nên là bỏ đi các bộ phận tín hiệu
âm thanh không hiên quan cản nhận Bộ nén khai thác hạn chỗ cảm nhận của hệ thông
am không mụhe được âm thanh khác,
xụghe của con người
MPEG-Audio hé tro ba tân sẻ lây mẫn 32, 44.1 và 48 kHz Dòng nén có thế có tốc độ nén cổ định từ 32 đến 244 kbps/kênh Phụ thuộc vào tân số lây mẫu mà tỷ lệ
xin sẽ từ 2.7 đến 2⁄4
MPEG-Audio chi bé di cac thành phần không nghe được cúa âm thanh, cảm giác thi day là nén không mất mát thông tin, mặc dủ không thể khỏi phục từng bít để có dữ liệu âm thanh gốc Ủy ban kiểm thứ MPHG-Audio cho biết dù
chuyên gia vẫn không thể phân biệt giữa âm thanh r
Trang 3535
giải mã layer 2 có thể giải mã dữ liệu nén bảng bộ nén layer 1, bộ giải mã layer 3 có thé gidi mã dữ liêu nén bang bé ma héa layer 1 va layer 2
2.1.4 Giấu tín mật trong âm thanh số
Giấu tin mật trong âm thanh số mang những đặc điểm riêng khác với giấu tia mật trong cáo đối tượng đa phương liên khác Như đã để cập trong chương 1, một lrong, những yêu câu cũ bản của giầu tín mật là đầm bâo tỉnh chất ân của thông tín được giầu đông thời không làm ảnh hưởng đến chất lượng của đữ liệu gốc Dễ đảm bảo yêu cầu này, nêu như kỹ thuật giấu tin trong ảnh phụ thuộc vào hệ thông thị giác của con người
- ITVS thi kỳ thuật gidu tỉa mật trong âm thanh số lại phụ thuộc vào hệ thống thính giác HAS Và một vẫn dễ khó khăn ở dây là hệ thống thỉnh giác của con người nghe được các tin hiệu ở cáo dài tần rộng và công suất lớn nén dã gay kho dé dối với các
phương pháp giấu tin troug âm thanh số Nhưng thật may là HAS lại kém trong việc
cao lấn có thể che giâu được ra thanh nhỏ thâp một cach dé dang Cac mé hinh
phân tích tâm lý đã chỉ ra điểm yếu trên và thông tin này sẽ giúp ích cho việc chọn các
file âm thanh số thích hợp cho việc giấu tin Vẫn đề khó khăn thứ hai đổi với giấu tin trong âm thanh sẻ là kênh truyền tin Kénh truyền hay bang thông chậm sẽ ảnh hưởng, cến chát lượng thông tin sau khi giấu Ví dụ dễ nhủng một doạn java applet vào một
đoạn ôm thanh (16 bịt, 44.100 Hz) có chiều dài bình thường thí cáo phương pháp nói
chung, cing cần it nhất là 20 bit’s, Gidu tin trong âm thanh s6 doi hei yêu câu rất cao
vé tinh đồng bộ và tính an toàn của thông in Các phương pháp giảu tin mật ong am
thanh số đếu lợi đụng điểm yếu trong hệ thông thính giác cửa con người
Các phương pháp giẫu fin mật trong âm thanh số
Có nhiều phương pháp giấu tin mật trang âm thanh số Một số phương pháp
chính bao gdm:
- Mã hoủ bữt thấp (low bật encoding): trong mã hoà bịt thấp, đữ liệu dược nhúng,
bằng cách thay thể bít cỏ trọng, sở thấp LSHB của mỗi diễm lấy mẫu bằng mội xâu nhị
phân dược mã hoá Như vậy một lượng lớn dữ liệu có thể dược mã hoá trong một file
âm thanh sô Äfã hoá bửt thấp được coi là cách đơn giãn nhất để gid dit ligu trong cae
file âm thanh
nhưng ewe đà mã hoá bít thấp có thể lì phá huý bối nhiễu lrên kênh
truyền và việc lây mẫu lại
- Ma hod pha (phase coding): duoc coi là kỹ thuật hiệu quả nhật đối ở khía cạnh tương quan giữa tín hiệu và độ nhiễu Trong phương pháp này, pha của tỉnh hiệu âm
thanh ban đầu được thay thể bằng pha tham chiếu của dữ liệu được giấu Người ta khám phá rằng một kênh cò dung lượng cỡ 8 bps của xAp xi 8 bps có thể thu được bằng cách định vị 128 khe tân sé (slot) tén bit voi it độ nhiễu nền tang (little
background noise) Thủ tuc cho mi hoá pha là
+ Day am thanh khéi ngudn duoc chia thanh mét loal cdc segment a6 dai N
1 Ap đụng biến đối Fourier rai rac trén mdi segment dé tao ra mét ma trận của
pha va dé lén (a matrix of phase and magnitude).
Trang 3636
+ Tỉnh toán độ lệch pha giữa các segment liên kể nhau
+ Tạo ra một phá tuyệt đối nhân tạo (artiftcal nbaohue phase) pọ chủ sepnert đầu
tiên Sụ
+ Tạo ra các khung pha mới cho tất ca cac segment
+ Pha mới và cường độ ban đầu được kết hợp với nhau đề tao ra mét segment
mới, Sạ
+ Cuối củng, các sesrent mới được móc nổi vào nhau dé tao ra dau ra (output)
được mã hoá
Tiên trinh
Người nhận phải năm: bài được chiêu đài của segment, các điểm biên đối Furicr rời rạc
mã việc dồng bộ hoá của dãy dược thực hiện trước khi giải mã
DET và khoảng dể liệu (đuủa inlerval), Giá trị sửa pha phía đưới (underlying phase)
olla segment dau tiên được xác định ở dạng 0, 1 để
- Äÿ thuật trải phd (spread spectrum): Cac hé théng giấu tìn biện đại sử đụng
các liên lạc trái phố dé truyền một tính hiệu băng hẹp (narrawband) trên một kênh
băng rộng hơn sao cho mật độ trái (sprectral density) của tin hiệu trong kênh truyền trông tương, tự như nhiều Hai kỹ thuật trải phổ phân biệt được sử dụng là nháy theo day truc tiép { direct-sequence hopping) va nhdy tan (frequency hopping) K¥ thuat
diễn xâu nhi phan ma hoa
nhay theo dãy trực tiến giấu thông tin bằng lap modul-pha (phase-rnoduling) cho tín thiệu dữ liệu (vật mang - carrier) bằng một đấy số giả ngẫu nhiên mà cả người gửi và người nhận đều biết được Kỹ thuật nhây tan (frequency hopping) chia bang thông
thành nhiên kênh và bước nhảy giữa các kênh náy (cũng được kích hoạt bởi mét day
số giả ngẫu nhiên)
- Kf thudt gidu tin trong tiéng vang - echo lđing: là một dạng giẫu thông tin, là
xuột phương pháp để nhúng thông tin vảo trong một tin hiệu âm thanh Đây lá một phương pháp giấu tia mạnh, khi không làm suy giấm tin hiệu chính (cover audio) về
xnặt nhận thức Phương pháp này chủ yếu thực hiện các thay đổi đối với cover guẩio trên các đặc tính liên quan đến điển kiện môi trường và không liên quan đến độ nhiều ngau hién (random noise), vì vậy nó mạnh mẽ hơn trong những giỗi thuật nén dữ liệu
có mắt mát thông tỉn
Giéng như tắt cä các phương pháp giâu tin tốt khác, echa #iđïng tim các đù liệu
của nó để trong luồng đữ liệu sao cho ít suy hao luỗông đữ liệu gốc nhất, tức là sự thay đổi bn trong cover audio hoặc không thể nhận thức được hoặc chỉ đơn giản được người nghe bé qua giống như đổi với các độ méo (distortion) khác gây ra bởi môi
trường
Độ méo nhất định chỉng la đang để cập tới là tượng tự với các tiếng vàn vọng
trong một cần phòng kin có tường bao và dỗ đạc Sự kháo biệt giữa âm thưnh số gốc
(cover audio) va 4m thanh số đã giâu tin mật (stego-audia) tương tự như sự khác biệt giữa việc nghe một đĩa nén bằng headphone với âm thanh được ghi lại Với các speaker, chủng ta nghe thấy âm thanh cộng với tiếng vang được tạo ra bởi âm học trong phỏng (room acoustic) Bằng cách lựa chọn chỉnh xác độ méo cho echo hiding,
Trang 37thanh số đều có dung lượng giấu khá tốt về khía cạnh cài đặt, phương pháp mã
hoá bít thấp là phương pháp liên kới và phố biến nha Tuy nhiền, phương phầp này có
nhược điểm là có thể bị phá huỷ bởi nhiễu trẻn kênh truyền hoặc do quá trình lấy màu
lại Kỹ thuật mnä hoá phá được coi u xói trên tương quan giữa lim
hiệu vả dộ nhiều Kỹ thuật trái phố vả giấu trong tiếng vang lả kỹ thuật tiên tiến, có
dung lượng giấu tốt và độ an toàn khá cao sơ với hai phương pháp trước
~ Cae frame ota video 36
- Anh tao ra tir cac phan mềm để họa
2.3.1 Biểu diễn ảnh số
Ảnh có thể là ảnh vée#z hay ảnh rasier
- Ảnh véctø: Là các dữ liệu dé hoa (graphios) 13a loại đối tượng dé họa riêng, biệt là điểm, đường vá vúng, Ảnh véctơ được hình thành từ nhiều đổi tượng để họa
đơn giản: đoạn thẳng, elip Khuôn mẫu ảnh có thể là DXT, WME, PIG, CƠM
- Anh raster: Bao gém cae dit héu anh (image) Khuôn mẫu ânh rasler có thể là
BMP, JPEG, GIF Mai didin anh (pixel) eda loại ảnh này cần duợc xác định màu cụ
thể, Ảnh raster có thẻ là da mức xám lay anh mau
Biểu diễn ảnh đa mức xám
Ảnh được hiển thị trên man hình bởi các pixel Các pixel có độ chói (cường độ) khác nhau Dải cường độ từ đen đến trắng phụ thuộc vào chất lượng ảnh, hay tổng số bít sử dụng cho mỗi pixel 'Thí dụ với 8 bít biểu diễn pixel thi có tới 255 mức cường độ
+háo nhau cỏ thể biểu điển
Tóm lại, ảnh đa mức xám được biểu diễn bằng mảng 2 chiều Mỗi phần tử của
mảng tương ứng với | pixel
o sắp xếp các giá trị pixel này trong vùng bộ nhớ liên tục được gọi 1a bitmap
Khái niêm này xuất phát từ anh xa (map) các pixel anh vat lý vào các địa chỉ liên tục trong bộ nhớ Bộ nhớ sử đựng để lưu trữ dữ lign anh bitmap được gọi là “#ame buffer”
Trang 3838
Biểu diễn ảnh màu
Ảnh màu cng bao gôm trường chữ nhật các pixel Khác biệt với các ảnh đa cấp xám là cần 3 giá trị để biếu điển ảnh
điển này xuất phát từ lý tuyết răng màu có thể hình thành từ trộn ba màu cơ sở Các
mau co sd sti dung trong ‘L'V va man hinh may tinh la Red, Green va Blue
giá trị biểu điễn một mâu cơ sở Cách biểu
Ảnh màu cỏ thẻ biểu diễn bởi ba mảng hai chiều tương img voi các màu cơ sở
red, green va blue cia anh
2.2.2, Các tham số chính của ảnh số
CHẤt lượng ảnh được do bởi các tham số chính sau dây,
ích thước ảnh: Tổng số pixel trên hàng và tổng số cột pixel Ta thường nói
1 lượng ảnh góc thì tổng số diém anh/déng và tổng số đồng phải bằng giá trị tôi thiểu xác định theo định lý Nyquist Thỉ
đụ mật độ ảnh gốc lá 300 dpi thi tong sé pixel (mẫu) / inch phải ít nhất 300 Néu không nó bị suy giảm so với ảnh gốc
'Tổng số bit biếu diễn từng pixel (pixei đep£k): Với ảnh đa mức xảm chất lượng chấp nhận được doi hoi 8 bit/pixel Voi anh mau, cin 24 bit/pixel (m4i thành phần
mau can 8 bit)
kích thước ảnh là x pixel vay dong, Pé dat duge
2.2.3 Ném anh
Ảnh không nén có kích thước rất lớn Do vậy, nén ảnh trở nên rất quan trọng,
trong ứng dụng đa phương tiện
Các kỹ thuật vả chuẩn nén:
- Lấy mẫu phủ không gian (Sputial Subsampling)
Vì dữ liệu ảnh chửa đư thừa, cho nên không giữ lại mọi pixel ảnh pốc Kỹ thuật
này gọi lả lấy mẫu phụ không gian Phía nén ảnh ta chợn vả truyễn tái một trong vải điểm ảnh Phía giải nén ánh, các điểm ảnh thiểu sẽ được nội suy trên cơ sở cáo điểm ảnh thu được để sinh ra trình tự video gốc với độ phân dái thấp hơn Hộ giải mã sẽ giải
xã và hiển thi anh subsampled khong gian nhé hon
Kỹ thuật mày khả dơn giản nhưng biệu quả Nó được sử dụng lắm tiển xứ lý cho các kỹ thuật nén khuic (MPEG)
-_ Mã hóa dự báo (Predictive coling)
Nguyễn lý mã hóa dự báo trước cho ãnh tương tự cho âm thanh Téng qual thi
các giá trị mẫu (snpie) của các phần tử ảnh láng giểng (về mặt không gian) là lương
quan St tương quan | hay sự phụ thuộc thông kê tuyến tính chỉ ra rằng dự báo tuyến tỉnh của các giá trí mẫu trên cơ sở các giá trị mẫu của phan tử ảnh láng giêng là kết quả
trong lỗi dự báo mà nó có bất biển nhớ hơn giá trị mẫu gốc Các thuật toán dự bảo 1-D
sử dựng tương quan của các phân tử ảnh láng giêng trong dòng quét Lược đề phức tạp
hơn với tương quan dòng - dòng vả khung - khung (dự báo 2D và 3D) Dao động nhỏ
Trang 3939
hơn của tín hiệu sẽ được lượng tứ hỏa, mã hỏa và truyền tải trong hệ thông mã hỏa dự
báo có thể thu nhỏ đãi biên độ của bộ lượng Lữ hóa và làm giảm tổng số múc lượng lữ hoa, din Lai doi hdi it bils/pixcl (so với hệ thông PCM) mã vẫn không làm giãm Lỷ lệ
tin hiệu — nhiễu lượng lử hóa
- Mé héa bién déi (Transform Coding)
Ÿ buồng chính: Loại bỏ tương quan giữa ác điểm ảnh (chuyển đổi các
ảnh phụ thuộc thống kẻ thành các hing số độc lập) và tập tung năng lượng ảnh vào
một vài hing s6 Do vậy, có thế loại bỏ đư thừa trong anh
Trong mã hóa biên đổi thường chỉa ảnh gỏc thành các khối (block) ảnh nhỏ Áp dụng biến đổi toàn học cho từ khỏi con để chuyển đổi khối con từ miễn không gian
sang miễn tần số Kết quả là năng lượng chỉ tập trung vào một vài mẫu ở miễn tân số
thấp, Chú ý rằng ap dụng biển dối đữ liệu ảnh khong Jam giảm đỡ liệu Nếu dữ liệu
ảnh trơng miễn không gian có tính tương quan cao, thì dũ liệu kết quả trong miền lân
số sẽ Irong hình thúc phủ hợp cho việc làm giảm thiểu đữ liệu bằng kỹ thuật nén
Huffman hay REE
Whiéu loai biên đổi có thể áp dung dé nén ảnh: KLT, DCT, WHT, DFT Trong đó ELT 18 higu qua nhất về hiệu năng loại bé tong, quan (decorrelation) Nhung cô các
thuật toán biến đổi DCT nhanh cho nên biến đổi DCT được sử dụng rộng rãi nhất
trong nén ánh
- Biển đỗi DCT
Tiên đối DCT xuất phát từ ý tưởng biến đối tín hiện do Jean Baptiste Fourier dé
xuất như sau: Bắt ký tin hiệu hay dang song nảo đều có thể được tạo ra từ dãy các sóng, hình sin với cường độ vả tần số phủ hợp Tương tự biến déi Fourier, DCT là phương, trình tỉnh toán tần số, cường độ và pha của các sóng hình gìn cần có để tạo ra tín hiệu
cho trude
Các bước chính khí c:
đặt hệ thống nén ảnh biến đổi + Chẹn loại biển đổi Hiến đổi tốt nhất thóa mãn thỏa hiệp giữa phi tương quan
và khã năng tập trung năng lượng với thực tế cài đặt, DCT được áp dụng rộng rãi
+ Chọn kích thước khối ảnh và áp dung biến đổi trên chúng Nếu khỏi ảnh quả nhỏ thì tương quan giữa các điểm ảnh lang giéng không được khai thác hết Mặt khác, nêu khối ảnh quá lớn thì làm tăng độ phức tạp cải đặt phần cứng và gây khó chịu khi quan sát biên của các khỏi Kích thước khối ảnh lựa chọn tốt nhát lả 8xE
+ Tượng tử hòa cáo hãng số biển đổi để giãm dụng lượng lưu trữ hay truyền li + Nên các hằng số đã lượng tứ hỏa bằng phương pháp IIuffman và/hoặc RLIL
- Luong tr héa vécta (VQ)
Luong ti hoa được thực hiện trên từng mẫu giá trị thực của dang sóng hay các
pixel ánh Mã hóa biển đổi thực hiện lượng tứ hóa như sau: trước hết biến đổi blếc
Trang 4040
diễm anh sau đó mã hỏa riêng rễ các hệ số biến dối Mã hóa dự báo thực hiện việc này bằng lượng tử hóa giá trị lỗi (là hiệu số giữa mẫu mới và dự bảo mẫu mới trên cơ số
đầu ra mã hỏa trước đó)
Bộ lượng tử hóa vécto được định nghĩa nhụ ảnh xạ Q của các véotơ K chiều trong
không gian Euclid RỄ vào tập con hữu hạn các véctơ Y của RỂ, Q: RỀ->>Y, trong
đó, Y=Œ¿i=L,2,.M), x) là vécte thứ ¡ trong Y và được gọi là eodøvecfar hay codeword
Với mỗi codeward có một vùng lắng giêng, gân nhất lién quan (wing Voronoi)
Tập cáo œodewardi được gọi là VQ codebook hay VQ table Xa ting s
trong Y Trong bộ mã hỏa, mãi véctơ đữ liêu x thuộc RỄ là phù hợp hay xấp ›
mé trong, codebook, va địa chỉ hay chỉ số của từ mã được truyễn đi thay cho dữ liêu
véctơ Tại bộ giái ruÃ, chí mục được ảnh xạ trở lại từ mã vả nó được sử dụng để biểu,
diễn véotơ dữ liệu gốc, Bộ mã hóa và bộ giải mã sử dụng củng codebook, dau vào cúa chúng chứa tổ hop cdc pixel trong biỗo.Giá sử ring kích thước blếc ảnh là (n xa) pixel
ö thể (2% loại biến Tuy
1 xuất hiện, nó làm giảm
các đặc tính cảm nhận của con người thị kích thước này còn giảm nữa và chỉ cần it bit
để biển điễn chỉ mục đầu vào codebook
Ta nhận thấy nguyên tắc lượng tử hóa véctơ tương tự thuật toán LZW: sử đụng
chỉ mục để biểu diễn biếc đữ liệu
- Mã húu anh fractal
Fractat: hiển đơn giản Eractal là ảnh texture hoặc hình dạng biểu diễn bởi mệt
hay nhiéu công thức toán học
Hình học fractal: dang hinh hoc ma chi tiét khéng đền của nó tái điển với kích thước và góc khác nhau, nó có thể biểu diễn bởi biến đổi a[Time tay actal (công thức)
Trong lich sit, fractal duoc st đụng dé phát sinh ảnh ứng đựng trong các cảnh mô
phỏng bay và các hiệu ứng đặc biệt của ảnh chuyển đông, Các ông thức ảnh fractal
được sử đụng để mô tả hầu hết các ảnh thẻ giới thực
Nếu ảnh fraclal: là ngượu lại của sinh fvih fractal Sinh dri hay hink fractal từ
công thức cho trước, nón anh fractal tim kiểm tập Íractal trong ảnh số tà nó rô tả và
biểu điển toàn bộ ảnh Một khi tập raclal phù hợp dược xác định, nó dược nén thành
mã hay công thức Iractal đầy đổ Các mã là qui luật sinh ra tập Íraelal khác nhau để lái
tạo toàn bộ ảnh Do các mã biến dỏi fractal doi Léi rat it dữ liệu để biểu diễn và lưu trữ
Tnihhư công thức, cho riển nén fractal ed tỷ lệ nứn rất ca.