Thông tin giấu cần được toàn vẹn dưới bất kỳ hình thức tác độngnào lên vật chứa đối với các kỹ thuật nhúng thủy vân số trong âm thanhMột số vấn đề cần lưu ý trong kỹ thuật giấu tin trong
Trang 1Học Viện Công Nghệ Bưu Chính Viễn Thông
KHOA CÔNG NGHỆ THÔNG TIN 1
BÁO CÁO THUYẾT TRÌNH
Đề tài: Giới thiệu tổng quan về giấu tin trong âm thanh và phương pháp LSB
GVHD : PGS Đỗ Xuân Chợ
Bộ môn : Các kỹ thuật giấu tin
Lớp D19_Các kỹ thuật giấu tin_Nhóm02 - Nhóm btl 05
Thanh viên trong nhóm:
Sinh viên: Bùi Kim Cường - B19DCAT018
Sinh viên: Trương Phúc Đạt - B19DCAT040
Sinh viên: Nguyễn Chí Kiên - B19DCAT101
Trang 2Hà Nội, 2023
Trang 3MỤC LỤC
I Tổng quan về giấu tin trong âm thanh 3
1 Khái niệm giấu tin trong âm thanh 3
2 Đặc điểm của kỹ thuật giấu tin trong âm thanh 3
3 Một số định dạng file âm thanh 4
4 Phân loại một số phương pháp giấu tin trong âm thanh 7
a) Phân loại theo kỹ thuật giấu tin 7
b) Phân loại theo đặc điểm tín hiệu gốc 7
5 Sơ đồ giấu tin và tách tin trong dữ liệu âm thanh 8
II Kỹ thuật giấu tin trong âm thanh bằng phương pháp LSB 9
1 Kỹ thuật giấu tin trên bit có trọng số thấp LSB 9
1.1 Tổng quan về phương pháp LSB 9
1.2 Thuật toán 9
a Thuật toán giấu tin 9
b Thuật toán tách tin 10
1.3 Ví dụ minh họa: 11
1.4 Đánh giá về LSB 11
2 Kỹ thuật giấu tin ảnh xám trên tín hiệu âm thanh (LSB nâng cao) 11
2.1 Tổng quan về LSB nâng cao 11
2.2 Thuật toán 12
a Thuật toán giấu tin 12
b Thuật toán tách tin 13
2.3 Ví dụ minh họa giấu ảnh trên tín hiệu âm thanh 13
Minh họa về giấu tin và tách tin LSB nâng cao 13
Giấu tin 13
Tách tin 14
2.4 Đánh giá về LSB nâng cao 14
2.5 Demo 15
III Kết Luận 21
Trang 4I Tổng quan về giấu tin trong âm thanh
1 Khái niệm giấu tin trong âm thanh
Là các phương pháp nhằm giấu thông tin vào môi trường âm thanh Giấutin trong âm thanh thường áp dụng các biện pháp và kỹ thuật nhằm giấu thôngtin vào trong các vùng âm thanh sao cho ngưỡng nghe của tai người không pháthiện ra những bất thường hoặc nhiễu do các thuật toán giấu tin gây ra Hiệnnay, giấu tin trong âm thanh cũng đang được quan tâm và ứng dụng trong thực
tế
2 Đặc điểm của kỹ thuật giấu tin trong âm thanh
Đặc điểm của kỹ thuật giấu tin trong âm thanh là giấu thông tin vào các khe
hở của âm thanh Các khe hở ở đây chính là các thành phần như: tần số, biên
độ, chu kỳ,… của âm thanh Các kỹ thuật giấu tin trong âm thanh lợi dụng vàođiểm yếu hệ thống thính giác con người (Human Auditory System – HAS).Giấu tin trong âm thanh là kỹ thuật giấu tin đòi hỏi nhiều yêu cầu về lượngtin giấu và chất lượng giấu bởi vì hệ thống thính giác của con người rất nhạycảm Chính vì vậy, với bất kỳ thay đổi nào mà làm ảnh hưởng đến chất lượng
âm thanh đều có thể bị phát hiện và tìm ra nhanh chóng Tùy theo từng ứngdụng của giấu tin trong âm thanh mà sẽ có những yêu cầu đối với các kỹ thuật,thuật toán hoặc phương pháp giấu tin thanh khác nhau
Tuy nhiên, trong trường hợp tổng quát các kỹ thuật giấu tin trong âm thanhngoài việc phải đảm bảo các tính chất của kỹ thuật giấu tin vẫn cần phải đảmbảo một số yêu cầu đối với môi trường âm thanh như như: Thông tin được giấuphải tồn tại được khi trải qua các phép biến đổi hay các hình thức tấn công cố ýhay vô tình Thông tin giấu cần được toàn vẹn dưới bất kỳ hình thức tác độngnào lên vật chứa (đối với các kỹ thuật nhúng thủy vân số trong âm thanh)Một số vấn đề cần lưu ý trong kỹ thuật giấu tin trong âm thanh:
- Tần số mẫu: Để đưa được âm thanh vào các ứng dụng của giấu tin,cần xác định biên độ dao động của sóng âm vào các thời điểm khácnhau Công việc này gọi là trích/lấy mẫu Với một giây phát ra âm thanh,trích lấy một số mẫu biên độ đưa vào dữ liệu, con số ấy gọi là tần sốtrích mẫu (sample rate) Tần số này cho biết biên độ rung mỗi giây củasóng âm thanh Thí dụ, tần số mẫu là 44,1 kHz thì mỗi giây tín hiệu nhậnđược bị cắt thành 44100 lát
- Độ dày của bit: Để lưu lại dưới dạng số, mỗi mẫu được biểu diễnbằng một lượng bit dữ liệu nhất định nào đó, gọi là BitDepth Với tập tinWAV thường là 8 hoặc 16 bits BitDepth càng lớn thì âm thanh lấy mẫu
Trang 5càng chính xác và người nghe càng thấy sắc nét, trung thực Giả sử, nếulấy được mẫu với tần số 44,1kHz (44100 lần/giây), 16 bit (tương đươngvới chất lượng CD) thì khi đó 1 phút âm thanh sẽ tiêu tốn tới 10MB ổcứng
- Kích thước mẫu trích: Công thức kích thước mẫu trích (được tínhbằng byte) như sau: LengthOfSample = Channels * âm thanhSampleSize/ 8
- Âm thanh số: là các mẫu lấy theo phương pháp lượng tử hóa,chuyển đổi giá trị mẫu (liên tục thành các giá trị rời rạc) Tỉ lệ lấy mẫuthông thường nằm trong khoảng 8 kHz đến 44.1 kHz
Từ các thông ѕố cơ bản trên, ta không những biết được chất lượng mà còn cóthể tính được dung lượng của bản nhạc Ví dụ một phút của bản nhạc có : Tần
số mẫu = 44100 H , BitDepth = 16 bitѕ = 2 bуteѕ, Channel = 2 kênh ѕẽ có dungᴢlượng: 44100 đợt lấу mẫu х 2 bуteѕ х 60 giâу х 2 kênh = 10.584.000 bуteѕ, tứckhoảng 10.1 MB
Hình 1: Ví dụ về tín hiệu âm thanh và mẫu
3 Một số định dạng file âm thanh
Do các thuật toán giấu tin phụ thuộc vào định dạng của tệp âm thanh, nên đểgiấu tin vào tệp âm thanh, ta cần hiểu rõ định dạng tệp âm thanh
Có thể phân các định dạng thành âm thanh thành ba nhóm chính, đó là:
- Định dạng âm thanh không nén (uncompressed âm thanh formats): đây lànhóm định dạng âm thanh chứa các mẫu sóng âm thanh không bị nén, cho phéplưu trữ âm thanh với chất lượng cao nhưng yêu cầu nhiều dung lượng lưu trữ
Trang 6hơn Các định dạng trong nhóm này bao gồm: WAV (.wavt); AIFF (.aif); AU(.au)…vv
- Định dạng âm thanh bị nén lossless (lossless compressed âm thanh formats):đây là nhóm định dạng âm thanh bị nén nhưng vẫn giữ nguyên chất lượng âmthanh ban đầu, không bị mất mát thông tin âm thanh Các định dạng trongnhóm này bao gồm: ALAC (.m4a, caf); FLAC (.flac)…vv…
- Định dạng âm thanh bị nén lossy (lossy compressed âm thanh formats): đây
là nhóm định dạng âm thanh bị nén và mất mát một phần thông tin âm thanh,cho phép giảm dung lượng lưu trữ nhưng cũng dẫn đến giảm chất lượng âmthanh Các định dạng trong nhóm này bao gồm: MP3 (.mp3); Realâmthanh(.ra); WMA (.wma) vv
Có thể phân loại định dạng file âm thanh thành một số định dạng chính nhưsau:
- WAV (.wav): là kiểu định dạng đại diện cho âm thanh kỹ thuật số
trong Windows PCs Đây là định dạng file âm thanh gốc và không nén, nó cóchất lượng âm thanh tốt (tương đương nhạc CD) nhưng khá nặng do dunglượng lớn
- AIFF (aif): Là kiểu định dạng âm thanh đại diện cho Macintosh,
Đây là định dạng âm thanh không nén phổ biến Nó có thể chứa nhiều dữ liệukhông nén, vì vậy thông tin giấu tin có thể được thêm vào tệp AIFF mà khôngảnh hưởng đến chất lượng âm thanh
- AU (.au): là kiểu định dạng đại diện cho hệ thống Sun Đây là định
dạng âm thanh không nén Tuy nhiên, dung lượng của các tệp AU khá lớn, vìvậy việc giấu tin trong các tệp này có thể là một thách thức
- MIDI (.mid): là chuẩn đại diện cho thông tin âm nhạc chuyển giao
giữa phương tiện điện tử và máy tính Nó là định dạng âm thanh không chứa
âm thanh thuần túy mà thay vào đó chứa các chỉ dẫn về cách phát lại âm thanh,bao gồm thông tin về nốt nhạc, nhịp độ và nhạc cụ được sử dụng
- QuickTime (.qt): được sử dụng để định dạng đa phương tiện từ máy
tính Apple, hỗ trợ cả luồng âm thanh và luồng hình ảnh
- ALAC (.m4a or caf): một định dạng dùng để nén các dữ liệu âm
thanh nhưng không làm mất đi tín hiệu nào File âm thanh FLAC được giữ lạichất lượng âm tốt, nhưng đã nhẹ đi đáng kể (dung lượng chỉ nhẹ bằng một nửaWAV)
Trang 7Hệ Thống
Thông Tin 100% (17)
190
Phân tích Hệ thống thông tin về chuỗi…
Trang 8- Realâm thanh (.ra): là hệ thống được sử dụng đầu tiên đại diện cho
luồng âm thanh và hình ảnh trên Internet Tuy nhiên ít được sử dụng trong
những năm gần đây do những hạn chế của nó
- MP3 (.mp3): Đây là định dạng âm thanh được nén, nó sử dụng các
kỹ thuật nén dữ liệu để giảm dung lượng tệp âm thanh
Bảng 1.1 trình bày một số định dạng âm thanh thường gặp trên các hệ thống
máy tính
Một số sản phẩm đã được phát triển và ứng dụng cho lĩnh vực giấu tin trong
âm thanh như sau:
Tùy thuộc vào mục đích sử dụng và tính chất của các định dạng âm thanh
khác nhau, người dùng có thể chọn định dạng phù hợp để giấu tin Tuy nhiên,
việc giấu tin trong các tệp âm thanh có thể đòi hỏi kiến thức chuyên môn về kỹ
Ngân hàng Ttdidong Nhatptit
Hệ ThốngThông Tin 100% (3)
62
CÂU HỎI HỆ THỐNG THÔNG TIN TRONG…
Hệ ThốngThông Tin 100% (2)
35
Trang 9thuật giấu tin và cần phải được thực hiện cẩn thận để tránh làm ảnh hưởng đếnchất lượng và tính khả dụng của tệp âm thanh.
4 Phân loại một số phương pháp giấu tin trong âm thanh
Kỹ thuật giấu tin trong âm thanh đã và đang được ứng dụng nhiều trongthực tế hiện nay Có nhiều phương pháp và kỹ thuật khác nhau đã được sử dụng
để giấu thông tin vào âm thanh
a) Phân loại theo kỹ thuật giấu tin
Phương pháp phân loại theo kỹ thuật giấu tin dựa vào đặc tính và tínhchất của kỹ thuật được sử dụng để giấu tin trong âm thanh Theo tiêu trí này,các kỹ thuật giấu tin trong âm thanh chia làm một số kỹ thuật như sau:
- Kỹ thuật LSB;
- Kỹ thuật trải phổ;
- Kỹ thuật mã hóa pha;
- Kỹ thuật tiếng vang;
- Kỹ thuật tự đánh dấu
b) Phân loại theo đặc điểm tín hiệu gốc
Đối với cách phân loại này, các chuyên gia phân thành 2 loại chính:
- Giao thoa tín hiệu gốc : Các phương pháp thuộc nhóm này đều cần đến
tín hiệu gốc khi muốn rút trích thông tin Tuy nhiên, trong các ứng dụng thực tếnhóm phương pháp này lại tỏ ra không hiệu quả vì phải cần gấp đôi bộ nhớ đểlưu trữ cùng một thông tin, cần đến gấp đôi lượng băng thông cho quá trình rúttrích thông tin Vì vậy, nhóm phương pháp này ít được nghiên cứu và phát triển.Trong một số trường hợp đặc biệt nhóm phương pháp này lại tỏ ra rất hiệu quảtrong việc chứng thực bản quyền Một số thuật toán trong nhóm này như: Mãhóa pha; Điều chế pha
- Không giao thoa tín hiệu gốc : Các phương pháp thuộc nhóm này khi
muốn trích xuất thông tin được giấu trong âm thanh thì không cần đến tín hiệugốc hay bất kỳ thông tin nào khác (trừ khóa mật nếu có) Nhóm các phươngpháp này chỉ cần đến một nửa bộ nhớ lưu trữ và một nửa băng thông để rút
Trang 10trích so với nhóm phương pháp cần tín hiệu gốc Một số thuật toán trong nhómnày như:
• Các phương pháp trải phổ
• Các phương pháp tập đôi
• Các phương pháp sử dụng bản sao
• Các phương pháp tự đánh dấu
5 Sơ đồ giấu tin và tách tin trong dữ liệu âm thanh
Hình 1.1 Sơ đồ tổng quát giấu tin và tách tinh trong âm thanhTrong đó:
- âm thanh Content: Là dữ liệu âm thanh số đầu vào ban đầu dùng để baothông tin
- Watermark Data: Là dữ liệu quan trọng cần được giấu trong các dữ liệu âmthanh
- Watermark Embedder: Bộ chương trình giấu tin
- Watermarked âm thanh: Là dữ liệu âm thanh số đã giấu tin
- Watermark Detector: Bộ chương trình tách thông tin đã giấu trong dữ liệu
âm thanh
Trang 11Watermark Data đem giấu có thể là một đoạn văn, một ảnh logo, một đoạn
mã ID định danh nào đó liên quan đến bản dữ liệu che dấu nó hoặc có thể làmột đoạn âm thanh số ngắn nào đó…
II Kỹ thuật giấu tin trong âm thanh bằng phương pháp LSB
1 Kỹ thuật giấu tin trên bit có trọng số thấp LSB
1.1 Tổng quan về phương pháp LSB
Phương pháp LSB (Least Significant Bit) là một kỹ thuật ẩn thông tin bằngcách thay đổi bit ít ảnh hưởng nhất của một tập tin âm thanh, hình ảnh hoặcvideo mà không ảnh hưởng đến chất lượng của tập tin gốc
Đây là một trong những kỹ thuật được nghiên cứu và ứng dụng sớm nhấttrong lĩnh vực giấu tin trên âm thanh cũng như trên các định dạng dữ liệu khác
Ý tưởng chính của kỹ thuật này là thay thế các bit ít quan trọng của mẫu dữ liệugốc bằng các bit của tin giấu Các bit được gọi là bit ít quan trọng khi ta thayđổi giá trị của bit đó từ 0 sang 1 hay từ 1 sang 0 thì sự thay đổi giá trị của mẫu
dữ liệu không lớn và nó không gây ra sự khác biệt nào đối với hệ thống tri giáccủa con người
Ví dụ ta có mẫu 8 bit có giá trị bằng 94 và cần giấu bit 1 vào trong mẫunày Khi đó ta sẽ điều chỉnh giá trị bit cuối cùng mẫu từ 0 thành 1 và giá trị mớicủa mẫu là 95 Hình 2.1 sau minh hoạ cách điều chỉnh bit trên mẫu có giá trị 94
để giấu bit 1 Trong trường hợp cần giấu bit 0 vào mẫu này thì ta không cầnđiều chỉnh giá trị của mẫu
Hình 2.1 Điều chỉnh bit thấp nhất của mẫu để giấu bit 1 Khi giấu 1 bit mật vào mẫu dữ liệu thì độ lệch giá trị giữa mẫu dữ liệu gốc
và dữ liệu mang tin tối đa là 1 Để tăng độ bền vững của kỹ thuật giấu này, ta
có thể giấu nhiều lần chuỗi thông điệp mật hoặc điều chỉnh vị trí các bit caohơn trong mỗi mẫu để giấu tin Các kỹ thuật giấu dùng phương pháp điều chỉnhLSB thường chọn các bit từ vị trí 1 đến 3, tính từ bên phải sang trái
Trang 12- Đầu ra: Dữ liệu âm thanh số đã giấu tin
Bước 1: Đọc file âm thanh gốc Chia âm thanh gốc thành các segmen.
Thông thường, người giấu tin sẽ chia file âm thanh các segmen dựa trên độdài bit của thông tin cần giấu Sau đó các segmen này được vector giá trịcủa tín hiệu, rồi lưu vào mảng một chiều để thực hiện giấu tin
Bước 2: Chuyển đổi thông tin cần giấu sang dạng nhị phân, tính độ dài bit của thông tin rồi lưu vào L.
Bước 3: Chọn k là số bit LSB của tín hiệu âm thanh sẽ giấu sao cho phù
hợp nhất
Bước 4: Chia chuỗi bit thông điệp thành các chuỗi con có độ dài k bit.
Trong đó, mỗi chuỗi con này sẽ được thay thế vào bit LSB củatín hiệu âmk
thanh để giấu đủ bit thông điệp.L
Bước 5: Thực hiện giấu L bit đã tính vào các segmen Để tăng độ an toàn
cho kỹ thuật này, có thể sử dụng bộ sinh số ngẫu nhiên để sinh ra các vị trícác mẫu được chọn giấu chứ không phải các mẫu liên tục Bộ sinh số này
sử dụng một khóa bí mật như là phần tử khởi tạo bộ sinh số Khóa được sửdụng trong cả quá trình giấu tin và giải tin
Bước 6: Lưu lại tệp âm thanh kết quả S được thông tin đã giấu.
b Thuật toán tách tin
- Đầu vào: Dữ liệu âm thanh đã giấu tin S
- Đầu ra: Thông điệp đã giấu M
Bước 1: Đọc dữ liệu âm thanh vào S, dựa vào tần số lấy mẫu và các thông
số liên quan đến cấu trúc lưu trữ của tệp âm thanh ta được vector giá trị củatín hiệu mẫu lưu vào mảng một chiều để thực hiện tách tin
Bước 2: Cho biết giá trị k (số bit LSB đã giấu tin).
Bước 3: Tách ra độ dài bit L đã giấu trên ba tín hiệu đầu tiên hoặc cuối
cùng của tín hiệu âm thanh
Trang 13p lại điệp
1.4 Đánh giá về LSB
Ưu điểm của phương pháp này là dễ cài đặt và cho phép giấu dữ liệu nhiều
Có thể tăng thêm dữ liệu giấu bằng cách dùng hai bít LSB Tuy nhiên cách nàylàm cũng làm tăng nhiễu trên đối tượng chứa dẫn đến đối phương dễ phát hiện
và thực hiện các tấn công Vì vậy dữ liệu chứa cần phải được chọn trước khigiấu sử dụng phương pháp mã hóa LSB
byte âm thanh
Để tăng độ an toàn cho kỹ thuật này, ta sử dụng bộ sinh số nguyên ngẫunhiên để sinh ra các vị trí các mẫu được chọn giấu chứ không phải các mẫu liêntục Bộ sinh số này sử dụng một khóa bí mật key như là phần tử khởi tạo của
bộ sinh số Khóa key này được sử dụng trong cả quá trình giấu tin và giải tin
Trang 14Lưu ý là bộ sinh số không tạo ra các giá trị trùng nhau để tránh trường hợpmột vị trí được giấu hai lần.
2 Kỹ thuật giấu tin ảnh xám trên tín hiệu âm thanh (LSB nâng cao) 2.1 Tổng quan về LSB nâng cao
Phương pháp này áp dụng để giấu ảnh xám trên tín hiệu âm thanh bằng cách sử dụng 7 bit quan trọng nhất MSB của các tín hiệu âm thanh để giấu các điểm ảnh, quét lần lượt các tín hiệu âm thanh so sánh chuỗi bit nhị
phân của điểm ảnh với 7 bit MSB của tín hiệu âm thanh:
- Nếu giá trị một điểm ảnh cần giấu (chuyển sang chuỗi nhị phân) trùng với
7 bit quan trọng nhất MSB của tín hiệu âm thanh thì viết vị trí tương ứng vào
3 bit LSB của tín hiệu âm thanh là 1 để đánh dấu đã giấu một điểm ảnh vào tínhiệu này
- Nếu giá trị điểm ảnh cần giấu không trùng với 7 bit MSB thì thay thế 3 bitLSB của tín hiệu âm thanh đều bằng 0 để đánh dấu không giấu điểm ảnh ở tínhiệu này
Quá trình giấu điểm ảnh sẽ thực hiện tiếp cho các điểm ảnh tiếp theo trêncác tín hiệu âm thanh cho đến khi giấu hết các điểm ảnh vào âm thanh Nếukhông quét đến hết âm thanh mà vẫn còn điểm ảnh chưa giấu thì thông báoảnh quá lớn để giấu vào âm thanh
2.2 Thuật toán
a Thuật toán giấu tin
Đầu vào: gốc A có độ dài tín hiệu L, ảnh xám cần giấu I.
Đầu ra: âm thanh đã giấu tin.
Các bước thực hiện:
Bước 1: Đọc ảnh cần giấu và chuyển đổi giá trị các điểm ảnh sang chuỗi
bit nhị phân Lưu số hàng và số cột của ảnh theo phương pháp nào đó đểphục vụ khi khôi phục lại ảnh (có thể sử dụng các tín hiệu đầu tiên hoặccuối cùng của âm thanh để giấu giá trị số hàng và số cột của ảnh)
Bước 2: Đọc âm thanh dùng để che giấu ảnh.
Bước 3: Chọn các tín hiệu âm thanh và so sánh 7 bit MSB với 7 bit điểm
ảnh cần giấu, nếu trùng thì đánh giấu vào 3 bit LSB của tín hiệu âm thanhbằng 1 và chuyển sang giấu điểm ảnh tiếp theo, nếu không trùng thì đánh