1. Trang chủ
  2. » Cao đẳng - Đại học

luận văn chuyên ngành Công nghệ thông tin-trình bày một kỹ thuật nén dữ liệu sử dụng phương pháp biến đổi wavelet

78 313 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 78
Dung lượng 1,92 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

So sánh với các kỹ thuật nén sử dụng phép biến đổi trước đây như phép biến đổi Fourier t của biến đổi Haar FT, biến đổi Causin rời rạc t của biến đổi Haar DCT, biến đổi xếp chồng t củ

Trang 1

Lời nói đầu 4

CHƯƠNG I: MỞ ĐẦU 5

1.1 CƠ SỞ NGHIÊN CỨU VÀ MỤC ĐÍCH CỦA LUẬN VĂN: 5

1.2 TỔ CHỨC LUẬN VĂN: 5

CHƯƠNG 2: TỔNG QUAN CÁC KỸ THUẬT NÉN TRONG MÃ HOÁ ÂM THANH, HÌNH ẢNH 6

2.1 GIỚI THIỆU CHUNG VỀ NÉN ẢNH SỐ, ÂM THANH SỐ 7

2.2 PHÂN LOẠI CÁC KỸ THUẬT NÉN 9

2.2.1 Nén tổn hao và không tổn hao 9

2.2.2 Mã hoá dự đoán và mã hoá dựa trên phép biến đổi 9

2.2.3 Mã hoá băng con 10

2.3 TIÊU CHUẨN CHẤT LƯỢNG ĐÁNH GIÁ MÃ HOÁ 10

2.4 CÁC KỸ THUẬT NÉN CÓ TỔN HAO 11

2.4.1 Kỹ thuật mã hoá băng con 11

2.4.2 Kỹ thuật mã hoá dựa trên phép biến đổi 15

2.4.2.1 Kỹ thuật mã hoá dựa trên phép biến đổi DCT 15

2.4.2.2 Kỹ thuật mã hoá dựa trên phép biến đổi DWT 22

2.5 TỔNG QUAN ÂM THANH SỐ 27

2.5.1 Một số phương pháp mã hoá audio 27

2.5.2 Một số kỹ thuật nén audio 28

CHƯƠNG 3:CƠ SỞ LÝ THUYẾT BIẾN ĐỔI WAVELET 38

3.1 CƠ SỞ TOÁN HỌC 38

3.1.1 Biến đổi Wavelet liên tục 38

3.1.2 Biến đổi Wavelet rời rạc 41

3.2 TÍNH CHẤT CỦA BIẾN ĐỔI WAVELET 42

3.3 GIỚI THIỆU MỘT SỐ HỌ WAVELET 46

3.3.1 Biến đổi Wavelet Haar 46

3.3.2 Biến đổi Wavelet Meyer 47

3.3.3 Biến đổi Wavelet Daubechies 47

3.4 MỘT SỐ ỨNG DỤNG NỔI BẬT CỦA WAVELET 48

3.4.1 Nén tín hiệu 48

3.4.2 Khử nhiễu 49

3.4.3 Mã hoá nguồn và mã hoá kênh 49

CHƯƠNG 4: CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI WAVELET – JPEG2000 49

4.1 LỊCH SỬ RA ĐỜI VÀ PHÁT TRIỂN CỦA CHUẨN JPEG2000 50

4.2 CÁC TÍNH NĂNG CỦA JPEG2000 50

4.3 CÁC BƯỚC THỰC HIỆN NÉN ẢNH THEO CHUẨN JPEG2000 51

4.3.1 Xử lý trước biến đổi 51

4.3.2 Biến đổi liên thành phần 51

4.3.3 Biến đổi riêng thành phần (biến đổi Wavelet) 52

4.3.4 Lượng tử hoá - Giải lượng tử hoá 54

4.3.5 Mã hoá và kết hợp dòng dữ liệu sau mã hoá 54

4.3.6 Phương pháp mã hoá SPIHT 55

4.3.7 Phương pháp mã hoá EZW 57

4.4 SO SÁNH CHUẨN JPEG2000 VỚI JPEG VÀ CÁC CHUẨN NÉN ẢNH TĨNH KHÁC 59

Trang 2

CHƯƠNG 5: ỨNG DỤNG CỦA WAVELET TRONG NÉN ẢNH SỐ VÀ ÂM

THANH SỐ 63

5.1 NÉN ẢNH (IMAGE COMPRESSION) 64

5.2 NÉN THOẠI VÀ NÉN AUDIO (SPEECH AND AUDIO COMPRESSION) 67

5.3 PHƯƠNG PHÁP LOẠI NHIỄU ẢNH BẰNG WAVELET 68

5.3.1 Giới thiệu : 68

5.3.2.Wavelet: 69

5.3.2.1 Định vị theo không gian và tham số : 69

5.3.2.2 Tính chất đều: 70

5.3.2.3 Biến đổi wavelet hai chiều: 71

5.3.2.4 Thực hiện biến đổi wavelet rời rạc: 72

5.3.2.5 Đối xứng và phản đối xứng: 72

5.3.2.6 Sự bằng phẳng (smoothness): 73

5.3.3 Nhiễu và loại nhiễu Wavelet 73

5.3.4 Dự đoán đều từ các hệ số Wavelet 74

5.3.5 Tương quan hệ số giữa các lớp Wavelet 75

Kết luận 77

Trang 3

DANH MỤC CÁC HÌNH

Hình 2.1 Sơ đồ bộ khái quát hệ thống nén ảnh 9

Hình 2.2 Sơ đồ minh hoạ kỹ thuật mã hoá băng con – M băng con 12

Hình 2.3 Minh hoạ quá trình phân ly băng con cây bát phân 13

Hình 2.4 Phân ly hai ảnh mẫu thành bốn băng con 14

Hình 2.5 Sơ đồ bộ mã hoá theo chuẩn JPEG 19

Hình 2.6 Sắp xếp Zigzag các hệ số DCT ở bộ mã hoá 10

Hình 2.7 Sơ đồ khối bộ giải mã theo chuẩn JPEG 20

Hình 2.8 Bank lọc khôi phục lý thuyết sử dụng DWT 1D 24

Hình 2.9 Minh hoạ DWT hai chiều cho ảnh 15

Hình 2.10(a) Minh hoạ DWT kiểu dyadic mức 3 để nén ảnh 15

Hình 2.10(b) Minh hoạ DWT kiểu dyadic mức 3 để nén ảnh 22

Hình 2.11 Các mẫu trong MPEG-1 31

Hình 2.12 Sơ đồ khối MPEG layer III 32

Hình 2.13 Chuẩn MPEG-2 m ã hoá mono/stereo 35

Hình 2.14 Mã hoá và giải mã MPEG-2 36

Hình 3.1 Minh hoạ lưới nhị tố dyadic với các giá trị của m và n 40

Hình 3.2 Phân tích đa phân giải áp dụng cho biểu diễn tín hiệu 44

Hình 3.3 Hàm ψ (t ) của biến đổi Haar t ) của biến đổi Haar 45

Hình 3.4: Hàm ψ (t ) của biến đổi Haar t ) của biến đổi Meyer 46

Hình 3.5 Hàm ψ (t ) của biến đổi Haar t ) của họ biến đổi Daubechies n với n=2, 3, 7, 8 47

Hình 4.1 Trình tự mã hoá (t ) của biến đổi Haar a) và giải mã JPEG2000 (t ) của biến đổi Haar b) 50

Hình 4.2 Minh hoạ ảnh với RGB và YCrCb 51

Hình 4.3 Phương pháp Lifting 1D dùng tính toán biến đổi Wavelet 52

Hình 4.4 Minh hoạ cây tứ phân (t ) của biến đổi Haar a) và sự phân mức (t ) của biến đổi Haar b 56

Hình 4.5 Hai cách sắp xếp thứ tự các hệ số biến đổi 57

Hình 4.6 So sánh JPEG và JPEG2000 59

Hình 4.7 Minh hoạ tính năng ROI 61

Hình 5.1 Sơ đồ khối quá trình nén ảnh bằng Wavelet 64

Hình 5.2 biến đổi wavelet rời rạc bốn mức và dãy lọc tương đương của nó 65

Hình 5.3 Ảnh được phân tích với wavelet 4 mức 66

Hình 5.4 Ảnh mã hoá bằng DWT 66

Hình 5.5-Sự phân tích của mặt phẳng tần số bằng biến đổi wavelet hai chiều bình phương 66

Trang 4

Lời nói đầu

Trong những năm gần đây, nhu cầu dịch vụ dữ liệu trên mạng, đặc biệt là Internet là rất lớn Cùng với nhu cầu đó, vấn đề đặt ra là làm thế nào

để tìm được một kỹ thuật mã hoá dữ liệu then chốt, có hiệu quả để truyền các dữ liệu này trên mạng

Mục đích của luận văn này là trình bày một kỹ thuật nén dữ liệu sử dụng phương pháp biến đổi Wavelet, đặc biệt các dữ liệu lớn trong các dịch

vụ cần truyền qua mạng Internet với điều kiện đường truyền có tốc độ hạn chế So sánh với các kỹ thuật nén sử dụng phép biến đổi trước đây như phép biến đổi Fourier (t ) của biến đổi Haar FT), biến đổi Causin rời rạc (t ) của biến đổi Haar DCT), biến đổi xếp chồng (t ) của biến đổi Haar FT)…v v, biến đổi Wavelet (t ) của biến đổi Haar DWT) có nhiều ưu điểm trong xử lý ảnh và

âm thanh mà còn có nhiều ứng dụng khác Bằng chứng là sự ra đời của chuẩn nén JPEG2000 (t ) của biến đổi Haar dựa trên DWT) có tính năng vượt trội so với JPEG (t ) của biến đổi Haar DCT) Hiện nay Wavelet đang chính là một chủ đề nóng về cả hai lĩnh vực

lý thuyết và ứng dụng Wavelet là một cây cầu nối liền các lĩnh vực riêng biệt của toán học, thống kê, xử lý tín hiệu và các khoa học vật lý khác Càng ngày người ta càng quan tâm nghiên cứu về wavelet nhiều ehơn

Trong luận văn đã trình bày một phương pháp nén dữ liệu sử dụng kỹthuật biến đổi Wavelet không chỉ đem lại hiệu quả nén, chất lượng hình ảnh

mà còn tiết kiệm năng lượng xử lý của hệ thống Điều này hứa hẹn có thể xây dựng một mã hoá ảnh và âm thanh tiết kiệm năng lượng xử lý, thời gian truyền mà vẫn phù hợp với điều kiện băng thông thấp, ràng buộc về chất

Trang 5

lượng dữ liệu trong các mạng thông tin.

CHƯƠNG I: MỞ ĐẦU.

1.1.CƠ SỞ NGHIÊN CỨU VÀ MỤC ĐÍCH CỦA LUẬN VĂN:

Để có thể sử dụng các dịchu vụ dữ liệu âm thanh hình ảnh cũng như dịch vụ dữ liệu khác trên nền dịch vụ mạng cần có một kỹ thuật then chốt để

có thể hỗ trợ truyền thông nhiều dạng dữ liệu thông tin tế bào gồm: âm thanh, hình ảnh, văn bản, video Tuy nhiên vấn đề truyền thông đa phương tiện gặp một số khó khăn như: băng thông của mạng, tính ổn định của mạng,tính tương thích dữ liệu…v v Trong khi việc cải thiện băng thông, tính ổn định cho mạng internet cần có thời gian trong tương lai, thì phương pháp giảm kích thước của dữ liệu bằng các kỹ thuật nén là một cách tiếp cận hiệu quả giải quyết cho các khó khăn trên

Mặc dù cho đến nay có rất nhiều kỹ thuật nén, tuy nhiên những kỹ thuật này chủ yếu tập trung vào hiệu quả nén và đánh mất chất lượng hình ảnh vì thế chúng bỏ qua vấn đề tiêu hao năng lượng trong quá trình nén và truyền Luận văn này trình bày một kỹ thuật hiệu quả để khắc phục những khó khăn trên cho các loại dữ liệu âm thanh và hình ảnh Đó là kỹ thuật nén hình ảnh

và nén âm thanh sử dụng phương pháp biến đổi Wavelet cho dữ liệu trong mạng thông tin, truyền thông

1.2.TỔ CHỨC LUẬN VĂN:

Luận văn được trình bày trong 5 chương Chương 1 tác giả trình bày tóm tắt cơ sở nghiên cứu và mục đích cũng như tổ chức của luận văn

Trang 6

Chương 2 trình bày khái quát các kỹ thuật nén ảnh, phân loại các nguyên lý nén và định nghĩa một số thuật ngữ được sử dụng rộng rãi

Chương này cũng trình bày cơ sở lý thuyết của các nguyên lý nén có tổn haođiển hình

Chương 3 trình bày cơ sở toán học, tính chất biến đổi Wavelet Nội dung của chương này là lý thuyết nền tảng cho các ứng dụng Wavelet

Chương này cũng đưa ra một số họ Wavelet phổ biến và giới thiệu một số ứng dụng nổi bật của Wavelet ngoài ứng dụng nén ảnh, nén âm thanh

Chương 4 giới thiệu tổng quan về chuẩn nén JPEG2000 dựa trên biến đổi Wavelet Mục đích không chỉ là giới thiệu một chuẩn nén vượt trội so với chuẩn JPEG dựa trên biến đổi DCT mà còn đưa ra một lựa chọn giải quyết bài toán đặt ra trong luận văn JPEG2000 đang từng bước được tổ chức ISO công nhận nên chắc chắn sẽ trở thành một chuẩn nén phổ biến trong các ứng dụng di động tương lai Cũng trong chương này, tác giả trình bầy tóm tắt các bước thực hiện nén ảnh theo JPEG200 và so sánh nó với chuẩn JPEG và các chuẩn nén ảnh tĩnh khác

Chương 5 là chương quan trong nhất Dựa trên cơ sở toán học, các tính chất biến đổi Wavelet, đưa vào xây dựng các ứng dụng trong thực tế như nén ảnh số, âm thanh số

Trang 7

CHƯƠNG 2: TỔNG QUAN CÁC KỸ THUẬT NÉN TRONG MÃ HOÁ ÂM THANH, HÌNH ẢNH.

2.1.GIỚI THIỆU CHUNG VỀ NÉN ẢNH SỐ, ÂM THANH SỐ.

Nén ảnh số, âm thanh số là một đề tài nghiên cứu khá phổ biến trong lĩnh vực xử lý dữ liệu Mục đích là làm thế nào để lưu trữ bức ảnh hay một đoạn âm thanh, dưới dạng có kích thước nhỏ hơn hay dưới dạng biểu diễn

mà chỉ yêu cầu số bit mã hoá ít hơn so với dữ liệu gốc Nén dữ liệu ở đây thực hiện được do một thực tế: thông tin trong đó không phải ngẫu nhiên mà

có trật tự, cấu trúc đó thì sẽ biết được phần thông tin nào quan trọng nhất trong phân đoạn dữ liệu để biểu diễn và truyền đi với số lượng bit ít hơn so với dữ liệu gốc mà vẫn đảm bảo tính đầy đủ của thông tin Ở phía thu, quá trình giải mã sẽ tổ chức, sắp xếp lại được bức ảnh, đoạn âm thanh xấp xỉ gầnchính xác so với gốc của nó nhưng vẫn thoả mãn chất lượng yêu cầu, đảm bảo thông tin cần thiết

Tóm lại, tín hiệu ảnh, video hay audio đều có thể nén lại bởi chúng có những tính chất như sau:

+ Có sự tương quan (dư thừa) thông tin về không gian: Trong phạm

vi một bức ảnh hay một khung video tồn tại sự tương quan đáng kể (dư thừa) giữa các điểm ảnh lân cận.

+ Có sự tương quan (dư thừa) thông tin về phổ: Các dữ liệu thu được

từ các bộ cảm biến của thiết bị thu nhận ảnh tồn tại sự tương quan đáng kể giữa các mẫu thu, đây chính là sự tương quan về phổ.

+ Có sự tương quan (dư thừa) thông tin về thời gian Trong một chuỗi

Trang 8

video, tồn tại sự tương quan giữa các điểm ảnh của các khung video (frame)

Sơ đồ của một hệ thống nén dữ liễu tổng quát như sau:

Trong hình 2.1, bộ mã hoá dữ liệu thực hiện quá trình nén bằng cách giảm kích thước dữ liệu ảnh gốc đến một mức phù hợp với việc lưu trữ và truyền dẫn trên kênh Tốc độ bit đầu ra của bộ mã hoá được tính là số bit cho một mẫu (t ) của biến đổi Haar điểm ảnh) Bộ mã hoá kênh thực hiện việc chuyển đổi luồng bit đã được nén thành dạng tín hiệu phù hợp cả cho việc lưu trữ và truyền dẫn,

thường bộ mã hoá kênh sử dụng các kỹ thuật: mã hoá có dộ dài thay

đổi-RLC (Run Length Coding), mã hoá Hufman, mã hoá số học Bộ giải mã thực

hiện quá trình ngược lại so với bộ mã hoá

Trong các hệ thống nén, tỷ số nén chính là tham số quan trọng đánh giá khảnăng nén của hệ thống, công thức được tính như sau:

Tỷ số nén= Kích thước dữ liệu gốc/Kích thước dữ liệu nén.

Trang 9

Đối với ảnh tĩnh, kích thước chính là số bit để biểu diễn toàn bộ bức ảnh Đối với video, kích thước chính là số bit để biểu diễn một khung hình video

(video frame).

2.2.PHÂN LOẠI CÁC KỸ THUẬT NÉN.

Các kỹ thuật nén chủ yếu được phân loại như sau:

2.2.1 Nén tổn hao và không tổn hao.

Trong các kỹ thuật nén không tổn hao (Losses compression), ảnh khôi

phục giống hoàn toàn so với ảnh gốc Tuy nhiên, nén không tổn hao chỉ đạt

được hiệu quả nén rất nhỏ Trái lại, các kỹ thuật nén có tổn hao (losy

compression) có thể đạt được hiệu quả nén cao hơn rất nhiều mà ở điều kiện

cảm nhận thông thường sự mất mát thông tin không cảm nhận được và vì thế vẫn đảm bảo chất lượng hình ảnh Một số kỹ thuật nén có tổn hao bao gồm: điều xung mã vi sai-DPCM, điều xung mã – PCM, lượng tử hoá vectơ-

VQ, mã hoá biến đổi và băng con Ảnh khôi phục trong hệ thống nén có tổn hao luôn có sự suy giảm thông tin so với ảnh gốc bởi vì: phương pháp nén này đã loại bỏ những thông tin dư thừa không cần thiết

2.2.2 Mã hoá dự đoán và mã hoá dựa trên phép biến đổi.

Đối với mã hoá dự đoán (predictive coding) các giá trị mang thông tin

đã được gửi hay đang sẵn có sẽ được sử dụng để đoán các giá trị khác, và chỉ mã hoá sự sai lệch giữa chúng Phương pháp này đơn giản rất phù hợp với công việc khai thác các đặc tính cục bộ của bức ảnh Kỹ thuật DPCM chính là một ví dụ điển hình của phương pháp này Trong khi đó, mã hoá

dựa trên phép biến đổi (transform based coding) thì lại thực hiện như sau:

trước tiên thực hiện phép biến đổi với ảnh để chuyển sự biểu diễn ảnh từ

Trang 10

miền không gian sang một miền biểu diễn khac Các phép biến đổi thường dung là: DCT - biến đổi Causin rời rạc, DWT- biến đổi Wavelet rời rạc, LT

- biến đổi trồng (lapped), tiếp đó thực hiện mã hoá đối với các hệ số biến

đổi Phương pháp này có hiệu suất nén cao hơn rất nhiều so với các phương pháp nén dự đoán bỏi vì chính các phép biến đổi (t ) của biến đổi Haar sử dụng các thuộc tính nénnăng lượng của mình) đã gói gọn toàn bộ năng lượng bức ảnh chỉ bằng một

số ít các hệ số, số lớn các hệ số còn lại ít có ý nghĩa hơn sẽ bị loại bỏ sau khilượng tử hoá và như vậy dữ liệu phải truyền nhỏ đi rất nhiều Trong phương pháp mã hoá dự đoán, sai lệch giữa ảnh gốc và ảnh dự đoán vẫn có ý nghĩa (t ) của biến đổi Haar còn sử dụng ở bước tiếp theo) sau khi lượng tử hoá,chính điều này làm cho phương pháp mã hoá dự đoán có nhiều dữ liệu được truyền đi hơn so với phương pháp mã hoá biến đổi

2.2.3 Mã hoá băng con.

Bản chất của mã hoá băng con (subband coding) là chia băng tần của tín hiệu (t ) của biến đổi Haar ảnh) thành nhiều băng con (subband) Để mã hoá cho mỗi băng

con, chúng ta sử dụng một bộ mã và một tốc độ bit tương ứng với tính chất thống kê của băng con

2.3.TIÊU CHUẨN CHẤT LƯỢNG ĐÁNH GIÁ MÃ HOÁ.

Để đánh giá chất lượng của bức ảnh (t ) của biến đổi Haar hay khung ảnh video) ở đầu ra của bộ mã hoá, người ta sử dụng hai tham số: sai số bình phương trung bình

– MSE (mean square error) và tỉ số tín hiệu trên nhiễu đỉnh – PSNR (peak

to signal to noise ratio) MSE thường được gọi là phương sai lượng tử- σ 2

Trang 11

Trong đó tổng lấy theo j, k tính cho tổng tất cả các điểm ảnh trong ảnh và N

là số điểm ảnh trong ảnh Còn PSNR giữa hai ảnh (t ) của biến đổi Haar b bit cho mỗi điểm ảnh,

RMSE là căn bậc hai của MSE) được tính theo công thức dB như sau:

) 2 2 (t ) của biến đổi Haar 1 2 log

Thông thường nếu PSNR ≥ 40dB thì hệ thống mắt người gần như không phân được giữa ảnh gốc và ảnh khôi phục

Một tham số khác hay sử dụng trong các hệ thông viễn thông đó là tỉ

số tín hiệu trên nhiễu – SNR, tuy vậy SNR sử dụng cho một hệ thống nén ảnh cũng có công thức dB như sau:

2.4 CÁC KỸ THUẬT NÉN CÓ TỔN HAO.

Trong phần này, tác giả lựa chọn trình bày hai kỹ thuật nén tổn hao

cho nén ảnh tĩnh và ảnh động, đó là: mã hoá băng con (subband coding) và

mã hoá sử dụng phép biến đổi (transform coding) Đây là hai kỹ thuật nén

điển hình và cho hiệu quả nén cũng như chất lượng ảnh cao

2.4.1 Kỹ thuật mã hoá băng con.

Tư tưởng chính của kỹ thuật mã hoá băng con là: các ảnh được lấy mẫu ở đầu vào được phân ly thành các băng tần khác nhau (t ) của biến đổi Haar gọi là các tín hiệu băng con) Yêu cầu của kỹ thuật này là làm thế nào các băng con không

bị chồng chéo lên nhau Để có thể phân ly tín hiệu ở bộ mã hoá (encoder) thành các băng con, ảnh được cho qua một bank lọc (filter bank) gọi là các

bank lọc phân tích và mỗi đầu ra của bank lọc băng con được lấy mẫu xuống

hệ số 2 Các đầu ra băng con rần số được lấy mẫu xuống sẽ lần lượt được: lượng tử hoá độc lập bằng các bộ lọc vô hướng khác nhau, mã hoá entropy,

lưu trữ và truyền đi Ở phía bộ giải mã (decoder), quá trình được thực hiện

ngược lại: giải lượng tử băng con tần số, lấy mẫu lên với hệ số 2, cho đi qua

Trang 12

bank lọc băng con tổng hợp rồi cộng tất cả các đầu ra của bộ lọc để khôi phục lại ảnh.

Các bộ lọc băng con thường được thiết kế xấp xỉ thoả mãn tiêu chuẩn của các đáp ứng tần số không chồng chéo Mục đích của vấn đề là để giải tương quan các hệ số tần số kết quả Đây chính là tính chất quan trọng mà quá trình lọc băng con cố gắng đạt được Các bộ lọc băng con được thiết kết để

là các xấp xỉ với các bộ lọc chọn tần số lý tưởng, trong đó đáp ứng tổng hợp

từ tất cả các bộ lọc bao trùn tất cả băng tần của dải Tuy nhiên trong thực tế,

sự tương quan tổng không bao giờ đạt được do những bộ lọc này chỉ xấp xỉ với các bộ lọc lý tưởng

HÌnh 2.2 dưới đây là sơ đồ tổng quát giải thích kỹ thuật mã hoá băng con

Trang 13

Các bộ lọc sử dụng trong mã hoá băng con là các bộ lọc gương tứ

phương – QMF (quardrature mirror filters), do vậy chúng ta chỉ cần thiết kế các bộ lọc thông thấp có đáp ứng H(ω)) còn đáp ứng của các bộ lọc thông

xác của bộ lọc phụ thuộc vào số các hệ số của bộ lọc

Một trong các phương pháp mã hoá băng con đó là áp dụng sự phân

ly cây bát phân để phân ly dữ liệu ảnh thành các băng tần khác nhau Ý tưởng của phương pháp này là: trước tiên lọc và lược bỏ ảnh để phân ly nhưng chỉ áp dụng cho băng con tần số thấp để tạo thành các băng con tần

số cao và thấp để tiếp tục lược bỏ Kỹ thuật này rất phổ biến và cũng được

áp dụng trong các bộ mã sử dụng biến đổi Wavelet Đầu ra của các băng consau khi đã giản lược sẽ được lượng tử hoá và mã hoá độc lập Mỗi băng con

sẽ sử dụng bộ lượng tử hoá riêng và mỗi bộ lượng tử hoá này có tốc độ lấy mẫu riêng (t ) của biến đổi Haar bit/mẫu)

Như vậy rõ rang mã hoá băng con không đạt được sự nén, mà nó chỉ thực hiện việc giải tương quan dữ liệu ảnh gốc và tập trung năng lượng của ảnh vào một số băng con Nén chỉ đạt được là do sự lược bỏ ảnh

(decimation) và do sự lượng tử hoá (quantization).

Trang 14

Trong các hệ thống mã hoá băng con hai chiều thực tế, người ta chia miền tần số - không gian hai chiều của ảnh gốc thành các băng khác nhau ở bất kỳ mức nào Hình 2.4 dưới đây minh hoạ việc phân ly 2 ảnh mẫu thành 4băng con LL, HL, LH và HH ở mức đầu tiên.

Nhược điểm của kỹ thuật mã hoá băng con:

Một trong những vấn đề chủ yếu của kỹ thuật mã hoá băng con đó là giải quyết bài toán cấp phát bit (t ) của biến đổi Haar là số bit cấp cho mỗi băng con) để đạt được hiệu suất cao nhất Một trong những cách thực hiện là sử dụng ý tưởng cấp phát bit tối ưu cho mỗi đầu ra băng con đã được lượng tử hoá Tuy nhiên cách này chủ yếu thích hợp cho trường hợp tốc độ cao (t ) của biến đổi Haar ≥1 bit/mẫu)

Trước khi đi vào nghiên cứu kỹ thuật mã hoá dựa trên phép biến đổi, chúng

ta sẽ tổng kết một số nhược điểm của kỹ thuật mã hoá băng con như sau:

Trang 15

+ Kỹ thuật mã hoá băng con không xác định được hệ thống mã hoá tối

ưu cho các ứng dụng tốc độ bit thấp Việc cấp phát bit tối ưu sẽ thay đổi khi tốc độ bit tổng thay đổi, điều này làm quá trình mã hoá phải lặp lại hoàn toàn cho mỗi tốc độ bit xác định.

+ Không hoàn toàn giải tương quan cho tất cả các băng tần, đấy là do các bộ lọc không phải là lý tưởng và có sự chồng chéo nhỏ giữa các băng tần liền kề Do vậy luôn luôn tồn tại một sự tương quan nhỏ giữa các băng tần kề nhau và dữ liệu sẽ không được nén hoàn toàn.

+ Kỹ thuật mã hoá băng con không hiệu quả khi thực hiện bù chuyển động trong video vì rất khó để thực hiện đánh giá chuyển động ở các băng con (sai số dự đoán là rất lớn).

2.4.2 Kỹ thuật mã hoá dựa trên phép biến đổi

Một phép biến đổi là một hàm toán học được sử dụng để biến đổi một tập các giá trị này thành một tập các giá trị khác và tạo ra một cách biểu diễnmới cho cùng một nguồn tin Tất cả các phép biến đổi mà chúng ta định

trình bày dưới đây đều là không tổn hao (lossless); với sự chính xác của các

phép toán số học thì các phép biến đổi vẫn bảo tồn được độ chính xác ở bất

kỳ mức độ nào Nhưng hầu hết các kỹ thuật mã hoá đều có tổn hao ở các bước lượng tử hoá do có sự làm tròn giá trị cho các hệ số phép biến đổi.Phần này chúng ta sẽ trình bày các kỹ thuật mã hoá dựa trên phép biến đổi được sử dụng trong nén ảnh

(a) Kỹ thuật mã hoá dựa trên phép biến đổi Causin rời rạc – DCT

(b) Kỹ thuật mã hoá dựa trên phép biến đổi chồng – LT

(c) Kỹ thuật mã hoá dựa trên phép biến đổi DWT

2.4.2.1 Kỹ thuật mã hoá dựa trên phép biến đổi DCT

Trang 16

Phép biến đổi Causin rời rạc DCT ( Disctrete Cosine Transform) biến

đổi thông tin ảnh từ miền không gian sang miền tần số để có thể biểu diễn dưới dạng gọn hơn Tính chất của nó tương tự như biến đổi Fourier, coi ảnh đầu vào (t ) của biến đổi Haar tín hiệu audio hoặc video) là các tín hiệu ổn đinh bất biến theo thời

gian Để hiểu rõ kỹ thuật này trước hết ta cần tìm hiểu biến đổi Fourier.

Biến đổi Fourier- FT:

Biến đổi Fourier – FT (Fourier Transform) là một phép biến đổi thuận

nghịch, nó cho phép sự chuyển đổi thuận - nghịch giữa thông tin gốc (t ) của biến đổi Haar miền không gian hoặc thời gian) và tín hiệu được xử lý (t ) của biến đổi Haar được biến đổi) Tuy nhiên ở một thời điểm bất kỳ chỉ tồn tại một miền thông tin được thể hiện Nghĩa là tín hiệu trong miền không gian không có sự xuất hiện thông tin về tần số và tín hiệu sau biến đổi Fourier không có sự xuất hiện thông tin về thời gian

Ft cho biết thông tin tần số của tín hiệu, cho biết những tần số nào có trong tín hiệu, tuy nhiên nó không cho biết tần số nào đó xuất hiện khi nào

trong tín hiệu Nếu như tín hiệu là ổn định (stationary- có các thành phần

tần số không thay đổi theo thời gian) thì việc xác định các thành phần tần số

xuất hiện khi nào trong tín hiệu là không cần thiết

Phép biến đổi FT thuận và nghịch được định nghĩa như sau:

) 4 2 (t ) của biến đổi Haar )

(t ) của biến đổi Haar )

(t ) của biến đổi Haar f x t e 2 dt

(t ) của biến đổi Haar )

(t ) của biến đổi Haar t X t e 2 df

Phép biến đổi FT cũng có thể được áp dụng cho tín hiệu không ổn

định (non-stationary) nếu như chúng ta chỉ quan tâm đến thành phần phổ

nào có trong tín hiệu mà không quan tâm đến nó xuất hiện khi nào trong tín hiệu Tuy nhiên, nếu thông tin về thời gian xuất hiện của phổ trong tín hiệu

Trang 17

là cần thiết, thì phép biến đổi FT không có khả năng đáp ứng được yêu cầu này, đây cũng là hạn chế của phép biến đổi này.

Để có biến đổi Fourierr rời rạc – DFT (Discrete Fourier Transform)

thì ở phép tích phân trong biểu thức toán học của biến đổi FT, ta thay bằng phép tổng và tính toán nó với các mẫu hữu hạn

Hệ số phép biến đổi DFT thứ k của một chuỗi gồm N mẫu {x(n)} được định

nghĩa:

) 6 2 (t ) của biến đổi Haar 1 , , 0 , ) (t ) của biến đổi Haar )

(t ) của biến đổi Haar 1

n x k

n

phục bằng DFT ngược như sau:

) 7 2 (t ) của biến đổi Haar 1 , , 0 , ) (t ) của biến đổi Haar )

(t ) của biến đổi Haar 1

0

kn -

k X n

n

Định nghĩa và các tính chất của biến đổi DCT

Biến đổi DCT thuận và ngược một chiều gồm N mẫu được định nghĩa như sau:

) 8 2 (t ) của biến đổi Haar 1 , , 1 , 0 , 2

) 1 2 (t ) của biến đổi Haar ) (t ) của biến đổi Haar

2 ) (t ) của biến đổi Haar 1

N

k n os c n x c N k X

n k

) 9 2 (t ) của biến đổi Haar 1 , , 1 , 0 , 2

) 1 2 (t ) của biến đổi Haar ) (t ) của biến đổi Haar

2 )

(t ) của biến đổi Haar 1

N

k n os c k X c N n

x

k k

1

0 ,

2

/

1

k k

c k

Cả DCT và IDCT đều là biến đổi trực giao, tách biệt và thực Tính

chất phân tách (separable) ở đây nghĩa là biến đổi nhiều chiều của nó có thể

phân tách thành các biến đổi một chiều Tính chất trực giao ở đây nghĩa là

nếu các ma trận của DCT và IDCT là không bất thường (non-singular) và

Trang 18

thực thì biến đổi ngược của chúng có thể đạt được bằng cách áp dụng hoán

tử hoán vị Cũng như biến đổi FT, DCT cũng coi dữ liệu đầu vào là tín hiệu

ổn định (t ) của biến đổi Haar bất biến)

Trong các chuẩn nén ảnh tĩnh vào video, người ta thường sử dụng DCT và IDCT có kích thước 8 mẫu Bức ảnh hoặc khung ảnh video kích thước NxN được chia thành các khối không chồng chéo nhau hai chiều gọi là các ảnh con kích thước 8x8 rồi áp dụng biến đổi DCT hai chiều ở bộ mã hoá và áp dụng biến đổi IDCT ở bộ mã

Biến đổi DCT và IDCT 8 mẫu tạo thành các ma trậnh 8x8 theo công thức:

) 1 2 (t ) của biến đổi Haar cos 16

) 1 2 (t ) của biến đổi Haar cos 4

) (t ) của biến đổi Haar ) (t ) của biến đổi Haar X DCT

D

0

7 0 , l

m x

l c k c

n m

) 1 2 (t ) của biến đổi Haar cos 16

) 1 2 (t ) của biến đổi Haar cos 4

) (t ) của biến đổi Haar ) (t ) của biến đổi Haar x

, n

m X

l c k c

l k

1

0

&

, 2 / 1 ) (t ) của biến đổi Haar

),

(t ) của biến đổi Haar 2 2

l k

l k l

và so với các phép biến đổi khác nó có thể tối thiểu hoá MSE giữa ảnh khôi phục và ảnh gốc

Trang 19

JPEG là chuẩn nén số quốc tế đầu tiên cho các ảnh tĩnh có tông màu liên tục gồm cả ảnh đơn sắc và ảnh màu Trong kỹ thuật này các khối ảnh kích thước8x8 được áp dụng để thực hiện DCT, sau đó lượng tử hoá các hệ số rồi mã hoá entropy sau lượng tử.

Đối với những ảnh màu RGB, để áp dụng kỹ thuật nén này, trước hết phải chuyển sang chế độ màu YUV (t ) của biến đổi Haar Y là thành phần chói, U và V là hai thành phần màu) Thành phần độ chói là ảnh đơn sắc xám Hai thành phần màu còn lại chứa thông tin về màu Việc mã hoá và giải mã ảnh trong JPEG

ở được thực hiện cho thành phần chói rồi màu

Sơ đồ khối bộ mã hoá và giải mã của JPEG như sau:

Trang 20

Quá trình xử lý thành phần độ chói ở phía mã hoá được giải thích như sau:

(t ) của biến đổi Haar a) Ảnh gốc được chia thành các khối ảnh (block) nhỏ kích thước 8x8

không chồng chéo lên nhau Tiếp theo, giá trị của mỗi điểm ảnh ở mỗi khối ảnh sẽ được trừ đi 128 Lý do là do giá trị các điểm ảnh có giá trị trừ

0 đến 255 (t ) của biến đổi Haar được mã hoá bởi 8 bit không dấu), áp dụng biến đổi DCT sẽ tạo ra các hệ số AC có dải giá trị từ -1023 đến +1023 (t ) của biến đổi Haar có thể được mã hoá bởi 11 bit có dấu) Nhưng hệ số DC lại có giải giá trị từ 0 đến 2040 (t ) của biến đổi Haar được mã hoá bởi 11 bit không dấu) và cần cách xử lý khác ở phần cứng hoặc phần mềm so với các hệ số AC Chính vì thế việc trừ mỗi điểm ảnh

đi 128 là để sau khi biến đổi DCT cả các hệ số DCT cả các hệ số DC và

AC có cùng dải giá trịo thuận lợi cho việc xử lý và biểu diễn

Trang 21

(t ) của biến đổi Haar b) Ở mỗi khối ảnh hai chiều kích thước 8x8, áp cụng biến đổi DCT để tạo

ra mảng hai chiều các hệ số biến đổi Hệ số có tương ưng với tần số không gian thấp nhấp nhưng lại có giá trị lớn nhất được gọi là hệ số DC (t ) của biến đổi Haar một chiều), nó tỷ lệ với độ chói trung bình của cả khối ảnh 8x8 Các hệ

số còn lại gọi là các hệ số AC (t ) của biến đổi Haar xoay chiều) Theo lý thuyết, biến đổi DCTkhông đem lại sự mất mát thông tin ảnh, mà đơn giản nó chỉ chuyển thông tin ảnh sang miền không gian mới thuận lợi hơn cho mã hoá ở bước tiếp theo

(t ) của biến đổi Haar c) Mảng hai chiều các hệ số biến đổi được lượng tử hoá sử dụng bộ lượng

tử hoá đồng nhất nghĩa là các hệ số sẽ được lượng tử hoá riêng lẻ và độc lập Quá trình lượng tử hoá là dựa trên sinh lý của hệ thống mắt người: cảm nhận hình ảnh có độ nhạy kém hơn ở các hệ số tần số cao và có độ nhạy tốt hơn ở các hệ số có tần số thấp Vì thế các hệ số được chọn sao cho thực hiện lượng tử hoá thô đối với các hệ số tần số cao và lượng tử hoá tinh đối với các hệ số có tần số thấp Bảng lượng tử hoá được lấy tỉ

lệ để tạo ra các mức nén thay đổi tuỳ theo tốc độ bit và chất lượng ảnh Việc lượng tử hoá sẽ tạo ra rất nhiều giá trị 0, đặt biệt là ở tần số cao Quá trình làm tròn trong khi lượng tử hoá chính là nguyên nhân chính gây ra sự tổn hao nhưng lại là nhân tố chính đem lại hiệu suất nén

(t ) của biến đổi Haar d) Để tận dụng ưu điểm của các hệ số đã được lượng tử có giá trị gần bằng

0, mảng hai chiều các hệ số đã được lượng tử sẽ được sắp xếp theo hình Zigzag tạo thành mảng một chiều Cách sắp xếp này cho phép giảm thiểunăng lượng tổn hao trung bình và tạo ra các giá trị bằng 0 liên tiếp Cũng theo cách sắp xếp này, các hệ số DC được tách khỏi các hệ số AC và sử dụng kỹ thuật mã hoá điều xung mã vi sai – DPCM

Trang 22

(t ) của biến đổi Haar e) Bước cuối cùng của bộ mã hoá là sử dụng mã hoá entropy chẳng hạn mãhoá Huffman cho các AC và DC (t ) của biến đổi Haar sau khi đã mã hoá DPCM) để tăng thêm hiệu quả nén cũng như giảm thiểu lỗi.

Ở phía giải mã, luồng bit mã hoá được giải mã entropy, sau đó mảng hai chiều các hệ số DCT đã được lượng tử hoá được giải sắp xếp Zigzag và giải lượng tử Mảng hai chiều các hệ số DCT kết quả sẽ được biến đổi IDCTrồi cộng mỗi giá trị với 128 để xấp xỉ tạo thành các khối ảnh con kích thước 8x8 Chú ý là bảng lượng tử hoá và mã hoá entropy ở các phia mã hoá và giải mã đồng nhất

Hai thành phần màu cũng được mã hoá tương tự như thành phần chói ngoại trừ khác biệt là chúng được lấy mẫu xuống hệ số 2 hay 4 ở cả chiều ngang hay chiều dọc trước khi biến đổi DCT Ở phía giải mã, thành phần màu sẽ được nội suy thành kích thước gốc

2.4.2.2 Kỹ thuật mã hoá dựa trên phép biến đổi DWT

Mối quan hệ giữa biến đổi Wavelet và Fourier:

Không giống như biến đổi Fourier chỉ thích hợp khi phân tích những

tín hiệu ổn định (stationary), Wavelet là phép biến đổi được sử dụng để phân tích các tín hiệu không ổn định (non-stationary) – là những tín hiệu có

đáp ứng tần số thay đổi theo thời gian

Để khắc phục những hạn chế của phép biến đổi FT, phép biến đổi Fourier thời gian ngắn – STFT được đề xuất Chỉ có một sự khác biệt nhỏ giữa STFT và FT: trong biến đổi STFT, tín hiệu được chia thành các khoảng nhỏ

và trong khoảng tín hiệu được giả định là tín hiệu không ổn định Để thực hiện kỹ thuật này cần chọn một hàm cửa sổ w sao cho độ dài của cửa sổ đúng bằng các khoảng tín hiệu phân chia Với phép biến đổi STFT, chúng ta

Trang 23

có thể thu được đáp ứng tần số - thời gian của tín hiệu đồng thời mà với phép biến đổi FT ta không thực biện được.

Biến đổi STFT đối với tín hiệu liên tục thực được định nghĩa như sau:

) 12 2 (t ) của biến đổi Haar ]

) (t ) của biến đổi Haar ) (t ) của biến đổi Haar [

Giải thích biến đổi STFT bằng nguyên lý bất định Heisender, nguyên lý này

phát biểu là: “ không thể biết chính xác được biểu diễn thời gian - tần số

của một tín hiệu (hay không thể biết các thành phần phổ của tín hiệu ở một thời điểm nhất định)” Cái mà ta có thể biết là một trong một khoảng thời

gian ngắn nhất định tín hiệu có những băng tần nào Đây được gọi là bài toán phân giải Vấn đề này liên quan đến độ rộng của hàm cửa sổ mà chúng

ta sử dụng Nếu hàm cửa số càng hẹp thì độ phân giải càng tốt hơn và giả định tín hiệu là ổn định càng có độ chính xác nhưng độ phân giải tần số lại kém đi Ta có các hệ quả sau:

Cửa sổ hẹp -> phân giải thời gian tốt, phân giải tần số kém.

Cửa sổ rộng -> phân giải tần số tốt, phân giải thời gian kém.

Trên cơ sở cách tiếp cận biến đổi STFT, biến đổi Wavelet được phát triển đểgiải quyết các vấn đề về độ phân giải tín hiệu (t ) của biến đổi Haar miền thời gian hoặc tần số)

mà STFT vẫn còn hạn chế Biến đổi Wavelet được thực hiện theo cách: tín hiệu được nhân với hàm Wavelet (t ) của biến đổi Haar tương tự nhân với hàm cửa sổ trong biến đổi STFT), rồi thực hiện biến đổi riêng rẽ cho các khoảng tín hiệu khác nhautrong miền thời gian tại các tần số khác nhau Cách tiếp cận như vậy còn

được gọi là: phân tích đa phân giải – MRA (Multi Resolution Analysis):

phân tích tín hiệu ở các tần số khác nhau và cho các độ phân giải khác nhau.

Trang 24

Biến đổi Wavelet rời rạc – DWT:

Bước này có thể hiểu phép biến đổi DWT như là áp dụng một tâp các

bộ lọc: thông cao và thông thấp Thiết kế cac bộ lọc này tương đương như

kỹ thuật mã hoá băng con (Subband coding) nghĩa là: chỉ cần thiết kế các bộ

lọc băng thấp, còn các bộ lọc thông cao chính là các bộ lọc thông thấp dịch

DWT được thiết kế phải có đáp ứng phổ phẳng, trơn và trực giao.

HÌnh 2.11 dưới đây minh hoạ dạng tổng quát của biến đổi DWT một chiều Theo đó tín hiệu đựoc cho đi qua các bộ lọc thông cao và thông thấp H và G mức 1 Biến đổi ngược thì thực hiện ngược lại: lấy mẫu lên (t ) của biến đổi Haar up sampling) hệ

số 2 rồi sử dụng các bộ lọc khôi phục H’, G’ (t ) của biến đổi Haar lý tưởng là H’ và G’ chính là

H, G)

Từ biến đổi DWT một chiều có thể mở rộng định nghĩa biến đổi DWT hai chiều theo cách: Sử dụng các bộ lọc riêng biệt, thực hiện biến đổi DWT một chiều dữ liệu vào (t ) của biến đổi Haar ảnh) theo hàng rồi thực hiện theo cột Theo cách này nếu thực hiện biến đổi DWT ở mức 1, sẽ tạo ra 4 nhóm hệ số biến đổi Quá trìnhbiến đổi DWT hai chiều có thể minh hoạ như hình 2.12 dưới đây, trong đó 4nhóm hệ số là: LL, HL, LH, HH (t ) của biến đổi Haar chữ cái đầu tiên tương ứng đã thực hiện lọc theo hang, chữ cái thứ hai tương ứng đã thực hiện lọc theo cột)

Trang 26

Hai thuật toán nén sử dụng DWT điển hình:

So với phép biến đổi DCT sử dụng trong chuẩn nén JPEG ra đời năm

1992, nén ảnh dựa trên biến đổi DWT đã có những cải tiến đáng kể Tuy nhiên cải tiến mang tính đột phá sử dụng DWT để nén ảnh bắt đầu là kỹ

thuật mã hoá – EZW (embedded zero-tree wavelet).

Thuật toán EZW dựa trên khả năng khai thác các thuộc tính đa phân giải củabiến đổi Wavelet để đưa ra một thuật toán ít phức tạp trong tính toán mà vẫncho hiệu quả nén cao Những cải tiến và nâng cấp của EZW về sau đã ra đời một số thuật toán tương tự như: SPIHT (t ) của biến đổi Haar set partitationing in hierarchical

tree-cây phân cấp phân tập) và ZTE (zero-tree entropy coding-mã hoá

entropy cây zero).

Gần đây còn có thêm một thuật toán nữa được đề xuất đó là LS (lifting

scheme) sử dụng để tạo các biến đổi Wavelet số nguyên Kỹ thuật này sử

dụng các bộ lọc Wavelet trực giao đem lại hiệu quả rất cao cho các ứng dụng nén ảnh có tổn hao Chúng ta sẽ trình bày 3 thuật toán điển hình này ở chương 3

2.5.TỔNG QUAN ÂM THANH SỐ

Âm thanh là một dạng lan truyền của sóng trong không gian, khi đến tai người nghe đập vào màng nhĩ, làm cho người đó cảm nhận được sự rung động này và có khả năng phân biệt được với các âm thanh khác dựa vào một

số đặc tính như tần số, nhịp điệu, mức áp lực

Mục đích của các hệ thống audio là: xử lý, tạo hiệu ứng, nén tín hiệu audio từ tín hiệu thu được từ nguồn Với hệ thống audio tương tự, việc xử lýtín hiệu gặp phải một số vấn đề như khả năng của linh kiện (t ) của biến đổi Haar về mặt tần số), lưu trữ, phức tạp…

Trang 27

Đối với các hệ thống audio số, việc thu nhận, hiệu chỉnh, và phát lại trở lên dễ dàng hơn rất nhiều Các kỹ thuật tổng hợp và nhận dạng phát triểnmột cách nhanh chóng, tương tác giữa máy tính và con người trở lên phong phú hơn.

Audio số là một chuỗi các giá trị số được biểu diễn bằng mức âm thanh theothời gian

2.5.1 Một số phương pháp mã hoá audio

Các phương pháp mã hoá chuyển đổi

FFT (Fast Fourier Tranform)

DFT (Discrete Fourier Transform)

DCT (Discrete Consine Transform)

Khôi phục đúng thông tin ban đầu khi giải nén

Cơ sở: loại bỏ dư thừa thống kê, các thông tin xuất hiện trong tín hiệu mà cóthể dự báo trước

Trang 28

Tỷ số nén thấp, khoảng 2:1, phụ thuộc vào mức độ phức tạp của tín hiệu nguồn.

Thường sử dụng kỹ thuật mã hoá dự đoán trong miền thời gian

(t ) của biến đổi Haar a) Thuật toán vi sai

(t ) của biến đổi Haar b) Mã hoá Entropy

tử luôn nằm dưới mức giá trị cần che.

- Mã hoá ghép: khai thác độ dư thừa trong hệ thống audio đa kênh với các thành phần số liệu trong các kênh giống nhau Mã hoá một phần số liệu chung trên một kênh và chỉ đinh cho bộ giải mã lặp lại tín hiệu đó trên các kênh còn lại.

Một số chuẩn nén audio:

MPEG1 :

Được phát triển trên cơ sở phối hợp chuẩn ISO/IEC 11172 Sử dụng tần số lấy mẫu của CD-DA, với fs=32;44.1;48khz, mã hoá 16 bit/mẫu tín hiệu Tốc độ bit 32 – 768 kbps/channel Các kiểu: Mono, dual-mono, dual-

Trang 29

stereo, joint-stereo Xác định các tham số khác nhau về tốc độ, dòng số sau khi nén, số mẫu header cho một kênh, cấu trúc thời gian khung, phương pháp mã hoá dự đoán và các chế độ làm việc.

Trang 30

Hình 2.11 Các mẫu trong MPEG-1

Trang 31

Hình 2.12 Sơ đồ khối MPEG layer III

Với mỗi băng con, xác định mức biên độ và mức nhiễu bằng mô hình tâm

sinh lý nghe SMR (signal-mask-rate) được sử dụng để xác định số bit cho

quá trình lượng tử hoá đối với mỗi băng con với mục đích giảm thiểu dung

lượng

Ví dụ: Sau khi phân tích, mức của 16 băng con đầu là:

Nếu mức của băng con thứ 2 là 60 thì nó che 12dB ở băng con thứ 7 và

15dB ở băng con thứ 9

Băng con 7 có 10dB<12dB:loại Băng con thứ 9 có mức 35dB>15dB: gửi đi

Trang 32

 chỉ có các mức lớn hơn che là được gửi đi thay vì dung 6 bit để mã hoá,

ta dùng 4 bit

MPEG-Layer I: Bộ lọc DCT 1 khung và tần số bằng phẳng trong mỗi băng con Mô hình tâm sinh lý nghe sử dụng che tần số

MPEG-Layer II: Có 3 khung trong bộ lọc (t ) của biến đổi Haar trước, hiện tại và kế), tổng

là 1125 mẫu Sử dụng vài bits để che thời gian

MPEG-Layer III: Sử dụng bộ lọc tới hạn để đáp ứng tốt hơn Mô hìnhtâm sinh lý nghe sử dụng che thời gian, che tần số, tính toán độ dư thừa stereo và mã hoá Hufman

MPEG2:

Mở rộng MPEG-1 cho các ứng dụng mới

- Có khả năng áp dụng nhiều tốc độ khác nhau, từ 32 đến 1066kbps

- Chất lượng âm thanh tuỳ thuộc ứng dụng

- Tần số lấy mẫu có thể giảm 1 nửa so với MPEG-1 (t ) của biến đổi Haar 16; 22,05; 24kHz)

- Khả năng đa kênh, tốc độ bits mở rộng có thể lên đến 1 Mbps cho các ứngdụng tốc độ cao

- Cho phép nén đồng thời nhiều kênh

- Hỗ trợ khả năng lồng tiếng, bình luận nhiều ngôn ngữ trong phần bits mởrộng

- MPEG-2 sử dụng mã hoá cường độ cao, giảm xuyên âm, mã hoá dự đoánliên kênh và mã hoá ảo ảnh kênh trung tâm để nhận được tốc độ bit kết hợp

384 kbps

- Khung MPEG-2 được chia thành 2 phần, phần đầu là MPEG-1stereo tươnghợp lớp I với tốc độ tối đa 448kbps, lớp II tốc độ tối đa 384kbps và lớp III tối đa 320kbps; phần mở rộng MPEG-2 chứa tất cả những dữ liệu surround khác

Trang 33

Hình 2.13 Chuẩn MPEG-2 mã hoá mono/stereo

Trang 34

H ình 2.14 Mã hoá và giải mã MPEG-2

AC 33 ((DOLBY DIIGIITAL)):

- Chuyển tải âm thanh đa kênh trong các ứng dụng như DVD-Video, DTV

và DBS

- Phát triển từ AC-1 và AC-2

- Mã hoá âm thanh từ 1 đến 6 kênh, thông thường cung cấp âm thanh 5.1 kênh: trái, phải, trung tâm, trái vòm, phải vòm và 1 kênh hiệu ứng tần số thấp

- 6 kênh yêu cầu 6x48kHzx18bits=5.184Mbps chưa nén có thể được mã hoá tối thiểu với tốc độ 384kbps (t ) của biến đổi Haar tỷ lệ 13:1).Tuy nhiên, AC-3 hỗ trợ tốc độ từ 32đến 640kbps

- Cung cấp khả năng tự chọn mức âm thanh cho thính giả

- Cho phép giảm dữ liệu bằng quá trình lượng tử biểu diễn trong miền tần sốcủa tín hiệu âm thanh

Trang 35

- Bộ mã hoá sử dụng băng lọc phân tích chuyển các mẫu PCM thành các hệ

số trong miền tần số Mỗi hệ số biểu diễn ký hiệu mũ nhị phân gồm phần mũnhị phân và phần định trị Các tập mũ nhị phân được mã hoá thô qua phổ tín hiệu và được xem như đường bao phổ Sử dụng phân phối bít xác định số bits cần mã hoá mỗi định trị Đường bao phổ và các định trị được lượng tử cho 6 khối âm thanh (t ) của biến đổi Haar 1536 mẫu âm thanh) được định dạng thành khung rồi chuyển đi

Trang 36

- Không hẳn dựa vào mô hình tâm sinh lý nghe, cũng không trực tiếp loại các thành phần không thích hợp trong tín hiệu audio, mà nó ngầm hiểu một

mô hình đáp ứng nghe bằng việc phân phối ít bit ở tần số cao

- Thuật toán hoàn toàn trong miền thời gian sử dụng mã hoá dự đoán tuyến tính trong các băng con

- Hoạt động với bất kỳ tần số lấy mẫu với ngõ ra 16 bits/từ mẫu

- Tín hiệu audio được chia thành 4 băng con với băng thông đều nhau sử dụng các bộ lọc QMF

- Tín hiệu được phân tích trong miền thời gian: sử dụng mã hoá dự đoán tuyến tính ADPCM để lượng tử mỗi băng theo nội dung và loại bỏ độ dư thừa trong các băng con

- Mã hoá sự khác biệt của mẫu hiện thời và mẫu trước

- Giải mã được tiến hành một cách ngược lại

Trang 37

CHƯƠNG 3:CƠ SỞ LÝ THUYẾT BIẾN ĐỔI

WAVELET

3.1.CƠ SỞ TOÁN HỌC

3.1.1 Biến đổi Wavelet liên tục

Biến đổi Wavelet liên tục (t ) của biến đổi Haar Continuous Wavelet Transform - CWT) của một t hàm f(t ) của biến đổi Haar t) được bắt đầu từ một hàm Wavelet mẹ (t ) của biến đổi Haar mother Wavelet) ψ (t ) của biến đổi Haar t ) Hàm Wavelet mẹ ψ(t ) của biến đổi Haar t ) có thể là bất kỳ một hàm số thực hoặc phức liên tục

nào thoả mãn các tính chất sau đây:

Tích phân suy rộng trên toàn bộ trục t của hàm ψ (t ) của biến đổi Haar t ) là bằng 0 Tức là:

) 1 3 (t ) của biến đổi Haar 0 ) (t ) của biến đổi Haar

Tích phân năng lượng của hàm trên toàn bộ trục t là một số hữu hạn, tức là:

) 2 3 (t ) của biến đổi Haar 0 )

(t ) của biến đổi Haar 2

Điều kiện (t ) của biến đổi Haar 3.2) có nghĩa là hàm ψ (t ) của biến đổi Haar t ) phải là một hàm bình phương khả tích nghĩa là hàm ψ (t ) của biến đổi Haar t ) thuộc không gian L2 (t ) của biến đổi Haar R) các hàm bình phương khả tích Sau khi hàm Wavelet ψ (t ) của biến đổi Haar t ) được lựa chọn, biến đổi Wavelet liên tục của một hàm bình phương khả tích f (t ) của biến đổi Haar t ) được tính theo công thức:

) 3 3 (t ) của biến đổi Haar a

1 f(t ) của biến đổi Haar t) b)

a b t

t

chúng ta có thể viết được:

Trang 38

) 5 3 (t ) của biến đổi Haar ) (t ) của biến đổi Haar ) (t ) của biến đổi Haar b)

W(t ) của biến đổi Haar a, f t ,b t dt

Theo toán học ta gọi đây là tích vô hướng của hai hàm f (t ) của biến đổi Haar t ) và ψa,b (t ) của biến đổi Haar t)

hàm ψa,b(t ) của biến đổi Haar t) sẽ độc lập với a và b :

) 6 3 (t ) của biến đổi Haar )

(t ) của biến đổi Haar )

(t ) của biến đổi Haar 2 2

Với mỗi giá trị của a thì ψa,b(t ) của biến đổi Haar t) là một bản sao của ψa,b(t ) của biến đổi Haar t) được dịch đi b đơn

vị trên trục thời gian Do đó b được gọi là tham số dịch.

Đặt tham số dịch b = 0 ta thu được:

) 7 3 (t ) của biến đổi Haar 1

t

điều đó cho thấy rằng a là tham số tỷ lệ.

Khi a >1 thì hàm Wavelet sẽ được trải rộng còn khi 0< a <1 thì hàm sẽ được

co lại Sau đây chúng ta sẽ định nghĩa phép biến đổi ngược của biến đổi Wavelet liên tục Gọi Ψ (t ) của biến đổi Haar ω ) là biến đổi Fourier của ψ(t ) của biến đổi Haar t):

) 8 3 (t ) của biến đổi Haar )

(t ) của biến đổi Haar )

(t ) của biến đổi Haar t e j t dt

Nếu W(t ) của biến đổi Haar a,b) là biến đổi CWT của f (t ) của biến đổi Haar t ) bằng hàm Wavelet ψ (t ) của biến đổi Haar t ) , thì biến đổi

ngược của biến đổi CWT sẽ được tính như sau:

) 9 3 (t ) của biến đổi Haar )

(t ) của biến đổi Haar b) W(t ) của biến đổi Haar a, 1 1

)

a C t

(t ) của biến đổi Haar 2

Trang 39

đây là điều kiện thứ 3 mà một hàm cần phải thoả mãn để có thể được lựa

chọn làm hàm Wavelet Chúng ta có thể xem biến đổi CWT như là một ma trận hai chiều các kết quả của phép tính tích vô hướng giữa hai hàm f(t) và

ψa,b(t ) của biến đổi Haar t) Các hàng của ma trận tương ứng với các giá trị của a và các cột tương ứng với các giá trị của b do cách tính biến đổi Wavelet theo tích vô

hướng đã trình bày ở trên:

) 11 3 (t ) của biến đổi Haar ) (t ) của biến đổi Haar ) (t ) của biến đổi Haar )

(t ) của biến đổi Haar ) (t ) của biến đổi Haar )

(t ) của biến đổi Haar ) (t ) của biến đổi Haar )

(t ) của biến đổi Haar

3.1.2 Biến đổi Wavelet rời rạc

Việc tính toán các hệ số Wavelet tại tất cả các tỉ lệ là một công việc

hết sức phức tạp Nếu tính toán như vậy sẽ tạo ra một lượng dữ liệu khổng

lồ Để giảm thiểu công việc tính toán người ta chỉ chọn ra một tập nhỏ các giá trị tỉ lệ và các vị trí để tiến hành tính toán Hơn nữa nếu việc tính toán

được tiến hành tại các tỷ lệ và các vị trí trên cơ sở luỹ thừa cơ số 2 thì kết

quả thu được sẽ hiệu quả và chính xác hơn rất nhiều Quá trình chọn các tỷ

lệ và các vị trí để tính toán như trên tạo thành lưới nhị tố (t ) của biến đổi Haar dyadic) Một phân tích như trên hoàn toàn có thể thực hiện được nhờ biến đổi Wavelet rời rạc (t ) của biến đổi Haar DWT) Do đó, việc tính toán biến đổi DWT thực chất là sự rời rạc hoá biến đổi Wavelet liên tục (CWT); việc rời rạc hoá được thực hiện với sự lựa chọn các hệ số a và b như sau:

a 2m;b 2m n; m,n Z (t ) của biến đổi Haar 3 12 )

Việc tính toán hệ số của biến đổi Wavelet có thể dễ dàng thực hiện bằng các

băng lọc số nhiều nhịp đa kênh, một lý thuyết rất quen thuộc trong xử lý tín

hiệu

Ngày đăng: 20/12/2017, 12:11

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w