1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phương pháp mã hóa các dải tần con và ứng dụng

20 580 6

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 20
Dung lượng 1,33 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Hiệu ứng che ở tai người là khác nhau trên từng thành phần tần số, bì thế ta cần chia tín hiệu âm thanh thành các thành phần tần số con dải băng con rồi xác định bị che và không bị che c

Trang 1

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

──────── * ────────

BÁO CÁO

XỬ LÝ DỮ LIỆU TRUYỀN THÔNG ĐA

PHƯƠNG TIỆN

ĐỀ TÀI: “PHƯƠNG PHÁP MÃ HÓA CÁC DẢI TẦN

CON VÀ ÁP DỤNG”

Giảng viên hướng dẫn:

PGS.TS Nguyễn Thị Hoàng Lan

Sinh viên thực hiện:

Lê Thị Kim Anh 20121198 Bùi Tuấn Ánh 20121247 Nguyễn Thành Lợi 20114633 Thái Thị Lộc 20122020

Hà Nội, tháng 05 năm 2016

Trang 2

PHÂN CÔNG CÔNG VIỆC

- Tìm hiểu chung và giải thích sơ đồ

nguyên tắc mã hóa các dải tần con SBC

Thái Thị Lộc

- Tìm hiểu và so sánh sơ đồ phân tách các

dải tần con trong nén ảnh JPEG-2000 và

sơ đồ phân tách các dải tần con trong mã

hóa MP3

Lê Thị Kim Anh Nguyễn Thành Lợi

- Thuật toán xử lý dữ liệu thực hiện sơ đồ

phân tách các dải tần con trong nén ảnh

JPEG-2000 và cài đặt thử nghiệm thuật

toán

Bùi Tuấn Ánh

Trang 3

MỤC LỤC

I TÌM HIỂU CHUNG PHƯƠNG PHÁP MÃ HÓA CÁC DẢI TẦN CON SBC 4

1 Nguyên tắc chung của phương pháp mã hóa các dải tần con SBC 4

1.1 Kỹ thuật băng lọc thông thấp – thông cao 5

1.2 Kỹ thuật băng lọc thông dải 6

2 Quá trình mã hóa các dải tần con 7

II TÌM HIỂU VÀ SO SÁNH SƠ ĐỒ PHÂN TÁCH CÁC DẢI TẦN CON TRONG NÉN ẢNH JPEG-2000 VÀ SƠ ĐỒ PHÂN TÁCH CÁC DẢI TẦN CON TRONG MÃ HÓA MP3 8

1 Sơ đồ subband trong JPEG-2000 8

2 Sơ đồ subband trong mã hóa MP3 9

3 So sánh 12

III Thuật toán xử lý dữ liệu thực hiện sơ đồ phân tách các dải tần con trong nén ảnh JPEG-2000 và cài đặt thử nghiệm thuật toán 14

1 Sơ đồ phân tách giải tần của ảnh 14

2 Thuật toán subband coding theo FlowChart (FowChart diagram) 16

3 Sơ đồ Giải mã subband trong jpeg2000 17

4 Thuật toán giải mã subband coding Jpeg2000 theo FlowChart (FlowChart diagram) 18

5 Cài đặt thử nghiệm và nhận xét 19

Trang 4

I TÌM HIỂU CHUNG PHƯƠNG PHÁP MÃ HÓA CÁC DẢI TẦN CON SBC

1 Nguyên tắc chung của phương pháp mã hóa các dải tần con SBC

Hiện nay có nhiều phương pháp mã hóa nén tín hiệu âm thanh, hình ảnh dựa trên phân bố của tín hiệu theo một dạng nào đây Ví dụ như đối với tín hiệu có biên

độ cụm, người ta hay sử dụng lượng tử hóa vecto; đối với tín hiệu lấy mẫu có độ tương quan mạnh, có biên độ chênh lệch nhau không lớn, người ta sử dụng mã hóa

dự đoán DPCM Tuy nhiên dạng phân bố tín hiệu là hoàn toàn ngẫu nhiên, do đó khó có thể chọn được một phương pháp mã hóa nén tối ưu cho toàn bộ tín hiệu Vì vậy, người ta đưa ra ý tưởng chia tín hiệu ra làm nhiều phần nhỏ, mã hóa riêng từng phần để đạt được hiệu quả nén cao nhất

Mặt khác, đối với âm thanh, thực nghiệm cho thấy tai người thường nhạy cảm với mọt khoảng tần số, nhưng một khi tín hiệu đủ lớn ở một tần số nào đó, tai sẽ không nghe thấy tín hiệu yếu hơn ở tần số gần đó, có thẻ bởi vì hiệu ứng che tần số, che thời gian, Để có thể tiết kiệm dữ liệu bằng cách loại đi các thành phần tín hiệu

bị che, chúng ta chỉ mã hóa các thành phần nghe được Hiệu ứng che ở tai người là khác nhau trên từng thành phần tần số, bì thế ta cần chia tín hiệu âm thanh thành các thành phần tần số con (dải băng con) rồi xác định bị che và không bị che của tín hiệu trong từng dải tần số để xử lý

Từ đó, các nhà khoa học tại Bell Labs đã cho ra đời phương pháp mã hóa các dải tần con SBC vào năm 1980 Ý tưởng cơ bản của mã hóa SBC là để tiết kiệm dữ liệu bằng cách loại bỏ các thông tin về tần số bị che (với tín hiệu âm thanh) hoặc thông tin dư thừa, không quan trọng (với tín hiệu hình ảnh) Các thông tin bị loại bỏ được lựa chọn một cách cẩn thận sao cho con người không cảm nhận được sự khác biệt này Mã hóa SBC chia tín hiệu gốc thành các thành phần tín hiệu thuộc dải tần

Trang 5

con bằng kỹ thuật lọc số đẻ xử lý và sau đó mã hóa riêng biệt từng thành phần cho phép đạt hệu quả nén tốt nhất Việc nhận tín hiệu, giải mã và khôi phục tín hiệu ban đầu được thực hiện theo trình tự ngược lại Các dải băng con không chồng chập lên nhau (mà thực chất là liền kề nhau), vì vậy tín hiệu thu được ở các dải tần được giải tương quan, nhờ đó có thể mã hoá riêng biệt mà vẫn khôi phục được thành tín hiệu ban đầu

Mã hoá SBC được ứng dụng rộng rãi trong nén dữ liệu audio (MP3) hình ảnh (JPEG-2000), video

Trường hợp 1D discrete signal

Xét sơ đồ nguyên lý của phương pháp mã hóa dải tần con SBC trong trường hợp tín hiệu 1 chiều rời rạc (1D discrete signal)

Biểu diễn mô hình lọc trên miền số phức:

X’(z) = 1/2Go(z)[Ho(z)X(z) + Ho(-z)X(-z)] + 1/2G1(z)[H1(z)X(z) + H1(-z)X(-z)] = ½[Go(z)Ho(z) + G1(z)H1(z)]X(z) + ½[Go(z)Ho(-z) + G1(z)H1(-z)]X(-z)

Đầu vào là tín hiệu cần mã hóa X[n] được phân tích thành 2 thành phần đi qua bộ lọc thông thấp (H0) và thông cao (H1) Tại đây tần số của tín hiệu được giảm tần số lấy mẫu đi 2 lần (down-sampling), khi đó chu kỳ (T) của tín hiệu sẽ tăng 2 lần và số

mẫu sẽ giảm theo Ta thu được các dải tần con (subband) Sau khi thu được các subband, thực hiện mã hóa riêng cho các dải tần

Hiệu năng của giải pháp nén được đánh giá qua:

Tỉ số nén: phụ thuộc vào cả quá trình subband và coding

Độ tổn hao phụ thuộc vào lượng tử hóa Q

Một số kỹ thuật phân tách các dải tần con như kỹ thuật băng lọc thông thấp – thông cao, kỹ thuật băng lọc thông dải,

1.1 Kỹ thuật băng lọc thông thấp – thông cao

Kỹ thuật này thường được dùng trong mã hóa nén ảnh, video, âm thanh thoại

Trang 6

Việc chia bao nhiêu dải tần tùy thuộc vào ứng dụng và nhu cầu của người sử dụng

1.2 Kỹ thuật băng lọc thông dải

Kĩ thuật này thường được dùng trong mã hóa nén âm thanh

Hệ thống phân tách M dải tần con dùng M bộ lọc thông dải đồng thời, tần số lấy mẫu giảm M lần Số kênh M càng lớn độ phân giải tần số càng cao Do đó, hệ số nén tín hiệu sẽ tăng theo số kênh Tuy nhiên, số kênh càng lớn, số bộ lọc càng nhiều, việc thiết kế bộ lọc càng phức tạp Hiện nay, SBC đã ứng dụng trong xử lý âm thanh

số với số kênh là 32 (MPEG/audio), 4 kênh (APT-X),

Trang 7

2 Quá trình mã hóa các dải tần con

Quá trình mã hóa SBC bao gồm 2 giai đoạn: subband và quantization and coding

 Giai đoạn subband được thực hiện như sau:

- Lọc phân tích: tín hiệu được đưa qua các bộ lọc nhằm chia tín hiệu thành các thành phần tín hiệu ứng với các dải tần con không chồng nhau

- Tín hiệu của các dải tần được giảm tần số lấy mẫu đi M lần (M là số dải tần chia tín hiệu) Việc giảm tần số lấy mẫu làm phổ rộng ra, trải hết trục tần số Số mẫu lúc này cũng giảm theo Giảm tần số lấy mẫu được thực hiện theo định lý lấy mẫu Nyquist và hệ quả của định lý Nyquist

Tỷ lệ giảm tần số lấy mẫu phụ thuộc vào tỷ lệ giữa dải thông của bộ lọc với dải tần tín hiệu vào

 Giai đoạn lượng tử hóa và mã hóa (Quantization and coding):

- Thực hiện lượng tử hóa và mã hóa riêng trên từng dải tần số Việc lựa chọn phương pháp lượng tử hóa và mã hóa, thực hiện và phân phối bit dựa trên tính chất của dòng tín hiệu sau bộ lọc Đây là bước mang lại hiệu quả nén cho toàn bộ quá trình mã hóa SBC

Phân phối bit là việc cấp phát số bit nhất định tùy theo năng lượng tín hiệu của mỗi dải tần con Năng lượng tín hiệu tỷ lệ với lượng thông tin của mỗi dải tần nên năng lượng càng lớn thì số bit mã hóa càng lớn để cho tỷ lệ nén tín hiệu cao nhất

có thể Cụ thể, những dải tần con có năng lượng lớn và tập trung sẽ được mã hóa với

số lượng bit lớn Ngược lại với những dải tần con có năng lượng thấp được mã hóa với số lượng bit thấp hơn Do đó, có thể tiết kiệm được số bit cần truyện hoặc lưu trữ Phân phối bit ảnh hưởng lớ đến khôi phục dữ liệu sau quá trình gửi nhận dữ liệu

Trong quá trình giải mã, thực hiện theo trình tự ngược lại:

Trang 8

- Tín hiệu nhận được được phân kênh về các bộ xử lý với các dải tần tương ứng

- Giải mã tín hiệu, sử dụng các hệ số của quá trình lượng tử hoá và mã hoá ở trước

- Tăng tần số lấy mẫu lên M lần

- Đi qua các bộ lọc để tín hiệu có xung giống như lúc sau khi đi qua bộ lọc phần mã hoá

- Ghép các tín hiệu lại thành tín hiệu ban đầu

II TÌM HIỂU VÀ SO SÁNH SƠ ĐỒ PHÂN TÁCH CÁC DẢI TẦN CON TRONG NÉN ẢNH JPEG-2000 VÀ SƠ ĐỒ PHÂN TÁCH CÁC DẢI TẦN CON TRONG MÃ HÓA MP3

Tư tưởng chung của hai phương pháp subband trong nén JPEG-2000 và nén MP3 là chia tín hiệu gốc thành các thành phần tín hiệu thuộc các dải tần (subband)

để xử lý và mã hóa riêng biệt từng thành phần nhằm tăng hiệu quả nén tuy nhiên do bản chất vật lý của ảnh và âm thanh khác nhau và cách con người cảm nhận về ảnh

và âm thanh khác nhau , nên ta áp dụng các chia tín hiệu cho 2 chuẩn nén trên là khác nhau nhằm đạt được hiệu quả nén cao nhất

Do dữ liệu ảnh bao gồm 2 thành phần riêng biệt : thành phần thô chứa phần lớn

dữ liệu ảnh thường nằm ở thành phần tần số thấp và thành phần biên chứa thông tin

về đường nét ảnh thường nằm ở thành phần tần số cao vì vậy Trong nén ảnh

JPEG-2000, sơ đồ subband được sử dụng là sơ đồ kỹ thuật bang lọc thông thấp thông cao:

1 Sơ đồ subband trong JPEG-2000

Đầu vào của sơ đồ là tín hiệu gốc ban đầu được cho qua 2 bộ lọc thông thấp- thông cao, sau quá trình này sẽ thu được 2 dải tần con tương ứng với hai bộ lọc, tín hiệu tương ứng hai dải tần con này sẽ được lấy xuống 2 lần Quá trình này sẽ được

Trang 9

tiếp tục với hai băng tần con này, tùy thuộc vào ứng dụng mà người thiết kế có thể

sử dụng bao nhiêu bang lọc

Kỹ thuật xử lý đa phân giải được áp dụng trong sơ đồ: trong sơ đồ này , quá trình subsampling hay còn gọi là giảm tần số lấy mẫu đi 2 lần chính là quá trình xử lý đa phân giải việc giảm tần số mẫu chính là giảm độ phân giải , tùy thuộc vào số lượng bang lọc mà có thể xác định các độ phân giải khác nhau

2 Sơ đồ subband trong mã hóa MP3

Do khác với tín hiệu ảnh với các miền tần số cao và tần số thấp được phân chia

rõ ràng với miền tần số cao là các cạnh và đường nét, miền tần số thấp là các vùng ảnh và sau khi đi qua bang lọc ta lại loại bỏ phần đi (Low-High và High-High) thì tín hiệu âm thanh không thể phân chia rõ ràng như vậy Các âm thanh ở cả miền tần

số thấp và cap với tín hiệu âm thanh đều có thể bị loại bỏ nếu có mức năng lượng nhỏ hơn ngưỡng che Các âm thanh có tần số cao hoàn toàn có thể là nội dung tín hiệu nếu có năng lượng lớn

Hiện tượng che :là hiện tượng khi một hoặc một số âm thanh tuy tồn tại được

trong không gian (vẫn nằm trong tần số mà con người cảm nhận được) nhưng tai ta khong nghe thấy do 1 số lý do nhất định (biên độ nhỏ hoặc bị âm thanh khác lấn át) hiện tượng này được gọi là che hoàn toàn.một trường hợp khác của hiệu ứng che là che một phần khi đó âm thanh bị che không biến mất hoàn toàn mà vẫn có thể cảm nhận được, tuy nhiên với một biên độ thấp hơn (âm thanh trở nên bé hơn) Các giá trị của hiệu ứng che chủ yếu được xác định dựa trên thực nghiệm và giá trị không giống nhau đối với từng người có những hiệu ứng che là:

- Che về mặt tần số:

Hiện tượng che đối với các âm thanh thanh phức tạp của nhiều âm thanh đơn lẻ không chỉ là sự hợp nhất kết quả trên từng âm thanh đơn lẻ mà còn là kết quả của tổng cũng như sự chênh lệch của những âm thanh đó

Cơ quan thính giác của con người có khả năng hoạt động như một thiết bị phân tích phổ và nó có thể phân tách những tần số trong tin hiệu âm thanh sử dụng một ngưỡng

Trang 10

lọc gọi là lọc nghe được Độ rộng của bộ lọc này là thay đổi tùy thuộc vào tần số của

âm thanh đến Trong những công trình của mình, Fletcher đã chỉ ra rằng ngưỡng che phủ của một giai điệu là tỉ lệ thuận với cả băng thông của nhiếu che, tuy nhiên khi tín hiệu che đạt đến một độ rộng nhất định thì tác dụng che phủ của nó không tăng thêm nữa Điều này cho phép đặt ra giả thuyết rằng mỗi bộ lọc nghe được có một vùng găng xác định.Fletcher định nghĩa vùng găng như là tỉ lệ giữa cường độ của tín hiệu và cường độ của nhiễu, thể hiện bằng độ chênh lệch tính bằng dB giữa tín hiệu

âm thanh và tín hiệu che

- Che về mặt thời gian :

Với hiện tượng che về mặt tần số hai âm thanh cùng xuất hiện đồng thời thì hiện tượng che về mặt thời gian hai âm thanh che và bị che có thể xuất hiện ở các thời điểm khác nhau

Che thuận: Tín hiệu che xuất hiện trước tín hiệu bị che Với hiện tượng che

thuận khi âm thanh che có cường độ lớn xuất hiện thì sau đó một lúc tai ta mới có thể nghe được âm thanh khác Nếu âm thanh bị che xuất hiện trong khoảng thời gian này thì ta không thể nghe thấy được Đây là dạng thuồng thấy của hiện tượng che về mặt thời gian Hiện tượng này xuất hiện khi khoảng cách giữa 2 tín hiệu che và bị che là nhỏ hơn 200 ms

Che ngược: Tín hiệu che xuất hiện sau tín hiệu bị che Đây là hiện tượng âm

thanh che sẽ che mất phần cuối của âm thanh trước đó được phát ra Hiện tượng này

ít xảy ra hơn và ngược chỉ có thể xảy ra khi mức độ của tín hiệu che cao hơn tương đối nhiều so với mức độ của tín hiệu âm thanh bị che phủ và khoảng cách thời gian giữa 2 tín hiệu này nhỏ hơn 25ms Mặc dù tín hiệu âm thanh tới tai trước nhưng do não bộ lại xủa lý tín hiệu che (có độ ồn cao) trước nên hiện tượng che ngược xuất hiện

Trang 11

Sơ đồ nén audio theo chuẩn MP3 :

Quá trình chia tín hiệu nguồn thành các tín hiệu trên các dải tần con nằm ở khối Analysis Filterbank :

Sử dụng băng lọc thông dải có 32 bộ lọc với đáp ứng tần số khác nhau chia tín hiệu đầu vào thành 32 subband , tín hiệu của các tần số lấy mẫu được giảm đi 32 lần, việc phân chia bang con là lợi dụng đặc điểm độ nhạy của tai đối với các thành phần tần

số khác nhau, tín hiệu ban đầu sẽ đưa vào các bộ lọc cùng một lúc

Sơ đồ mô phỏng băng lọc được sử dụng trong khối Analysis Filterbanks :

Trang 12

Tín hiệu nguồn là: tín hiệu audio PCM, 1 chuỗi 1152 mẫu PCM được lọc bởi băng lọc song song cách đều chứa 32subband, mỗi subband lại chứa 36 mẫu subband

Trong nén MP3 sau khi tín hiệu nguồn được chia thành các tín hiệu trên các dải tần con khác nhau bởi băng lọc thì nó sẽ được ánh xạ vào một MDCT, trước khi quá trình biến đổitrong MDCT xảy ra các subband sẽ được áp dụng một loại cửa sổ, cửa sổ dài hay ngắn được áp dụng tùy thuộc vào mỗi subband và quyết định chọn cửa sổ nào đc áp dụng phụ thuộc vào khối Masking Thresholds

Với mỗi subband đc áp dụng cửa sổ dài sau khi qua MDCT sẽ sản sinh ra 18 dòng tần số Và các subband đc áp dụng cửa sổ ngắn sẽ sinh ra thêm 3 nhóm của 6 tần số

Do có sự chồng cửa sổ lên nhau 50% nên kích thước cửa sổ là 36 mẫu cho khối dài

và 12 mẫu cho khối ngắn

 Như vậy sẽ tạo ra 576 dòng tần số sau khi đi qua khối MDCT Cửa sổ dài đc áp dụng nhằm tăng cường độ phân giải phổ được đưa ra bởi MDCT Cửa sổ ngắn: chứa 3 cửa sổ ngắn gối lên nhau có tác dụng tăng cường độ phân giải thời gian được đưa ra bởi MDCT

3 So sánh

- Trong nén MP3, băng lọc được sử dụng là bang lọc thông dải gồm 32 bộ loc

có đáp ứng tần số khác nhau, còn trong JPEG-2000 sử dụng bộ lọc thông thấp thông cao

- Subban trong nén MP3 dựa trên hiệu ứng che, nén ảnh JPEG-2000 chia tín hiệu dựa trên phân bố năng lượng

Trang 13

- Nén ảnh loại bỏ các thành phần tần số chứa ít thông tin ngay sau qúa trình lọc, còn nén âm thanh trong MP3 loại bỏ thành phần tần số dựa theo ngướng nghe

- Trong nén MP3 tín hiệu đầu vào sẽ đưa vào băng lọc cùng một lúc, trong JPEG-2000 tín hiệu được đưa qua nhiều tầng bộ lọc với tín hiệu đầu ra của bộ lọc tầng trên là đầu vào của bộ lọc tầng dưới

- Trong nén MP3 tín hiệu được chia thành các dải tần có độ rộng đều nhau, và bằng 1/32 tín hiệu ban đầu , trong JPEG-2000 tạo ra các dải tần không đều nhau, độ rộng của từng dải tần và mức độ down sampling của từng nhánh phụ thuộc vào độ sâu của nhánh trên

Ngày đăng: 08/06/2016, 23:55

HÌNH ẢNH LIÊN QUAN

Sơ đồ phân tách các dải tần con trong mã - Phương pháp mã hóa các dải tần con và ứng dụng
Sơ đồ ph ân tách các dải tần con trong mã (Trang 2)
Mã hoá SBC được ứng dụng rộng rãi trong nén dữ liệu audio (MP3) hình ảnh  (JPEG-2000), video - Phương pháp mã hóa các dải tần con và ứng dụng
ho á SBC được ứng dụng rộng rãi trong nén dữ liệu audio (MP3) hình ảnh (JPEG-2000), video (Trang 5)
2000, sơ đồ subband được sử dụng là sơ đồ kỹ thuật bang lọc thông thấp thông cao: - Phương pháp mã hóa các dải tần con và ứng dụng
2000 sơ đồ subband được sử dụng là sơ đồ kỹ thuật bang lọc thông thấp thông cao: (Trang 8)
Sơ đồ nén audio theo chuẩn  MP3 : - Phương pháp mã hóa các dải tần con và ứng dụng
Sơ đồ n én audio theo chuẩn MP3 : (Trang 11)
Sơ đồ mô phỏng băng lọc được sử dụng trong khối Analysis Filterbanks : - Phương pháp mã hóa các dải tần con và ứng dụng
Sơ đồ m ô phỏng băng lọc được sử dụng trong khối Analysis Filterbanks : (Trang 11)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w