Bộ lọc Bộ lấy mẫu Bộ biến đổi A/D Bộ mã hóa nguồn Bộ mã hóa kênh Nguồn thoại * Ý tưởng cơ bản của mã hóa âm thanh cảm nhận: - Dựa vào mô hình tâm lí thính giác để được ngưỡng nghe và mặt
Trang 1Bộ lọc Bộ lấy mẫu Bộ biến đổi A/D Bộ mã hóa nguồn Bộ mã hóa kênh Nguồn thoại
* Ý tưởng cơ bản của mã hóa âm thanh cảm nhận:
- Dựa vào mô hình tâm lí thính giác để được ngưỡng nghe và mặt nạ -vùng được bảo vệ 26db ,MNR = 26 không ảnh hưởng đến âm
Băng không cần mã hóa ,không cần bit
+ SMR mà âm được bảo về hoàn toàn (chỉ mã hóa cái nào trên vùng bảo
vệ )
Bài 2.2:
a, Phân tích sơ đồ khối của hệ thống mã hóa thoại:
Sơ đồ khối hệ thống mã hóa thoạiTín hiệu thoại tương tự và liên tục theo thời gian từ một nguồn đã cho(chưa nén) được số hóa thông qua bộc lọc (loại bỏ băng tần thừa ở tần số cao),
bộ lấy mẫu(biến đổi thành tín hiệu rời rạc theo thời gian) và bộ biến đổitương tự/số (lượng tử hóa) và sau đó được mã hóa (nén) Đó là quá trình
Trang 2mã hóa nguồn Tín hiệu đã được mã hóa nguồn sau đó được tiếp tục mã hóa
để thêm khả năng chống lỗi (mã hóa kênh) và độ ưu tiên để truyền dẫn quakênh
Tại đầu thu, một bộ giải mã kênh sẽ tách và sửa những lỗi trong quá trình truyền dẫn và một bộ giải mã nguồn sẽ giải nén tín hiệu Tín hiệu đã được giải nén có thể giống hệt như tín hiệu ban đầu (nén không tổn thất) hoặc nócũng có thể bị méo hoặc suy biến theo một vài cách nào đó(nén có tổn thất)
Trang 3 Trong miền tần số: mã hoá băng con SBC (subband coding) và
mã hoá biến đổi thích nghi ATC (Adaptive Transform Coding).
Mã hóa 64 Kbít PCM (ITU G 711)
Các bộ mã hóa điều chế xung mã PCM là bộ mã hóa dạng sóng đơngiản nhất Thoại băng hẹp được lấy mẫu với tần số 8000 Hz và mỗi mộtmẫu thoại phải được lượng tử hoá Nếu lượng tử hoá tuyến tính được sửdụng thì cần thiết phải dùng 12 bit mã hóa cho một mẫu và dẫn đến tốc độbit là 96 Kbit/s Tuy nhiên, tốc độ này có thể được giảm xuống một cách
dễ dàng bằng cách sử dụng lượng tử hoá phi tuyến tính
Trong việc mã thoại người ta thấy rằng với việc lượng tử hoá phituyến, 8 bit mã hóa cho một xung mẫu là đủ đảm bảo chất lượng thoại vàgần như khó mà phân biệt được so với thoại gốc ban đầu Điều này dẫnđến tốc độ bit chuẩn là 64 Kbit/s và hai loại bộ mã hóa phi tuyến PCM đãtrở thành tiêu chuẩn vào những năm 60 của thế kỷ 20
Ở Bắc Mỹ, người ta dùng mã hóa theo luật µ, trong khi đó ở Châu
Âu, mã hóa theo luật A được áp dụng Do tính đơn giản, chất lượng thoại
đảm bảo và độ trễ thấp, cả hai loại mã hóa PCM này vẫn được sử dụngrộng rãi cho đến ngày nay
Một kỹ thuật được sử dụng phổ biến trong việc mã thoại là cố gắng
dự đoán giá trị của mẫu tiếp theo từ những mẫu trước đó Điều này có thểkhả thi bởi có sự tương quan hiện tại giữa những mẫu thoại dưới tác dụngcủa cơ quan phát âm và sự rung động của dây thanh âm như đã được giớithiệu ở 2.2.1
Nếu dự đoán có hiệu quả, thì tín hiệu sai lệch giữa những mẫu đã dựđoán và những mẫu thoại thực sẽ có một sự khác biệt thấp hơn so với giữacác mẫu thoại nguyên gốc Bởi vậy, chúng ta có thể lượng tử hoá nhữngtín hiệu sai lệch này với một số lượng bit ít hơn so với tín hiệu mẫu thoạigốc Đây là cơ sở của những mô hình điều chế xung mã vi sai – DPCM(Differential Pulse Code Modulation)- chúng lượng tử hoá sự khác biệtgiữa những tín hiệu gốc và tín hiệu dự đoán
Kết quả từ những bộ mã hoá như vậy có thể được cải thiện nếu bộ dựđoán và bộ lượng tử có sự tương thích sao cho chúng thay đổi phù hợp vớicác đặc tính của thoại được mã hoá Điều này dẫn tới kỹ thuật điều chế
Trang 4xung mã vi sai thích ứng – ADPCM (Adaptive Differential Pulse CodeModulation) Vào giữa những năm 1980, CCITT đã chuẩn hoá bộ mã hóaADPCM hoạt động ở tốc độ 32Kbps với chất lượng thoại tương đương vớiphương pháp điều chế mã xung 64Kbps Sau đó, các bộ mã hóa ADPCMhoạt động ở các tốc độ 16, 24 và 40Kbps cũng đã được chuẩn hóa Sơ đồ
bộ mã hóa và giải mã ADPCM được minh họa ở hình 2.12
Hình 2.1: Bộ mã hóa và giải mã ADPCM
Mã hóa ADPCM (ITUG.721, G.726, G.727)
Bộ mã hóa điều chế xung mã vi sai thích nghi (ADPCM) là bộ mãhóa dạng sóng thay vì lượng tử hoá trực tiếp tín hiệu thoại, giống nhưphương pháp PCM, nó lượng tử hóa sự khác nhau giữa tín hiệu thoại và tínhiệu dự đoán
Nếu sự dự đoán là chính xác thì sự khác nhau giữa các mẫu thật vàmẫu dự đoán sẽ nhỏ hơn, ít khác biệt hơn so với giữa các mẫu thoại thực,
và sự khác biệt này nếu được lượng tử hoá chính xác thì sẽ cần số bit íthơn so với việc phải lượng tử hoá các mẫu thoại gốc
Tại bộ giải mã, tín hiệu khác biệt mà đã được lượng tử hóa đượccộng với tín hiệu dự đoán để khôi phục lại tín hiệu thoại ban đầu Hiệunăng của bộ mã hóa được cải thiện thông qua việc sử dụng bộ dự đoán vàlượng tử thích nghi sao cho bộ dự đoán và bộ lượng tử phải thích ứng vớinhững đặc tính thay đổi của thoại đang được mã hoá
Trang 5Vào giữa những năm 1980, CCITT đã chuẩn hoá ADPCM 32Kbpsđược biết đến với cái tên G721, cho phép khôi phục thoại tốt như phươngpháp PCM 64 Kbps Các khuyến nghị sau đó: các bộ mã hóa G726 vàG727 hoạt động ở các tốc độ 40, 32, 24 và 16 Kbps cũng đã được chuẩnhoá.
Các bộ mã hóa dạng sóng được mô tả ở trên đều mã hóa thoại hoàntoàn trong miền thời gian Tuy nhiên, các tiếp cận theo miền tần số cũng
có thể thực hiện được và có một số ưu điểm Ví dụ như ở trong mã hóabăng con - SBC (Sub – Band Coding), tín hiệu thoại đầu vào được phânchia thành một số dải băng tần thoại gọi là các băng con thông qua các bộlọc số và sau đó mỗi một băng con được mã hóa độc lập bằng việc sử dụngcác bộ mã hóa như ADPCM Ở đây, các băng con tương ứng với phổ tần
số thấp chứa hầu hết năng lượng của tín hiệu thoại sẽ được cấp phát với sốbit mã hóa lớn, còn các băng con tương ứng với các phổ tần số cao, chứa ítnăng lượng tín hiệu sẽ được mã hóa với số bit nhỏ hơn Kết quả là tổng sốbit dùng cho mã hóa băng con sẽ ít hơn so với trường hợp mã hóa trên toàndải phổ của tín hiệu Tại phía thu, các tín hiệu băng con được giải mã vàkết hợp lại để khôi phục lại tín hiệu thoại ban đầu (G 722 1988)
Ưu điểm của mã hóa băng con là nhiễu trong mỗi băng con chỉ phụthuộc vào mã hóa sử dụng trong băng con đó Bởi vậy chúng ta có thể cấpphát nhiều bit hơn cho các băng con quan trọng sao cho nhiễu trong nhữngvùng tần số này là thấp, trong khi đó ở các băng con khác, chúng ta có thểcho phép có nhiễu mã hóa cao vì nhiễu ở những tần số này có tầm quantrọng thấp hơn Các mô hình cấp phát bit thích ứng có thể được sử dụng đểkhai thác thêm ý tưởng này Các bộ mã hóa băng con cho chất lượng thoạitốt trong phạm vi tốc độ từ 16 – 32 Kbps Do phải cần đến bộ lọc để táchtín hiệu thoại trong các băng con nên mã hóa băng con phức tạp hơn bộ mãhóa DPCM thông thường và có thêm độ trễ mã hóa Tuy nhiên, độ phứctạp và độ trễ là tương đối thấp so với các bộ mã hóa lai
Bài 2.4:
Phương pháp mã hóa tham số theo mô hình LPC:
Trang 6Mô hình toán học của LPC
Tín hiệu thoại số là đầu ra của bộ lọc số - bộ lọc LPC có đầu vào là dãy các xung hoặc chuỗi nhiễu trắng Nói cách khác, cuống họng được đặc trưng bởi bộ lọc biến đổi theo thời gian và bị kích thích với những nguồn nhiễu trắng khác cho phân đoạn thoại vô thanh hoặc một dãy các xung phân tách theo chu kỳ âm thanh cho các âm hữu thanh
Do vậy thông tin phải được gửi đến bộ giải mã là các tham số đặc trưng cho bộ lọc; âm vô thanh/hữu thanh; những thay đổi cần thiết của tín hiệu kích thích, chu kỳ âm thanh Quá trình này được cập nhật liên tục 10–20
ms theo bản chất không dừng (non-stationary) của tín hiệu thoại
Các tham số của mô hình có thể được xác định bởi bộ mã hóa theo một số cách khác nhau sử dụng các kỹ thuật trong miền thời gian hoặc tần số Đồng thời các thông tin có thể được mã hóa để truyền dẫn theo những cáchkhác nhau
Bài 2.5:
Phương pháp mã hóa lai theo mô hình AbS:
Trang 7Cấu trúc bộ mã hóa và giải mã lai AbS
+ Sử dụng 2 công nghệ là mã hóa sóng và mã hóa vocoder
+ có thể đạt được chất lương thoại tốt tại tốc độ bit 2-16Kbps
+Mã hóa lai phổ biến nhất là mã hoá phân tích bằng cách tổng hợp AbS (Analysis-by-Synthesis), RPE-LTP, CELP, ACELP, CS-CELP…vv
+Mã hóa lai có nhiều phương pháp nhưng phương pháp phổ biến nhất là
mã hoá phân tích bằng cách tổng hợp AbS (Analysis-by-Synthesis) Bộ mãhoá này cũng sử dụng mô hình cơ quan phát âm của người giống như mã hoá tham số Tuy nhiên, thay vì sử dụng các mô hình tín hiệu kích thích đơn giản thì ở đây tín hiệu kích thích được chọn sao cho cố gắng đạt được dạng sóng tiếng nói tái tạo càng giống với dạng sóng tiếng nói ban đầu càng tốt Đây chính là đặc tính phân biệt sự khác nhau giữa các bộ mã hoá kiểu AbS
+Thuật toán tìm ra dạng sóng kích thích này quyết định tới độ phức tạp của bộ mã hoá
Bài 2.6:
a, Phương pháp mã hóa âm thanh:
Trang 8Mã hóa âm thanh
Mã hóa âm thanh nhằm mục tiêu giảm tốc độ bit nhờ sử dụng các bộ mã hóa và giải mã, như chỉ ra ở hình trên Bộ mã hóa có được bản nén của tín hiệu âm thanh đầu vào (tín hiệu nguồn), yêu cầu ít bit hơn Các bit của bảnnén được phân phát qua kênh truyền thông hoặc kênh lưu trữ tới bộ giải
mã, thực hiện khôi phục lại thành tín hiệu âm thanh ban đầu từ bản nén nhận được
Khi tín hiệu âm thanh khôi phục được tại đầu ra của bộ giải mã là bản sao giống hệt tín hiệu âm thanh nguồn tại đầu vào bộ mã hóa (từng bit một), thì quá trình mã hóa âm thanh này được gọi là không tổn thất Ngược lại,
nó sẽ là tồn thất
Nén âm thanh có thể được thực hiện theo một trong hai cách Cách thứ nhất là mã hóa dạng sóng, các tín hiệu được biến đổi toán học bằng phép biến đổi Fourier thành các thành phần tần số Các biên độ của mỗi thành phần sau đó được mã hóa Mục tiêu là để tái tạo lại dạng sóng một cách chính xác với số lượng bit mã hóa thấp nhất có thể
b, Khái niệm về ngưỡng nghe và ngưỡng đau:
*Ngưỡng nghe:
Tai người phát hiện những âm thanh biến đổi cục bộ trong áp suất không khí được đo bằng mức áp suất âm- SPL (Sound Pressure Level) Nếu như những biến đổi của mức áp suất âm (SPL) là dưới một ngưỡng nào đó về biên độ thì tai người không thể phát hiện được Ngưỡng nghe là giá trị nhỏnhất của cường độ âm gây được cảm giác âm ở tai con người Ngưỡng nghe phụ thuộc vào tần số âm
*Ngưỡng đau:
Trang 9Là giá trị lớn nhất của cường độ âm gây ra cảm giác đau ở tai con người Ngưỡng đau không phụ thuộc vào tần số âm.
*Ảnh hưởng của chúng trong mã hóa âm thanh:
Bài 2.7:
a, Tổng quan về chuẩn mã hóa âm thanh MPEG:
MPEG mô tả nén tín hiệu âm thanh sử dụng các mô hình nén theo nhận thức, đưa ra một hệ với ba mô hình nén âm thanh đơn giản là Layer I, Layer II và Layer III theo mức độ tăng lên của độ phức tạp và khả năng thực hiện (chất lượng âm thanh theo dòng bít) của bộ mã hóa Ba bộ mã hóa này tương thích với nhau theo cách có thứ tự, có nghĩa là bộ giải mã Layer N có khả năng giải mã dòng dữ liệu được mã hóa trong Layer N và tất cả các Layer thấp hơn N
b, Điểm giống nhau của ba lớp âm thanh:
- Dùng chung cấu trúc bộ lọc dải- filerband
- Dùng chung thông tin của phần đầu-header information trong dòng dữ liệu
- Đều có khả năng nhạy đối với lỗi bít tương tự nhau, sử dụng cùng cấu trúc dòng bít với các phần nhạy với lỗi bite (“header”, “bit location”,
“scale factor”, “side information”) và các phần ít nhạy hơn (dữ liệu về các thành phần phổ “data of spectral components”)
- Hỗ trợ khả năng chèn các thông tin về chương trình vào dòng dữ liệu âm thanh
- Có thể sử dụng tần số lấy mẫu là 32,44.1 hoặc 48 kHz
- Cho phép hoạt động với các dòng bít giống nhau
Bài 2.8: Hiệu ứng mã hóa âm thanh :
a :
Hiệu ứng che khuất âm thanh: Là hiện tượng âm thanh mà tại đó
ngưỡng nghe thấy của một âm thanh này được tăng lên trong khi có mặt của một âm thanh khác (khó nghe hơn) Được sử dụng trong kỹ thuật nén.
c,
Băng 9 bị che 15dB, thực chất nó chỉ có 14dB
=> băng 9 nằm dưới ngưỡng nghe => không cần mã hóa
Trang 10Băng 7 bị che 12dB, thực chất nó có 20dB
=> băng 7 mã hóa 4 bit nằm trên ngưỡng nghe=> còn 20-12=8dB cần được mã hóa
Theo công thức tính: SNR= 6,02.n
Nếu ta tăng hoặc giảm 1bit => SNR tăng hoặc giảm 6dB
Vì băng 7 bị che 12dB => bị che mất 2bit
Mà tín hiệu gốc được mã hóa 8bit/mẫu/băng
=> cần 8-2=6 (bit) để mã hóa
Bài 2.9:
Các giai đoạn chính trong xử lý ảnh:
1 Thu nhận hình ảnh: Đây là giai đoạn đầu tiên và quan trọng nhất trong tòan bộ quá trình xử lý ảnh Ảnh nhận được tại đây chính là ảnh gốc để đưa vào xử lý tại các giai đoạn sau, trường hợp ảnh gốc có chất lượng kémhiệu quả của các bước xử lý tiếp theo sẽ bị giảm Thiết bị thu nhận có thể
là các ống ghi hình chân không (vidicon, plumbicon ) hoặc CCD
(Charge-Coupled Device)
2 Tiền xử lý ảnh: Giai đoạn xử lý tương đối đơn giản nhằm nâng cao chất lượng ảnh để trợ giúp cho các quá trình xử lý nâng cao tiếp theo, ví dụ: tăng độ tương phản, làm nổi đường biên, khử nhiễu …
3 Phân đoạn: là quá trình tách hình ảnh thành các phần hoặc vật thể riêng biệt Đây là một trong nhưng vấn đề khó giải quyết nhất trong lĩnh vực xử
lý ảnh Nếu thực hiện tách quá chi tiết thì bài toán nhận dạng các thành phần được tách ra trở nên phức tạp, còn ngược lại nếu quá trình phân đoạn được thực hiện quá thô hoặc phân đoạn sai thì kết quả nhận được cuối cùng sẽ không chính xác
4 Biểu diễn và mô tả: là quá trình xử lý tiếp sau khâu phân đoạn hình ảnh Các vật thể sau khi phân đoạn có thể được mô tả dưới dạng chuỗi các điểmảnh tạo nên ranh giới một vùng, hoặc tập hợp tất cả các điểm ảnh nằm trong vùng đó Phương pháp mô tả thông qua ranh giới vùng thường được
sử dụng khi cần tập trung sự chú ý vào hình dạng bên ngòai của chi tiết ảnh như độ cong, các góc cạnh… Biểu diễn vùng thường được sử dụng khi
Trang 11chúng ta quan tâm tới đặc tính bên trong của vùng ảnh như đường vân (texture) hay hình dạng (skeletal).
5 Nén ảnh: bao gồm các biện pháp giảm thiểu dung lượng bộ nhớ cần thiết để lưu trữ hình ảnh, hay giảm băng thông kênh truyền, cần thiết để truyền tín hiệu hình ảnh số
6 Nhận dạng: là quá trình phân loại vật thể dựa trên cơ sở các chi tiết mô
tả vật thể đó (ví dụ các phương tiện giao thông có trong ảnh)
Bài 2.14
Cho hệ thống LPC tổng quát như hình vẽ dưới đây:
Tính giá trị 10 mẫu tổng hợp đầu tiên tại đầu ra? Biết:
- Bộ dự đoán có bậc p=4 với các hệ số dự đoán: a 1 =1,793; a 2 1,401; a 3 =0,566; a 4 =-0,147.
= Độ lợi G=2, độ dài chu kỳ pitch=60; giả thiết là âm hữu thanh,
- u(m)=1 tại m=1 và u(m)=0 tại các giá trị m khác.
Các điều kiện đầu =0 tại thời điểm bắt đầu của chu kỳ pitch.
Trang 12Phương pháp đệ qui Levinson – Dubin:
(0)
1 1 1 1
(0)
( )
i i j j i
Trang 130,866 0.866
Giải
X(5) = α(1).x(4)+α(2).x(3)= 1,9345.0,5-1,5.0,1=0,81725
Câu 2,17:
a,Trình bày về các mô hình màu trong ảnh?
b, Cho ảnh màu RGB với R=200, G=150, B=40 Xác định các thành phần
Y, Cb, Cr cho ảnh theo mô hình Y, Cb, Cr? Giả sử với ảnh màu RGB đã cho có
Trang 15Bộ lượng tử cho R và G:
Trang 17192 224
208 2
128 160
144 2
0 64
32 2
R G B
x p
và bộ lượng tử 3 mức dưới đây:
1 0
1 2
) (
d d
d d
Q
Giả sử rằng giá trị tạo lại của 2 mẫu đầu tiên là 3, 3 Mã sau được sử dụng để
mã hóa tín hiệu sai số: Error“0”->“1”,Error“2”->“01”,Error“-2”->00”.
Giải:
Sơ đồ mã hóa DPCM:
Trang 18Q Buffer
d d d
≥ −
<
< −
Trang 19Bài 2.19
a)Mã hufman
H E D G F A B C 0.03 0.05 0.06 0.06 0.09 0.11 0.19 0.41
Trang 20b Dùng codebook vừa thiết kế viết luồng bít nhị phân cho chuỗi {baacddacbda}
Giải:
Trang 21Phần a :
b c d a 0.1 0.2 0.3 0.4
Trang 22b, Luồng bít nhị phân cho chuỗi {baacddacbda}:
Hình 3.1: Nén trong ảnh (Intra Frame Compression)
Sử dụng phương pháp biến đổi DCT Phương pháp chuyển đổi tối ưu
là chuyển đổi KLT (Karhunen – Loeve) Chuyển đổi này thông qua một
ma trận chuyển đổi làm giảm trật tự tương quan của một quá trình xử lýngẫu nhiên liên tiếp dưới dạng đường chéo Sử dụng phương pháp chuyểnđổi KLT không thông dụng cho tất cả các ứng dụng của nén ảnh số Vìvậy, thay thế nó là phương pháp DCT (Discrete Cosine Transform) cónhiều thuật toán biến đổi nhanh cho việc tính toán
Bài 2.22
Nguyên lí nén liên ảnh :
Đến đây, các kỹ thuật cơ bản về mã hóa ảnh đặc biệt là các kỹ thuật
sử dụng trong mã hóa ảnh tĩnh đã được trình bày Trong phần này, chúng
Trang 23ta sẽ tìm hiểu thêm các vấn đề về nén chuỗi video Do vậy, một số các kháiniệm về các chuỗi ảnh và video sẽ được nhắc lại Hai kỹ thuật khai thác sựtương quan giữa các khung hình liên tiếp là mã hóa bù khung và mã hóa
bù chuyển động sẽ được nói đến Sau cùng là các khái niệm về phân tíchchuyển động, bù chuyển động và kỹ thuật ánh xạ khối sẽ được nêu ra
Xét bộ cảm biến đặt ở một vị trí xác định trong không gian 3 chiều.Thiết bị này sẽ tạo ra các ảnh về cảnh, ảnh này sau ảnh kia Theo thời gian,các ảnh tạo thành một chuỗi Tập những ảnh này có thể biểu diễn bằng mộthàm cường độ sáng g(x,y,t), trong đó x,y là các tọa độ trên mặt phẳng ảnh;
và là chuỗi ảnh theo thời gian
Trong khi đó, bộ cảm biến này có thể dịch chuyển (trong 3 chiều tựdo), có thể quay (trong 2 chiều tự do) Do vậy, chúng ta sẽ có các loại ảnhkhác nhau khi bộ cảm biến chuyển dịch sang các tọa độ khác nhau và quaysang các góc khác nhau trong không gian 3 chiều Ở một thời điểm nào đó,tất cả những ảnh này tạo thành một tập và được gọi là chuỗi ảnh khônggian Khi thời gian thay đổim những tập ảnh này tạo thành nhiều tập ảnhlớn hơn gọi là không gian ảnh Khi đó tập các ảnh này thường được mô tảnhư sau:
(x, y, t, )
Ví dụ trong Hình 3.58 chỉ ra các vị trí biểu diễn của bộ cảm biến
Hình 3.2: Hai vị trí của bộ cảm biến
Các chuỗi ảnh theo thời gian và không gian đều cùng thuộc mứctrung gian, giữa không gian ảnh và các ảnh riêng lẻ Cấu trúc phân cấp
Trang 24được thể hiện ở Hình 3.59.
Bài 2.23
: Nêu ý nghĩa của tăng cường ảnh? Cho ảnh đa mức xám I với các mức xám nằm trong đoạn [0, 255] Dùng biến đổi s=log(1+r) để tìm ảnh đầu ra?
Giải:
Ý nghĩa tăng cường ảnh là ;
Để ảnh tốt hơn so với đường dẫn
Trang 26Bài 2.24:
Nêu ý nghĩa phương pháp cân bằng lược đồ xám? Cho ảnh đầu vào I
có 10 mức xám Thực hiện cân bằng lược đồ xám ảnh I đã cho?
Trang 28a, Các bước trong kĩ thuật giải nén
Nén theo chuẩn JPEG là một tiến trình nhiều bước Trước hết là bước qui tắc hóa (regularizing stage) để làm cho ảnh có nhiều đoạn giống nhau hơn thực tế Ảnh màu được chuyển sang dạng YUV hoặc CIELAB, trong đó thông tin về độ chói (luminance) được tách rời với thông tin về độ màu (chrominance) Một yếu tố được tính tới là mắt người ta nhạy cảm với những thay đổi nhỏ về độ sáng hơn là những thay đổi về màu sắc, đặc biệt
ở đầu xanh của phổ Ngoài ra cách làm này còn khai thác thực tế là ảnh thường có nhiều vùng lớn tại đó các điểm kế nhau rất giống nhau về kênh màu
Quá trình nén và giải nén được mô tả theo các hình vẽ dưới đây:
Trang 29Bài 3.2
a) Cấu trúc dòng bit và loại ảnh trong tiêu chuẩn MPEG
Cấu trúc dòng MPEG gồm 6 lớp: lớp dãy ảnh (sequence), lớp nhóm ảnh (GOP), lớp ảnh (pictrue), lớp cắt lát dòng bit (slice), lớp macroblock, lớp khối (Block) Mỗi lớp này hỗ trợ một chức năng nhất định: một là chức năng xử lý tín hiệu (DCT, bù chuyển động) hai là chức năng logic (tái đồng bộ, điểm truy xuất ngẫu nhiên) Quá trình tạo ra dòng bit MPEG là ghép kênh: kết hợp các dòng dữ liệu vào, dòng dữ liệu ra, điều chỉnh đồng
bộ và quản lý bộ đệm Cú pháp dòng MPEG bao gồm: lớp dòng bit
(stream), lớp gói (pack) và lớp gói tin (packet) như trong hình dưới
Trong MPEG, có 3 loại ảnh khác nhau được dùng để mã hoá cho các khối ảnh: