MỤC LỤC LỜI NÓI ĐẦU 2 CHƯƠNG I 4 CƠ SỞ LÝ THUYẾT TRUYỀN HÌNH 4 1.1. Giới thiệu chương 4 1.2.Truyền hình tương tự 5 1.2.1 Truyền hình đen trắng 5 1.2.2 Truyền hình màu 10 1.3. Truyền hình số 16 1.3.1. Đặc điểm của truyền hình số 16 1.3.2. Số hóa tín hiệu truyền hình tương tự 17 CHƯƠNG II 26 QUÁ TRÌNH HÌNH THÀNH DÒNG TRUYỀN TẢI TIÊU CHUẨN MPEG TRONG HỆ THỐNG TRUYỀN HÌNH SỐ 26 2.1. Giới thiệu chương 26 2.2. Quá trình nén dữ liệu 27 2.2.1. Nén video 27 2.2.2. Nén audio 38 2.2.3. Nén video và audio theo tiêu chuẩn MPEG 2 40 2.3. Ghép kênh chương trình và tạo dòng truyền tải 41 2.3.1 Dòng cơ sở 42 2.3.2. Dòng chương trình 45 2.3.3. Dòng truyền tải 47 CHƯƠNG III 50 TRUYỀN DẪN DÒNG TRUYỀN TẢI 50 3.1.Giới thiệu chương 50 3.2. Hệ thống truyền hình số mặt đất tiêu chuẩn DVBT 51 3.2.1. Phần mã hóa nguồn dữ liệu và ghép kênh MPEG2 52 3.2.2. Phần mã hóa kênh truyền 53 3.2.3. Phần điều chế và phát sóng 54 3.3. Kỹ thuật ghép kênh đa tần trực giao có mã COFDM 57 3.3.1. Nguyên lý OFDM 57 3.3.2. Can nhiễu do phản xạ đa đường và khoảng thời gian bảo vệ 61 3.3.3. Mã hoá đường truyền và chống nhiễu trong COFDM. 63 3.3.4. Điều chế trong COFDM. 65 3.3.5. Cấu trúc khung của COFDM. 67 3.3.6. Mô hình hệ thống COFDM 70 KẾT LUẬN 73 LỜI NÓI ĐẦU Cùng với sự phát triển của xã hội thì yêu cầu về số lượng và chất lượng các chương trình truyền hình ngày càng cao. Kỹ thuật sản xuất và truyền dẫn tương tự ngày càng tỏ ra kém ưu thế. Sự phát triển của kỹ thuật điện tử, tin học và viễn thông trong kỷ nguyên số hóa đã tạo ra các kỹ thuật xử lý tín hiệu số, các thuật toán nén tín hiệu hình ảnh, các kỹ thuật truyền dẫn số ra đời, là nền tảng cho sự xuất hiện truyền hình số. Truyền hình số đã thể hiện các ưu thế vượt trội và đã giải quyết triệt để các khiếm khuyết của truyền hình tương tự, nó sẽ chiếm vị trí thống lĩnh trong tương lai gần. Hòa cùng với xu thế phát triển của ngành truyền hình, em đã chọn truyền hình số làm đề tài tốt nghiệp của mình, cuốn đồ án này bao gồm ba chương: Chương I: Cơ sở lý thuyết truyền hình, nêu lên những vấn đề cơ bản nhất của truyền hình tương tự và sự chuyển đổi từ tín hiệu truyền hình tương tự sang dạng số với ba bước cơ bản là lấy mẫu, lượng tử, mã hóa. Chương II: Quá trình hình thành dòng truyền tải tiêu chuẩn MPEG trong truyền hình số. Các tín hiệu truyền hình số nhận được từ quá trình số hóa tín hiệu truyền hình tương tự không thể truyền trực tiếp do yêu cầu băng tần quá rông nên buộc phải nén xuống. MPEG (cụ thể là MPEG2) là tiêu chuẩn nén được áp dụng cho tín hiệu truyền hình, kết quả của quá trình nén là các dòng truyền tải (hoặc dòng chương trình). Chương III: Truyền dẫn dòng truyền tải. Dòng truyền tải sẽ được truyền theo các phương thức khác nhau tạo nên các dịch vụ truyền hình khác nhau như cáp, vệ tinh, hay mặt đất. Truyền hình số mặt đất theo tiêu chuẩn DVBT có những ưu điểm vượt trội so với truyền hình tương tự như khả năng chống nhiễu cao, tự phát hiện và sửa lỗi, chất lượng trung thực, ít bị ảnh hưởng bởi nhiễu đường truyền sẽ được đề cập trong chương ba với phương thức truyền dẫn cơ bản OFDM.
Trang 1MỤC LỤC
***
LỜI NÓI ĐẦU 2
CHƯƠNG I 4
CƠ SỞ LÝ THUYẾT TRUYỀN HÌNH 4
1.1 Giới thiệu chương 4
1.2.Truyền hình tương tự 5
1.2.1 Truyền hình đen trắng 5
1.2.2 Truyền hình màu 10
1.3 Truyền hình số 16
1.3.1 Đặc điểm của truyền hình số 16
1.3.2 Số hóa tín hiệu truyền hình tương tự 17
CHƯƠNG II 26
QUÁ TRÌNH HÌNH THÀNH DÒNG TRUYỀN TẢI TIÊU CHUẨN MPEG TRONG HỆ THỐNG TRUYỀN HÌNH SỐ 26
2.1 Giới thiệu chương 26
2.2 Quá trình nén dữ liệu 27
2.2.1 Nén video 27
2.2.2 Nén audio 38
2.2.3 Nén video và audio theo tiêu chuẩn MPEG -2 40
2.3 Ghép kênh chương trình và tạo dòng truyền tải 41
2.3.1 Dòng cơ sở 42
2.3.2 Dòng chương trình 45
2.3.3 Dòng truyền tải 47
CHƯƠNG III 50
TRUYỀN DẪN DÒNG TRUYỀN TẢI 50
3.1.Giới thiệu chương 50
3.2 Hệ thống truyền hình số mặt đất tiêu chuẩn DVB-T 51
3.2.1 Phần mã hóa nguồn dữ liệu và ghép kênh MPEG-2 52
3.2.2 Phần mã hóa kênh truyền 53
3.2.3 Phần điều chế và phát sóng 54
3.3 Kỹ thuật ghép kênh đa tần trực giao có mã COFDM 57
3.3.1 Nguyên lý OFDM 57
3.3.2 Can nhiễu do phản xạ đa đường và khoảng thời gian bảo vệ 61
3.3.3 Mã hoá đường truyền và chống nhiễu trong COFDM 63
3.3.4 Điều chế trong COFDM 65
3.3.5 Cấu trúc khung của COFDM 67
3.3.6 Mô hình hệ thống COFDM 70
KẾT LUẬN 73
Trang 2LỜI NÓI ĐẦU
***
Cùng với sự phát triển của xã hội thì yêu cầu về số lượng và chất lượngcác chương trình truyền hình ngày càng cao Kỹ thuật sản xuất và truyền dẫntương tự ngày càng tỏ ra kém ưu thế Sự phát triển của kỹ thuật điện tử, tinhọc và viễn thông trong kỷ nguyên số hóa đã tạo ra các kỹ thuật xử lý tín hiệu
số, các thuật toán nén tín hiệu hình ảnh, các kỹ thuật truyền dẫn số ra đời, lànền tảng cho sự xuất hiện truyền hình số Truyền hình số đã thể hiện các ưuthế vượt trội và đã giải quyết triệt để các khiếm khuyết của truyền hình tương
tự, nó sẽ chiếm vị trí thống lĩnh trong tương lai gần Hòa cùng với xu thế pháttriển của ngành truyền hình, em đã chọn "truyền hình số" làm đề tài tốt nghiệpcủa mình, cuốn đồ án này bao gồm ba chương:
Chương I: Cơ sở lý thuyết truyền hình, nêu lên những vấn đề cơ bảnnhất của truyền hình tương tự và sự chuyển đổi từ tín hiệu truyền hình tương
tự sang dạng số với ba bước cơ bản là lấy mẫu, lượng tử, mã hóa
Chương II: Quá trình hình thành dòng truyền tải tiêu chuẩn MPEGtrong truyền hình số Các tín hiệu truyền hình số nhận được từ quá trình sốhóa tín hiệu truyền hình tương tự không thể truyền trực tiếp do yêu cầu băngtần quá rông nên buộc phải nén xuống MPEG (cụ thể là MPEG-2) là tiêuchuẩn nén được áp dụng cho tín hiệu truyền hình, kết quả của quá trình nén làcác dòng truyền tải (hoặc dòng chương trình)
Chương III: Truyền dẫn dòng truyền tải Dòng truyền tải sẽ đượctruyền theo các phương thức khác nhau tạo nên các dịch vụ truyền hình khácnhau như cáp, vệ tinh, hay mặt đất Truyền hình số mặt đất theo tiêu chuẩnDVB-T có những ưu điểm vượt trội so với truyền hình tương tự như khả năngchống nhiễu cao, tự phát hiện và sửa lỗi, chất lượng trung thực, ít bị ảnhhưởng bởi nhiễu đường truyền sẽ được đề cập trong chương ba với phươngthức truyền dẫn cơ bản OFDM
Trang 3Với ba chương ngắn gọn, cuốn đồ án này đã mô tả một cách định tínhquá trình chuyển đổi từ truyền hình tương tự sang truyền hình số và quá trìnhtruyền dẫn tín hiệu truyền hình số Tuy nhiên do hạn chế về mặt thời giancũng như kiến thức thực tế, cuốn đồ án này sẽ khó tránh khỏi những thiếu sót.
Em mong được sự góp ý của các thầy và các bạn để hoàn thiện bài viết củamình hơn
Em xin chân thành cảm ơn sự hướng dẫn, chỉ bảo tận tình của giảngviên - Tiến sĩ Nguyễn Hoàng Nguyên là người đã trực tiếp giúp em hoànthành cuốn đồ án này Cuối cùng em xin cảm ơn các thầy cô, các bạn đã dànhthời gian đọc và quan tâm tới đề tài này
Trang 4
CHƯƠNG I
CƠ SỞ LÝ THUYẾT TRUYỀN HÌNH
***
1.1 Giới thiệu chương
Truyền hình là một hệ thống biến đổi hình ảnh và âm thanh kèm theothành tín hiệu điện và truyền tới máy thu, tại đây nó được biến đổi ngược lạithành dạng ban đầu và hiện thị lên màn hình dưới dạng hình ảnh
Truyền hình dựa trên đặc điểm cảm nhận ánh sáng của mắt người đểtruyền các thông tin về độ sáng và màu sắc của vật Tuy nhiên người ta khôngthể truyền trực tiếp thông tin này dưới dạng ánh sáng (ảnh quang) mà phảibiến đổi nó thành các tín hiệu điện để có thể truyền đi xa Quá trình này đượcgọi là quá trình biến đổi quang - điện và được thực hiện nhờ camera Dòng tínhiệu điện sau camera đã mang tin tức của ảnh được gọi là dòng tín hiệu hình(tín hiệu video) Nó sẽ được khuyếch đại, gia công rồi truyền đi theo kênhthông tin sang phía thu Ở phía thu, tín hiệu hình lại tiếp tục được khuyếch đạiđến mức cần thiết rồi đưa đến bộ chuyển đổi tín hiệu - ảnh để biến đổi thànhdạng ảnh quang, nhờ vậy mà mắt người có thể cảm nhận được màu sắc và độsáng của vật Đó là nguyên lý chung về thu và phát tín hiệu truyền hình.Truyền hình tương tự và truyền hình số đều dựa trên nguyên tắc này, điểmkhác nhau giữa hai hệ thống là cách biểu diễn thông tin về màu sắc và độ chóicủa ảnh, truyền hình tương tự biến đổi tín hiệu điện theo sự thay đổi củathông tin, truyền hình số biểu diễn các thông tin đó thành chuỗi số (bit 0,1).Trong chương này, ta không đề cập đến vấn đề thu, phát mà chỉ quan tâm tớicác thông tin trong dòng tín hiệu video tương tự và quá trình biến đổi tín hiệutương tự sang tín hiệu số
Trang 51.2.Truyền hình tương tự
1.2.1 Truyền hình đen trắng
1.2.1.1 Dòng tín hiệu truyền hình đen trắng
Như chúng ta đã biết, thông tin cần truyền của ảnh bao gồm độ chói vàmàu sắc tuy nhiên đối với truyền hình đen trắng, ta chỉ truyền thông tin về độchói Bộ quét trong camera sẽ thực hiện việc chuyển đổi độ chói thành tínhiệu điện bằng một lượt quét gồm các dòng quét theo chiều ngang từ trái quaphải, từ trên xuống dưới Lúc này có thể xem ảnh quang như một tập hợp gồmcác điểm ảnh, mỗi điểm ảnh có một độ chói nhất định, giá trị độ chói trungbình của tất cả các điểm ảnh chính là độ chói của ảnh cần truyền Quá trìnhquét sẽ chuyển đổi độ chói của mỗi điểm ảnh thành các giá trị điện áp tươngứng và cứ thế lặp lại cho hết một ảnh rồi tới ảnh tiếp theo Tuy nhiên, để quátrình khôi phục ảnh là chính xác thì cần có sự đồng bộ giữa phía thu và phíaphát Đồng bộ dòng đảm bảo cho điểm xuất phát quét ở mỗi dòng phía thu vàphát là như nhau Tương tự đồng bộ mành sẽ đảm bảo cho điểm xuất phát ởmỗi mành phía thu và phát là trùng nhau Ngoài các xung đồng bộ dòng vàđồng bộ mành ta cần truyền thêm các xung xóa dòng và xung xóa mành đểxóa các vết quét từ cuối dòng quét cũ về vị trí bắt đầu dòng quét mới hay từcuối mành cũ tới vị trí đầu mành mới, để trên màn hình không có các vệt sáng
di chuyển gây khó chịu cho mắt Các xung đồng bộ và các xung xóa đượctruyền trong thời gian xóa dòng Như vậy, thông tin trong dòng tín hiệu hìnhđen trắng bao gồm thông tin về độ chói truyền trong thời gian quét tích cực vàcác xung đồng bộ và xung xóa truyền trong thời gian xóa dòng
Trang 61.2.1.2 Phổ của tín hiệu hình
Muốn phát tín hiệu nào đó đi xa ta phải xác định độ rộng kênh truyền,
nó phụ thuộc vào phổ của tín hiệu cần truyền đi Trong tín hiêu hình, cácthành phần tần số thấp ứng với các chi tiết lớn của ảnh, các thành phần tần sốcao ứng với các chi tiết nhỏ của ảnh Thành phần tần số thấp nhất của tần phổđược xác định bằng tần số quét mành (quét ảnh) Thành phần tần số cao nhấtquyết định bởi tần số quét cùng kích thước và độ phân giải của ảnh theo chiềungang Tần số này có thể xác định gần đúng theo công thức sau:
A A
A A
H H
H p
f a
b Z f
N f
Z N f
N t
2
1 2
1 2
1 2
1 2
1
(1.1)Trong đó: t p - thời gian cần thiết để truyền tín hiệu mang thông tin về mộtphần tử nhỏ nhất của ảnh theo chiều ngang;
A H
T
f 1
- tần số quét dòng; T H - chu kỳ quét dòng;
Z - số dòng quét trong một ảnh; f A - tần số quét ảnh;
p H p
H H
t f t
T
N 1 - số phần tử phân giải ứng với thời gian truyềntoàn bộ một dòng quét T H ;
p A p
A A
t f t
- tỷ lệ kích thước giữa chiều dài và chiều rộng của ảnh
Xét hệ thống truyền hình quảng bá với số dòng quét Z 625 dòng/ảnh với tỉ
lệ khuân hình 4/3, số ảnh truyền trong một giây là f A 50Hz(tần số tới hạn đểtránh hiện tượng nhấp nháy đối với mắt người), thì tần số cao nhất của tínhiệu hình có giá trị cỡ:
MHz Hz
3
4 625 2
Trang 7Giá trị này là rất lớn xét theo cả hai khía cạnh: băng tần đòi cần thiết
để truyền dẫn và khả năng đảm bảo dải thông của các thiết bị vô tuyến điệnthông thường (Ví dụ: so sánh với phổ của tín hiệu âm thanh chỉ có giá trị mộtvài đến cỡ 20KHz) Chính vì vậy người ta đã cố gắng giảm nó xuống một nửa(chỉ còn 6,5 MHz) bằng biện pháp quét xen dòng Trong đó mỗi ảnh đượcchia thành hai nửa (2 mành - Frame): mành thứ nhất bao gồm tất cả các dòng
lẻ của ảnh còn mành thứ hai - các dòng chẵn Các mành chẵn, lẻ được truyền
đi lần lượt với tần số f V có giá trị bằng tần số tới hạn để mắt không cảm thấy
sự nhấp nháy Do mỗi ảnh gồm hai mành nên tần số truyền ảnh đã giảm đi
2fH-fV
Hình 1.1 cấu trúc phổ của tín hiệu
video đen trắng
Trang 8Xét về mặt cấu trúc, phổ tín hiệu hình được sắp xếp khá đặc biệt
(Hình 1.1) Nó bao gồm các hài của tần số mành f v và dòng f H , trong đó tần số
càng cao thì biên độ càng bé Năng lượng chủ yếu tập trung trong khoảng tần
số từ 0 đến cỡ 1,5MHz Giữa các nhóm phổ hài tần số dòng tồn tại cáckhoảng trống Có thể lợi dụng các khoảng trống này để truyền những tín hiệukhác Trong trường hợp hai tín hiệu có cấu trúc phổ như nhau, nếu bố trí saocho các nhóm phổ của tín hiệu thứ hai nhằm vào các khoảng trống giữa cácnhóm phổ của tín hiệu thứ nhất thì có thể truyền cả hai tín hiệu ấy trên cùngmột kênh thông tin, và sau đó tách chúng ra được Tính chất này được ápdụng để ghép các tín hiệu màu vào tín hiệu chói trong truyền hình màu
1.2.1.3 Băng tần của một kênh truyền hình đen trắng
Trong truyền hình quảng bá các tham số về tần số, số dòng quét và giátrị tần số cực đại của tín hiệu video được được quy định theo tiêu chuẩn một
số tiêu chuẩn sau (Bảng 1)
Bảng 1: Một số tiêu chuẩn truyền hình đen trắng
Tên tiêu
chuẩn
Tổng số dòngquét/ số dòngquét ngược
fVxfH[Hz]
fmax[MHz]
fs[MHz]
Trang 9Để thực hiện truyền dẫn tín hiệu video người ta dùng phương pháp điều chế
AM với biên tần cụt Xét giá trị cực đại của phổ tín hiệu hình cùng tần số f s
tương ứng của các tiêu chuẩn trên, băng tần cần thiết để truyền dẫn một kênhtruyền hình có giá trị từ 6-8MHz
Hình 1.2.a.Phân bố các kênh trên dải tần số
Trang 101.2.2 Truyền hình màu
1.2.2.1 Tín hiệu truyền hình màu
Truyền hình màu ra đời khi truyền hình đen trắng đã trưởng thành vàcòn đang được xây dựng Vì vậy giải pháp đặt ra đối với truyền hình màu làphải giữ nguyên toàn bộ hệ thống đen trắng sẵn có, các máy thu đen trắng vẫn
sử dụng được
Theo thuyết ba màu, tất cả các màu sắc tồn tại trong tự nhiên đều có thểtạo ra từ ba màu: R (Red), G (Green), B (blue), tỉ lệ trộn giữa chúng cho tabiết màu sắc, còn độ lớn của chúng có thể cho ta biết độ chói của vật Nếu ởphía phát ta phân tích được màu của điểm ảnh theo các tỉ lệ trộn R, G, B vàtruyền đi các giá trị điện áp ER,, EG, EB (chúng được gọi tà các tín hiệu màu)biểu diễn các màu cơ bản R, G, B thì ở phần thu hoàn toàn có thể tái tạo lạiđược màu và độ chói của điểm ảnh Giá trị điện áp biểu diễn độ chói trungbình EY tính qua ER,, EG, EB theo công thức:
EY = 0,299 ER + 0,587 EG + 0,114 EB (1.2)Như vậy đối với truyền hình màu, ta chỉ cần truyền đi ba giá trị ER,, EG,
EB là đủ nhưng để máy thu đen trắng vẫn thu được tín hiệu từ các đài phátmàu thì các đài phát màu phải phát thêm tín hiệu độ chói EY Xét mối quan hệ(1.2) ta thấy để tái tạo lại được các tín hiệu màu thì chỉ cần truyền EY và haitrong ba tín hiệu màu Ngoài ra để giảm thiểu nhiễu cho tín hiệu độ chói thìthay vì việc truyền toàn bộ tín hiệu màu người ta lựa chọn hai trong ba các tínhiệu hiệu số màu sau:
ER-Y=ER-EY; EB-Y=EB-EY; EG-Y=ER-EY.Lưu ý rằng các tín hiệu hiệu số màu có giá trị rất nhỏ khi với ảnh màuvới độ bão hoà thấp (nó bằng “0” với ảnh đen trắng) Trong 3 giá trị trênngười ta loại bỏ tín hiệu EG-Y và thực hiện truyền ER-Y, EB-Y.Việc loại bỏ EG-Yđược lý giải như sau:
Trang 11 Với cùng một độ sáng chuẩn như nhau, G-Y có quãng biến thiên bénhất làm cho thông tin không rõ ràng.
Mắt người khá nhạy cảm với màu xanh lá cây (G), do đó đòi hỏi dải tầncủa G-Y cao hơn nên khó truyền hơn so với dải tần B-Y và R-Y chỉ vàokhoảng 1,5 MHz
Như vậy các thông tin trong dòng tín hiệu màu so với tín hiệu đen trắng
sẽ có thêm hai tín hiêu màu ER-Y, EB-Y Các tín hiệu này có thể được ghépchung thành một tín hiệu gọi là tín hiệu video tổng hợp để tương thích với hệtruyền hình đen trắng hoặc truyền trên 3 kênh riêng (gọi là các tín hiệu videothành phần) Tín hiệu video tổng hợp có ưu điểm là tiết kiệm được băng tầntruyền dẫn song khả năng xử lý hình ảnh lại kém linh động Tín hiệu videothành phần hoàn toàn khắc phục nhược điểm này nhưng phải trả giá bằng việctốn kém phổ tần Do mỗi loại tín hiệu có những ưu nhược điểm riêng nên các
hệ thống truyền hình cho phép dùng cả hai dạng tín hiệu video tổng hợp và tínhiệu video thành phần tùy vào mục đích sử dụng
1.2.2.2 Ghép phổ tín hiệu mang màu và độ chói
Sau khi đã loại bỏ tín hiệu màu EG-Y , tin tức cần truyền đi là ER,, EG, EB(hay Ey,ER-Y, EB-Y ) Vấn đề đặt ra là làm thế nào để gói các tín hiệu màu ER-
Y, EB-Y (gọi là các tín hiệu C1, C2) vào tín hiệu chói Ey mà không làm thayđổi phổ EY Người ta đã lợi dụng tính chất đặc biệt trong phổ tín hiệu hình đentrắng là tồn tại những khoảng trống có thể ghép xen kẽ tín hiệu mang màu vào
đó để truyền đi cùng với tín hiệu đen trắng Để ghép xen kẽ, tín hiệu mangmàu được đem điều chế với một dao động có tần số sóng mang phụ fsc saocho tín hiệu đã điều chế (gọi là tín hiệu mang màu cao tần) có các vạch phổnằm đúng vào khe hở của tín hiệu chói trong cùng một giải tần số Muốn vậythì tần số mang phụ fsc phải bằng (n-1/2)fh, (n là số nguyên, fh là tần số dòng).Khi chọn tần số sóng mang phụ cần phải lưu ý Tần số sóng mang phụ phải ởmiền tần số cao của phổ tín hiệu chói để giảm thiểu tối đa ảnh hưởng lẫn nhaugiữa tín hiệu độ chói và tín hiệu màu vì càng ở tần số cao biên độ tín hiệu chói
Trang 12càng giảm, đồng thời fsc phải nhỏ hơn tần số cao nhất của phổ tần tín hiệu chóinhằm tiết kiệm giải thông.
Phép điều chế ở đây nhằm dịch phổ của tín hiệu mang màu lên phía tần
số cao của tín hiệu chói, đồng thời đảm bảo cho các vạch phổ của hai loại tínhiệu có thể đan nhau mà không trùng pha Bằng cách này, giải tần rộng 6MHzvừa mang được cả tin tức về màu và độ chói của ảnh Hình 1.3 minh họa phổtín hiệu chói và tín hiệu màu cao tần
Hình 1.3.a Phổ tín hiệu chói
Trang 131.2.2.3 Các hệ truyền hình màu
Tùy vào cách mã hóa và điều chế tín hiệu mang màu, ta có các hệ thốngtruyền hình màu khác nhau Hiện nay có ba hệ truyền hình màu là: NTSC,PAL, SECAM
Theo hệ NTSC hai tín hiệu sắc (ER-Y, EB-Y) trước khi chèn vào tín hiệuchói được quay pha 33o để giảm tối đa phổ chiếm của nó, giảm tối đa ảnhhưởng tới tín hiệu chói, tín hiệu này sau khi quay pha gọi là I và Q sẽ đượcđem điều biên nén vuông góc với sóng mang phụ fsc Các tham số cơ bản cầnlưu ý với hệ với NTSC 525 dòng : fH = 15734,25Hz, tần số mặt fv = 59,94
Hz, fsc =3,58Mhz, fmax=5MHz
Hệ PAL tương tự như hệ màu NTSC Hệ PAL cũng dùng một sóngmang phụ mang đồng thời hai tín hiệu màu U và V, điều biên nén vuông gócnhưng thành phần sóng mang phụ mang tín hiệu V đảo pha theo từng dòngquét nên so với hệ NTSC, nó khắc phục được sự nhạy cảm của tín hiệu màuvới méo pha và méo pha vi sai Các tham số cơ bản của hệ PAL gồm: tần sốdòng fH = 15625Hz, tần số mành fv = 50Hz, fsc =4,43Mhz, fmax=5 MHz
SECAM là hệ truyền hình màu đồng thời - lần lượt Tín hiệu chói đượctruyền ở tất cả các dòng, còn hai tín hiệu màu DR và DB không được truyền đicùng một lúc, mà chỉ truyền một trong hai, hoặc DR hoặc DB lần lượt cho mỗidòng quét Phương pháp điều chế hai tín hiệu màu là phương pháp điều tầnvới hai sóng mang phụ có tần số trung tâm fOR và fOB Vì sử dụng phương phápđiều tần nên khi chuyển sang tín hiệu số rất khó khăn trong việc xác định tần
số lấy mẫu, do vậy người ta chỉ số hóa tín hiệu video thành phần với hệ màuSECAM mà không áp dụng với tín hiệu video tổng hợp
Như vậy truyền hình tương tự hiện tại tồn tại ba hệ màu cơ bản làNTSC, PAL, SECAM và hai tiêu chuẩn truyền 25 ảnh trên một giây, mỗi ảnh
có 625 dòng hoặc truyền 30 ảnh, mỗi ảnh chúa 525 dòng
Trang 14Quá trình ghép các tín hiệu màu và tín hiệu chói để tạo ra tín hiệutruyền hình tổng hợp được tóm tắt qua hình 1.4 Các thông số trong hình làcủa hệ NTSC 525 dòng Mổ tả sơ lược hình 1.4 như sau:
Tín hiệu độ chói Y kèm theo các thông tin đồng bộ dòng và đồng bộmành (H.sync và V.sync) gói gọn trong dải phổ 0 > 4,2 MHz (với hệ PAlcần giải phổ rộng hơn một chút là 5MHz )
Hai tín hiệu sắc C1, C2 nhận được bằng cách biến đổi ER-Y, EB-Y , có dảitần cỡ 1,5 MHz được đưa vào điều chế với sóng mang phụ fsc = 3,58 (hoặc4,43 MHz) sau đó được ghép vào với tín hiệu chói để phổ tín hiệu màu nằmxen kẽ với phổ tín hiệu chói
Tín hiệu âm thanh (sound) đem điều tần với sóng mang phụ ở 4,5 MHz(FCC) hoặc 6,5 MHz (OIRT) Sóng FM 4,5 MHz (hoặc 6,5 MHz) nằm ngoàigiải tần của video 0 > 4,2 MHz (hoặc từ 0 >6 MHz) do đó có thể nhậpchung nó với đường tín hiệu video để truyền đi trên cùng một đường màkhông bị lẫn lộn với nhau Tất cả 6 tin tức trên cùng nằm chung trên một tínhiệu (gọi là tín hiệu hình màu) rồi đưa vào mạch điều biên (AM) với sóngmang 187,5 MHz Tín hiệu sau bộ điều biên là tín hiệu hình màu tổng hợp.Như vậy, truyền dẫn tín hiệu tương tự tổng hợp chỉ cần một kênh truyền cóbăng tần không rộng lắm, cỡ 6 đến 8 MHz là có thể truyền đi được
Trang 15Hình 1.4 Mã hóa và phát sóng tín hiệu truyền hình màu
Trang 161.3 Truyền hình số
1.3.1 Đặc điểm của truyền hình số
So với tín hiệu tương tự, tín hiệu số có nhiều ưu điểm hơn, ví dụ nhưcho phép tạo, lưu trữ, ghi đọc nhiều lần mà không làm giảm chất lượng hìnhảnh, khả năng xử lý tạo kỹ xảo ảnh, khả năng giảm giá thành hệ thống nhờviệc tiêu chuẩn hoá các thiết bị số, khả năng phát triển truyền hình tương tác
và đa truyền thông Tuy có những ưu điểm như vậy nhưng truyền hình số rađời khá muộn so với truyền hình tương tự Đó là do tín hiệu số có yêu cầubăng tần rất rộng Ví dụ, nếu tính sơ bộ tốc độ bit (Vbit=Flấy mẫu x (số bít 1mẫu)), đối với tín hiệu tương tự tổng hợp, khi số hóa với yêu cầu tần số lấymẫu bằng 4 lần tần số sóng mang màu - như đối với hệ NTSC là 14,4 MHz;thực hiện mã hóa mỗi mẫu bằng một từ mã có độ dài 8 bit, tốc độ dòng bit là115,2 Mbps, độ rộng băng tần khoảng 58 MHz Trong khi đó, tín hiệu tương
tự chỉ cần một băng tần rộng cỡ 4,2 MHz Nếu có thêm các bit sửa lỗi, yêucầu băng tần tín hiệu số còn tăng lên nữa Vì vậy mãi sau này, khi kỹ thuậtnén băng tần và nén tín hiệu phát triển, các tính chất đặc biệt của tín hiệu hìnhảnh như sự lặp lại, khả năng dự báo cũng được đưa vào khai thác sử dụng, tỉ
lệ nén có thể đạt được 100:1, độ rộng băng tần tín hiệu số không cần lớn lắmthì truyền hình số mới ra đời
Quá trình số hóa tín hiệu truyền hình tương tự cũng giống như quá trình
số hóa thông thường, bao gồm các bước: lấy mẫu, lượng tử, mã hóa nhưngmang các đặc trưng riêng của tín hiệu video Có hai cách số hóa : biến đổitrực tiếp tín hiệu video màu tổng hợp hoặc biến đổi riêng từng tín hiệu videomàu thành phần Biến đổi tín hiệu video tổng hợp có ưu điểm là yêu cầu băngtần không lớn lắm nhưng không loại bỏ được những nhược điểm của tín hiệuvideo tổng hợp tương tự như hiện tượng can nhiễu chói màu, hay khó thựchiện xử lý, tạo kỹ xảo truyền hình Những nhược điểm này hoàn toàn có thể
Trang 17khắc phục trong tín hiệu video số thành phần Vì vậy, mặc dù tín hiệu video
số thành phần yêu cầu băng tần rộng hơn nhưng nhờ những tính chất ưu việtnên phương pháp biến đổi tín hiệu thành phần vẫn được khuyến khích sửdụng và sẽ ngày càng được sử dụng rộng rãi trong tương lai
1.3.2 Số hóa tín hiệu truyền hình tương tự
1.3.2.1 Lấy mẫu tín hiệu video
1.3.2.1.1.Lấy mẫu tín hiệu video tổng hợp
Lấy mẫu tín hiệu tương tự là quá trình rời rạc hóa theo thời gian bằngtần số lấy mẫu fsa, kết quả cho ta một chuỗi các mẫu Việc lựa chọn tần số fsa
sẽ ảnh hưởng tới chất lượng khôi phục hình ảnh Tần số lấy mẫu càng cao thìquá trình số hóa càng chính xác, chất lượng hình ảnh khôi phục càng tốt, tuynhiên ta không thể tăng mãi tần số mẫu fsa được Nó bị giới hạn trên bởi độrộng băng tần tín hiệu Băng tần dành cho tín hiệu số là hữu hạn kéo theo giớihạn về tốc độ bit, tức là giới hạn về tần số lấy mẫu Tần số fsa bị giới hạndưới bởi tiêu chuẩn Nyquyst Theo tiêu chuẩn này, để tránh hiện tượng méochồng phổ, fsa phải lớn hơn 2 lần tần số cao nhất của phổ tín hiệu (tức là fsalớn hơn 8,4 MHz với hệ NTSC và lớn hơn 10 MHz với hệ PAL) Các giá trị8,4 MHz và 10 MHz là các giá trị tần số lấy mẫu bé nhất có thể được
Như đã nói ở phần trên, tín hiệu video có những đặc trưng riêng nênngoài việc thỏa mãn định lý lấy mẫu Nyquyst, quá trình lấy mẫu còn phảithỏa mãn các yêu cầu về cấu trúc lấy mẫu, tính tương thích giữa các hệ thốngv.v , khi chọn tần số lấy mẫu (fsa) có thể xuất hiện các trường hợp:
fsa gấp nhiều lần fsc
fsa không có quan hệ trực tiếp với fsc Trong trường hợp này, sẽ xuấthiện (ngoài thành phần tín hiệu có ích) thêm các thành phần tín hiệuphụ do liên hợp giữa fsa và fsc hoặc hài của fsc trong phổ tín hiệu lấymẫu Đặc biệt thành phần tín hiệu (fsa - 2fsc) sẽ gây méo tín hiệu video
Trang 18tương tự được khôi phục lại (méo điều chế chéo) Các thành phần tínhiệu điều chế chéo có tần số nằm trong kênh màu sẽ tạo nên các "hìnhđồng màu", thể hiện rất rõ trong các ảnh có nền đồng màu và độ bãohòa màu cố định.
Như vậy để tránh méo điều chế chéo thông thường chọn tần số lấy mẫubằng bội số của tần số sóng mang màu Ở hệ NTSC, PAL do sử dụng mộtsóng mang màu nên việc chọn giá trị tần số fsa tối ưu sẽ đơn giản Các kếtquả nghiên cứu cho thấy, khi tần số lấy mẫu tiến đến gần phạm vi 13 MHz,chất lượng hình ảnh khôi phục sẽ rất tốt Nếu lấy tần số lấy mẫu nhỏ hơn 13MHz, chất lượng hình ảnh giảm rõ rệt Ta thường lấy fsa = 4fsc, hiện nay cóhai tiêu chuẩn là: tiêu chuẩn 4fsc NTSC và tiêu chuẩn 4fsc PAL
Tiêu chuẩn 4fsc NTSC xây dựng dựa trên hệ NTSC 525 dòng Tần sốlấy mẫu là 14,3181 MHz Tần số này không chỉ thỏa mãn điều kiện bằngnguyên lần tần số sóng mang màu (fsa = 4fsc = 3,58 MHz (chính xác là3,579525 MHz)) mà còn thỏa mãn điều kiện bội của tần số dòng, do thỏa mãnđiều kiên này mà điểm lấy mẫu trên các dòng quét sẽ thẳng hàng nhau vàtránh được các hiệu ứng méo đường biên gây ra, việc khôi phục ảnh sẽ chínhxác hơn
Việc lấy mẫu không những phụ thuộc vào thời gian (tần số lấy mẫu)
mà còn phụ thuộc vào tọa độ các điểm lấy mẫu (cấu trúc lấy mẫu) Tần số lấymẫu phù hợp với cấu trúc lấy mẫu sẽ cho phép khôi phục hình ảnh tốt nhất.Tiêu chuẩn 4fsc NTSC và 4fsc PAL quy định cấu trúc lấy mẫu theo kiểu trựcgiao Các mẫu được sắp xếp trên các dòng kề nhau thẳng hàng theo chiềuđứng Trong cấu trúc trực giao các mẫu được lặp lại giống nhau trên từngdòng, từng mành, từng ảnh So với các cấu trúc quincunx mành và quincunx
Trang 19dòng, cấu trúc trực giao giảm thiểu được hiện tượng đường viền hoặc nhòe do
có sự so le ở mỗi dòng, mỗi mành
Xác định được tần số lấy mẫu và cấu trúc lấy mẫu ta có thể xác địnhđược cấu trúc của một dòng video số cũng như cấu trúc của mành số Với fsa =14,3181 MHz, tần số quét dòng fh =15734,25 Hz, tổng số mẫu thu được trênmột dòng là fsa / fh = 910 mẫu Dòng video tích cực chiếm 768 mẫu 142 mẫucòn lại dành cho đồng bộ dòng tín hiệu số Điểm nửa biên độ của sườn xungđồng bộ dòng của tín hiệu video tương tự nằm giữa hai mẫu số 784 và 785.Mẫu đầu tiên trong 910 mẫu tương ứng với mẫu đầu tiên của dòng tích cực số
và được ký hiệu là mẫu số 0 Các mẫu tương ứng sẽ được đánh số từ 0 đến
909 Dòng số tích cực bao gồm từ 0 đến 767 Dòng xóa bắt đầu từ mẫu 768đến mẫu 909 Hình 1.5.a mô tả một số mẫu đặc trưng trong dòng video số củatiêu chuẩn 4fsc NTSC
Tiêu chuẩn 4fsc PAL có tần số lấy mẫu bằng 4 lần fsc (và bằng17,734475 MHz) Với fh là 15625Hz, fsa không thỏa mãn điều kiện bằngnguyên lần tần số quét dòng (17734475/15625=1135,0064) Quá trình xử lýtín hiệu yêu cầu một số nguyên các mẫu trên mỗi dòng quét Số mẫu đượcchọn trên mỗi dòng quét là 1135 mẫu Để bù các mẫu còn thiếu, trên các dòng
313 và 625, người ta cộng thêm mỗi dòng một mẫu Các dòng này đều thuộckhoảng xóa mành nên việc thêm mẫu sẽ không ảnh hưởng tới chất lượng hìnhảnh Cấu trúc dòng số theo tiêu chuẩn 4fsc PAL như sau Mỗi dòng tích cực có
1135 mẫu, trong đó có 948 mẫu tích cực (được đánh số từ 0 đến 947), 187mẫu còn lại thuộc khoảng xóa dòng Khoảng xóa dòng số bắt đầu từ mẫu 948đến mẫu 1134 trên tất cả các dòng không thuộc khoảng xóa mành (Hình1.5.b)
Trang 20Hình 1.5.a Dòng video số của tiêu chuẩn 4fsc NTSC
Điểm kết thúc dòng xóa số Dòng chuẩn
Trang 21Hình 1.5.b Dòng video số theo tiêu chuẩn 4fsc PAL
Cấu trúc mành số có các đặc điểm khác với mành tương tự Khoảngthời gian tích cực của mành số trong cả hai tiêu chuẩn đều vượt quá thời giantích cực của mành tương tự Một chu kỳ tích cực của mành số bắt đầu trước
và kết thúc sau chu kỳ tích cực của mành tương tự Dòng tích cực số cũngvượt quá dòng tích cực tương tự Khoảng xóa dòng tương tự sẽ nằm trongdòng số tích cực Khoảng xóa dòng số bắt đầu từ mẫu 768 đến mẫu 909 vớitiêu chuẩn 4fsc NTSC (và từ mẫu 948 đến mẫu 1134 với tiêu chuẩn 4fscPAL) ở tất cả các dòng không thuộc khoảng xóa mành
Điểm bắt đầu dòng video tích cực
Trang 221.3.2.1.2 Lấy mẫu tín hiệu video thành phần
Các tín hiệu video thành phần được truyền trên 3 kênh riêng biệt vàkhông dùng sóng mang màu, nên không có sự ảnh hưởng của tín hiệu màu lêntín hiệu chói hay ngược lại Vì vậy trong quá trình số hóa tín hiệu video thànhphần, khái niệm tần số lấy mẫu phải bằng bội lần tần số sóng mang màu làkhông cần thiết Thậm chí, tần số lấy mẫu của mỗi loại tín hiệu không nhấtthiết phải bằng nhau Yêu cầu số hóa chính xác của tín hiệu độ chói cao hơnrất nhiều so với tín hiệu màu vì nó liên quan trực tiếp tới độ sáng trung bìnhcủa ảnh, mắt người dễ dàng nhận biết Do vậy tần số lấy mẫu tín hiệu chóiphải lớn hơn rất nhiều tần số lấy mẫu tín hiệu màu Việc giảm tần số lấy mẫucủa tín hiệu màu là cần thiết vì nó sẽ tiết kiệm được băng tần truyền dẫn
Đối với tín hiệu chói tần số lấy mẫu được chọn bằng 13,5 MHz vừa đểtiến tới sự thống nhất các tiêu chuẩn truyền hình và vừa thỏa mãn cấu trúc lấymẫu tín hiệu là trực giao bởi vì giá trị 13,5 là một số nguyên lần tần số dòngcho cả hai tiêu chuẩn 625 và 525 dòng (13,5 MHz = 864 x 15625 = 864fh vớichuẩn 625 dòng; 13,5MHz = 858 x 15750 = 858fh với tiêu chuẩn 525 dòng).Tần số lấy mẫu của các tín hiệu màu có thể nhỏ hơn Tùy vào tỉ lệ giữa tần sốlấy mẫu tín hiệu chói và tần số lấy mẫu tín hiệu màu mà ta có các tiêu chuẩnlấy mẫu khác nhau Hiện nay có 4 tiêu chuẩn là: 4:4:4; 4:2:2; 4:2:0; 4:1:1 Số
4 ở mỗi đầu chuẩn biểu thị tần số lấy mẫu của tín hiệu chói nhưng không cònbằng bốn lần tần số sóng mang màu như trước Các con số khác biểu thị tỉ lệgiữa tần số lấy mẫu tín hiệu màu so với tín hiệu chói
Cấu trúc một dòng số theo tiêu chuẩn hay dùng nhất là tiêu chuẩn 4:2:2như sau: với tần số lấy mẫu là 13,5 MHz, tổng số mẫu tín hiệu chói mỗi dòng
là 864 mẫu với hệ 625 dòng (858 mẫu với hệ 525 dòng), trong đó có 720 mẫutích cực và 144 mẫu (138 mẫu) trong khoảng thời gian xóa dòng Tần số lấymẫu tín hiệu màu bằng một nửa tần số lấy mẫu tín hiệu chói nên số mẫu tínhiệu màu cũng chỉ bằng một nửa số mẫu tín hiệu chói, ứng với 720 mẫu độ
Trang 23chói sẽ có 360 mẫu CR và 360 mẫu CB Sau khi lấy mẫu, các mẫu tín hiêu chói
và tín hiệu màu có thể được xử lý riêng biệt hoặc ghép theo thời gian Nếughép các mẫu tín hiệu chói và tín hiệu màu thì tổng số mẫu trong một dòngcủa hệ 625 dòng là 1728 mẫu (1440 mẫu tích cực, 288 mẫu trong khoảng xóadòng) hoặc bằng 1715 đối với hệ 525 dòng (1440 mẫu tích cực, 276 mẫutrong khoảng xóa dòng)
Cấu trúc mành số như sau: ở hệ 625 dòng, mỗi ảnh được chia làm haimành, mành 1 có 312 dòng và mành 2 có 313 dòng, thời gian xóa của mỗimành 1 là 24 dòng, của mành 2 là 25 dòng Tổng số dòng tích cực của hệ là
576 dòng Ở hệ 525, mỗi ảnh cũng được chia làm hai mành, mành 1 có 262dòng, mành 2 có 263, khoảng xóa của mỗi mành chứa 19 dòng Tổng số dòngtích cực của hệ là 487dòng
1.3.2.2 Lượng tử và mã hóa
Lượng tử hóa là bước tiếp sau quá trình lấy mẫu Toàn bộ giải độngcủa tín hiệu được chia thành các mức cách đều nhau một khoảng là Q (Q gọi
là bước lượng tử) Giá trị điện áp của các mẫu được làm tròn ứng với các mức
đó Quá trình làm tròn giá trị điện áp gây nên sai số lượng tử trong phạm vi Q/
2 Sai số lượng tử có thể coi như một nguồn nhiễu Tuy nhiên, trong các hệthống sử dụng 8 bit trở lên, nhiễu lượng tử hoàn toàn có thể loại bỏ được Cácgiá trị điện áp của các mẫu sau khi làm tròn sẽ được mã hóa bằng một từ mã
Độ dài của mỗi từ mã có thể là 8 hay 10 bit Số bit dùng càng lớn (tức là bướclượng tử càng nhỏ) thì việc mã hóa càng chính xác nhưng điều này sẽ làm chotốc độ bit tăng lên Vì vậy, ta phải lựa chọn bước lượng tử hợp lý, cân bằngcác điều kiện để tốc độ bit không quá lớn nhưng vẫn đảm bảo độ chính xáccủa tín hiệu
Quá trình lượng tử hóa và mã hóa đối với cả tín hiệu video thành phần
và tín hiệu video tổng hợp đều có đặc điểm sau: thang lượng tử được chia
Trang 24thành các khoảng bao gồm khoảng bảo vệ phía trên (mức trắng), khoảng bảo
vệ phía dưới (mức đen), các mức lượng tử trong khoảng này sẽ được mã bằngcác từ mã cấm (là các từ mã không xuất hiện trong dòng số), phần giữa củathang lượng tử sẽ dùng để biểu diễn các giá trị điện áp của các mẫu, bao gồm
cả giá trị điện áp của các mức đồng bộ và mức xóa Riêng đối với tín hiệuvideo thành phần trước khi đem lượng tử thì các tín hiệu màu C1 và C2 sẽđược nhân thêm các hệ số phù hợp để khoảng biến đổi của chúng ( bằng từ
- 0,5 đến + 0,5) giống như tín hiệu chói
Ta sẽ tính tốc độ bit đối với mỗi loại tín hiệu video số để thấy rõ yêucầu về độ rộng băng tần của tín hiệu số Vbit = (số ảnh truyền/1s) x (số dòng/1ảnh) x (số mẫu/1 dòng) x (số bit/ 1 mẫu)
Tiêu chuẩn 4fsc NTSC truyền 30 ảnh trong một giây, mỗi ảnh gồm 525dòng, mỗi dòng chứa 910 mẫu, mỗi mẫu mã bằng một từ mã 8 bit, tốc độdòng số là : 30 x 525 x 910 x 8 = 114660000 bit/s= 114,66 Mb/s
Tiêu chuẩn 4fsc PAL truyền 25 ảnh trong một giây, mỗi ảnh gồm 625dòng, mỗi dòng chứa 1135 mẫu, mỗi mẫu mã bằng một từ mã 8 bit, tốc độdòng số là : 25x 625x 1135x 8 = 141875000 bit/s= 141,875 Mb/s
Với hệ 625 dòng, tiêu chuẩn 4:2:2, ta chỉ lấy mẫu cho 576 dòng tíchcực, mỗi dòng có 1728 mẫu, tốc độ bít là: 1728 x 576 x 25 x 8 =199065600bit/s ≈ 199,065 Mb/s
Tương tự với hệ 525, tốc độ bit là: 1715 x 487x 30 x 8 = 196744800bit/s = 196,7448 Mb/s
Như vậy, tốc độ bit của tín hiêu truyền hình số là rất lớn cỡ 100 Mb/sđối với các tín hiệu số tổng hợp, còn với các tín hiệu số thành phần thì tốc độbit lớn hơn rất nhiều, cỡ 200 Mb/s Muốn truyền tải tốc độ này thì yêu cầubăng tần ít nhất phải bằng nửa tốc độ bit, tức là khoảng 50 MHz (hoặc100MHz với tín hiệu số thành phần) Dải băng tần này là quá rộng, nếu dành
Trang 25để truyền tín hiệu truyền hình thì không có chỗ để truyền thêm các loại tínhiệu khác Vì vậy, yêu cầu nén tín hiệu, giảm tốc độ bit là một vấn đề mangtính sống còn đối với truyền hình số
Trang 26CHƯƠNG II QUÁ TRÌNH HÌNH THÀNH DÒNG TRUYỀN TẢI TIÊU CHUẨN
MPEG TRONG HỆ THỐNG TRUYỀN HÌNH SỐ
***
2.1 Giới thiệu chương
Trong chương này, ta sẽ tìm hiểu nguyên lý quá trình hình thành dòng
dữ liệu phục vụ truyền dẫn (dòng truyền tải) trong hệ thống truyền hình số
Nó bao gồm hai công đoạn chính sau:
Nén tín hiệu video và audio nhằm giảm thiểu tốc độ luồng dữ liệu
Ghép kênh dòng chương trình và tạo dòng truyền tải
Nội dung được giới hạn với chuẩn MPEG Sở dĩ ta chọn nén tín hiệutheo chẩn MPEG vì chuẩn này được ứng dựng rất rộng rãi trong lĩnh vựctruyền hình Chuẩn MPEG được phân nhỏ thành các tiêu chuẩn: MPEG-1,MPEG-2, MPEG-3, MPEG-4, MPEG-7 với tỉ lệ nén từ 5:1 cho tới 10:1 đểphù hợp với nhiều mục đích sử dụng, ta sẽ quan tâm hơn tới chuẩn nénMPEG-2 Tất cả các tiêu chuẩn nén trên đều dựa theo một nguyên tắc chungcủa chuẩn nén MPEG (nén video và audio), trong đó nén video MPEG là sựkết hợp giữa nén trong ảnh và nén liên ảnh, còn nén audio MPEG dựa trên kỹthuật "che mặt nạ tâm sinh lý nghe" Tín hiệu truyền hình số sau khi đã nén sẽđược tiếp tục biến đổi thành dòng truyền tải hay dòng chương trình rồi mớiđược điều chế và truyền tới phía thu
Trang 272.2 Quá trình nén dữ liệu
2.2.1 Nén video
2.2.1.1 Nén trong ảnh
Nén trong ảnh dựa trên hai cơ sở:
Một là dựa trên tính chất ảnh có độ dư thừa về mặt không gian Điềunày được hiểu như sau Mỗi một ảnh như chúng ta đã biết có thể coinhư một tập hợp các điểm ảnh Các điểm ảnh này không độc lập riêng
rẽ mà có quan hệ với nhau Mỗi một điểm ảnh cùng với 8 điểm ảnhxung quanh sẽ có quan hệ mật thiết nhất Quan hệ này sẽ giảm dần đốivới các điểm ảnh càng cách xa nhau Trong video, để thuận tiện choviệc nén, người ta dùng khái niệm Block và Macroblock để giới hạncác điểm ảnh có liên quan đến nhau Mỗi block là một ma trận gồm 8x8điểm ảnh, còn một Macroblock lại gồm 4 block Các điểm ảnh trongblock không có sự sai khác nhau nhiều lắm, đặc biệt là các điểm ảnh kếcận nhau, chúng có thể mang những thông tin giống nhau Vì vậy mộtđiểm ảnh có thể được suy từ một vài điểm ảnh khác hay khái quát hơn
từ một số điểm ảnh có thể suy ra toàn bộ ảnh, như vậy ảnh có độ dưthừa thông tin về mặt không gian, việc truyền đi tất cả các điểm ảnh vớinhững thông tin giống nhau là không cần thiết Nén ảnh thực hiện đốivới từng macroblock, nhằm loại bỏ những thông tin dư thừa không cầnthiết, rồi tiến hành mã tiết kiệm (chỉ mã sự sai khác nhau giữa các điểmảnh), nhờ vậy mà số bit cần dùng sẽ giảm xuống rất nhiều
Cơ sở thứ hai là dựa trên đặc tính cảm nhận của mắt Mắt người rấtnhạy cảm với các thành phần tần số thấp, kém nhạy cảm với các chi tiếtnhỏ ứng với các thành phần tần số cao Việc chia ảnh thành các block
là rất hợp lý cho việc nén tín hiệu dựa trên cả hai đặc tính trên Bởi vìtrong một ảnh sẽ có những vùng có độ dư thừa thông tin cao hơn hoặc
có những vùng chứa nhiều thành phần tần số cao mà mắt người kém
Trang 28nhạy cảm nên việc mã hóa không cần chính xác với toàn bộ các mẫucủa ảnh Với những mẫu cầu độ chính xác không cao lắm có thể mãbằng ít bit hơn các mẫu khác, do vậy số bít cần dùng cũng giảm xuốngđáng kể.
Quá trình nén trong ảnh bao gồm 3 bước chính: biến đổi DCT, lượng
tử hóa, mã hóa được biểu diễn trên hình sau:
Hình 2.1 Nén trong ảnh
Trước khi nén, ảnh được chia thành các block gồm 8x8 mẫu tín hiệuchói và các khối tương ứng của tín hiệu màu Từng block sẽ được biến đổicosin rời rạc DCT DCT là phép biến đổi tín hiệu không tổn hao, có tính thuậnnghịch, tín hiệu sau phép biến đổi này hoàn toàn có thể khôi phục nguyên vẹnnhư ban đầu Mục đích của phép biến đổi DCT là xác định thông tin dư thừatrong miền không gian của một macroblock Phép biến đổi DCT biến dữ liệudưới dạng biên độ thành dữ liêu dưới dạng tần số Có thể hiểu phép biến đổinày một cách đơn giản như sau Mỗi một mẫu có vị trí (x,y) trong block cómột giá trị độ chói (đây chính là dữ liệu dưới dạng biên độ) Nếu xét về mặt
tần số thì mỗi mẫu đó ứng với một thành phần tần số cụ thể (gọi là tần số xy),
trong block trước khi biến đổi DCT, các mẫu này được sắp xếp một cách ngẫunhiên về mặt tần số Phép biến đổi DCT dùng một hàm F(u,v) có đối số là vị
Điều khiển tốc độ bítBảng lượng tử
tử hóa
Mã hóa Entropy(VLC,RLC)
Mạch trộn
Bộ đệm
Trang 29trí của mẫu (x,y) và giá trị độ chói của mẫu Kết quả phép biến đổi là mẫu(x,y) sẽ chuyển sang vị trí mới (u,v) trong bảng hệ số DCT 8x8, vị trí (u,v)
ứng với tần số xy của mẫu và giá trị của mẫu mới (hệ số DCT) sẽ biểu thị
lượng thông tin mẫu (x,y) mang, với những mẫu chứa lượng thông tin lớn giátrị f(u,v) là lớn và ngược lại Như vậy, sau phép biến đổi DCT, các mẫu trongblock được sắp xếp lại theo tần số và giá trị mẫu mới C(u,v) biểu thị lượngthông tin mẫu chứa (dữ liệu được chuyển sang dạng tần số)
Mỗi block 8x8 mẫu sẽ cho ra một bảng hệ số DCT (gồm 8x8 số) Hệ sốnằm góc trái trên cùng (hệ số 0,0) ứng với thành phần tần số thấp nhất (thànhphần tần số một chiều) Các hệ số phía dưới giá trị thành phần một chiều, biểuthị các thành phần tần số cao hơn theo chiều dọc Các hệ số ở phía bên phảicủa thành phần một chiều, biểu thị các tần số cao hơn theo chiều ngang Còncác hệ số khác ứng với những phối hợp khác nhau của tần số theo chiều dọc
và chiều ngang Do tính chất của tín hiệu video, hệ số góc trái trên cùng củabảng sẽ có giá trị lớn nhất, các hệ số ứng với thành phần tần số cao, nằm ởgóc phải trên cùng hay góc trái dưới cùng sẽ có giá trị nhỏ nhất
Biến đổi DCT về lý thuyết không giảm bớt dung lượng dữ liệu bởi vìmỗi mẫu cho ta một hệ số DCT Tuy nhiên, nhờ vào phép biến đổi DCT mà taphân định được vùng dữ liệu thừa hay những vùng mắt kém nhạy cảm Quátrình nén được thực hiện ở khâu lượng tử và mã hóa, với các vùng dữ liệu mắtkém nhạy cảm có thể biểu thị bằng một số lượng bit rất nhỏ hoặc loại bỏ màkhông nhận biết được sự suy giảm chất lượng
Lượng tử hóa có thể theo nhiều cách khác nhau Một là tiến hành lượng
tử hóa và mã hóa trực tiếp với các hệ số DCT Có thể nén tín hiệu bằng cách
sử dụng số bit mã phù hợp với các hệ số DCT Số bit dùng để mã thay đổitheo mức độ quan trọng của hệ số DCT, dựa trên cảm nhận của mắt Hệ sốmột chiều (0,0) đòi hỏi độ chính xác cao nhất vì nó biểu thị độ chói trung bình
Trang 30trình lượng tử hóa hệ số một chiều đều có khả năng được nhận biết dễ dàngbởi nó làm thay đổi mức chói trung bình của khối Trong quá trình lượng tửhóa, ta có thể dùng tới 11 bit cho hệ số một chiều và rất ít bit cho các hệ số
có số thứ tự cao hơn ứng với thành phần tần số cao mắt kém nhậy cảm
Lượng tử hóa còn được thực hiện bằng cách thứ hai gọi là lượng tử hóa
có trọng số với cách làm như sau: chia các hệ số DCT (C(u,v)) cho các hệ số
ở vị trí tương ứng với nó trong bảng lượng tử, hệ số ứng với tần số thấp đượcchia cho các giá trị nhỏ (10,11,12, ) Hệ số ứng với tần số cao được chia chocác giá trị lớn (100,120,121, ) và bỏ đi phần thập phân Bằng cách đó, cácthành phần tần số thấp sẽ được lượng tử hóa chính xác hơn các thành phần tần
số cao Bảng lượng tử có thể coi như một ma trận trọng số của bảng hệ sốDCT, giá trị trong bảng lượng tử càng nhỏ thì mức độ quan trọng của hệ sốDCT càng lớn và ngược lại Vì vậy phương pháp này được gọi là lượng tửhóa có trọng số Cần chú ý, lượng tử hóa có trọng số sẽ gây tổn hao, mức độtổn hao phụ thuộc vào giá trị các hệ số trên bảng lượng tử Nếu các giá trị lựachọn thích hợp, tổn hao sẽ rất nhỏ và trên thực tế sẽ không nhận thấy
Sau quá trình lượng tử hóa gián tiếp các hệ số DCT, ta thu được mộtbảng các hệ số C'(u,v), trong đó các hệ số tương ứng với thành phần tần sốcao (được chia cho các hệ số lớn) phần lớn sẽ bằng 0 Các hệ số C'(u,v) sẽđược mã hóa Entropy Mã hóa Entropy là tên gọi chung của các cách mã hóakhông tổn hao, tuân theo lý thuyết về Entropy Lý thuyết này chỉ ra số bittrung bình ít nhất dùng để mã sao cho quá trình mã hóa không gây tổn hao,tức là tín hiệu sau khi mã có thể khôi phục y nguyên như lúc ban đầu Có thể
mã hóa Entropy bằng 2 cách: mã hóa với độ dài thay đổi (VLC) hoặc mã hóatheo chiều dài (RLC) VLC là cách mã hóa dựa trên kết quả của phép thống
kê, các mẫu có xác suất xuất hiện lớn, sẽ mã bằng các từ mã ngắn, các mẫu cóxác xuất xuất hiện thấp, sẽ được mã bằng các từ mã dài hơn RLC là phương
Trang 31pháp mã dựa trên sự lặp lại của cùng giá trị mẫu để tạo ra các mã đặc biệt đểbiểu diễn sự bắt đầu và kết thúc của giá trị được lặp lại Chẳng hạn như, quátrình lượng tử hóa có trọng số tạo ra nhiều giá trị '0', ta sẽ dùng một từ mã đểbiểu diễn độ dài của chuỗi '0' và giá trị '0' của chuỗi Để tăng hiệu quả nén,cách quét (truyền các mẫu) không cần quét lần lượt từng dòng mà theo cácđường zíc - zắc để chuỗi giá trị giống nhau là dài nhất Cả hai cách mã VLC
và RLC đều mang lại hiệu quả nén rất tôt
Sau khi mã hóa Entropy, ta nhận được chuỗi bit có tốc độ thay đổi Nếuphải truyền qua kênh có tốc độ cố định thì cần có bộ nhớ đệm Bộ mã hóa sẽkiểm tra trạng thái đầy của bộ đệm, khi số liệu trong bộ nhớ đệm gần bằngdung lượng cực đại, mạch trộn sẽ điều chỉnh lại các giá trị trong bảng lượng
tử (tăng lên) để các hệ số DCT được lượng tử ít chính xác hơn Ngược lại, khi
bộ nhớ đệm chứa số liệu quá ít, thì các hệ số trong bảng lượng tử nhỏ đi, các
hệ số DCT sẽ được lượng tử hóa chính xác hơn Như vậy tốc độ bit đầu ra sẽ
ổn định và không xẩy ra hiện tượng tràn bộ nhớ đệm
Trên đây là toàn bộ quá trình nén trong ảnh Ảnh tạo ra gọi là ảnh I, quatrình này không sử dụng thông tin của các ảnh trước và sau của ảnh đang xét
2.2.1.2 Nén liên ảnh
Cơ sở của nén liên ảnh là tín hiệu video có chứa thông tin dư thừa trongmiền thời gian Điều này có nghĩa là với một chuỗi liên tục các ảnh, lượngthông tin chứa đựng giữa các ảnh liên tiếp thay đổi rất ít Bởi vậy, tương tựnhư nén trong ảnh là không truyền đi toàn bộ các điểm ảnh, nén liên ảnh cũngkhông cần thiết phải truyền toàn bộ chuỗi ảnh mà chỉ cần truyền một số ảnhgốc và các thông tin để khôi phục các ảnh còn lại (thông tin này gọi là số liệu
về véc-tơ chuyển động) Nhờ việc giảm bớt số ảnh cần truyền mà lượng thôngtin truyền đi sẽ giảm xuống rất nhiều Mặt khác ta có thể nâng cao hiệu quả
Trang 32tế của ảnh dự đoán (ảnh sau quá trình nén vi sai được gọi là ảnh khác biệt),trong cách mã này phía phát cần có các bước để tạo ảnh dự đoán Khi phátthay vì truyền đi các ảnh gốc ta chỉ truyền ảnh khác biệt cùng với các thôngtin để khôi phục ảnh (là các véc-tơ chuyển động) Véc-tơ chuyển động vừađược sử dụng để tạo ảnh dự đoán ở phía phát và vừa được truyền đi để khôiphục ảnh đã nén thành dạng ban đầu trong phần giải nén Ảnh dự đoán càngchính xác thì thông tin cần truyền sẽ càng ít, hiệu quả nén càng cao.
Có hai phương pháp nén liên ảnh: mã hóa ảnh dự đoán trước tạo ra ảnhloại P và mã hóa ảnh dự đoán hai chiều tạo ra ảnh loại B Dưới đây là sơ đồtổng quát của 2 phương pháp nén
Hình 2.2 Nén liên ảnh
Hai phương pháp trên đều dựa theo nguyên tắc mã vi sai giữa ảnh dựđoán và ảnh thực tế như đã nói Điểm phân biệt giữa hai phương pháp là ởcách xác định véc-tơ chuyển động (hay cách tạo ra ảnh dự đoán)
Véctơ chuyển động
+_
+
Ảnh thực tế của
ảnh dự đoán
Ảnh so sánh
Ảnh dự đoán
Trang 33Trong sơ đồ trên, "ảnh thực tế của ảnh dự đoán "chính là ảnh gốc chưa
bị nén Ảnh này có hai nhiệm vụ, một là dùng để xác định véc-tơ chuyểnđộng, nhiệm vụ thứ hai là để so sánh với ảnh dự đoán để tạo ra ảnh khác biệt
Đối với ảnh loại P, thông tin dùng để tạo ảnh dự đoán được lấy từ cácảnh trước đó Cách xác định véc-tơ chuyển động đối với ảnh P như sau Ảnhthực tế của ảnh dự đoán và ảnh đem so sánh (ảnh trước đó) đều được chiathành các maroblock So sánh giữa hai ảnh ta sẽ xác định phần chuyển động
và phần tĩnh của ảnh Phần tĩnh sẽ giữ nguyên vị trí còn phần động sẽ chuyểnsang maroblock khác trong "ảnh thực tế của ảnh dự đoán" Xác địnhmaroblock chứa phần động trong ảnh gốc và ảnh thực tế thì đoạn nối giữa 2maroblock tạo ra véc-tơ chuyển động Ảnh dự đoán nhận được bằng cách dịchchuyển phần động sang vị trí mới theo véc-tơ chuyển động, còn phần tĩnh giữnguyên như trong ảnh so sánh
Đối với ảnh lại B, thông tin dùng để tạo ra ảnh dự đoán được lấy từ ảnhphía trước và phía sau "ảnh thực tế của ảnh dự đoán" Ảnh thực tế đem sosánh với ảnh trước và ảnh sau sẽ tạo ra hai véc-tơ chuyển động Các ảnh phíatrước và ảnh sau của "ảnh thực tế của ảnh dự đoán " sẽ là các ảnh so sánh.Như vậy, khác với ảnh P, ảnh so sánh của ảnh P là các ảnh phía trước nó, ảnh
so sánh của ảnh B bao gồm ít nhất hai ảnh lấy từ 2 phía (trước và sau của ảnhB), bởi vậy ảnh dự đoán loại B sẽ chính xác hơn, mức độ nén số liệu sẽ caohơn so với trường hợp nén ảnh P
2.2.1.3 Nén video theo tiêu chuẩn MPEG
Nguyên lý nén MPEG video được trình bày theo sơ đồ sau:
Trang 34Hình 2.3 Nguyên lý nén MPEG
MPEG là sự kết hợp giữa nén trong ảnh và nén liên ảnh Quá trình nénliên ảnh được thực hiện trước tạo ra ảnh khác biệt ở đầu ra bộ cộng Ảnh nàysau đó lại được nén trong ảnh qua các bước: biến đổi DCT, lượng tử hóa, mãhóa Cuối cùng ảnh này được trộn với véc-tơ chuyển động đưa đến bộkhuyếch đại đệm rồi truyền đi
Ví dụ đầu vào của bộ nén là một chuỗi các ảnh liên tiếp nhau, ảnh thứnhất mã hóa như loại ảnh I Trong trường hợp này, sau khi lấy mẫu lần đầutiên, tín hiệu video được truyền đến khối biến đổi DCT cho các macroblockriêng, sau đó được đưa đến bộ lượng tử hóa và mã hóa entropy Tín hiệu ra từ
bộ lượng tử hóa được đưa đến bộ lượng tử hóa ngược, biến đổi DCT ngượcsau đó được lưu vào bộ nhớ ảnh Bộ nhớ ảnh bao gồm ảnh xuất hiện trong bộgiải mã sau khi giải mã ảnh truyền loại I
Trang 35Trong trường hợp mã hóa ảnh loại P, trên cơ sở so sánh giữa ảnh đangxét và ảnh trong bộ nhớ, ta sẽ xác định được các véc-tơ chuyển động, sau đó
dự báo ảnh Sự chênh lệch giữa ảnh đang xét và dự báo ảnh của nó lại đượcbién đổi DCT, lượng tử hóa và mã hóa entropy Cũng như trong trường hợpcác loại ảnh I, tín hiệu ra từ bộ lượng tử hóa được giải lượng tử hóa và biếnđổi ngược DCT rồi cộng với ảnh dự báo đang xét và lưu vào bộ nhớ dùngtrong dự báo ảnh tiếp theo
Một vấn đề đặt ra đối với nén ảnh MPEG là, trong chuỗi ảnh gồm nhiềuảnh liên tiếp như vậy, ảnh nào sẽ được mã hóa như loại ảnh I, ảnh P, hay ảnh
B Việc quyết định nén ảnh theo loại nào (I, P, B) cho từng ảnh sẽ có một bộphận đảm nhiệm, từ đó sinh ra khái niệm nhóm ảnh GOP và điều khiển nhómảnh Nhờ việc điều khiển nhóm ảnh mà chuỗi ảnh liên tiếp sẽ ngắt thànhnhiều đoạn liên tiếp, mỗi đoạn sẽ chứa một số GOP, các ảnh trong GOP sẽđược nén loại I, P, hay B theo sự điều khiển của nhóm ảnh Có hai cấu trúccủa GOP: cấu trúc GOP mở quy định ảnh bắt đầu và kết thúc của GOP đều làảnh I, cấu trúc GOP đóng quy định ảnh bắt đầu của GOP là ảnh I còn ảnh kếtthúc là ảnh P GOP được xác định bởi hai thông số m và n, trong đó thông số
m xác định số ảnh P và B xuất hiện giữa hai ảnh I gần nhất, n xác định sốkhung P giữa hai khung B
Như chúng ta đã biết, nhờ có điều khiển nhóm ảnh mà chuỗi ảnh liêntiếp được ngắt thành các đoạn nối tiếp nhau Đoạn là đơn vị lớn nhất củachuỗi ảnh, ta sẽ phân tích cấu trúc bit của một đoạn, trong một đoạn sẽ chứanhững thông tin gì (Hình 2.4 sẽ mô tả cấu trúc bit của một đoạn video)
Trang 36Hình 2.4 Cấu trúc số liệu nén ảnh MPEG
Thông tin đầu
Đoạn thứ N-1
Dòng cơ sở
Thông tin kết thúc đoạn
Thuộc tính MB
Véc-tơ chuyển động