Để đáp ứng được nhu cầu đó, hệ thống truyền hình số đang sử dụng các phương pháp xử lý và mã hóa để phù hợp với các tín hiệu audio và video.. Nội dung bài này sẽ trình bày về các phươ
Trang 1Method of coding and signal processing in digital television
Nguyễn Văn Hùng, Đinh Nguyễn Ngọc Tân
Trường Đại học Giao thông Vận tải – Cơ sở II e-Mail: nguyenhungktvtk50@gmail.com
Tóm tắt
Hệ thống truyền hình số đang được sử dụng ngày
càng rộng rãi trong trong cuộc sống với chất lượng và
dịch vụ ngày càng tốt Để đáp ứng được nhu cầu đó,
hệ thống truyền hình số đang sử dụng các phương
pháp xử lý và mã hóa để phù hợp với các tín hiệu
audio và video Nội dung bài này sẽ trình bày về các
phương pháp mã hóa và xử lý tín hiệu trong truyền
hình số, bao gồm các mã và các chuẩn nén
Abstract
Digital television system is using widely in life with
the quality and better services To meet that demand,
digital TV system is using the processing method and
encryption to match the audio and video signals The
contents of this article will talk about the methods of
coding and signal processing in digital television,
including the codes and the compression
Discrete Cosine Transform
Joint Photographic Experts Group
Moving Picture Experts Group
Run-length and level coding
Phần mở đầu
Trên thế giới, các nhà điều hành cáp, vệ tinh, trên mặt
đất đều đang chuyển động đến môi trường số Hầu hết
các nhà phân tích công nhgiệp đều dự báo việc
chuyển dịch lên truyền hình số là một sự tiến hóa
(evolution) hơn là một cuộc cách mạng (revolution),
nó làm thay đổi cách sống của hàng trăm triệu gia
đình trên thế giới Các công ty cho rằng sự hội tụ giữa
máy tính cá nhân, máy thu hình (TV sets) và Internet
đã bắt đầu và điều đó sẽ dẫn đến sự chuyển hóa cực
đại về máy tính, đối với người tiêu dùng, kỷ nguyên
mới về số sẽ nâng cao việc xem truyền hình ngang với chất lượng chiếu phim, âm thanh ngang với chất lượng CD cùng với hàng trăm kênh truyền hình mới
và nhiều dịch vụ mới, Truyền hình số cho thuê bao xem được nhiều chương trình truyền hình với chất lượng cao nhất Đối với các nhà phát sóng truyền hình, việc chuyển dịch lên môi trường số sẽ làm giảm việc sử dụng băng tần/kênh, làm tăng khả năng cung cấp các ứng dụng Internet cho thuê bao và mở ra một lĩnh vực mới, các cơ hội mới về thương mại
Trên năm mươi năm qua, truyền hình sử dụng tín hiệu tương tự như là một phương tiện truyền dẫn phát sóng, Việc chấm dứt truyền hình tương tự và phát triển truyền hình số đòi hỏi phải đầu tư mới máy thu hình số, máy phát hình số, các thiết bị sản xuất và hậu
kỳ số cho chương trình truyền hình, Điều đó dẫn đến phải sử dụng một mặt bằng số chung, mở ra các cơ hội cho thị trường dân dụng
Truyền hình số có tốc độ truyền dữ liệu cao, cho phép cung cấp nội dung đa phương tiện phong phú và người xem truyền hình có thể lướt qua Internet bằng máy thu hình Nhờ có kỹ thuật nén, có thể phát sóng nhiều chương trình truyền hình trên một kênh sóng (truyền hình tương tự phát sóng 1 chương trình /1 kênh sóng)
1.1 Giảm tốc độ dữ liệu không tổn thất
Nén không tổn thất cho phép khôi phục lại thông tin
dữ liệu gốc giãn (ngược lại với nén) Một số phương pháp nén không tổn hao tiêu biểu
Trang 2có chiều dài không đổi là 8 bits Trong nhiều tập tin,
xác suất xuất hiện các kí tự này là nhiều hơn các kí tự
khác, từ đó ta thấy ngay rằng nếu chỉ dùng một vài bit
để biểu diễn cho các kí tự có xác suất xuất hiện lớn và
dùng nhiều bit hơn để biểu diễn cho các kí tự có xác
suất xuất hiện nhỏ thì có thể tiết kiệm được độ dài tập
tin một cách đáng kể Ví dụ, để mã hoá một chuỗi như
sau
"ABRACADABRA"
Nếu mã hoá chuỗi trên trong dạng mã nhị phân 5 bit
ta sẽ có dãy bit sau:
0000100010100100000100011000010010000001000
101001000001
1.1.2 Mã hóa Entropy(Entropy coding)
Định lý này được phát biểu rằng: đối với các chữ cái
mã hoá bằng số nhị phân, chiều dài từ mã trung bình,
lớn hơn hoặc bằng với entropy Người ta định nghĩa
entropy là:
Trong đó pi là xác suất của bản tin thứ i Giá trị
log2(1/pi) được hiểu như là nội dung của thông tin và
đơn vị của nó là bit Entropy là lượng tin trung bình
trên bản tin Gọi chiều dài từ trung bình là n, định lý
này được xác định bằng công thức sau: n ≥ H
1.2 Giảm tốc độ dữ liệu tổn thất
1.2.1 Phương pháp mã dự đoán có tổn hao
H 1 sơ đồ khối mã hóa dự đoán có tổn thất
mức lượng tử gần nhất là hiệu quả nén của hệ thống
mã hóa và sai số giữa ảnh nén và ảnh gốc sẽ phụ thuộc vào số mức lượng tử được sử dụng trong coder
1.2.2-Mã hóa DCT
Biến đổi DCT: là biến đổi cosin rời rạc DCT (Discrete Cosine Transform) DCT biến đổi dữ liệu từ miền không gian sang miền tần số
Biến đổi DCT được thực hiện trong phạm vi các khối 8×8 mẫu tín hiệu chói
Y và các khối tương ứng của tín hiệu hiệu màu (UV hoặc IQ)
DCT hai chiều: Biến đổi DCT hai chiều (2-D) được dùng cho các khối ảnh có kích thước 8×8 Quá trình biến đổi thuận DCT (Forward DCT) dùng trong tiêu chuẩn JPEG được định nghĩa như sau:
1.2.3-Giải mã DCT
H 2 Sơ đồ khối bộ giải mã tín hiệu JPEG
Các bảng này được đưa tới khối giải mã entropy và khối lượng tử ngược Dữ liệu mang tin tức về ảnh được lần lượt đưa qua bộ giải mã entropy, giải mã DPCM và RLC Các hệ số DC và AC sau khi giải mã
Trang 3Phần II: phương pháp xử lý tín hiệu
2.1 Tín hiệu số
Tín hiệu số là dạng tín hiệu đặc trưng bởi 2 mức giá
“0” hay “1” và các mạch số chỉ làm việc với hai mức
giá trị này
Chuyển đổi DAC (digital to ananlog
converter: Đây là quá trình lấy tín hiệu số (ở
dạng nhị phân) chuyển thành tín hiệu analog
với mức điện áp hay dòng điện tỉ lệ với giá
trị số ở ngõ vào
Chuyển đổi ADC (analog to digital
converter): Là quá trình chuyển đổi tín hiệu
từ tương tự sang số gọi tắt là A\D là quá
trình ngược của D\A, nhưng phức tạp hơn
D\A và thời gian chuyển đổi cũng nhiều, dài
hơn
2.1.1-nén video
Tín hiệu video sau khi được số hóa 8 bit có tốc độ
216Mbit/s Để có thể truyền được trong một kênh
truyền hình thông thường tín hiệu video số cần phải
được “nén” trong khi đó vẫn đảm bảo chất lượng hình
ảnh
2.1.1.1-Chuẫn nén MPEG
Tiên chuẩn JPEG dùng cho nén ảnh tĩnh và đơn sắc
và màu thực hiện bởi bốn mode mã hóa đó là
Mã hóa tuần tự: ảnh được mã hóa theo kiểu
quét từ trái qua phải, từ trên xuống dưới dựa
trên khối DCT
Mã hóa lũy tiến: ảnh được mã hóa bằng kiểu
quét phức hợp theo chế độ phân giải không
gian cho các ứng dụng trên các kiểu băng
hẹp và do đó thời gian truyền dẫn có thể dài
Mã hóa không tổn thất: ảnh được đảm bảo
khôi phục chính xác cho mỗi giá trị mẫu của
nguồn Thông tin không cần thiết sẽ bị cắt bỏ
nên cho hiệu quả nén thấp hơn so với có
phương pháp nén có tổn thất
Mã hóa phân cấp: ảnh được mã hóa ở chế độ
phân giải không gian phức hợp, để cho
những ảnh có phân giải thấp có thể được truy
xuất và hiển thị mà không cần giải nén như
những ảnh có độ phân giải trong không gian
Nén liên ảnh: một tính chất nữa của tín hiệu video là
có chứa thông tin dư thừa trong miền thời gian Điều này có nghĩa là với một chuỗi liên tục các ảnh, lượng thông tin chứa đựng trong mỗi ảnh thay đổi rất ít từ ảnh này sang ảnh khác Tính toán sự chuyển dịch vị trí của nội dung hình ảnh là một phần quan trọng trong nén liên ảnh
Tiêu chuẩn đầu tiên là MPEG-1, mục tiêu là mã hóa tín hiệu audio và video với tốc độ bit là 1,5Mbit/s Tiêu chuẫn thứ hai là MPEG-2 với những công cụ mã hóa khác nhau, nhằm lưu trữ ảnh động vào đĩa với dung lượng bit thấp
2.1.2 Nén video
Các kỹ thuật mã hóa nguồng cũng được sử dụng nhằm làm giảm lượng thông tin dư thừa trong video, các kỹ thuật che sử dụng cảm nhận âm thanh phép loại bỏ các phần tín hiệu không thể nghe được sẽ tạo nên các phương pháp nén dòng tín hiệu audio trong hệ thống chung
2.1.2.1 Tiêu chuẩn nén audio MPEG-1
Là một hệ thống nén video và audio để lưu giữ chương trình với tốc đố 1.5 Mbit/s thành phần audio theo tiêu chuẩn này xác định 3 lớp để mã hóa tín hiệu PCM với tần số lấy mẫu bằng 32; 44,1; 48 kHz
2.1.2.2-Tiêu chuẩn nén audio MPEG-2
Đây là tiêu chuẩn nén mở rộng của MPEG-1 để cho các ứng dụng mới, tiêu chuẩn nén MPEG-2 audio có thể áp dụng cho nhiều tốc độ khác nhau từ 32 đến
1066 Kbit/s, với chất lượng âm thanh biến đổi tùy theo ứng dụng khung MPEG-2 audio được chia làm 2 phần, một dòng bit cơ bản tương thích với chuẩn MPEG-1 (384 kbit/s cho lớp II) và một dòng bit mở rộng với lớp II, tại tốc độ 64kbit/s cho một kênh audio, quá trình mã hóa có thể phối hợp 5 kênh audio
để tạo thành dòng bit có tốc độ 320 kbit/s
Mã hóa MPEG-2 audio cho phép nén đồng thời 0 kênh, tropng đó có 1 kênh sử dụng tín hiệu audio tần
số thấp, nhằm phục vụ cho các chương trình mang hiệu ứng âm thanh đặc biệt
Trang 4được gỉam còn một nửa mức tần số lấy mẫu của
chuẩn nén MPEG-1, tức là 16; 22,5 hoặc 24 khz
3 Kết luận
Từ những trình bày trên, mã hóa âm thanh chất lượng
cao đã được ứng dụng trong thực tế Mục tiêu là xây
dựng được tiêu chuẩn mã hóa tín hiệu âm thanh để sử
dụng độc lập hoặc đi kèm với hình ảnh, với tốc độ bit
khoảng 64 đến 192Kbit/s
Truyền hình số chắc chắn sẽ kèm dữ liệu âm thanh có
nén với tốc độ bit thấp Sự lựa chọn tiêu chuẩn mã
hóa sẽ phải dựa trên nhiều yếu tố, sử dụng loại mã
nào cho phù hợp với tiên chuẩn truyền hình số Một
trong những nội dung cần bàn luận nhiều nhất có lẽ là
Tài liệu tham khảo
1 Hoàng Ninh; Hoàng Gia Khánh; Trịnh Duy
Thăng; Nguyễn Tiên: Giáo trình truyền hình
Nhà xuất bản khoa học kỹ thuật
2 Nguyễn Kim Sách: Truyền hình số & HDTV
Nhà xuất bản khoa học và kỹ thuật, Hà nội,
1995
3 Andrew F Inglis: Video Engineering
McCraw-Hill Companies, Inc, 1993
Trang 6NHẬN XÉT CỦA CÁN BỘ HƯỚNG DẪN
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
Ngày tháng năm 201
ThS Trần Xuân Trường
Trang 7LỜI CẢM ƠN Chúng em xin gửi lời cảm ơn đến Ban giám đốc Trường Đại Học Giao Thông Vận Tải-cơ sở II, bộ môn Điện-Điện tử đã tạo cho chúng em có dịp để nghiên cứu, tìm hiểu và trình bày về một vấn đề khoa học mà chúng em quan tâm
Chúng em xin cảm ơn Thầy Ths Trần Xuân Trường là người trực tiếp hướng dẫn
đề tài nghiên cứu của chúng em
Nhân dịp này, chúng tôi xin chân thành cảm ơn ông: Ngô Thái Trị, Đỗ Hoàng Tiến, Vũ Đức Lý, Nguyễn Kim Sách, Hoàng Ninh, Hoàng Gia Khánh, Trịnh Duy Thăng, Nguyễn
Tiên; các Ông Michael Robin và Michel Poulin, Arch C.Luther là tác giả những tài liệu
mà chúng tôi tham khảo trong quá trình nghiên cứu và biên soạn
Nhóm sinh viên thực hiện
Trang 8LỜI NÓI ĐẦU Ngày nay, hệ thống truyền hình số đang được sử dụng rộng rãi và dần thay thế các
hệ thống tương tự Hệ thống tryền hình số muốn truyền tải được tín hiệu với tốc độ cao thì phải đảm bảo sử dụng các loại mã và phương pháp thích hợp với hệ thống truyền hình
số Để hiểu rõ hơn về điều đó và để bổ sung vào tủ sách học tập của sinh viên, chúng em tìm hiểu và trình bày về: “NGHIÊN CỨU ỨNG DỤNG PHƯƠNG PHÁP MÃ HÓA VÀ
XỬ LÝ TÍN HIỆU TRONG TRUYỀN HÌNH SỐ”
Nội dung bao gồm:
Chương 1: Tổng quan về tín hiệu số
Chương 2: Phương pháp mã hóa cho các tín hiệu đảm bảo thích hợp với các hệ thống truyền hình số
Chương 3: Phương pháp xử lý cho các tín hiệu đảm bảo thích hợp với các hệ thống truyền hình số
Trong quá trình nghiên cứu, tìm hiểu dù đã có rất nhiều cố gắng xong nhóm chúng
em không tránh khỏi những khó khăn, thiếu sót cũng như sai lầm Mong nhận được ý kiến đóng góp của Thầy để nội dung được hoàn chỉnh hơn
Nhóm sinh viên thực hiện
Trang 9MỤC LỤC
NHẬN XÉT CỦA CÁN BỘ HƯỚNG DẪN 1
LỜI CẢM ƠN 2
LỜI NÓI ĐẦU 3
MỤC LỤC 4
CÁC THUẬT NGỮ VIẾT TẮT 5
DANH MỤC HÌNH ẢNH, BẢNG BIỂU 6
CHƯƠNG 1- TỔNG QUAN TÍN HIỆU DIGITAL 7
1.1- Giới thiệu về truyền hình số 8
1.2- Tiêu chuẩn tryền hình số 8
1.3- Đặc điểm truyền hình cáp digital 9
CHƯƠNG 2 - PHƯƠNG PHÁP MÃ HÓA CHO CÁC TÍN HIỆU ĐẢM BẢO THÍCH HỢP VỚI CÁC HỆ THỐNG TRUYỀN HÌNH SỐ 11
2.1- Giảm tốc độ dữ liệu không tổn thất 11
2.1.1- Mã Hóa Huffman 11
2.1.2- Mã hóa Entropy 13
2.2- Giảm tốc độ dữ liệu tổn thất 20
2.2.1- Phương pháp mã dự đoán có tổn hao 21
2.2.2- Mã hóa DCT 22
2.2.3- Giải mã DCT 31
CHƯƠNG 3 - PHƯƠNG PHÁP XỬ LÝ CHO CÁC TÍN HIỆU ĐẢM BẢO THÍCH HỢP VỚICÁC HỆ THỐNG TRUYỀN HÌNH SỐ 32
3.1- Tín hiệu 32
3.1.1- Tín hiệu số 32
3.1.2- Các phương pháp xử lý tín hiệu 32
3.2- Tín hiệu video số 45
3.3- Tín hiệu audio số 47
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỒ ÁN 50
DANH MỤC CÁC TÀI LIỆU THAM KHẢO 51
Trang 10CÁC THUẬT NGỮ VIẾT TẮT
A/D Analog to digital converter
ADC Analog-Digital Converter
DAC Digital-Analog Convert
DCT Discrete Cosine Transform
DVB Digital Video Broadcasting
END Equivalent Noise Degradation
JPEG Joint Photographic Experts Group
Trang 11DANH MỤC HÌNH ẢNH
Hình 2.2.1: Sơ đồ khối mã hóa dự đóan có tổn thất
Hình 2.2.2-1: Mã hóa khối DCT 2 chiều
Hình 2.2.2-2: Quá trình biến đổi DCT hai chiều
Hình 2.2.2-2: Quá trình biến đổi DCT hai chiều
Hình 2.2.2.3 Sơ đồ khối bộ mã hóa thành phần DC
Hình 2.2.2.3 Sơ đồ khối bộ mã hóa thành phần DC
Hình 2.2.2.3-3: Block DCT cần được mã hóa
Hình 2.2.2.4 Sơ đồ khối của bộ mã hóa thành phần AC
Hình 2.2.3: Sơ đồ khối bộ giải mã tín hiệu JPEG
Hình 3.1.2.1-1 Sơ đồ khối thuật toán mã hóa và giải mã tiêu chuẩn JPEG
Hình 3.1.2.1-2 : Cấu trúc ảnh Mpeg
Hình 3.1.2.1-3: Sơ đồ khối quá trình mã hóa MPEG
Hình 3.1.2.1-4: Giải mã MPEG
Hình 3.1.2.2-1 Hệ thống mã hóa điểm động khối số liệu audio
Hình 3.1.2.2-2: Cấu trúc bộ mã hóa audio MPEG
Hình 3.1.2.2-3: Cấu trúc bộ giải mã audio MPEG
Hình 3-2-2: Biến đổi A/D tín hiệu màu thành phần
DANH MỤC BẢNG
Bảng 2.1.2: Mã hóa chuỗi
Bảng 2.2.2.3-2: Bảng mã Huffman dành cho thành phần DC
Bảng 2.2.2.4: Bảng phân loại
Trang 12CHƯƠNG 1: TỔNG QUAN TÍN HIỆU DIGITAL 1.1- Giới thiệu về truyền hình số
Truyền hình số (Digital Television) là một phương pháp truyền hình hoàn toàn mới Trên thế giới, các nhà điều hành cáp, vệ tinh, trên mặt đất đều đang chuyển động đến môi trường số, Ở Châu Âu, truyền hình số đã được sử dụng ở Anh (phát sóng truyền hình số 1999, Đức, Pháp, Ireland, Tây Ban Nha, Hà Lan, Thụy Điển, Hầu hết các nhà phân tích công nhgiệp đều dự báo việc chuyển dịch lên truyền hình số là một sự tiến hóa (evolution) hơn là một cuộc cách mạng (revolution), nó làm thay đổi cách sống của hàng trăm triệu gia đình trên thế giới Các công ty cho rằng sự hội tụ giữa máy tính
cá nhân, máy thu hình (TV sets) và Internet đã bắt đầu và điều đó sẽ dẫn đến sự chuyển hóa cực đại về máy tính Đối với người tiêu dùng, kỷ nguyên mới về số sẽ nâng cao việc xem truyền hình ngang với chất lượng chiếu phim, âm thanh ngang với chất lượng
CD cùng với hàng trăm kênh truyền hình mới và nhiều dịch vụ mới Truyền hình số cho thuê bao xem được nhiều chương trình truyền hình với chất lượng cao nhất
Đối với các nhà phát sóng truyền hình, việc chuyển dịch lên môi trường số sẽ làm giảm việc sử dụng băng tần/kênh, làm tăng khả năng cung cấp các ứng dụng Internet cho thuê bao và mở ra một lĩnh vực mới, các cơ hội mới về thương mại, nhiều dịch vụ mới trên cơ sở truyền hình số sẽ được hình thành:
Truy cập Internet tại các tốc độ Chơi Game trên mạng với nhiều người Video theo yêu cầu VOD (video – on - demand) Cung cấp các dòng video và audio
Dịch vụ thanh toán tiền từ nhà (home banking) Các dịch vụ thương mại điện tử
Cập nhật phần mềm máy tính Truyền thanh, truyền hình đa phương tiện (Multimedia)
Trang 13Đọc báo điện tử Trên năm mươi năm qua, truyền hình sử dụng tín hiệu tương tự như là một phương tiện truyền dẫn phát sóng, Việc chấm dứt truyền hình tương tự và phát triển truyền hình số đòi hỏi phải đầu tư mới máy thu hình số, máy phát hình số, các thiết bị sản xuất và hậu kỳ số cho chương trình truyền hình, Điều đó dẫn đến phải sử dụng một mặt bằng số chung, mở ra các cơ hội cho thị trường dân dụng
Truyền hình số có tốc độ truyền dữ liệu cao, cho phép cung cấp nội dung đa phương tiện phong phú và người xem truyền hình có thể lướt qua Internet bằng máy thu hình Nhờ có kỹ thuật nén, có thể phát sóng nhiều chương trình truyền hình trên một kênh sóng (truyền hình tương tự phát sóng 1 chương trình /1 kênh sóng)
1.2- Tiêu chuẩn truyền hình số
Các tổ chức về tiêu chuẩn quốc tế là các cơ sở nghiên cứu và đề xuất các tiêu chuẩn truyền hình số, ví dụ một vài tổ chức quốc tế như:
ETSI (the European Telecommunications Standards Institute)
DVB (Digital Video Broadcasting)
ATSC (the Advanced Television Systems Committee)
DAVIC (the Digital Audio Visual Council)
ECCA (the European Cable Communications Association)
CableLabs
W3C (W3 Consortium)
FCC (the Federal Communications Commission)
ETSI là một tổ chức phi lợi nhuận, xác định và cung cấp các tiêu chuẩn viễn thông, ETSI bao gồm một hội đồng chung GA (General Assembly) , 1 uỷ ban (Broard), một tổ chức kỹ thuật TO (Technical Organization) và một ban thư ký, Tổ chức TO đề
Trang 14xuất và quảng bá các tiêu chuẩn kỹ thuật Trên 3500 chuyên gia làm việc cho ETSI trong 200 nhóm
1.3- Đặc điểm truyền hình cáp Digital
Sự tiến bộ của công nghệ truyền hình cáp số trong việc mã hóa hình ảnh và âm thanh, sản xuất chương trình, lưu trữ và phát sóng đang làm thay đổi một cách nhanh chóng những quan niệm truyền thống về phát thanh và truyền hình Trong kỹ thuật truyền hình cáp số, tín hiệu video và audio được truyền chung trên một kênh, Thuê bao
có thể lựa chọn và xem các chương trình theo ý muốn Ngày nay, mạng cáp phân phối thường là mạng đa dịch vụ phức tạp điển hình là mạng HFC (Hybrid Fiber Coax) Mạng HFC là sự kết hợp tối ưu giữa cáp đồng trục và cáp quang, Mạng HFC là mạng băng rộng tuyến tính cho phép truyền đồng thời nhiều tín hiệu cao tần RF (radio frequency), mỗi tín hiệu có băng tần khác nhau được ghép kênh theo tần số FDM (Frequency Division Multiplexing)
Để đáp ứng nhu cầu ngày càng cao của khách hàng, việc cải tiến khả năng truyền và cung cấp các dịch vụ trên cáp là quan trọng, đã có nhiều đề án cải tiến tập trung quan tâm đến việc truyền các kênh truyền hình số trên cáp: Ở Châu Á và Nhật Bản có tiêu chuẩn ISDB (Integrated Services Digital Broadcasting: phát số các dịch vụ tổng hợp) Tiêu chuẩn này cho phép truyền nhiều dịch vụ số như truyền hình nhiều kênh, Fax, Teletex, hình ảnh tĩnh và các dữ liệu khác qua một kênh giống kênh của một chương trình truyền hình tương tự Ở Châu Âu nhóm nghiên cứu DVB (Digital Video Broadcasting) đã đưa ra các tiêu chuẩn mô tả việc cung cấp các dịch vụ truyền hình số trên cáp, Tiêu chuẩn do nhóm DVB rất được quan tâm và được ứng dụng ở Châu Âu cũng như nhiều nơi trên thế giới Thành công có ý nghĩa của dự án DVB là độ phân giải cao của hệ thống truyền hình trực tiếp đến tận nhà Dự án DVB là sự kết hợp hài hòa giữa các chuẩn của ETSI cho truyền dẫn các dịch vụ đa phương tiện và đa chương trình qua các phương tiện quảng bá như các vệ tinh, mạng truyền hình cáp CATV, hệ thống phân phối video từ một điểm đến nhiều điểm MVDS (Multipoint Video Distribution)
và các kênh UHF các trạm mặt đất
Trang 15Sự ra đời của các chuẩn truyền hình số có các ưu điểm vượt trội so với các chuẩn truyền dẫn và phát tín hiệu truyền hình tương tự như
Khả năng chống nhiễu cao
Có khả năng phát hiện và sửa lỗi
Chất lượng chương trình trung thực do tại phía thu tín hiệu truyền hình số có khả năng phát hiện và tự sửa lỗi nên tín hiệu được khôi phục hoàn tòan giống khi phát
Tiết kiệm phổ tần số và kinh phí đầu tư bằng cách sử dụng công nghệ nén MPEG–2 và phương thức điều chế tín hiệu số có mức điều chế cao: QBSK, QAM, 16QAM, nhờ đó dải tần 8Mhz có thể tải được 4 – 8 kênh chương trình truyền hình số chất lượng cao
Khả năng thực hiện truyền hình tương tác, truyền số liệu và có khả năng truy cập Internet
Trang 16CHƯƠNG 2 PHƯƠNG PHÁP MÃ HÓA CHO CÁC TÍN HIỆU ĐẢM BẢO THÍCH HỢP VỚI
CÁC HỆ THỐNG TRUYỀN HÌNH SỐ
Phương pháp mã hóa các tín hiệu đảm bảo thích hợp với các hệ thống truyền hình
số được chia theo 2 phương pháp
Giảm tốc độ dữ liệu không tổn thất
Giảm tốc độ dữ liệu có tổn thất
2.1- Giảm tốc độ dữ liệu không tổn thất
Nén không tổn thất cho phép khôi phục lại thông tin dữ liệu gốc giãn (ngược lại với nén) Nén không tổn thất đối với ảnh có chất lượng truyền hình sẽ không cho tỉ lệ nén cao (thường dùng tỉ lện nén 1:2) Số lượng dữ liệu giảm phụ thuộc vào nội dung ảnh, dẫn đến các ứng dụng có tốc độ bit thay đổi VBR (variable-bit-rate) như lưu trữ ảnh tĩnh và truyền dẫn Sau đây chúng ta phân tích một số phương pháp nén không tổn hao tiêu biểu
VLC (variable-length coding) mã hóa Huff man và mã hóa Entropy
dựa trên cơ sở xác suất các giá trị biên độ giống nhau trong 1 ảnh và
1 mã ngắn cho các giá trị có xác suất xuất hiện cao nhất và các từ mã dài cho các giá trị biên độ còn lại (xác suất xuất hiện thấp) trong ảnh.Ở phần dãn (giải nén), việc gán các từ mã giống nhau được dùng
để tạo lại các giá trị dữ liệu gốc Mã hóa Huffman dễ sử dụng nhờ
bảng tìm kiếm (look-up tables) trong phần cứng
2.1.1- Mã hóa Huffman
Các tập tin của máy tính được lưu dưới dạng các kí tự có chiều dài không đổi là 8 bits Trong nhiều tập tin, xác suất xuất hiện các kí tự này là nhiều hơn các kí tự khác, từ đó ta thấy ngay rằng nếu chỉ dùng một vài bit để biểu diễn cho các kí tự có xác suất xuất hiện
Trang 17lớn và dùng nhiều bit hơn để biểu diễn cho các kí tự có xác suất xuất hiện nhỏ thì có thể tiết kiệm được độ dài tập tin một cách đáng kể Ví dụ, để mã hoá một chuỗi như sau
Ta có thể gán các chuỗi bit ngắn nhất cho các kí tự được dùng phổ biến nhất, giả
sử ta gán: A là 0, B là 1, R là 01, C là 10 và D là 11 thì chuỗi trên được biễu diễn như sau:
0 1 01 0 10 0 11 0 1 01 0
Ví dụ này chỉ dùng 15 bits so với 55 bits như ở trên, nhưng nó không thực sự là một mã vì phải lệ thuộc vào khoảng trống để phân cách các kí tự Nếu không có dấu phân cách thì ta không thể giải mã được thông điệp này Ta cũng có thể chọn các từ mã sao cho thông điệp có thể được giải mã mà không cần dấu phân cách, ví dụ như: A là 11, B là
00, C là 010, D là 10 và R là 011, các từ mã này gọi là các từ mã có tính prefix (Không có
từ mã nào là tiền tố của từ mã khác) Với các từ mã này ta có thể mã hoá thông điệp trên như sau:
1100011110101110110001111
Với chuỗi đã mã hoá này ta hoàn toàn có thể giải mã được mà không cần dấu phân cách Nhưng bằng cách nào để tìm ra bảng mã một cách tốt nhất? Vào năm 1952, D.Huffman đã phát minh ra một cách tổng quát để tìm ra bảng mã này một cách tốt nhất Bước đầu tiên trong việc xây dựng mã Huffman là đếm số lần xuất hiện của mỗi kí tự trong tập tin sẽ được mã hoá
Trang 18Bước tiếp theo là xây dựng một cây nhị phân với các tần số được chứa trong các nút Hai nút có tần số bé nhất được tìm thấy và một nút mới được tạo ra với hai nút con là các nút
đó với giá trị tần số của nút mới bằng tổng tần suất của hai nút con Tiếp theo hai nút mới với tần số nhỏ nhất lại được tìm thấy và một nút mới nữa lại được tạo ra theo cách trên Lặp lại như vậy cho đến khi tất cả các nút được tổ hợp thành một cây duy nhất
Sau khi có cây nhị phân, bảng mã Huffman được phát sinh bằng cách thay thế các tần số
ở nút đáy bằng các kí tự tương ứng
Ưu điểm của phương pháp mã hoá Huffman là đạt được hệ số nén cao (Hệ
số nén tuỳ thuộc vào cấu trúc của các tập tin) Nhược điểm của phương pháp này là bên nhận muốn giải mã được thông điệp thì phải có một bảng
mã giống như bảng mã ở bên gửi, do đó khi nén các tập tin bé hệ số nén không được cao
2.1.2- Mã hóa Entropy(Entropy coding):
Vấn đề ta quan tâm ở đây là tìm ra các mã có thể giải đoán duy nhất được với chiều dài nhỏ nhất Điều này sẽ cho phép truyền với tốc độ lớn nhất trên kênh Việc kiểm tra các mã được trình bày rõ ràng hơn trong phần này Những bản tin khác nhau được mã hoá thành những từ có chiều dài khác nhau Khi nói về chiều dài của một mã, ta phải chỉ
ra chiều dài trung bình của những từ mã Trị trung bình này được tính toán bằng cách lấy xác suất của mỗi bản tin Rõ ràng rất thuận lợi khi gán những từ mã ngắn hơn cho hầu hết những bản tin có thể có Mã Morse theo quy luật này bằng cách gán từ mã ngắn nhất bằng ký tự E Một định lý căn bản đã tồn tại trong thuyết mã hoá không có nhiễu Định lý này được phát biểu rằng: đối với các chữ cái mã hoá bằng số nhị phân, chiều dài từ mã trung bình, lớn hơn hoặc bằng với entropy Người ta định nghĩa entropy là
(2.1.2.a)
Trang 19Trong đó pi là xác suất của bản tin thứ i Giá trị log2(1/pi) được hiểu như là nội dung của thông tin và đơn vị của nó là bit Entropy là lượng tin trung bình trên bản tin Gọi chiều dài từ trung bình là n, định lý này được xác định bằng công thức sau
Mã này có thể giải đoán được và có chiều dài trung bình là 1.75 bits
Phương pháp mã hoá độ dài loạt (Run-Length Encoding)
Loại dư thừa đơn giản nhất trong một tập tin là các đường chạy dài gồm các kí tự lặp lại, điều này thường thấy trong các tập tin đồ hoạ bitmap, các vùng dữ liệu hằng của các tập tin chương trình, một số tập tin văn bản
Ví dụ, xét chuỗi sau:
AAAABBBAABBBBBCCCCCCCCDABCBAAABBBBCCCD
Chuỗi này có thể được mã hoá một cách cô đọng hơn bằng cách thay thế chuỗi kí tự lặp lại bằng một thể hiện duy nhất của kí tự lặp lại cùng với một biến đếm số lần kí tự đó được lặp lại Ta muốn nói rằng chuỗi này gồm bốn chữ A theo sau bởi ba chữ B rồi lại theo sau bởi hai chữ A, rồi lại theo sau bởi năm chữ B Việc nén một chuỗi theo phương pháp này được gọi là mã hoá độ dài loạt Khi có những loạt dài, việc tiết kiệm có thể là
Trang 20đáng kể Có nhiều cách để thực hiện ý tưởng này, tuỳ thuộc vào các đặc trưng của ứng dụng (các loạt chạy có khuynh hướng tương đối dài hay không ? Có bao nhiêu bit được dùng để mã hoá các kí tự đang được mã ?)
Nếu ta biết rằng chuỗi của chúng ta chỉ chứa các chữ cái, thì ta có thể mã hoá biến đếm một cách đơn giản bằng cách xen kẻ các con số với các chữ cái Vì vậy chuỗi kí tự trên được mã hoá lại như sau:
4A3BAA5B8CDABCB3A4B3CD
Ở ÐÂY "4A" có nghĩa là "bốn chữ A" Chú ý là không đáng để mã hoá các loạt chạy có
độ dài 1 hoặc 2 vì cần đến hai kí tự để mã hoá
Ðối với các tập tin nhị phân một phiên bản được tinh chế của phương pháp này được dùng để thu được sự tiết kiệm “ÐÁNG KỂ” Ý tưởng ở đây là lưu lại các độ dài loạt, tận dụng sự kiện các loạt chạy thay đổi giữa 0 và 1 để tránh phải lưu chính các số 0 và 1 đó Ðiều này giả định rằng có một vài loạt chạy ngắn (Ta tiết kiệm các bit trên một loạt chạy chỉ khi độ dài của đường chạy là lớn hơn số bit cần để biễu diễn chính nó trong dạng nhị phân), nhưng khó có phương pháp mã hoá độ dài loạt nào hoạt động thật tốt trừ phi hầu hết các loạt chạy đều dài
Việc mã hoá độ dài loạt cần đến các biễu diễn riêng biệt cho tập tin và cho bản đã được mã hoá của nó, vì vậy nó không thể dùng cho mọi tập tin, điều này có thể hoàn toàn bất lợi, ví dụ, phương pháp nén tập tin kí tự đã được đề nghị ở trên sẽ không dùng được đối với các chuỗi kí tự có chứa số Nếu những kí tự khác được sử dụng để mã hoá các số đếm, thì nó sẽ không làm việc với các chuỗi chứa các kí tự đó Giả sử ta phải mã hoá bất
kì kí tự nào từ một bảng chữ cái cố định bằng cách chỉ dùng các kí tự từ bảng chữ cái đó
Ðể minh hoạ, giả sử ta phải mã hoá bất kì một chuỗi nào từ một chữ cái đó, ta sẽ giả định rằng ta chỉ có 26 chữ cái trong bảng chữ cái (và cả khoảng trống) để làm việc
Ðể có thể dùng vài chữ cái để biểu diễn các số và các kí tự khác biểu diễn các phần tử của chuỗi sẽ được mã hoá, ta phải chọn một kí tự được gọi là kí tự "Escape" Mỗi một sự xuất hiện của kí tự đó báo hiệu rằng hai chữ cái tiếp theo sẽ tạo thành một cặp (số
Trang 21đếm, kí tự) với các số đếm được biểu diễn bằng cách dùng kí tự thứ i của bảng chữ cái để biểu diễn số i Vì vậy, chuỗi ví dụ của chúng ta sẽ được biểu diễn như sau với Q được xem là các kí tự "Escape"
QDABBBAABQHCDABCBAAAQDBCCCD
Tổ hợp của kí tự "Escape", số đếm và một kí tự lặp lại được gọi là một dãy Escape Chú ý rằng không đáng để mã hoá các đường chạy có chiều dài ít hơn bốn kí tự,
vì ít nhất là cần đến ba kí tự để mã hoá bất kì một loạt chạy nào
Trong trường hợp bản thân kí tự "Escape" xuất hiện trong dãy kí tự cần mã hoá ta
sử dụng một dãy "Escape" với số đếm là 0 (kí tự space) để biểu diễn kí tự "Escape" Như vậy trong trường hợp kí tự "Escape" xuất hiện nhiều thì có thể làm cho tập tin nén phình
Phương pháp nén LZW
Phương pháp nén LZW được phát minh bởi Lempel - Zip và Welch Nó hoạt động đựa trên một ý tưởng rất đơn giản là người mã hoá và người giải mã cùng xây dựng bản
mã
Nguyên tắc hoạt động của nó như sau
Một xâu kí tự là một tập hợp từ hai kí tự trở lên
Nhớ tất cả các xâu kí tự đã gặp và gán cho nó một dấu hiệu (token) riêng
Nếu lần sau gặp lại xâu kí tự đó, xâu kí tự sẽ được thay thế bằng dấu hiệu của nó
Trang 22Phần quan trọng nhất của phương pháp nén này là phải tạo một mảng rất lớn dùng
để lưu giữ các xâu kí tự đã gặp (Mảng này được gọi là "Từ điển") Khi các byte dữ liệu cần nén được đem đến, chúng liền được giữ lại trong một bộ đệm chứa (Accumulator) và đem so sánh với các chuỗi đã có trong "từ điển" Nếu chuỗi dữ liệu trong bộ đệm chứa không có trong "từ điển" thì nó được bổ sung thêm vào "từ điển" và chỉ số của chuỗi ở trong "từ điển" chính là dấu hiệu của chuỗi Nếu chuỗi trong bộ đệm chứa đã có trong "từ điển" thì dấu hiệu của chuỗi được đem ra thay cho chuỗi ở dòng dữ liệu ra Có bốn qui tắc để thực hiên việc nén dữ liệu theo thuật toán LZW là:
Qui tắc 1: 256 dấu hiệu đầu tiên được dành cho các kí tự đơn (0 - 0ffh)
Qui tắc 2: Cố gắng so sánh với "từ điển" khi trong bộ đệm chứa đã có nhiều hơn hai kí tự Qui tắc 3: Các kí tự ở đầu vào (Nhận từ tập tin sẽ được nén) được bổ sung vào bộ đệm chứa đến khi chuỗi kí tự trong bộ đệm chứa không có trong "từ điển"
Qui tắc 4: Khi bộ đệm chứa có một chuỗi mà trong "từ điển" không có thì chuỗi trong bộ đệm chứa được đem vào "từ điển" Kí tự cuối cùng của chuỗi kí tự trong bộ đệm chứa phải ở lại trong bộ đệm chứa để tiếp tục tạo thành chuỗi mới
Ví dụ: Các bước để mã hoá chuỗi "!BAN!BA!BAA!BAR!" như sau (Bảng 2.1.2)
bước 1: Kí tự thứ nhất ‘!’ được cất vào bộ đệm chứa để chuẩn bị tạo nên một chuỗi
bước 2: Kí tự thứ hai ‘B’ nối thêm vào sau kí tự ! Vì trong "từ điển" chưa có chuỗi "!B" nên chuỗi này được thêm vào "từ điển" và được gán dấu hiệu là 100h (Vì từ 000h đến 0ffh được dành riêng cho các kí tự đơn: Qui tắc 1) ‘!’ được gửi ra còn ‘B’ phải ở lại trong bộ đệm chứa
bước 3: Kí tự thứ ba ‘A’ thêm vào sau ‘B’ Chuỗi "BA" cũng chưa có trong "từ điển" nên nó được thêm vào "từ điển" và gán dấu hiệu là 101h ‘A’ ở lại trong bộ đệm chứa còn ‘B’ được gửi ra
Trang 23 bước 4: Kí tự thứ tư ‘N’ thêm vào sau ‘A’ tạo thành chuỗi "AN" cũng chưa có trong "từ điển" nên được thêm vào "từ điển" và có dâu hiệu là 102h ‘N’ ở lại trong bộ đệm chứa còn ‘A’ được gửi ra
bước 5: Kí tự thứ năm ‘!’ thêm vào sau ‘N’ để tạo thành chuỗi "N!", "N!" được thêm vào "từ điển" với dấu hiệu là 103h ‘!’ ở lại còn ‘N’ được gửi ra
bước 6: Kí tự thứ sáu ‘B’ thêm vào sau ‘!’ Lần này thì chuỗi "B!" đã có trong "từ
điển" nên không có kí tự nào được gửi ra "B!" tiếp tục ở lại trong "từ điển" để tạo
ra chuỗi mới
bước 7: Kí tự thứ bảy ‘A’ thêm vào sau ‘B’ để tạo thành chuỗi "B!A", do "B!A" không có trong "từ điển" nên nó được thêm vào "từ điển" và gán dấu hiệu là 104h đồng thời dấu hiệu 100h được gửi ra thay cho "B!" (Qui tắc 4) A tiếp tục ở lại trong bộ đệm chứa để tạo thành chuỗi mới
Bàng 2.1.2: Mã hóa chuỗi
Trang 24Các bước trên cứ thế tiếp tục cho đến khi hết tập tin cần nén Việc giảm kích thước chỉ thực sự bắt đầu tại bước 7 khi mà một dấu hiệu 12 bits là <100h> được gửi ra thay cho hai byte "B!"
Trong thuật toán nén này, phần lớn thời gian khi bắt đầu nén chủ yếu mất vào việc tạo "từ điển" Khi "từ điển" đủ lớn, xác suất gặp chuỗi ở bộ đệm chứa trong "từ điển" tăng lên và càng nén được nhiều hơn Một điều cần chú ý ở đây là mỗi một dấu hiệu, ta phải lưu một chuỗi trong "từ điển" để so sánh Vì dấu hiệu được biểu diễn bằng một số 12 bits nên "từ điển" sẽ có 4096 lối vào, khi tăng số bit dể biễu diễn dấu hiệu lên thì hiệu quả nén sẽ tốt hơn nhưng lại bị giới hạn bởi bộ nhớ của máy tính Vì dụ, khi dùng 16 bits để biểu diễn một dấu hiệu thì "từ điển" phải có đến 65536 lối vào, nếu mỗi lối vào có khoảng 20 kí tự thì "từ điển" phải lớn khoảng 1,2 MB Với một từ điển có dung lượng như vậy rất khó có thể thực hiện trên các máy tính PC hoạt động dưới hệ điều hành DOS
vì giới hạn của một đoạn (Segment) là 64KB Ưu điểm của phương pháp nén LZW là bên nhận có thể tự xây dựng bảng mã mà không cần bên gửi phải gửi kèm theo bản tin nén
Qua ba phương pháp nén được dùng phổ biến trên, ta thấy rằng, thuật toán nén độ dài loạt (Runlength) không thể áp dụng cho mhiều loại tập tin được, ví dụ như tập tin chương trình, tập tin cơ sở dữ liệu vì ở đó các loạt chạy là rất ngắn,
do đó nếu áp dụng thuật toán này không những không làm bé tập tin mà còn làm phình to chúng
Trang 25 Hai thuật toán còn lại (Huffman và LZW) đều có thể áp dụng được để nén nhiều loại tập tin trên các máy vi tính
Thuật toán Huffman có ưu điểm là hệ số nén tương đối cao, phương pháp thực hiện tương đối đơn giản, đòi hỏi ít bộ nhớ, có thể xây dựng dựa trên các
mảng bé hơn 64KB Nhược điểm của nó là phải chứa cả bảng mã vào tập tin nén
thì phía nhận mới có thể giải mã được do đó hiệu suất nén chỉ cao khi ta thực hiện nén các tập tin lớn
Thuật toán nén LZW có các ưu điểm là hệ số nén tương đối cao, trong tập tin nén không cần phải chứa bảng mã Nhược điểm của thuật toán này là tốn nhiều
bộ nhớ, khó thực hiện dựa trên các mảng đơn giản (bé hơn 64KB)
Từ các ưu và nhược điểm trên, ta chọn phương pháp nén Huffman vì tính đơn giản của nó hệ số nén lại cao Nhược điểm của phương pháp nén này có thể khắc phục bằng cách thực hiện nén một lần nhiều tập tin chuẩn bị truyền, làm như vậy coi như chúng ta đang thực hiện nén một tập tin lớn
2.2- Giảm tốc độ dữ liệu tổn thất
Nén có tổn thất được thực hiện bằng cách liên kết 2 hoặc nhiều kĩ thuật xử lý để biểu diễn tính hiệu hình Nén có tổn thất có thể đạt tỉ lệ nén cao từ 2:1 đến 100:1, và kết quả có tổn thất dữ liệu và làm giãn chất lượng ảnh sau khi dãn vì có sự làm tròn và giảm dữ liệu trong 1 khung và giữa các khung Có thể tối thiểu hóa độ giảm chất lượng bằng cách tách bộ dư thừa tâm lý các giá trị mẫu Tỉ số nén phụ thuộc nội dung ảnh được dùng trong các ứng dụng tốc độ bit cố định CBR (constant-bit rate) như lưu trữ
và truyền ảnh Tốc độ dữ liệu trong các hệ thống có nén tổn thất phụ thuộc vào các yêu cầu về chất lượng ảnh được chấp nhận Một số kỹ thuật nén tổn thất tiêu biểu
Trang 262.2.1- Phương pháp mã dự đoán có tổn hao
Hình 2.2.1:Sơ đồ khối mã hóa dự đóan có tổn thất
a)mã hóa DPCM b) giải mã DPCM
Sơ đồ khối của bộ mã hóa dự đoán có tổn thất khác với bộ mã hóa không tổn thất
do có thêm bộ lượng tử hóa Quá trình lượng tử hóa sẽ làm tròn giá trị en tới mức lượng
tử gần nhất là Hiệu quả nén của hệ thống mã hóa và sai số giữa ảnh nén và ảnh gốc sẽ phụ thuộc vào số mức lượng tử được sử dụng trong coder
Để kết quả dự đoán ở coder và decoder như nhau, các mẫu tới trước dùng để dự đoán tại coder phải chứa cả thành phần sai số do lượng tử hóa tạo ra vì sai số này tồn tại trong tín hiệu đưa tới bộ dự đoán trong decoder:
(2.2.2-2)
Trang 27Với
i - hệ số dự đoán với i = 1,2,….,m
Round(.)- toán tử làm tròn với số nguyên gần nhất
2.2.2- Mã hóa DCT:
Biến đổi DCT: là biến đổi cosin rời rạc DCT (Discrete Cosine Transform) DCT
biến đổi dữ liệu từ miền không gian sang miền tần số DCT được sử dụng tương đối rộng rãi vì nó có đặc tính "gói" năng lượng tốt, biến đổi DCT cho kết quả là các số thực, ngoài
ra có các thuật toán nhanh để thực hiện biến đổi này
Biến đổi DCT được thực hiện trong phạm vi các khối 8×8 mẫu tín hiệu chói Y và các khối tương ứng của tín hiệu hiệu màu (UV hoặc IQ)
DCT hai chiều:
Biến đổi DCT hai chiều (2-D) được dùng cho các khối ảnh có kích thước 8×8 Quá trình biến đổi thuận DCT (Forward DCT) dùng trong tiêu chuẩn JPEG được định nghĩa như sau
(2.2.2-1)
Trang 28Hình 2.2.2-1: Mã hóa khối DCT 2 chiều
Phương trình trên là kết quả liên kết của hai phương trình DCT một chiều, một cho tần số ngang và một cho tần số dọc Trong ma trận hệ số DCT hai chiều, hệ
số thứ nhất F(0,0) bằng giá trị trung bình của các điểm ảnh trong block 8x8
(2.2.2-2) Các hệ số nằm ở các dòng dưới thành phần một chiều, đặc trưng cho các tần số cao hơn của tín hiệu theo chiều dọc Các hệ số nằm ở các cột bên phải của thành phần một chiều đặc trưng cho các tần số cao hơn theo chiều ngang Hệ số F(0,7) là thành phần có tần số cao nhất theo chiều ngang của block ảnh 8×8, và hệ
số F(7,0) đặc trưng cho thành phần có tần số cao nhất theo chiều dọc Còn các hệ số khác ứng với những phối hợp khác nhau của các tần số theo chiều dọc và chiều