Thiết kế headend SD, HD
Trang 1Thiết kế headend SD, HD
Chương 1: Tổng quan về truyền hình và chuẩn MPEG
1 Lịch sử truyền hình
Truyền hình, hay còn được gọi là báo hình, là một loại phương tiện thông tin đại chúng hiện đại, không thể thiếu của một quốc gia Nó là một phương tiện hiệu quả nhất trong truyền bá thông tin, phục vụ tốt nhiệm vụ chính trị, kinh tế, xã hội, … của một địa phương hay một quốc gia, phát triển mạnh mẽ trên quy mô toàn cầu, là loại thông tin đến được nhiều người nhất
Truyền hình là loại hình báo chí truyền tải nội dung chủ yếu bằng hình ảnh sống động và các phương tiện biểu đạt khác như lời nói, chữ viết, hình ảnh, âm thanh, truyền hình chính là ngành công nghiệp được phát triển trên cơ sở các tiến bộ về công nghệ, thiết bị thu, phát, truyền dẫn, trường quay
1.1 Quá trình phát triển của truyền hình
Truyền hình ra đời trong nửa đầu thế kỷ XX, sau khi có sự ra đời của tivi, các thiết bị truyền dẫn, phát sóng và các tiến bộ về công nghệ Sau nhiều tiến bộ khác nhau, năm 1923, kỹ sư người Scotland, ông John Logie Baird đã đăng ký phát minh
ra chiếc máy có khả năng hiện hình ảnh nhận từ những tín hiệu điện từ mà sau này chúng ta gọi là vô tuyến truyền hình (tivi)
Từ khoảng năm 1932, hãng BBC của Anh bắt đầu phát các chương trình truyền hình thường kỳ Ngày nay, sóng truyền hình có thể đạt tới mọi nơi trên trái đất qua trạm chuyển tiếp, cáp truyền hình, vệ tinh nhân tạo và internet Các chương trình truyền hình, từ chỗ chỉ phát bản tin thô sơ, đã tiến bộ dần với việc cho
ra đời hàng trăm loại hình chương trình như các game show, truyền hình thực tế, phỏng vấn truyền hình, truyền hình theo yêu cầu,
Nhờ sự phát triển của khoa học kỹ thuật, mà công nghệ truyền hình ngày càng hoàn thiện về mặt kỹ thuật cũng như mặt sản xuất chương trình, từ lúc mới ra đời chỉ là truyền hình analog đen trắng dần phát triển lên truyền hình màu, rồi truyền hình số SDTV (truyền hình độ nét chuẩn) và HDTV (truyền hình độ nét cao)
1.2 Các thế hệ truyền hình
Từ lúc ra đời cho đến nay công nghệ truyền hình phát triển một cách vượt bậc giữ một vị trí quan trọng trong các lĩnh vực như: giải trí, kinh doanh, chính trị, thông tin, … có nhiều cách phân chia các thế hệ truyền hình, nếu dựa vào công nghệ phát hình thì có thể chia ra hai công nghệ truyền hình đó là công nghệ số và analog Còn nếu dựa vào công nghệ sản xuất tivi thì ta có thể chia thành các loại như công nghệ
Trang 2Thiết kế headend SD, HD
CRT, công nghệ LCD, công nghệ Plasma, công nghệ OLED, … còn dựa vào màu sắc của hình ảnh thì phân ra hai loại là truyền hình đen trắng và truyền hình màu, còn dựa vào môi trường truyền thì chia làm hai loại là truyền hình vô tuyến và truyền hình hữu tuyến Ở đây chúng ta sẽ tìm hiểu kỹ hơn về hai loại công nghệ này
1.2.1 Truyền hình vô tuyến
Truyền hình vô tuyến là công nghệ truyền hình được sử dụng rộng rãi từ lâu và vẫn tồn tại cho đến ngày nay, với ưu điểm là có vùng phủ sóng rộng, có thể phủ sóng một vùng lãnh thổ rộng lớn (tỉnh, thành phố, quốc gia, …) nhờ các trạm trung chuyển Nó sử dụng sóng điện từ RF để truyền tín hiệu truyền hình (hình ảnh, âm thanh, …) từ đài phát đến máy thu (tivi) nhờ môi trường không khí
Truyền hình vô tuyến được phân ra làm nhiều loại nhưng có hai loại quan trọng nhất được sử dụng rộng rãi là truyền hình mặt đất và truyền hình vệ tinh Truyền hình vô tuyến chịu nhiều can nhiễu của môi trường và thời tiết như mưa, sấm sét, các vật cản, …
a) Truyền hình mặt đất
Truyền hình mặt đất được sử dụng để phát sóng trên một vùng lãnh thổ tương đối rộng lớn (một tỉnh, thành phố, một khu vực, một quốc gia), lợi dụng sự phản xạ của tầng điện li đối với sóng RF băng tần VHF và UHF để truyền hính hiệu đi xa Máy thu (tivi) thu tín hiệu từ các đài phát hay từ các trạm thu phát trung gian nhờ anten thu (chủ yếu là anten yagi)
Tần số phát của truyền hình mặt đất chủ yếu sử dụng băng tần VHF có dải tần từ
30 MHz ÷ 300 MHz và băng tần UHF có dải tần từ 300 MHz ÷ 1000 MHz
Tín hiệu được điều chế bằng phương pháp điều chế của truyền hình vệ tinh COFDM nhưng phát xuống mặt đất
b) Truyền hình vệ tinh
Truyền hình vệ tinh được sử dụng để phát sóng trên vùng lãnh thổ rất rộng lớn (một quốc gia, một châu lục, toàn cầu), lợi dụng sự truyền thẳng của tần số siêu cao tần qua tầng khí quyển để truyền tín hiệu từ mặt đất đến vệ tinh và từ vệ tinh xuống mặt đất sử dụng mode truyền bất đồng bộ (ATM-Asynchronous Transfer Mode) Máy thu (tivi) thu tín hiệu truyền hình trực tiếp từ vệ tinh thông qua anten parabol, tần số thu phát của truyền hình vệ tinh chủ yếu sử dụng băng C có dải tần từ 3 GHz – 4 GHz và băng Ku có dải tần từ 10 GHz – 12 GHz
Tín hiệu được điều chế bằng phương pháp điều chế COFDM
Trang 3Thiết kế headend SD, HD
1.2.2 Truyền hình hữu tuyến
Khác với truyền hình vô tuyến, truyền hình hữu tuyến chủ yếu sử dụng dây cáp để đưa tín hiệu từ đài phát đến máy thu (tivi) Cáp được sử dụng ở đây là cáp quang và cáp đồng trục
Do tín hiệu được truyền trực tiếp từ đài phát đến máy thu thông qua dây cáp nên tín hiệu ít bị ảnh hưởng bởi môi trường bên ngoài Vì thế tín hiệu thu được tương đối tốt, chất lượng tương đối cao
Tín hiệu số truyền trong cáp chủ yếu sử dụng các mode điều chế QAM (như: 16-QAM, 32-QAM, 64-QAM, 128-QAM, 256-QAM) Sử dụng mode càng cao thì truyền được nhiều chương trình nhưng dễ ảnh hưởng bởi nhiễu
2 Quá trình hình thành và phát triển truyền hình cáp Việt Nam
2.1 Quá trình hình thành
Với sự phát triển về kinh tế xã hội làm cho cuộc sống người dân đang ngày càng cải thiện và tăng cao Nhu cầu thụ hưởng các dịch vụ cao cấp cũng tăng theo Trong đó có nhu cầu về truyền hình – “món ăn tinh thần” không thể thiếu của mọi người dân Từ cách thức xem truyền hình thụ động, người dân muốn mình chủ động hơn về chương trình truyền hình Đứng trước những nhu cầu đó truyền hình tương tác
ra đời mà đi tiên phong là lĩnh vực truyền hình cáp
Dịch vụ truyền hình cáp ra đời phục vụ nhu cầu thông tin giải trí ngày càng tăng cao của người dân, mà lĩnh vực truyền hình thông thường không đáp ứng được (như số lượng kênh nhiều, có kênh nước ngoài, có kênh chuyên biệt, không có quảng cáo, chất lượng chương trình tốt, ổn định, …) Dịch vụ truyền hình cáp Việt Nam hình thành từ những năm cuối của thập niên 90 và phát triển mạnh mẽ vào các năm gần đây Đặc biệt là ở hai thành phố lớn là Hồ Chí Minh và Hà Nội, như trung tâm Dịch vụ Truyền hình cáp của đài Truyền hình Việt Nam VCTV ra đời vào năm 1996 trên cơ sở của trung tâm dịch vụ truyền hình MMDS, hay trung tâm Truyền hình cáp của đài Truyền hình thành phố Hồ Chí Minh HTVC ra đời năm
2003 Từ lúc ra đời truyền hình cáp sử dụng công nghệ analog hiện nay đang dần chuyển sang số và sắp tới là phát chương trình HD
2.2 Các nhà cung cấp dịch vụ truyền hình cáp hiện nay
Hiện nay, ở Việt Nam dịch vụ truyền hình cáp phục vụ chủ yếu ở Hà Nội và thành phố Hồ Chí Minh và càng ngày được mở rộng ra các vùng lân cận chủ yếu là khu vực đô thị, dân cư đông đúc Có ba nhà cung cấp dịch vụ truyền hình cáp chính:
Trang 4Thiết kế headend SD, HD
Trung tâm Dịch vụ Truyền hình cáp của đài Truyền hình thành phố Hồ Chí Minh HTVC, hiện phát khoảng 67 kênh truyền hình trong và ngoài nước
Trung tâm Dịch vụ Truyền hình cáp của đài Truyền hình Việt Nam VCTV, hiện nay phát khoảng 54 kênh truyền hình trong và ngoài nước
Công ty Truyền hình cáp SaigonTourist SCTV là doanh nghiệp nhà nước liên doanh giữa đài Truyền hình Việt Nam và tổng công ty Du lịch Sài Gòn, hiện nay phát khoảng 72 kênh truyền hình trong và ngoài nước
Dịch vụ truyền hình cáp từ lúc ra đời cho đến nay đã có những bước phát triển không ngừng Với ưu thế của mình truyền hình cáp sẽ cạnh tranh quyết liệt với các loại truyền hình khác để mở rộng và phát triển thị phần
2.3 Lợi ích của dịch vụ truyền hình cáp
Dịch vụ truyền hình cáp ra đời mang lại bước đột phá mới trong công nghệ truyền hình, làm thay đổi quan niệm về lĩnh vực truyền hình (truyền hình bây giờ không còn là truyền hình miễn phí mà là truyền hình có thu phí) Truyền hình không đơn thuần là giải trí, xem tin tức như thông thường nữa mà nó còn tích hợp nhiều tính năng khác nữa như: VoD -Video on Deman-truyền hình theo yêu cầu, internet, mua sắm qua mạng, … với chất lượng cực tốt với hai công nghệ là SDTV và HDTV Dịch vụ truyền hình cáp ra đời giúp chúng ta không còn thấy cảnh trên các mái nhà chứa đầy các anten vừa tốn kém vừa mất mỹ quan và có thể xảy ra nguy hiểm khi gãy ngã anten vào mùa mưa bão
Vừa qua Thủ tướng Chính phủ ra quyết định số 22/2009/QĐ-TTg bắt buộc các nhà cung cấp dịch vụ truyền hình cáp đến năm 2015 phải ngầm hoá tất cả các cáp truyền hình của mình, tạo nên mỹ quan cho đô thị và an toàn cho người dân
Dịch truyền hình cáp ra đời năng chất lượng truyền hình lên tầm cao mới Chất lượng dịch vụ gần như hoàn hảo phục vụ tốt nhiệm vụ chính trị của nhà nước, nhu cầu quảng cáo của doanh nghiệp cũng như nhu cầu giải trí của người dân Số lượng kênh nhiều, nội dung phong phú, đa dạng, …
Dịch vụ truyền hình cáp ra đời đang thành công rực rỡ Hứa hẹn sẽ tạo ra cuộc chạy đua mới trong công nghệ truyền hình, khiến các nhà cung cấp dịch vụ truyền hình đầu tư, nghiên cứu, khai thác các công nghệ mới như truyền hình di động, IPTV, … tạo ra bước đột phá trong công nghệ truyền hình, tạo nên sự đa dạng về dịch vụ phục vụ thị hiếu ngày càng cao của người dân Giúp nâng cao đời sống văn hóa, tinh thần cho xã hội
Trang 5Thiết kế headend SD, HD
3 Giới thiệu về chuẩn MPEG
3.1 Khái quát về các tiêu chuẩn nén
Các tổ chức quốc tế đã•tiêu tốn hàng triệu USD để phát triển các tiêu chuẩn
nén Như vậy, có thể thấy các tiêu chuẩn nén là cần thiết Hiểu một cách đơn giản,
tiêu chuẩn nén cũng như ngôn ngữ chính thống của một đất nước Quốc gia đó có
nhiều dân tộc với nhiều ngôn ngữ khác nhau, nhưng để thuận lợi cho giao tiếp cần có
một ngôn ngữ chính thống trên toàn lãnh thổ Như vậy, chìa khoá ở đây là “sự dễ
dàng trong giao tiếp” Chúng ta cần các tiêu chuẩn nén để thuận tiện trao đổi giữa
các hệ thống khác nhau
Vậy tại sao cần có nhiều tiêu chuẩn nén? Bởi vì chúng ta có nhiều ứng dụng
nên đòi hỏi nhiều tiêu chuẩn khác nhau Không có bất kỳ một tiêu chuẩn nén nào
có thể đáp ứng được tất cả các yêu cầu ứng dụng khác nhau Các tiêu chuẩn nén
gồm hai mức: mức quốc gia và mức quốc tế
Ở mức quốc gia: Có ANSI (American National Standard Institute), AIIM
(Association of Image and Information), tại Canada có tổ chức tiêu chuẩn của
Canada (Canadian Standards Association and the Standards Council of Canada)
Ở mức quốc tế: Có ISO (International Standards Organization), IEC
(Interna-tional Electrotechnical Commission), ITU (Interna(Interna-tional Telecommunication Union,
CCITT) và một số tổ chức khác
Các tiêu chuẩn nén với ứng dụng của chúng được khái quát trong bảng sau đây:
Fax, ảnh dữ liệu
Fax, ảnh dữ liệu
Truyền thanh thông thường, quảng bá, cảm nhận từ xa
Bảng 1.1: Các tiêu chuẩn nén với các ứng dụng của nó
Trong số đó, được sử dụng phổ biến và có phạm vi ứng dụng rộng rãi là
MPEG (Moving Pictures Experts Group) MPEG là một chuỗi các chuẩn bao gồm:
MPEG-1, MPEG-2 và MPEG-4 Trong đó MPEG-1 là cơ bản MPEG-2 và MPEG-4
là sự phát triển và mở rộng từ MPEG-1
Trang 6Thiết kế headend SD, HD
Hiệp hội Viễn thông Quốc tế (ITU) và tổ chức Tiêu chuẩn Quốc tế/Uỷ ban Kỹ thuật Điện tử Quốc tế (ISO/IEC) là hai tổ chức phát triển các tiêu chuẩn mã hoá video Theo ITU, các tiêu chuẩn mã hoá video được coi là các khuyến nghị gọi tắt là chuẩn H.26x (H.261, H.262, và H.264) Với tiêu chuẩn ISO/IEC, chúng được gọi là MPEG-x (như MPEG-1, MPEG-2 và MPEG-4)
3.2 Chuẩn MPEG-2
MPEG-2 là một tiêu chuẩn được sử dụng rộng rãi trong kỹ thuật truyền hình số và kỹ thuật video số MPEG-2 chia dòng tín hiệu thành hai loại là dòng truyền tải (TS- Transport Stream) và dòng chương trình (PS- Program Stream) MPEG-2 là tiêu chuẩn chung cho việc mã hoá audio và video
MPEG-2 ra đời khắc phục những thiếu sót trong MPEG-1 như: hệ thống nén âm thanh có hiệu quả kém, thiếu tính linh hoạt (có thể chấp nhận được ít hơn các biến thể của loại gói) không hỗ trợ cách quét xen kẻ MPEG-2 nén tín hiệu video và audio với một dải tốc độ bit từ 1,5 Mbps tới 60 Mbps Tiêu chuẩn này còn được gọi là chuẩn quốc tế ISO/IEC 13818, là chuẩn nén ảnh động và âm thanh Nó cung cấp một dải các ứng dụng như: lưu trữ dữ liệu số, truyền hình quảng bá và truyền thông
3.2.1 Các phần của MPEG-2
Phần 1 - Hệ thống: Mô tả cách đồng bộ, ghép kênh video và audio Còn được
gọi là ITU-T Rec H.222.0
Phần 2 – Video: Mã hóa, nén tín hiệu video (xen kẻ và liên tục) Còn được
gọi là ITU-T Rec H.262
Phần 3 – audio: Nén, mã hóa các tín hiệu audio Đa kênh–là phần mở rộng
của MPEG-1 audio
Phần 4 : Mô tả các thủ tục để thử nghiệm sự phù hợp
Phần 5 : Mô tả cho các hệ thống phần mềm mô phỏng
Phần 6 : Mở rộng cho các mô tả DSM-CC (lưu trữ kỹ thuật số và kiểm soát) Phần 7 : Advanced Audio Coding (AAC)
Phần 8 : Phần mở rộng video 10 bit Ứng dụng chính là phòng thu video Phần
8 đã được thu hồi vì thiếu quan tâm bởi tính công nghiệp
Phần 9 : Gia hạn thời gian thực cho các giao diện
Phần 10 : Phù hợp phần mở rộng cho DSM-CC
Phần 11 : Quản lý sở hữu trí tuệ (IPMP)
Trang 7Thiết kế headend SD, HD
3.2.2 Profiles và Levels
MPEG - 2 video hỗ trợ rất nhiều ứng dụng từ thiết bị di động để hiệu chỉnh chất lượng cao Việc định chuẩn cho nhiều ứng dụng khó thực hiện và quá tốn kém Vì vậy MPEG-2 hỗ trợ các ứng dụng khác nhau thông qua định nghĩa Profiles và Levels Profiles xác định nhóm các tính năng như các thuật toán nén, định dạng lấy mẫu tín hiệu màu thành phần, … Levels xác định về định lượng của: tốc độ bit cực đại, kích thước frame tối đa, …
Các bảng dưới đây tóm tắt những quy định về các Profiles và Levels
MPEG-2 Levels
Ký
hiệu Tên
Tốc độ frame (Hz)
Độ phân giải hàng tối đa
Độ phân giải cột tối đa
Số mẫu của tín hiệu chói cực đại (=độ rộng x chiều ngang
x tốc độ frame)
Vmax trong
MP (Mbps)
80
Bảng 1.2: Các level
Trang 8Thiết kế headend SD, HD
MPEG-2 Profiles
Ký hiệu Tên Kiểu mã
hóa
Tỉ lệ lấy mẫu
Tỉ lệ khuôn hình Modes scalable
SNR noise ratio)
SNR- or scalable
spatial-Bảng 1.3: Các profile
3.2.3 Các ứng dụng của MPEG-2
Trang 9Thiết kế headend SD, HD
+ MPEG Layer 2 (MP2): 48 KHz, lên tới 5.1 kênh (bất buộc cho riêng hệ PAL) + Dolby Digital (DD, còn được gọi là AC-3): 48 KHz, 32 - 448 Kbps, lên tới 5,1 kênh + DTS-Digital Theater Systems (hệ thống nhà hát số): 754 Kbps hoặc 1510 Kbps (không bắt buộc đối với đầu DVD)
+ NTSC DVD phải chứa ít nhất một LPCM hoặc Dolby Digital âm thanh theo dõi + PTZ DVD phải chứa ít nhất một lớp 2 MPEG, LPCM, hoặc theo dõi các âm thanh Dolby Digital
GOP (Group of Pictures):
+ Header sequence phải được trình bày tại đầu của mỗi nhóm
+ Giá trị lớn nhất của frame/GOP: 18 (NTSC), 15 (PAL) tức là 0,6 giây cả hai
+ 720 x 576 x 50 khung/s quét liên tục (576p50)
+ 1280 x 720 x 25 hoặc 50 khung/s quét liên tục (720p50)
+ 1440 hay 1920 x 1080 x 25 khung/s quét liên tục (1080p25)
+ 1440 hay 1920 x 1080 x 25 khung/s quét xen kẽ (1080i25)
+ 1920 x 1080 x 50 khung/s quét liên tục (1080p50)
Trang 10Thiết kế headend SD, HD
c) Chuẩn ATSC và ISDB-T
Các tiêu chuẩn ATSC A/53, được sử dụng tại Mỹ, sử dụng MPEG-2 video MP@ HL, với các quy định như sau:
Tốc độ tối đa của dòng video MPEG-2 là 19,4 Mbps cho phát sóng truyền hình, và 38,8 Mbps cho các chế độ “high-data-rate” (ví dụ như: truyền hình cáp)
Số lượng dòng đệm MPEG-2 được yêu cầu ở phía giải mã phải nhỏ hơn hoặc bằng 999.424 byte
Các dòng phải bao gồm các phép đo thông tin (đường cong gamma, sử dụng các giá trị màu RGB, và các mối quan hệ giữa RGB và YCBCR)
Video được lấy mẫu 4:2:0 (màu thành bằng 1/2 của luma ngang và bằng 1/2 của luma dọc)
Độ phân giải, tỷ lệ khuông hình, và tốc độ frame/ field của video:
1920 × 1080 pixel (16:9), tại 30p, 29,97p, 24p, 23,98p, 30i, hoặc 29,97i
1280 × 720 pixel (16:9), tại 60p, 59,94p, 30p, 29,97p, 24p, hoặc 23,98p
704 × 480 pixel (hoặc 4:3 hoặc 16:9), tại 60p, 59,94p, 30p, 29,97p, 24p, 23,98p, 30i, hoặc 29.97i
640 ×480 pixel (4:3), tại 60p, 59,94p, 30p, 29,97p, 24p, 23,98p, 30i, hoặc 29,97i
3.3 Tiêu chuẩn MPEG-4
3.3.1 Khái quát về MPEG-4
Kể từ khi mới xuất hiện vào đầu những năm 90, chuẩn MPEG-2 đã hoàn toàn thống lĩnh thế giới truyền thông Cũng trong thập kỷ này, chuẩn nén MPEG-2 đã được cải tiến về nhiều mặt Giờ đây nó có tốc độ bit thấp hơn và việc ứng dụng nó được mở rộng hơn nhờ có các kỹ thuật như đoán chuyển động, tiền xử lý, xử lý đối ngẫu và phân bổ tốc độ bit tùy theo tình huống thông qua ghép kênh
Tuy nhiên, chuẩn nén MPEG-2 cũng không thể được phát triển một cách vô hạn định Thực tế hiện nay cho thấy chuẩn nén này đã đạt đến hết giới hạn ứng dụng của mình trong lĩnh vực truyền hình và lưu trữ video số Bên cạnh đó, nhu cầu nén video lại đang ngày một tăng cao kèm theo sự phát triển mạnh mẽ của mạng
IP mà tiêu biểu là mạng internet và công nghệ truyền hình HDTV Khối lượng nội dung mà các công ty truyền thông cũng như các nhà cung cấp dịch vụ thông tin ngày càng lớn, ngoài ra họ còn có thể cung cấp nhiều dịch vụ theo yêu cầu thông qua hệ thống cáp, vệ tinh và các hạ tầng viễn thông đặc biệt là mạng internet Các tiêu chuẩn mã hoá video ra đời và phát triển với mục tiêu cung cấp các phương tiện cần thiết để tạo ra sự thống nhất giữa các hệ thống được thiết kế bởi
Trang 11Thiết kế headend SD, HD
những nhà sản xuất khác nhau đối với mọi loại ứng dụng video; Nhờ vậy thị trường video có điều kiện tăng trưởng mạnh Chính vì lý do này nên những người sử dụng bộ giải mã cần có một chuẩn nén mới để đi tiếp chặng đường mà MPEG-2 đã bỏ dở Và MPEG-4 đã ra đời
MPEG-4 là một tập hợp các phương pháp nén audio, video (AV) và dữ liệu kỹ thuật số Nó đã được giới thiệu vào cuối 1998 và còn có tên gọi khác là tiêu chuẩn ISO/IEC 14496, hay H.264 Sử dụng nén AV, dữ liệu cho trang web và lưu trữ đĩa
CD, voice (điện thoại, videophone) và phát sóng truyền hình MPEG-4 hấp thụ rất nhiều các tính năng của MPEG-1 và MPEG-2 và các tiêu chuẩn khác có liên quan, bổ sung các tính năng mới (mở rộng) như VRML hỗ trợ cho biểu diễn 3D, đa hợp hướng đối tượng (bao gồm cả audio, video và các đối tượng VRML)
Ban đầu, mục tiêu chủ yếu MPEG-4 là truyền video với tốc độ bit thấp, tuy nhiên sau đó phạm vi của nó đã được mở rộng hơn nữa của một tiêu chuẩn mã hóa
đa phương tiện MPEG-4 sử dụng hiệu quả trên nhiều loại tốc độ bit khác nhau, từ một vài Kbps đến hàng chục Mbps MPEG-4 cung cấp những chức năng sau đây:
Cải thiện hiệu quả mã hóa
Khả năng mã hóa nhiều loại dữ liệu (video, âm thanh, lời nói)
Khả năng sữa lỗi cho phép truyền tốt hơn
Khả năng tương tác với các thiết bị nghe nhìn ở phía thu
3.3.2 Các phần trong MPEG-4
MPEG-4 bao gồm nhiều phần, mỗi phần có nhiều “Profiles” và “levels”
Phần 5 ISO/IEC Reference Software Cung cấp phần mềm để chứng
Trang 12Thiết kế headend SD, HD
của tiêu chuẩn
14496-6
Delivery Multimedia Integration
Framework (DMIF)
14496-7
Optimized Reference Software
Cung cấp các ví dụ về việc làm thế nào để triển khai thực hiện các cải tiến
14496-8
Carriage on IP networks
Xác định một phương pháp mang nội dung MPEG-4 trên mạng IP
14496-9 Reference Hardware
Cung cấp thiết kế phần cứng dành cho chứng minh làm thế nào để thực hiện các phần khác của tiêu chuẩn
14496-10
Advanced Video Coding (AVC) Mã hóa tín hiệu video
14496-11
Scene description and Application
engine("BIFS")
Có thể được sử dụng cho nhiều nội dung tương tác với nhiều profiles, bao gồm cả các phiên bản 2D và 3D
14496-14 MPEG-4 File Format
Các thiết kế để chứa nội dung tập tin định dạng MPEG-4, mà là dựa trên Phần 12
14496-15 AVC File Format
Để lưu trữ video của phần 10 dựa trên Phần 12
14496-16
Animation Framework eXtension (AFX)
Chưa hoàn thành
Phần 17 ISO/IEC Timed Text subtitle Chưa được hoàn thành
Trang 13Thiết kế headend SD, HD
14496-17 format
14496-18
Font Compression and Streaming (for OpenType fonts)
Chưa được hoàn thành
Chưa được hoàn thành
14496-21
MPEG-J Graphical Framework Xtension (GFX)
Chưa được hoàn thành
14496-22
Open Font Format Specification (OFFS) based on OpenType
Chưa được hoàn thành
14496-23
Symbolic Music Representation (SMR)
Chưa được hoàn thành
Bảng 1.4: Các phần của MPEG-4
Trong các phần của MPEG-4 có phần 10 là tương đối quan trọng vì nó quy định các cách thức nén video, sau đây ta tìm hiểu về phần này
3.3.3 Tìm hiểu về MPEG-4 phần 10
a) Giới thiệu chung
Những khuyến nghị của ITU được thiết kế dành cho các ứng dụng video truyền thông thời gian thực như truyền hình hội nghị hay videophone Mặt khác, những tiêu chuẩn MPEG được thiết kế hướng tới mục tiêu lưu trữ video chẳng hạn như trên đĩa quang DVD, quảng bá video số trên mạng cáp, đường truyền số DSL, truyền hình vệ tinh hay những ứng dụng truyền dòng video trên mạng internet hoặc thông qua mạng không dây (wireless)
Với đối tượng để truyền dẫn video HD thì ứng cử viên hàng đầu là chuẩn nén MPEG-4 AVC, còn được gọi là H.264, MPEG-4 phần 10, H.26L hoặc JVT
b) Các Profile và lelves của H.264 (MPEG-4 AVC)
Trang 14Thiết kế headend SD, HD
Profile có nhiều phần để phù hợp với các ứng dụng khác nhau:
+ Constrained Baseline Profile (CBP): Được sử dụng chủ yếu trong các
ứng dụng thấp Profile này được sử dụng rộng rãi trong các ứng dụng di động và truyền hình hội nghị Nó tương ứng với các tính năng của các nhóm Baseline, Main, và High Profiles
+ Baseline Profile (BP): Chủ yếu cho các ứng dụng giá rẻ với tài nguyên
điện toán hạn chế, Profile này sẽ được sử dụng rộng rãi trong các ứng dụng di động và truyền hình hội nghị
+ Main Profile (MP): Ban đầu nó được sử dụng cho truyền hình quảng bá
Profile này thật sự phai nhạt trước sự xuất hiện của High profile
+ Extended Profile (XP): Profile này định dạng dòng video, và khả năng
nén tương đối cao và bổ sung một số các thủ thuật bảo vệ chống mất dữ liệu và chuyển mạch luồng máy chủ
+ High Profile (HiP): Profile này ứng dụng chính cho truyền hình quảng bá
đặc biệt là các ứng dụng HDTV và việc lưu trữ như đĩa HD DVD và Blu-ray
+ High 10 Profile (Hi10P): Profile này là sự phát triển của HiP với số bit mã
hóa và lượng tử là 10 bit (HiP 8 bit)
+ High 4:2:2 Profile (Hi422P): Profile này xử lý tín hiệu video một cách
chuyên nghiệp, profile này được xây dựng trên Hi10P hỗ trợ thêm định dạng 4:2:2, sử dụng 10 bit cho mã hóa và lượng tử
+ High 4:4:4 Predictive Profile: Profile này phát triển dựa trên Hi422P hỗ
trợ định dạng 4:4:4, sử dụng 14 bit cho việc mã hóa và lượng tử
High 4:4:4 Predictive
Slices I và P Ye
Trang 15Thiết kế headend SD, HD
Hệ số màu 4:2:0 Ye
Hệ số màu đơn
Lấy mẫu 8 Bit Ye
Điều kiển riêng
Mã hóa màu
Trang 16Thiết kế headend SD, HD
Mã hóa dự đoán
Bảng 1.5: Các tham số của profile
Vmax Baseline, Extended and Main Profiles
Vmax của High Profile
Vmax của High 10 Profile
Vmax của High 4:2:2 and High 4:4:4 Predictive
Các ví dụ về độ phân giải cao @ khung (lưu trữ khung tối đa) trong levels
1 1485 99 64 Kbps 80
Kbps
192 Kbps 256 Kbps
128x96@30.9 (8) 176x144@15.0 (4)
Kbps
160 Kbps
384 Kbps 512 Kbps
128x96@30.9 (8) 176x144@15.0 (4)
Kbps
240 Kbps
576 Kbps 68 Kbps
176x144@30.3 (9) 320x240@10.0 (3) 352x288@7.5 (2)
Kbps
480 Kbps
1152 Kbps
1536 Kbps
320x240@20.0 (7) 352x288@15.2 (6)
1,3 11880 396 768
Kbps
960 Kbps
2304 Kbps
3072 Kbps
320x240@36.0 (7) 352x288@30.0 (6)
2 11880 396 2 Mbps 2,5
Mbps
6 Mbps 8 Mbp
320x240@36.0 (7) 352x288@30.0 (6)
2,1 19800 792 4 Mbps 5
Mbps
12 Mbps 16 Mbps
352x480@30.0 (7) 352x576@25.0 (6)
2,2 20250 1620 4 Mbps 5
Mbps
12 Mbps 16 Mbps
52x480@30.7 (10) 352x576@25.6 (7) 720x480@15.0 (6) 720x576@12.5 (5)
3 40500 1620 10 Mbps 12,5
Mbps
30 Mbps 40 Mbps
352x480@61.4 (12) 352x576@51.1 (10) 720x480@30.0 (6) 720x576@25.0 (5)
3,1 108000 3600 14 Mbps 17,5
Mbps
42 Mbps 56 Mbps
720x480@80.0 (13) 720x576@66.7 (11)
Trang 17Thiết kế headend SD, HD
1280x720@30.0 (5)
3,2 216000 5120 20 Mbps 25
Mbps
60 Mbps 80 Mbps
1280x720@60.0 (5) 1280x1024@42.2 (4)
4 245760 8192 20 Mbps 25
Mbps
60 Mbps 80 Mbps
1280x720@68.3 (9) 1920x1080@30.1 (4) 2048x1024@30.0 (4)
4,1 245760 8192 50 Mbps 62,5
Mbps
150 Mbps
200 Mbps
1280720@68.3 (9) 1920x1080@30.1 (4) 2048x1024@30.0 (4)
4,2 522240 8704 50 Mbps 62,5
Mbps
150 Mbps
200 Mbps
1920x1080@64.0 (4) 2048x1080@60.0 (4)
5 589824 22080 135
Mbps
168,7 Mbps
405 Mbps
540 Mbps
1920x1080@72.3(13) 2048x1024@72.0(13) 2048x1080@67.8(12) 2560x1920@30.7 (5) 3680x1536@26.7 (5)
5,1 83040 36864 240
Mbps
300 Mbps
720 Mbps 960 Mbps
1920x1080@120.5(16) 4096x2048@30.0 (5) 4096x2304@26.7 (5)
Bảng 1.6: Các tham số của level
Vmax: Là tốc độ bit cực đại của tín hiệu video
c) Tính kế thừa của chuẩn nén H.264 (MPEG-4 AVC)
Mục tiêu chính của chuẩn nén H.264 đang phát triển nhằm cung cấp video có chất lượng tốt hơn nhiều so với những chuẩn nén video trước đây Điều này có thể đạt được nhờ sự kế thừa các lợi điểm của các chuẩn nén video trước đây Không chỉ thế, chuẩn nén H.264 còn kế thừa phần lớn lợi điểm của các tiêu chuẩn trước đó là H.262 (MPEG-2) bao gồm 4 đặc điểm chính như sau:
Phân chia mỗi hình ảnh thành các Block (bao gồm nhiều điểm ảnh), do vậy quá trình xử lý từng ảnh có thể được tiếp cận tới mức Block
Khai thác triệt để sự dư thừa về mặt không gian tồn tại giữa các hình ảnh liên tiếp bởi một vài mã của những Block gốc thông qua dự đoán về không gian, phép biến đổi, quá trình lượng tử và mã hoá Entropy (hay mã có độ dài thay đổi VLC)
Khai thác sự phụ thuộc tạm thời của các Block của các hình ảnh liên tiếp bởi vậy chỉ cần mã hoá những chi tiết thay đổi giữa các ảnh liên tiếp Việc này được
Trang 18Thiết kế headend SD, HD
thực hiện thông qua dự đoán và bù chuyển động Với bất kỳ Block nào cũng có thể được thực hiện từ một hoặc vài ảnh mã hoá trước đó hay ảnh được mã hoá sau đó để quyết định vector chuyển động, các vector này được sử dụng trong bộ mã hoá và giải mã để dự đoán các loại Block
Khai thác tất cả sự dư thừa về không gian còn lại trong ảnh bằng việc mã các block dư thừa Ví dụ như sự khác biệt giữa block gốc và block dự đoán sẽ được mã hoá thông qua quá trình biến đổi, lượng tử hoá và mã hoá Entropy
d) Cơ chế nén ảnh của H.264 (MPEG-4 AVC)
Với chuẩn nén H264, mỗi hình ảnh được phân chia thành nhiều block, mỗi block tương ứng với một số lượng nhất định các MacroBlock Ví dụ một hình ảnh có độ phân giải QCIF (tương đương với số lượng điểm ảnh 176x144) sẽ được chia thành 99 MacroBlock với kích cỡ 16x16 Một sự phân đoạn các MacroBlock tương tự được sử dụng các kích cỡ ảnh khác Thành phần chói của ảnh được lấy mẫu tương ứng với độ phân giải của ảnh đó, trong khi đó thành phần màu CR và CB được lấy mẫu với tần số thấp hơn theo 2 chiều ngang và dọc Thêm vào đó mỗi hình ảnh có thể được phân thành số nguyên lần các lát (slice), việc này rất có giá trị cho việc tái đồng bộ trong trường hợp lỗi dữ liệu
Giảm bớt độ dư thừa: Cũng giống như các bộ giải mã khác, H.264 nén video bằng cách giảm bớt độ dư thừa cả về không gian và thời gian trong hình ảnh Những dư thừa về mặt thời gian là những hình ảnh giống nhau lặp đi lặp lại từ khung (frame) này sang khung khác, ví dụ như phần phông nền không chuyển động của một chương trình đối thoại trên truyền hình Dư thừa về không gian là những chi tiết giống nhau xuất hiện trong cùng một khung, ví dụ như nhiều điểm ảnh giống nhau tạo thành một bầu trời xanh
Chọn chế độ, phân chia và chế ngự: Bộ lập giải mã bắt đầu bằng việc quyết định loại khung cần nén tại một thời điểm nhất định và chọn chế độ mã hoá phù hợp Chế độ “Intra” tạo ra ảnh “I”, trong khi chế độ “Inter” tạo ra khung “P” hoặc “B" Sau đó, bộ mã hoá sẽ chia ảnh thành hàng trăm hàng và cột các điểm ảnh của ảnh video số chưa nén thành các khối nhỏ hơn, mỗi khối có chứa một vài hàng và cột điểm ảnh
Nén theo miền thời gian: Khi bộ mã hoá đang hoạt động ở chế độ “giữa khối” (inter), khối này sẽ phải qua công đoạn hiệu chỉnh chuyển động Quá trình này sẽ phát hiện ra bất kỳ chuyển động nào diễn ra giữa khối đó và một khối tương ứng ở một hoặc hơn một ảnh tham chiếu đã được lưu trữ từ trước, sau đó tạo ra một khối “chênh lệch” hoặc “lỗi” Thao tác này sẽ giảm bớt dữ liệu trong mỗi block một cách hiệu quả do chỉ phải trình bày chuyển động của nó mà thôi Tiếp đến là
công đoạn biến đổi côsin rời rạc (DCT-Discrete Cosine Transform) để bắt đầu nén
Trang 19Thiết kế headend SD, HD
theo miền không gian Khi bộ mã hoá hoạt động ở chế độ “trong khối” (intra), khối này sẽ bỏ qua công đoạn hiệu chỉnh chuyển động và tới thẳng công đoạn DCT
Nén theo miền không gian: Các khối thường có chứa các điểm ảnh tương tự
hoặc thậm chí giống hệt nhau Trong nhiều trường hợp, các điểm ảnh thường không thay đổi mấy (nếu có) Như vậy có nghĩa là tần số thay đổi giá trị điểm ảnh trong khối này là rất thấp Những khối như thế được gọi là khối có tần số không gian thấp Bộ lập mã lợi dụng đặc điểm này bằng cách chuyển đổi các giá trị điểm ảnh của khối thành các thông tin tần số trong công đoạn biến đổi côsin rời rạc
+ Biến đổi cosin rời rạc:
Công đoạn DCT biến đổi các giá trị điểm ảnh của khối thành một ma trận gồm các hệ số tần số ngang, dọc đặt trong không gian tần số Khi khối ban đầu có tần số không gian thấp, DCT sẽ tập hợp phần lớn năng lượng vào góc tần số thấp của mạng Nhờ vậy, những hệ số tần số thấp ở góc đó sẽ có giá trị cao hơn
Một số lượng lớn các hệ số khác còn lại trên ma trận đều là các hệ số có tần số cao, năng lượng thấp và có giá trị thấp Hệ số DC và một vài hệ số tần số thấp sẽ hàm chứa phần lớn thông tin được mô tả trong khối ban đầu Điều này có nghĩa là bộ lập mã có thể loại bỏ phần lớn hệ số tần số cao còn lại mà không làm giảm đáng kể chất lượng hình ảnh của khối
Bộ lập mã chuẩn bị các hệ số cho công đoạn này bằng cách quét chéo mạng lưới theo đường zig-zag, bắt đầu từ hệ số DC và qua vị trí của các hệ số ngang dọc tăng dần Do vậy nó tạo ra được một chuỗi hệ số được sắp xếp theo tần số
+ Lượng tử hoá và mã hoá entropy:
Tại đây thao tác nén không gian mới thực sự diễn ra Dựa trên một hệ số tỷ lệ (có thể điều chỉnh bởi bộ mã hoá), bộ lượng tử hoá sẽ cân đối tất cả các giá trị hệ số Do phần lớn hệ số đi ra từ DCT đều mang năng lượng cao nhưng giá trị thấp nên bộ lượng tử hoá sẽ làm tròn chúng thành 0 Kết quả là một chuỗi các giá trị hệ số đã được lượng tử hoá bắt đầu bằng một số giá trị cao ở đầu chuỗi, theo sau là một hàng dài các hệ số đã được lượng tử hoá về 0 Bộ lập mã entropy có thể theo dõi số lượng các giá trị 0 liên tiếp trong một chuỗi mà không cần mã hoá chúng, nhờ vậy giảm bớt được khối lượng dữ liệu trong mỗi chuỗi
e) Các ưu điểm nổi bật của chuẩn nén H.264 (MPEG-4 AVC)
Ưu điểm của nén không gian:
Chuẩn nén MPEG-4 AVC có hai cải tiến mới trong lĩnh vực nén không gian Trước hết, bộ lập mã này có thể tiến hành nén không gian tại các macroblock 16x16 điểm ảnh thay vì các block 8x8 như trước đây Điều này giúp tăng cường
Trang 20Thiết kế headend SD, HD
đáng kể khả năng nén không gian đối với các hình ảnh có chứa nhiều khoảng lớn các điểm ảnh giống nhau
Thứ hai là thao tác nén được tiến hành trong miền không gian trước khi công đoạn DCT diễn ra Chuẩn nén MPEG-4 AVC so sánh macroblock hiện thời với các macroblock kế bên trong cùng một khung, tính toán độ chênh lệch, và sau đó sẽ chỉ gởi đoạn chênh lệch tới DCT Hoặc là nó có thể chia nhỏ macroblock 16x16 điểm ảnh thành các khối 4x4 nhỏ hơn và so sánh từng khối này với các khối kế bên trong cùng một macroblock Điều này giúp cải thiện khả năng nén ảnh chi tiết
Ưu điểm của nén thời gian:
Điểm cải tiến lớn nhất ở MPEG-4 AVC là chế độ mã hoá giữa Những phương pháp tiên tiến ở chế độ này khiến cho nén thời gian đạt đến một cấp độ cao hơn nhiều, cùng với chất lượng chuyển động tốt hơn so với các chuẩn MPEG trước đây
Kích cỡ khối:
Ở chế độ giữa khối, MPEG-2 chỉ hỗ trợ các macroblock 16x16 điểm ảnh, không đủ độ phân giải để mã hoá chính xác các chuyển động phức tạp hoặc phi tuyến tính, ví dụ như phóng hay to thu nhỏ Ngược lại, MPEG-4 AVC lại tăng cường hiệu chỉnh chuyển động bằng cách cho phép bộ lập mã biến đổi kích cỡ thành phần chói của mỗi macroblock (Bộ lập mã sử dụng thành phần chói như vậy là do mắt người nhạy cảm với chuyển động chói hơn nhiều so với chuyển động màu.) MPEG-4 AVC có thể chia thành phần chói của từng macroblock thành 4 cỡ: 16x16, 16x8, 8x16 hoặc 8x8 Khi sử dụng khối 8x8, nó còn có thể chia tiếp 4 khối 8x8 này thành 4 cỡ nữa là 8x8, 8x4, 4x8 hoặc 4x4
Hình 1.1: MPEG-4 AVC có thể phân chia thành phần chói của từng
MacroBlock theo nhiều cách để tối ưu hoá việc bù chuyển động
Việc phân chia các macroblock cho phép bộ lập mã xử lý được một vài loại chuyển động tuỳ theo độ phức tạp của chuyển động đó cũng như nguồn lực về tốc độ bit Nhìn chung, kích cỡ phân chia lớn phù hợp với việc xử lý chuyển động tại các khu vực giống nhau trong ảnh, trong khi đó kích cỡ phân chia nhỏ lại rất có ích khi xử
Trang 21Thiết kế headend SD, HD
lý chuyển động tại các chỗ có nhiều chi tiết hơn Kết quả là chất lượng hình ảnh cao hơn, ít bị vỡ khối hơn
Các cuộc thử nghiệm đã chỉ ra rằng việc sắp xếp hợp lý các khung có thể tăng tỷ lệ nén thêm 15% MPEG-4 AVC lấy phần chói của ảnh gốc và sử dụng các macroblock đã được chia nhỏ tại các khu vực có nhiều chi tiết nhằm tăng cường khả năng hiệu chỉnh chuyển động
+ Độ chính xác trong hiệu chỉnh chuyển động
Trong đa số trường hợp, chuyển động tại rìa mỗi macroblock hay khối thường diễn ra với độ phân giải nhỏ hơn một điểm ảnh Do vậy, chuẩn nén MPEG-4 AVC có thể đảm bảo độ chính xác trong hiệu chỉnh chuyển động lên tới 1/4 hoặc 1/8 điểm ảnh, trong khi các chuẩn MPEG trước đây chỉ dừng lại ở mức 1/2 điểm ảnh Khả năng đạt mức chính xác 1/8 ảnh điểm của MPEG-4 AVC giúp tăng hiệu suất mã hoá tại tốc độ bit cao và độ phân giải video cao Các thử nghiệm cho thấy độ chính xác đến 1/4 điểm ảnh có thể làm giảm tốc độ bit xuống hơn 15% so với độ chính xác 1 điểm ảnh
+ Chọn nhiều hình tham chiếu
Chuẩn nén MPEG-2 chỉ dựa trên hai khung tham chiếu để dự đoán các chuyển động mang tính chu kỳ Tuy nhiên, khi camera thay đổi góc quay hay chuyển qua chuyển lại giữa các cảnh, việc chỉ sử dụng hai khung tham chiếu không còn phù hợp để dự đoán chính xác chuyển động Tương tự như vậy, để đoán trước các chuyển động phức tạp như sóng biển hay một vụ nổ, ta cần phải có nhiều hơn hai khung tham chiếu
Vì thế, chuẩn MPEG-4 AVC cho phép có tới năm khung tham chiếu phục vụ cho việc mã hoá giữa khung Kết quả là chất lượng video tốt hơn và hiệu suất nén cao hơn
+ Giải khối tích hợp
Video số sau khi nén thường tạo ra một hiệu ứng gọi là “kết khối”, có thể thấy rõ tại điểm giao nhau giữa các khối, đặc biệt là khi có tốc độ bit thấp Hiệu ứng này là do công đoạn xử lý sử dụng nhiều loại chuyển động và bộ lượng tử khác nhau Đối với MPEG-2, cách duy nhất để ngăn chặn hiệu ứng này là sử dụng các cơ chế hậu xử lý phù hợp, tuy nhiên các cơ chế này lại không tương thích được với tất cả các máy thu Chuẩn nén MPEG-4 AVC đưa vào sử dụng một bộ lọc giải khối hoạt động ở hai cấp độ: macroblock 16x16 và khối 4x4 Việc giải khối thường tạo ra một tỉ số tín hiệu trên nhiễu (SNR-Signal-to-noise ratio) cực điểm thấp hơn, tuy nhiên nhìn một cách chủ quan thì nó tạo ra hình ảnh chất lượng tốt hơn
Ưu điểm về lượng tử hoá và biến đổi:
Chấm di động 8x8 DCT cùng với dung sai của lỗi làm tròn chính là phần cốt lõi của các chuẩn MPEG trước đây MPEG-4 AVC độc đáo hơn ở chỗ nó sử dụng
Trang 22Thiết kế headend SD, HD
biến đổi không gian nguyên (gần giống như DCT) đối với các khối 4x4 điểm ảnh Kích cỡ nhỏ giúp giảm bớt hiện tượng “kết khối”, trong khi thông số nguyên tuyệt đối giúp loại bỏ nguy cơ không thích ứng giữa bộ lập mã và giải mã trong phép biến đổi ngược Thêm vào đó, dãy hệ số xích lượng tử lớn hơn khiến cho cơ chế kiểm soát tốc độ dữ liệu ở bộ lập mã hoạt động một cách linh hoạt hơn dựa trên một tỉ lệ phức hợp vào khoảng 12,5% thay cho một mức tăng lượng gia không đổi
Ưu điểm đối với mã hoá entropy:
Sau khi tiến hành hiệu chỉnh, biến đổi và lượng tử hoá chuyển động, các bộ lập mã MPEG trước đây sẽ vạch ra các symbol biểu diễn vector chuyển động và hệ số đã lượng tử hoá thành các bit thực sự Ví dụ như chuẩn nén MPEG-2 sử dụng phương pháp mã có chiều dài biến thiên tĩnh (VLC-Variable-length code) không thể tối ưu hoá trong môi trường video thời gian thực (trong đó nội dung và các cảnh biến đổi theo thời gian)
MPEG-4 AVC sử dụng mã hoá thuật toán nhị phân theo tình huống CABAC (Context-Adaptive Binary Arithmetic Coding) Hiệu suất mã hoá của CABAC cao hơn hẳn nhờ khả năng thích nghi với các thay đổi có thể xảy ra trong phân bổ symbol Ví dụ, nó có thể khai thác sự tương quan giữa các symbol và từ đó sử dụng sự tương quan bit và thuật toán mã hoá Cơ chế này có thể giúp tiết kiệm thêm một lượng bit vào khoảng hơn 5%
f) Kết luận
MPEG-4 AVC đánh dấu một bước ngoặt trong lĩnh vực nén video, áp dụng các kỹ thuật tiên tiến nhằm mục đích sử dụng băng thông hiệu quả hơn và đem lại chất lượng ảnh cao hơn Với các kỹ thuật này, MPEG-4 AVC có thể giảm tốc độ bit xuống hơn 50% so với chuẩn MPEG-2 Tuy nhiên, MPEG-4 AVC đòi hỏi một cấp độ phức tạp cao hơn trong cả quá trình mã hóa lẫn giải mã Mặc dù vậy, thử thách này hoàn toàn có thể chinh phục được nhờ có những tiến bộ mới liên tiếp trong khả năng xử lý phần mềm cũng như phần cứng Điều này có nghĩa là MPEG-4 AVC có khả năng thay thế hoàn toàn MPEG-2 trong thời gian tới
Trang 23Thiết kế headend SD, HD
Chương 2: Công nghệ nén và ghép kênh
1 Công nghệ nén
1.1 Nhu cầu của công nghệ nén trong truyền hình
Với công nghệ số phát triển vượt bậc như hiện nay, các thiết bị đều có dải thông nhất định, các dòng tín hiệu số tốc độ cao yêu cầu dải thông rất rộng vượt quá khả năng cho phép của các thiết bị Một cách sơ bộ, nén là quá trình làm giảm tốc độ bit của các dòng dữ liệu tốc độ cao mà vẫn đảm bảo chất lượng dữ liệu cần lưu trữ hoặc truyền tải
Ví dụ như tín hiệu video sau khi được số hóa 8 bit có tốc độ 216 Mbps, với tốc độ này vượt quá khả năng truyền của một kênh truyền hình, vì vậy trong lĩnh vực truyền hình việc sử dụng công nghệ nén gần như tất yếu để giảm tốc độ bit
Trung tâm của mạng phát sóng video số bao gồm hệ thống nén, nó cung cấp chương trình video, audio chất lượng cao cho người xem bằng cách chỉ sử dụng một phần nhỏ độ rộng băng tần mạng Mục đích của nén dữ liệu là tối thiểu hóa khả năng lưu trữ và truyền dẫn phát sóng thông tin (ghép nhiều thông tin vào một dòng truyền) Hệ thống nén tín hiệu bao gồm các bộ mã hóa số và các bộ ghép kênh, các bộ giải mã có nhiệm vụ chuyển tín hiệu analog sang số có nén và xáo trộn thành một dòng audio-video và dữ liệu khác dưới dạng số có nén Mã hóa số cho phép truyền dẫn phát sóng nhiều chương trình audio-video chất lượng cao qua cùng độ rộng băng tần như một kênh sóng audio-video analog (8 MHz ở Việt Nam)
1.2 Công nghệ nén audio chuẩn ISO/MPEG-1
Đây là tiêu chuẩn mã hóa audio với tần số lấy mẫu là 32,441 KHz và 48 KHz, tốc độ bit khoảng 32-192 Kbps cho âm thanh mono và 64-384 Kbps cho âm thanh stereo
Có hai phương pháp để giảm tốc độ bit của tín hiệu audio:
Phương pháp 1: Chủ yếu là loại bỏ tín hiệu dư thừa audio bằng phép tương quan thống kê
Phương pháp 2: Sử dụng che mặt nạ thời gian và phổ tần số
Sử dụng hai phương pháp trên thì tốc độ bit cần truyền giảm xuống 200 Kbps và thậm chí thấp hơn đối với âm thanh stereo
Sau đây là sơ đồ hệ thống audio trong truyền hình số
Trang 24Thiết kế headend SD, HD
Hình 2.1: Hệ thống audio trong truyền hình số
Sau đây ta xét sơ đồ mạch mã hóa và giải mã của hệ thống audio lớp 1 và 2 theo tiêu chuẩn (ISO/MPEG)
Hình 2.2: Sơ đồ khối mạch mã hoá audio lớp 1 và 2 theo chuẩn ISO/IEC 11172-1,
2
Tùy thuộc vào từng ứng dụng khác nhau, hệ thống mã hóa tín hiệu audio có
ba lớp với mức độ phức tạp tăng dần Đối với cả ba lớp tín hiệu được biến đổi từ miền thời gian sang miền tần số bằng 32 băng lọc phụ
Hình 2.3: Sơ đồ khối mạch giải mã audio lớp 1 và 2 theo chuẩn ISO/IEC 11172-2
Dữ liệu audio đã mã hóa Mô hình “Tâm
lý âm thanh”
Biểu số FFT
(1024 điểm)
Băng lọc (32 băng phụ)
Lượng tử hóa tuyến tính
Mã hóa các thông tin phụ
Định dạng dòng bit và mã sữa sai
Giải lượng tử
Quá trình ngược của băng lọc (32 băng phụ)
Giải mã thông tin phụ
Trang 25Thiết kế headend SD, HD
Lớp 1, 2 biểu thị tín hiệu audio đầu vào bằng 32 băng lọc phụ, những thông số này được lượng tử hóa và mã hóa dưới sự khống chế của mô hình âm thanh
Lớp 1 chỉ biến thể giản ước của phương pháp mã hóa MPEG-1 và được sử dụng chủ yếu trong các ứng dụng dân dụng
Lớp 2 thực hiện việc nén tín hiệu và thực hiện việc lượng tử hóa tinh hơn, ứng dụng nhiều kể cả dân dụng lẫn chuyên dụng
Hình 2.4: Sơ đồ khối mạch giải mã audio lớp 3 theo chuẩn ISO/IEC 11172-3
Hình 2.5: Sơ đồ khối mạch giải mã audio lớp 3 theo chuẩn ISO/IEC 11172-3
Lớp 3 là sự mã hóa các môđun hiệu quả của 2 loại mã ASPEC và MUSICAM Mỗi băng lọc phụ lại được chia nhỏ nhiều đường nên có độ phân giải cao hơn Ở lớp này nếu muốn hiệu quả nén cao phải dùng phương pháp lượng tử hóa phi tuyến
1.3 Công nghệ nén video chuẩn MPEG
1.3.2 Nén video theo chuẩn MPEG-1
Tiêu chuẩn MPEG-1 gồm 4 phần:
Phần 1: Hệ thống (ISO/IEC 11172-1)
Phần 2: Nén video (ISO/IEC 11172-2)
Phần 3: Nén audio (ISO/IEC 11172-3)
Dữ liệu audio đã mã hoá
Dữ liệu
audio vào
Biểu số FFT (1024 điểm)
Băng lọc (32 băng phụ)
DCT
Mã hóa các thông tin phụ
Định dạng dòng bit và mã sữa sai
0
575
Mã hoá Huffanm
0
575
Tín hiệu audio stereo
Trang 26Thiết kế headend SD, HD
Phần 4: Kiểm tra (ISO/IEC 11172- 4)
MPEG-1 nghiên cứu cách thức ghép nối một hoặc vài dòng dữ liệu chứa thông tin thời gian để hình thành nên một dòng dữ liệu Nó cung cấp qui tắc cú pháp đồng bộ hoá quá trình phát lại cho một dải ứng dụng video rộng MPEG-1 coi ảnh chuyển động như dạng thức dữ liệu máy tính (gồm các điểm ảnh) Cũng như các dữ liệu máy tính (ảnh và văn bản), ảnh video chuyển động có khả năng truyền và nhận bằng máy tính và mạng truyền thông Chúng cũng có thể được lưu trữ trong các thiết bị lưu trữ dữ liệu số như đĩa CD và ổ quang
MPEG-1 cung cấp cả các ứng dụng đối xứng và không đối xứng:
Trong ứng dụng không đối xứng, ảnh động được nén một lần, sau đó giải nén nhiều lần để truy cập thông tin, ví dụ trò chơi games
Trong ứng dụng đối xứng, quá trình nén và giải nén phải cân bằng nhau Ví dụ: điện thoại hình, thư điện tử
Để đạt được hiệu suất nén cao mà vẫn giữ tốt chất lượng ảnh phục hồi, chuẩn MPEG-1 sử dụng cả công nghệ nén trong ảnh (Intraframe) và liên ảnh (Interframe) để loại bỏ được cả sự dư thừa không gian và thời gian
Do MPEG-1 được phát triển cho lưu trữ dữ liệu số nên đòi hỏi có sự truy cập ngẫu nhiên (Random Access) Cách thức mã hoá tốt nhất cho truy cập ngẫu nhiên là mã hoá Intraframe đơn thuần Song do sự dư thừa thông tin về thời gian chưa được loại bỏ nên hiệu suất nén rất thấp Do vậy trong tiêu chuẩn nén MPEG-1, có sự cân bằng giữa nén trong ảnh và nén liên ảnh bằng cách sử dụng các công nghệ sau đây:
Bù chuyển động
Dự báo
Nội suy
Biến đổi cosine rời rạc
Lượng tử hoá
Mã•hoá độ dài thay đổi (mã Huffman-VLC)
Tức là có sự kết kết hợp hai công nghệ nén DPCM (Differential Pluse Code Modulation–điều chế mã xung vi sai) và TC (Trasform Codin-mã hóa chuyển đổi) Thuật toán nén MPEG-1 sử dụng bù chuyển động khối để giảm sự dư thừa thời gian với vector chuyển động cho mỗi khối kích thước 16x16 điểm ảnh Bù chuyển động được sử dụng cho cả dự báo nhân quả và không nhân quả
Dự báo nhân quả tạo dự báo ảnh hiện hành từ ảnh trước đó
Dự báo không nhân quả tạo dự báo cho ảnh hiện hành dựa trên ảnh trong quá khứ và cả tương lai
Trang 27Thiết kế headend SD, HD
Vòng lặp DPCM được sử dụng để tạo khung sai số dự báo Sau đó, công nghệ mã hoá chuyển đổi chuyển khung sai số này sang miền tần số để nén các hệ số nhờ lượng tử hoá và mã hoá Huffman trước khi truyền tải hay lưu trữ
a) Các thành phần ảnh cơ bản trong chuẩn nén MPEG
Các tiêu chuẩn MPEG, cấu trúc dữ liệu đều ở dạng lớp Bao gồm các thành phần cơ bản sau đây:
Hình 2.6: Cấu trúc lớp dữ liệu trong MPEG
Khối (Block): Là đơn vị cơ bản cho chuyển đổi DCT Bao gồm 8x8 điểm
ảnh tín hiệu chói hoặc tín hiệu màu
Macro Block: Là nhóm các khối DCT tương ứng với thông tin của một cửa
sổ 16x16 điểm ảnh gốc Có nhiều dạng Macro Block khác nhau phụ thuộc vào cấu trúc lấy mẫu được sử dụng
Lớp nhóm ảnh
(GOP layer)
Lớp khung
(Frame layer)
Khung I Khung B Khung P Khung B Khung I Khung B
GOP #p GOP #p+1 GOP #p+2 GOP #p+3 GOP #p+4 GOP #p+5
Chuỗi video #n
Đặc điềm MB Vecto chuyển động Khối Y Khối Y Khối Y Khối Y Khối C B Khối CR
Các hệ số DCT EOB
8x8 điểm chói
Lớp chuỗi ảnh
(Sequence layer)
Sequence header)
Trang 28Thiết kế headend SD, HD
Hình 2.7: Cấu trúc Macroblock của các dạng lấy mẫu
Phần đầu đề (header) của Macroblock chứa thông tin phân loại (Y hay CB,
CR) và vector bù chuyển động tương ứng
Lát (slice): Được cấu thành từ một hay một số MB liên tiếp nhau
Phần header của slice chứa thông tin về vị trí của nó trong ảnh và tham số quét lượng tử (quantized scaling factor) Kích cỡ của slice quyết định bởi mức bảo vệ lỗi cần có trong ứng dụng vì bộ giải mã sẽ bỏ qua slice bị lỗi Hệ số một chiều DC được định vị tại điểm bắt đầu mỗi slice
Ảnh: Lớp ảnh cho bên thu biết về loại mã hoá khung ( I,P,B) Phần header mang thứ tự, ngoài ra còn có một số thông tin bổ sung như thông tin đồng bộ, độ phân giải và vector chuyển động
Nhóm ảnh (GOP-group of picture): Gồm cấu trúc các ảnh I, B và P Mỗi nhóm bắt đầu bằng ảnh I cung cấp điểm vào ra và tìm kiếm Phần header chứa
25 bit thời gian và chế độ điều khiển cho VTR và thông tin thời gian
Chuỗi Video (Video Sequence): Lớp chuỗi bao gồm phần header, một hoặc một số nhóm ảnh (Picture Group) và phần kết thúc chuỗi (Sequence end Code) Thông tin quan trọng nhất của phần header là kích thước (dọc, ngang) của mỗi ảnh, tốc độ bit, tốc độ ảnh và dung lượng đòi hỏi bộ đệm dữ liệu bên thu Thông tin chuỗi ảnh và phần header của chuỗi là dòng bit đã mã hoá, còn gọi là dòng video cơ bản
Trong MPEG có các cấu trúc nhóm ảnh điển hình như sau:
8
6
Trang 29Thiết kế headend SD, HD
Hình 2.8: Các cấu trúc nhóm ảnh trong tiêu chuẩn MPEG
b) Sự phân loại ảnh trong MPEG
Tiêu chuẩn nén video MPEG định nghĩa 3 loại ảnh: ảnh I, ảnh B và ảnh P
Ảnh I: (Intra - Coded Picture)
Các ảnh I được mã hoá theo mode Intra để có thể giải mã mà không cần sử dụng dữ liệu từ bất cứ một ảnh nào khác Đặc điểm của phương pháp mã hoá này như sau:
+ Chỉ loại bỏ được sự dư thừa không gian
+ Dùng các điểm trong cùng một khung để tạo dự báo
+ Không có bù chuyển động
+ Các thông tin được mã hoá rõ ràng, minh bạch nên số lượng bit yêu cầu lớn
Do được mã hoá Intra, ảnh I bao giờ cũng là ảnh đầu tiên trong một nhóm ảnh hay một chuỗi ảnh Nó cung cấp thông tin khởi động các ảnh tiếp theo trong nhóm
Ảnh P (Predictive Code Picture)
Ảnh P được mã hoá liên ảnh một chiều (Interframe một chiều):
+ Dự báo Inter một chiều
Cấu trúc IBBPBBPBBI
Cấu trúc IBI Cấu trúc IBP Cấu trúc IP
Trang 30Thiết kế headend SD, HD
+ Ảnh dự báo được tạo ảnh tham chiếu trước đó (dự báo nhân quả) Ảnh tham chiếu này có thể là ảnh I hoặc ảnh P gần nhất
+ Có sử dụng bù chuyển động Thông tin ước lượng chuyển động của các khối nằm trong vector chuyển động (motion vector) Vector này xác định Macroblock nào được sử dụng từ ảnh trước
Do vậy ảnh P bao gồm cả những MB mã hoá Inter (I - MB) là những macroblock chứa thông tin lấy từ ảnh tham chiếu và những MB mã hoá Intra là những MB chứa thông tin không thể mượn từ ảnh trước Ảnh P có thể được sử dụng làm ảnh tham chiếu tạo dự báo cho ảnh sau
Ảnh B (Bidirectionally Predicted Pictures)
Ảnh B là ảnh mã hoá liên ảnh hai chiều Tức là :
+ Có sử dụng bù chuyển động
+ Dự báo không nhân quả, ảnh dự báo gồm các macroblock của cả khung hình trước đó và sau đó
Việc sử dụng thông tin lấy từ ảnh trong tương lai hoàn toàn có thể thực hiện được vì tại thời điểm mã hoá thì bộ mã hoá đã sẵn sàng truy cập tới ảnh phía sau Ảnh B không được sử dụng làm ảnh tham chiếu tạo dự báo cho các ảnh sau
Hình 2.9: Nội suy bù chuyển động
Khung dự báo (P) = Khung trước – Khung hiện hành + Vecto chuyển động
Vùng không bao phủ
Dự báo bù chuyển động bù ảnh P Khung dự báo (B) = Khung trước – Khung hiện hành + Vecto chuyển động hai chiều
Khung hiện hành (n)
Vị trí nội suy
Đường di chuyển của vật thể
Dự báo bù chuyển động bù ảnh B
Trang 31Thiết kế headend SD, HD
Thứ tự truyền dẫn và thứ tự hiển thị ảnh:
Chuỗi ảnh MPEG thường có cấu trúc IBBPBBPBBI nhưng thứ tự truyền dẫn và thứ tự hiển thị ảnh là khác nhau do khi tạo ảnh B cần thông tin từ cả khung quá khứ và tương lai Như vậy có nghĩa, ảnh trong tương lai cần phải được truyền dẫn trước Trong khi đó, lúc hiển thị phải theo đúng thứ tự nguồn Để thực hiện điều này, lớp ảnh (Picture layer) của dòng dữ liệu MPEG có thông tin về số thứ tự ảnh để trợ giúp hiển thị
Hình 2.10: Thứ tự truyền dẫn và thứ tự hiển thị ảnh
c) Tiêu chuẩn MPEG-1
MPEG-1 có phạm vi ứng dụng rộng rãi cho dạng thức CSIF (Common Source Intermediate Format) CSIF là một định dạng nguồn dữ liệu đầu vào của các bộ nén và giải nén (codec) do CCITT qui định phù hợp với hai dạng quét TV 525dòng/60Hz và 625dòng/50Hz Dạng thức này gắn với cấu trúc lấy mẫu 4:2:0 được qui định như sau:
CCIR - 601
525
CSIF- 525 4:2:0
CCIR - 601
625
CSIF - 625 4:2:0 Số điểm/dòng tích cực
Trang 32Thiết kế headend SD, HD
Bảng 2.1: Dạng thức ảnh cơ bản của CSIF
Như vậy đối với MPEG-1, dòng dữ liệu truyền hình chuẩn theo CCIR- 601 phải được biến đổi sang dạng CSIF bằng một bộ chuyển đổi (converter) Điều này được thực hiện bằng cách sử dụng bộ lọc dòng (horizontal decimation filter) cho tín hiệu chói mành lẻ và bộ lọc dòng và mành cho tín hiệu CR, CB mành lẻ Quá trình giải mã tại bộ thu phải dự báo mành chẵn từ mành lẻ nội suy
Để giảm mức độ phức tạp và giá thành bộ giải mã, trong MPEG 1 một số tham số được mặc định thành hằng số như sau:
Bảng 2.2: Các tham số mặc định trong chuẩn MPEG-1
Cú pháp dòng bit gồm 6 lớp như đã mô tả ở bảng 2.3
Sử dụng cả hai dạng thức nén:
Nén Intra: Biến đổi DCT, lượng tử hoá, mã hoá VLC cho ảnh I
Nén Inter: Ước lượng chuyển động, tạo dự báo có bù chuyển động cho ảnh B và ảnh P
MPEG 1 có một số tiêu chuẩn cơ bản như sau:
Trang 33Thiết kế headend SD, HD
+ Chỉ có một cấu trúc lấy mẫu 4:2:0
+ Kích cỡ ảnh tối đa 720 pixel với 576 dòng sử dụng các tham số mặc định và cỡ 4095 x 4095 dùng tham số đầy đủ
+ Độ chính xác mẫu đầu vào 8 bit
+ Độ chính xác lượng tử hoá và DCT: 9 bit
+ Sử dụng lượng tử hoá DPCM tuyến tính cho hệ số DC
+ Lượng tử thích nghi cho lớp macroblock (16x16 điểm)
+ Độ chính xác cực đại của hệ số DC là 8 bit
+ Ma trận lượng tử chỉ có thể thay đổi ở lớp chuỗi
+ Sử dụng khung P và B
+ Độ chính xác dự báo chuyển động là nửa điểm
+ Tốc độ bit tối đa là 1,85 Mbps khi dùng tham số mặc định cho ảnh 720x576 và 100 Mbps khi dùng tham số đầy đủ cho ảnh 4095 x 4095
MPEG-1 cho phép có sự truy cập ngẫu nhiên các khung video, tìm kiếm nhanh thuận ngược theo dòng bit đã nén, phát lại ngược dòng video và khả năng dời bỏ dòng bit nén
d) Hệ thống nén MPEG-1
Bộ phân loại Inter/Intra căn cứ vào thông tin phân loại ảnh (I, P, B) sẽ cho tín hiệu ra Inter/Intra xác định ảnh được mã hóa theo mode Inter hay mode Intra Thông tin này là tác nhân chuyển mạch kích hoạt bộ tạo dự báo tương ứng
Nếu ảnh I (mã hóa Intra): Sử dụng dự báo Intra, lấy MB lân cận trước đó làm dự báo cho MB hiện hành MB lân cận này được phục hồi nhờ bộ giải lượng tử và biến đổi DCT ngược (IDCT)
Nếu ảnh B, P (mã hóa Inter): Sử dụng bộ tạo dự báo Inter có bù chuyển động
Bộ tạo dự báo này hoạt động như sau:
Chuyển động của các MB được tính toán nhờ bộ ước lượng chuyển động theo các thuật toán Blocking Matching Kết quả cho vector chuyển động
Vector chuyển động này được đưa đến khối dự báo có bù chuyển động để tạo giá trị dự báo có bù chuyển động
Do quá trình ước lượng chuyển động cần so sánh giữa khung hiện hành với khung quá khứ (ảnh P) hoặc với cả khung quá khứ lẫn tương lai (ảnh B) nên cần có hai bộ lưu trữ ảnh
Trang 34Thiết kế headend SD, HD
Sai số giữa MB dự báo và hiện hành được biến đổi DCT, lượng tử hóa, mã hóa VLC rồi đưa tới bộ nhớ đệm Đầu ra bộ nhớ đệm là dòng bit đã được mã hóa và có tốc độ ổn định
Tham số lượng tử, thông tin phân loại Inter/Intra và vector chuyển động sẽ được ghép kênh với thông tin ảnh đưa tới bên thu phục vụ cho quá trình tạo dự báo và giải mã khôi phục ảnh
Sơ đồ khối chi tiết bộ codec (bộ mã hoá) trong chuẩn MPEG-1 như sau:
Hình 2.11: Sơ đồ khối bộ mã hóa MPEG-1
Thông tin về loại
Mã hóa VLC và ghép kênh
Bộ nhớ điệm
Lượng tử hóa
Lượng tử hóa thích
Giải lượng tử
ICDT
Dự báo có bù chuyển động
Ước lượng chuyển động
Lưu trữ ảnh tương lai
Lưu trữ ảnh quá khứ
DCT: Biến đổi cosin rời rạc
ICDT: Biến đổi cosin rời rạc ngược
Loại ảnh (I,B,P)
Write Future
Vecto chuyển động
INTER/
INTRA
Tham số lượng tử
Tham số lượng tử
Vecto chuyển động
Trang 35Thiết kế headend SD, HD
Sơ đồ khối chi tiết bộ giải mã trong chuẩn MPEG-1 như sau:
Hình 2.12: Sơ đồ khối bộ giải mã MPEG-1
Trong dòng bit truyền đi từ bên phát sẽ có thông tin ảnh gốc cũng như các tham số quy định bước lượng tử và vector chuyển động Vector chuyển động này được bên thu sử dụng để tạo dự báo có bù chuyển động tương tự như phía phát
Giá trị sai số dự báo từ bên thu sau khi giải lượng tử và biến đổi DCT ngược được cộng với giá trị dự báo Kết quả thu được ảnh cần hồi phục
1.3.3 Nén video theo tiêu chuẩn MPEG-2
a) Tiêu chuẩn nén video MPEG-2
Tiêu chuẩn MPEG-2 còn được gọi là ISO/IEC 13818 là sự phát triển tiếp theo của MPEG-1 ứng dụng cho độ phân giải tiêu chuẩn của truyền hình do CCIR-
601 qui định MPEG 2 gồm 4 phần:
Phần 1: Hệ thống (ISO/IEC 13818-1): Xác định cấu trúc ghép kênh audio,
video và cung cấp đồng bộ thời gian thực
Phần 2: Video (ISO/IEC 13828-2): Xác định những thành phần mã hóa đại diện
cho dữ liệu video và phân loại xử lý giải mã để khôi phục lại khung hình ảnh
Phần 3: Audio (ISO/IEC 13818-3): Mã hóa và giải mã dữ liệu âm thanh
Phần 4: Biểu diễn (ISO/IEC 13818-4): Định nghĩa quá trình kiểm tra các yêu
cầu của MPEG-2
Bộ nhớ
đệm
Giải mã và tách kênh
Giải lượng tử hóa
IDCT
Lưu trữ ảnh tương lai
Lưu trữ ảnh quá
bù chuyển động
Dòng video ra
Loại ảnh (I,B,P)
Loại ảnh (I,B,P)
Vecto chuyên động
Tham số lượng tử
Write Future
Write Previous
INTER/
INTRA Dòng bit
Trang 36Thiết kế headend SD, HD
So với MPEG-1, MPEG-2 có nhiều cải thiện, ví dụ về kích thước ảnh và độ phân giải ảnh, tốc độ bit tối đa, tính phục hồi lỗi, khả năng co giãn dòng bit Khả năng co giãn dòng bit của MPEG-2 cho phép khả năng giải mã một phần dòng bit mã hóa để nhận được ảnh khôi phục có chất lượng tuỳ thuộc mức độ yêu cầu Sau đây là một số đặc điểm chủ yếu của tiêu chuẩn này :
Hỗ trợ nhiều dạng thức video, đặc biệt là các dạng thức video độ phân giải không gian cao, dạng thức video xen kẽ của truyền hình
Cú pháp dòng bit MPEG-2 là sự mở rộng của dòng bit MPEG-1
Nén video MPEG-2 tương hợp với nén video MPEG-1 Được thể hiện qua
4 hình thức tương hợp
+ Tương hợp thuận: Bộ giải mã MPEG-2 có khả năng giải mã dòng bit (hoặc một phần dòng bit MPEG-1)
+ Tương hợp ngược: Bộ giải mã MPEG-1 có khả năng giải mã được
một phần dòng bit MPEG-2
+ Tương hợp lên: Bộ giải mã có độ phân giải cao có khả năng giải mã
được dòng bit của bộ mã hoá có độ phân giải thấp
+ Tương hợp xuống: Bộ giải mã c o ù độ phân giải thấp có thể giải mã được một phần dòng bit của bộ mã hóa độ phân giải cao
MPEG-2 hỗ trợ khả năng co giãn (scalability): Co giãn không giãn, co giãn SNR (Signal to Noise Ratio), co giãn phân chia số liệu,
Ngoài ra còn có nhiều cải tiến khác trong MPEG-2 bao gồm:
+ Cho phép nhiều cấu trúc lấy mẫu: 4:4:4, 4:2:2 và 4:2:0
+ Hệ số DC được mã hóa với độ chính xác đặc biệt
+ Bảng lượng tử riêng biệt cho các thành phần chói và màu nên lợi dụng được đặc điểm của mắt người ít nhạy cảm hơn với tín hiệu màu
+ Cho phép cả hai dạng quét: Quét xen kẽ và quét liên tục
+ Có khả năng hồi phục sữa lỗi
Cú pháp đầy đủ của MPEG-2 được thể hiện qua các tập con gọi là profile, phù hợp với các lĩnh vực áp dụng Mỗi profile lại bao gồm từ 1 đến 4 mức độ hạn chế về độ phân giải không gian, tốc độ bit
b) Cấu trúc dòng bit video MPEG-2
Dòng bit MPEG-2 về cơ bản tương hợp với MPEG-1, tức là cũng gồm cấu trúc 6 lớp tên gọi và chức năng các lớp được liệt kê lại như sau:
Trang 37Thiết kế headend SD, HD
Lớp chuỗi (Sequence Layer) Đơn vị nội dung
Lớp nhóm ảnh (GOP Layer) Đơn vị truy nhập ngẫu nhiên
dòng video mã hóa
Lớp ảnh (Picture Layer) Đơn vị mã hóa cơ bản
Lớp lát (Slice Layer) Đơn vị tái đồng bộ
Lớp Macro Block (MB Layer) Đơn vị bù chuyển động
Lớp khối (Block Layer) Đơn vị chuyển đổi DCT
Bảng 2.3: Các lớp của cú pháp dòng bit MPEG-2
Lớp chuỗi là đại diện mã hóa cho một chuỗi ảnh (Video sequence)
Lớp nhóm ảnh cung cấp điểm truy cập ngẫu nhiên Ảnh bắt đầu của chuỗi bao giờ cũng là một ảnh I Ảnh I này cung cấp điểm truy cập vào dòng bit mã hóa
Lớp lát có chức năng hồi phục đồng bộ Khi dòng bit có lỗi, bộ giải mã có thể bỏ qua slice có lỗi và bắt đầu bằng một slice mới Mỗi lát chứa một hoặc một số MB
Mỗi macroblock (MB) là một đơn vị được ước lượng chuyển động và có vector chuyển động riêng trong phần header của nó
Lớp khối là lớp thấp nhất Mỗi khối là một đơn vị DCT gồm 64 hệ số (một hệ số DC và 63 hệ số AC phép chuyển đổi cosine rời rạc) của khối ảnh I hoặc khối sai số dự báo (ảnh P, B)
So với MPEG-1, cú pháp dòng bit MPEG-2 có thêm một số chức năng mở rộng
Do đó có 2 hướng đi trong dòng bit MPEG-2 như hình vẽ dưới đây: hoặc theo quy trình MPEG-1 hoặc theo các chức năng mở rộng riêng của MPEG-2
Hình 2.13: Cú pháp dòng bit MPEG-2 c) Khả năng co giản của MPEG-2
Một trong những đặc điểm quan trọng nhất của MPEG-2 là sự phù hợp với nhiều ứng dụng video Có thể sử dụng MPEG-2 cho phân phối truyền hình tiêu chuẩn (Standard Television), truyền hình phân giải cao (High Definition Television) hoặc cho truyền dẫn tín hiệu truyền hình thông qua các mạng truyền thông
Trang 38Thiết kế headend SD, HD
Tính co giãn của dòng bit MPEG-2 là khả năng giải mã được một phần dòng bit MPEG-2 độc lập với phần còn lại của dòng bit đó nhằm khôi phục video với chất lượng hạn chế (hạn chế độ phân giải không gian, độ phân giải thời gian hoặc hạn chế về SNR ) Dựa theo tính co giãn, dòng bit được phân thành hai hay nhiều lớp Tập con nhỏ nhất của cú pháp dòng bit có thể giải mã một cách độc lập được gọi là lớp cơ bản Các lớp còn lại được gọi là các lớp nâng cao Có nhiều loại co giãn khác nhau như:
Co giãn không gian: Dòng bit gồm hai hay nhiều lớp video có độ phân
giải không gian khác nhau
Co giãn SNR: Dòng bit gồm hai hay nhiều lớp video có cùng độ phân
giải không gian nhưng tỉ số tín hiệu trên nhiễu SNR là khác nhau
Co giãn thời gian: Dòng bit gồm hai hay nhiều lớp video có cùng độ phân
giải không gian nhưng có độ phân giải thời gian khác nhau
Co giãn phân chia số liệu: Dòng bit video được chia làm hai phần Phần
ưu tiên cao (lớp cơ bản) gồm các hệ số DCT tần số thấp, phần ưu tiên thấp (lớp nâng cao) gồm các hệ số DCT tần số cao
Co giãn phân chia số liệu chính là một dạng cơ bản của co giãn tần số Tiêu chuẩn MPEG-2 đã qui định chính thức hai loại co giãn: co giãn không gian và co giãn SNR Các loại co giãn khác chỉ mới ở dạng dự thảo
d) Profile và Level của MPEG-2
Phạm vi ứng dụng của MPEG-2 rất rộng Mỗi ứng dụng đòi hỏi mức độ phức tạp khác nhau Bởi vậy, MPEG-2 định nghĩa các mức (level) và các tập con (profile) phù hợp cho từng lĩnh vực áp dụng Profile xác định cú pháp dòng bit và level xác định các tham số hạn chế độ phân giải không gian, tốc độ bit
Có 4 mức: low (thấp), main (chính), high-1440 (cao-1440) và high (cao) Kích cỡ ảnh quy định bởi 4 mức tương ứng sau:
Bảng 2.4: Mức ảnh trong MPEG-2
Có 5 profile là: Simple (đơn giản), Main (chính), SNR scalable (co giãn SNR), Spatial scalable (có khả năng co giãn không gian) và High profile Tổng cộng có 12 tổ hợp profile, level Trong đó:
Trang 39Thiết kế headend SD, HD
MP @ ML (Main profile @ Main level):
Lấy mẫu 4:2:0 Độ phân giải: 720*576 Tốc độ bit: 15Mbps Dạng ảnh: I, P, B
Ứng dụng vào việc số hóa truyền hình tiêu chuẩn (Standard television)
MP @ HL (Main profile @ High level):
Lấy mẫu 4:2:0 Độ phân giải: 1920x1152 Tốc độ bit: 80Mbps Dạng ảnh sử dụng: I, P, B
Ứng dụng vào HDTV (truyền hình số có độ phân giải cao)
Sau này có bổ sung 4:2:2 P @ ML (4:2:2 Profile @ Main level) áp dụng vào lĩnh vực sản xuất chương trình truyền hình (studio) vì các lý do sau:
+ Chất lượng cao: Độ phân giải màu tốt hơn so với MP @ ML (lấy mẫu 4:2:0), chất lượng tổng quát cao hơn do sử dụng tốc độ bit lớn hơn
+ Có khả năng sao chép nhiều lần mà vẫn đảm bảo chất lượng y như video gốc + Tính linh hoạt: Nhóm anh (GOP) ngắn hơn nên thuận tiện cho việc dàn dựng, biên tập chương trình truyền hình
+ Tính kinh tế: Giá thành lưu trữ và truyền dẫn giảm, có khả năng tương hợp giữa các thiết bị của nhiều hãng sản xuất khác nhau
Các tham số cơ bản của 4:2:2 P @ ML:
Cấu trúc lấy mẫu: 4:2:2 Độ phân giải ảnh: 720*576 Tốc độ dòng bit: 20Mbps Dạng ảnh sử dụng: I, P, B
2 Công nghệ ghép kênh
Ngày nay, việc sử dụng phổ tần số ngày càng được chú trọng Vì phổ tần số là tài sản hữu hạn của quốc gia phục vụ nhiệm vụ thông tin liên lạc ngày càng phát triển không ngừng của xã hội, cũng như phục vụ cho việc phát triển kinh tế xã hội,
an ninh quốc phòng Việc sử dụng tần số một cách tiết kiệm và có hiệu quả là ưu tiên hàng đầu Ghép kênh là ghép nhiều luồng tín hiệu lại với nhau thành một luồng duy nhất, nhằm tiết kiệm kênh truyền Có hai phương pháp ghép kênh số:
Trang 40Thiết kế headend SD, HD
Ghép kênh phân chia theo thời gian (TDM - Time Division Multilexing
Method) Về nguyên lý TDM gán các khe thời gian một cách tuần hoàn cho các dòng sơ cấp audio, video và số liệu
Hình 2.14: Ghép kênh theo thời gian
Ghép kênh gói (Packet Multiplexing Method) Trong cách ghép kênh gói, các gói
số liệu từ các dòng sơ cấp audio, video, số liệu được đan xen vào nhau một cách tuần hoàn hoặc không tuần hoàn, gói này tiếp theo gói kia để hình thành một dòng ghép kênh
Hình 2.15: Ghép kênh gói
2.1 Hệ thống ghép kênh video số theo tiêu chuẩn MPEG-2
2.1.1 Ghép kênh gói theo chuẩn MPEG
Hình 2.16: Bộ ghép kênh MPEG-2
Hệ thống ghép kênh gói mô tả cách thức các dòng số video nén, audio nén và các dòng số liệu khác được ghép chung lại với nhau để tạo ra dòng ghép kênh MPEG Một số thuật ngữ và các nguyên lý cơ bản của các lớp hệ thống MPEG:
Dòng ghép kênh MPEG-2
BỘ GHÉP KÊNH MPEG-2