ITPV theo định nghĩa chính thức như sau: IPTV được định nghĩa là các dịch vụ đa phương tiện như truyền hình ảnh, tiến nói, văn bản, dữ liệu được phân phối qua các mạng dựa trên IP mà đượ
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
Trang 2Mục lục
Chương 1 Tổng quan về IPTV
1.1 Giới thiệu về truyền hình số theo giao thức IP………4
1.2 Một số đặc tính IPTV……… 4
1.3 Sự khác biệt giữa IPTV và truyền hình Internet……….5
1.4 Cơ sở hạ tầng một mạng IPTV………7
1.5 Mô hình truyền thông của IPTV……… 8
1.5.1 Lớp mã hóa video……….9
1.5.2 Lớp đóng gói video……… 10
1.5.3 Lớp cấu trúc dòng truyền tải………10
1.5.4 Lớp giao thức truyền tải thời gian thực……… 10
1.5.5 Lớp truyền tải……… 10
1.5.6 Lớp IP……….12
1.5.7 Lớp liên kết dữ liệu……….14
1.5.8 Lớp vật lý………15
1.6 Ưu điểm của IP và sự lựa chọn IP cho IPTV……….16
Chương 2 Chuẩn mã hóa H.264 2.1 Các kĩ thuật nén thông dụng……… 18
2.1.1 Nén MPEG……… 18
2.1.2 Chuẩn MPEG-2……… 18
2.1.2.1 Quá trình nén MPEG……… 18
2.1.2.2 Các ảnh trong chuẩn nén MPEG……… 20
2.1.3 MPEG-4……… 22
2.1.4 Công nghệ mã hóa video trong MPEG-4……… 23
2.2 Sự ra đời của chuẩn H.264………26
2.2.1 Cơ chế H.264……….28
2.2.1.1 Giảm bớt độ dư thừa……… 29
2.1.1.2 Chọn chế độ, phân chia………29
2.1.1.3 Nén theo miền thời gian……… 29
Trang 32.1.1.4 Nén theo miền không gian……… 30
2.2.2 Cấu trúc phân lớp của H.264/AVC………31
2.2.3 Bộ mã hóa H.264………34
2.2.4 Các đặc điểm chính của H.264………37
2.3 Khái niệm và phân loại điều khiển tốc độ……… 43
2.3.1 One-pass VBR……….43
2.3.2 One-pass CBR……….44
2.3.3 One-pass constant QP……… 44
2.3.4 One-pass ABR……….45
2.4 Vấn đề điều khiển tốc độ trong H.264………45
2.4.1 Các thành phần của điều khiển tốc độ H.264……… 47
Chương 3 Chuẩn H.264 ứng dụng trong IPTV 3.1 Các ưu điểm của chuẩn H.264………59
3.1.1.Ưu điểm của nén không gian………59
3.1.2 Ưu điểm của nén thời gian……… 59
3.1.3 Kích cỡ khối………59
3.1.4 Ưu điểm về lượng tử hóa và biến đổi……….59
3.1.5 Ưu điểm với mã hóa Entropy……….61
3.1.6 Kết luận……… 62
3.2 Mô hình IPTV và truyền tải nội dung với H.264……… 64
3.2.1 Lớp mã hóa video……… 64
3.2.2 Lớp đóng gói video ……… 66
3.2.3 Lớp cấu trúc dòng truyền tải……… 68
3.2.4 Lớp giao thức truyền tải thời gian thực……… 73
3.2.5 Lớp truyền tải……….79
3.2.6 Lớp IP……….87
3.2.7 Lớp liên kết dữ liệu……….96
3.2.8 Lớp vật lý………98
Chương 4 Đề xuất mô hình IPTV cho trung tâm tin học – đo lường Đài truyền hình Việt Nam 4.1 Xây dựng mô hình IPTV cho trung tâm tin học – đo lường Đài THVN…… 101
Trang 44.1.1 Hệ thống Headend……….102
4.1.2 Hệ thống Middleware………103
4.1.3 Hệ thống mạng phân phối nội dung……… 108
4.1.4 Hệ thống quản lý bản quyền số……… 111
4.1.5 Hệ thống Billing, VoD, STB……… 112
4.2 Mô hình thực hiện các dịch vụ trong IPTV……… 113
4.2.1 Cơ chế đăng kí người dùng………113
4.2.2 Cơ chế hủy bỏ đăng kí dịch vụ IPTV……….115
4.2.3 Cơ chế đăng kí kiểu thuê bao……….116
4.2.4 Cơ chế hủy thuê bao……… 117
4.2.5 Cơ chế phân phối nội dung………118
4.2.6 Cơ chế lấy nội dung……… 120
4.2.7 Cơ chế xuất bản nội dung……… 121
4.2.8 Cơ chế xuất bản EPG……….123
4.2.9 Cơ chế VoD………124
Kết luận
Trang 5CHƯƠNG 1 TỔNG QUAN VỀ IPTV
IPTV là tên viết tắt của cụm từ Internet Protocol Television _ truyền hình qua giao thức Internet
ITPV theo định nghĩa chính thức như sau: IPTV được định nghĩa là các dịch
vụ đa phương tiện như truyền hình ảnh, tiến nói, văn bản, dữ liệu được phân phối qua các mạng dựa trên IP mà được quản lý để cung cấp các cấp chất lượng dịch vụ, bảo mật, tính tương tác, tính tin cậy theo yêu cầu
Như vậy IPTV đóng vai trò phân phối các dữ liệu, kể cả hình ảnh, âm thanh, văn bản qua mạng sử dụng giao thức Internet Điều này nhấn mạnh vào việc Internet không đóng vai trò chính trong việc truyền tải thông tin truyền hình hay bất
kì loại nội dung truyền hình nào khác Thay vào đó, IPTV sử dụng IP là cơ chế phân phối mà theo đó có thể sử dụng Internet, đại diện cho mạng công cộng dựa trên IP, hay có thể sử dụng mạng riêng dựa trên IP
Có thể thấy, IPTV là một dịch vụ số mà có khả năng cung cấp những tính năng vượt trội hơn khả năng của bất kì cơ chế phân phối truyền hình nào khác Ví
dụ, set – top box IPTV có thể thông qua phần mềm để cho phép xem đồng thời 4 chương trình truyền hình trên màn hiển thị, hay có thể nhận tin nhắn sms, e – mail…
1.2 Một số đặc tính IPTV:
- Hỗ trợ truyền hình tương tác: Khả năng hai chiều của hệ thống IPTV cho phép nhà cung cấp dịch vụ phân phối toàn bộ các ứng dụng TV tương tác Các loại dịch vụ được truyền tải thông qua một dịch vụ IPTV có thể bao gồm TV trực tiếp chuẩn,
TV chất lượng cao (HDTV), trò chơi tương tác, và khả năng duyệt Internet tốc độ cao
Trang 6- Sự dịch thời gian: IPTV kết hợp với một máy ghi video kĩ thuật số cho phép dịch thời gian nội dung chương trình – một cơ chế cho việc ghi và lưu trữ nội dung IPTV
để xem sau
- Cá nhân hóa: Một thệ thống IPTV từ kết cuối đến kết cuối hỗ trợ truyền thông tin hai chiều và cho phép người dùng ở kết cuối cá nhân hóa những thói quen xem TV của họ bằng cách cho phép họ quyết định những gì họ muốn xem và khi nào họ muốn xem
- Yêu cầu về băng thông thấp: Thay vì phân phối trên mọi kênh để tới mọi người dùng, công nghệ IPTV cho phép nhà cung cấp dịch vụ chỉ truyền trên một kênh mà người dùng yêu cầu Đặc điểm hấp dẫn này cho phép nhà điều hành mạng có thể tiết kiệm băng thông của mạng
- Có thể truy xuất qua nhiều thiết bị: Việc xem nội dung IPTV bây giờ không chỉ giới hạn ở việc sử dụng TV Người dùng có thể sử dụng máy PC hay thiết bị di động để truy xuất vào các dịch vụ IPTV
1.3 Sự khác biệt giữa IPTV và truyền hình Internet:
Do đều được truyền trên mạng dựa trên giao thức IP, người ta đôi lúc hay nhầm IPTV là truyền hình Internet Tuy nhiên, 2 dịch vụ này có nhiều điểm khác nhau:
• Các nền khác nhau:
Truyền hình Internet sử dụng mạng Internet công cộng để phân phát các nội dung video tới người sử dụng cuối IPTV sử dụng mạng riêng bảo mật để truyền các nội dung video đến khách hàng Các mạng riêng này thường được tổ chức và vận hành bởi nhà cung cấp dịch vụ IPTV
• Về mặt địa lí
Các mạng do nhà cung cấp dịch vụ viễn thông sở hữu và điều khiển không cho phép người sử dụng Internet truy cập Các mạng này chỉ giới hạn trong các khu vực địa lí cố định.Trong khi, mạng Internet không có giới hạn về mặt địa lí, người dùng Interet nào cũng có thể xem truyền hình Internet ở bất kì đâu trên thế giới
• Quyền sở hữu hạ tầng mạng
Trang 7Khi nội dung video được gửi qua mạng Internet công cộng, các gói sử dụng giao thức Internet mạng nội dung video có thể bị trễ hoặc mất khi nó di chuyển trong các mạng khác nhau tạo nên mạng Internet công cộng Do đó, nhà cung cấp các dịch vụ truyền nhình ảnh qua mạng Internet không đảm bảo chất lượng truyền hình như với truyền hình mặt đất, truyền hình cáp hay truyền hình vệ tinh Thực tế là các nội dung video truyền qua mạng Internet khi hiển thị trên màn hình TV có thể bị giật và chất lượng hình ảnh thấp Trong khi, IPTV chỉ được phân phối qua một hạ tầng mạng của nhà cung cấp dịch vụ Do
đó người vận hành mạng có thể điều chỉnh để có thể cung cấp hình ảnh với chất lượng cao
• Cơ chế truy cập
Một set-top box số thường được sử dụng để truy cập và giải mã nội dung video được phân phát qua hệ thống IPTV , trong khi PC thường được sử dụng để truy cập các dịch vụ Internet Các loại phần mềm được sử dụng trong PC thường phụ thuộc vào loại nội dung truyền hình Internet Ví dụ như, để download các chương trình TV từ trên mạng Internet, đôi khi cần phải cài đặt các phần mềm media cần thiết để xem được nội dung đó Hay hệ thống quản lí bản quyền cũng cần để hỗ trợ cơ chế truy cập
• Giá thành
Phần trăm nội dung chương trình được phân phát qua mạng Internet công cộng tự
do thay đổi Điều này khiến các công ty truyền thông đưa ra các loại dịch vụ dựa trên mức giá thành Giá thành các loại dịch vụ IPTV cũng gần giống với mức phí hàng tháng của truyền hình truyền thống Các nhà phân tích mong rằng truyền hình Internet và IPTV có thể hợp lại thành 1 loại hình dịch vụ giải trí
Trang 81.4 Cơ sở hạ tầng một mạng IPTV
Hình 1 Sơ đồ khối đơn giản của một hệ thống IPTV
• Trung tâm dữ liệu IPTV:
Cũng được biết đến là “đầu cuối_headend” Trung tâm dữ liệu IPTV nhân nội dung từ nhiều nguồn khác nhau, bao gồm truyền hình địa phương, các nhà tập hợp nội dung, nhà sàn xuất, qua đường cáp, trạm số mặt đất hay vệ tinh Ngay khi nhận được nội dung, một số các thành phần phần cứng khác nhau từ thiết bị mã hóa
và các máy chủ video tới bộ định tuyến IP và thiết bị bảo mật giành riêng được sử dụng để chuẩn bị nội dung video cho việc phân phối qua mạng dựa trên IP Thêm vào đó, hệ thống quản lý thuê bao được yêu cầu để quản lý và hồ sơ và phí thuê bao của những người sử dụng Chú ý rằng, địa điểm thực của trung tâm dữ liệu IPTV được yêu cầu bởi hạ tầng cơ sở mạng được sử dụng bởi nhà cung cấp dịch vụ
• Mạng truyền dẫn băng thông rộng:
Việc truyền dẫn dịch vụ IPTV yêu cầu kết nối điểm – điểm Trong trường hợp triển khai IPTV trên diện rộng, số lượng các kết nối điểm – điểm tăng đáng kể
và yêu cầu độ rộng băng thông của cơ sở hạ tầng khá rộng Sự tiến bộ trong công nghệ mạng trong những năm qua cho phép những nhà cung cấp viễn thông thỏa mãn một lượng lớn yêu cầu độ rộng băng thông mạng Hạ tầng truyền hình cáp dựa trên cáp đồng trục lai cáp quang và các mạng viễn thông dựa trên cáp quang rất phù hợp để truyền tải nội dung IPTV
Trang 9• Thiết bị người dùng IPTV:
Thiết bị người dùng IPTV (IPTVCD) là thành phần quan trọng trong việc cho phép mọi người có thể truy xuất vào các dịch vụ IPTV Thiết bị này kết nối vào mạng băng rộng và có nhiệm vụ giải mã và xử lý dữ liệu video dựa trên IP gửi đến Thiết bị người dùng hỗ trợ công nghệ tiên tiến để có thể tối thiểu hóa hay loại bỏ hoàn toàn ảnh hưởng của lỗi, sự cố mạng khi đang xử lý nội dung IPTV
• Mạng gia đình:
Mạng gia đình kết nối với một số thiết bị kĩ thuật số bên trong một diện tích nhỏ Nó cải tiến việc truyền thông và cho phép chia sẻ tài nguyên (các thiết bị) kĩ thuật số đắt tiền giữa các thành viên trong gia đình Mục đích của mạng gia đình là
để cung cấp việc truy cập thông tin, như là tiếng nói, âm thanh, dữ liệu, giải trí, giữa những thiết bị khác nhau trong nhà Với mạng gia đình, người dùng có thể tiết kiệm tiền và thời gian bởi vì các thiết bị ngoại vi như là máy in và máy scan, cũng như kết nối Internet băng rộng, có thể được chia sẻ một cách dễ dàng
1.5 Mô hình truyền thông của IPTV
Mô hình truyền thông trong IPTV có 7 lớp (và một lớp tùy chọn) được xếp chồng lên nhau
Các dữ liệu video ở phía thiết bị gửi được truyền từ lớp cao xuống lớp thấp trong mô hình IPTV, và được truyền đi trong mạng băng rộng bằng các giao thức của lớp vật lí Ở thiết bị nhận, dữ liệu nhận được chuyển từ lớp thấp nhất đến lớp trên cùng trong mô hình IPTV
Trang 10Hình 2 : mô hình truyền thông IPTV
Do đó, nếu 1 bộ mã hóa gửi chương trình video đến 1 thiết bị IPTV của khách hàng, thì phải chuyển qua các lớp trong mô hình IPTV ở cả phía thiết bị nhận
và thiết bị gửi Mỗi lớp trong mô hình IPTV độc lập với nhau và có chức năng riêng Khi chức năng này được thực hiện , dữ liêu video được chuyển đến lớp tiếp theo trong mô hình IPTV Mỗi lớp sẽ thêm vào hoặc bỏ đi phần thông tin điều khiển của các gói video trong quad trình xử lí Thông tin điều khiển chứa các thông tin giúp thiết bị có thể sử dụng gói dữ liệu đúng chức năng của nó, và thường được định dạng như các header hoặc trailer Bên cạnh việc truyền thông giữa các lớp, còn
có các liên kết ảo giữa các tầng cùng mức 7 lớp và 1 lớp bổ sung trong mô hình IPTV có thể được chia làm 2 loại: các lớp cao và lớp thấp các tầng cao hơn thì quan tâm nhiều hơn tới các ứng dụng của IPTV và các định dạng file, trong khi các tầng thấp hơn thì quan tâm tới việc truyền tải các nội dung
1.5.1 Lớp mã hóa video:
Quá trình truyền thông bắt đầu ở lớp mã hóa, các tín hiệu tương tự hoặc số được nén Tín hiệu lối ra của bộ nén là các dòng MPEG cơ bản Các dòng MPEG cơ bản được
Trang 11định nghĩa là các tín hiệu số liên tục thời gian thực Có nhiều loại dòng cơ bản VD : âm thanh được mã hóa sử dụng MPEG được gọi là “dòng cơ bản âm thanh.“ Một dòng cơ bản thực ra chỉ là tín hiệu ra thô từ bộ mã hóa Các dòng dữ liệu được tổ chức thành các khung tại lớp này
1.5.2 Lớp đóng gói Video:
Để truyền các dòng cơ bản âm thanh, dữ liệu và hình ảnh qua mạng số, mỗi dòng
cơ bản này phải được chuyển đổi sang một dòng được chèn của gói PES đã được đánh dấu thời gian (PES- parketized Element Stream ) Một dòng PES chỉ bao gồm 1 loại dữ liệu từ 1 nguồn Một gói PES có thể có kích thước khối cố định hoặc thay đổi, có thể lên tới 65536 byte/gói Bao gồm 6 byte header, và số byte còn lại chứa nội dung chương trình
1.5.3 Lớp cấu trúc dòng truyền tải:
Lớp tiếp theo trong mô hình truyền thông IPTV làm nhiệm vụ tạo nên dòng truyền tải, bao gồm 1 dòng liên tiếp các gói Những gói này thường được gọi là các gói TS, được tạo ra bằng cách ngắt các gói PES thành các gói TS có kích thước cố định là 188 byte độc lập với thời gian Sử dụng thời gian độc lập này làm giảm khả năng mất gói tin trong quá trình truyền và giảm ồn Mỗi gói TS bao gồm 1 trong 3 định dạng truyền thông: dữ liêu,
âm thanh, hình ảnh Do đó, các gói TS mang cố định 1 loại hình truyền thông Mỗi gói TS bao gồm 184 byte payload và 4 byte header
1.5.4 Lớp giao thức truyền tải thời gian thực( tùy chọn):
Lớp tùy chọn này được sử dụng rộng rãi trong nhiều ứng dụng khác nhau Lớp này hoạt động như 1 lớp trung gian giữa các nội dung được nén MPEG-2, H.264/AVC ở lớp cao hơn và cá lớp thấp hơn trong mô hình IPTV Giao thức RTP chính là lõi của lớp này và thường là block cơ sở hỗ trợ truyền dòng nội dung theo thời gian thực qua mạng
IP
1.5.5 Lớp truyền tải:
Thông thường các gói RTP là dạng đầu vào của lớp truyền tải Điều đáng chú ý là
Trang 12có thể ánh xạ trực tiếp các gói MPEG-TS sang payload giao thức của lớp truyền tải
Lớp truyền tải IPTV được thiết kế để đảm bảo các kết nối đầu cuối là tin cậy Nếu
dữ liệu tới thiết bị người nhận đúng Lớp truyền tải sẽ truyền lại Lớp truyền tải thông báo với lớp trên để có các thông tin chính xác hơn
TCP và UDP là 2 giao thức quan trong nhất được sử dụng ở lớp này
a) Sử dụng TCP để định tuyến các gói IPTV :
TCP là giao thức cốt lõi của bộ giao thức internet và được xếp vào loại định hướng kết nối Điều này cơ bản có nghĩa là kết nối được thiết lập giưa đầu cuối nhà cung cấp và thiết bị IPTV cua người sử dụng để truyền các chương trình qua mạng
TCP có khả năng điều khiển lỗi xảy ra trong quá trình truyền các chương trình qua mạng Các lỗi như mất gói, mất trật tự gói,hoặc lặp gói thường gặp trong mô trương truyên IPTV Để xử lí các tình huống này, TCP sử dụng hệ thống các số liên tục để cho phép thiết bị gửi có thể gửi lại các dữ liệu hình ảnh bị mất hoặc hỏng Hệ thống số liên tục này là trường có độ dài 32 bit trong cấu trúc gói trường đầu tiên chứa chuỗi số bắt đầu của dữ liệu trong gói và trường thứ hai chứa giá trị của chuỗi số tiếp theo mà video server đang đợi (mong) nhận trở lại từ IPTVCD
Bên cạnh việc sửa các lỗi có thể xảy ra trong quá trình truyền nội dung video qua mạng IP băng rộng, TCP còn có điều khiển luồng dữ liệu Điều này có thể đạt được bằng cách sử dụng trường kích thước cửa sổ, với thuật toán được gọi là cửa sổ trượt Giá trị trong trường này xác định số các byte có thể truyền đi qua mạng trước khi nhận được xác nhận từ phía thiêt bị nhận
b) Sử dụng UDP để định hướng các gói IPTV:
UDP là giao thức thuộc về bộ giao thức Internet UDP cho phép máy chủ kết nối với mạng băng rộng để gửi tới các IPTVCD dịch vụ truyền hình quảng bá có chất lượng hài lòng người dùng UDP giống với TCP nhưng là phiên bản sơ lược hơn, đưa ra cho số lượng tối thiểu các dịch vụ truyền tải UDP là giao thức không liên kết, điều đó có nghĩa
là kết nối giữa video server và IPTVCD ko cần phải thiết lập trước khi dữ liệu được
Trang 13truyền đi Video server dơn giản chỉ thêm vào địa chỉ IP đích và số cổng vào datagram và gửi tới cơ sở mạng để phân phát tới địa chỉ IP đích Khi trên mạng, UDP sd cách tốt nhất
để cố gắng thu được dữ liệu về điểm đích của nó Chú ý rằng UDP sử dụng các khối dữ liệu được gọi là các datagram để truyền nội dung qua mạng
c) Sự khác biệt giữa TCP và UDP:
Khi các nhà cung cấp dịch vụ phát các nội dung IPTV tới các thuê bao, điều quan trọng là các nội dung này phải đến thiết bị của người dùng đúng lúc và trong dạng đúng Nói cách khác, các gói video phải không bị ngắt quãng Do đó, các nhà cung cấp dịch vụ cần chắc chắn sử dụng giao thức hỗ trợ khả năng phân phối qua hạ tầng mạng
Mặc dù TCP cung cấp các ứng dụng với nhiều đặc trưng về mạng so với UDP, nhưng các nhà cung cấp dịch vụ IPTV không thường chọn TCP là giao thức tryền tải.Điều này chỉ ra 1 thực tế rằng IPTV là ứng dụng thời gian thực và không có trễ TCP
có thể đưa ngầm vào sự phân phối nội dung video IP do thực tế rằng giao thức sử dụng cơ chế điều khiển dòng
Như vậy, độ tin cậy và khả năng sử lỗi của UDP không bằng TCP nhưng UDP là giao thức được lựa chọn để phân phát các dịch vụ IPTV UDP có các nhược điểm sau: không có khả năng tìm và sửa lỗi Vấn đề này được khắc phục bằng cách gắn các hàm sửa lỗi vào các ứng dụng IPTV chạy trên các mạng hoặc trong chính các dòng video
1.5.6 Lớp IP:
Sau lớp truyền tải là lớp IP(còn được gọi là lớp liên mạng ) Nhiệm vụ chính của lớp này là đưa các dữ liệu tới các vị trí mạng riêng biệt thông qua nhiều mạng độc lập được liên kết với nhau được gọi là liên mạng Lớp này được sử dụng để gửi các dữ liệu thông qua các đường khác nhau tới đích IP là giao thức tốt nhất được sử dụng trong lớp liên mạng giao thức này cung cấp dịch vụ phân phát gói cơ bản cho tất cả các dịch vụ IPTV Các loại dịch vụ này với hệ thống truyền đơn điểm, nơi các gói được truyền từ nguồn tới 1 IPTVCD đích, khác với hệ thống truyền đa điểm nơi mà các gói được truyền
từ máy chủ tới nhiều IPTVCD
Trang 14IPv4 là giao thức phổ biến nhất được sử dụng trong mạng IPTV ngày nay Nhiệm
vụ chính của IP là phân phát các bit dữ liệu trong các gói từ nguồn tới đích IP sử dụng kĩ thuật có hiệu quả cao nhất để phân phát dữ liệu Nói cách khác không có tiến trình nào đảm bảo quá trình phân phát thông tin qua mạng Các khối cơ sở của giao thức IP là các đoạn bit dữ liệu được đặt trong các gói và được định địa chỉ
Gói IP là đơn vị dữ liệu bao gồm dữ liệu video thực và các thông tin của việc nhận video từ trung tâm cung cấp dữ liệu IPTV tới đích IPTVCD
Một điểm đáng chú ý là một vài bit đầu tiên của địa chỉ sẽ định nghĩa các bit còn lại của trường địa chỉ sẽ được phân chia thế nào cho host và mạng Để thuận lợi cho việc
sư dụng và quản lí, địa chỉ IP được chia thành các lớp khác nhau
A
Mô tả một mạng sở hữu số đầu tiên trong địa chỉ IP, có giá trị từ 0 đến 128 Ba số còn lại được dùng để xác định một IPTVCD, máy chủ, hay thiết bị mạng khác
Do đó, một địa chỉ lớp A có địa chỉ mạng 7 bit và địa chỉ host 24 bit Bit có thứ tự cao nhất được thiết lập bằng 0
Có 126 địa chỉ mạng lớp A trên thế giới và mỗi mạng trong số đó có đủ số địa chỉ IP để hỗ trợ hơn 16 thiết bị mạng Tất cả các địa chỉ IP lớp A được cấp phép từ InterNIC từ nhiều năm trước
B
Một mạng lớp B có địa chỉ gồm số đầu tiên có giá trị từ
128 đến 191 Giá trị này tương đương với địa chỉ mạng
14 bit và một địa chỉ cục bộ 16 bit Giá trị của 1 và 0 gán cho 2 bit có thứ tự cao nhất
Có khoảng 16000 mạng lớp B trên Internet, mỗi mạng
có khả năng hỗ trợ 64000 thiết bị mạng Những tổ chức lớn hơn và các nhà cung cấp dịch vụ Internet đã cấp
Trang 15phép cho hầu hết hoặc gần hết các địa chỉ này Ví dụ về địa chỉ lớp B: 132.6.2.24, trong đó, 132.6 chỉ ra mạng, 2.24 chỉ ra host
Là phần đầu tiên của địa chỉ có giá trị từ 224 đến 239
Những địa chỉ IP này được sử dụng cho mục đích truyền đa điểm
E Địa chỉ mạng lớp E có giá trị từ 240 đến 247 và được
đặt trước để sử dụng sau này Nhược điểm chính khi sử dụng giao thức IP là không có gì đảm bảo rằng khi nào các gói tới đúng đích hay gói có đến đúng lúc không.ngay cả thứ tự các gói được chuyển đến cũng không được xác định Do đó, lớp IP làm việc cùng với giao thức lớp truyền tải
để đảm bảo rằng các gói đến IPTVCD đúng lúc và theo trật tự đúng IP cũng làm cho quá trình phân phát nội video bị trễ
1.5.7 Lớp liên kết dữ liệu:
Lớp liên kết dữ liệu lấy các dữ liệu thô từ lớp IP và định dạng chúng thành các gói phù hợp để truyền qua mạng vật lí Chú ý, lớp liên kết dữ liệu khác với các giao thức mạng Kĩ thuật Ethetnet là một trong những kĩ thuật phổ biến hơn được sử dụng trong
hệ thống IPTV Lớp liên kết dữ liệu bao gồm các chức năng dành cho các mạng dựa trên Ethernet:
Encapsulation Lớp này thêm vào các gói IPTV 1 header Ethernet header
là loại Encapsulation phổ biến nhất dùng trong lớp liên kết dữ liệu của IPTVCD Các thành phần cơ bản của Ethernet header được giải thích trong bảng 3.9
Trang 16Định địa chỉ Lớp liên kết dữ liệu xử lí các địa chỉ vật lí của mạng người
sử dụng và các thiết bị chủ Hệ thống địa chỉ khác nhau với các topo mạng Ví dụ, địa chỉ MAC được sử dụng trong mạng Ethernet Mỗi thiết bị kết nối với mạng IPTV thì có 1 địa chỉ MAC Độ dài của địa chỉ MAC là 48 bit và thường được biểu diễn bằng 12 số trong hệ 16 Trong 12 số hệ 16 này, 6 số đầu tiên để dành cho nhà sản xuất thiết bị IPTV và các số còn lại được dùng để định nghĩa giao diện mạng ảo
Kiểm tra lỗi - chức năng kiểm tra lỗi được dùng trong vài lớp của mô hình IPTV, bao gồm cả lớp liên kết dữ liệu Các gói bị ngắt là lỗi thường gặp trong quá trình truyền các nội dung video qua mạng dựa trên IP Phương pháp sửa lỗi thường dung là kiểm tra dư thừa vòng (CRC) trong IPTV để tìm và loại bỏ các gói bị ngắt
Sử dụng kĩ thuật CRC thiết bị gửi IPTV thực hiện việc tính toán trên các gói và lưu trữ kết quả trong gói Các phép tính toán tương tự cũng được thưc hiện trên thiết bị nhận khi nhận được các gói Nếu kết quả tính toán là như nhau, thì các gói được xử
lí bình thường Tuy nhiên, nếu kết quả này là khác nhau, thì gói bị lỗi sẽ bị loại bỏ.Thiết bị gửi sẽ tạo một gói mới và gửi lại nó Thông báo với lớp trên trong mô hình IPTV khi có lỗi xảy ra là nhiệm vụ chính của lớp liên kết dữ liệu trong kĩ thuật kiểm tra lỗi mà các hệ thống IPTV end to end
Điều khiển luồng Điều khiển luồng là một trong chức năng của lớp truyền tải Trong mạng IPTV, điều khiển luồng cho thiết bị IPTV của người sử dụng không
bị tràn bởi các nội dung Lớp liên kết dữ liệu cùng với lớp truyền tải thực hiện bất kì yêu cầu điều khiển luồng nào
1.5.8 Lớp vật lí:
Lớp vật lí quy định luật lệ truyền các bit số qua mạng Nó đề cập đến việc đưa các dữ liệu qua các mạng vật lí riêng biệt như x DSL, và không dây Lớp này định nghĩa cấu hình mạng vật lí, thông số kĩ thuật, điện trong môi trường truyền
Khi dòng bit được truyền qua mạng, các gói được chuyênr từ lớp thấp đến lớp cao trong mô hình truyền thông IPTV Ví dụ lớp liên kết dữ liệu sẽ kiểm tra các gói và loại bỏ đi phần header Ethernet và trường sửa lỗi CRC Tiếp đó sẽ kiểm tra
Trang 17trường kiểu mã của Ethernet header và xác định gói cần được xử kí bởi giao thức
IP Do đó gói dữ liệu được chuyển lên lớp mang Lớp mạng kiểm tra và loại bỏ đi phần IP header và chuyển gói đó lên lớp truyền tải Phương pháp bỏ đi phần header khi qua các lớp khác nhau gọi là bóc gói Quá trình này tiếp tục đươc thực hiện cho tới khi gói dũ liệu lên đến tưng trên cùng trong mô hình Hình ảnh gôc được thể hiện trên màn hình TV của người xem
1.6 Ưu điểm của IP và sự lựa chọn IP cho IPTV:
Truyền hình số được định thời một cách chính xác, là dòng dữ liệu liên tục có tốc
độ bit không đổi, thường hoạt động trên các mạng mà mỗi tín hiệu được truyền đều phục vụ cho mục đích truyền hình Trái với truyền hình, mạng IP truyền những loại dữ liệu khác nhau từ rất nhiều nguồn trên một kênh chung, bao gồm thứ điện tử, trang web, tín nhắn trực tiếp, tiếng nói qua IP (VoIP) mà nhiều loại dữ liệu khác Để truyền đồng thời những dữ liệu này, Mạng Internet phân thông tin thành các gói Như vậy, rõ ràng là
IP và truyền hình không phải là một sự kết hợp hoàn hảo (lý tưởng) về công nghệ
Mặc dù không tương thích về căn bản, nhưng thị trường IPTV vẫn bùng nổ Vậy
lý do tại sao lại chọn các mạng dựa trên IP để truyền tín hiệu truyền hình? Câu trả lời cho câu hỏi này có thể tóm tắt thành năm điểm sau:
- Mạng IP băng rộng đã vươn tới rất nhiều gia đình ở nhiều nước, các nhà cung cấp dịch vụ truyền hình có thể sử dụng những mạng này để phát các dịch vụ truyền hình
mà không cần xây dựng hệ thông mạng riêng của họ
- IP có thể đơn giản công việc phát các dịch vụ truyền hình mới, như là chương trình tương tác, truyền hình theo yêu cầu…
- Giá thành của mạng IP tiếp tục giảm do số thiết bị được sản xuất mỗi năm rất lớn
và sự tồn tại của các chuẩn trên toàn thế giới
- Mạng IP có mặt trên toàn thế giới, và số người dùng mạng Internet tốc độ cao tiếp tục tăng rất nhanh
- IP là công nghệ hoàn hảo cho nhiều ứng dụng khác nhau, bao gồm sự trao đổi dữ liệu, mạng cục bộ, chia sẻ tệp tin, lướt web và nhiều nhiều nữa…
Trang 18IP cung cấp cơ chế để định hướng truyền gói giữa các thiết bị được liên kết trong mạng IP là một giao thức phổ biến được sử dụng khắp các mạng Internet và hàng triệu các mạng khác có sử dụng IP Không có IP, mọi việc sẽ hỗn loạn bởi vì không
có cách nào để một thiết bị gửi dữ liệu một cách riêng biệt tới một thiết bị khác
Với việc sử dụng các mạng IP để truyền dẫn tín hiệu truyền hình, việc xem truyền hình hiện đại sẽ rất khác so với xem truyền hình trước đây Các tín hiệu truyền hình bây giờ không khác gì những dữ liệu khác Nhờ đó, ngoài các kênh truyền hình quảng bá truyền thống, chúng ta sẽ có thêm những kênh truyền hình riêng biệt, tương tác để thỏa mãn nhu cầu của từng người
Trang 19CHƯƠNG 2: CHUẨN MÃ HÓA H.264
2.1 Các kĩ thuật nén thông dụng
Nén cho phép các nhà cung cấp dịch vụ truyền các kênh hình và tiếng với chất lượng cao qua mạng IP băng rộng Do mắt người ko thể phân biệt được toàn bộ các phần của hình ảnh Do đó việc nén sẽ làm giảm độ lớn của tín hiệu ban đầu bằng cách bỏ bớt các phần của hình ảnh
2.1.1 Nén MPEG:
MPEG là 1 chuẩn nén được sử dụng rộng rãi trong thông tin vệ tinh, truyền hình cáp và trong các hệ thống truyền hình mặt đất MPEG (moving pictures exert group) được thành lập nhằm phát triển các kĩ thuật nén cho phù hợp vói việc truyền hình ảnh Từ khi được thành lập, MPEG đã đưa ra các chuẩn nén như: MPEG-1, MPEG-2, MPEG4-( Part 2 và part 10), MPEG-7, và MPEG-21 Trong các chuẩn này, MPEG-2 và MPEG-4 Part 10 được sử dụng rộng rãi trong IPTV
2.1.2 Chuẩn MPEG-2:
MPEG 2 là 1 công nghệ đạt được thành công lớn và là 1 chuẩn nén có ưu thế vượt trội dành cho truyền hình số được truyền qua nhiều mạng truyền thông băng rộng Chuẩn nén MPEG-2 được chia thành 2 loại nén hình và nén tiếng Nén hình: Video
ở dạng cơ bản là 1 chuỗi các ảnh liên tục 1 frame được định nghĩa với 1 chuỗi bit header Mắt người thường thấy thoải mái khi xem TV với tốc độ 25 hình/s Sẽ không có lợi nếu phát với tốc độ nhanh hơn vì người xem không thể nhận ra sự khác biệt do đó có thể dung lượng của những hình ảnh bằng cách nén chúng lại Các bộ nén hình được sử dụng với mỗi frame mà vẫn giữ chất lượng hình ảnh cao
2.1.2.1 Quá trình nén MPEG:
Phần đầu tiên của nén bao gồm 1 quá trình tiền đồng bộ Quá trình này cơ bản bao gồm việc làm giảm kích thước của các frame Làm giảm kích thước của các frame
Trang 20chính là làm giảm số lượng bit , điều này cũng giúp giảm băng thông cần thiết để truyền tín hiệu Tuy nhiên, quá trình này không phải ko có trở ngại Ví dụ, sự giảm kích thước của khung có thể thường xuyên gây ra những lỗi tỉ số cạnh (giống như sai tỉ lệ 4/3 hay 16/9) khi được thể hiện trên màn hình TV có độ phân giải thấp
Phần hai của quá trình nén tin hiệu là chia 1 frame ảnh ra thành các block có kích thước 8 nhân 8 pixel –khối mã hóa nhỏ nhất trong giải thuật của MPEG Có 3 loại block; độ chói Y, thành phần màu đỏ Cr hoặc xanh Cb Các loại block thành phần màu mang thông tin về những màu khác nhau của hình ảnhtrg khi độ chói mang thông tin về những phần màu đen hoặc trắng của hình ảnh
Khi hoàn thành 2 phần trên, MPEG sẽ thực hiện 1 hàm toán được gọi là biến đổi cosin rời rạc đối với mỗi block riêng biệt Kết quả thu được là một ma trận hệ số 8*8 DCT sẽ biến đổi sự khác nhau về không gian thành các tần số khác nhau, nhưng không làm thay đổi các thông tin trong block, các blcok ban đầu sẽ được tái tạo lại 1 cách chính xác sử dụng biến đổi ngược Nguyên tắc thực hiện hàm này bao gồm việc chia các block thành các phần tùy theo mức độ quan trọng Những phần quan trọng sẽ đươc giữ nguyên cho tới bước tiếp theo trong khi các phần còn lại sẽ bị giảm bớt Điều này sẽ đảm bảo rằng mắt người không chú ý tới việc những phần không quan trọng của block
bị bỏ bớt khi tốc bít bị hạn chế
Bước tiếp theo trong MPEG là quá trình lượng tử hóa Quá trình lượng tử hóa dữ liệu số là quá trình làm giảm số lượng bít của các block Mức lượng tử đối với mỗi tìn hiệu video là rất quan trọng
Khi tất cả các block trong frame đều đã đc nén lại, MPEG sẽ ngắt các frame thành
1 dạng mới gồm nhiều block gọi l à macro block Mỗi macro block có kích thướ c 16 nhân 16 chứa các block độ chói và block thành phần màu Nếu có sự khác biệt giữa frame cuối cùng và frame hiện tại, các thiết bị nén MPEG sẽ chuyển những block mới này tới 1 vị trí mới trên frame hiện tại Điều này giúp không phải gửi đi những hình ảnh mới hoàn toàn, do đó có thể tích kiệm băng thông Có 2 cách để thực hiện điều đó:
Trang 21Nén theo không gian : là làm giảm các bít trên từng frame riêng biệt điều này có
thể đạt được do các pixel luôn đứng cạnh nhau trong các frame thường có giá trị giống nhau Do đó thay về mã hóa từng pixel riêng biệt Kĩ thuật nén theo không gian này mã hóa sự khác biệt giữa các pixel cạnh nhau Số lượng bít cần thiết để mã hóa những khác biệt này ít hơn số lượng bít cần thiết để mã hóa từng pixel riêng biệt
Nén theo thời gian : là làm giảm các bit giữa các frame liên tục Trong quá trình
sản xuất video có những thông tin được lặp lại giữa những frame liên tiếp VD: nếu trên hình có 1 bức tường , bức tường vẫn xuất hiện liên tục trong 30 hình tiếp theo, mà không thay đổi ( bức tường đó không thay đổi trong vòng 1s) thay vì mã hóa 30 lần liên tục trong 1s, nên thời gian chỉ gửi đi các thông tin dự đoán chuyển động giữa những frame hình, trong trương hợp của bức tường trong VD trên, dự đoán chuyển động được đặt = 0
Có nhiều phuơng thức khác nhau để nén 1 frame hình VD như với 1 frame hình
có độ phức tạp cao thì cần phương pháp nén có yếu tố nén theo không gian thấp bởi vì chỉ
có 1 phần rất nhỏ các pixel được lặp lại Nếu tốc đọ bit có sự thay đổi lớn thì khó có thể truyền đi trong mạng IP, vì thế nhiều bộ mã hóa bao gồm cả chức năng đệm để có thể điều khiển và quản lí tốc độ chung mà tại đó các bit được truyền đi tới tầng tiếp theo của
hệ thống sản xuất video
Bước tiếp theo của quá trình nén MPEG là mã hóa các macroblock thành các slice Slice là 1 chuỗi ảnh đặt nằm ngang cạnh nhau từ trái sang phải Nhiều slice kết hợp với nhau tạo thành 1 hình Mỗi slice được mã hóa độc lập với nhau để hạn chế lỗi
2.1.2.2 Các ảnh trong chuẩn nén MPEG:
Chuẩn nén MPEG định nghĩa 3 loại ảnh:
Intra-frame (I-frame) frame được mã hóa riêng biệt không phụ thuộc các frame trước đó hoặc tiếp theo.Mã hóa theo hệ thống đc sử dụng gần giống như nén JPEG Đây là frame độc lập và đc sử dụng để tạo ra các loại frame khác
Trang 22P-frame ( forward predicted frame) khung dự đoán ảnh tiếp theo là khung dự đoán ảnh dựa trên các frame I trước đó MPEG không thực sự mã hóa ảnh mà chứa các thông tin về chuyển động cho phép IPTVCD có thể tái tạo lại frame P-frame yêu cầu ít băng thông hơn I-frame, điều này là yếu tố quan trọng đối với mạng dựa trên IPTV
B-frame (Bi-directional predicted frame ) frame dự đoán hướng: B-frame
là frame đc tạo thành từ việc kết hợp các thông tin từ cả I-frame và P-frame Mã hóa B-frame thì tương tự với P-frame, ngoại trừ các vecto chuyển động phụ thuộc vào các vùng trong các khung tham khảo sau đó B-frame chiếm ít dung lượng hơn là I-frame va P-frame Vì thế dòng Mpeg video gồm nhiều B-frame thì chiếm dung lượng thấp hơn so với dòng chứa các frame I va P Thậm chí, B-frame giúp làm tối thiểu băng thông cần thiết đối với các dòng MPEG video Tuy nhiên, B-frame cũng
có hạn chế đó là độ trễ Do IPTVCD phải kiểm tra 2 khung trước và sau trước khi tạo ra B-frame
3 loại ảnh trên kết hợp với nhau tạo thành 1 chuỗi các frame đc gọi là nhóm ảnh (GOP ) Mỗi nhóm ảnh bắt đầu bằng một frame I và có một số các frame B và P, Mỗi nhóm ảnh MPEG có cấu trúc như sau:
[I B B B P B B B P B B B P B B B P]
Mỗi nhóm ảnh cần bắt đầu với một khung I, mặc dù kích thước của mỗi nhóm ảnh là khác nhau, nhưng trung bình mỗi nhóm ảnh trong IPTV có khoảng 12 đến 15 frame Mỗi cấu trúc của một nhóm ảnh thông thường có thể được miêu tả bởi 2 thông số: N, số ảnh trong một nhóm và M, khoảng cách giữa các frame Các nhóm ảnh được chia thành 2 loại: nhóm đóng và nhóm mở Với nhóm đóng, khung B cuối cùng không yêu cầu khung I đầu tiên cho nhóm ảnh tiếp theo để giải mã, trong khi với nhóm mở cần yêu cầu khung I cho nhóm ảnh tiếp theo Các nhóm ảnh sau đó được kết hợp với nhau
để tạo thành dòng video Mỗi dòng video bắt đầu biết một đoạn mã, theo sau đó là một header và kết thúc với một mã duy nhất
Thứ tự các khung được truyền đi trên mạng băng rộng thì khác với thứ tự các
Trang 23khung trong chuối bit đầu vào của bộ mã hóa Bởi vì bộ giải mã trong IPTVCD cần xử
lý các frame I và P trước khi tạo ra khung B Mối quan hệ tổng thể giữa các chuỗi ảnh, ảnh, các slice, các khối macro, các khối và các điểm ảnh được minh họa ở hình sau:
Hình 3 Cấu trúc dòng MPEG video
Mặc dù 2 được sử dụng trong truyền hình cáp và vệ tinh, nhưng
MPEG-2 có nhưng hạn chế đối với các mạng có băng thông giới hạn.Do đó một công nghệ nén mới với nhiều tính năng đã được phát triển trong nhưng năm gần đây vơi mục đích truyền video qua mạng băng thông giới hạn MPEG-4 part 10 được sử dụng trong hạ tầng mạng IPTV
Trang 24• Phần3:Audio;
• Phần 4: Conformance xác định việc triển khai một MPEG-4 sẽ như thế nào;
• Phần 5: Các phần mềm tham chiếu, đưa ra một nhóm các phần mềm tham chiếu quan trọng, được sử dụng để triển khai MPEG-4 và phục vụ như một ví dụ demo về các bước phải thực hiện khi triển khai;
• Phần 6: Khung chuẩn cung cấp truyền thông đa phương tiện tích hợp DMIF (Delivery Multimedia Integration Framework), xác định một giao diện giữa các ứng dụng và mạng/lưu trữ;
• Phần 7: Các đặc tính của một bộ mã hoá video tối ưu (bổ xung cho các phần mềm tham chiếu, nhưng không phải là các triển khai tối thiểu cần thiết)
• Các phần mới bổ xung tiếp cho chuẩn MPEG-4 sau này là:
• Phần 8: Giao vận (về nguyên tắc không được xác định trong chuẩn, nhưng phần
8 xác định cần ánh xạ như thế nào các dòng MPEG-4 vào giao vận IP);
• Phần 9: Mô tả phần cứng tham chiếu (Reference Hardware Description);
• Phần 10: MPEG-4 Advanced Video Coding /H.264 là thành tựu mới nhất về nén video, trên cơ sở đồng bộ với khả năng tính toán và dung lượng bộ nhớ của các máy tính PC hiện nay, ứng dụng các phương pháp mã hoá phức tạp hơn nhiều các
phương pháp trước đó và có thể thực hiện cả trong môi trường phần mềm và phần cứng, do nhóm chuyên gia MPEG hợp tác với nhóm IUT Study Group phát triển và
có nhiều khả năng sẽ trở thành chuẩn mã hoá video qui mô toàn cầu, duy nhất của ITU và ISO;
• Phần 11: Mô tả khung hình (Scene Description - được tách ra từ phần 1);
• Phần 12: Định dạng file truyền thông ISO (ISO Media File Format);
• Phần 13: Quản lý bản quyền nội dung IPMP (Intellectual Property Management and Protection Extensions);
• Phần 14: Định dạng fille MP4 (trên cơ sở phần 12);
• Phần 15: Định dạng file AVC (cũng trên cơ sở phần 12);
• Phần 16: AFX (Animation Framwork eXtensions) và MuW (Multi-user Worlds)
Trang 252.1.4 Công nghệ mã hoá video trong MPEG-4
Chuẩn MPEG-4 là một chuẩn động dễ thay đổi: với MPEG-4, các đối tượng khác nhau trong một khung hình có thể được mô tả, mã hoá và truyền đi một cách riêng biệt đến bộ giải mã trong các dòng cơ bản ES (Elementary Stream) khác nhau Cũng nhờ xác định, tách và sử lý riêng các đối tượng (như nhạc nền, âm thanh xa gần, đồ vật, đối tượng ảnh video như con người hay động vật, nền khung hình…), nên người sử dụng có thể loại bỏ riêng từng đối tượng khỏi khuôn hình Sự tổ hợp lại thành khung hình chỉ được thực hiện sau khi giải mã các đối tượng này
Các bộ phận chức năng chính trong các thiết bị MPEG-4 bao gồm:
• Bộ mã hoá hình dạng ngoài Shape Coder dùng để nén đoạn thông tin, giúp xác định khu vực và đường viền bao quanh đối tượng trong khung hình scene
• Bộ dự đoán và tổng hợp động để giảm thông tin dư thừa theo thời gian
• Bộ mã kết cấu mặt ngoài Texture coder dùng để xử lý dữ liệu bên trong và các dữ liệu còn lại sau khi đã bù chuyển động
Trang 26
Hình 4 Mã hóa và tổng hợp khung hình trong MPEG-4
Hình 4 là một ví dụ về mã hoá, tổng hợp khung hình video sử dụng trong MPEG-4
Nhiều đối tượng, như người, xe ô tô, nhà cửa, được tách ra khỏi video đầu vào Mỗi
đối tượng video sau đó được mã hoá bởi bộ mã hoá đối tượng video VO (video
object) và sau đó được truyền đi trên mạng Tại vị trí thu, những đối tượng này
được giải mã riêng rẽ nhờ bộ giải mã VO và gửi đến bộ tổ hợp compositor Người
sử dụng có thể tương tác với thiết bị để cấu trúc lại khung hình gốc (a), hay để xử lý
các đối tượng tạo ra một khung hình khác (b) Ngoài ra, người sử dụng có thể
download các đối tượng khác từ các thư viện cơ sở dữ liệu (có sẵn trên thiết bị hay
từ xa thông qua mạng LAN, WAN hay Internet) để chèn thêm vào hay thay thế các
đối tượng có trong khuôn hình gốc (c)
Để có thể thực hiện việc tổ hợp khung hình, MPEG-4 sử dụng một ngôn ngữ mô tả
khung hình riêng, được gọi là Định dạng nhị phân cho các khung hình BiFS (Binary
Format for Scenes) BiFS không chỉ mô tả ở đâu và khi nào các đối tượng xuất hiện
Trang 27trong khung hình, nó cũng mô tả cách thức hoạt động của đối tượng (làm cho một đối tượng xoay tròn hay chồng mờ hai đối tượng lên nhau) và cả điều kiện hoạt động đối tượng và tạo cho MPEG-4 có khả năng tương tác Trong MPEG-4, tất cả các đối tượng
có thể được mã hoá với sơ đồ mã hoá tối ưu riêng của nó – video được mã hoá theo kiểu video, text được mã hoá theo kiểu text, các đồ hoạ được mã hoá theo kiểu đồ hoạ - thay
vì việc xử lý tất cả các phần tử ảnh pixels như là mã hoá video ảnh động Do các quá trình mã hoá đã được tối ưu hoá cho từng loại dữ liệu thích hợp, nên chuẩn MPEG-4 sẽ cho phép mã hoá với hiệu quả cao tín hiệu ảnh video, audio và cả các nội dung tổng hợp như các bộ mặt và cơ thể hoạt hình
2.2 Sự ra đời của chuẩn H.264
Kể từ khi mới xuất hiện vào đầu những năm 90, chuẩn nén video MPEG-2 đã hoàn toàn thống lĩnh thế giới truyền thông Cũng trong thập kỷ này, chuẩn nén MPEG-2
đã được cải tiến về nhiều mặt Giờ đây nó có tốc độ bit thấp hơn và việc ứng dụng
nó được mở rộng hơn nhờ có các kỹ thuật như đoán chuyển động, tiền xử lý, xử lý đối ngẫu và phân bổ tốc độ bit tùy theo tình huống thông qua ghép kênh thống kê Tuy nhiên, chuẩn nén MPEG-2 cũng không thể được phát triển một cách vô hạn định Thực tế hiện nay cho thấy chuẩn nén này đã đạt đến hết giới hạn ứng dụng của mình trong lĩnh vực truyền truyền hình từ sản xuất tiền kỳ đến hậu kỳ và lưu trữ Video số Bên cạnh đó, nhu cầu nén Video lại đang ngày một tăng cao kèm theo sự phát triển mạnh mẽ của mạng IP mà tiêu biểu là mạng Internet Khối lượng nội dung mà các công ty truyền thông cũng như các nhà cung cấp dịch vụ thông tin có thể mang lại ngày càng lớn, ngoài ra họ còn có thể cung cấp nhiều dịch vụ theo yêu cầu thông qua hệ thống cáp, vệ tinh và các hạ tầng viễn thông đặt biệt là mạng Internet Các tiêu chuẩn mã hoá Video ra đời và phát triển với mục tiêu cung cấp các phương tiện cần thiết để tạo ra sự thống nhất giữa các hệ thống được thiết kế bởi những nhà sản xuất khác nhau đối với mọi loại ứng dụng Video; Nhờ vậy thị trường Video có điều kiện tăng trưởng mạnh Chính vì lý do này nên những người sử dụng
Trang 28bộ giải mã cần có một chuẩn nén mới để đi tiếp chặng đường mà MPEG-2 đã bỏ dở Hiệp hội viễn thông quốc tế (ITU) và tổ chức tiêu chuẩn quốc tế/ Uỷ ban kỹ thuật điện tử quốc tế (ISO/IEC) là hai tổ chức phát triển các tiêu chuẩn mã hoá Video Theo ITU-T, các tiêu chuẩn mã hoá Video được coi là các khuyến nghị gọi tắt là chuẩn H.26x (H.261, H.262, H.263 và H.264) Với tiêu chuẩn ISO/IEC, chúng được gọi là MPEG-x (như MPEG-1, MPEG-2 và MPEG-4)
Đầu năm 1998, 2 tổ chức ITU-T và VCEG đã cùng đưa ra một chuẩn nén mới H.26L nhằm tăng gấp đôi hiệu suất nén Do đó chuẩn nén này sẽ mở ra nhiều ứng dụng mới như truyền hình qua mạng Internet, truyền hình di động và phát triển các ứng dụng hiện có
Cuối năm 2001, VCEG và MPEG đã thành lập JVT ( Joint Video Team) có nhiệm
vụ hoàn thành chuẩn nén mới và chính thức được thông qua với tên gọi là MPEG-4 Part 10 hoặc H.264/AVC vào tháng 3 năm 2003
Những khuyến nghị của ITU được thiết kế dành cho các ứng dụng truyền thông Video thời gian thực như Video Conferencing hay điện thoại truyền hình Mặt khác, những tiêu chuẩn MPEG được thiết kế hướng tới mục tiêu lưu trữ Video chẳng hạn như trên đĩa quang DVD, quảng bá Video số trên mạng cáp, đường truyền số DSL, truyền hình vệ tinh hay những ứng dụng truyền dòng Video trên mạng Internet hoặc thông qua mạng không dây (wireless) Với đối tượng để truyền dẫn Video là mạng Internet thì ứng cử viên hàng đầu là chuẩn nén MPEG-4 AVC, còn được gọi là H.264, MPEG-4 part 10, H.26L hoặc JVT
Nén cho phép các nhà cung cấp dịch vụ truyền các kênh hình và tiếng với chất lượng cao qua mạng IP băng rộng Do mắt người ko thể phân biệt được toàn bộ các phần của hình ảnh Do đó việc nén sẽ làm giảm độ lớn của tín hiệu ban đầu bằng cách bỏ bớt các phần của hình ảnh
Mục tiêu chính của chuẩn nén H.264 đang phát triển nhằm cung cấp Video có chất
Trang 29lượng tốt hơn nhiều so với những chuẩn nén Video trước đây Điều này có thể đạt được nhờ sự kế thừa các lợi điểm của các chuẩn nén Video trước đây Không chỉ thế, chuẩn nén H.264 còn kế thừa phần lớn lợi điểm của các tiêu chuẩn trước đó là H.263 và MPEG-4 bao gồm 4 đặc điểm chính như sau:
• Phân chia mỗi hình ảnh thành các Block (bao gồm nhiều điểm ảnh), do vậy quá trình xử lý từng ảnh có thể được tiếp cận tới mức Block
• Khai thác triệt để sự dư thừa về mặt không gian tồn tại giữa các hình ảnh liên tiếp bởi một vài mã của những Block gốc thông qua dự đoán về không gian, phép biến đổi, quá trình lượng tử và mã hoá Entropy (hay mã có độ dài thay đổi VLC)
• Khai thác sự phụ thuộc tạm thời của các Block của các hình ảnh liên tiếp bởi vậy chỉ cần mã hoá những chi tiết thay đổi giữa các ảnh liên tiếp Việc này được thực hiện thông qua dự đoán và bù chuyển động Với bất kỳ Block nào cũng có thể được thực hiện từ một hoặc vài ảnh mã hoá trước đó hay ảnh được mã hoá sau đó để quyết định véc tơ chuyển động, các véc tơ này được
sử dụng trong bộ mã hoá và giải mã để dự đoán các loại Block
• Khai thác tất cả sự dư thừa về không gian còn lại trong ảnh bằng việc mã các block dư thừa Ví dụ như sự khác biệt giữa block gốc và Block dự đoán sẽ được mã hoá thông qua quá trình biến đổi, lượng tử hoá và mã hoá Entropy
Trang 30được lấy mẫu với tần số thấp hơn theo 2 chiều ngang và dọc Thêm vào đó mỗi hình ảnh có thể được phân thành số nguyên lần các lát mỏng (slice), việc này rất có giá trị cho việc tái đồng bộ trong trường hợp lỗi dữ liệu
Mỗi hình ảnh thu được được xem như một ảnh I Ảnh I là ảnh được mã hoá bởi việc
áp dụng trực tiếp các phép biến đổi lên các MacroBlock khác nhau trong ảnh Các ảnh I được mã hoá sẽ có kích cỡ lớn bởi nó được xây dựng từ một khối lượng lớn thông tin của bản thân ảnh hiện tại mà không sử dụng bất cứ thông tin nào từ miền thời gian trong quá trình xử lý mã hoá để tăng hiệu quả xử lý mã hoá bên trong trong H.264
2.2.1.1 Giảm bớt độ dư thừa
Cũng giống như các bộ lập giải mã khác, H.264 nén video bằng cách giảm bớt độ dư thừa cả về không gian và thời gian trong hình ảnh Những dư thừa về mặt thời gian là những hình ảnh giống nhau lặp đi lặp lại từ khung (frame) này sang khung khác, ví dụ như phần phông nền không chuyển động của một chương trình đối thoại trên truyền hình Dư thừa về không gian là những chi tiết giống nhau xuất hiện trong cùng một khung, ví dụ như nhiều điểm ảnh giống nhau tạo thành một bầu trời xanh Hình 1 biểu diễn một cách sơ lược các bước mà bộ lập giải mã MPEG-4 phải tiến hành để nén không gian và thời gian
2.2.1.2 Chọn chế độ, phân chia
Bộ lập giải mã bắt đầu bằng việc quyết định loại khung cần nén tại một thời điểm nhất định và chọn chế độ mã hoá phù hợp Chế độ intra tạo ra ảnh "I", trong khi chế độ inter tạo ra khung "P" hoặc "B" Sau đó, bộ mã hoá sẽ chia ảnh thành hàng trăm hàng và cột các điểm ảnh của ảnh video số chưa nén thành các khối nhỏ hơn, mỗi khối có chứa một vài hàng và cột điểm ảnh
2.2.1.3 Nén theo miền thời gian
Khi bộ mã hoá đang hoạt động ở chế độ inter, khối này sẽ phải qua công đoạn
Trang 31hiệu chỉnh chuyển động Quá trình này sẽ phát hiện ra bất kỳ chuyển động nào diễn ra giữa khối đó và một khối tương ứng ở một hoặc hơn một ảnh tham chiếu đã được lưu trữ từ trước, sau đó tạo ra một khối "chênh lệch" hoặc "lỗi" Thao tác này sẽ giảm bớt dữ liệu trong mỗi block một cách hiệu quả do chỉ phải trình bày chuyển động của nó mà thôi Tiếp đến là công đoạn biến đổi côsin rời rạc (DCT) để bắt đầu nén theo miền không gian Khi bộ mã hoá hoạt động ở chế độ intra, khối này sẽ bỏ qua công đoạn hiệu chỉnh chuyển động và tới thẳng công đoạn DCT
2.2.1.4 Nén theo miền không gian
Các khối thường có chứa các điểm ảnh tương tự hoặc thậm chí giống hệt nhau Trong nhiều trường hợp, các điểm ảnh thường không thay đổi mấy (nếu có) Như vậy có nghĩa là tần số thay đổi giá trị điểm ảnh trong khối này là rất thấp Những khối như thế được gọi là khối có tần số không gian thấp Bộ lập mã lợi dụng đặc điểm này bằng cách chuyển đổi các giá trị điểm ảnh của khối thành các thông tin tần số trong công đoạn biến đổi côsin rời rạc
* Biến đổi cosin rời rạc:
Công đoạn DCT biến đổi các giá trị điểm ảnh của khối thành một ma trận gồm các
hệ số tần số ngang, dọc đặt trong không gian tần số Khi khối ban đầu có tần số không gian thấp, DCT sẽ tập hợp phần lớn năng lượng tần số vào góc tần số thấp của mạng Nhờ vậy, những hệ số tần số thấp ở góc đó sẽ có giá trị cao hơn
Một số lượng lớn các hệ số khác còn lại trên ma trận đều là các hệ số có tần số cao, năng lượng thấp và có giá trị thấp Hệ số DC và một vài hệ số tần số thấp sẽ hàm chứa phần lớn thông tin được mô tả trong khối ban đầu Điều này có nghĩa là bộ lập
mã có thể loại bỏ phần lớn hệ số tần số cao còn lại mà không làm giảm đáng kể chất lượng hình ảnh của khối.Bộ lập mã chuẩn bị các hệ số cho công đoạn này bằng cách quét chéo mạng lưới theo đường zig-zag, bắt đầu từ hệ số DC và qua vị trí của các
hệ số ngang dọc tăng dần Do vậy nó tạo ra được một chuỗi hệ số được sắp xếp theo tần số
Trang 32* Lượng tử hoá và mã hoá entropy:
Tại đây thao tác nén không gian mới thực sự diễn ra Dựa trên một hệ số tỷ lệ (có thể điều chỉnh bởi bộ mã hoá), bộ lượng tử hoá sẽ cân đối tất cả các giá trị hệ số Do phần lớn hệ số đi ra từ DCT đều mang năng lượng cao nhưng giá trị thấp nên bộ lượng tử hoá sẽ làm tròn chúng thành 0 Kết quả là một chuỗi các giá trị hệ số đã được lượng tử hoá bắt đầu bằng một số giá trị cao ở đầu chuỗi, theo sau là một hàng dài các hệ số đã được lượng tử hoá về 0 Bộ lập mã entropy có thể theo dõi số lượng các giá trị 0 liên tiếp trong một chuỗi mà không cần mã hoá chúng, nhờ vậy giảm bớt được khối lượng dữ liệu trong mỗi chuỗi
2.2.2 Cấu trúc phân lớp của H.264/AVC
Với sự gia tăng các ứng dụng và dịch vụ trên nhiều mạng thì câu hỏi đặt ra là làm thế nào quản lí được các ứng dụng đó Do vậy, chuẩn H.264/AVC phải có độ linh hoạt cao và có thể ứng dụng trên nhiều mạng khác nhau Do đó, chuẩn H.264/AVC được thiết kế theo phân lớp mã hóa video VCL ( Video Coding Layer) và lớp NAL làm nhiệm vụ tương thích với môi trường mạng khác nhau
Hình 5: Cấu trúc phân lớp của H.264
a) Lớp mạng NAL ( Network Abstration Layer)
NAL có khả năng ánh xạ từ lớp VCL đến lớp truyền tải:
+ RTP/IP cho dịch vụ thời gian thực qua mạng Internet (conversational và streaming)
Trang 33+ Định dạng file: ISO MP4 cho lưu trữ và truyêng tải MMS
+ H32x cho các dịch vụ đàm thoại có dây và không dây
+ Dòng truyền tải MPEG-2 cho các dịch vụ quảng bá
Gói NAL: dữ liệu video được mã hóa được tổ chức trong một đơn vị NAL( hay gói NAL) Mỗi gói có độ dài tính theo byte Byte đầu tiên của mỗi gói NAL là byte mào đầu, nó chỉ rõ loại dữ liệu được chứa trong NAL, các byte còn lại chứa dữ liệu Phần dữ liệu của NAL được ghép xen
Cấu trúc của đơn vị NAL có định dạng chung cho việc sử dụng truyền trong hệ thống hướng bit và hướng gói
đó Đối với tất cả các ảnh còn lại của dãy hoặc giữa các điểm truy cập ngẫu nhiên,
mã hóa “Inter” được sử dụng, dùng dự đoán bù chuyển động từ các ảnh được mã hóa trước
c) Khái niệm về ảnh, khung, bán ảnh, macroblock
Tín hiệu video được mã hóa trong H.264 bao gồm tập hợp các ảnh được mã hóa có trật tự Một ảnh có thể biểu diễn bằng cả một khung hoặc một bán ảnh Nhìn chung, một khung gồm có hai bán ảnh xen kẽ nhau: bán ảnh trên và bán ảnh dưới Bán ảnh trên gồm các dòng chẵn 0, 2, 4, …, H/2 -1, với H là tổng số dòng trong một khung Bán ảnh dưới gồm các dòng lẻ và bắt đầu từ dòng thứ 2
Trang 34
Hình 6 Các bán ảnh trong một khung
Các macroblock : Mỗi ảnh video, frame hoặc field, được chia thành các
macroblock có kích thước cố định bao trùm một diện tích ảnh hình chữ nhật gồm 16
x 16 mẫu thành phần luma và 8 x 8 mẫu cho mỗi một trong hai thành phần chroma Tất cả các mẫu macroblock luma hoặc chroma được dự đoán theo không gian hoặc thời gian, và dự đoán tại chỗ hợp thành được truyền đi nhờ dùng mã chuyển vị Do vậy mỗi thành phần màu dự đoán tại chỗ được chia nhỏ thành các khối Mỗi khối được biến đổi nhờ dùng biến đổi nguyên (an integer transform), và các hệ số biến đổi được lượng tử hóa và được truyền đi bằng phương pháp mã hóa entropy
Các macroblock được tổ chức thành các slice, biểu diễn các tập con của ảnh đã cho và có thể được giải mã độc lập Thứ tự truyền các macroblock trong dòng bit phụ thuộc vào bản đồ phân phối Macroblock (Macroblock Allocation Map) và không nhất thiết phải theo thứ tự quét H.264 / AVC hỗ trợ năm dạng mã hóa slice khác nhau Đơn giản nhất là slice I (Intra), trong đó tất cả macroblock được mã hóa không có tham chiếu tới các ảnh khác trong dãy video Tiếp theo là các slice P và B,
ở đó việc mã hóa có tham chiếu tới các ảnh trước nó (slice P) hoặc cả ảnh trước lẫn ảnh sau (slice B) Hai dạng slice còn lại là SP (switching P) và SI (switching I), được xác định cho chuyển mạch hiệu quả giữa các dòng bit được mã hóa ở các tốc
độ bit khác nhau
Trang 352.2.3 Bộ mã hóa H.264
Giống như các tiêu chuẩn nén trước đây ( ví dụ như MPEG-1, MPEG-2 và
MPEG-4),H.264 không được định nghĩa là bộ CODEC ( một cặp encoder và decoder) mà H.264 định nghĩa các cú pháp của luồng nén video Trong thực tế, bộ
mã hóa và giải mã bao gồm các thành phần cơ bản như trong hình 8 và hình 9 So với các chuẩn nén trước bao gồm các thành phần như bộ dự đoán, biến đổi, lượng
tử, mã hóa entropy, H.264 CODEC còn bao gồm bộ lọc deblocking và có nhiều thay đổi quan trọng trong các chi tiết về chức năng của các thiết bị
Bộ mã hóa (hình 8) bao gồm 2 dòng dữ liệu , dòng forward (từ trái sang phải) và dòng tái tạo (từ phải sang trái) Dòng dữ liệu trong bộ giải mã được truyền từ phải sang trái trong hình 9
Hình 7 Sơ đồ bộ mã hóa H.264
Trang 36Bộ mã hóa dòng forward
Một khung hoặc trường lối vào Fn được xử lí trong các khối của một macroblock( đáp ứng cho 16x16 pixel trong một hình bình thường) Mỗi macroblock được mã hóa ở chế độ trong ảnh hoặc liên ảnh, với từng block trong macroblock Một dự doán PRED (kí hiệu là P trong hình 8) được định dạng dựa trên các mẫu ảnh tái tạo lại Trong chế độ nén liên ảnh, PRED được hình thành từ slice hiện thời vừa được
mã hóa, giải mã và tái tạo lại (uF′ n trong hình, chú ý rằng các mẫu không được lọc được sủ dụng để tạo nên PRED)
Trong chế độ nén trong ảnh, PRED được hình thành bằng cách dự đoán bù chuyển động từ một hoặc hai ảnh tham khảo được Trong hình 2.8, ảnh tham khảo là ảnh F′
n −1 vừa được mã hóa Nhưng, dự đoán tham chiếu đối với mỗi macroblock có thể được chọn từ các hình ảnh trong quá khứ hoặc trong tương lai vừa được mã hóa, tái tạo và lọc ( theo thứ tự hiển thị)
Dự đoán PRED trừ với block hiện tại đer tìm ra sự khác biệt , được biến đổi và lượng tử hóa để thu được hệ số lưởng tử X sẽ được sắp xếp lại và mã hóa entropy
Hệ số được mã hóa entropy cùng với thông tin về cạnh được mã hóa trong mỗi block trong macroblock (chế độ dự đoán, mức lượng tử, thông tin về vector chuyển động, …) định dạng nên các dòng bit để truyền tơi lớp mạng trừu tượng để truyền hoặc lưu trữ
Hình 8 Bộ mã hóa
Trang 37Bộ mã hóa dòng tái tạo
Bên cạnh việc mã hóa và truyền tải các block trong macroblock, bộ mã hóa còn giải
mã ( tái tạo) chúng để làm tham khảo cho các dự đoán trong tương lai Hệ số X được giải lượng tử (Q−1 ) và biến đổi ngược (T−1 ) để thu được sụ khác biệt block D′ n Block dự đoán PRED được cộng vào để tạo thành block tái tạo uF′n
Bộ lọc được ứng dụng để giảm ảnh hưởng của méo và các ảnh tham khảo dự đoán được tạo từ 1 chuỗi các block F′n
Mục đích chính của bộ giải mã dòng tái tạo trong bộ mã hóa là để chắc chắn rằng cả
bộ mã hóa và giải mã đều sử dụng các tham số khung đã xác định để tạo ra dự đoán
P Nếu không có các tham số này, dự báo P ở bộ mã hóa và giải mã sẽ không được xác định, dẫn đến lỗi giữa bộ mã hóa và giải mã
Hình 9 Bộ giải mã
Bộ giải mã
Bộ giải mã nhận được các dòng bit được nén từ NAL Các thành phần dữ liệu được giải mã entropy để tìm ra hệ số lượng tử X Sử dụng giải lượng tử và biến đổi ngược để thu được Dn Sử dụng các thông tin header đươc giải mã từ các dòng bit,
bộ mã hóa tạo ra block dự đoán, giống hệt với PRED được tạo ra ở bộ mã hóa PRED được cộng với D′ n để tạo ra uF′n , sau đó được lọc để tạo ra các block F′n.
Trang 382.2.4 Các đặc điểm chính của H.264 :
2.2.4.1 Kích thước block ảnh có thể thay đổi được :
Thành phần độ chói của macroblock (16*16 mẫu) có thể được chia theo 4 cách: một macro block 16 *16 phần macroblock, hai macroblock 16*8 phần, hai 8* 16 phần hoặc bốn macroblock 8*8 phần Nếu kiểu 8*8 phần được chọn, mỗi bốn 8*8 sub-macroblock trong một macro block có thể được chia theo 4 cách: một phần sub-macro block 8*8, hai phần sub-macroblock 4*8, hai phần sub-macroblock 8*4 hoặc bốn phần sub-macroblock 4*4 Các phần này và các sub-macroblock tạo ra nhiều cách kết hợp giữa trong mỗi macroblock
Trong thực tế, phần có kích thước lớn phù hợp với những vị trí không chi tiết, và phần kích thước nhỏ phù hợp với các vị trí có độ chi tiết cao
Hinh 10 Bù chuyển động
2.2.4.2 Độ chính xác của vector bù chuyển động cao:
Mỗi phần hay mỗi phần sub-macroblock trong một macro được mã hóa trong ảnh được dự đoán từ một vùng có cùng kích thước trong ảnh tham khảo, hầu hết các
Trang 39chuẩn nén trước đó chỉ đạt được độ chính xác 1/2 của vector bù chuyển động, nhưng với H.264 có thể đạt được tới 1/4
2.2.4.3.Tham chiếu nhiều ảnh bù chuyển động:
Ảnh P trong MPEG-2 là ảnh dự đoán được tham chiếu từ một ảnh trước đó, còn ảnh
B là ảnh dự đoán 2 chiều được tham chiếu từ nhiều ảnh I hoặ P trước và sau nó Trong chuẩn nén H.264, ảnh hiện tại có thể tham chiếu bởi nhiều ảnh, điều này cho phép tăng hiệu suất nén Một lượng lớn các ảnh được giải nén và lưu trong bộ giải nén Trong các chuẩn nén trước đó, thứ tự các ảnh dùng cho mục đích tham chiếu
bù chuyển động và thứ tự các ảnh thể hiện có mối quan hệ chặt chẽ với nhau Tuy nhiên, chuẩn nén H.264 đã khắc phục nhược điểm này bằng cách cho phép bộ giải nén lựa chọn thứ tự các ảnh tham chiếu
Hình 11 Tham chiếu đa ảnh 2.2.4.4.Dự đoán trong ảnh:
Các mẫu của một macroblock được dự đoán bằng cách chỉ sử dụng phần thông tin của macroblock được truyền đi trong một ảnh
Trong chuẩn nén H.264/AVC, có hai loai dự đoán trong ảnh cho thành phần chói Y Loại thứ nhất là intra 4x4 và loại thứ 2 là intra 16x16 Trong INTRA 4x4, các phần
tử ảnh có kích thước 16x16 được chia thành 16 phần có kích thước 4x4, việc dự
Trang 40đoán được thực hiên với từng phần riêng biệt Có 9 mode dự đoán tùy chọn đối với các block thành phần chói Y kích thước 4x4, 4 mode đối với thành phần chói Y kích thước 16x16, 4 mode cho thành phần màu Cr, Cb Bộ nén sẽ lựa chọn mode dự đoán sao cho sự khác biệt giữa P và block được mã hóa là nhỏ nhất
c mode dự đoán thành phần chói Y 4x4
Có 9 mode dự đoán thành phần chói Y kích thước 4x4, đó là : : Mode 0: dự đoán theo chiều dọc
Mode 1: dự đoán theo chiều ngang
Mode CD: dự đoán dựa trên trung bình tất cả các mẫu xung quanh từ bên trái và từ trên của khối dữ liệu hiện tại
Mode 3: dự đoán dự trên các mẫu có độ nghiêng 45 độ từ phải sang trái
Mode 4: dự đoán dự trên các mẫu có độ nghiêng 45 độ từ trái sang phải
Mode 5 : sử dụng phép ngoại suy với góc có độ nghiêng 26.6 độ so với chiều dọc Mode 6: sử dụng phép ngoại suy với góc có độ nghiêng 26.6 độ so với chiều ngang Mode 7: sử dụng phép ngoại suy với góc có độ nghiêng 26.6 độ so với dọc bên phải Mode 8: sử dụng phép ngoại suy với góc có độ nghiêng 26.6 độ từ so với chiều ngang
Hình 12 Mode dự đoán thành phần chói Y kích thước 4x4