Danh mục các bảngTrang Bảng 1.1 Các lớp địa chỉ IP Bảng 3.1 Cấu trúc của một gói MPEG PES Bảng 3.2 Cấu trúc gói MPEG TS Bảng 3.3 Cấu trúc của gói IPTV dựa trên RTP Bảng 3.4 định dạng của
Trang 1bộ giáo dục và đào tạo bộ quốc phòng
Học viện kỹ thuật quân sự
Trang 2Bộ giáo dục và đào tạo bộ quốc phòng
Học viện kỹ thuật quân sự
Khúc ngọc khoa
Chuẩn mã hoá h.264 và khả năng ứng
dụng trong hệ thống IPTV
Chuyên ngành: Kỹ thuật điện tử
Mã số: 60 52 70
luận văn thạc sỹ kỹ thuật
Hà Nội - Năm 2011
Trang 3Luận văn thạc sĩ đợc bảo vệ tại:
hội đồng chấm luận văn thạc sĩhọc viện kỹ thuật quân sự
Ngày tháng năm 2011
Trang 4Học viện kỹ thuật quân sự
Phòng sau đại học Cộng hoà xã hội chủ nghĩa việt nam Độc lập - Tự do - Hạnh phúc
Nhiệm vụ luận văn thạc sĩ
Họ tên học viên: Khúc Ngọc Khoa Giới tính: Nam
Ngày, tháng, năm sinh: 03 - 05 - 1978 Nơi sinh: Thái BìnhChuyên nghành: Kỹ thuật điện tử Mã số: 60 52 70
I-Tên đề tài:
chuẩn mã hoá h.264 và khả năng ứng dụng
trong hệ thống IPTV
II- nhiệm vụ và nội dung:
Ngiên cứu chuẩn mã hoá H.264 làm rõ các đặc điểm của bộ mã hoá H.264, các u điểm của bộ mã hoá H.264 so với các bộ mã hoá trớc Đề xuất mô hình IPTV cho Đài phát thanh và truyền hình Nam Định
IiI- ngày giao nhiệm vụ:
IV-ngày hoàn thành nhiệm vụ: 25 - 02 - 2011
Trang 5MỤC LỤC
Trang
Trang phô b×a
NhiÖm vô luËn v¨n
Môc lôc
Tãm t¾t luËn v¨n
Danh môc c¸c ký hiÖu
Danh môc c¸c b¶ng
Danh môc c¸c h×nh vÏ
Më ®Çu
Ch¬ng1
Tæng quan vÒ IPTV
Trang 6Tóm tắt luận văn thạc sĩ
-Họ và tên học viên : Khúc Ngọc Khoa
-Lớp: Kỹ thuật điện tử Khoá: 21
-Cán bộ hớng dẫn: TS Nguyễn Tiến Tài
-Tên đề tài: chuẩn mã hoá h.264 và khả năng ứng dụng trong hệ thống IPTV.-Tóm tắt: Ngiên cứu chuẩn mã hoá H.264 làm rõ các đặc điểm của bộ mã hoá H.264, các u điểm của bộ mã hoá H.264 so với các bộ mã hoá trớc Nghiên cứu các mô hình thực nghiệm về hệ thống phân phối nội dung, hệ thống quản
lý bản quyền số, mô hình thực hiện các dịch vụ trong IPTV Đa ra mô hình IPTV cho Đài phát thanh và truyền hình Nam Định
Trang 7DANH Mục các ký hiệu, chữ viết tắt
CABAC Context-adaptive binary
arithmetic coding
Mã hoá số học nhị phân thích nghi với ngữ cảnh
CACVLC Context-adaptive
variable-length coding
Mã hoá có độ dài từ mã thay đổi thích nghi với ngữ cảnh
CDN Content Distridution Network Mạng phân phối nội dung
DRM Digital Right Management Quản lý bản quyền số
DSCP Differentiated services code
point
điểm mã phân biệt dịch vụ
EPG Electronics Programer Guide Hớng dẫn chơng trình điện tửFMO Flexible Macroblock Ordering thứ tự macroblock mềm dẻo
HDTV High Definition Television truyền hình độ nét cao
IPG Interactive Programming Guide Hớng dẫn tơng tác
IPTV Internet Protocol Television truyền hình qua giao thức
InternetITU International
Telecommunication Union
Liên minh viễn thông quốc tếMPEG Moving Picture Expert Group Nhóm âm thanh và hình ảnh
Trang 8OSS Operation Support System Hệ thống hỗ trợ hoạt động
PES Parketized Element Stream đánh dấu thời gian
PKI Public Key Infratructure Khoá chứng thực
RDO rate distortion optimization Tối u hoá độ méo
SMS Service Management System Hệ thống quản lý dịch vụ
TCP Transmission Control Protocol Giao thức cần kết nối
UDP User Datagram Protocol Giao thức không cần kết nốiVLC Video Coding Layer Phân lớp mã hoá video
VLC Common variable-length
coding
Mã hoá có độ dài từ mã thay đổi
Trang 9Danh mục các bảng
Trang
Bảng 1.1 Các lớp địa chỉ IP
Bảng 3.1 Cấu trúc của một gói MPEG PES
Bảng 3.2 Cấu trúc gói MPEG TS
Bảng 3.3 Cấu trúc của gói IPTV dựa trên RTP
Bảng 3.4 định dạng của TCP segment
Bảng 3.5 cấu trúc datagram IPTV dựa trên UDP
Bảng 3.6 cấu trúc gói video IPv4
Bảng 3.7 các lớp địa chỉ IPv4
Bảng 3.8 mô tả trờng của IPv6
Bảng 3.9 cấu trúc của Ethernet header
Bảng 3.10 Cấu trúc khung Ethernet đợc dùng để mang nội dung MPEG-2Bảng 3.11 Tổng kết các lớp trong mô hình IPTV
Trang 10Danh mục các hình vẽ trang
Hình 1.1 Sơ đồ khối đơn giản của một hệ thống IPTV
Hình 1.2 Mô hình truyền thông IPTV
Hình 2.1 Cấu trúc dòng MPEG video
Hình 2.2 Mã hóa và tổng hợp khung hình trong MPEG-4
Hình 2.9 Tham chiếu đa ảnh
Hình 2.10 Mode dự đoán thành phần chói Y kích thớc 4*4
Hình 2.11 Mode dự đoán 16*16 liên ảnh
Hình 2.12 Loại bỏ d thừa không gian
Hình 2.13 Thứ tự truyền các block trong một macroblock
Hình 2.19 Hệ thống điều khiển lặp có Rate control
Hình 2.20 Những thành phần quan trọng trong phần điều khiển tốc độ
Hình 3.1 MPEG-4 AVC có thể phân chia thành phần chói của từng
Trang 11macroblock theo nhiều cách để tối u hóa việc bù chuyển động.
Hình 3.2 Đóng gói các lớp trong mô hình IPTV
Hình 3.3 Cấu trúc của khối NAL
Hình 3.4 Định dạng gói MPEG PES
Hình 3.5 Định dạng gói MPEG TS
Hình 3.6 ánh xạ gói truy cập AVC sang gói MPEG PES
Hình 3.7 ứng dụng nhãn thời gian với các gói MPEG PES
Hình 3.8 Mối liên hệ giữa PMT và PAT
Hình 3.9 Định dạng RTP header
Hình 3.10 Các gói MPEG TS
Hình 3.11 ánh xạ nội dung H.264/AVC (từng khối NAL
riêng biệt ) sang RTP payload
Hình 3.12 ánh xạ nội dung H264/AVC (nhiều khối NAL
riêng biệt) sang một RTP payload
Hình 3.13 ánh xạ nội dung một H264/AVC NAL sang nhiều RTP payloadHình 3.14 Cơ chế điều khiển luồng của TCP
Hình 3.15 Quá trình truyền thông trong mạng IPTV
Hình 3.16 Định dạng datagram dựa trên UDP
Hình 3.17 Định nghĩa dạng gói video IPv4
Trang 12H×nh 4.7 CÊu tróc m¹ng hai líp.
H×nh 4.8 CÊu tróc m¹ng ®a líp
H×nh 4.9 C¬ chÕ ®¨ng ký ngêi dïngH×nh 4.10 C¬ chÕ hñy bá ngêi dïngH×nh 4.11 C¬ chÕ ®¨ng ký kiÓu thuª baoH×nh 4.12 C¬ chÕ hñy thuª bao
H×nh 4.13 C¬ chÕ ph©n phèi néi dungH×nh 4.14 C¬ chÕ lÊy néi dung
H×nh 4.15 C¬ chÕ xuÊt b¶n néi dungH×nh 4.16 C¬ chÕ xuÊt b¶n EPG
H×nh 4.17 C¬ chÕ VOD
Trang 13Tại Việt Nam, IPTV đã trở nên khá gần gũi đối với ngời sử dụng Internet tại Việt Nam Các nhà cung cấp nh: VNPT, FPT, SPT, VTC đã đa ra thị trờng đó là IPTV, VoD ra thị trờng nhng ở quy mô nhỏ
Xu hớng phát triển mạng thế hệ sau NGN hiện nay l chuyển từàSoftswitch sang IMS do IMS đem lại khả năng cung ứng dịch vụ đa phơng tiện cho ngời sử dụng đầu cuối mà không phụ thuộc vào vị trí, công nghệ truy nhập mạng và vào thiết bị đầu cuối của ngời sử dụng IMS hỗ trợ các loại hình dịch vụ khác nhau (thoại, dữ liệu, hình ảnh và khả năng tích hợp cả ba loại hình dịch vụ nói trên – Tripple Play mà điển hình là dịch vụ IPTV), các công nghệ mạng và các thiết bị đầu cuối Đặc biệt, trên nền tảng IMS, yếu tố di
động và truy nhập không dây trở nên khả thi, càng tạo điều kiện cho IPTV phát triển thành một trong những dạng dịch vụ Quad - Play
Từ bài toán thực tế đồng thời mong muốn đợc nâng cao trình độ và khả năng nghiên cứu của mình tôi đã chọn đề tài luận văn tốt nghiệp “Chuẩn mã hoá H.264 và khả năng ứng dụng trong hệ thống IPTV” Luận văn có nhiệm vụ: Ngiên cứu chuẩn mã hoá H.264 làm rõ các đặc điểm của bộ mã hoá H.264, các u điểm của bộ mã hoá H.264 so với các bộ mã hoá trớc Nghiên cứu về
Trang 14công nghệ IPTV Đề xuất mô hình IPTV cho Đài phát thanh và truyền hình Nam Định.
Nội dung của luận văn đợc trình bày trong 4 chơng bao gồm:
Chơng I: Tổng quan về IPTV.
Giới thiệu tổng quan về IPTV, các đặc tính, cơ sở hạ tầng, việc lựa chọn
IP cho IPTV, sự khác biệt giữa IPTV và truyền hình Internet, nhu cầu thực tế
Chơng II: Chuẩn mã hoá H.264.
Giới thiệu chung về các chuẩn mã MPEG nói chung, tập trung tìm hiểu
về các đặc điểm của mã hoá H.264, đặc điểm kỹ thuật Rate control trong H.264
Chơng III: Chuẩn nén H.264 và ứng dụng trong IPTV.
Đa ra các đặc điểm nổi bật của mã hoá H.264, khả năng ứng dụng trong IPTV Mô hình IPTV trong truyền tải nội dung với mã hoá H.264
Chơng IV: Đề xuất mô hình IPTV cho đài phát thanh và truyền hình Nam
Định.
Mặc dù đã cố gắng song do trình độ chuyên môn còn hạn chế, vấn đề
đề cập tới lại mới và tơng đối phức tạp, tài liệu phải tham khảo tơng đối rộng, nhiều chỗ vợt quá trình độ hiểu biết của ngời viết, vì vậy luận văn không thể tránh khỏi những sai sót Tôi rất mong nhận đợc những góp ý và chỉ bảo của các thầy giáo và các bạn đồng nghiệp để luận văn hoàn chỉnh hơn
Qua đây tôi xin đợc bày tỏ lòng biết ơn đến các thầy giáo, cô giáo khoa
Kỹ thuật vô tuyến - HVKTQS về những kiến thức đã nhận đợc trong thời gian học tại trờng Tôi xin chân thành cảm ơn thầy giáo hớng dẫn khoa học Thiếu tá - TS Nguyễn Tiến Tài đã tận tình, chu đáo và có những ý kiến hết sức quý báu giúp tôi thực hiện tốt các nhiệm vụ đề tài đã đa ra và hoàn thành đúng kế hoạch
Hà Nội, ngày tháng 05 năm 2011
Trang 15Chơng 1
tổng quan về iptv
1.1 Giới thiệu về truyền hình số theo giao thức IP
IPTV là tên viết tắt của cụm từ Internet Protocol Television _ truyền hình qua giao thức Internet
IPTV theo định nghĩa chính thức nh sau: IPTV đợc định nghĩa là các dịch
vụ đa phơng tiện nh truyền hình ảnh, tiếng nói, văn bản, dữ liệu đợc phân phối qua các mạng dựa trên IP mà đợc quản lý để cung cấp các cấp chất lợng bảo mật, tính tơng tác, tính tin cậy theo yêu cầu
Nh vậy IPTV đóng vai trò phân phối các dữ liệu kể cả hình ảnh, âm thanh, văn bản qua mạng sử dụng giao thức Internet Điều này nhấn mạnh vào việc Internet không đóng vai trò chính trong việc truyền tải thông tin truyền hình hay bất kỳ loại nội dung truyền hình nào khác Thay vào đó, IPTV sử dụng IP là cơ chế phân phối mà theo đó có thể sử dụng Internet, đại diện cho mạng công cộng dựa trên IP hay có thể sử dụng mạng riêng dựa trên IP
Có thể thấy, IPTV là một dịch vụ số mà có khả năng cung cấp những tính năng vợt trội hơn khả năng của bất kỳ cơ chế phân phối truyền hình nào khác Ví dụ, set – top box IPTV có thể thông qua phần mềm để cho phép xem đồng thời 4 chơng trình truyền hình trên màn hiển thị, hay có thể nhận tin nhắn sms, email…
1.2 Một số đặc tính IPTV [9]
Hỗ trợ truyền hình tơng tác: Khả năng hai chiều của hệ thống IPTV cho phép nhà cung cấp dịch vụ phân phối toàn bộ các ứng dụng TV tơng tác Các loại dịch vụ đợc truyền tải thông qua một dịch vụ IPTV có thể bao gồm TV trực tiếp, chuẩn TV chất lợng cao (HDTV), trò chơi tơng tác và khả năng duyệt Iternet tốc độ cao
Trang 16Sự dịch thời gian: IPTV kết hợp với một máy ghi video kỹ thuật số cho phép dịch thời gian nội dung chơng trình - một cơ chế cho việc ghi và lu trữ nội dung IPTV để xem sau.
Cá nhân hóa: Một hệ thống IPTV hỗ trợ truyền thông tin hai chiều và cho phép ngời dùng cá nhân hoá những thói quen xem TV của họ bằng cách cho phép họ quyết định những gì họ muốn xem và khi nào họ muốn xem
Yêu cầu về băng thông thấp: Thay vì phân phối trên mọi kênh để tới mọi ngời dùng, công nghệ IPTV cho phép nhà cung cấp dịch vụ chỉ truyền trên một kênh mà ngời dùng yêu cầu Đặc điểm hấp dẫn này cho phép nhà điều hành mạng có thể tiết kiệm băng thông của mạng
Có thể truy xuất qua nhiều thiết bị: Việc xem nội dung IPTV bây giờ không chỉ giới hạn ở việc sử dụng TV Ngời dùng có thể sử dụng máy tính xách tay hay thiết bị di động để truy xuất vào các dịch vụ của IPTV
1.3 Sự khác biệt giữa IPTV và truyền hình Internet
Do đều đợc truyền trên mạng dựa trên giao thức IP, ngời ta đôi lúc hay nhầm IPTV là truyền hình Internet Tuy nhiên hai dịch vụ này có nhiều điểm khác nhau:
*Các nền khác nhau
Truyền hình Internet sử dụng mạng Internet công cộng để phân phối các nội dung video tới ngời sử dụng cuối IPTV sử dụng mạng riêng bảo mật để truyền các nội dung video đến khách hàng Các mạng riêng này thờng đợc tổ chức và vận hành bởi nhà cung cấp dịch vụ IPTV
Trang 17Khi nội dung video đợc gửi đi qua mạng Internet công cộng, các gói sử dụng giao thức Internet mạng nội dung video có thể bị trễ hoặc mất khi nó di chuyển trong các mạng khác nhau tạo nên mạng Internet công cộng Do đó, nhà cung cấp các dịch vụ truyền hình ảnh qua mạng Internet không đảm bảo chất lợng truyền hình nh với truyền hình mặt đất, truyền hình cáp hay truyền hình vệ tinh Thực tế là các nội dung video truyền qua mạng Internet khi hiển thị trên màn hình TV có thể bị giật và chất lợng hình ảnh thấp Trong khi IPTV chỉ đợc phân phối qua một hạ tầng mạng của nhà cung cấp dịch vụ do đó ngời vận hành mạng có thể điều chỉnh để có thể cung cấp hình ảnh với chất lợng cao.
th-*Giá thành
Phần trăm nội dung chơng trình đợc phân phát qua mạng Internet công cộng tự do thay đổi Điều này khiến các công ty truyền thông đa ra các loại dịch vụ dựa trên mức giá thành Giá thành các loại dịch vụ IPTV cũng gần giống với mức phí hàng tháng của truyền hình truyền thống Các nhà phân tích mong muốn rằng truyền hình Internet và IPTV có thể hợp nhất lại thành một lloại hình dịch vụ giải trí
Trang 181.4 Cơ sở hạ tầng một mạng IPTV [9]
Hình 1.1 Sơ đồ khối đơn giản của một hệ thống IPTV
*Trung tâm dữ liệu IPTV
Cũng đợc biết đến là “đầu cuối _ headend” Trung tâm dữ liệu IPTV nhận nội dung từ nhiều nguồn khác nhau, bao gồm truyền hình địa phơng, các nhà tập hợp nội dung, nhà sản xuất, qua đờng cáp, trạm số mặt đất hay vệ tinh Ngay khi nhận đợc nội dung, một số các thành phần phần cứng khác nhau từ thiết bị mã hoá và các máy chủ video tới bộ định tuyến IP và thiết bị bảo mật giành riêng đợc sử dụng để chuẩn bị nội dung video cho việc phân phối nội dung qua mạng dựa trên IP Thêm vào đó, hệ thống quản lý thuê bao đợc yêu cầu để quản lý hồ sơ và phí thuê bao của những ngời sử dụng Chú ý rằng, địa
điểm thực của trung tâm dữ liệu IPTV đợc yêu cầu bởi hạ tầng cơ sở mạng đợc
sử dụng bởi nhà cung cấp dịch vụ
Trang 19Hạ tầng truyền hình cáp dựa trên cáp đồng trục lai cáp quang và các mạng viễn thông dựa trên cáp quang rất phù hợp để truyền tải nội dung IPTV.
*Thiết bị ngời dùng IPTV
Thiết bị ngời dùng IPTV (IPTV CD) là thành phần quan trọng trong việc cho phép mọi ngời có thể truy xuất vào các dịch vụ IPTV Thiết bị này kết nối vào mạng băng thông rộng và có nhiệm vụ giải mã và xử lý dữ liệu video dựa trên IP gửi đến Thiết bị ngời dùng hỗ trợ công nghệ tiên tiến để có thể tối thiểu hoá hay loại bỏ hoàn toàn ảnh hởng của lỗi, sự cố mạng khi đang xử lý nội dung IPTV
*Mạng gia đình
Mạng gia đình kết nối với một số thiết bị kỹ thuật số bên trong một diện tích nhỏ Nó cải tiến việc truyền thông và cho phép chia sẻ tài nguyên (các thiết bị) kĩ thuật số đắt tiền giữa các thành viên trong gia đình Mục đích của mạng gia đình là để cung cấp thiết bị khác nhau trong nhà Với mạng gia đình, ngời dùng có thể tiết kiệm tiền và thời gian bởi vì các thiết bị ngoại vi nh máy
in và máy scan, cũng nh kết nối băng rộng, có thể đợc chia sẻ một cách dễ dàng
1.5. Mô hình truyền thông của IPTV [9]
Mô hình truyền thông của IPTV có 7 lớp (và một tuỳ chọn) đợc xếp chồng lên nhau
Các dữ liệu video ở phía thiết bị gửi đợc truyền từ lớp cao xuống lớp thấp trong mô hình IPTV, và đợc truyền đi trong mạng băng rộng bằng các giao thức của lớp vật lý ở thiết bị nhận, dữ liệu nhận đợc truyền từ lớp thấp nhất
đến lớp trên cùng trong mô hình IPTV
Trang 21tin giúp thiết bị có thể sử dụng gói dữ liệu đúng chức năng của nó, và thờng
đ-ợc định dạng nh các header hoặc trailer Bên cạnh việc truyền thông giữa các lớp, còn có các liên kết ảo giữa các tầng cùng mức 7 lớp và một lớp bổ sung trong mô hình IPTV có thể đợc chia làm hai loại: các lớp cao và lớp thấp, các tầng cao hơn thì quan tâm nhiều hơn tới các ứng dụng của IPTV và các định dạng file, trong khi các tầng thấp hơn thì quan tâm tới việc truyền tải các nội dung
1.5.1 Lớp mã hoá video
Quá trình truyền thông bắt đầu ở lớp mã hoá, các tín hiệu tơng tự hoặc
số đợc nén Tín hiệu lối ra của bộ nén là các dòng MPEG cơ bản Các dòng MPEG cơ bản đợc định nghĩa là các tín hiệu số liên tục thời gian thực Có nhiều loại dòng cơ bản VD: âm thanh đợc mã hoá sử dụng MPEG đợc gọi là
“dòng cơ bản âm thanh” Một dòng cơ bản thực ra chỉ là tín hiệu ra thô từ bộ mã hoá Các dòng dữ liệu đợc tổ chức thành các khung tại lớp này
1.5.2 Lớp đóng gói video
để truyền các dòng cơ bản âm thanh, dữ liệu và hình ảnh qua mạng số, mỗi dòng cơ bản này phải đợc chuyển đổi sang một dòng đợc chèn của gói PES đã đợc đánh dấu thời gian (PES - parketized Element Stream) Một dòng PES chỉ bao gồm 1 loại dữ liệu từ 1 nguồn Một gói PES có thể có kích thớc cố khối cố định hoặc thay đổi, có thể lên tới 65536 byte/gói Bao gồm 6 header,
và số byte còn lại chứa nội dung chơng trình
1.5.3 Lớp cấu trúc dòng truyền tải
Lớp tiếp theo trong mô hình truyền thông IPTV làm nhiệm vụ tạo nên dòng truyền tải, bao gồm 1 dòng liên tiếp các gói Những gói này thờng đợc gọi là các gói TS, đợc tạo ra bằng cách ngắt các gói PES thành các gói TS có kích thớc cố định là 188 byte độc lập với thời gian Sử dụng thời gian độc lập này làm giảm khả năng mất gói tin trong quá trình truyền và giảm ồn Mỗi gói
Trang 22TS bao gồm 1 trong 3 định dạng truyền thông, mỗi gói TS bao gồm 184 byte payload và 4 byte header.
1.5.4 Lớp giao thức truyền tải thời gian thực (tuỳ chọn)
Lớp tuỳ chọn này đợc sử dụng rộng rãi trong nhiều ứng dụng khác nhau Lớp này hoạt động nh 1 lớp trung gian giữa các nội dung đợc nén MPEG - 2, H.264/AVC ở lớp cao hơn và các lớp thấp hơn trong mô hình IPTV Giao thức RTP chính là lõi của lớp này và thờng là block cơ sở hỗ trợ truyền dòng nội dung theo thời gian thực qua mạng IP
1.5.5 Lớp truyền tải
Thông thờng các gói RTP là dạng đầu vào của lớp truyền tải Điều đáng chú ý là có thể ánh xạ trực tiếp các gói MPEG - TS sang payload giao thức của lớp truyền tải
Lớp truyền tải IPTV đợc thiết kế để đảm bảo các kết nối đầu cuối là tin cậy Nếu dữ liệu tới thiết bị ngời nhận sai, lớp truyền tải sẽ truyền lại Lớp truyền tải thông báo với lớp trên để có các thông tin chính xác hơn
TCP và UDP là 2 giao thức quan trọng nhất đợc sử dụng ở lớp này
1.5.5.1. Sử dụng TCP để quyết định các gói IPTV
TCP là giao thức cốt lõi của bộ giao thức Internet và đợc xếp vào loại
định hớng kết nối Điều này cơ bản có nghĩa là kết nối đợc thiết lập giữa đầu cuối nhà cung cấp thiết bị IPTV của ngời sử dụng để truyền các chơng trình qua mạng
TCP có khả năng điều khiển lỗi xảy ra trong quá trình truyền các chơng trình qua mạng các lỗi nh mất gói, mất trật tự gói, hoặc lặp gói thờng gặp trong môi trờng truyền IPTV Để xử lý các tình huống này, TCP sử dụng hệ thống các số liên tục để cho phép thiết bị gửi có thể gửi lại các dữ liệu hình
ảnh bị mất hoặc hỏng Hệ thống số liên tục này là trờng có độ dài 32 bít trong cấu trúc gói, trờng đầu tiên chứa chuỗi số bắt đầu của dữ liệu trong gói và tr-
Trang 23ờng thứ 2 chứa giá trị của chuỗi số tiếp theo mà video server đang đợi (mong) nhận trở lại từ IPTVCD.
Bên cạnh việc sửa các lỗi có thể xảy ra trong quá trình truyền nội dung video qua mạng IP băng rộng, TCP còn có điều khiển luồng dữ liệu Điều này
có thể đạt đợc bằng cách sử dụng trờng kích thớc cửa sổ, với thuật toán đợc gọi là cửa sổ trợt Giá trị trong trờng này xác định số các byte có thể truyền đi qua mạng trớc khi nhận đợc từ phía thiết bị nhận
1.5.5.2 Sử dụng UDP để định hớng các gói IPTV
UDP là giao thức thuộc về bộ giao thức Internet UDP cho phép máy chủ kết nối với mạng băng rộng để gửi tới các IPTVCD dịch vụ truyền hình quảng bá có chất lợng hài lòng ngời dùng UDP giống TCP nhng là phiên bản sơ lợc hơn, đa ra cho số lợng tối thiểu các dịch vụ truyền tải UDP là giao thức không liên kết, điều đó có nghĩa là kết nối giữa video server và IPTVCD không cần phải thiết lập trớc khi dữ liệu đợc truyền đi Video server đơn giản chỉ thêm vào địa chỉ IP đích và số cổng vào datagram và gửi tới cơ sở mạng để phân phát tới địa chỉ IP đích Khi trên mạng UDP sử dụng cách tốt nhất để cố gắng thu đợc dữ liệu về điểm đích của nó Chú ý rằng UDP sử dụng các khối dữ liệu đợc gọi là các datagram để truyền nội dung qua mạng
1.5.5.3 Sự khác biệt giữa UDP và TCP
Khi các nhà cung cấp dich vụ phát các nội dung IPTV tới các thuê bao,
điều quan trọng là các nội dung này phải đến thiết bị của ngời dùng đúng lúc
và trong dạng đúng Nói cách khác, các gói video phải không bị ngắt quãng
Do đó, các nhà cung cấp dịch vụ cần chắc chắn sử dụng giao thức hỗ trợ khả năng phân phối qua hạ tầng mạng
Mặc dù TCP cung cấp các ứng dụng với nhiều đặc trng về mạng so với UDP, nhng các nhà cung cấp dịch vụ IPTV không thờng chọn TCP là giao thức truyền tải Điều này chỉ ra 1 thực tế rằng IPTV là ứng dụng thời gian thực và
Trang 24không có trễ TCP có thể đa ngầm vào sự phân phối nội dung video IP do thực
tế rằng giao thức sử dụng cơ chế điều khiển dòng
Nh vậy, độ tin cậy và khả năng sửa lỗi của UDP không bằng TCP nhng UDP là giao thức đợc lựa chọn để phân phát các dịch vụ IPTV UDP có các nh-
ợc điểm kông có khả năng tìm và sửa lỗi Vấn đề này đợc khắc phục bằng cách gắn các hàm sửa lỗi vào các ứng dụng IPTV chạy trên các mạng hoặc trong chính các dòng video
1.5.6 Lớp IP
Sau lớp truyền tải là lớp IP (còn đợc gọi là lớp liên mạng) Nhiệm vụ chính của lớp này là đa các dữ liệu tới các vị trí mạng riêng biệt thông qua nhiều mạng độc lập đợc liên kết với nhau đợc gọi là liên mạng Lớp này đợc
sử dụng để gửi các dữ liệu thông qua các đờng khác nhau tới đích IP là giao thức tốt nhất đợc sử dụng trong lớp liên mạng, giao thức này cung cấp dịch vụ phân phát gói cơ bản cho tất cả các dịch vụ IPTV Các loại dịch vụ này với hệ thống truyền đơn điểm, nơi mà các gói đợc truyền từ máy chủ tới nhiều IPTVCD
Ipv4 là giao thức phổ biến nhất đợc sử dụng trong mạng IPTV ngày nay Nhiệm vụ chính của IP là phân phát các bít dữ liệu trong các gói từ nguồn tới đích IP sử dụng kỹ thuật có hiệu quả cao nhất để phân phát dữ liệu Nói cách khác không có tiến trình nào đảm bảo quá trình phân phát thông tin qua mạng các khối cơ sở của giao thức IP là các đoạn bít dữ liệu đợc đặt trong các gói và đợc định địa chỉ
Gói IP là đơn vị dữ liệu bao gồm dữ liệu video thực và thông tin của việc nhận video từ trung tâm cung cấp dữ liệu IPTV tới đích IPTVCD
Một điểm đáng chú ý là một vài bít đầu tiên của địa chỉ sẽ định nghĩa các bít còn lại của trờng địa chỉ sẽ đợc phần chia host và mạng Để thuận lợi cho việc sử dụng và quản lý, địa chỉ IP đợc chi thành các lớp khác nhau
Bảng 1.1 Các lớp địa chỉ IP
Trang 25Lớp địa
A
Mô tả một mạng sở hữu số đầu tiên trong địa chỉ IP, có giá trị từ 0
ữ 128, 3 số còn lại đợc dùng để xác định một IPTVCD, máy chủ
hay thiết bị mạng khác Do đó một địa chỉ lớp A có địa chỉ mạng 7 bít và địa chỉ host 24 bít Bít có thứ tự cao nhất đợc thiết lập bằng 0
Có 126 địa chỉ mạng lớp A trên thế giới và mỗi mạng trong số đó
có đủ sốđịa chỉ IP để hỗ trợ hơn 16 thiết bị mạng Tất cả các địa chỉ
IP lớp A đợc cấp phép từ InterNIC từ nhiều năm trớc
B
Một mạng lớp B có địa chỉ gồm số đầu tiên có giá trị từ 128 ữ 191 Giá trị này tơng đơng với địa chỉ mạng 14 bít và một địa chỉ cục bộ
16 bít Giá trị của 1 và 0 gán cho 2 bít có thứ tự cao nhất
Có khoảng 16.000 mạng lớp B trên Internet, mỗi mạng có khả năng
hỗ trợ 64.000 thiết bị mạng Những tổ chức lớn hơn và các nhà cung cấp dịch vụ Internet đã cấp phép cho hầu hết hoặc gần hết các
địa chỉ này Ví dụ về địa chỉ lớp B: 132.6.2.24, trong đó 132.6 chỉ
ra mạng, 2.24 chỉ ra host
C
Mạng lớp C có địa chỉ có số đầu tiên có giá trị từ 192 ữ 223 Số
này tơng đơng với một địa chỉ mạng 21 và địa chỉ của bộ 8 bít Giá trị 1 và 0 đợc gán cho 3 bít có thứ tự cao nhất Có gần 2.000000 địa chỉ mạng lớp C, mỗi mạng có khả năng hỗ trợ đánh địa chỉ cho 254 thiết bị mạng
D Là phần đầu tiên của địa chỉ có giá trị từ 224 ữ 239 Những địa chỉ
IP này đợc sử dụng cho mục đích truyền đa điểm
E Địa chỉ mạng lớp E có giá trị từ 240 ữ 247 và đợc đặt trớc để sử
dụng sau này
Nhợc điểm chính khi sử dụng giao thức Ip là không có gì đảm bảo rằng khi nào các gói tới đúng lúc hay gói có đến đúng lúc không ngay cả thứ tự các gói đợc chuyển đến cũng không đợc xác định Do đó, lớp IP làm việc cùng với
Trang 26giao thức lớp truyền tải để đảm bảo rằng các gói đến IPTVCD đúng lúc và theo trật tự đúng IP cũng làm cho quá trình phân phát nội video bị trễ.
1.5.7 Lớp liên kết dữ liệu
Lớp liên kết dữ liệu lấy các dữ liệu thô từ lớp IP và định dạng chúng thành các gói phù hợp để truyền qua mạng vật lý Chú ý lớp liên kết dữ liệu khác với các giao thức mạng Kỹ thuật Ethernet là một trong những kỹ thuật phổ biến hơn đợc sử dụng trong hệ thống IPTV Lớp liên kết dữ liệu bao gồm các chức năng dành cho các mạng dựa trên Ethernet:
Encapsulation: lớp này thêm vào các gói IPTV 1 header Ethernet
header là loại Encapsulation phổ biến nhất dùng trong lớp liên kết dữ liệu của IPTVCD
Định địa chỉ: Lớp liên kết dữ liệu xử lý các địa chỉ vật lý của mạng ngời
sử dụng và các thiết bị chủ Hệ thống địa chỉ khác nhau với các topo mạng Ví dụ: địa chỉ MAC đợc sử dụng trong mạng Ethernet Mỗi thiết bị kết nối với mạng IPTV thì có một địa chỉ MAC Độ dài của địa chỉ MAC là 48 bit và th-ờng đợc biểu diễn bằng 12 số trong hệ 16 Trong 12 số hệ 16 này, 6 số đầu tiên
để dành cho nhà sản xuất thiết bị IPTV và các số còn lại đợc dùng để định nghĩa giao diện mạng ảo
Kiểm tra lỗi: Chức năng kiểm tra lỗi đợc dùng trong vài lớp của mô hình IPTV, bao gồm cả lớp liên kết dữ liệu Các gói bị ngắt là lỗi thờng gặp trong quá trình truyền các nội dung video qua mạng dựa trên IP Phơng pháp sửa lỗi thờng dùng là kiểm tra d thừa vòng (CRC) trong IPTV trong IPTV để tìm và loại bỏ các gói bị ngắt Sử dụng kỹ thuật CRC thiết bị gửi IPTV thực hiện việc tính toán trên các gói và lu trữ kết quả trong gói Các phép tính toán tơng tự cũng đợc thực hiện trên thiết bị nhận khi nhận đợc các gói Nếu kết quả tính toán là nh nhau thì các gói đợc xử lý bình thờng Tuy nhiên, nếu kết quả này là khác nhau, thì gói bị lỗi sẽ bị loại bỏ Thiết bị gửi sẽ tạo một gói mới và gửi lại nó Thông báo với lớp trên trong mô hình IPTV khi có lỗi xảy ra
Trang 27là nhiệm vụ chính của lớp liên kết dữ liệu trong kỹ thuật kiểm tra lỗi mà các hệ thống IPTV end to end.
điều khiển luồng: điều khiển luồng là một trong những chức năng của lớp truyền tải Trong mạng IPTV, điều khiển luồng cho thiết bị IPTV của ngời
sử dụng không bị tràn bởi các nội dung Lớp liên kết dữ liệu cùng với lớp truyền tải thực hiện bất kỳ yêu cầu điều khiển luồng nào
1.5.8 Lớp vật lý
Lớp vật lý quy định luật lệ truyền các bit qua mạng Nó đề cập đến việc
đa các dữ liệu qua mạng vật lý riêng biệt nh xDSL, và không dây Lớp này
định nghĩa cấu hình mạng vật lý, thông số kỹ thuật, điện trong môi trờng truyền
Khi dòng bit đợc truyền qua mạng, các gói đợc chuyển từ lớp thấp đến lớp cao trong mô hình truyền thông IPTV Ví dụ lớp liên kết dữ liệu sẽ kiểm tra các gói và loại bỏ đi phần header Ethernet và trờng sửa lỗi CRC Tiếp đó sẽ kiểm tra trờng kiều mã của Ethernet header và xác định gói cần đợc xử lý bởi giao thức IP Do đó gói dữ liệu đợc chuyển lên lớp mạng Lớp mạng kiểm tra
và loại bỏ đi phần IP header và chuyển nó lên lớp truyền tải Phơng pháp bỏ đi phần header khi qua các lớp khác nhau gọi là bóc gói Quá trình này tiếp tục
đợc thực hiện cho tới khi gói dữ liệu lên đến tầng trên cùng trong mô hình Hình ảnh gốc đợc thể hiện trên màn hình tivi của ngời xem
Kết luận.
Truyền hình số đợc định thời một cách chính xác, là dòng dữ liệu liên tục có tốc độ bit không đổi, thờng hoạt động trên các mạng mà mỗi tín hiệu đ-
ợc truyền đều phục vụ cho mục đích truyền hình Trái với truyền hình, mạng
IP truyền những loại dữ liệu khác nhau từ rất nhiều nguồn trên một kênh chung, bao gồm th điện tử, trang web, tin nhắn trực tiếp, tiếng nói qua IP (VoIP) mà nhiều loại dữ liệu khác Để truyền đồng thời những dữ liệu này,
Trang 28mạng Internet phân thông tin thành các gói Nh vậy rõ ràng là IP và truyền hình không phải là một sự kết hợp hoàn hảo (lý tởng) về công nghệ.
Mặc dù không tơng thích về căn bản, nhng thị trờng IPTV vẫn bùng nổ Vì lý do tại sao lại chọn các mạng dựa trên IP để truyền tín hiệu truyền hình?
- Mạng IP băng rộng đã vơn tới rất nhiều gia đình ở nhiều nớc, các nhà cung cấp dịch vụ truyền hình có thể sử dụng những mạng này để phát các dịch
vụ truyền hình mà không cần xây dựng hệ thống mạng riêng của họ
- IP có thể đơn giản công việc phát các dịch vụ truyền hình mới, nh là chơng trình tơng tác, truyền hình theo yêu cầu…
- Giá thành của mạng IP tiếp tục giảm do số thiết bị đợc sản xuất mỗi năm rất lớn và tồn tại của các chuẩn trên toàn thế giới
- Mạng IP có mặt trên toàn thế giới, và số ngời dùng mạng Internet tốc
độ cao tiếp tục tăng rất nhanh
- IP là công nghệ hoàn hảo cho nhiều ứng dụng khác nhau, bao gồm sự trao đổi dữ liệu, mạng cục bộ, chia sẻ tập tin, lớt web…
Với việc sử dụng các mạng IP để truyền dẫn tín hiệu truyền hình, việc xem truyền hình hiện đại sẽ rất khác so với xem truyền hình trớc đây Ngoài các kênh truyền hình quảng bá truyền thống, chúng ta sẽ có thêm những kênh truyền hình riêng biệt, tơng tác để thoả mãn nhu cầu của từng ngời
Trang 29Chơng 2
chuẩn mã hoá h.264 2.1 Các kỹ thuật nén thông dụng
nén cho phép các nhà cung cấp dịch vụ truyền các kênh hình và tiếng với chất lợng cao qua mạng IP băng rộng Do mắt ngời không thể phân biệt đ-
ợc toàn bộ các phần của hình ảnh do đó việc nén sẽ làm giảm độ lớn của tín hiệu ban đầu bằng cách bỏ bớt các phần của hình ảnh
2.1.2 Chuẩn MPEG - 2
MPEG-2 là một công nghệ đạt đợc thành công lớn và là 1 chuẩn nén có
u thế vợt trội dành cho truyền hình số đợc truyền qua nhiều mạng truyền thông băng rộng Chuẩn nén MPEG-2 đợc chia làm 2: nén hình và nén tiếng Nén hình: Video ở dạng cơ bản là một chuỗi các ảnh liên tục, 1 framer đợc định nghĩa với 1 chuỗi bit header Mắt ngời thờng thấy thoải mái khi xem TV với tốc độ 25 hình/giây Sẽ không có lợi nếu phát với tốc độ nhanh hơn vì ngời xem không thể nhận ra sự khác biệt, do đó dung lợng của những hình ảnh sẽ đ-
Trang 30ợc giảm xuống bằng cách nén chúng lại Các bộ nén hình đợc sử dụng với mỗi frame mà vẫn giữ chất lợng hình ảnh cao.
2.1.2.1 Quá trình nén MPEG
Phần đầu tiên của nén bao gồm 1 quá trình tiền đồng bộ Quá trình này cơ bản bao gồm việc làm giảm kích thớc của các frame làm giảm kích thớc của các frame chính là làm giảm tốc độ bit, điều này cũng giúp băng thông cần thiết để truyền tín hiệu Tuy nhiên, quá trình này không phải không có trở ngại Ví dụ, sự giảm kích thớc của khung có thể thờng xuyên xảy ra những lỗi
tỉ số cạnh (giống nh sai tỉ lệ 4/3 hay 16/9) khi đợc thể hiện trên màn hình TV
có độ phân giải thấp
Phần hai của quá trình nén tín hiệu là chia 1 frame ảnh ra thành các block có kích thớc 8*8 pixel - khối mã hoá nhỏ nhất trong giải thuật của MPEG Có 3 loại block: độ chói Y, thành phần màu đỏ Cr hoặc màu xanh Cb Các loại bock thành phần màu mạng thông tin về những màu sắc khác nhau của hình ảnh trong khi độ chói mang thông tin về những phần màu đen hoặc trắng của hình ảnh
Khi hoàn thành hai phần trên, MPEG sẽ thực hiện hàm toán đợc gọi là biến đổi cosin rời rạc với mỗi block riêng biệt Kết quả thu đợc là một matrix
hệ số 8*8 DCT sẽ biến đổi sự khác nhau về không gian thành các tần số khác nhau, nhng không làm thay đổi các thông tin trong block, các block ban đầu sẽ
đợc tái tạo lại một cách chính xác sử dụng biến đổi ngợc Nguyên tắc thực hiện hàm này bao gồm việc chia block thành các phần tuỳ theo mức độ quan trọng Những phần quan trọng sẽ đợc giữ nguyên cho tới bớc tiếp theo trong khi các phần còn lại sẽ bị giảm bớt Điều này sẽ đảm bảo rằng mắt ngời không chú ý tới việc những phần không quan trọng của block bị bỏ bớt khi tốc độ bit
bị hạn chế
Trang 31Bớc tiếp theo trong MPEG là quá trình lợng tử hoá Quá trình lợng tử hoá dữ liệu số là quá trình làm giảm số lợng bít của các block Mức lợng tử đối với mỗi tín hiệu video là rất quan trọng.
Khi tất cả các block trong frame đều đã đợc nén lại, MPEG sẽ ngắt các frame thành 1 dạng mới gồm nhiều block gọi là macroblock Mỗi macroblock
có kích thớc 16*16 chứa các block độ chói và thành phần màu nếu có sự khác biệt giữa frame cuối cùng và frame hiện tại, các thiết bị nén MPEG sẽ chuyển những block mới này tới vị trí mới trên frame hiện tại Điều này giúp không phải gửi đi những hình ảnh mới hoàn toàn, do đó có thể tiết kiệm băng thông
Có 2 cách để thực hiện điều đó:
nén theo không gian: Là làm giảm các bit trên từng frame riêng biệt,
điều này có thể đạt đợc các pixel luôn đứng cạnh nhau trong các frame thờng
có giá trị giống nhau Do đó thay vì mã hoá từng pixel riêng biệt Kỹ thuật nén theo không gian này mã hoá sự khác biệt giữa các pixel đứng cạnh nhau Số l-ợng bit cần thiết để mã hoá những khác biệt này ít hơn số lợng bit cần thiết để mã hoá từng pixel riêng biệt
nén theo thời gian: Là làm giảm các bit giữa các frame liên tục Trong
quá trình sản xuất video có những thông tin đợc lặp lại giữa các frame liên tiếp Ví dụ: nếu trên 1 hình có 1 bức tờng, bức tờng vẫn xuất hiện liên tục trong 30 hình tiếp theo, mà không thay đổi (bức tờng đó không thay đổi trong vòng 1s) Thay vì mã hoá 30 lần liên tục trong 1s, nên thời gian chỉ gửi đi các thông tin dự đoán chuyển động giữa những frame hình, trong trờng hợp của bức tờng trong ví dụ trên, dự đoán chuyển động đợc đặt bằng 0
Có nhiều phơng thức khác nhau để nén 1 frame hình ví dụ nh với 1 frame hình có độ phức tạp cao thì cần phơng pháp nén có yếu tố nén theo không gian thấp bởi vì chỉ có một phần rất nhỏ các pixel đợc lặp lại Nếu tốc
độ bit có sự thay đổi lớn thì khó có thể truyền đi trong mạng IP, vì thế nhiều bộ
Trang 32mã hoá bao gồm cả chức năng đệm có thể điều khiển và quản lý tốc độ chung thì tại đó các bít đợc truyền đi tới tầng tiếp theo của hệ thống sản xuất video.
Bớc tiếp theo của quá trình nén MPEG là mã hoá các macro bock thành các slice Slice là một chuỗi ảnh đặt nằm ngang cạnh nhau từ trái qua phải Nhiều slice kết hợp với nhau tạo thành 1 hình Mỗi slice đợc mã hoá độc lập với nhau để hạn chế lỗi
2.1.2.2 Các ảnh trong chuẩn nén MPEG
Chuẩn nén MPEG định nghĩa 3 loại ảnh:
Intra-frame (I-frame), frame đợc mã hoá riêng biệt không phụ thuộc vào các frame trớc đó hoặc tiếp theo Mã hoá theo hệ thống đợc sử dụng gần giống nh nén JPEG Đây là frame độc lập và đợc sử dụng để tạo ra các loại frame khác
P - frame (porward predicted frame), khung dự đoán ảnh tiếp theo là khung dự đoán ảnh dựa trên các frame I trớc đó MPEG không thực sự mã hoá
ảnh mà chứa các thông tin về chuyển động cho phép IPTVCD có thể tái tạo lại các frame P-frame yêu cầu ít băng thông hơn I-frame, điều này là yếu tố quan trọng đối với mạng dựa trên IPTV
B-frame (Bi- directional predicted frame), frame dự đoán hớng: B - frame đợc tạo thành từ việc kết hợp các thông tin từ cả I-frame và P-frame Mã hoá B - frame thì tơng tự nh P - frame, ngoại trừ các véc tơ chuyển động phụ thuộc vào các vùng trong các khung tham khảo sau đó B-frame chiếm ít dung lợng hơn là I - frame và P - frame Vì thế dòng MPEG video gồm nhiều B - frame thì chiếm dung lợng thấp hơn so với dòng chứa I-frame và P-frame
3 loại ảnh trên kết hợp với nhau tạo thành 1 chuỗi các frame đợc gọi là nhóm ảnh (GOP) Mỗi nhóm ảnh bắt đầu bằng 1 frame I và có một số các frame B và P, mỗi nhóm ảnh MPEG có cấu trúc nh sau:
{I B B B P B B B P B B B P B B B P}
Trang 33Mỗi nhóm ảnh cần bắt đầu với 1 khung I, mặc dù kích thớc của mỗi nhóm ảnh là khác nhau, nhng trung bình mỗi nhóm ảnh trong IPTV có khoảng
12 đến 15 frame Mỗi cấu trúc của một nhóm ảnh thông thờng có thể đợc miêu tả bởi 2 thông số: N, số ảnh trong một nhóm và M, khoảng cách giữa các frrame Các nhóm ảnh đợc chia thành 2 loại: nhóm đóng và nhóm mở Với nhóm đóng, khung B cuối cùng không yêu cầu khung I đầu tiên cho nhóm ảnh tiếp theo để giải mã, trong khi với nhóm mở cần yêu cầu khung I cho nhóm
ảnh tiếp theo Các nhóm ảnh sau đó đợc kết hợp với nhau để tạo thành dòng video Mỗi dòng video bắt đầu biết một đoạn mã, sau đó là một header và kết thúc với một mã duy nhất
Trang 34Hình 2.1 Cấu trúc dòng MPEG videoThứ tự các khung đợc truyền đi trên mạng băng rộng thì khác với thứ tự các khung trong chuỗi bit đầu vào của bộ mã hoá Bởi vì bộ giải mã trong IPTVCD cần xử lý các frame I và P trớc khi tạo ra khung B Mối quan hệ tổng thể giữa các chuỗi ảnh, ảnh, các slice, các khối và các điểm ảnh đợc minh hoạ
ở hình trên
Mặc dù MPEG - 2 đợc sử dụng trong truyền hình cáp và vệ tinh, nhng MPEG - 2 có những hạn chế đối với các mạng có băng thông giới hạn Do đó một công nghệ nén mới với nhiều tính năng đã đợc phát triển trong những năm gần đây với mục đích truyền video qua mạng băng thông giới hạn MPEG - 4 part 10 đợc sử dụng trong hạ tầng mạng IPTV
2.1.3 MPEG - 4
Chuẩn MPEG - 4 thành công hơn so với chuẩn MPEG - 2 Thêm vào
đó, MPEG - 4 đa ra một hệ thống hoàn chỉnh với các đặc điểm hỗ trợ các định dạng dữ liệu MPEG - 4 bao gồm rất nhiều phần có thể thực hiện cùng nhau hoặc riêng biệt
Trang 35*Phần 5: Các phần mềm tham chiếu, đa ra một nhóm các phần mềm tham chiếu quan trọng, đợc sử dụng để triển khai MPEG-4 và phục vụ nh một
ví dụ demo về các bớc phải thực hiện khi triển khai;
*Phần 6: Khung chuẩn cung cấp truyền thông đa phơng tiện tích hợp DMIF (Delivery Multimedia Integration Framework), xác định một giao diện giữa các ứng dụng và mạng/lu trữ;
*Phần 7: Các đặc tính của một bộ mã hoá video tối u (bổ xung cho các phần tham chiếu, nhng không phải là các triển khai tối u cần thiết)
+Các phần mới bổ xung tiếp theo cho chuẩn MPEG - 4 sau này là:
*Phần 8: Giao vận (về nguyên tắc không đợc xác định trong chuẩn,
nh-ng phần 8 xác định cần ánh xạ nh thế nào các dònh-ng MPEG - 4 vào giao vận IP);
*Phần 9: Mô tả phần cứng tham chiếu (Reference Hardware Description);
*Phần 10: MPEG - 4 Advanced Video Coding/H.264 là thành tựu mới nhất về nén video, trên cơ sở đồng bộ với khả năng tính toán và dung lợng lớn hơn nhiều các phơng pháp trớc đó và có thể có thực hiện cả trong môi trờng phần mềm và phần cứng, do nhóm chuyên gia MPEG hợp tác với nhóm IUT Study Group phát triển và có nhiều khả năng sẽ trở thành chuẩn mã hoá video qui mô toàn cầu, duy nhất của ITU và ISO
*Phần 11: Mô tả khung hình (Scence Description) đợc tách ra từ phần 1;
*Phần 12 : Định dạng file truyền thông ISO (ISO Media File Format);
*Phần 13: Quản lý bản quyền nội dung IPMP (Intellectual Property Management and Protection Extension);
*Phần 14: định dạng file MP4 (trên cơ sở phần 12);
*Phần 15: Định dạng file AVC (cũng trên cơ sở phần 12);
*Phần 16: AFX (Animation Framwork eXtensions) và MuW (Multi – user World)
Trang 362.1.4 Công nghệ mã hoá video trong MPEG - 4
Chuẩn MPEG - 4 là mộ chuẩn động dễ thay đổi: Với MPEG - 4, các đối tợng khác nhau trong một khung hình có thể đợc mô tả, mã hoá và truyền đi một cách riêng biệt đến bộ giải mã trong các dòng cơ bản ES (Elementary Stream) khác nhau Cũng nhờ xác định, tách và xử lý riêng các đối tợng (nh nhạc nền, âm thanh xa gần, đồ vật, đối tợng ảnh video nh con ngời hay động vật, nền khung hình ), nên ng… ời sử dụng có thể loại bỏ riêng từng đối tợng khỏi khuôn hình Sự tổ hợp lại thành khung hình chỉ đợc thực hiện sau khi giải mã các đối tợng này
Các bộ phận chức năng chính trong các thiết bị MPEG - 4 bao gồm:
*Bộ mã hoá hình dạng ngoài Shape Coder dùng để nén đoạn thông tin, giúp xác định khu vực và đờng viền bao quanh đối tợng trong khung hình scense
*Bộ dự đoán và tổng hợp động để giảm thông tin d thừa theo thời gian
*Bộ mã hoá kết cấu mặt ngoài Texture coder dùng để xử lý dữ liệu bên trong và các dữ liệu còn lại sau khi đã bù chuyển động
Hình 2.2 là một ví dụ về mã hoá, tổng hợp khung hình video sử dụng trong MPEG - 4 Nhiều đối tợng nh ngời, xe ô tô, nhà cửa đ… ợc tách ra khỏi video đầu vào Mỗi đối tợng video VO (video object) và sau đó đợc truyền đi trên mạng Tại vị trí thu, những đối tợng này đợc giải mã riêng rẽ nhờ bộ giải mã VO và gửi đến bộ tổng hợp compositor Ngời sử dụng có thể kết tơng tác với thiết bị để cấu trúc lại khung hình gốc (a), hay để xử lý các đối tợng tạo ra một khung hình khác (b) Ngoài ra, ngời sử dụng có thể download các đối tợng khác từ các th viện cơ sở dữ liệu (có sẵn trên thiết bị hay từ xa thông qua mạng LAN, WAN hay Internet) để chèn thêm vào thay thế các đối tợng có trong khuôn hình gốc (c)
Cofects
Segmentation
of video object
Trang 38để có thể thực hiện việc tổ hợp khung hình, MPEG - 4 sử dụng một ngôn ngữ mô tả khung hình riêng, đợc gọi là định dạng nhị phân cho các khung hình BiFS (Binary Format for Scenes) BiFS không chỉ mô tả ở đâu và khi nào các đối tợng xuất hiện trong khung hình, nó cũng mô tả cách thức hoạt
động của đối tợng (làm cho đối tợng xoay tròn hay chồng mờ hai đối tợng lên nhau) và cả điều kiện hoạt động đối tợng và tạo cho MPEG - 4 có khả năng t-
ơng tác Trong MPEG - 4, tất cả các đối tợng có thể đợc mã hoá với sơ đồ mã hoá tối u riêng của nó video đợc mã hoá theo kiểu video, text đợc mã hoá theo kiểu text, các đồ hoạ đợc mã hoá theo kiểu đồ hoạ - thay vì việc xử lý tất cả các phần tử ảnh pixels nh là mã hoá video ảnh động Do các quá trình mã hoá
đã đợc tối u hoá cho từng loại dữ liệu thích hợp, nên chuẩn MPEG – 4 sẽ cho phép mã hoá với hiệu quả cao tín hiệu ảnh video, audio và cả các nội dung tổng hợp nh các bộ mặt và cơ thể hoạt hình
2.2 Sự ra đời của chuẩn H.264
Kể từ khi mới xuất hiện vào những năm 90, chuẩn nén video MPEG - 2
đã hoàn toàn thống lĩnh thế giới truyền thông Cũng trong thập kỷ này, chuẩn nén MPEG - 2 đã đợc cải tiến về nhiều mặt Giờ đây nó có tốc độ bit thấp hơn
và việc ứng dụng nó đợc mở rộng hơn nhờ có các kỹ thuật nh chuẩn đoán chuyển động, tiền xử lý, xử lý đối ngẫu và phân bổ tốc độ bit tuỳ theo tình huống thông qua ghép kênh thống kê
Tuy nhiên, chuẩn MPEG - 2 cũng không thể đợc phát triển một cách vô hạn định Thực tế hiện nay cho thấy chuẩn nén này đã đạt đến giới hạn ứng dụng của mình trong lĩnh vực truyền hình từ sản xuất tiền kỳ đến hậu kỳ và lu trữ video số Bên cạnh đó, nhu cầu nén Video lại đang ngày một tăng cao kèm theo sự phát triển mạnh mẽ của mạng IP mà tiêu biểu là mạng Internet Khối l-ợng nội dung mà các công ty truyền thông cũng nh các nhà cung cấp dịch vụ thông tin có thể mang lại ngày càng lớn, ngoài ra họ còn có thể cung cấp nhiều dịch vụ theo yêu cầu thông qua hệ thống cáp, vệ tinh và các hạ tầng viễn thông
Trang 39đặc biệt là mạng Internet Các tiêu chuẩn mã hoá Video ra đời và phát triển với mục tiêu cung cấp các phơng tiện cần thiết để tạo ra sự thống nhất giữa các hệ thống đợc thiết kế bởi những nhà sản xuất khác nhau đối với mọi loại ứng dụng Video Nhờ vậy thị trờng Video có điều kiện tăng trởng mạng Chính vì
lý do này nên những ngời sử dụng bộ giải mã cần có một chuẩn nén mới để đi tiếp chặng đờng mà MPEG - 2 đã bỏ dở
Hiệp hội viễn thông quốc tế (ITU) và tổ chức tiêu chuẩn quốc tế/ Uỷ ban kỹ thuật điện tử quốc tế (ISO/IEC) là hai tổ chức phát triển các tiêu chuẩn mã hoá Video Theo ITU - T, các tiêu chuẩn mã hoá video đợc coi là các khuyến nghị gọi tắt là chuẩn H.26x (H.261, H.262, H.263 và H.264) Với tiêu chuẩn ISO/IEC, chúng đợc gọi là MPEG - x (nh MPEG - 1, MPEG -2 và MPEG - 4)
đầu năm 1998, 2 tổ chức ITU - T và VCEG đã cùng đa ra một chuẩn nén mới H.26L nhằm tăng gấp đôi hiệu suất nén Do đó chuẩn nén này đã mở
ra nhiều ứng dụng mới nh truyền hình qua mạng Internet, truyền hình di động
và phát triển các ứng dụng hiện có
Cuối năm 2001, VCEG và MPEG đã thành lập JVT (Jiont Video Team)
có nhiệm vụ hoàn thành chuẩn nén mới và chính thức thông qua với tên gọi là MPEG - 4 Part 10 hoặc H.264/ AVC vào tháng 3 năm 2003
Những khuyến nghị của ITU đợc thiết kế dành cho các ứng dụng truyền thông video thời gian thực nh Video Conferencing hay điện thoại truyền hình Mặt khác, những tiêu chuẩn MPEG đợc thiết kế hớng tới mục tiêu lu trữ Video chẳng hạn nh trên đĩa DVD, quảng bá Video số trên mạng cáp, đờng truyền số DSL, truyền hình vệ tinh hay những ứng dụng truyền dòng Video trên mạng Internet hoặc thông qua mạng không dây (wireless) Với đối tợng để truyền dẫn Video là mạng Internet thì ứng cử viên hàng đầu chính là chuẩn nén MPEG - 4 AVC, còn đợc gọi là H.264, MPEG - 4 part 10, H.26L hoặc JVT
Trang 40nén cho phép các nhà cung cấp dịch vụ truyền các kênh hình và tiếng với chất lợng cao qua mạng IP băng rộng Do mắt ngời không thể phân biệt đ-
ợc toàn bộ các phần của hình ảnh Do đó việc nén sẽ làm giảm độ lớn của tín hiệu ban đầu bằng cách bỏ bớt các phần của hình ảnh
Mục tiêu chính của chuẩn nén H.264 đang phát triển nhằm cung cấp Video có chất lợng tốt hơn nhiều so với những chuẩn nén Video trớc đây Điều này có thể đạt đợc nhờ sự kế thừa các lợi điểm của các chuẩn nén Video trớc
đây Không chỉ thế, chuẩn nén H.264 còn kế thừa phần lớn lợi điểm của các tiêu chuẩn trớc đó là H.263 và MPEG - 4 bao gồm 4 đặc điểm chính nh:
*Phân chia mỗi hình ảnh thành các Block (bao gồm nhiều điểm ảnh),
do vậy quá trình xử lý từng ảnh có thể đợc tiếp cận tới mức block
*Khai thác triệt để sự d thừa về mặt không gian tồn tại giữa các hình
ảnh liên tiếp bởi một vài mã của những Block gốc thông qua dự đoán về không gian, phép biến đổi, quá trình lợng tử hoá và mã hoá Entropy (mã hoá có độ dài thay đổi VLC)
*Khai thác sự phụ thuộc tạm thời của các Block của các hình ảnh liên tiếp bởi vậy chỉ cần mã hoá những chi tiết thay đổi giữa các ảnh liên tiếp Việc này đợc thực hiện thông qua dự đoán và bù chuyển động Với bất kỳ Block nào cũng có thể đợc thực hiện từ một hoặc vài ảnh mã hoá trớc đó hay ảnh đ-
ợc mã hoá sau đó để quyết định véc tơ chuyển động, các véc tơ này đợc sử dụng trong bộ mã hoá và giải mã để dự đoán lại các loại block
*Khai thác tất cả sự d thừa về không gian còn lại trong ảnh bằng việc mã hoá các block d thừa Ví dụ nh sự khác biệt giữa block gốc và block dự
đoán sẽ đợc mã hoá thông qua quá trình biến đổi, lợng tử hoá và mã hoá entropy
2.2.1 Cơ chế của H.264
Với chuẩn nén H.264, mỗi ảnh đợc phân chia thành nhiều block, mỗi block tơng ứng với một số lợng nhất định các Macro block Ví dụ một hình