Nhu cầu sử dụng các dịch vụ đa phương tiện trên các thiết bị đầu cuối di động đã và đang bùng nổ trong những năm gần đây, điều này thúc đẩy việc nghiên cứu phát triển các hệ thống thông
Trang 1HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
-
Nguyễn Quốc Chính
NGHIÊN CỨU KHẢ NĂNG ỨNG DỤNG
MÃ HÓA VIDEO SVC/H.264 CHO TRUYỀN TẢI
VIDEO TRÊN HỆ THỐNG THÔNG TIN DI ĐỘNG LTE
Chuyên ngành: KỸ THUẬT ĐIỆN TỬ
Mã số: 60.52.70
TÓM TẮT LUẬN VĂN THẠC SĨ
HÀ NỘI – NĂM 2013
Trang 2Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: TS Nguyễn Thị Hằng Nga
Phản biện 1: ……….…………
Phản biện 2: ………
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công nghệ Bưu chính Viễn thông
Vào lúc: giờ ngày tháng năm
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
Trang 31
CHƯƠNG I: CƠ HỘI VÀ THÁCH THỨC KHI TRUYỀN
TẢI VIDEO TRÊN MẠNG 4G
Sự phát triển vượt bậc về công nghệ đã thúc đẩy xu hướng hội tụ công nghệ cố định và di động, dịch vụ viễn thông và công nghệ thông tin, tích hợp các thiết bị đầu cuối trở thành hiện thực Nhu cầu sử dụng các dịch vụ đa phương tiện trên các thiết
bị đầu cuối di động đã và đang bùng nổ trong những năm gần đây, điều này thúc đẩy việc nghiên cứu phát triển các hệ thống thông tin di động tế bào băng rộng như : LTE, WiMAX,…Trong đó, công nghệ LTE được các nhà khai thác di động ở Việt Nam (Viettel, VNPT,…) khá quan tâm và đã triển khai thử nghiệm do khả năng tương thích ngược với các hệ thống di động hiện có GSM và WCDMA/UMTS
Có rất nhiều nghiên cứu xảy ra trong truyền video trực tuyến (streaming video) không dây từ góc độ khác nhau Hiện nay, bộ mã hóa H.264/AVC được sử dụng cho các dịch vụ video di động khác nhau Tuy nhiên, xét tính chất không đồng nhất của màn hình hiển thị, khả năng tính toán khác nhau của thiết bị di động, và các điều kiện mạng không đồng nhất, SVC mở rộng của H.264 là một cách tiếp cận đầy hứa hẹn để cung cấp những nội dung khả năng điều chỉnh cho các ứng dụng di động trong tương lai
1.1 Các công nghệ không dây thế hệ thứ 4
1.2 LTE và OFDMA
Mạng LTE bao gồm mạng truy nhập và mạng lõi, được biết đến như mạng truy cập vô tuyến mặt đất UMTS phát triển (E-UTRAN) và lõi gói phát triển (Evolved Packet Core - EPC
Hệ thống truy nhập vô tuyến mặt đất UMTS phát triển (E-UTRA) của LTE
sử dụng OFDMA cho đường xuống và FDMA sóng mang đơn (SCFDMA) cho đường lên
Trang 42
1.3 Các giao thức trên giao diện vô tuyến LTE
1.4 Phân phối video qua mạng LTE
Hình 1.5 Phân phối video thời gian thực qua mạng LTE 1.5 Chất lượng kênh trong mạng LTE
1.6 Thách thức khi truyền tải video qua mạng LTE
1.6.1 Truyền dẫn lại không mong muốn
1.6.2 Băng thông thay đổi
1.6.3 Đặc tính người dùng và thiết bị đầu cuối không đồng nhất
1.7 Kết luận
Từ một số nội dung được trình bày trong chương về tổng quan mạng di động 4G LTE, phương thức truyền tải video qua mạng LTE và khó khăn thách thức khi truyền tải video H.264 qua mạng không dây, giúp ta thấy được bức tranh tổng quan
và những vấn đề cần quan tâm khi truyền tải video qua mạng LTE Hiện nay, có một số phương pháp đã được đề xuất để cải thiện truyền video trực tuyến qua mạng không dây Người ta phân loại các phương pháp tiếp cận dựa trên các ngăn xếp giao thức mạng mà chúng làm việc trên đó và thiết kế hệ thống trên chip (SoC) Các ngăn xếp giao thức liên quan là lớp ứng dụng, lớp vận chuyển, lớp mạng và cross-layer (ví dụ, các cơ chế được thiết kế liên quan đến các hoạt động từ nhiều
Trang 53
ngăn xếp giao thức) Những vấn đề thiết kế chính nhằm:
(1) Nâng cao khả năng thiết bị đầu cuối của người sử dụng điện thoại di động;
(2) Tối giảm tác động tổng thể của việc rớt khung trong mạng không dây; (3) Nâng cao hiệu quả truyền tải và sử dụng tài nguyên cho việc phân phối video trực tuyến
Trong lớp ứng dụng, vấn đề chính là hiệu quả mã hóa của bộ codec đó Mã hóa video có khả năng điều chỉnh (Scalable Video Coding - SVC) đã được đề xuất
để cung cấp khả năng điều chỉnh của mã hóa video Trong lớp truyền tải, khả năng phục hồi lỗi bit là một kỹ thuật chỉnh sửa và truyền các gói với lỗi bít tới các lớp cao hơn thay vì loại bỏ chúng Đối với các lớp mạng, các vấn đề chính là tạo ra tuyến truyền tải video, lựa chọn nút chuyển tiếp và cấp phát tài nguyên để phân phối các dòng H.264/AVC cho các nhóm người sử dụng trong mạng chuyển tiếp với nguồn lực tối thiểu hoặc để phục vụ người dùng tối đa với một quỹ tài nguyên hạn chế Trong thiết kế cross-layer, thông tin từ lớp ứng dụng, lớp MAC và lớp vật
lý được cùng xem xét để cải thiện hiệu quả phân phối video qua mạng Cuối cùng, khả năng thiết bị đầu cuối cũng là một vấn đề quan trọng trong thông tin liên lạc không dây vì giải mã video đòi hỏi khả năng tính toán mạnh mẽ Kiến trúc phần cứng nâng cao của thiết kế SoC được đề xuất với công nghệ VLSI để tăng cường phân phối video đến người dùng cuối
Với khuôn khổ hạn hẹp của luận văn này, tôi đi vào nghiên cứu về chuẩn mã hóa video H.264/SVC và tìm hiểu được ưu điểm của phương pháp mã hóa này để truyền video qua mạng di động 4G LTE Từ đó, đề xuất áp dụng khi triển khai 4G tại Việt Nam
Trang 64
CHƯƠNG II: TÌNH HÌNH TIÊU CHUẨN MÃ HÓA
VIDEO TIÊN TIẾN 2.1 Kỹ thuật nén video số
2.1.1 Khái niệm
2.1.2 Mô hình nén ảnh
2.2 Các đặc điểm của nén tín hiệu số
2.2.1 Xác định hiệu quả của quá trình nén ảnh số
2.2.2 Độ dư thừa số liệu
2.2.3 Sai lệch bình phương trung bình
H.264/MPEG-4 Part 10 hoặc AVC/H.264 (AVC - Advanced Video Coding)
là một tiêu chuẩn cho nén video, và hiện nay là một trong các định dạng được sử dụng phổ biến nhất được sử dụng để ghi, nén và phân phối video độ nét cao Công việc soạn thảo cuối cùng về phiên bản đầu tiên của tiêu chuẩn này được hoàn thành tháng 5 năm 2003
H.264/MPEG-4 AVC được phát triển bởi nhóm các chuyên gia mã hóa video ITU-T cùng với nhóm các chuyên gia hình ảnh chuyển động MPEG của ISO / IEC JTC1
Trang 7AVC/H.264 có 10 profiles không có khả năng điều chỉnh, 04 profiles chỉ có các khung I, 02 profiles multiview (đa hình ảnh) và 05 profiles có khả năng điều chỉnh
2.8 Ưu điểm của chuẩn nén H.264/AVC
Có lẽ lợi thế lớn nhất của H.264 hơn tiêu chuẩn trước đó là hiệu quả nén của
nó So sánh với các tiêu chuẩn như MPEG-2 và MPEG-4 Visual, H.264 có thể cung cấp:
Chất lượng hình ảnh tốt hơn ở cùng một bitrate nén, hoặc một bitrate nén thấp hơn cho cùng một chất lượng hình ảnh
2.9 Tổng kết
Nén video tiên tiến H.264/AVC là một tiêu chuẩn công nghiệp cho mã hóa video mà nó định nghĩa một định dạng hoặc cú pháp nén video và một phương pháp giải mã cú pháp này Nó cung cấp một tập hợp các công cụ hoặc các thuật toán có thể được sử dụng để cung cấp nén video hiệu quả, linh hoạt và mạnh mẽ cho một phạm vi rộng các ứng dụng, từ các ứng dụng có độ phức tạp thấp, các ứng dụng video di động bitrare thấp tới các dịch vụ truyền hình quảng bá độ nét cao
2.10 Tiêu chuẩn mã hóa SVC
Sự phát triển của mã hóa video có khả năng điều chỉnh (Scalable Video Coding - SVC) mở rộng cho H.264, chuẩn hóa theo tiêu chuẩn H.264/SVC SVC hỗ trợ mã hóa cho video theo một cách mà nhiều phiên bản của các tín hiệu video có
Trang 86
thể được giải mã ở một loạt các bitrate, độ phân giải không gian và / hoặc độ phân giải thời gian và tốc độ khung hình có hiệu quả Bằng cách kết hợp nhiều phiên bản
mã hóa, nó có thể được phân phối theo cách hiệu quả hơn so với phương án mã hóa
và truyền mỗi phiên bản riêng biệt
H.264/SVC được đưa ra trong Phụ lục G của H.264/AVC và H.264/SVC có
05 profiles trong tổng số 21 profiles của AVC
2.10.1 Truyền tải Simucast (Simucast transmission)
2.10.2 Truyền tải có khả năng điều chỉnh (Scalable transmission)
Hình 2.14 Các luồng có khả năng điều chỉnh
2.10.3 Ứng dụng của mã hóa video có khả năng điều chỉnh
SVC đã được đề xuất cho một số kịch bản ứng dụng
Nhiều bộ giải mã:
Suy giảm nhẹ hoặc tăng cường (Graceful degradation / enhancement)
Lưu trữ
2.10.4 Mã hóa video có khả năng điều chỉnh trong H.264
Mã hóa video có khả năng điều chỉnh (Scalable Video Coding - SVC) được đưa ra trong Phụ lục G của các phiên bản gần đây của tiêu chuẩn H.264/AVC và điều chỉnh khả năng của các tiêu chuẩn ban đầu Một phần mềm thực hiện, mô hình video có khả năng điều chỉnh (the Joint Scalable Video Model), JSVM, hiện có sẵn
để tải về và trải nghiệm
H.264 SVC hỗ trợ ba loại hoặc lớp chính cho khả năng điều chỉnh (hình 2.15):
Trang 97
1 Khả năng điều chỉnh thời gian: Lớp cơ bản được mã hoá ở độ phân giải
thời gian thấp hoặc tốc độ khung hình thấp, các lớp tăng cường thêm vào làm tăng tốc độ khung hình của trình tự giải mã
2 Khả năng điều chỉnh không gian: Các lớp cơ bản được mã hoá ở độ
phân giải không gian thấp, các lớp tăng cường thêm vào làm tăng độ phân giải không gian của chuỗi được giải mã
3 Khả năng điều chỉnh chất lượng: Các lớp cơ bản được mã hoá tại một
chất lượng hình ảnh thấp bằng cách sử dụng một QP cao, các lớp tăng cường thêm vào làm tăng chất lượng hình ảnh của chuỗi được giải mã
Hình 2.15 Tổng quan các loại khả năng điều chỉnh
2.10.5 Khả năng điều chỉnh thời gian
2.10.6 Khả năng điều chỉnh chất lượng
2.10.7 Khả năng điều chỉnh không gian
2.10.7.1 Tổng quan về khả năng điều chỉnh không gian
2.10.7.2 Chi tiết khả năng điều chỉnh không gian
Trang 108
2.10.8 Chi tiết khả năng điều chỉnh chất lượng
2.10.9 Kết hợp các khả năng điều chỉnh (Combined scalability)
2.11.Kết luận
Sự khác biệt cơ bản giữa SVC và AVC là việc mã hóa các tín hiệu video được thực hiện như là một tập các lớp Các lớp khác nhau phụ thuộc vào nhau, tạo thành một hệ thống phân cấp Một lớp đặc biệt, cùng với các lớp mà nó phụ thuộc vào cung cấp các thông tin cần thiết để giải mã tín hiệu video ở một độ trung thực
cụ thể (particular fidelity) Độ trung thực ở đây liên quan đến một hoặc nhiều độ phân giải không gian, độ phân giải thời gian, hoặc tỉ lệ tín hiệu trên nhiễu (SNR) Các lớp thấp nhất, tức là, lớp mà không phụ thuộc vào bất kỳ lớp nào khác, được gọi là lớp cơ sở và cung cấp các mức chất lượng thấp nhất Mỗi lớp bổ sung cải thiện chất lượng của tín hiệu trong bất kỳ một trong ba chiều (không gian, thời gian, hoặc SNR)
Theo thiết kế, một khía cạnh rất quan trọng của SVC là lớp cơ sở phù hợp với AVC Nói cách khác, lớp cơ sở của một tín hiệu SVC được giải mã bởi một bộ giải mã AVC Điều này đảm bảo một tín hiệu SVC là tương thích ngược với AVC, mặc dù ở mức thấp hơn của độ trung thực so với tín hiệu đầy đủ nếu có liên quan đến nhiều hơn một lớp Lưu ý rằng một bộ mã hóa SVC không cần phải luôn luôn tạo ra các luồng bít được mã hóa theo lớp - nếu nó hoạt động trong một môi trường
mà không cần thiết hoặc không yêu cầu phải có khả năng điều chỉnh thì nó có thể tạo ra các luồng bít AVC truyền thống
Trang 119
CHƯƠNG III: NGHIÊN CỨU ỨNG DỤNG SVC/H.264 VÀO CUNG CẤP VIDEO TRÊN LTE VÀ ĐỀ XUẤT TRIỂN
KHAI
Trái ngược với mạng hữu tuyến, trong đó QoS có thể được đảm bảo bằng tối
ưu hóa độc lập tại mỗi lớp trong các kết nối mô hình hệ thống mở (OSI), trong các mạng không dây có một kết nối mạnh mẽ giữa các lớp mà làm cho cách tiếp cận theo lớp không hiệu quả [37] Vì lý do này, thiết kế cross-layer là cần thiết để tối ưu hóa việc sử dụng các phương tiện không dây và cung cấp QoS chấp nhận được cho người sử dụng không dây Cross-layer tối ưu hóa phân phối video qua mạng LTE được thảo luận bởi các tác giả [19] Khả năng điều chỉnh được cung cấp bởi video SVC và thiết kế cross-layer cung cấp lựa chọn hấp dẫn cho việc thực hiện các thuật toán truyền video trực tuyến thích ứng Đặc biệt, nó rất hữu ích để đạt được các thích ứng trong lớp MAC và lớp ứng dụng bằng cách sử dụng kênh thông tin chất lượng từ lớp vật lý
Rất nhiều nghiên cứu đã được thực hiện trên truyền tải video dựa trên SVC qua các mạng truy cập không dây, bao gồm cả LTE Chất lượng kênh của người dùng cá nhân có sẵn trong lớp MAC của eNodeB dưới hình thức phản hồi chỉ số chất lượng kênh (CQI) Một số sơ đồ lập biểu miền tần số MAC LTE được trình bày trong tài liệu sử dụng những thông tin phản hồi cho lập biểu phụ thuộc kênh Chủ động loại bỏ các khung hình video trong lớp MAC của mạng WiMAX dựa trên thông tin trạng thái kênh (CSI – Channel State Information) được thảo luận trong [25] Lập biểu hoặc thích ứng gói trong lớp MAC của trạm gốc được sử dụng bởi hầu hết các công việc hiện có trong tài liệu Một khung báo hiệu cross-layer cho một thích ứng video có khả năng điều chỉnh động trong dung lượng mạng hay thay đổi (varying) được trình bày trong [13] Các tác giả so sánh thích ứng gói nhanh lớp MAC với thích ứng dài hạn (long-term) và tương đối chậm trong lớp ứng dụng bằng cách sử dụng một đoạn video H.264/SVC thực Các tác giả kết luận rằng việc làm rớt (dropping) các gói dữ liệu trong máy chủ video là một giải pháp hiệu quả hơn
Trang 1210
lớp MAC làm rớt trong trạm cơ gốc để giảm nghẽn trong cả hai môi trường có dây trong mạng lõi và môi trường không dây tới UE Hầu hết các tài liệu hiện có thảo luận về khả năng thích nghi xảy ra trong lớp MAC của trạm gốc Tuy nhiên, làm rớt các gói tin trong eNodeB không phải là một giải pháp chung cho nghẽn trong môi trường không dây và các tuyến truyền dẫn trong một hệ thống LTE Các gói tin bị rớt trong eNodeB là sự lãng phí tài nguyên trong backhaul LTE và mạng lõi Rớt các khung hình video trong lớp truyền tải thời gian thực (RTP) của máy chủ video làm giảm sự tắc nghẽn trong cả eNodeB và tuyến backhaul
SVC là đặc biệt thích hợp cho multicast bởi vì nó tạo điều kiện cho việc cung cấp các dòng phương tiện truyền thông (streaming media) tới một tập hợp các máy thu với dung lượng kênh không đồng nhất Khi một dòng video không khả năng điều chỉnh cần phải được phân phối đến tất cả người dùng trong một nhóm multicast, nó phải được truyền tại tốc độ của người sử dụng kém nhất (weakest) trong nhóm
Multicast/Broadcast đóng một vai trò rất quan trọng trong các dịch vụ giải trí và các ứng dụng Trong chế độ điểm - đa điểm của MBMS, một nhóm các thuê bao MBMS dùng một kênh chung Chúng chia sẻ tài nguyên thời gian và tần số giống nhau cũng như sơ đồ điều chế và mã hóa giống nhau (MCS) Điều này nhấn mạnh rằng để thực hiện đầy đủ các yêu cầu QoS, MCS đã được điều chỉnh tới thiết
bị đầu cuối yếu nhất của một nhóm thuê bao Vì vậy, thích ứng với các sơ đồ MCS tới các thiết bị đầu cuối yếu nhất là rất quan trọng để đáp ứng người sử dụng ở cạnh
tế bào SVC cung cấp một lựa chọn hấp dẫn cho việc gửi cùng một đoạn video trong nhiều lớp như lớp cơ sở và các lớp nâng cao Tiếp nhận các lớp cơ sở là đủ cho chất lượng cơ bản của video, và lớp tăng cường thêm vào để cung cấp chất lượng video nâng cao Điều này có thể được sử dụng trong dịch vụ MBMS cell đơn (single-cell MBMS) để cung cấp chất lượng cơ bản cho người sử dụng ở cạnh tế bào hoặc người sử dụng có chất lượng kênh thấp và để cung cấp video chất lượng cao cho người sử dụng chất lượng kênh cao Trong đặc tả kỹ thuật 3GPP phiên bản 8, truyền dẫn MBMS được phân loại thành truyền dẫn cell đơn và truyền dẫn mạng tần số
Trang 133.1.1 Triển khai các dịch vụ MBMS trong LTE
Có thể có hai loại truyền dữ liệu MBMS trong LTE
• Truyền tải đơn cell
• Truyền tải đa cell
3.1.2 MBMS trên mạng tần số đơn
3.1.3 MBSFN trong LTE
Hình 3.1: Kiến trúc hệ thống MBSFN LTE 3.2 Truyền video trực tuyến qua mạng không dây
3.2.1 Sự tăng cường của các giao thức truy nhập vô tuyến LTE cho truyền video trực tuyến hiệu quả
Để cung cấp đường truyền tin cậy trên các kênh không dây, hệ thống LTE hỗ trợ hai sơ đồ: ARQ (Automatic Repeat reQuest – Yêu cầu phát lại tự động) và HARQ (Hybrid Automatic Repeat reQuest – Yêu cầu phát lại tự động lai ghép) Cả