Các yên câu kỹ thuật của các chuẩn nén trong video sireaming + Bảng thông ĐỂ thm dược chất lượng chấp nhàn được theo cảm giác, một úmạ đụng etreamine điển hình cần có yêu câu hăng thông
Trang 11
MỞ ĐẦU Với sự phát triển nhanh chóng cũa mạng, Internet bằng rộng làm thay đỗi cả về nội đụng va Id thuật truyền hình Hiện nay truyền hình:
có nhiều dạng khác nhau truyền hình số, truyền hình vệ tinh, truyền
nh cáp, truyền hình Internet và IPTV IPTV đang là cấp độ cao nhất
và là công nghệ truyền hình của tương lai
VÌ dữ liện video thé chiếm một lượng lớn bang thông riễn thường
sử dựng nén để (hu được hiệu quả Iruyễn dẫn Nén cho phép các nhà cũng cấp dịch vụ H*TV quảng bá các kênh vidco và gui chất lượng cao gua một mang IP băng rộng, Chuẩn nén viđeo MPEG-4 Part
10/H.2á4 là một trong nhiing dinh dang hay được zử dụng nhất hiện nay để phi, nén, phân phối viđeo độ nét cao với nhiều ting đựng rộng rãi lừ các ứng, đụng viđea streaming qua Imtermet tốc độ bịt thấp tới quảng bá HIYTV Chuân MPEG-4 Part 10/H.264 kế thừa các ưu điểm của các chuẩn nén trước đó như MPEG-2, MPEG-I, nhưng MPEG-
4 Part 10/H.264 có hiệu suất nén tốt hơn và linh hoạt hơn trong việc umn trữ và truyền đẫn
Với đề tài:" Nghiên cửu img đụng của chẩn nén MPEG-4 Part 1811.264 kết hợp với video streaming", Infn van cia em gồm 3
Trang 2CHƯƠNG 1 - TÔNG QUAN VE CAC CHUAN NEN
‘TRONG VIDEO STREAMING
1.1 Giới thiện
Co 2 mồ hình truyễn dẫn video hm trữ trên mạng, Internet đó là chế độ download và ché 46 streaming, Vadeo streaming có các yên
iên, ruạng Irirmnel nỗ
lực tôi đa hiện nay không cung cấp bắt kỳ đâm bảo vé Qos
‘Wén video lam gidm s6 bit đùng, để biểu điễn từng, pixel trong ảnh
Các thuật toán nên ảnh ginh ra các tạp nhiền (atfifact} nhỉn thấy được
ắNến luôn là sự được -mắt giffs mức anithact và băng thông,
1.2 Các yên câu kỹ thuật của các chuẩn nén trong video
sireaming
+ Bảng thông ĐỂ thm dược chất lượng chấp nhàn được theo cảm giác, một úmạ đụng etreamine điển hình cần có yêu câu hăng thông tôi thiêu
© Tré: Streaming video yêu cẩu trễ ertd-to-end piới hạn đế gôi cỏ thể rồi phía thu đúng túc để giãi mã và hiển thị
+ Mất gửi: Mắt gỏi là không thể tránh dược trên Internet
Do dé, mong muốn một video stream mạnh trảnh mắt gởi
+ Chức năng như video-cassctte-recoder (VCR): Một số img dung streamine yêu cấu các chức năng giỏng như VCR như là
đứng, tạm đừng/riếp tục lại
« Độ phức tạp giải mã hóa: Một số thiết bị như điện thoại
đi động, thiết bị số cả nhân (PDA) yêu cảu tốn it năng lượng Do đó,
yêu cân độ phức tạp giải mã hóa thấp
1.3 Các chuẩn nén trong video streaming
1.8.1 Cơ xử nén
"Một video clip là một chuỗi các ảnh hoặc khung Tửng ảnh có thể được xử lý riêng biết như là mội ảnh tĩnh Một ví dụ điển hình là
chuan JPEG
** Nên trong khung
ến một ảnh dơn trong miễn không gian được gọi là nén trang Xung,
Trang 3
sự thay đổi nhỏ từ một ảnh: này tới ảnh Liệp theo, ngoại trừ một số thay đổi cảnh Nén thec thời gian hoặc liên Khrung loại bỏ dư thừa giữa các khung liên tiếp nhau
'Vñng mạc và võ nãa củng nhan xử lý cảnh nhìn thấy theo cách phat hiện các biên và các đường Một kiến trie nén tốt l4 nhái tận dụng được cơ chế của thị giác
1.3.2 Các thuật t0án nón
C6 4 loại đư thừa chỉnh trong tin hiện viđeo là: Không gian, thời
gian, giác quan, thông kê,
+ Ma héa trong khung hay nén không gian
Mã tỏa tiền đổi, trong đó một tlock của các pixel được biến đổi
sang xiễn tần số, sau đó lượng tử hỏa và nã hóa entropy
Mũ hóa biển đi
'Mã hóa biên đối chuyển đổi mắng không pian của các trixel hloek, một bản đồ bit sang miền tân số Hiển đối cosin rời rạc DCT được
thông qua rộng rất cho video codec Mội số biển đổi khác được nghiên cứu là ĐFT, KLT và WHT
Nén wavelet
Củng cấp sự biểu điễn lại thời gian-tân số của ảnh và có thế thu
được cimg chất lượng ánh ntT3CT ở tí số nén cao hơm nhiễn
"Trang những ảnh nhất định, các phản cúa ảnh trơng đẳng với các
thân khác của củng một ảnh Các phần giống nhan cửa ảnh được định
vị và sau đó áp dụng thuật toán clủa nhỏ
Mũ hóa dựa trên di trong
Mã hỏa đối tượng được thông, gua là cơ sở cho mã hỏa MPEG-4 Mặt cảnh được biến điễn lai bing mét #6 déi tong video Mai déi
Trang 44
tượng được miêu rả bởi hình đạng, kết câu và đi chuyển Thật toán như ĐCI và wavelet có thể được sử dụng để nén các đối lượng,
Ma héa entropy
‘Mi hda entropy cé thể mang lại biểu điễn ãnh ngắn hơn nhiều với
‘ping cach stt dụng, các từ mã ngắn hơn cho các chmỗi tt có khả năng,
‘han va tir md dai hem cho các chuỗi it Kha ning hon
Tiiến đỗi cosin rời rac
Biển đối này là cơ sở cho tất cả các codec video phổ biến Ảnh được chủa thành các tiock thông thường và sau đó mỗi block biến đổi thành biock hệ số tiến đối Các hệ số được chuẩn hóa và lượng từ tỏa
© Ma héa dp dai thay dai (VLC)
Tiằng cách quét các hệ số thea đường zigzag thị kết quả đần chạy
tới 0 Các hệ số sau đó được chuyển đổi thành một chuỗi các tãi cường độ chạy Các tệ số cường độ chạy này sau đỏ được mã hỏa với
từ mã độ dài thay đối
Ni liên kung hay nén theo thoi gian
Cở sở của loại nén này là chỉ phát sự sai khác giữa các khung
‘Haw hét sự sai khác giữa rác klunng là từ đối tượng chuyển động,
© Vor link chuyển động
ĐỂ tạo ra vector chuyển động, hộ mã hóa phải ước tỉnh chuyển đông của các phân tử ảnh Dự đoản chuyển động so sánh một khung trước đỏ với khung hiện lại, và san đỏ mróc tính bao nhiều block cúa
Anh đã đi chuyển
13.3 Cac 66 codec nén
1) H.261 - hội nghi video
Tây lá chuẩn mã hóa video dau tiến và là khởi đân cho chuẩn
MPRG-1 11.261 cho điện thoại video và hội nghị viđea qua đường
ISDN Chuẩn định nga kích thước màn hnh là định dạng trưng
trình chưng (CIE) 352 x 288 và Quarter Clt 176 x 144 pixel, sử dựng,
quét tiên lên và lây mẫu 4:2:0 Tốc độ đữ liệu tử 64 kh/s tới 2 Mb/s
được chuẩn hỗ trợ Nén dựa trên DCT với mã hóa độ dai thay đổi
3) MPEG-I
Trang 55
Độ phân giải tháng thường là nguễn hoặc định đạng đần vào
chuẩn (SII) Độ phân giải không gian khác nhau : 352 x 288 ở 25 fps cho PAL và 351 x 240 ở 30 [ps cho NTSC Chuẩn này sử dụng quél tiến lên Nẻn video giêng như H.261 sử đụng DCT với mã độ đài thay đối
“Chuẩn này được thiết kế cho các ứng đựng lmi trữ như CD-ROM,
tốc độ đữ liệu lên tới 1.5 Mi/e và không hễ trợ streamng
3) 1.263 1H.263 là sự phát triển của H.261 hướng tới các ứng đụng Lốc độ bịt thấp, có từ năm 1992 Chuẩn H.263 hỗ trợ độ phân giải SQCTE, QCK, CIF, 4CIF, 16 CIF H.263 hién nay là chuẩn cơ sở cho mã hóa video tự nhiên MPEG-4
4) MPEG-2 Một hệ thông độ phân giải cao hơn, chối lượng cao cho truyền thui quảng bá, MPEG-2 đành để thay thế cho lệ thống tổng hợp
tương tự (NTSC, PAL) bằng hệ thỏng truyễn đẫn số mã hóa DVD
TỪng dụng chỉnh sứ đụng, băng thông kênh lớn hơn 4 Mb/e ProRile chỉnh ở mức chính (MP(ÿML,) là †V độ nét chuẩn với tốc độ đử liệu
lên lới 15 Mb/s, Chuẩn này dành để hỗ Irợ tốc độ bịt UV độ nét cao
(đến tới 80 Mb/s) và mét profile studio chi co khung I (SO Mbis)
5) MPEG
MPEG-~4 14 hé thang MPEG dau tién ma ha tro streaming 14 mét phân cúa chuẩn MPEG-1 phiên bản 1 hỗ trợ: Tốc độ bịt điển hình rừ
5 kb/s tới 10 Mb/s; định dạng quét: viđeo trộn lấn hoặc lũy tiến Độ
phân giải: điển hình từ sub-QClE tới (rên HĐTV
MPEG-4 không dùng bản đỗ bịt 2 chiều và vuông góc như các chuẩn mã hỏa trước đó mà thông, qua ruã hóa đối trong
6) AVC (Advanced Video Codec, H.264)
Nhom video két hop (IVT - Joint Video Team) được thành lập đế phat trién video codec tién tién hay AVC Nó được gợi là H.264 bởi
T?U và MPEG-4 ban 10 bởi tổ chức MPEG
** Các chuẩn MIPEG khác
MPEG-7
Trang 66
Đây là hệ thống được chndn hoa để mô tả nội đưng âm thanh-
rink ánh Điều này chơ phép tìm kiếm nhanh và hiệu quá và
âm thanh có thể được trình bảy rong các trừu tượng: bố cục, mồ Li văn bản của nội đưng, màu sắc
MPEG-21 MPRG-21 là một framework cho cic tai nguyên đa phương tiên tích hợp qua một đái rộng các nền tăng và địch vụ Streaming media
là một phần quan trọng của lzanework nảy Một lrợng Làn của
MPEG-21 là bản nội dung, Chia khóa là quản lý sở hữu trí tuệ
+ Chuẩn VC-L
'V(-1 là viết tắt của Video Codec i, được chuẩn hỏa bởi cộng
đồng k¥ sw trayén hình và ảnh động SMPTE Chuẩn được phát hành
vào 2006 Một rong những triển khai profile can nhất được thông,
qua bởi nên Lắng xnã hóa đa phương liện WMV 9 của Microsoft Mộ
số đặc điểm của VC-L như sau,
« _ Triển khai qua một dải rộng nền tảng,
+ _ Hỗ trợ 3 profile ring bit: simple, main, advanced
© Hỗtrợ ASF để cấu trúc đòng IPTV
«- Hỗ ượ một đải kích thước tuck
« T.oại khung bố sung:VŒ-I đưa ra một loại khung mới l4 BT
+ Hoạt động qna một đãi rộng các cộng nghệ truyền tải mạng
1.4 Kết luận
Chương 1 trình bày yêu cầu kỹ thuật của nén video trong video streaming, cơ sở của nén video và một số chuẩn nén phổ biển Các công nghề nén khác nhau được phát triển cho các mục đích khác nhau Dêi với ứng đụng video streaming, b video cođec phải đảm
bản được các yên cân về băng thông, độ trễ, mắt nói, độ phức tp
Trang 7Chương 2 - CHUAN NEN VIDEO MPEG VA MPEG-
4 PART 10/ 11.264
2.1 Giới thiện
'MPRG là nhóm chuyên gia vẻ hình ánh, được thánh lập vào năm
198 với nhiệm vụ xây dựng liều chuẩn cho tín hiệu audio và video
số, Ngày nay, MPEG đã Hở thành xuột kỹ thuật nên audio va video
phổ biển nhất, tây thuộc vào yêu cầu cụ thể côa từng thiết bị sẽ có một tiêu chuẩn thích hợp nhưng vẫn trên một nguyên lý thông nhất
2.2 Mã húa và giải mã MPEG
3.21 CẤu trúc déng bit video MPEG
mm [sa] - | 1 |
Video Bitstream | QT», Params Par:
fats | aye Mstion | Queue cop vo | | es
Limb 2.1: Can truc dong bit video MPEG:
3.3.2 Nguyên bl) nén MPEG
‘Nén MPEG chía một chuỗi video thành các nhóm ảnh Từng ảnh trong nhóm sẽ được chia thành các slice macroblock Mét macroblock bao gém4 block 49 chéi và 1 block U va V,
‘MPEG dinh nghia 3 loại khung trong nhóm: khung ï (Tniraframe}, +imng dự đoán hay kimng P, khung hai hưởng hay khumg B
Cơ sở của công nghệ nén MPEG là kết hop nén trong khung
(imtra-frame) và nén liên khung (inter-ftame)
Trang 8kh
“Điêu khiển tốc độ
ng từ đr Tượng lừ| tengs> „— MRHdg Be
với ảnh trước tạo ra ảnh sai khác Ảnh này san đó được nén trong ảnh:
qma các hước: biến đối DCT, lượng tứ hỏa, mã hóa DÉ liệu của ảnh
sai khác và vector chuyển động mang thông tin về ảnh san nén liên
+khung được đưa tới bộ độn đầu ra
3.2.3 Nguyên ly gidi nén MPEG
ut va thà» | Qloàngiò| | por [arate iad -
Ergany hóa - | [mượn xe
— erry
Trang 99
ảnh sẽ được giải lượng hit hoa và biến đổi DCT ngược Nên ảnh là
ảnh loại L bái đâu ở môi nhóm ảnh: trưng chuối, ở đầu ra sẽ nhận được
ảnh hoàn chỉnh bằng cách trên Nếu ảnh là ảnh loại P (hì cũng thực
hiện giải lượng tử hóa và biễn đổi DCT ngược kết hợp với việc sử
dung vector chuyển đông và lưu vào bộ nhớ ảnh trước Ta nhận được
ảnh sau khi công đự đán ảnh và kết quả biển đổi DCT ngược
2.3 Chuan nén MPEG-4
‘Vio thing 10 nm 1998, MPEG-4 đã ra đời, với tốc độ mã hóa
khoảng 1.5 Mb/s, chuan nén MPEG-1 đã giải quyết phản nảo vẫn đề
tắc nghẽn mạng, và sự hạn chế về băng thông MPTIG-4 bao gêm các
bộ phân riêng rẽ, có quan hệ chặt chế với nhau thể được triển
khu ứng dụng riêng hoặc tổ hợp với các phần khác,
2.3.1 Céng nghé ma hda va gidi ma video rong MPEG-4
Hình 2.4: Cần trúc bộ mã hóa và giải mã MPEC-4
‘Voi MPEG-4, cac đối tượng khác nhau trong một khung bình có
thể được 1uổ tả, muã hóa và truyền đi một cách riêng biệt đến bộ giái
mã trong các động cơ bản E8 khác nhan
- Mã hỏa hình đạng: đừng để nén đoạn thông tỉ, giúp xác
định khu vục và đường viên bao quanh đối tượng trang khưng hình
-_ A48 hóa kếL cấu: kết cấu của một đối lượng vidco Lhường
được mã hóa bằng DCT Có thể mã hóa sử đụng biến đổi wavclct
- _ Mã hỏa chuyến động: Nếu đối tượng chuyển động, thông sô
chuyển động cho toàn bệ đối tượng được Iruyền.
Trang 10€ö nhiều nhỏm proñle như media proñle, scene graph profile, MPEG-I profile,
Nhóm media proñle có: audio profile, visual profile, graphics profile Trong d6 visual profile gom cỏ các proñle sau: Simple profile Simple scalable profile, Core profile (profile 1éi), Main profile, N-bit profile, Scalable texture profile Simple face, Hybrid profile, Basic animated texture profile
2.4 Chuân nén MPEG-4 Part 10/H.264
2.41 Giới thiệu chung về MPEG-4 part 10/11.264
Dé cung cấp nén video tốt hơn các chuẩn nén trước đó, chuẩn MPEG-4 part 10/H.264 hay H.264/AVC được phát triển bởi nhóm video kết hợp JVT bao gôm các chuyên gia đến từ MPEG và VCEG' của ITU-T H.264/AVC đáp ứng hiệu quả mã hóa, đặc tả cú pháp đơn giản, tich hợp mã hóa video với tất cả các giao thức và kiên trúc ghép
Trang 1111
kênh hiện lại Do đó, II264/AVC cả thế hỗ trợ các ứng đựng như
video broadcasting, video streaming, video conferencing qua mang
cỗ định, không đây và qua cắc giao thức truyền tải khác nhau
Tỉnh kế thừa của chuẩn nén MPEG-4 Part 10/H.2
= Phin chia inh nh thành các block bao gém nhiễu pixel
w Khai thác triệt để sự đư thửa vé mat khong gian tén tại gitta
TH.261 có những sự thay đổi qnan trọng trong chỉ tiết của các phan
tử chức năng như đự đoán trong ảnh, biến đổi zỗ nguyên 4 x 4 mới,
nhiều ảnh tham chiếu, các kích thước block thay đổi, độ chính xác 1⁄4 vho bù đhuyển động, bộ lọc Lác khối, vãi tiên sud hoa entropy H.261 sử dụng một số phương pháp để phuc hổi lỗi Thiết lập
tham sé, thtr ty macroblock mém déo, slice chuyển đối, phương pháp
sliee đư thừa được thêm vào
3.42 Cầu trúc bộ mã hón MPEG-4 pan 101.264
Lớp mã hỏa video của MPEG-4/H.264 là sự két hợp của mã hóa
*hông gian va mi héa thời gian Bộ mã hỏa có thế lựa chọn mã hóa trong ảnh hoặc mã hóa liên ảnh cho miễn khôi Bộ lọc tách khối lam giảm sự nhiễu khối tại các đường biên của block Các vector chuyển động và các xode dự đoán trong ảnh có thể làm biếu đổi kích thước tock trong ảnh Cuỗi cùng, vector chuyển động hay các moác dy đoán liên ảnh được liên kết với thông tin cũa hệ số biến đổi lượng tir Thỏa và được mã hóa sử! đựng mã entropy như CAVLC hay CABAC 2.4.2.1 Các ảnh và bù chuyến động đủng trong MEG-4 Part
10/1264
4 Chia ảnh thành các macro-blocic
Mỗi ảnh video, frzme được chia thanh cae macroblock có kích thước cô định bao phủ một điệu tích ảnh bình chữ nhật gỗm 16 x 16 mẫu cho các thành phần chói và 8 x § mẫu cho một trong hai thành: hân màu
Trang 12
12
Các marroblock được tổ chúc thành các slice MPEG Part
10/11.364 hỗ trợ 5 dạng mã hóa see khác nhau Slice 1, B, P như các
chuẩn rước Hai dạng mdi 1a SI va SP
% Dw doan trong anh Intva-frame
H264 sử đụng phương pháp đu đoán các macroblock mã hóa
trong ảnh để giãm một lượng các hi! được mã hóa bằng chỉnh tin hiện
Hình 2.6: Sơ đỗ mã hóa của MPEG-4 part 10/H.264
$_ Bù chuyển động trong cic slice P (đự doán liên ãnh)
Các đạng mã hỏa bù chuyển động được xác định cho các
Tacroblock sliee P IDự đoán liều ảnh làn giãm sự tương, quan lheo
thời gian với sự trợ giúp cũa việc trớc tỉnh vector chuyển động và bù
chuyển động
- Chia che macroblock thanh cac block
- _ Các giá trị dụ đoán cho thành phần chói và thành phần màn
-_ Bủ chuyển động,
MIEG-4 Fan 10/H.264 cho phép các vector chuyển động không,
hạn chế, tức là chúng có thể hướng ra ngoài miền ảnh
MPEG Patt 19/H.264 hỗ trợ dự doản bù chuyển động, da ảnh