Mpeg-4 là chu n cho các ng d ng MultiMedia... nh pixels nh là mã hoá video nh đ ng... Sau đó đem bi n... Chu n nén nh JPEG hi n nay dùng ph ng pháp mã hoá Huffman, đây là phép mã hoá khô
Trang 1Ph ng pháp mã hóa video theo đ i t ng ng d ng trong các h th ng
thông tin video nén
M C L C
Ch ng 1 : T ng quan v mã hóa video
1.1 M c đích nghiên c u video nén theo h ng đ i t ng
1.2 T ng quan v các chu n nén
1.3 K thu t mã hóa video nén theo h ng đ i t ng MPEG-4 và u đi m
Ch ng 2: Công ngh mã hóa video trong MPEG-4
2.1 Mã hoá hình d ng ngoài (Shape Coder)
2.2.3.6 Ch đ vector chuy n đ ng không gi i h n
2.2.3.7 Ch đ nâng cao ch t l ng d đoán
Trang 3V i s phát tri n c a công ngh thông tin, và cùng v i đó là s phát tri n
ngày càng m nh m c a các ng d ng truy n thông đa ph ng ti n , đòi h i con
ng i không ng ng tìm tòi sáng t o đ đáp ng k p v i xu th phát tri n y Nh
vào s phát tri n c a các ng d ng truy n thông đa ph ng ti n mà chúng ta có
th đ a âm thanh, hình nh, hay các đo n video đi xa m t cách nhanh chóng và
thu n ti n Song v i vi c truy n t i m t đo n video có dung l ng l n đi xa g p
khá nhi u khó kh n b i kh n ng có h n c a kênh d n.Vì v y các nhà s n xu t
đã áp d ng m t s k thu t nén đ giúp t i u hóa các đo n video trên, làm gi m
dung l ng ph i truy n đi mà ch t l ng hình nh t ng đ ng v i hình nh
g c M t trong các k thu t nén đ c s d ng r ng rãi đó là k thu t nén chuy n
đ ng mà tiêu bi u là chu n nén MPEG Qua quá trình nghiên c u các chuyên
gia đã cho ra đ i chu n nén MPEG-4 v i nhi u tính n ng u vi t và nó đã nhanh
chóng đ c ng d ng r ng rãi trong h th ng thông tin video nén MPEG-4 s
d ng m t ph ng pháp mã hóa video theo t ng đ i t ng thay vì mã hóa toàn
b c m t đo n video, vì v y dung l ng video đ c gi m đi đáng k mà ch t
l ng l i không có nhi u thay đ i
Vì v y chúng tôi đã ch n đ tài nghiên c u “Ph ng pháp mã hóa
video theo đ i t ng ng d ng trong các h th ng thông tin video nén” đ đi
sâu tìm hi u k thu t mã hóa trong chu n nén MPEG-4 này
tài nghiên c u đ c chia làm 3 ph n
Ch ng 1: t ng quan v video
Ch ng 2: công ngh mã hóa video trong MPEG-4
Ch ng 3: các ng d ng
Chúng tôi xin g i l i c m n t i th y giáo đã h ng d n và giúp đ
chúng tôi th c hi n đ tài này Và chúng tôi c ng xin g i l i c m n t i th y cô
giáo trong b môn K Thu t Thông Tin và các b n cùng l p đã giúp đ chúng
Trang 4tôi trong vi c tìm ki m thông tin, tài li u và các giáo trình tham kh o trong su t
quá trình th c hi n đ tài này
Chúng tôi r t mong nh n đ c ý ki n đóng góp c a th y cô giáo và các
b n sinh viên đ cho đ tài nghiên c u đ c hoàn thi n h n
Ch ng 1 : T ng quan v mã hóa video
1.1 M c đích nghiên c u video nén theo h ng đ i t ng
T i sao chúng ta c n ph i nén video ?
xem đ c 1 đo n video có ch t l ng cao mà dung l ng không quá l n
là 1 đi u r t quan tr ng và c n thi t ó chính là lí do c n ph i s d ng 1 công
c nén video nh m gi m t i đa dung l ng c a đo n video mà ch t l ng v n
đáp ng đ c yêu c u
Nhu c u truy n phát các d ch v Multimedia m i trên h t ng k thu t m ng
Internet đã làm n y sinh các yêu c u ch c n ng không có trong các chu n
MPEG-1, MPEG-2,H.26X và các chu n nén video tr c đó S xu t hi n c a
chu n MPEG-4 (10/1998) và H264 đã t o ra m t ph ng th c thi t l p và t ng
tác m i v i truy n thông nghe nhìn trên m ng internet, t o ra m t ph ng th c
s n xu t, cung c p và ng d ng m i các n i dung video trên c s n i dung và
h ng đ i t ng (content/object-based) ây chính là m t công ngh trình di n
truy n thông đa ph ng ti n ph c h p, có kh n ng truy n thông trong các môi
tr ng b ng thông r t khác nhau nh k t h p t t 3 môi tr ng: Truy n hình s ,
đ ho t ng tác và World Wide Web
1.2 T ng quan v các chu n nén
Hi p h i vi n thông qu c t (ITU) và t ch c tiêu chu n qu c t / U ban k
thu t đi n t qu c t (ISO/IEC) là hai t ch c phát tri n các tiêu chu n mã hoá
Video Theo ITU-T, các tiêu chu n mã hoá Video đ c coi là các khuy n ngh
Trang 5g i t t là chu n H.26x (H.261, H.262, H.263 và H.264) V i tiêu chu n
ISO/IEC, chúng đ c g i là MPEG-x (nh MPEG-1, MPEG-2 và MPEG-4)
MPEG hay g n h n là MPG có xu t x t Moving Picture Experts Group
(Nhóm các chuyên gia đi n nh) T ch c ra đ i h i n m 1988 này chuy n phát
tri n các tiêu chu n v cái v nén phim s (digital video) và âm thanh s (digital
audio) Nó ho t đ ng d i s “đ đ u” c a T ch c Qu c t v Tiêu chu n hóa
(ISO) Mpeg-4 là chu n cho các ng d ng MultiMedia Mpeg-4 tr thành m t
tiêu chu n cho nén nh k thu t truy n hình s , các ng d ng v đ ho và
Video t ng tác haichi u(Games,Videoconferencing) và các ng d ng
Multimedia t ng tác hai chi u (World Wide Web ho c các ng d ng nh m
phân phát d li u Video nh truy n hình cáp, Internet Video ) Mpeg-4 đã tr
thành m t tiêu chu n công ngh trong quá trình s n xu t, phân ph i và truy c p
vào các h th ng Video Nó đã góp ph n gi i quy t v n đ v dung l ng cho
các thi t b l u tr , gi i quy t v n đ v b ng thông c a đ ng truy n tín hi u
Video ho c k t h p c hai v n đ trên
V i MPEG-4, các đ i t ng khác nhau trong m t khung hình có th đ c
mô t , mã hoá và truy n đi m t cách riêng bi t đ n b gi i mã trong các dòng c
b n ES (Elementary Stream) khác nhau C ng nh xác đ nh, tách và x lý riêng
các đ i t ng (nh nh c n n, âm thanh xa g n, đ v t, đ i t ng nh video nh
con ng i hay đ ng v t, n n khung hình …), nên ng i s d ng có th lo i b
riêng t ng đ i t ng kh i khuôn hình S t h p l i thành khung hình ch đ c
th c hi n sau khi gi i mã các đ i t ng này
H.264 ( MPEG-4 AVC hay MPEG-4 part 10), hi n đang là ph ng th c tiên
ti n nh t trong l nh v c nén video H.264 cho ch t l ng hình nh t t nh t khi
có cùng dung l ng so v i các chu n nén khác H.264 c ng đ c ng d ng nh
thu t nén chính trong video đ phân gi i cao (HD)
M c tiêu chính c a chu n nén H.264 đang phát tri n nh m cung c p Video
có ch t l ng t t h n nhi u so v i nh ng chu n nén Video tr c đây i u này
có th đ t đ c nh s k th a các l i đi m c a các chu n nén Video tr c đây
Trang 6Trong đ tài này chúng tôi xin phép đ c trình bày k thu t mã hóa video
nén theo h ng đ i t ng MPEG-4 mà hi n nay đang đu c s d ng r t nhi u
nh 1 công c mã hóa v i nhi u tính n ng u vi t
1.3 K thu t mã hóa video nén theo h ng đ i t ng MPEG-4 và u
đi m c a nó
MPEG-4 đ c coi là m t cu c cách m ng m i trong media s Nó là chu n
multimedia toàn c u th h k ti p Nó đ c thi t k đ truy n t i video v i ch t
l ng DVD (MPEG-2) qua m ng MPEG-4 có kh n ng nén cao và t i u hóa
đ c dung l ng b ng thông c ng nh dung l ng file l u tr mà l i đ a ra ch t
l ng video ch p nh n đ c
MPEG-4 có ph ng th c mã hóa và nén video hoàn toàn t i u h n các
chu n khác tr c nó đó là vi c chia nh m i l p video thành các đ i t ng riêng
bi t,Thay vì th c hi n truy n t i t t c các l p video nh 2 thì
MPEG-4 ch truy n đi s thay đ i trong m i đ i t ng đã đ c tách ra.MPEG-4 ra đ i
v i khá nhi u tính n ng u vi t:
1.3.1 Tính m m d o và có kh n ng nâng c p
Các nhà thi t k b mã hoá MPEG ph i đ i m t v i r t nhi u v n đ , nh ng
v n đ quan tr ng nh t là làm sao thi t k đ c m t thu t toán nén m m d o và
có kh n ng nâng c p đ c trong t ng lai H th ng mong mu n có đ c các
b mã hoá MPEG thích h p cho nhi u ng d ng, t TV màn nh r ng, ch t
l ng cao t i các h th ng nh , tín hi u video đen tr ng cho các h th ng
camera an ninh Hi n nhiên là m t h th ng nén thi t k dành cho các phim màn
nh r ng ph i có ph n c ng m nh, b nh l n h n là m t h th ng đ c thi t k
cho h th ng camera dành cho m c đích an ninh.Các nhà thi t k gi i quy t v n
đ này b ng cách đ nh ngh a "Level" và "Profile" cho h th ng Các "Level" xác
đ nh gi i h n n ng l c x lý c a ph n c ng và b nh c n thi t đ mã hoá tín
Trang 7hi u Các "Profile" xác đ nh đ ph c t p c a quá trình mã hoá và gi i mã i
v i MPEG-4 thì có 19 profile (nh ng đ i v i H.264 ch có 3 profile)
V kh n ng nâng c p c a b mã hoá MPEG, h thi t k theo hai b c
B c th nh t là thay cho xác đ nh ch tiêu c a b mã hoá và gi i mã, h xác
đ nh lo i tín hi u n m gi a hai thi t b này B c th hai là th c hi n các c i
ti n trong b mã hoá và gi i mã m i sao cho nó t ng thích v i các chu n c
(backward compatible).Chu n MPEG có các qui t c và giao th c cho tín hi u
truy n gi a b mã hoá và gi i mã Các quy t c này, th c ch t gi ng nh là m t
lo i ngôn ng dành riêng cho b mã hoá và gi i mã Các b mã hoá t ng thích
ph i có kh n ng “nói” đ c ngôn ng này Các b gi i mã t ng thích ph i có
kh n ng hi u đ c toàn b các "t v ng" mà b mã hoá đã phát ra trong m t
ng c nh nh t đ nh.MPEG-4 th c hi n đi u này b ng cách t o ra m t b các
công c dùng đ nén tín hi u trong các tr ng h p khác nhau M t trong các
công c này, chuy n đ i cosine r i r c (DCT - discrete cosine transform), có
nhi m v chuy n đ i m t kh i 8x8 pixel thành m t t p các h s
1.3.2 MPEG-4 đem l i công c nén m i
Ta hãy xem xét các c ng c nén m i mà chu n MPEG-4 mang t i l nh v c
nén nh Hình 1 so sánh các công c c a chu n MPEG-2 và MPEG-4
Hình 1.1: công c nén m i c a MPEG-4 so v i MPEG-2
Trang 8Chu n MPEG-4 đi xa h n, theo hình 2, nó có th d đoán h s c a toàn b
các kh i trên m t hàng hay h s c a các kh i c t bên trái t m t kh i đ u
tiên
Hình 1.2: MPEG4 có th d đoán các tham s trên 1 hàng, hay các thông s c a c t bên trái
t m t kh i đ u tiên
Vi c d đoán các h s c a hàng hay c a c t d a trên n i dung c a hình nh
Ví d , m t nh ch a m t v t th theo chi u đ ng nh cái c c ch ng h n Khi đó
quét nh này theo chi u ngang s t o ra s thay đ i l n trong các h s sau DCT
khi g p hình nh cái c c này Trái l i, khi quét theo chi u đ ng thì các kh i n m
trong m t c t có các h s DCT g n gi ng nhau, t đó có th nén v i t l nén
cao h n
MPEG-4 m r ng cách d đoán vector chuy n đ ng MPEG-4 có th d
đoán vector cho m t macroblock t các macroblock trên hay bên trái, và nó
ch g i đi s sai khác so v i các vector c mà thôi Do đó gi m đi d li u c n
thi t dùng đ mã hoá m t vector, cho phép có th dùng m t vector cho m i kh i
DCT Vi c d đoán chuy n đ ng s t t h n v i 4 vector, gi m nh l i khi d
đoán
Ch t l ng hình nh có th đ c c i thi n đáng k b ng cách dùng t l nén
d li u l n h n mà không c n thay đ i đ phân gi i Mpeg không ph i là m t
công c nén đ n l mà u đi m c a nén Mpeg chính là ch nó có m t t p h p
Trang 9các công c mã hoá chu n, chúng có th đ c k t h p v i nhau m t cách linh
đ ng đ ph c v cho m t lo t các ng d ng khác nhau, kh n ng truy n d n t t
trong môi tr ng truy n d n kh c nhi t
1.3.3 Ti m n ng c a chu n MPEG-4
Trong khi các chu n MPEG-1 và MPEG-2 thao tác v i m t nh toàn v n, thì
chu n MPEG-4 có th làm vi c đ c v i các hình nh đ c t o ra, hay đã đ c
máy tính x lý và đó là m t th m nh c a chu n 4.So v i chu n
MPEG-2 thì MPEG-4 có nh ng u th h n v x lý đ h a tr c ti p
Hình 1.3 a : u vào c a b mã hóa MPEG-2 là m t nh hoàn ch nh đ c
l p l i theo t n s nh (frame rate)
Hình 1.3.b : B mã hóa MPEG-4 có th x lý các l nh đ h a m t
cách tr c ti p , do đó công c bi u di n hình nh th c s n m trong b
gi imã MPEG-4 Hình 1.3 : so sánh gi a chu n MPEG-2 và MPEG-4 v x lý đ h a
Chu n MPEG-4 có th làm vi c đ c v i 4 lo i đ i t ng, nh trên hình 4.Hình
4 cho th y chu n MPEG-4 đã chu n hoá ph ng pháp truy n các đ i t ng 3
chi u nh các đ i t ng l i (mesh object), cùng v i các ph ng ti n ánh x b
Trang 10Truy n thông multimedia theo dòng (Multimedia stream), trong đó dòng
audio và video s đ c bi n đ i thích nghi v i yêu c u b ng thông và ch t l ng
hình nh lo i b nh ng đ i t ng (hình nh, âm thanh) không c n thi t kh i
dòng d li u và đ ng b các thông tin đ c nhúng trong dòng d li u đó Thêm
vào đó, MPEG-4 s cho phép ng i s d ng kh n ng t ng tác tr c ti p v i
dòng d li u (d ng ti n hay lùi nhanh, kích chu t đ kích ho t các tu ch n
video và audio…)
L u gi và ph c h i d li u audio và video: do MPEG-4 phân chia các
khung hình thành các đ i t ng, vi c trình duy t Browser trên c s n i dung
(đ i t ng) mong mu n s đ c th c hi n m t cách d dàng và nh v y, các
ng d ng l u gi hay ph c h i thông tin trên c s n i dung MPEG-4 s đ c
thu n l i h n
Trang 11Truy n thông báo đa ph ng ti n: các thông báo d i d ng text, audio và
video MPEG-4 s đ c truy n đi v i yêu c u b ng thông ít h n, và có kh n ng
t đi u ch nh ch t l ng cho phù h p v i kh n ng b ng thông c a thi t b gi i
mã
Thông tin gi i trí: nh ng s trình di n nghe nhìn t ng tác (th gi i o, trò
ch i t ng tác …) có th đ c tri n khai trên c s chu n MPEG-4 s làm gi m
yêu c u v b ng thông và làm cho th gi i o tr nên sinh đ ng và gi ng nh
th c t trên các trang web
Ch ng 2 : Công ngh mã hóa video trong MPEG-4
MPEG-4 là s n ph m c a nhóm MPEG (Moving Picture Expert Group)
đ c thành l p tháng 1/1988 v i nhi m v phát tri n các chu n x lý, mã hoá và
hi n th các nh đ ng, audio và các t h p c a chúng
S n ph m đ u tiên c a nhóm này là MPEG-1 đ c s d ng cho vi c mã hoá
các d li u nghe nhìn v i t c đ 1,5 Mbps S n ph m th hai c a nhóm là chu n
MPEG-2 n i ti ng hi n nay, mang tính t ng quát h n và đang đ c áp d ng cho
m t lo t các ng d ng nghe nhìn trong ph m vi t c đ t 3-40 Mbps
Không gi ng các chu n MPEG tr c đó, ví d nh trong MPEG-2, n i mà
n i dung đ c t o ra t nhi u ngu n nh video nh đ ng, đ h a, v n b n… và
đ c t h p thành chu i các khung hình ph ng, m i khung hình (bao g m các
đ i t ng nh ng i, đ v t, âm thanh, n n khung hình…) đ c chia thành các
ph n t nh pixels và x lý đ ng th i, gi ng nh c m nh n c a con ng i thông
qua các giác quan trong th c t Các pixels này đ c mã hoá nh th t t c
chúng đ u là các ph n t nh video nh đ ng T i phía thu c a ng i s d ng,
quá trình gi i mã di n ra ng c v i quá trình mã hoá không khó kh n Vì v y có
th coi MPEG-2 là m t công c hi n th t nh, và n u m t nhà truy n thông
truy n phát l i ch ng trình c a m t nhà truy n thông khác v m t s ki n, thì
Trang 12logo c a nhà s n xu t ch ng trình này không th lo i b đ c V i MPEG-2,
b n có th b xung thêm các ph n t đ ho và v n b n vào ch ng trình hi n
th cu i cùng (theo ph ng th c ch ng l p), nh ng không th xoá b t các đ
Chu n MPEG-4 kh c ph c đ c h n ch này và là m t chu n đ ng d thay đ i
V i MPEG-4, các đ i t ng khác nhau trong m t khung hình có th đ c mô t ,
mã hoá và truy n đi m t cách riêng bi t đ n b gi i mã trong các dòng c b n
ES (Elementary Stream) khác nhau C ng nh xác đ nh, tách và x lý riêng các
đ i t ng (nh nh c n n, âm thanh xa g n, đ v t, đ i t ng nh video nh con
ng i hay đ ng v t, n n khung hình …), nên ng i s d ng có th lo i b riêng
t ng đ i t ng kh i khuôn hình S t h p l i thành khung hình ch đ c th c
hi n sau khi gi i mã các đ i t ng này
Hình 2.1 C u trúc c a b mã hoá và gi i mã video MPEG-4
Các b ph n ch c n ng chính trong các thi t b MPEG-4 bao g m:
- B mã hoá hình d ng ngoài Shape Coder dùng đ nén đo n thông tin, giúp
xác đ nh khu v c và đ ng vi n bao quanh đ i t ng trong khung hình scene
- B d đoán và t ng h p đ ng đ gi m thông tin d th a theo th i gian
- B mã k t c u m t ngoài Texture coder dùng đ x lý d li u bên trong và
các d li u còn l i sau khi đã bù chuy n đ ng
Trang 13Hình 2 là m t ví d v t ng h p khung hình video s d ng trong MPEG-4
Nhi u đ i t ng đ c tách ra kh i video đ u vào M i đ i t ng video sau đó
đ c mã hóa b i b mã hoá đ i t ng video VO (Video Object) và sau đó đ c
truy n đi trên m ng T i v trí thu, nh ng đ i t ng này đ c gi i mã riêng r
nh b gi i mã riêng VO và g i t i b compositor Ng i s d ng có th t ng
tác v i thi t b đ c u trúc l i khung hình g c, hay đ x lý các đ i t ng t o ra
m t khung hình khác Ngoài ra, ng i s d ng có th download các đ i t ng
khác t các th vi n c s d li u (có s n trên thi t b hay t xa thông qua m ng
LAN, WAN hay Internet) đ chèn thêm vào hay thay th các đ i t ng có trong
có th th c hi n vi c t h p khung hình, MPEG-4 s d ng m t ngôn ng
mô t khung hình riêng, đ c g i là đ nh d ng nh phân cho khung hình BiFS
(Binary Format for Scenes) BiFS không ch mô t đâu và khi nào các đ i
t ng xu t hi n trong khung hình, nó c ng mô t cách th c ho t đ ng c a đ i
t ng (làm cho m t đ i t ng xoay tròn hay ch ng m hai đ i t ng lên nhau)
và c đi u ki n ho t đ ng đ i t ng và t o cho MPEG-4 có kh n ng t ng tác
Trong MPEG-4 t t c các đ i t ng có th đ c mã hoá v i s đ mã hoá riêng
c a nó - video đ c mã hoá theo ki u video, text đ c mã hoá theo ki u text,
các đ ho đ c mã hoá theo ki u đ ho - thay vì vi c x lý t t c các ph n t
Trang 14nh pixels nh là mã hoá video nh đ ng Do các quá trình mã hoá đã đ c t i
u hoá cho t ng lo i d li u thích h p, nên chu n MPEG-4 s cho phép mã hoá
v i hi u qu cao tín hi u nh video, audio và c các n i dung t ng h p nh các
b m t và c th ho t hình
2.1 Mã hoá hình d ng ngoài (Shape Coder )
-Khung hình : là thành ph n mã hoá chính Th ng th ng chúng ta có th
phân bi t s thay đ i v đ sáng c a nh t t h n so v i s thay đ i v màu Do
đó tr c h t các s đ nén Mpeg s ti n hành chia khung hình thành các thành
ph n đ sáng Y và thành ph n đ màu Cb, Cr (m t thành ph n v đ sáng và hai
thành ph n v đ màu) M t khung hình s g m có 3 ma tr n ng v i các thành
ph n v đ sáng (Y) và hai thành ph n v đ màu Cb và Cr
Ma tr n Y có s hàng và c t b ng nhau (ma tr n vuông) Ma tr n Cb và Cr
có s hàng và c t b ng n a ma tr n Y Hình 3 cho th y quan h và v trí c a Y
và các thành ph n Cb và Cr L u ý r ng c 4 giá tr Y l i có 2 giá tr k t h p
m t c a Cb và m t c a Cr (V trí c a giá tr Cb và Cr là t ng đ ng)
Các b l c ti n x lý s l c ra nh ng thông tin không c n thi t t tín hi u Video
và nh ng thông tin khó mã hoá nh ng không quan tr ng cho s c m th c a m t
ng i K thu t đoán chuy n đ ng d a trên nguyên t c là các khung hình trong
m t c nh Video d ng nh có liên quan m t thi t v i nhau theo th i gian: M i
khung hình t i m t th i đi m nh t đ nh s có nhi u kh n ng gi ng v i các
khung hình đ ng ngay phía tr c và ngay phía sau nó Do v y phía b mã hoá,
ch c n g i nh ng khung hình có thay đ i so v i nh ng khung hình tr c, sau
đó dùng ph ng pháp nén v không gian đ lo i b s d th a v không gian
trong chính khung hình sai khác này Trong MPEG-4 là y u t ít có s thay đ i
nh t, các b c mã hóa khung hình c ng t ng t nh mã hóa nh Thu t toán
Trang 15S đ thu t toán nén và gi i nén đ c mô t d i đây:
Hình 2.3 s đ thu t toán nén nh (a)
Quá trình gi i nén s đ c làm ng c l i, ng i ta gi i mã t ng ph n nh
nén t ng ngv i ph ng pháp nén đã s d ng trong ph n nén nh các thông
tin liên quan ghi trong ph n header c a file nén K t qu thu đ c là h s đã
l ng t Các h s này đ c khôi ph c v giá tr tr c khi l ng t hóa b ng
b t ng t hóa Ti p đó đem bi n đ i Cosin ng c ta đ c nh ban đ u v i đ
trung th c nh t đ nh
B ng mã và b ng l ng t trong s đ gi i nén đ c d ng lên nh nh ng
thông tin ghi trong ph n c u trúc đ u t p ( Header) c a t p nh nén Quá trình
nén ch u trách nhi m t o ra và ghi l i nh ng thông tin này Ph n ti p theo s
phân tích tác d ng c a t ng kh i trong s đ 2.3
+ Ph n kh i
Vì nh g c có kích th c r t l n cho nên tr c khi đ a vào bi n đ i DCT,
nh đ c phân chia thành các kh i vuông, m i kh i này th ng có kích th c 8
x 8 pixel và bi u di n các m c xám c a 64 đi m nh, các m c xám này là các s
nguyên d ng có giá tr t 0 đ n 255 Vi c phân kh i này s làm gi m đ c m t
ph n th i gian tính toán các h s chung, m t khác bi n đ i cosin đ i v i các
kh i nh s làm t ng đ chính xác khi tính toán v i d u ph y t nh, gi m thi u sai
s do làm tròn sinh ra
Trang 16Bi n đ i DCT là m t công đo n chính trong các ph ng pháp nén s d ng
bi n đ i 2 công th c đây minh ho cho 2 phép bi n đ i DCT thu n ngh ch đ i
v i m i kh i nh có kích th c 8 x 8 Giá tr x(n1, n2) bi u di n các m c xám
c a nh trong mi n không gian, X(k1, k2) là các h s sau bi n đ i DCT trong
mi n t n s
+ Bi n đ i
Bi n đ i là m t trong nh ng công đo n l n trong các ph ng pháp nén s
d ng phép bi n đ i Nhi m v c a công đo n bi n đ i là t p trung n ng l ng
vào m t s ít các h s bi n đ i Công th c bi n đ i cho m i kh i là:
và
Thu t toán bi n đ i DCT cho m i kh i trong tr ng h p này s bao g m 16
phép bi n đ i DCT u tiên, ng i ta bi n đ i nhanh Cosin m t chi u cho các
dãy đi m nh trên m i hàng L n l t th c hi n cho 8 hàng Sau đó đem bi n
Trang 17Kh i l ng t hóa trong s đ nén đóng vai trò quan trong và quy t đ nh t
l nén c achu n nén u vào c a kh i l ng t hóa là các ma tr n h s bi n
đ i Cosin c a các kh i đi m nh.Sau khi th c hi n bi n đ i DCT, 64 h s s
đ c l ng t hoá d a trên m t b ng l ng t g m 64 ph n t Q(u,v) v i 0≤u,
v≤7 B ng này đ c đ nh ngh a b i t ng ng d ng c th Các ph n t trong
b ng l ng t có giá tr t 1 đ n 255 đ c g i là các b c nh y cho các h s
DCT Quá trình l ng t đ c coi nh là vi c chia các h s DCT cho b c
nh y l ng t t ng ng, k t qu này sau đó s đ c làm tròn xu ng s nguyên
g n nh t Công th c (3) th hi n vi c l ng t v i F(u,v) là các h s DCT,
F Q (u,v) là các h s sau l ng t , các h s này s đ c đ a vào b mã hoá
Entropy
(3)
Trang 18Quá trình gi i l ng t phía b gi i mã đ c th c hiên ng c l i Các h
s sau b gi i mã entropy s nhân v i các b c nh y trong b ng l ng t (b ng
l ng t đ c đ t trong ph n header c a nh JPEG) K t qu này sau đó s đ c
đ a vào bi n đ i DCT ng c nâng cao hi u qu nén cho m i b h s trong
m t kh i, ng i ta x p chúng l i theo th t ZigZag Tác d ng c a s p x p l i
theo th t ZigZag là t o ra nhi u lo i h s gi ng nhau Chúng ta bi t r ng
n ng l ng c a kh i h s gi m d n t góc trên bên trái xu ng góc d i bên
ph i nên vi c s p x p l i các h s theo th t ZigZag s t o đi u ki n cho các
h s x p x nhau (cùng m c l ng t ) n m trên m t dòng
Hình 2.5 : Quá trình gi i l ng t và th t s p x p zigzag
M i kh i ZigZag này đ c mã hóa theo ph ng pháp RLE Cu i m i kh i
đ u ra c a RLE, ta đ t d u k t thúc kh i EOB (End Of Block) Sau đó, các kh i
đ c d n l i và mã hóa m t l n b ng ph ng pháp mã Huffman Nh có d u k t
thúc kh i nên có th phân bi t đ c hai kh i c nh nhau khi gi i mã Huffman
Hai b ng mã Huffman cho hai thành ph n h s t t nhiên s khác nhau có
Trang 19th gi i nén đ c, chúng ta ph i ghi l i thông tin nh : kích th c nh, kích
th c kh i, ma tr n Y, đ l ch tiêu chu n, các m c t o l i, hai b ng mã
Huffman, kích th c kh i nén m t chi u, kích th c kh i nén xoay chi u… và
ghi n i ti p vào hai file nén c a thành ph n h s
Cài đ t gi i thu t cho nén th c s ph c t p Chúng ta ph i n m đ c các
ki n th c v nén
RLE, Huffman, bi n đ i Cosin, xây d ng b l ng t hóa
Lloyd-Max…Nén và gi i nén h i ch m nh ng bù l i, th i gian truy n trên m ng
nhanh h n do kích th c t p nén nh V i nh ng u đi m c a mình đ c ISO
ch p nh n là chu n nh qu c t và đ c bi t đ n d i mã s ISO 10918-1
2.1.3 Mã hóa
Mã hoá là b c cu i cùng trong h th ng nén nh d a trên bi n đ i DCT
Chu n nén nh JPEG hi n nay dùng ph ng pháp mã hoá Huffman, đây là phép
mã hoá không làm m t thông tin Ph ng pháp này d a trên mô hình th ng kê
Các h s thu đ c sau khi l ng t hoá s đ c s p x p thành m t chu i
các ký hi u theo ki u “zig-zag” (theo đ ng zig-zag) đ đ t các h s có t n s
Trang 20th p lên tr c các h s t n s cao Các h s này s đ c mã hoá d a trên b ng
mã Huffman sao cho chi u dài trung bình c a t mã là nh nh t B ng mã này
c ng s đ c đ t trong ph n mào đ u c a nh đ th c hi n gi i nén nh
2.2 D đoán và t ng h p đ ng
M i l p video bao g m các đ i t ng riêng r M i đ i t ng riêng r y
g i là VOP Khi 1 VOP đ c tách ra,VOP đó s đ c đ a vào b mã hóa và
đ c th c hi n mã hóa nh sau :
Hình 2.6 C u trúc mã hóa m t VOP
2.2.1 c l ng chuy n đ ng
Nén Mpeg là s k t h p hài hoà c a b n k thu t c b n: Ti n x lý
(Preprocessing), đoán tr c s chuy n đ ng c a các khung hình (Picture) b
mã hoá (Temporal Prediction), bù chuy n đ ng b gi i mã (Motion
Compensation) và mã l ng t hoá (Quatization Coding).Các b l c ti n x lý
s l c ra nh ng thông tin không c n thi t t tín hi u Video và nh ng thông tin
khó mã hoá nh ng không quan tr ng cho s c m nh n c a m t ng i K thu t
đoán chuy n đ ng d a trên nguyên t c là các khung hình trong m t c nh Video
(Video Sequence) d ng nh có liên quan m t thi t v i nhau theo th i gian:
M i khung hình t i m t th i đi m nh t đ nh s có nhi u kh n ng gi ng v i các
Trang 21khung hình đ ng ngay phía tr c và ngay phía sau nó Các b mã hoá s ti n
hành quét l n l t t ng ph n nh trong m i khung hình g i là MB, sau đó nó s
phát hi n MB nào không thay đ i t khung hình này t i khung hình khác B mã
hoá s d đoán tr c s xu t hi n c a các MB khi bi t v trí và h ng chuy n
đ ng c a nó Do đó ch nh ng s thay đ i gi a các MB trong khung hình hi n
t i và các MB đ c d đoán m i đ c truy n t i bên phía thu
Phía bên thu t c b gi i mã đã l u tr s n nh ng thông tin mà không thay
đ i t khung hình này t i khung hình khác trong b nh đ m c a nó và chúng
đ c dùng đ đi n thêm m t cách đ u đ n vào các v trí tr ng trong nh đ c
khôi ph c
Nén tín hi u Video đ c th c hi n nh vi c lo i b c s d th a v không
gian (Spatial Coding) và th i gian (Temporal Coding) Trong Mpeg, vi c lo i b
d th a v th i gian (nén liên khung hình) đ c th c hi n tr c h t nh s d ng
các tính ch t gi ng nhau gi a các khung hình liên ti p (Inter-Picture) Chúng ta
có th s d ng tính ch t này đ t o ra các khung hình m i nh vào nh ng thông
tin t nh ng khung hình đã g i tr c nó Do v y phía b mã hoá, ch c n g i
nh ng khung hình có thay đ i so v i nh ng khung hình tr c, sau đó dùng
ph ng pháp nén v không gian (Spatial Coding) đ lo i b s d th a v không
gian trong chính khung hình sai khác này Nén v không gian d a trên nguyên
t c là phát hi n s gi ng nhau c a các đi m nh (pixel) lân c n nhau
(Intra-Picture)
2.2.2 K thu t đ m
K thu t đ m m t hình nh s đ c th c hi n l p đi l p l i trên VOP đ th c
hi n vi c d đoán chuy n đ ng và bù chuy n đ ng
M c đích c a k thu t này là đ đi u ch nh t c đ c a lu ng video mã hóa
hay đi u ch nh t c đ nén video
2.2.3 K thu t chuy n đ ng c b n
Trang 22MPEG-4 s d ng m t s k thu t t ng t nh ITU-T.263 đ mã hóa d
li u chuy n đ ng Các khái ni m v k thu t chuy n đ ng c b n s đ c trình
bày các m c d i đây:
2.2.3.1 K thu t thay đ i t ng kh i thích ng v i c u trúc đa c nh c a
VOP
Các hình ch nh t có ch a các VOP đ c m r ng v bên ph i và phía d i
cùng theo b i s c a kích th c MB Kích c c a hình ch nh t cho đ chói
VOP là b i s c a 16x16, và kích th c cho màu là b i s c a 8x8 Các giá tr
alpha c a các đi m nh m r ng (ví d nh bên ngoài ranh gi i c a VOP) đ c
thi t l p là r ng Các MB đ c hình thành b i các phân vùng m r ng ranh gi i
c a kh i hình ch nh t 16 x 16 Trong quá trình d đoán chuy n đ ng, giá tr
SAD (t ng s khác nhau tuy t đ i c a các đi m nh) đ c s d ng nh 1 công
c đ tìm ra đ sai l ch Vi c xây d ng l i các anpha Plane c a VOP có s d ng
c các đi m nh c a các MB mà chúng n m ngoài VOP.Giá tr SAD ch đ c
tính cho các đi m nh có giá tr khác 0 Công th c này đ c áp d ng c v i các
MB thu c đ ng biên c a VOP K thu t này đ c áp d ng nh trong hình 2.7
Hình 2.7 : K thu t thay đ i t ng kh i thích ng v i c u trúc đa c nh c a VOP
2.2.3.2 c l ng chuy n đ ng c a đi m nh
Vi c tìm ki m s thay đ i v thành ph n đ sáng ( theo ph ng Y ) đ c
th c hi n hi u qu khi ta tìm ki m trên 1 s nguyên đi m nh.Vi c so sánh đ c
di n ra gi a MB hi n t i v i MB đã b thay th tr c đó.Vi c tìm ki m đ c
Trang 23Trong đó SADN(x,y) là giá tr SAD c a MB t i t a đ (x , y)
Original: là giá tr đi m nh ij hi n t i
Previous: là giá tr đi m nh ij tr c đó đã b thay th
!(Alphaoriginal=0) : là m t h s khác 0
Trong mi n không gian m r ng tìm ki m,nh ng n i mà (x,y) lên t i lên ±
31,5 pixel v i N =16 ho c 8 đ u tiên cho vector r ng khi không có s khác
bi t thì véc t r ng SAD (0, 0) đ c s d ng theo công th c
v i NB là s ch s c a MB bên trong các VOP C p k t qu (x,y) th p nh t
trong SAD16 đ c ch n nh 16x16 đi m nh nguyên c a MV , V0 Trong ch
đ nâng cao ch t l ng d đoán chuy n đ ng 4 MVs 8x8 đ i di n cho m i
16x16 MB Các SAD 8x8 cho MB s đ c tính nh sau :
Trang 24Khi d đoán chuy n đ ng c a các đi m nh đ c hoàn thành nh ng ng i
làm nhi m v mã hóa s quy t đ nh s s d ng ch đ INTRA ho c ch đ
trong ph m vi ±1 pixel xung quanh các ma tr n có s đi m là V0, V1, V2, V3,
V4 giá tr c a n a pixel tìm đ c b ng cách s d ng phép n i suy đ c di n t
trong hình sau :