1. Trang chủ
  2. » Luận Văn - Báo Cáo

PHƯƠNG PHÁP MÃ HÓA VIDEO THEO ĐỐI TƯỢNG ỨNG DỤNG TRONG CÁC HỆ THỐNG THÔNG TIN VIDEO NÉN

60 879 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 60
Dung lượng 1,88 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Một video thường chứa một lượng lớn dữ liệu, do đó sẽ gặp rất nhiều khó khăn trong việc lưu trữ và truyền đi trong một băng thông kênh truyền hạn chế. Để có thể truyền trong một kênh truyền hình thông thường, tín hiệu video số cần phải được nén trong khi vẫn phải đảm bảo chất lượng hình ảnh.Để xem được một đoạn video mà chất lượng cao mà dung lượng không quá lớn là một điều rất quan trọng và cần thiết. Đó là lí do phải sử dụng một công cụ nén video nhằm giảm tối đa dung lượng của đoạn video mà chất lượng vẫn đáp ứng được yêu cầu.Nén video đạt được sự giới hạn băng thông cho phép để upload, lưu trữ đoạn video lên trang web và download đoạn về một cách dễ dàng, tiện dụng nhất, tối ưu được thời gian và năng lượng của thiết bị đầu cuối .Thực chất của công nghệ ‘nén video’ là loại bỏ đi các thông tin dư thừa như:Độ dư thừa không gian giữa các pixel: giữa các điểm ảnh lân cận trong phạm vi một bức ảnh hay một khung video, còn gọi là thừa tĩnh bên trong từng frame.Độ dư thừa thời gian do các ảnh liên tiếp nhau: giữa các điểm ảnh của các khung video trong chuỗi ảnh video, còn gọi là thừa động giữa các frame;Độ dư thừa do các thành phần màu biễu diễn từng pixel có độ tương quan cao.•Độ dư thừa thống kê do bản thân các kí hiệu xuất hiện trong dòng bit với các xác suất xuất hiện không đều nhau.Độ dư thừa tâm lý thị giác ( các thông tin nằm ngoài khả năng cảm nhận của mắt ): thông tin không phù hợp với hệ thống thị giác con người, những tần số quá cao so với cảm nhận của mắt con người…

Trang 1

BÁO CÁO CHUYÊN ĐỀPHƯƠNG PHÁP MÃ HÓA VIDEO THEO ĐỐI TƯỢNG ỨNG DỤNG TRONG CÁC HỆ THỐNG THÔNG TIN VIDEO NÉN

Trang 2

DANH SÁCH CÁC CHỮ VIẾT TẮT

1 MV Motion Vector - Vector chuyển động

2 VOP Video Object Planes - Đối tượng video

3 DCT Discrete Cosine Transform - Biến đổi cosin rời rạc

4 MSE Mean Square Error - Sai số bình phương trung bình

5 BM Block Matchinh - Khối phù hợp

6 SAD Sum of Absolute Difference - Tổng sự khác nhau tuyệt đối

7 MB Macro Block - Khối vĩ mô

8 GOB Groups Of Block - Nhóm các khối

IEC International Electrotechnical Commission - Ủy ban kỹ thuật điện tử quốc tế

14 EOB End Of Block - Khối kết thúc

15 MRG Management Research Group - Nhóm quản lý nghiên cứu

16 IPTV Internet Protocol Television - Truyền hình Giao thức Internet

17 MSE Mean Square Error - Sai số bình phương trung bình

18 VOD Video on Demand - Video theo yêu cầu

19 BM Block Matchinh - Khối phù hợp

20

FTTH

Fiber-To-The-Home - Mạng viễn thông bằng cáp quang được nối đến tận nhà

21 ISDN Integrated Services Digital Network - Mạng đa dịch vụ số

22 NGN Next Generation Network - Dịch vụ truyền hình hội nghị

23 LAN Local Area Network - Mạng máy tính cục bộ

24 WAN Wide Area Network - Mạng diện rộng

25 QP Quantization Parameter - Tham số lượng tử

Trang 3

DANH SÁCH CÁC HÌNH VẼ

MỤC LỤC

Trang 4

LỜI NÓI ĐẦU

Với sự phát triển của công nghệ thông tin, và cùng với đó là sự phát triểnngày càng mạnh mẽ của các ứng dụng truyền thông đa phương tiện, đòi hỏi conngười không ngừng tìm tòi sáng tạo để đáp ứng kịp với xu thế phát triển ấy Nhờvào sự phát triển của các ứng dụng truyền thông đa phương tiện mà chúng ta cóthể đưa âm thanh, hình ảnh, hay các đoạn video đi xa một cách nhanh chóng vàthuận tiện Song với việc truyền tải một đoạn video có dung lượng lớn đi xa gặpkhá nhiều khó khăn bởi khả năng có hạn của kênh dẫn.Vì vậy các nhà sản xuất

đã áp dụng một số kỹ thuật nén để giúp tối ưu hóa các đoạn video trên, làm giảmdung lượng phải truyền đi mà chất lượng hình ảnh tương đương với hình ảnhgốc Một trong các kỹ thuật nén được sử dụng rộng rãi đó là kỹ thuật nén chuyểnđộng mà tiêu biểu là chuẩn nén MPEG Qua quá trình nghiên cứu các chuyêngia đã cho ra đời chuẩn nén MPEG-4 với nhiều tính năng ưu việt và nó đã nhanhchóng được ứng dụng rộng rãi trong hệ thống thông tin video nén MPEG-4 sửdụng một phương pháp mã hóa video theo từng đối tượng thay vì mã hóa toàn

bộ cả một đoạn video, vì vậy dung lượng video được giảm đi đáng kể mà chấtlượng lại không có nhiều thay đổi Vì vậy nhóm đã chọn đề tài nghiên cứu “Phương pháp mã hóa video theo đối tượng ứng dụng trong các hệ thống thôngtin video nén” để đi sâu tìm hiểu kỹ thuật mã hóa trong chuẩn nén MPEG-4 này

Đề tài nghiên cứu được chia làm 4 phần:

Chương 1 : Tổng quan về mã hóa video

Chương 2 : Công nghệ mã hóa video trong MPEG-4

Chương 3 : Ứng dụng

Chương 4 : Mô phỏng Demo

Nhóm xin gửi lời cảm ơn tới Thầy giáo Vũ Tuấn đã hướng dẫn và giúp đỡnhóm thực hiện đề tài này Và nhóm cũng xin gửi lời cảm ơn tới thầy cô giáotrong bộ môn Công Nghệ Thông Tin và các bạn cùng lớp đã giúp đỡ nhóm trongviệc tìm kiếm thông tin, tài liệu, và các giáo trình tham khảo trong suốt quá trìnhthực hiện đề tài này

Trang 5

CHƯƠNG 1 TỔNG QUAN VỀ MÃ HÓA VIDEO

1.1 Mục đích nghiên cứu video nén theo hướng đối tượng

Tại sao chúng ta cần phải nén Video ?

Một video thường chứa một lượng lớn dữ liệu, do đó sẽ gặp rất nhiều khókhăn trong việc lưu trữ và truyền đi trong một băng thông kênh truyền hạn chế

Để có thể truyền trong một kênh truyền hình thông thường, tín hiệu video số cầnphải được nén trong khi vẫn phải đảm bảo chất lượng hình ảnh

Để xem được một đoạn video mà chất lượng cao mà dung lượng không quálớn là một điều rất quan trọng và cần thiết Đó là lí do phải sử dụng một công cụnén video nhằm giảm tối đa dung lượng của đoạn video mà chất lượng vẫn đápứng được yêu cầu

Nén video đạt được sự giới hạn băng thông cho phép để upload, lưu trữđoạn video lên trang web và download đoạn về một cách dễ dàng, tiện dụngnhất, tối ưu được thời gian và năng lượng của thiết bị đầu cuối

Thực chất của công nghệ ‘nén video’ là loại bỏ đi các thông tin dư thừanhư:

• Độ dư thừa không gian giữa các pixel: giữa các điểm ảnh lân cậntrong phạm vi một bức ảnh hay một khung video, còn gọi là thừatĩnh bên trong từng frame

• Độ dư thừa thời gian do các ảnh liên tiếp nhau: giữa các điểm ảnhcủa các khung video trong chuỗi ảnh video, còn gọi là thừa độnggiữa các frame;

• Độ dư thừa do các thành phần màu biễu diễn từng pixel có độtương quan cao

• Độ dư thừa thống kê do bản thân các kí hiệu xuất hiện trong dòngbit với các xác suất xuất hiện không đều nhau

• Độ dư thừa tâm lý thị giác ( các thông tin nằm ngoài khả năng cảmnhận của mắt ): thông tin không phù hợp với hệ thống thị giác con

Trang 6

người, những tần số quá cao so với cảm nhận của mắt conngười…

• Truyền hình số

• Đồ họa tương tác

• World Wide Web

Tóm lại, nén video là điều luôn cần thiết trong việc bùng nổ của việc traođổi thông tin hiện nay với sự ra đời của nhiều chuẩn nén hiện nay như : JPEG,M-JPEG, MPEG, DV…Trong đó chuẩn nén MPEG được sử dụng nhiều trongnén video trong truyền hình.Và theo một thống kê không đầy đủ, thì hầu hết mọivideo trên internet đều đã được nén theo chuẩn MPEG-4 Nó có thể làm giảmlượng thông tin không quan trọng một cách đáng kể, mặt khác nó còn giúp tínhiệu được bảo mật hơn

Trang 7

1.2 Tổng quan về chuẩn nén.

Hiệp hội viễn thông quốc tế (ITU) và tổ chức tiêu chuẩn quốc tế/ Uỷ ban kỹthuật điện tử quốc tế (ISO/IEC) là hai tổ chức phát triển các tiêu chuẩn mã hoáVideo Theo ITU-T, các tiêu chuẩn mã hoá Video được coi là các khuyến nghịgọi tắt là chuẩn H.26x (H.261, H.262, H.263 và H.264) Với tiêu chuẩnISO/IEC, chúng được gọi là MPEG-x (như MPEG-1, MPEG-2 và MPEG-4).MPEG hay gọn hơn là MPG có xuất xứ từ Moving Picture Experts Group(Nhóm các chuyên gia điện ảnh) Tổ chức ra đời hồi năm 1988 này chuyên pháttriển các tiêu chuẩn về nén phim số (Digital Video) và âm thanh số (DigitalAudio)

Cho đến nay nhóm làm việc MPEG đã phát triển và phát hành nhiều tiêuchuẩn nén cho các loại ứng dụng khác nhau, nhưng nổi bật là các chuẩn MPEG-

1, MPEG-2, MPEG-4 và MPEG-4 AVC

Tiêu chuẩn MPEG-1

Xuất hiện vào 11/1192 là chuẩn khởi đầu cho phép nén các ảnhđộng và là nền tảng phát triển cho các chuẩn nén MPEG sau đó Nóđược coi là chuẩn “khởi động thiết bị số” Phần phim ảnh của MPEG

1 sử dụng các phương pháp nén ảnh để làm giảm tốc độ dữ liệu theoyêu cầu của một luồng phim ảnh Phương pháp nén ảnh sẽ giảm hoặcloại bỏ hoàn toàn thông tin dữ liệu trông một giải tần số nhất định vàcác khu vực hình ảnh mà mắt người nhận biết một cách hạn chế Cácthuật toán nén phim ảnh và các bộ mã hóa, giải mã đều kết hợp kỹthuật nén ảnh theo không gian và kỹ thuật bù đắp chuyển động theothời gian.MPEG 1 phần phim ảnh hỗ trợ độ phân giải lên đến4095x4095 và tốc độ bít lên đến 100Mbit/s Phần này thường sử dụng

độ phân giải SIF (Source input Format):352x240, 352x288, 320x240kết hợp với tốc độ bit thấp tạo nên dòng dữ liệu bít thấp với thông sốhạn chế Đảm bảo sự cân bằng giữa chất lượng phim ảnh và hiệu quả

sử dụng cho phép triển khai trên các hệ thống phần cứng có chi phí

Trang 8

không cao Phần âm thanh được chia làm 3 lớp: phần âm thanh lớp 1

Tiêu chẩn MPEG-2

Kỹ thuật nén MPEG-2 xuất hiện vào năm 1995, định nghĩa chomột tiêu chuẩn kỹ thuật “truyền hình số” nén ảnh phim ảnh MPEG-2đạt tốc độ rất cao nhờ khai thác các thông tin dư thừa trong phim ảnh.MPEG-2 loại bỏ cả sự dư thừa thời gian và dư thừa không gian xuấthiện trong phim ảnh chuyển động Dòng thừa thời gian phát sinh khikhung hình kế tiếp của phim ảnh hiển thị hình ảnh của cùng một cảnh

Nó có chung nội dung của một cảnh để giữ cố định hoặc thay đổi mộtchút không hình kế tiếp Dòng thừa không gian xảy ra do các vùng củamột bức hình được thay đổi rất nhỏ trong một khung hình duy nhất.MPEG 2 định nghĩa một cơ chế mã hóa âm thanh theo nhiều địnhdạng khác nhau tại các tốc độ bít khác nhau MPEG-2 hỗ trợ truyềnhai loại dữ liệu đó là thông tin về phim ảnh, âm thanh, và dòng dữ liệuđược mang trên đường truyền MPEG-2 và dữ liệu riêng tư như thôngtin cho một người hoặc nhiều người cụ thể MPEG-2 có thể tạo hìnhảnh với độ nét cao hơn và rõ hơn (720x480 và 1280x720) cho phép

mã hóa ở nhiều mức độ phân giải khác nhau đáp ứng cho nhiều ứngdụng như 2-5Mbps trong SDTV và 6-8Mbps trong DVD, 20Mbpstrong HDTV Chuẩn này có tốc độ bit lớn hơn 4Mbit/s MPEG-2 làđinh dạng sử dụng phổ biến trong truyền hình số mặt đất, truyền hình

Trang 9

cáp, truyền hình số vệ tinh DTH, định dạng đĩa quang kỹ thuật sốDVD.

Tiêu chuẩn MPEG-4

Phiên bản đầu tiên của MPEG-4 xuất hiện vào 2/1999 Cuối 1999MPEG-4 v2 ra đời và trở thành tiêu chuẩn quốc tế vào năm 2000.MPEG-4 định nghĩa một tiêu chuẩn cho các ứng dụng truyền thông đaphương tiện , các hình ảnh, âm thanh và dữ liệu đồ họa và việc tái hợpchúng trên thiết bị thu MPEG-4 mã hóa video và audio ở tốc độ bitrất thấp Thực tế tiêu chuẩn đưa ra với 3 dãy tốc độ bit: dưới 64kbps;64÷384kbps; 384Kbps÷4Mbps MPEG-4 cho phép khôi phục lỗi tạiphía thu nên rất thích hợp cho các ứng dụng truyền qua môi trường sẽxảy ra lỗi như mobile, wireless…MPEG-4 cho phép giải mã luồngtext kết hợp với video và các thông tin trong luồng bit có thể hiện thịnhiều dạng khác nhau tùy thuộc vào lựa chọn của người sử dụng nênmang lại hiệu xuất cao

Với MPEG-4, các đối tượng khác nhau trong một khung hình cóthể được mô tả, mã hoá và truyền đi một cách riêng biệt đến bộ giải

mã trong các dòng cơ bản ES (Elementary Stream) khác nhau Cũngnhờ xác định, tách và xử lý riêng các đối tượng (như nhạc nền, âmthanh xa gần, đồ vật, đối tượng ảnh video như con người hay độngvật, nền khung hình …), nên người sử dụng có thể loại bỏ riêng từngđối tượng khỏi khuôn hình Sự tổ hợp lại thành khung hình chỉ đượcthực hiện sau khi giải mã các đối tượng này MPEG 4 được ứng dụngtrong IP TV, Video theo yêu cầu, Mobile TV, Truyền hình hội nghị…

Tiêu chuẩn H.264 (MPEG-4 AVC)

H.264 hiện đang là phương thức tiên tiến nhất trong lĩnh vực nénvideo H.264 là một chuẩn mã hóa và giải mã video và định dạngvideo được dử dụng rộng rãi nhất hiên nay để ghi, nén và chia sẻvideo có độ phân giải cao, dựa trên việc bù trừ chuyển động trên từng

Trang 10

block Nó cho chất lượng hình ảnh tốt nhất khi có cùng dung lượng sovới các chuẩn nén khác MPEG-4 AVC cũng được ứng dụng nhưthuật nén chính trong video độ phân giải cao (HD) Mã hóa video vàaudio với tốc độ bit khoảng 64kbps-150Mbps.

1.3 Kĩ thuật mã hóa video nén theo hướng đối tượng MPEG-4 và ưu điểm của nó

MPEG-4 được coi là một cuộc cách mạng mới trong media số Nó là chuẩnmultimedia toàn cầu thế hệ kế tiếp Nó được thiết kế để truyền tải video với chấtlượng DVD (MPEG-2) qua mạng MPEG-4 có khả năng nén cao và tối ưu hóađược dung lượng băng thông cũng như dung lượng file lưu trữ mà lại đưa ra chấtlượng video chập nhận được

MPEG-4 có phương thức mã hóa và nén video hoàn toàn tối ưu hơn cácchuẩn khác trước nó đó là việc chia nhỏ mỗi lớp video thành các đối tượng riêngbiệt,Thay vì thực hiện truyền tải tất cả các lớp video như ở MPEG-2 thì MPEG-

4 chỉ truyền đi sự thay đổi trong mỗi đối tượng đã được tách ra MPEG-4 ra đờivới khá nhiều tính năng ưu việt sau:

1.3.1 Tính đa năng và có khả năng nâng cấp

Các nhà thiết kế bộ mã hóa MPEG phải đối mặt với rất nhiều vấn đềnhưng vấn đề quan trọng nhất là làm sao thiết kế được một thuật toán nén đanăng ứng dụng cho nhiều hệ thống và có khả năng nâng cấp được trong tươnglai Họ thường mong muốn có được các bộ mã hoá MPEG thích hợp cho nhiềuứng dụng, từ TV màn ảnh rộng, chất lượng cao tới các hệ thống nhỏ, tín hiệuvideo đen trắng cho các hệ thống camera an ninh Hiển nhiên là một hệ thốngnén thiết kế dành cho các phim màn ảnh rộng phải có phần cứng mạnh, bộ nhớlớn hơn là một hệ thống được thiết kế cho hệ thống camera dành cho mục đích

an ninh Các nhà thiết kế giải quyết vấn đề này bằng cách định nghĩa "Level" và

"Profile" cho hệ thống Các "Level" xác định giới hạn khả năng xử lý của phần

Trang 11

cứng và bộ nhớ cần thiết để mã hoá tín hiệu Các "Profile" xác định độ phức tạpcủa quá trình mã hoá và giải mã.Đối với MPEG-4 thì có 9 profile (nhưng đối vớiH.264 chỉ có 3 profile) như sau:

Simple Profiles (Profiles đơn giản ): chỉ cho phép các loại vật đơn

giản (tỷ lệ chiều cao/chiều rộng là tuỳ ý và tỷ lệ bít thấp) và được tạo

ra với các ứng dụng có độ phức tạp không cao trong việc nhận ra vật.Ứng dụng Simple Profiles cho di động, truyền các hình ảnh Video có

độ phức tạp không cao trên Internet hay các thiết bị camera ghi cáchình ảnh động như: đĩa hay chip nhớ Có 3 mức(Levels) được sử dụngcho Simple Profiles với tốc độ bít vào khoảng 64-384 kb/s

Simple Scalable Profile (Profiles phân mức đơn giản): có thể phân

chia việc mã hoá trong cùng một môi trường hoạt động như việc dựđoán trước cho Simple và có 2 mức được định nghĩa ở Profiles này.

Core Profiles (Profiles lõi ) : dùng cho các dịch vụ tương tác chất

lượng cao, phối hợp chất lượng tốt với việc hạn chế độ phức tạp và hỗtrợ tuỳ ý hình dạng của vật Vì vậy các dịch vụ Broadcast di độngđược hỗ trợ cho Profiles này Tốc độ bít tối đa là 384kb/s cho mức 1(Levels 1) và 2Mb/s cho mức 2 (Level 2)

Main Profile (Profiles chính ) : được tạo ra với các dịch vụ quảng bá

broadcast, địa chỉ hoá tiên tiến Nó phối hợp chất lượng cao nhất vớitính linh hoạt của các vật có hình dạng tự do mà sử dụng đến thangmàu nâu để mã hoá Mức cao nhất cho phép 32 vật (có nhiều mức) vàtốc độ bít lớn nhất là 38 Mb/s

N-bít Profiles : hữu ích cho những vùng mà sử dụng những người mô

tả nhiệt độ(thermal imagers), như các ứng dụng kiểm soát Vì vậy cácứng dụng trong y học muốn sử dụng để làm tăng độ sâu của điểm ảnhđưa ra một miền ảnh động lớn trong tín hiệu màu và tín hiệu chói

Trang 12

Scalable Texture Profiles (Profiles phân mức kết cấu ): là giá trị

trung bình cho các ứng dụng âm thanh đồ hoạ Nó được yêu cầu bởicác công ty muốn xây dựng các thiết bị di động, mà có kết nối đồngthời âm thanh và hình ảnh hiển thị, đồ hoạ có dạng thức BIFS cơ sởtrong các thiết bị đầu cuối rất đơn giản

Simple Face Profiles (Profiles bề mặt đơn giản): chỉ cho các vật có

bề mặt đơn giản (các hoạt ảnh) Phụ thuộc vào từng mức, song trongmột khuôn hình tối đa có 4 bề mặt có thể xuất hiện Tốc độ bít cònthấp, 32 kb/s là đủ cho việc truyền tối đa 4 bề mặt

Hybird Profiles (Profiles lai ghép): cho phép liên kết cả các vật tự

nhiên và nhân tạo trong cùng một khuôn hình mà vẫn giữ độ phức tạphợp lý.Với các vật tự nhiên, nó so sánh với Core Profiles, còn với cácvật nhân tạo, nó cộng gộp các hoạt ảnh lưới, kết cấu phân lớp và các

bề mặt hoạt ảnh - thiết lập nên bộ công cụ mà tạo ra sự lai ghép thú vịnội dung của cácvật tự nhiên và nhân tạo Profiles này được sử dụngcho những nơi có vật thật trong thế giới nhân tạo hay ngược lại kếthợp các vật thật vào trong môi trường tự nhiên

Basic Animated Texture Profiles (Profiles kết cấu hoạt ảnh cơ bản):cho phéphoạt ảnh của các hình ảnh tĩnh và các mặt hoạt ảnh.

Dùng cho các nội dung mà được tạo ra với tốc độ bít rất thấp.

Về khả năng nâng cấp của bộ mã hoá MPEG, họ thiết kế theo hai bước.Bước thứ nhất là thay cho xác định chỉ tiêu của bộ mã hoá và giải mã, họ xácđịnh loại tín hiệu nằm giữa hai thiết bị này Bước thứ hai là thực hiện các cảitiến trong bộ mã hoá và giải mã mới sao cho nó tương thích với các chuẩn cũ(backward compatible) Chuẩn MPEG có các qui tắc và giao thức cho tín hiệutruyền giữa bộ mã hoá và giải mã Các quy tắc này, thực chất giống như là mộtloại ngôn ngữ dành riêng cho bộ mã hoá và giải mã Các bộ mã hoá tương thích

Trang 13

phải có khả năng “nói” được ngôn ngữ này Các bộ giải mã tương thích phải cókhả năng hiểu được toàn bộ các "từ vựng" mà bộ mã hoá đã phát ra trong mộtngữ cảnh nhất định MPEG-4 thực hiện điều này bằng cách tạo ra một bộ cáccông cụ dùng để nén tín hiệu trong các trường hợp khác nhau Một trong cáccông cụ này, chuyển đổi cosine rời rạc (DCT - discrete cosine transform), cónhiệm vụ chuyển đổi một khối 8x8 pixel thành một tập các hệ số.

1.3.2 MPEG-4 đem lại công cụ nén mới

Ta hãy xem xét các cộng cụ nén mới mà chuẩn MPEG-4 mang tới lĩnh vựcnén ảnh Hình 1.1 so sánh các công cụ của chuẩn MPEG-2 và MPEG-4

Chuẩn MPEG-4 đi xa hơn, theo hình 1.2, nó có thể dự đoán hệ số của toàn

bộ các khối trên một hàng hay hệ số của các khối ở cột bên trái từ một khối đầutiên

13

Hình 1.1: Công cụ nén mới của MPEG-4 so với MPEG-2.

Trang 14

Việc dự đoán các hệ số của hàng hay của cột dựa trên nội dung của hìnhảnh Ví dụ, một ảnh chứa một vật thể theo chiều đứng như cái cọc chẳng hạn.Khi đó quét ảnh này theo chiều ngang sẽ tạo ra sự thay đổi lớn trong các hệ sốsau DCT khi gặp hình ảnh cái cọc này Trái lại, khi quét theo chiều đứng thì cáckhối nằm trong một cột có các hệ số DCT gần giống nhau, từ đó có thể nén với

tỉ lệ nén cao hơn

MPEG-4 mở rộng cách dự đoán vector chuyển động MPEG-4 có thể dựđoán vector cho một macroblock (khối vĩ mô) từ các macroblock ở trên hay ởbên trái, và nó chỉ gửi đi sự sai khác so với các vector cũ mà thôi Do đó giảm đi

dữ liệu cần thiết dùng để mã hoá một vector, cho phép có thể dùng một vectorcho mỗi khối DCT Việc dự đoán chuyển động sẽ tốt hơn với 4 vector, giảm nhỏlỗi khi dự đoán

Chất lượng hình ảnh có thể được cải thiện đáng kể bằng cách dùng tỉ lệ nén

dữ liệu lớn hơn mà không cần thay đổi độ phân giải MPEG không phải là mộtcông cụ nén đơn lẻ mà ưu điểm của nén MPEG chính là ở chỗ nó có một tập hợpcác công cụ mã hoá chuẩn, chúng có thể được kết hợp với nhau một cách linhđộng để phục vụ cho một loạt các ứng dụng khác nhau, khả năng truyền dẫn tốttrong môi trường truyền dẫn khắc nhiệt

1.3.3 Tiểm năng của công nghệ MPEG-4.

MPEG-4 là chuẩn nén video được đánh giá là giàu tham vọng nhất Cácnhà nghiên cứu muốn huy động các yếu tố như sự tổng hợp thoại và hình, hìnhhọc bất quy tắc, trực quan máy tính và trí thông minh nhân tạo (AI) để tái tạo lạicác hình ảnh

So với MPEG-1 và MPEG-2 thì MPEG-4 vượt trội hơn hẳn Cụ thể:

• MPEG-1 được thiết kế để mã hõa video với tốc độ 1,5 Mbps và chỉ thaotác với các ảnh nguyên vẹn

• MPEG-2 được thiết kế nhằm hỗ trợ việc truyền video số tốc độ bitlớn hơn 4 Mbps và cũng chỉ thao tác với các ảnh nguyên vẹn

Trang 15

Hình 1.3:Đầu vào của bộ mã hóa MPEG-2

• MPEG-4 cho phép sử dụng tốc độ bit lên đến 38.4 Mbps và việc xử

lý chất lượng studio cần các đặc tính và mức độ lên đến 1.2Gbps và cóthể làm việc được với các hình ảnh được tạo ra, hay đã được máy tính

xử lý

Hình 1.4:Bộ mã hóa MPEG-4 có thể xử lý các lệnh đồ họa một cách trực tiếp

Chuẩn MPEG-4 có thể làm việc được với 4 loại đối tượng, như hình 1.5.

Hình 1.5 cho thấy chuẩn MPEG-4 đã chuẩn hoá phương pháp truyền các đốitượng 3 chiều nhờ các đối tượng lưới (mesh object), cùng với các phương tiệnánh xạ bề mặt vật thể lên các đối tượng này, chuẩn này có thể xử lý các đốitượng có hình dạng bất kỳ

Trang 16

Hình 1.5 :MPEG4 đã chuẩn hóa phương pháp truyền các đối tượng 3 chiều

1 3.4 Audio, video và tất cả các đối tượng khác có thể được đồng bộ chặt chẽ với độ chính xác cao và có khả năng tương tác.

Truyền thông multimedia theo dòng (Multimedia stream), trong đó dòngaudio và video sẽ được biến đổi thích nghi với yêu cầu băng thông và chất lượnghình nhờ loại bỏ những đối tượng (hình ảnh, âm thanh) không cần thiết khỏidòng dữ liệu và đồng bộ các thông tin được nhúng trong dòng dữ liệu đó Thêmvào đó, MPEG-4 sẽ cho phép người sử dụng có khả năng tương tác trực tiếp vớidòng dữ liệu (dừng, tiến hay lùi nhanh, kích chuột để kích hoạt các tuỳ chọnvideo và audio…)

Lưu giữ và phục hồi dữ liệu audio và video: do MPEG-4 phân chia cáckhung hình thành các đối tượng, việc trình duyệt Browser trên cơ sở nội dung(đối tượng) mong muốn sẽ được thực hiện một cách dễ dàng và nhờ vậy, cácứng dụng lưu giữ hay phục hồi thông tin trên cơ sở nội dung MPEG-4 sẽ đượcthuận lợi hơn

Truyền thông báo đa phương tiện: các thông báo dưới dạng text, audio vàvideo MPEG-4 sẽ được truyền đi với yêu cầu băng thông ít hơn, và có khả năng

tự điều chỉnh chất lượng cho phù hợp với khả năng băng thông của thiết bị giảimã

Thông tin giải trí: những sự trình diễn nghe nhìn tương tác (thế giới ảo, tròchơi tương tác …) có thể được triển khai trên cơ sở chuẩn MPEG-4 sẽ làm giảm

Trang 17

yêu cầu về băng thông và làm cho thế giới ảo trở nên sinh động và giống nhưthực tế trên các trang web.

CHƯƠNG 2 :CÔNG NGHỆ MÃ HÓA VIDEO TRONG MPEG-4

MPEG-4 là sản phẩm của nhóm MPEG (Moving Picture Expert Group)được thành lập tháng 1/1988 với nhiệm vụ phát triển các chuẩn xử lý, mã hoá vàhiển thị các ảnh động, audio và các tổ hợp của chúng

Sản phẩm đầu tiên của nhóm này là MPEG-1 được sử dụng cho việc mãhoá các dữ liệu nghe nhìn với tốc độ 1,5 Mbps Sản phẩm thứ hai của nhóm làchuẩn MPEG-2 nổi tiếng hiện nay, mang tính tổng quát hơn và đang được ápdụng cho một loạt các ứng dụng nghe nhìn trong phạm vi tốc độ từ 3-40 Mbps.

Không giống các chuẩn MPEG trước đó, ví dụ như trong MPEG-2, nơi mànội dung được tạo ra từ nhiều nguồn như video ảnh động, đồ họa, văn bản…vàđược tổ hợp thành chuỗi các khung hình phẳng, mỗi khung hình (bao gồm cácđối tượng như người, đồ vật, âm thanh, nền khung hình…) được chia thành cácphần tử ảnh pixels và xử lý đồng thời, giống như cảm nhận của con người thôngqua các giác quan trong thực tế Các pixels này được mã hoá như thể tất cảchúng đều là các phần tử ảnh video ảnh động Tại phía thu của người sử dụng,quá trình giải mã diễn ra ngược với quá trình mã hoá không khó khăn Vì vậy cóthể coi MPEG-2 là một công cụ hiển thị tĩnh, và nếu một nhà truyền thôngtruyền phát lại chương trình của một nhà truyền thông khác về một sự kiện, thìlogo của nhà sản xuất chương trình này không thể loại bỏ được Với MPEG-2,bạn có thể bổ xung thêm các phần tử đồ hoạ và văn bản vào chương trình hiểnthị cuối cùng (theo phương thức chồng lớp), nhưng không thể xoá bớt các đồhoạ và văn bản có trong chương trình gốc

Chuẩn MPEG-4 khắc phục được hạn chế này và là một chuẩn động dễ thayđổi Với MPEG-4, các đối tượng khác nhau trong một khung hình có thể được

mô tả, mã hoá và truyền đi một cách riêng biệt đến bộ giải mã trong các dòng cơ

Trang 18

bản ES (Elementary Stream) khác nhau Cũng nhờ xác định, tách và xử lý riêngcác đối tượng (như nhạc nền, âm thanh xa gần, đồ vật, đối tượng ảnh video nhưcon người hay động vật, nền khung hình …), nên người sử dụng có thể loại bỏriêng từng đối tượng khỏi khuôn hình Sự tổ hợp lại thành khung hình chỉ đượcthực hiện sau khi giải mã các đối tượng này.

Hình 2.1: Cấu trúc của bộ mã hoá và giải mã video MPEG-4 Các bộ phận chức năng chính trong các thiết bị MPEG-4 bao gồm:

• Bộ mã hoá hình dạng ngoài Shape Coder dùng để nén đoạn thông tin,giúp xác định khu vực và đường viền bao quanh đối tượng trongkhung hình scene

• Bộ dự đoán và tổng hợp động để giảm thông tin dư thừa theo thờigian

• Bộ mã kết cấu mặt ngoài Texture coder dùng để xử lý dữ liệu bêntrong và các dữ liệu còn lại sau khi đã bù chuyển động

2.1 Mã hóa hình dạng ngoài (shape coder)

Khung hình: là thành phần mã hoá chính của MPEG 4 Thường thì chúng

ta có thể phân biệt sự thay đổi về độ sáng của ảnh tốt hơn so với sự thay đổi vềmàu sắc Do đó trước hết các sơ đồ nén MPEG sẽ tiến hành chia khung hìnhthành các thành phần độ sáng Y và hai thành phần độ màu Cb, Cr (một thànhphần về độ sáng và hai thành phần về độ màu) theo tỉ lệ 4/2/2 Cứ 4 giá trị Y lại

Trang 19

có 2 giá trị kết hợp một của Cb và một của Cr (Vị trí của giá trị Cb và Cr làtương đương) như hình 2.1.

Các bộ lọc tiền xử lý sẽ lọc ra những thông tin không cần thiết từ tín hiệuvideo và những thông tin khó mã hoá nhưng không quan trọng cho sự cảm thụcủa mắt người Kỹ thuật đoán chuyển động dựa trên nguyên tắc là các khunghình trong một cảnh video có liên quan mật thiết với nhau theo thời gian: Mỗikhung hình tại một thời điểm nhất định sẽ có nhiều khả năng giống với cáckhung hình đứng ngay phía trước và ngay phía sau nó Do vậy ở phía bộ mã hoá,chỉ cần gửi những khung hình có thay đổi so với những khung hình trước, sau

đó dùng phương pháp nén về không gian để loại bỏ sự dư thừa về không giantrong chính khung hình sai khác này Trong MPEG-4 đây là yếu tố ít có sự thayđổi nhất, các bước mã hóa khung hình cũng tương tư như mã hóa ảnh Thuậttoán mã hoá biến đổi gồm các bước :

• Biến đổi Cosine rời rạc (DCT)

Hình 2.2: Kiến trúc khối Macroblock

Trang 20

• Lượng tử hoá.

• Mã hóa

2.1.1 Biến đổi Cosin rời rạc ( DCT )

Sơ đồ thuật toán nén và giải nén được mô tả dưới đây:

Quá trình nén ảnh sẽ được thực hiện như hình 2.3 Ảnh sẽ được chia thànhcác khối vuông 8x8, rồi mới được đưa vào biến đổi DCT Trước khi được mãhóa ảnh sẽ được lượng tử hóa để loại bớt các thông tin dư thừa trong ảnh Saukhi đã lượng tử hóa ảnh được mã hóa và nén lại Ảnh lúc này có dung lượng nhỏhơn so với ảnh gốc mà chất lượng ảnh vẫn được đảm bảo

Quá trình giải nén sẽ được làm ngược lại như hình 2.4, người ta giải mãtừng phần ảnh nén tương ứng với phương pháp nén đã sử dụng trong phần nénnhờ các thông tin liên quan ghi trong phần header của file nén Kết quả thu được

Hình 2.3: Sơ đồ thuật toán nén ảnh

Hình 2.4: Sơ đồ thuật toán giải nén ảnh

Trang 21

là hệ số đã lượng tử Các hệ số này được khôi phục về giá trị trước khi lượng tửhóa bằng bộ tương tự hóa Tiếp đó đem biến đổi Cosin ngược ta được ảnh banđầu với độ trung thực nhất định.Bảng mã và bảng lượng tử trong sơ đồ giải nénđược dựng lên nhờ những thông tin ghi trong phần cấu trúc đầu tệp ( Header)của tệp ảnh nén Quá trình nén chịu trách nhiệm tạo ra và ghi lại những thông tinnày.

Tiếp theo sẽ phân tích tác dụng của từng khối trong sơ đồ 2.3:

số chung, mặt khác biến đổi cosin đối với các khối nhỏ sẽ làm tăng độchính xác khi tính toán với dấu phẩy tĩnh, giảm thiểu sai số do làmtròn sinh ra Biến đổi DCT là một công đoạn chính trong các phươngpháp nén có sử dụng sự biến đổi điểm ảnh Hai công thức ở đây minhhoạ cho hai phép biến đổi DCT thuận nghịch đối với mỗi khối ảnh cókích thước 8 x 8 Giá trị x(n1, n2) biểu diễn các mức xám của ảnh trongmiền không gian, X(k1, k2) là các hệ số sau biến đổi DCT trong miềntần số

Công thức biến đổi :

Biến đổi điểm ảnh là một trong những công đoạn lớn trong cácphương pháp nén sử dụng phép biến đổi Nhiệm vụ của công đoạnbiến đổi điểm ảnh là tập trung năng lượng vào một số ít các hệ số biếnđổi Công thức biến đổi cho mỗi khối được biểu diễn như sau:

Trang 22

Thuật toán biến đổi DCT cho mỗi khối trong trường hợp này sẽ bao gồm

16 phép biến đổi DCT Đầu tiên, người ta biến đổi nhanh Cosin một chiều chocác dãy điểm ảnh trên mỗi hàng Lần lượt thực hiện cho 8 hàng Sau đó đembiến đổi nhanh Cosin một chiều theo từng cột của ma trận vừa thu được sau 8phép biến đổi trên Cũng lần lượt thực hiện cho 8 cột Ma trận cuối cùng sẽ là

ma trận hệ số biến đổi của khối tương ứng.Trong sơ đồ giải nén ta phải dùngphép biến đổi Cosin ngược Công thức biến đổi ngược cho khối 8x8 như sau :

Với :

2.1.2 Lượng tử hóa.

Khối lượng tử hóa trong sơ đồ nén đóng vai trò quan trong và quyết định tỉ

lệ nén của chuẩn nén MPEG Đầu vào của khối lượng tử hóa là các ma trận hệ

số sau khi biến đổi Cosin rời rạc của các khối điểm ảnh Sau khi thực hiện biếnđối DCT, 64 hệ số sẽ được lượng tử hoá dựa trên một bảng lượng tử gồm 64

phần tử Q(u,v) với 0≤u, v≤7 Bảng này được định nghĩa bởi từng ứng dụng cụ

thể Các phần tử trong bảng lượng tử có giá trị từ 1 đến 255 được gọi là cácbước nhảy cho các hệ số DCT Quá trình lượng tử được coi như là việc chia các

hệ số DCT cho bước nhảy lượng tử tương ứng, kết quả này sau đó sẽ được làmtròn xuống số nguyên gần nhất

= = 1/ khi k=0

0 khi 1<k<8

Trang 23

Công thức (3) thể hiện việc lượng tử với F(u,v) là các hệ số DCT, F Q (u,v)

là các hệ số sau lượng tử, các hệ số này sẽ được đưa vào bộ mã hoá Entropy để

mã hóa

Quá trình giải lượng tử ở phía bộ giải mã được thực hiên ngược lại Các hệ

số sau đã giải mã entropy sẽ nhân với các bước nhảy trong bảng lượng tử (bảnglượng tử được đặt trong phần header của ảnh JPEG) Kết quả này sau đó sẽ đượcđưa vào biến đổi DCT ngược Để nâng cao hiệu quả nén cho mỗi bộ hệ số trongmột khối, người ta xếp chúng lại theo thứ tự ZigZag Tác dụng của sắp xếp lạitheo thứ tự ZigZag là tạo ra nhiều loại hệ số giống nhau Chúng ta biết rằngnăng lượng của khối hệ số giảm dần từ góc trên bên trái xuống góc dưới bênphải nên việc sắp xếp lại các hệ số theo thứ tự ZigZag sẽ tạo điều kiện cho các

hệ số xấp xỉ nhau cùng mức lượng tử nằm trên một dòng

Mỗi khối ZigZag này được mã hóa theo phương pháp RLE Cuối mỗi khốiđầu ra của RLE, ta đặt dấu kết thúc khối EOB (End Of Block) Sau đó, các khối

(3)

Hình 2.5 : Ví dụ về các bước của quá trình biến đổi DCT và

lượng tử hóa

Trang 24

được dồn lại và mã hóa một lần bằng phương pháp mã Huffman Nhờ có dấu kếtthúc khối nên có thể phân biệt được hai khối cạnh nhau khi giải mã Huffman.Hai bảng mã Huffman cho hai thành phần hệ số tất nhiên sẽ khác nhau Để cóthể giải nén được, chúng ta phải ghi lại thông tin như: kích thước ảnh, kíchthước khối, ma trận Y, độ lệch tiêu chuẩn, các mức tạo lại, hai bảng mãHuffman, kích thước khối nén một chiều, kích thước khối nén xoay chiều…vàghi nối tiếp vào hai file nén của thành phần hệ số.

2.1.3 Mã hóa

Mã hoá là bước cuối cùng trong hệ thống nén ảnh dựa trên biến đổi DCT.MPEG 4 chia video ra thành các khung hình và nén khung hình theo chuẩn nén

ảnh JPEG

Hiện nay, chuẩn nén ảnh JPEG dùng phương pháp mã hoá Huffman, đây

là phép mã hoá không làm mất thông tin Phương pháp này dựa trên mô hìnhthống kê Dựa vào dữ liệu gốc, người ta tính tần suất xuất hiện các hệ số Việctính tần suất được thực hiện bằng cách duyệt tuần tự từ đầu khối đến cuối khối,sau đó, những hệ số có tần suất cao được gắn cho một từ mã ngắn, các hệ số cótần suất thấp được gán một từ mã dài Với cách thức này chiều dài trung bìnhcủa từ mã đã giảm xuống

Hình 2.6: Đường ZicZig

Trang 25

Các hệ số thu được sau khi lượng tử hoá sẽ được sắp xếp thành một chuỗicác ký hiệu theo kiểu “zig-zag” (theo đường zig-zag) để đặt các hệ số có tần sốthấp lên trước các hệ số tần số cao Các hệ số này sẽ được mã hoá dựa trên bảng

mã Huffman sao cho chiều dài trung bình của từ mã là nhỏ nhất Bảng mã nàycũng sẽ được đặt trong phần mào đầu của ảnh để thực hiện giải nén ảnh

Thuật toán mã hóa Huffman :

Bài toán : Có một bảng tin là dãy các ký hiệu lấy trong một tập hữu hạn A.

Mỗi ký hiệu xuất hiện trong bản tin theo một tần xuất đã biết Hãy xây dựng bộ

mã tiền tố cho tập A sao cho độ dài chuỗi mã là ngắn nhất

Các bước xây dựng cây nhị phân để tạo ra bảng mã Huffman như sau:

Bước 1: Xây dựng rừng T có l cây, mỗi cây chỉ gồm một đỉnh tương ứng với một kí hiệu x trong A và được gán nhãn

• Bước 2 : Chọn hai cây trong T có gốc với nhãn là nhỏ nhất Thêm mộtđỉnh mới với nhãn lớn hơn hoặc là tổng các nhãn của hai cây gốc vừachọn Nối đỉnh mới với hai gốc này bằng hai cạnh có nhãn 0,1 để tạothành một cây nhị phân

• Bước 3: Nếu T vẫn chưa phải là một cây nhị phân thì lặp lại bước 2,ngược lại thì dừng

Trang 26

Kết quả bảng mã Huffman:

2.2 Dự đoán và tổng hợp

Mỗi lớp video bao gồm các đối tượng riêng rẽ Mỗi đối tượng riêng rẽ

ấy gọi là VOP Khi 1 VOP được tách ra,VOP đó sẽ được đưa vào bộ mã hóa vàđược thực hiện mã hóa như sau :

Hình 2.7: Xây dựng cây nhị phân Huffman tối ưu

Trang 27

Hình 2.8: Cấu trúc mã hóa một VOP 2.2.1 Ước lượng chuyển động

Nén MPEG là sự kết hợp hài hoà của bốn kỹ thuật cơ bản: Tiền xử lý(Preprocessing), đoán trước sự chuyển động của các khung hình (Picture) ở bộ

mã hoá (Temporal Prediction), bù chuyển động ở bộ giải mã (MotionCompensation) và mã lượng tử hoá (Quatization Coding) Các bộ lọc tiền xử lý

sẽ lọc ra những thông tin không cần thiết từ tín hiệu Video và những thông tinkhó mã hoá nhưng không quan trọng cho sự cảm nhận của mắt người Kỹ thuậtđoán chuyển động dựa trên nguyên tắc là các khung hình trong một cảnh Video(Video Sequence) dường như có liên quan mật thiết với nhau theo thời gian.Mỗi khung hình tại một thời điểm nhất định sẽ có nhiều khả năng giống với cáckhung hình đứng ngay phía trước và ngay phía sau nó Các bộ mã hoá sẽ tiếnhành quét lần lượt từng phần nhỏ trong mỗi khung hình gọi là MB, sau đó nó sẽphát hiện MB nào không thay đổi từ khung hình này tới khung hình khác Bộ mãhoá sẽ dự đoán trước sự xuất hiện của các MB khi biết vị trí và hướng chuyểnđộng của nó Do đó chỉ những sự thay đổi giữa các MB trong khung hình hiệntại và các MB được dự đoán mới được truyền tới bên phía thu

Trang 28

Phía bên thu tức bộ giải mã đã lưu trữ sẵn những thông tin mà khôngthay đổi từ khung hình này tới khung hình khác trong bộ nhớ đệm của nó vàchúng được dùng để điền thêm một cách đều đặn vào các vị trí trống trong ảnhđược khôi phục.

Nén tín hiệu Video được thực hiện nhờ việc loại bỏ cả sự dư thừa vềkhông gian (Spatial Coding) và thời gian (Temporal Coding) Trong MPEG,việc loại bỏ dư thừa về thời gian (nén liên khung hình) được thực hiện trước hếtnhờ sử dụng các tính chất giống nhau giữa các khung hình liên tiếp (Inter-Picture) Chúng ta có thể sử dụng tính chất này để tạo ra các khung hình mớinhờ vào những thông tin từ những khung hình đã gửi trước nó Do vậy ở phía bộ

mã hoá, chỉ cần gửi những khung hình có thay đổi so với những khung hìnhtrước, sau đó dùng phương pháp nén về không gian (Spatial Coding) để loại bỏ

sự dư thừa về không gian trong chính khung hình sai khác này Nén về khônggian dựa trên nguyên tắc là phát hiện sự giống nhau của các điểm ảnh (pixel) lâncận nhau (Intra-Picture)

2.2.3 Kỹ thuật chuyển động cơ bản

MPEG-4 sử dụng một số kỹ thuật tượng tự như ITU-T.263 để mã hóa dữliệu chuyển động Các khái niệm về kỹ thuật chuyển động cơ bản sẽ được trìnhbày ở các mục dưới đây:

Trang 29

2.2.3.1 Kỹ thuật thay đổi từng khối thích ứng với cấu trúc đa cạnh của VOP

Các hình chữ nhật có chứa các VOP được mở rộng về bên phải và phíadưới cùng theo bội số của kích thước MB Kích cỡ của hình chữ nhật cho độchói VOP là bội số của 16x16, và kích thước cho màu là bội số của 8x8 Các giátrị alpha của các điểm ảnh mở rộng (ví dụ như bên ngoài ranh giới của VOP)được thiết lập là rỗng Các MB được hình thành bởi các phân vùng mở rộngranh giới của khối hình chữ nhật 16 x 16 Trong quá trình dự đoán chuyểnđộng, giá trị SAD (tổng sự khác nhau tuyệt đối của các điểm ảnh) được sử dụngnhư 1 công cụ để tìm ra độ sai lệch.Việc xây dựng lại các anpha Plane của VOP

có sử dụng cả các điểm ảnh của các MB mà chúng nằm ngoài VOP.Giá trị SADchỉ được tính cho các điểm ảnh có giá trị khác 0 Công thức này được áp dụng

cả với các MB thuộc đường biên của VOP Kỹ thuật này được áp dụng nhưtrong hình 2.7

Hình 2.9: Kỹ thuật thay đổi từng khối thích ứng với cấu trúc đa cạnh của

VOP

2.2.3.2 Ước lượng chuyển động của điểm ảnh

Việc tìm kiếm sự thay đổi về thành phần độ sáng ( theo phương Y ) đượcthực hiện hiệu quả khi ta tìm kiếm trên 1 số nguyên điểm ảnh.Việc so sánh đượcdiễn ra giữa MB hiện tại với MB đã bị thay thế trước đó.Việc tìm kiếm đượcthực hiện trong một cửa sổ có độ rộng lên tới ± 31,5 pixel theo cả phương ngang

và phương thẳng đứng quanh vị trí MB ban đầu

Trang 30

Hình 2.10: Cửa sổ mở rộng cho việc tìm kiếm sự thay đổi theo phương Y

Từ đó ta tính được SAD như sau:

Trong đó: SADN(x,y) là giá trị SAD của MB tại tọa độ (x , y)

Original: là giá trị điểm ảnh ij hiện tạiPrevious: là giá trị điểm ảnh ij trước đó đã bị thay thế

!(Alphaoriginal=0) : là một hệ số khác 0Trong miền không gian mở rộng tìm kiếm,những nơi mà (x,y) lên tới lên ± 31,5 pixel với N =16 hoặc 8 Để ưu tiên cho vector rỗng khi không có sự khác biệt thì véc tơ rỗng SAD (0, 0) được sử dụng theo công thức:

với NB là số chỉ số của MB bên trong các VOP Cặp kết quả (x,y) thấpnhất trong SAD16 được chọn như 16x16 điểm ảnh nguyên của MV, V0 Trongchế độ nâng cao chất lượng dự đoán chuyển động 4 MVs 8x8 đại diện cho mỗi16x16 MB Các SAD 8x8 cho MB sẽ được tính như sau :

Ngày đăng: 25/10/2016, 02:37

HÌNH ẢNH LIÊN QUAN

Hình  1.1: Công cụ nén mới của MPEG-4 so với MPEG-2. - PHƯƠNG PHÁP MÃ HÓA VIDEO THEO ĐỐI TƯỢNG ỨNG DỤNG TRONG CÁC HỆ THỐNG THÔNG TIN VIDEO NÉN
nh 1.1: Công cụ nén mới của MPEG-4 so với MPEG-2 (Trang 13)
Hình  1.3:Đầu vào của bộ mã hóa MPEG-2 - PHƯƠNG PHÁP MÃ HÓA VIDEO THEO ĐỐI TƯỢNG ỨNG DỤNG TRONG CÁC HỆ THỐNG THÔNG TIN VIDEO NÉN
nh 1.3:Đầu vào của bộ mã hóa MPEG-2 (Trang 15)
Hình  1.4:Bộ mã hóa MPEG-4 có thể xử lý các lệnh đồ họa một cách trực tiếp - PHƯƠNG PHÁP MÃ HÓA VIDEO THEO ĐỐI TƯỢNG ỨNG DỤNG TRONG CÁC HỆ THỐNG THÔNG TIN VIDEO NÉN
nh 1.4:Bộ mã hóa MPEG-4 có thể xử lý các lệnh đồ họa một cách trực tiếp (Trang 15)
Hình  1.5 :MPEG4 đã chuẩn hóa phương pháp truyền các đối tượng 3 chiều  1 .3.4 Audio, video và tất cả các đối tượng khác có thể được đồng bộ  chặt chẽ với độ chính xác cao và có khả năng tương tác. - PHƯƠNG PHÁP MÃ HÓA VIDEO THEO ĐỐI TƯỢNG ỨNG DỤNG TRONG CÁC HỆ THỐNG THÔNG TIN VIDEO NÉN
nh 1.5 :MPEG4 đã chuẩn hóa phương pháp truyền các đối tượng 3 chiều 1 .3.4 Audio, video và tất cả các đối tượng khác có thể được đồng bộ chặt chẽ với độ chính xác cao và có khả năng tương tác (Trang 16)
Hình  2.1: Cấu trúc của bộ mã hoá và giải mã video MPEG-4 Các bộ phận chức năng chính trong các thiết bị MPEG-4 bao gồm: - PHƯƠNG PHÁP MÃ HÓA VIDEO THEO ĐỐI TƯỢNG ỨNG DỤNG TRONG CÁC HỆ THỐNG THÔNG TIN VIDEO NÉN
nh 2.1: Cấu trúc của bộ mã hoá và giải mã video MPEG-4 Các bộ phận chức năng chính trong các thiết bị MPEG-4 bao gồm: (Trang 18)
Hình  2.2: Kiến trúc khối Macroblock - PHƯƠNG PHÁP MÃ HÓA VIDEO THEO ĐỐI TƯỢNG ỨNG DỤNG TRONG CÁC HỆ THỐNG THÔNG TIN VIDEO NÉN
nh 2.2: Kiến trúc khối Macroblock (Trang 19)
Sơ đồ thuật toán nén và giải nén được mô tả dưới đây: - PHƯƠNG PHÁP MÃ HÓA VIDEO THEO ĐỐI TƯỢNG ỨNG DỤNG TRONG CÁC HỆ THỐNG THÔNG TIN VIDEO NÉN
Sơ đồ thu ật toán nén và giải nén được mô tả dưới đây: (Trang 20)
Hình  2.3: Sơ đồ thuật toán nén ảnh - PHƯƠNG PHÁP MÃ HÓA VIDEO THEO ĐỐI TƯỢNG ỨNG DỤNG TRONG CÁC HỆ THỐNG THÔNG TIN VIDEO NÉN
nh 2.3: Sơ đồ thuật toán nén ảnh (Trang 20)
Hình  2.6: Đường ZicZig - PHƯƠNG PHÁP MÃ HÓA VIDEO THEO ĐỐI TƯỢNG ỨNG DỤNG TRONG CÁC HỆ THỐNG THÔNG TIN VIDEO NÉN
nh 2.6: Đường ZicZig (Trang 24)
Hình  2.7: Xây dựng cây nhị phân Huffman tối ưu - PHƯƠNG PHÁP MÃ HÓA VIDEO THEO ĐỐI TƯỢNG ỨNG DỤNG TRONG CÁC HỆ THỐNG THÔNG TIN VIDEO NÉN
nh 2.7: Xây dựng cây nhị phân Huffman tối ưu (Trang 26)
Hình  2.8: Cấu trúc mã hóa một VOP 2.2.1 Ước lượng chuyển động - PHƯƠNG PHÁP MÃ HÓA VIDEO THEO ĐỐI TƯỢNG ỨNG DỤNG TRONG CÁC HỆ THỐNG THÔNG TIN VIDEO NÉN
nh 2.8: Cấu trúc mã hóa một VOP 2.2.1 Ước lượng chuyển động (Trang 27)
Hình  2.9: Kỹ thuật thay đổi từng khối thích ứng với cấu trúc đa cạnh của VOP - PHƯƠNG PHÁP MÃ HÓA VIDEO THEO ĐỐI TƯỢNG ỨNG DỤNG TRONG CÁC HỆ THỐNG THÔNG TIN VIDEO NÉN
nh 2.9: Kỹ thuật thay đổi từng khối thích ứng với cấu trúc đa cạnh của VOP (Trang 29)
Hình  2.10: Cửa sổ mở rộng cho việc tìm kiếm sự thay đổi theo phương Y - PHƯƠNG PHÁP MÃ HÓA VIDEO THEO ĐỐI TƯỢNG ỨNG DỤNG TRONG CÁC HỆ THỐNG THÔNG TIN VIDEO NÉN
nh 2.10: Cửa sổ mở rộng cho việc tìm kiếm sự thay đổi theo phương Y (Trang 30)
Hình  2.11: Tìm kiếm giá trị nửa điểm ảnh bằng phép nội suy - PHƯƠNG PHÁP MÃ HÓA VIDEO THEO ĐỐI TƯỢNG ỨNG DỤNG TRONG CÁC HỆ THỐNG THÔNG TIN VIDEO NÉN
nh 2.11: Tìm kiếm giá trị nửa điểm ảnh bằng phép nội suy (Trang 32)
Hình  2.13: Mã hóa khung hình trong MPEG-4 - PHƯƠNG PHÁP MÃ HÓA VIDEO THEO ĐỐI TƯỢNG ỨNG DỤNG TRONG CÁC HỆ THỐNG THÔNG TIN VIDEO NÉN
nh 2.13: Mã hóa khung hình trong MPEG-4 (Trang 33)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w