Nghiên cứu và ứng dụng kỹ thuật nén và truyền ảnh qua mạng internet

Ví dụ, tiến trình này có thể được sử dụng để chia ra từng ảnh nhỏ riêng biệt để tạo hình ảnh động cho những máy PC khác nhau thực hiện đồng thời và sau đó kết hợp những hình đã được xử l

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

-

NGUYỄN TUÂN ANH

ĐỀ TÀI:

NGHIÊN CỨU VÀ ỨNG DỤNG KỸ THUẬT NÉN VÀ

TRUYỀN ẢNH QUA MẠNG INTERNET

LUẬN VĂN THẠC SỸ

NGÀNH: ĐIỆN TỬ VIỄN THÔNG

NGƯỜI HƯỚNG DẪN KHOA HỌC:

NGUYỄN VĂN KHANG

HÀ NỘI – 2010

Trang 2

MỤC LỤC

MỞ ĐẦU 1

CHƯƠNG I: TỔNG QUAN 5

1.1 Giới thiệu 5

1.2 Nội dung nghiên cứu 9

1.3 Mục tiêu của đề tài 15

CHƯƠNG II: KỸ THUẬT VIDEO SỐ 17

2.1 Kỹ thuật nén Video số 17

2.1.1 Khái niệm 17

2.1.2 Mô hình nén ảnh 17

2.2 Các đặc điểm của nén tín hiệu số 18

2.2.1 Xác định hiệu quả của quá trình nén tín hiệu số 18

2.2.2 Độ dư thừa số liệu 19

2.2.3 Sai lệch bình phương trung bình 19

2.3 Các phương pháp nén 20

2.3.1 Nén không tổn hao 20

2.3.2 Nén có tổn hao 21

2.4 Tiêu chuẩn nén MPEG 22

2.4.1 Cấu trúc ảnh 22

2.4.2 Nhóm ảnh (GOP- Group Of Picture) 23

2.4.3 Cấu trúc dòng bit MPEG Video 24

2.5 Tiêu chuẩn nén MPEG-2 25

2.5.1 Đặc tính và định mức (profile and level) 25

2.5.2 MPEG-2 4:2:2P@ML 27

2.6 Tiêu chuẩn nén H.264 28

2.6.1 Giới thiệu chung về bộ CODEC H.264 28

2.6.2 Cấu trúc 30

2.6.3 Profile 35

2.6.4 Một số kỹ thuật trong H.264 36

2.6.5 Các đặc điểm nổi bật trong thiết kế của H.264 48

CHƯƠNG III : CẤU TRÚC GÓI DỮ LIỆU .53

3.1 Lớp mã hóa video 53

3.2 Lớp đóng gói Video 54

3.3 Lớp cấu trúc dòng truyền tải 57

3.4 Lớp giao thức truyền tải thời gian thực( tùy chọn) 61

3.5 Lớp truyền tải 65

3.6 Lớp IP 72

Trang 3

3.7 Lớp liên kết dữ liệu 79

3.8 Lớp vật lí 81

CHƯƠNG IV: THỬ NGHIỆM NÉN ẢNH VÀ TRUYỀN ẢNH 83

4.1 Đặt vấn đề 85

4.2 Thử nghiệm nén ảnh 85

4.3 Truyền ảnh và đánh giá đường truyền qua mạng 88

4.3.1 Cách thiết lập mạng vô tuyến giữa hai máy tính 89

4.3.2 Truyền ảnh qua mạng Peer to Peer 92

KẾT LUẬN 102

TÀI LIỆU THAM KHẢO 105

Trang 4

DANH MỤC HÌNH VÀ BẢNG

Hình 1.1: Hội tụ truyền thông 6

Hình 1.2: Truyền tải các chương trình trên IP 10

Hình 1.3: Mạng ngang hàng 14

Hình 2.1: Mô hình hệ thống nén Video .17

Hình 2.2: Sự phối hợp các kỹ thuật trong JPEG và MPEG 20

Hình 2.3: Dự đoán bù chuyển động một chiều và hai chiều 23

Hình 2.4: Kiến trúc dòng Video MPEG 24

Hình 2.5: Cấu trúc số liệu nén ảnh MPEG 24

Hình 2 6: Sơ đồ bộ mã hoá 28

Hình 2.7: Sơ đồ bộ mã hoá cụ thể 29

Hình 2.8: Sơ đồ bộ giải mã 30

Hình 2.9: cấu trúc mã hoá dữ liệu của H.264 30

Hình 2.10: Chuỗi đơn vị NAL 31

Hình 2 11: Slices 31

Hình 2.12: Cấu trúc của slice 33

Hình 2.13: MacroBlock 33

Hình 2.14: Ảnh tham chiếu và bù chuyển động 34

Hình 2.15: Các profile 35

Hình 2.16: Dự đoán nội suy 36

Hình 2.17: Dự đoán intra 4x4 37

Hình 2.18: Các chế độ dự đoán intra_4x4 37

Hình 2.19: Các chế độ dự đoán intra_16x16 38

Hình 2.20: Phân mảnh macroblock 39

Hình 2.21: Phân mảnh submacroblock 39

Hình 2.22: Tính nội suy cho các chuyển động có khoảng cách không nguyên 40

Hình2.23: Minh họa dự đoán bù chuyển động đa khung 42

Hình 2.24: Dự đoán liên khung trong slice B 43

Hình 2.25: Ví dụ về một khung hình sử dụng bộ lọc Deblocking 46

H.2.26: So với một số chuẩn nén khác .52

Hình 3.1: Mô hình giao thức 53

Hình 3.2: Cấu trúc của khối NAL 54

Hình 3.3: Định dạng gói MPEG PES 55

Hình 3.4: Định dạng gói MPEG TS 57

Hình 3.5: Ánh xạ gói truy cập AVC sang gói MPEG PES 58

Hình 3.6: Ứng dụng nhãn thời gian với các gói MPEG PES 58

Hình 3.7: Mối liên hệ giữa PMT và PAT 60

Hình 3.8: Định dạng RTP header 62

Hình 3.9: Các gói MPEG TS 63

Hình 3.10: Ánh xạ nội dung H264/AVC ( từng khối NAL riêng biệt ) sang RTP payload 64 Hình 3.11: Ánh xạ nội dung H264/AVC ( nhiều khối NAL riêng biệt ) 64

sang một RTP payload 64

Hình 3.12: Ánh xạ nội dung một H264/AVC NAL sang nhiều RTP payload 65

Hình 3.13: Cơ chế điều khiển luồng của TCP 66

Hình 3.14: Quá trình truyên thông trong mạng IPTV 68

Hình 3.15: Định dạng datagram dựa trên UDP 71

Hình 3.16: Định dạng gói video IPv4 73

Hình 3.17: Các lớp địa chỉ IP 76

Trang 5

Hình 3.18: Cấu trúc header của IPv6 78

Hình 4.1: Mô hình đo PSNR 85

Hình 4.2 Một picture của news_rev.mp4 ứng với PSNR >20(dB) 100

Hình 4.3 Một picture của news_rev.mp4 ứng với PSNR <20(dB) 100

Bảng 2.1: Các loại slice 32

Bảng 2.2: Các thành phần cấu trúc của Macroblock 33

Bảng 3.1: Cấu trúc của một gói MPEG PES 55

Bảng 3.2: Cấu trúc gói MPEG TS 58

Bảng 3.3: Cấu trúc của gói IPTV dựa trên RTP 62

Bảng 3.4: Định dạng của TCP segment 69

Bảng 3.5: Cấu trúc datagram IPTV dựa trên UDP 71

Bảng 3.6: Cấu trúc gói video IPv4 73

Bảng 3.7: Các lớp địa chỉ IPv4 75

Bảng 3.8: Mô tả trường của IPv6 78

Bảng 3.9: Cấu trúc của Ethernet header 80

Bảng 3.10: Cấu trúc khung Ethernet được dùng để mang nội dung MPEG-2 81

Bảng 3.11 Tổng kết các lớp trong mô hình IPTV 81

Bảng 4.1: Bảng đánh giá chất lượng video 85

Bảng 4.2 Kết quả PSNR của file phía thu sau giải mã news_rev_cfi.yuv so với file phía phát a03_ref.yuv 99

Bảng 4.3 Kết quả PSNR của file phía thu sau giải mã news_rev_cfi.yuv so với file phía phát a03_ref.yuv 99

Trang 6

MỞ ĐẦU

Toàn cầu hoá và hội nhập là quá trình vận động mang tính hệ thống và khách quan trên phạm vi toàn cầu, bao trùm tất cả các mặt đời sống kinh tế - xã hội của các quốc gia trên toàn thế giới Hiện tại, Việt Nam đã là thành viên chính thức của WTO, điều này đánh dấu một bước phát triển cao hơn trong quá trình hội nhập, đây

là kết quả tất yếu khi mà quá trình toàn cầu hóa đang diễn ra mạnh mẽ trên mọi mặt, tác động tới toàn bộ sự phát triển của mỗi quốc gia Tác động của Internet tới các hoạt động kinh doanh và xã hội ngày một lớn Khả năng tương tác và tiếp cận rộng rãi với công chúng biến Internet thành công cụ truyền thông đặc biệt Sau tin tức,

âm nhạc, giờ đây tới ngành công nghiệp truyền hình truyền thống đứng trước lựa chọn: kết hợp với Internet để bước sang kỷ nguyên phát triển mới hay tiếp tục đứng độc lập (và có thể đối mặt với nguy cơ biến mất) Những năm gần đây, khái niệm hội tụ truyền thông (media convergence) đã được nhắc đến nhiều Hội tụ truyền thông là một xu thế mới xuất phát từ những phát minh công nghệ, đặc biệt là internet Vì lý do này nên tôi đã làm luận văn khoa học tốt nghiệp với đề tài:

“Nghiên cứu ứng dụng kỹ thuật nén và truyền ảnh qua mạng Internet”

Nội dung của luận văn gồm 5 chương:

Chương 1: Tổng quan

Chương 1 đề cập tới vấn đề nghiên cứu nén ảnh và truyền ảnh trong môi trường mạng Internet

Chương 2: Kỹ thuật video số

Chương này đi vào chi tiết trình bầy một số vấn đề về nguyên lý nén ảnh số, đóng gói dữ liệu và truyền gói dữ liệu IP

Chương 3: Cấu trúc gói dữ liệu

Chương này đi vào chi tiết trình bầy một số vấn đề về nguyên lý đóng gói dữ liệu và truyền gói dữ liệu IP và giới thiệu mô hình giao thức truyền tải

Chương 4: Những thực nghiệm về nén ảnh và truyền ảnh

Phần này chủ yếu trình bầy quá trình thực hiện bằng thực nghiệm quá trình nén ảnh và truyền ảnh qua môi trường vô tuyến trong mạng giữa hai máy tính

Trang 7

Kết luận

Qua quá trình nghiên cứu chuẩn nén và thực nghiệm truyền ảnh qua mạng vô tuyến, chương này xây dựng mô hình mã hóa một file video thô YUV, sau đó tiến hành nén ảnh sang chuẩn MPEG và truyền hình ảnh nén này qua mạng vô tuyến Từ

đó đưa ra những đánh giá quá trình nén và giải nén thông qua việc tính toán PSNR,

tỉ số nén và xem đoạn video sau khi nén và truyền ảnh Cuối cùng là đưa ra những kiến nghị, kết luận và hướng phát triển trong tương lai

Tôi xin gửi lời cảm ơn chân thành tới TS Nguyễn Văn Khang người đã hướng dẫn và giúp đỡ tôi hoàn thành luận văn này Tôi cũng xin gửi lời cảm ơn tới những thầy cô giáo người đã trang bị những kiến thức để tôi làm luận văn này Mặc

dù tôi đã cố gắng nhưng chắc chắn luận văn vẫn còn rất nhiều thiếu sót, tôi mong các thầy cô và các bạn đồng nghiệp chỉ bảo để tôi ngày càng hoàn thiện hơn vốn kiến thức của mình

Hà Nội, tháng 10 năm 2010

Trang 8

lồ, rồi sau đó đã tiến hành phóng vệ tinh vào quỹ đạo trái đất nhằm thực hiện ước

mơ trên Với những nỗ lực như vậy, trong thế kỷ này, những người ở cách xa nhau nửa vòng trái đất đã có thể cùng xem và cùng suy ngẫm một vấn đề trong cùng một thời gian Ở đây ta có thể hình dung camera và micro không chỉ đơn thuần là thiết bị điện tử, đó chính là biến thể (sự nối dài) của con mắt và tai người, có khả năng thu nhận những sự kiện ở rất xa Thông qua những biến thể này, một cá nhân có thể vượt qua được nền tảng chính trị cũng như văn hoá truyền thống của mình để cùng chia sẻ và thấu hiểu giá trị cũng như cách nhìn của những con người khác nhau trên thế giới Những con người, những bộ tộc hoặc dân tộc đã lưu trữ lối sống cũng như nền văn hoá của mình trong một phạm vi hẹp qua hàng ngàn năm, nay đã có thể gia nhập ngôi làng toàn cầu nhờ vào bản chất của sóng điện từ Bản chất đó có thể mô

tả là khả năng truyền đến rất nhiều người một thông điệp cùng một thời gian Cho

dù có sự khác nhau về địa lý, về văn hóa, về nghề nghiệp người ta vẫn có thể hiểu ít nhất là những vấn đề cơ bản trong bức thông điệp đó Tuy vậy, ngày nay con người đang mất dần hứng thú với truyền hình và họ chờ đợi một cái gì hơn thế nữa Nhu cầu của họ đang chuyển từ những vấn đề dành cho quảng đại dân cư sang những vấn đề dành cho những cá nhân riêng lẻ Khi hạ tầng mạng IP phát triển sẽ làm cho việc ứng dụng cụng nghệ truyền video qua mạng đáp ứng nhu cầu người sử dụng ngày càng tăng Sự thay đổi này ta có thể thấy được hình ảnh thu vào camera ở một

Trang 9

nơi nào đú rất xa trên thế giới được truyền qua mạng IP về tới cho người xem Gần đây có khá nhiều dịch vụ ứng dụng công nghệ IP như : IPTV, Internet Video…

Hình 1.1: Hội tụ truyền thông

Hiện nay, chúng ta đang trong thời kỳ xây dựng một khuôn mẫu mới cho hoạt động thông tin liên lạc của con người Ðó chính là một môi trường phương tiện cho phép từng cá nhân liên lạc một cách thuận tiện vào bất kì lúc nào, bất kỳ ở nơi đâu qua phương tiện truyền thông có chức năng hợp nhất mọi dạng phương tiện liên lạc Sự ghép nối có tổ chức tạo nên sự linh hoạt, công nghệ mạng đang tạo ra một hệ thống liên lạc mới cho phép vượt qua mọi trở ngại trong việc liên lạc giữa cá nhân với cộng đồng Hệ thống mới này đồng thời cũng hợp nhất các phương tiện đã phát triển một cách độc lập với nhau trong quá khứ như: video, audio, text, liên lạc vô tuyến, hữu tuyến thành một phương tiện duy nhất Chúng ta hãy xét xem môi trường mới với tên gọi là công nghệ truyền thông tương lai, sẽ thay đổi môi trường phương tiện hiện đại như thế nào?

Thứ nhất, thông tin liên lạc giữa cá nhân, tổ chức và quảng đại dân cư trước

đây được thiết lập theo nhiều cách khác nhau nay sẽ được hợp nhất bằng hình thức liên lạc hợp nhất Chúng ta đã vượt qua giai đoạn khởi đầu và giờ đây đang tiến dần tới hình thức liên lạc hợp nhất khi mà chức năng xử lý và lưu giữ thông tin do máy tính đảm nhiệm, khả năng nối mạng do Internet đảm nhiệm, khả năng dịch vụ video

do truyền hình đảm nhiệm và chức năng liên lạc do điện thoại đảm nhiệm Ngày nay người ta có thể nối máy thu hình hoặc máy tính của mình vào mạng Internet và

Trang 10

liên lạc với những người khác bằng lời thoại hoặc thông điệp audio, video Không chỉ có vậy, ngày nay chúng ta còn có thể đọc báo, tạp chí hoặc xem truyền hình qua Internet

Thứ hai, khả năng hợp nhất truyền thông giữa mạng truyền dẫn có dây và

không dây chỉ có thể thực hiện được qua mạng hợp nhất Trên cơ sở công nghệ số, mạng có dây và không dây sẽ thiết lập và duy trì mạng hợp nhất có chức năng ghép nối mạnh và trở thành mạng hạ tầng Ðến lượt mình, mạng hạ tầng này sẽ cung cấp một môi trường hợp nhất có khả năng cung cấp đa dịch vụ cho người sử dụng

Thứ ba, mục tiêu tương lai của dịch vụ truyền thông là các cá nhân trong

quảng đại dân cư Người ta sẽ tiêu nhiều thời gian hơn cho những dịch vụ cung cấp thông tin cho họ vào thời gian và địa điểm mà họ đã định Bởi vậy các phương tiện phải cung cấp nhiều và lựa chọn khác nhau và điều kiện phải phù hợp với thị hiếu cũng như mối quan tâm của từng cá nhân Đến đây sẽ chấm dứt thời kỳ truyền tải một chiều và đồng dạng (giống nhau) Như vậy cái nỗi lo của các đài truyền hình lo lắng sự “đắt khách” của mình giảm thiểu đã được gạt bỏ Đối thủ trước mắt chính là

sự bùng nổ Internet Số người giải trí trong không gian Internet ngày càng tăng Tuy vậy cái bậc thang danh vọng mà truyền hình chiếm giữ bao lâu nay đâu dễ dàng từ

bỏ Với hệ thống âm thanh vòng (nhà hát tại gia) và màn hình phẳng long lanh truyền hình vẫn đang ngày càng thu hút người xem

Đầu năm 2005, tác giả Rob McGann cho biết, kết quả điều tra thường niên của Universal McCann với hơn 6000 người được phỏng vấn đã thống kê được thời gian sử dụng đồng thời để lướt web và xem tivi tại Anh đã tăng lên 72 phần trăm Năm 2001, thời gian trung bình để cùng lúc làm hai việc này là 174 phút mỗi tuần Tới năm 2004, con số này đạt 300 phút mỗi tuần Số thống kê năm 2004 cho thấy, thời gian sử dụng internet trong lúc xem tivi chiếm khoảng 20 phần trăm thời gian xem tivi hàng tuần với dân số trong độ tuổi từ 18-49 tại Hoa Kỳ Tại thời điểm năm

2001, nhóm người này chỉ dành 11 phần trăm thời gian xem tivi mỗi tuần kết hợp với duyệt web Sau ba năm, tỷ lệ này gần như đã tăng lên gấp hai lần

Tháng 11/2006, khảo sát thường niên của USC-Annenberg Digital Future Project với thói quen sử dụng internet của hơn 2000 người dùng tại Hoa Kỳ đã thống kê các kết quả: 41 phần trăm người dùng internet có thâm niên từ chín năm

Trang 11

trở lên cho biết việc xem thông tin trên web khiến họ ít xem truyền hình hơn Chỉ 23 phần trăm những người mới sử dụng Internet (dưới một năm) xác nhận họ dành ít thời gian cho truyền hình hơn vì Internet Những người không sử dụng Internet có thời gian xem tivi trung bình mỗi tuần là 21,4 giờ trong khi nhưng người có thói quen duyệt web (kể cả những người mới làm quen với Internet) chỉ dành 12,3 giờ mỗi tuần cho truyền hình Sự kiện bóng đá FIFA 2006 đã truyền hình trực tiếp tới

26 triệu người xem trên khắp các châu lục toàn thế giới Truyền hình Internet nhanh chóng bắt kịp với công bố rằng năm 2007 người mỹ đã xem khoảng 9,5 tỉ đoạn video Internet có độ dài trung bình 2,8 phút

Trên đây là con số thống kê về lượng người sử dụng truyền hình internet sử dụng tại các nước phát triển mạnh trên thế gới như Anh, Mỹ…, ta thấy rằng con số này tăng lên hàng năm Vậy tình hình ở Việt Nam ra sao? Đánh giá được đưa ra trong Hội thảo Cơ hội kinh doanh trong ngành vô tuyến và di động tại Việt Nam thời hội nhập, một hoạt động của VietnamComm 2007 Truyền hình trên Internet (IPTV) là dịch vụ được đánh giá sẽ phát triển bùng nổ bởi hội tụ nhiều điều kiện cần thiết Ông Weijun Lee, Phó Giám đốc tập đoàn ZTE - nhà cung cấp dịch vụ IPTV hàng đầu tại Trung Quốc, nêu ra 3 yếu tố căn bản để phát triển một dịch vụ IPTV, gồm: đường truyền băng rộng, nội dung đa dạng và thị trường phát triển năng động Tại Việt Nam, nền tảng cơ sở hạ tầng của VNPT đảm bảo được những chương trình IPTV hấp dẫn như Karaoke trên truyền hình, tương tác trực tiếp với những gì nhìn thấy trên màn hình TV

"Lấy ví dụ để các bạn thấy IPTV thay đổi quan niệm về truyền hình như thế nào Hãy tưởng tượng các bạn đang xem chương trình Vietnam Idol rất hấp dẫn Các bạn không cần soạn tin hay vào web để bình chọn mà có thể thao tác ngay trên máy thu hình", ông Weijun Lee nói "Thực tế tại những nơi đã triển khai IPTV, tỷ lệ bình chọn như vậy cao hơn hẳn so với qua tin nhắn hoặc các hình thức khác" Cơ hội kiếm tiền từ IPTV gần như được chia đều cho các bên tham gia Theo đó, nhà cung cấp dịch vụ được khoảng 30%, nhà cung cấp nội dung 40% và 30% còn lại thuộc về các nhà cung cấp dịch vụ gia tăng trên IPTV

Ông Trần Minh Tuấn, Phó viện trưởng Viện chiến lược Bộ TT-TT, cho biết những dự án truyền hình analog sẽ dần được hạn chế trong thời gian tới Thay vào

Trang 12

đó, truyền hình KTS sẽ được mở rộng Đặc biệt khi vệ tinh Vinasat được phóng lên quỹ đạo trong năm 2008, truyền hình kỹ thuật số sẽ được mở rộng đến vùng sâu, vùng xa Việc mở rộng truyền hình thế hệ mới sẽ được phổ biến bằng quỹ của chính phủ Từ đó làm cơ sở để kết thúc truyền hình analog vào năm 2015 - 2020

Chúng ta đang sống trong một thế giới bùng nổ thông tin rất mạnh mẽ Việc ứng dụng các công nghệ hiện đại cho phát thanh và truyền hình để truyền tin tức, sự kiện diễn ra rộng khắp trên toàn thế giới Xuất phát từ nhu cầu ngày càng tăng của đại bộ phận người xem cũng như xu thế phát triển mạnh của công nghệ truyền hình trên mạng internet trong thời gian tới, cũng như xu thế phát triển công nghệ truyền

hình này trên thế giới và tại Việt Nam, tôi đã chọn đề tài “ Nghiên cứu và ứng dụng kỹ thuật nén và truyền ảnh qua mạng Internet ” làm đề tài luận văn bảo vệ tốt nghiệp cao học

1.2 Nội dung nghiên cứu

Đã từ lâu, việc download và xem (nghe) lại các file video và audio chất lượng cao từ Internet đã trở nên dễ như bóc kẹo Các trình duyệt và máy chủ Web hiện hành đều hỗ trợ chức năng này Tuy nhiên, truyền đầy đủ dung lượng của một file multimedia thường yêu cầu một khoảng thời gian tải lâu đến mức không thể chấp nhận được, mà lại còn hay "đứt" giữa chừng và rất hay bị lỗi Chính vì dung lượng các file nội dung âm thanh và hình ảnh quá lớn, nên một giải pháp phát trực tuyến các nội dung này dưới dạng "dòng chảy" (streaming) đã được hình thành, để người dùng có thể xem và nghe từng phần nội dung được "phát sóng" từ máy chủ web một cách tuần tự Toàn bộ file nội dung vẫn được lưu giữ trên máy chủ, chỉ có từng phần thông tin được truyền tải và người dùng không lưu được toàn bộ file âm thanh hay hình ảnh, kể cả sau khi đã xem hoặc nghe toàn bộ nội dung

Trang 13

Hình 1.2: Truyền tải các chương trình trên IP

Theo lý thuyết, hình ảnh video và âm thanh sẽ được truyền từ máy chủ, qua mạng Internet đến với khách hàng theo đúng yêu cầu của họ khi truy cập vào trang web có tích hợp chức năng video Người sử dụng sẽ xem nội dung gửi tới cùng lúc

dữ liệu chuyển đến, theo kiểu "nhận tới đâu, xem tới đó" Tuy nhiên, do sử dụng

đường truyền mạng như một kênh truyền nội dung, nên độ rộng của đường truyền

sẽ là yếu tố quyết định chất lượng truyền tải nội dung có được liền mạch và trôi chảy hay không Tính tới thời điểm này, đã xuất hiện khá nhiều trang web cung cấp dịch vụ video streaming (các video streamer), cùng với nhiều công nghệ và giải pháp "truyền hình Internet" đầy tiềm năng Song thường thì các giải pháp video streaming hiện tại mới chỉ phát huy được hiệu quả trong các mạng intranet khép kín, còn khi đưa ra cung cấp đại trà trên toàn mạng Internet, chúng bỗng trở nên chuệch choạc và "tậm tịt" Tuy vậy, người ta vẫn tin rằng một ngày nào đó, những cải tiến

và sáng chế mới trong giao thức đường truyền sẽ giúp biến "ước muốn" này trở thành hiện thực thực tiễn Trong mô hình client/server thì một máy khách (client) sẽ kết nối với một máy chủ thông qua một giao thức nhất định, nên mọi xử lý sẽ nằm trên server và do đó sẽ tránh cho clients những tính toán nặng nề Tuy nhiên, mô hình client/server bộc lộ một nhược điểm quan trọng: khi số lượng clients tăng đến một mức độ nào đó thì nhu cầu về tải và băng thông tăng lên dẫn đến việc máy chủ không có khả năng cung cấp dịch vụ cho các máy khách thêm vào Để giải quyết vấn đề trên, công nghệ mạng ngang hàng P2P (peer to peer technology) được tin

tưởng sẽ là lời giải cho các vấn đề trên Mạng đồng đẳng (peer-to-peer network),

Trang 14

còn gọi là mạng ngang hàng, là một mạng máy tính trong đó hoạt động của mạng

chủ yếu dựa vào khả năng tính toán và băng thông của các máy tham gia chứ không tập trung vào một số nhỏ các máy chủ trung tâm như các mạng thông thường Mạng đồng đẳng thường được sử dụng để kết nối các máy thông qua một lượng kết nối dạng Ad hoc Ứng dụng thường xuyên gặp nhất là chia sẻ tệp tin, tất cả các dạng như âm thanh, hình ảnh, dữ liệu, hoặc để truyền dữ liệu thời gian thực như điện thoại VoIP Một mạng đồng đẳng đúng nghĩa không có khái niệm máy chủ và máy khách, nói cách khác, tất cả các máy tham gia đều bình đẳng và được gọi là peer, là một nút mạng đóng vai trò đồng thời là máy khách và máy chủ đối với các máy khác trong mạng Mạng ngang hàng (Peer to Peer - P2P) là một kiểu kiến trúc máy tính mới có nhiều hứa hẹn Tuy vậy để có thể có các ứng dụng tin cậy như thực tế đòi hỏi, không ít công sức và thời gian sẽ phải bỏ ra Trong những năm qua thuật ngữ mạng ngang hàng peer-to-peer (P2P) đã trở nên đồng nghĩa với Napster, chương trình chia xẻ tệp nổi tiếng được chuyên gia lập trình 20 tuổi là Shawn Fanning viết ra Khi các kiến trúc Internet đầu tiên được dựng lên như mạng của các mạng, các máy tính được kết nối theo kiểu ngang hàng Nhiều dịch vụ trên Internet như DNS, các nhóm tin và vô số các tính nǎng dựa trên các kiến trúc ngang hàng Nhưng trong thời gian đó, các máy tính nối mạng là những máy tính lớn, nặng nề và liên kết với nhau ít hơn bây giờ Vào nǎm 1996, hãng Mirabilis, Israel giới thiệu dịch vụ đưa tin tức thời ICQ được ưa thích ngay lập tức sử dụng kiến trúc ngang hàng để nhắn tin giữa các PC kết nối Internet Napster đã tiến những bước xa hơn, nhờ vào các bộ vi xử lý nhanh hơn, dung lượng nhớ lớn hơn và tốc độ kết nối nhanh hơn cho phép các PC cùng chia xẻ file trên Internet Thật đáng ngạc nhiên trường hợp Napster cho thấy mọi người sẵn sàng mở máy tính của họ, chia xẻ các file dữ liệu với những người hoàn toàn xa lạ khi họ thấy việc làm đó có lợi Trong quá trình

đó, những mạng máy tính lớn đã được tạo ra nhanh chóng từ sự kết hợp của hàng triệu máy PC riêng lẻ, mỗi máy trong số chúng có chức nǎng của máy chủ cũng như máy khách Nó cũng không hoàn toàn là một hệ thống P2P Nó sử dụng một máy server trung tâm để kết nối các máy tính với nhau tránh những rắc rối của các chương trình ngang hàng khác, như Gnutella, một chương trình chia xẻ file được dùng nhiều giữa các cộng đồng công nghệ cao Khái niệm P2P như người ta hiểu

Trang 15

bao gồm bốn hoạt động khác nhau: sự hợp tác giữa những người sử dụng, sự tương tác giữa những ứng dụng phần mềm, việc sử dụng hiệu quả các tài nguyên mạng và các siêu tính toán Các hệ thống này kết hợp khả nǎng chia sẻ tài nguyên với khả nǎng truyền tin tức thời, tất cả trong một môi trường an toàn Sự hấp dẫn chính là ở

sự khuyến khích chia xẻ file và truyền thông giữa các nhóm làm việc Ví dụ, người

sử dụng có thể kết nối với các đồng sự trong các môi trường ảo để cùng hợp tác trong công việc, giải quyết các vấn đề phức tạp và thậm chí lập kế hoạch chia xẻ tài liệu và cùng lướt trên Internet Quan trọng hơn cả đối với giới doanh nghiệp là dịch

vụ tạo ra một không gian an toàn cho người dùng cho dù họ ở trên Internet hay trong Intranet sau tường lửa Không cần phải có các kỹ sư của công ty, không cần phải thiết lập hình thức tổ chức trung tâm và không phải lo đến những vị khách lạ truy nhập vào mạng công ty Một số công ty khác nhấn mạnh việc xây dựng hạ tầng P2P, trên cơ sở đó các nhà phát triển có thể xây dựng các ứng dụng khác Một trong các cách làm này là sử dụng sức mạnh của giao thức XML, cho phép các nhà phát triển không những chỉ định rõ cách bố trí của các trang web mà còn có thể hiện các nội dung Mặc dù mọi sự chú ý đều tập trung vào vấn đề cộng tác, các hệ thống P2P cho phép các ứng dụng phần mềm tương tác với nhau đem lại nhiều hứa hẹn nhất cho các ứng dụng kết hợp các dữ liệu phân tán cho thương mại điện tử, thiêt kế sản phẩm hoặc quản lý tri thức Các chương trình đó dùng P2P như một phương thức gửi dữ liệu vào và ra từ trình ứng dụng này tới trình ứng dụng khác hoặc liên kết một số lượng vô hạn các máy tính thành một cơ sở dữ liệu khổng lồ Công nghệ tương tác phần mềm cho phép các công ty chia nhỏ các vấn đề phức tạp cho dễ quản lý hơn Các hệ thống cho phép đối chiếu dữ liệu và đảm bảo rằng chúng đang được điều khiển bởi chính những người tạo ra chúng, đảm bảo rằng hoạt động chính xác và kịp thời rất lý tưởng cho các ứng dụng trực tuyến và kinh doanh chứng khoán Một số các hang máy tính đang tiếp tục phát triển thế hệ tiếp theo của các máy tìm kiếm trên công nghệ P2P để phân phối thông tin đúng lúc và toàn diện hơn cho các công ty truyền thông lớn Một loạt các hãng mới thành lập đang tạo ra những chương trình tận dụng tài nguyên triển khai khả nǎng của P2P để lưu trữ các file, phân phối nội dung và chia sẻ sức mạnh xử lý của các máy khác Mục đích ở đây một phần là cắt giảm giá thành phần cứng chẳng hạn như thiết bị lưu trữ, server

Trang 16

và các thiết bị khác, nhưng cũng giúp cho việc quản lý giao thông trên mạng Mặc

dù có tiềm nǎng dịch vụ lớn, nhưng đây là một vấn đề khó khǎn nhất của P2P Có quá nhiều vấn đề liên quan đến an toàn bảo mật và sự phức tạp - không đề cập đến giá của các thiết bị lưu trữ và các server giảm xuống - khiến cho các dịch vụ P2P trở nên không thiết thực Cuối cùng, công nghệ P2P có thể áp dụng cho các dịch vụ tính toán phân tán có khả nǎng đạt được siêu xử lý cho các công ty cần khả nǎng xử lý lớn nhưng không muốn bỏ hàng triệu đôla cho nó Công nghệ này đã chia việc xử lý lớn ra thành những xử lý nhỏ có thể phân tán giữa các máy tính trong một mạng Mỗi một PC đồng thời xử lý các dữ liệu và trả về kết quả cho máy tính trung tâm ráp nối các phần này lại Ví dụ, tiến trình này có thể được sử dụng để chia ra từng ảnh nhỏ riêng biệt để tạo hình ảnh động cho những máy PC khác nhau thực hiện đồng thời và sau đó kết hợp những hình đã được xử lý đó thành một chuỗi các hình liên tục Khi có hàng ngàn, hay hàng triệu máy tính được nối lại với nhau thì có thể liên kết tính toán siêu xử lý song song với tốc độ nhiều triệu phép tính / giây, với giá thành nhỏ hơn nhiều so với các siêu máy tính như máy đánh cờ Deep Blue hay Blue Gene của IBM Liệu rằng các công ty đã sẵn sàng tin vào những người dùng máy tính dấu tên trên khắp thế giới truy nhập dữ liệu quý giá của họ không cho dù vô tình hay cố ý ? Do vậy hầu hết các hãng P2P đang thiết kế các ứng dụng cho các hãng đủ lớn để có thể thực hiện các xử lý phân tán trong nội bộ công ty Mặc dù một số lượng lớn các công ty nhỏ đã thất bại nhưng những sản phẩm của các công

ty lớn như Microsoft , Sun Microsystems và nhiều công ty khác đã bắt đầu áp dụng P2P Những hãng khổng lồ này đang nghiên cứu để ứng dụng công nghệ P2P trong các sản phẩm của họ Intel là công ty lớn đầu tiên dùng P2P và đang đầu tư để phát triển tiếp và đồng thời giúp đỡ các nhóm làm việc về P2P nhằm đưa ra các chuẩn công nghệ ban đầu Trong khi đó Microsoft đã tuyên bố công khai vào tháng Tám

dự án Hailstorm của họ, đó là ".Net" và đã đưa ra một số nét nổi bật của các dịch vụ P2P Không chịu đứng ngoài cuộc Sun Microsystems đã đưa ra một loạt chuẩn cho một nền P2P mã nguồn mở gọi là JXTA Sun gần đây cũng đã bắt đầu đầu tư cho công nghệ này và mua Infrasearch với giá 10 triệu đô la Thập kỷ trước đã chứng kiến những thay đổi lớn về cung cách làm việc Biên giới của các công ty đã trở lên rộng lớn hơn và mối quan hệ giữa khách hàng và nhà cung cấp đã trở lên gần gũi

Trang 17

hơn đồng thời sự tin tưởng của công ty vào những người lao động tạm thời và các chuyên gia tǎng lên, trong khi đó các tổ chức lại dựa nhiều hơn vào các nhóm làm việc đặc biệt Những nơi làm việc như vậy sẽ không có một cấu trúc làm việc cố định và một vai trò nghề nghiệp được xác định rõ ràng P2P rất phù hợp với cách thức hợp tác này Việc sử dụng các hệ thống mạng đã làm thay đổi một cách đáng

kể lực lượng lao động trong những nǎm gần đây Những nhóm làm việc tự phát qua mạng là sự phát triển có ý nghĩa quan trọng về cách thức làm việc của các công ty

Hình 1.3: Mạng ngang hàng

Lần lượt các hệ thống nhắn tin như ICQ và các công cụ P2P khác dùng để giao tiếp sẽ trở thành trung tâm của các mạng như thế và cho phép người sử dụng liên kết với nhau một cách tự do và dễ dàng Những bước nghiên cứu ban đầu về các ứng dụng P2P đã công nhận những xu hướng như vậy trong thế giới kinh doanh Các hệ thống giao tiếp tương tác được ứng dụng liên kết các hệ thống lập trình và thiết kế lại với nhau, tích hợp các kho dữ liệu khổng lồ và cho phép những nhóm phát triển và thiết kế độc lập liên kết với nhau tốt hơn Trong quá trình xử lý này hệ thống giảm các luồng thông tin sai hay lỗi thời giữa các nhóm thiết kế dẫn đến tiết kiệm nhiều triệu đô la Các nhà tin học cho rằng trong thương mại, P2P chỉ thích hợp cho những ứng dụng có trao đổi thông tin trực tiếp Như vậy, server sẽ tiếp tục duy trì vị trí của mình trong việc quản lý nhân sự và chi tiêu, kế hoạch kinh doanh

và nhiều ứng dụng khác Tuy nhiên, trong tương lai, server sẽ cung cấp các dịch vụ cao cấp hơn thay vì những việc lặt vặt đơn giản như lưu trữ và phân phát các tệp

Trang 18

P2P là một kiểu kiến trúc máy tính mới có nhiều hứa hẹn Tuy vậy để có thể có các ứng dụng tin cậy như thực tế đòi hỏi, không ít công sức và thời gian sẽ phải bỏ ra

Vì những ứng dụng thực tế của sự phát triển Internet trong nhiều lĩnh vực đời sống, với xu thế hội tụ truyền thông trên nền truyền dẫn là internet là một vấn đề rất rộng lớn nên trong đề tài luận văn này xin trình bầy một số vấn đề :

- Giới thiệu tổng quan nói tới sự phát triển của truyền hình từ phát sóng quảng bá tới ứng dụng những công nghệ số mới để đáp ứng những nhu cầu con người trong thời đại phát triển internet Ngoài ra trong phần này cũng giới thiệu tình hình phát triển của một hình thức truyền hình mới đó là truyền hình internet trên thế giới và những đánh giá, xu hướng tiếp cận công nghệ mới tại Việt Nam Từ đó làm

cơ sở cho nội dung nghiên cứu về nén ảnh và truyền ảnh qua mạng internet

- Cơ sở lý thuyết xin trình bầy về nguyên lý nén tín hiệu video với những vấn

đề như kỹ thuật nén video số, các đặc điểm của nén số, các phương pháp nén…và hai chuẩn nén cơ bản MPEG-2, H-264 Cuối cùng đề cập tới cấu trúc dữ liệu và các giao thức truyền tải gói dữ liệu

- Phần thử nghiệm truyền ảnh trong phẩn này tiến hành thử nghiệm hai vấn

đề chính đó là thử nghiệm nén ảnh H264 bằng công cụ phần mềm sau đó tiến hành đánh giá chất lượng ảnh sau khi nén bằng tham số PSNR Thứ hai là thử nghiệm truyền ảnh qua môi trường internet giữa hai máy tính dạng mạng đồng đẳng P2P (Peer to Peer) sau khi thu được ảnh sẽ tiến hành đánh giá chất lượng ảnh sau khi truyền bằng tham số PSNR

- Kết luận đưa ra nhận xét những kết quả thực nghiệm và những định hướng tiếp theo của luận văn Đồng thời tiến hành đánh giá lại đề tài và chỉ ra những tồn tại mà đề tài chưa thực hiện được

1.3 Mục tiêu của đề tài

Trước những phát triển mạnh mẽ của công nghệ số, ứng dụng truyền hình trên nền truyền dẫn mạng internet mạnh mẽ, mục tiêu của đề tài đề cập tới một số vấn đề cơ bản như :

- Chỉ ra lý do tại sao phải tiến hành nén ảnh trước khi truyền dẫn và một số nguyên lý nén ảnh

- Cách hình thành cấu trúc gói dữ liệu để truyền qua mạng IP

Trang 19

- Phương pháp đánh giá chất lượng hình ảnh sau nén

- Phương pháp đánh giá chất lượng ảnh sau khi truyền qua mạng P2P Thông qua những kiến thức các thầy cô giáo đã chỉ dạy tiến hành một số thử nghiệm thực tiễn về nén ảnh và truyền dẫn ảnh theo phương thức mạng ngang hang (P2P) Những thử nghiệm này giúp cho em minh họa thêm, hiểu rõ hơn những kiến thức thu được trong quá trình học tập tại trường Đại Học Bách Khoa Hà Nội

Trang 20

CHƯƠNG II: KỸ THUẬT VIDEO SỐ

2.1 Kỹ thuật nén Video số

2.1.1 Khái niệm

Nén về cơ bản là một quá trình trong đó lượng số liệu (data) biểu diễn lượng thông tin của một ảnh hoặc nhiều ảnh được giảm bớt bằng cách loại bỏ những số liệu dư thừa trong tín hiệu Video Các chuỗi ảnh truyền hình có nhiều phần ảnh giống nhau, vậy tín hiệu truyền hình có chứa nhiều dữ liệu dư thừa, ta có thể bỏ qua mà không làm mất thông tin ảnh Đó là các phần xoá dòng, xoá mành, vùng ảnh tĩnh hoặc chuyển động rất chậm, vùng ảnh nền giống nhau, mà ở đó các phần tử liên tiếp giống nhau hoặc khác nhau rất ít Thường thì chuyển động trong ảnh truyền hình có thể được dự báo, do đó chỉ cần truyền các thông tin về chuyển động Các phần tử lân cận trong ảnh thường giống nhau, nên chỉ cần truyền các thông tin biến đổi Các hệ thống nén sử dụng đặc tính này của tín hiệu Video và các đặc trưng của mắt người là kém nhậy với sai số trong hình ảnh có nhiều chi tiết, các phần tử chuyển động Quá trình sau nén ảnh là dãn (giải nén) ảnh để tạo lại ảnh gốc hoặc xấp xỉ ảnh gốc

Giải L.T.H

Biểu diễn thuận lợi

Biểu diễn

thuận lợi

Lượng tử hóa

Gán từ

mã

Giải từ

mã

Trang 21

- Hoạt động thứ hai của bộ mã hoá là lượng tử hoá, giúp rời rạc hoá thông tin được biểu diễn Để truyền tín hiệu video qua một kênh số, những thông tin biểu diễn được lượng tử hoá thành một số hữu hạn các mức

- Hoạt động thứ 3 là gán các từ mã Các từ mã này là một chuỗi bit dùng để biểu diễn các mức lượng tử hoá

Các quá trình sẽ ngược lại trong bộ giải mã video

Mỗi hoạt động cố gắng loại bỏ phần dư thừa trong tín hiệu video và tận dụng

sự giới hạn của khả năng nhìn của mắt người Nhờ bỏ đi các phần dư thừa, các thông tin giống nhau hoặc có liên quan đến nhau sẽ không được truyền đi Những thông tin bỏ đi mà không ảnh hưởng đến việc nhìn cũng không được truyền đi

2.2 Các đặc điểm của nén tín hiệu số

2.2.1 Xác định hiệu quả của quá trình nén tín hiệu số

Hiệu quả nén được xác định bằng tỉ lệ nén, nghĩa là tỷ số giữa số lượng dữ liệu của ảnh gốc trên trên số lượng dữ liệu của ảnh nén

Độ phức tạp của thuật toán nén được xác định bằng số bước tính toán trong

cả hai quá trình mã hoá và giải mã Thông thường thì thuật toán nén càng phức tạp bao nhiêu thì hiệu quả nén càng cao nhưng ngược lại giá thành và thời gian thực hiện lại tăng Đối với thuật toán nén có tổn thất thì độ sai lệch được xác định bằng

số thông tin bị mất đi khi tái tạo lại hình ảnh từ dữ liệu nén Với nén không tổn thất thì chúng ta có thể có những thuật toán mã hoá càng gần với Entropy của thông tin nguồn, bởi vì lượng entropy của nguồn chính là tốc độ nhỏ nhất mà bất cứ một thuật toán nén không tổn thất nào cũng có thể đạt được

Ngược lại, trong các nén có tổn thất thì mối quan hệ giữa tỷ lệ nén và độ sai lệch thông tin được Shannon nghiên cứu và biểu diễn dưới dạng hàm RD (hàm về độ sai lệch thông tin) Lý thuyết của ông cũng chỉ ra rằng với thuật toán nén có tổn thất thì chúng ta sẽ có hiệu quả cao nhất, nhưng ngược lại ta bị mất thông tin trong quá trình tái tạo lại nó từ dữ liệu nén Trong khi đó nén không tổn thất , mặc dù đạt hiệu quả thấp nhưng ta lại không bị mất thông tin trong quá trình tái tạo lại nó Vì vậy, ta phải tìm ra một biện pháp nhằm trung hoà giữa hai thuật toán nén này để tìm ra một thuật toán nén tối ưu sao cho hiệu quả nén cao mà lại không bị mất mát thông tin

Trang 22

2.2.2 Độ dư thừa số liệu

Nén số liệu là quá trình giảm lượng số liệu cần thiết để biểu diễn cùng một lượng thông tin cho trước Số liệu và thông tin không đồng nghĩa với nhau, số liệu chỉ là phương tiện dùng để truyền tải thông tin Cùng một lượng thông tin cho trước

có thể biểu diễn bằng các lượng số liệu khác nhau

Độ dư thừa số liệu là vấn đề trung tâm trong nén ảnh số Đánh giá cho quá trình thực hiện giải thuật nén là tỷ lệ nén (CN) được xác định như sau: Nếu N1 và N2

là lượng số liệu trong hai tập hợp số liệu cùng được biểu diễn một lượng thông tin cho trước thì độ độ dư thừa số liệu tương đối RD của tập hợp số liệu thứ nhất với tập hợp số liệu thứ hai có thể được định nghĩa như sau:

RD =1-1/ CN

Trong đó: CN =N1/N2

Trong trường hợp N1=N2 thì CN =1 và RD=0, có nghĩa là so với tập số liệu thứ hai thì tập số liệu thứ nhất không chứa số liệu dư thừa Khi N2<<N1 thì CN tiến tới vô cùng và RD tiến tới 1, có nghĩa là độ dư thừa số liệu tương đối của tập số liệu thứ nhất là khá lớn hay tập số liệu thứ hai đã được nén khá nhỏ

2.2.3 Sai lệch bình phương trung bình

Một đánh giá thống kê khác có thể đánh giá cho nhiều giải thuật nén là sai lệch bình phương trung bình so với ảnh gốc RMS (Root Mean Square) được tính bởi biểu thức:

1

XTrong đó:

RMS – sai lệch bình phương trung bình

Xi – Giá trị điểm ảnh ban đầu

Xi’ – Giá trị điểm ảnh sau khi nén

n – Tổng số điểm ảnh trong một ảnh

RMS chỉ ra sự khác nhau thống kê giữa ảnh ban đầu và ảnh sau khi nén Đa

số trường hợp khi nén chất lượng của ảnh nén là tốt với RMS thấp Tuy nhiên, trong một số trường hợp có thể xảy ra là chất lượng ảnh nén với RMS cao tốt hơn ảnh với RMS thấp hơn

Trang 23

2.3 Các phương pháp nén

Các hệ thống nén số liệu là sự phối hợp của rất nhiều các kỹ thuật xử lý nhằm giảm tốc độ bit của tín hiệu số mà vẫn đảm bảo chất lượng hình ảnh phù hợp ứng với một ứng dụng nhất định Nhiều kỹ thuật nén mất và không mất thông tin (loss/lossless data reduction techniques) đã được phát triển trong nhiều năm qua Chỉ có một số ít trong chúng có thể áp dụng cho nén video số

Hình 2.2 minh hoạ kỹ thuật nén được sử dụng để tạo thành các tín hiệu nén JPEG (Joint Photographic Expert Group) và MPEG (Moving Picture Expert Group)

Sử dụng các kỹ thuật này một cách riêng rẽ thực tế không đưa lại một kết quả nào

về giảm tốc độ dòng tín hiệu

Tuy nhiên, phối hợp một số các kỹ thuật này sẽ đem lại những hệ thống nén

vô cùng hiệu quả như hệ thống nén JPEG, MPEG-1, MPEG-2

Hình 2.2: Sự phối hợp các kỹ thuật trong JPEG và MPEG

2.3.1 Nén không tổn hao

Nén không mất thông tin cho phép phục hồi lại đúng tín hiệu ban đầu sau khi giải nén Đây là một quá trình mã hoá có tính thuận nghịch Hệ số nén phụ thuộc vào chi tiết ảnh được nén Hệ số nén của phương pháp nén không mất thông tin nhỏ hơn 2:1 Các kỹ thuật nén không mất thông tin bao gồm:

Nén không mất thông

Nén mất thông tin Video số

JPEG MPEG –

Trang 24

a Mã hoá với độ dài thay đổi (VLC)

Phương pháp này còn được gọi là mã hoá Huffman và mã hoá Entropy, dựa trên khả năng xuất hiện của các giá trị biên độ trùng hợp trong một bức ảnh và thiết lập một từ mã ngắn cho các giá trị có tần suất xuất hiện cao nhất và từ mã dài cho các giá trị còn lại Khi thực hiện giải nén, các thiết lập mã trùng hợp sẽ được sử dụng để tái tạo lại giá tri tín hiệu ban đầu

b Mã hoá với độ dài động (RLC)

Phương pháp này dựa trên sự lặp lại của cùng giá trị mẫu để tạo ra các mã đặc biệt biểu diễn sự bắt đầu và kết thúc của giá trị được lặp lại

Chỉ các mẫu có giá trị khác không mới được mã hoá Số mẫu có giá trị bằng không sẽ được truyền đi dọc theo cùng dòng quét

c Sử dụng khoảng xoá dòng, xoá mành

Vùng thông tin xoá được loại bỏ khỏi dòng tín hiệu để truyền đi vùng thông tin tích cực của ảnh Theo phương pháp đó, thông tin xoá dòng và xoá mành sẽ không được ghi giữ và truyền đi Chúng được thay bằng các dữ liệu đồng bộ ngắn hơn tuỳ theo ứng dụng

d Biến đổi cosin rời rạc (DCT)

Quá trình DCT thuận và nghịch được coi là không mất thông tin nếu độ dài

từ mã hệ số là 13 hoặc 14 băng tần đối với dòng video số sử dụng 8 bit biểu diễn mẫu Nếu độ dài từ mã hệ số của phép biến đổi DCT nhỏ hơn, quá trình này trở nên

Nén tổn hao thường thực hiện theo 3 bước liên tục:

Trang 25

-Bước 1: Biến đổi tín hiệu từ miền thời gian (không gian) sang miền tần số

bằng cách sử dụng các thuật toán chuyển vị như biến đổi cosin rời rạc DCT Bước này thực hiện việc giảm độ dư thừa của pixel trong ảnh, tuy nhiên quá trình này không gây tổn hao

-Bước 2: Thực hiện lượng tử hoá các hệ số DCT, số liệu được “làm trơn”

bằng cách làm tròn Việc mất mát số liệu xảy ra ở giai đoạn làm trơn này

Bước 3: Nén số liệu đã biến đổi và làm trơn bằng cách mã hoá Entropy, ở

đây sử dụng các mã không tổn hao như mã Huffman, RLC,…

2.4 Tiêu chuẩn nén MPEG

2.4.1 Cấu trúc ảnh

MPEG định nghĩa các loại ảnh khác nhau cho phép sự linh hoạt để cân nhắc giữa hiệu quả mã hoá và truy cập ngẫu nhiên Các loại ảnh đó như sau:

a ẢNH I: (Intra- Code Picture)

Các ảnh I được mã hoá theo mode intra để có thể giải mã mà không cần sử dụng dữ liệu từ bất cứ một ảnh nào khác Đặc điểm của phương pháp mã hoá này như sau:

- Chỉ loại bỏ được sự dư thừa không gian

- Dùng các điểm trong cùng một khung để dự báo

- Không có bù chuyển động

- Các thông tin được mã hoá rõ ràng, minh bạch nên số lượng bit yêu cầu lớn

Do được mã hoá Intra, ảnh I bao giờ cũng là ảnh đầu tiên trong một nhóm ảnh hay một chuỗi ảnh Nó cung cấp thông tin khởi động các ảnh tiếp theo trong nhóm

b ẢNH P (Predictive Code Picture)

Ảnh P được mã hoá liên ảnh một chiều (Interframe một chiều):

- Dự báo Inter một chiều

- Ảnh dự báo được tạo ảnh tham chiếu trước đó (dự báo nhân quả) Ảnh tham chiếu này có thể là ảnh I hoặc ảnh P gần nhất

- Có sử dụng bù chuyển động Thông tin ước lượng chuyển động của các khối nằm trong vector chuyển động (motion vector) Vector này xác định Macroblock nào được sử dụng từ ảnh trước

Trang 26

Do vậy ảnh P bao gồm cả những MB mã hoá (I-MB) là những Macroblock chứa thông tin lấy từ ảnh tham chiếu và những MB mã hoá Intra là những MB chứa thông tin không thể mượn từ ảnh trước

Ảnh P có thể sử dụng làm ảnh tham chiếu tạo dự báo cho ảnh sau

Hình 2.3: Dự đoán bù chuyển động một chiều và hai chiều

2.4.2 Nhóm ảnh (GOP- Group Of Picture)

Nhóm ảnh là một tập các ảnh mà đầu tiên phải là ảnh hoàn chỉnh I, tiếp sau

đó là một loạt các ảnh P, B Nhóm ảnh có hai loại:

- Cấu trúc mở: Luôn bắt đầu từ một ảnh I và kết thúc bằng một ảnh I tiếp theo,

nghĩa là ảnh cuối cùng của GOP dùng ảnh đầu tiên của GOP tiếp theo làm chuẩn

Khung dự báo (P)=

Khung trước

- khung hiện tại +Vector chuyển động Khung hình trước (n) Khung hình hiện

Khung hình tiếp (n+1)

Trang 27

- Cấu trúc khép kín: Việc dự đoán ảnh không sử dụng thông tin của GOP

khác Ảnh cuối cùng của một GOP bao giờ cũng là ảnh P

2.4.3 Cấu trúc dòng bit MPEG Video

Hình 2.4: Kiến trúc dòng Video MPEG

Hình 2.5: Cấu trúc số liệu nén ảnh MPEG

Trang 28

Cấu trúc số liệu Video MPEG-1 và MPEG-2 bao gồm 6 lớp như sau

- Khối (Block): Là đơn vị cơ bản cho chuyển đổi DCT Bao gồm 8x8 điểm

ảnh tín hiệu chói hoặc tín hiệu màu

- Khối Macro Block: Là nhóm các khối DCT tương ứng với thông tin của

một cửa sổ 16x16 điểm ảnh gốc Có nhiều dạng Macro Block khác nhau phụ thuộc vào cấu trúc lấy mẫu được sử dụng

Phần đầu đề (Header) của Macroblock chứa thông tin phân loại (Y hay CB, CR) và vector bù chuyển động tương ứng

- Lát (slice): Được cấu thành từ một hay một số MB liên tiếp nhau Phần

header của slice chứa thông tin về vị trí của nó trong ảnh và tham số quét lượng tử (quantized sanling factor) Kích cỡ của slice quyết định bởi mức bảo vệ lỗi cần có trong ứng dụng vì bộ giải mã sẽ bỏ qua slice bị lỗi Hệ số một chiều DC được định

vị tại điểm bắt đầu mỗi slice

- Ảnh : Lớp ảnh cho bên thu biết về loại mã hoá khung I, P, B Phần Header

mang thứ tự truyền tải của khung để bên thu hiển thị khung theo đúng thứ tự, ngoài

ra còn có một số thông tin bổ sung như thông tin đồng bộ, độ phân giải và vector chuyển động

- Nhóm ảnh (Group of Picture): Gồm cấu trúc các ảnh I, B và P Mỗi nhóm bắt đầu bằng ảnh I cung cấp điểm vào ra và tìm kiếm

- Chuỗi video ( Video Sequence): Lớp chuỗi bao gồm phần Header, một hoặc một số nhóm ảnh (Picture Group) và phần kết thúc chuỗi (Sequence End Code)

Thông tin quan trọng nhất của phần Header là kích thước (dọc, ngang) của mỗi ảnh, tốc độ bit, tốc độ ảnh và dung lượng đì hỏi bộ đệm dữ liệu bên thu

Thông tin chuỗi ảnh và phần Header của chuỗi là dòng bit đã mã hoá, còn gọi là dòng video cơ bản

2.5 Tiêu chuẩn nén MPEG-2

2.5.1 Đặc tính và định mức (profile and level)

Nén MPEG –2 có một chuỗi các mức (level) và đặc tính (profile) được dùng cho nhiều ứng dụng khác nhau Cấu trúc tín hiệu số trong chuẩn MPEG –2 rất phức tạp Việc sử dụng tiêu chuẩn MPEG –2 không phải lúc nào cũng cần thiết hoặc có ý nghĩa Vì thế dẫn đến việc phân chia cấu trúc thành phần các tập con gọi là các

Trang 29

profiles Trong phạm vi mỗi profile chỉ cho phép sử dụng các phần của các phần tử vừa phải trong cấu trúc tín hiệu đầy đủ Có 5 định nghĩa về profile:

- Simple profile (profile đơn giản): Số bước nén thấp, chỉ cho phép mã hoá các

ảnh loại I hoặc P Việc tách các ảnh loại B sẽ làm giảm bộ nhớ cho giải mã chuỗi

- Main profile: Cho phép sử dụng tất cả các loại ảnh, nhưng không tạo các

mức bất kỳ Chất lượng tốt hơn simple profile nhưng tốc độ bit không thay đổi

- SNR profile scanlable (profile phân cấp theo SNR): Tiêu chuẩn MPEG –2

cho phép phân cấp theo tỷ số nén tín hiệu trên tạp âm (S/N) Tính phân cấp theo S/N

có nghĩa là chất lượng hình ảnh và tỷ số S/N có tính thoả hiệp

- Spatially Scanlable profile (phân cấp theo không gian): Tính phân cấp theo

không gian có nghĩa là có sự thoả hợp với độ phân giải

Chuỗi ảnh được chia ra thành hai lớp tương ứng với các độ phân giải khác nhau của ảnh Lớp thấp hơn bao gồm ảnh có độ phân giải thấp ví dụ như truyền hình tiêu chuẩn, lớp cao hơn bao gồm ảnh có độ phân giải cao hơn ví dụ như truyền hình độ phân giải cao (HDTV)

- High profile (profile cao): Cho phép đối với cả hai loại thang mức và chuẩn

4:2:2 của tín hiệu video Nó bao gồm toàn bộ công cụ của profile trước cộng thêm khả năng mã hoá các tín hiệu khác nhau cùng một lúc Hay nói đúng hơn là “High profile” là một hệ thống hoàn hảo được thiết kế cho toàn bộ ứng dụng mà không bị giới hạn bởi tốc độ bit cao

Bảng 2.1: Bảng thông số chính profile và level của tín hiệu chuẩn MPEG –2

Phân cấp theo

Thấp (Low)

4:2:0 352x288

4 Mbit/s

4:2:0 352x 288

4 Mbit/s I,B,P Chính (Main)

4:2:0 720x576

15 Mbit/s I,P

4:2:0 720x576

15 Mbit/s I,B,P

4:2:0 720x 576

15 Mbit/s I,B,P

4:2:0 720x576

20 Mbit/s I,B,P Cao 1440

(High 1440)

4:2:0 1440×1152

60 Mbit/s I,B,P

4:2:0 1440×1152

60 Mbit/s I,B,P

4:2:0; 4:2:2 1440×1152

80 Mbit/s I,B,P Cao (High)

4:2:0 1920×1152

80 Mbit/s I,B,P

4:2:0 ;4:2:2 1920×1152

100 Mbit/s I,P,B

Trang 30

Vấn đề hạn chế các mức có liên quan đến độ phân giải cực đại của ảnh Có 4 mức hạn chế sau:

- Low level (Mức thấp): Ứng với độ phân giải của MPEG –1, có nghĩa là

bằng độ phân giải truyền hình tiêu chuẩn

- Main level (mức chính): Độ phân giải của truyền hình tiêu chuẩn

- High 1440 level (mức cao 1440): Độ phân giải của HDTV với 1440

mẫu/dòng

- High level (mức cao): Độ phân giải HDTV với 1920 mẫu/dòng

Kết hợp 4 level và 5 profile ta được tổ hợp 20 khả năng và hiện nay đã có 11 khả năng được ứng dụng như bảng ( theo tài liệu của Techtronic)

Với MPEG –2 MP@ML có thể nén tín hiệu truyền hình xuống còn (3∏5) Mbit/s, rất phù hợp và đáp ứng được tính kinh tế cho phát quảng bá các chương trình truyền hình tiêu chuẩn (SDTV) Còn đối với HDTV thì sử dụng MPEG –2 P@HL và MPEG –2 4:2:2 MP@HL

2.5.2 MPEG-2 4:2:2P@ML

Trong bảng 1.1: các tiêu chuẩn đều lấy mẫu theo tiêu chuẩn 4:2:2 và cho tốc

độ bit thấp rất phù hợp cho công đoạn truyền dẫn, phát sóng Tuy nhiên nó không thoả mãn yêu cầu chất lượng cho công đoạn sản xuất hậu kỳ Chuẩn 4:2:0 không thể cho một hình ảnh chất lượng studio sau một vài thế hệ gia công tín hiệu bởi phép nội suy tín hiệu mầu Sử dụng tốc độ bit 15 Mbit/s với GOP nhỏ chất lượng hình ảnh sẽ kém, GOP lớn sẽ gây khó khăn cho tất cả các thiết bị có chuyển đổi tín hiệu trong thời gian xoá mành Từ năm 1994 nhiều nhà sản xuất và sử dụng thấy cần phải

có tiêu chuẩn MPEG –2 4:2:2 P@ML (Profile Main Level) với tốc độ bit đạt 50 Mbit/s có thể đáp ứng được nhu cầu chất lượng trong các ứng dụng chuyên nghiệp Tháng 1/1996, MPEG –2 4:2:2P@ML trở thành tiêu chuẩn Quốc tế Nó hơn hẳn MPEG –2 MP@ML trên nhiều khía cạnh: tốc độ bit bằng 50 Mbit/s và có thể đáp ứng được cả hai chuẩn Video 4:2:2 và 4:2:0 Hệ thống này có đặc điểm chính sau đây:

- Có độ mềm dẻo cao và tính khai thác hỗn hợp Có khả năng giải mã trong phạm vi (15Æ50)Mbit/s với bất kỳ loại phối hợp nào giữa các ảnh I, P và B

- Chất lượng cao hơn MP@ML

Trang 31

- Độ phân giải màu tốt hơn MP@ML

- Xử lý hậu kỳ sau khi nén và giải nén

- Nén và giải nén nhiều lần

- Nhóm ảnh nhỏ, thuận tiện cho công nghệ dựng hình

- Có khả năng biểu thị tất cả các dòng tích cực của tín hiệu Video

Có khả năng biểu thị thông tin trong khoảng thời gian xoá mành

2.6 Tiêu chuẩn nén H.264

2.6.1 Giới thiệu chung về bộ CODEC H.264

1 Bộ mã hoá (Encoder)

Hình 2 6: Sơ đồ bộ mã hoá

Điểm khác biệt của H.264 so với các bộ mã hóa khác là có sự lựa chọn chế

độ mã hóa liên ảnh (Inter) hoặc trong ảnh (Intra) Chế độ mã hóa trong ảnh cho phép một MB có thể được nội suy từ giá trị các điểm ảnh ở MB lân cận trong cùng ảnh và nhờ đó làm tăng hiệu quả nén trong miền không gian

¾ Mã hoá xuôi (thuận): quá trình mã hoá thực hiện từ trái qua phải

Fn là khung hoặc field được chia nhỏ thành các macroblock, mỗi block sẽ

được mã hoá theo chế độ intra hoặc inter

Trong chế độ intra, thành phần được dự đoán P (ở đây có thể là các mẫu) được suy ra từ các mẫu đã được mã hóa hoặc đã được giải mã hay khôi phục trong

Trang 32

cùng 1 slice, trong đó uF'n là những mẫu chưa được lọc được dung cho việc xác

định P

Trong chế độ inter, thành phần được đoán P được suy ra nhờ dự đoán bù chuyển

động (motion-compensated prediction) từ 1 đến 2 khung đã mã hoá trước đó

Hiệu của thành phần được dự đoán P và block hiện tại là block hiệu Dn Block hiệu Dn được biến đổi DCT và lượng tử hoá tạo thành một nhóm hệ số biến đổi đã lượng tử hoá, các hệ số này sẽ được sắp xếp lại và mã hoá entropy Các hệ số lượng tử và các thông tin cần thiết để giải mã từng block trong Macroblock như chế

độ mã hoá nào, tham số lượng tử, thông tin của véc tơ chuyển động được nén

thành bitstream, qua NAL (Netword Abstraction Layer ) để truyền đi hay lưu trữ

Hình 2.7: Sơ đồ bộ mã hoá cụ thể

¾ Quá trình khôi phục : quá trình mã hoá thưc hiện từ phải qua trái

Cũng giống như quá trình mã hoá và truyền đi từng block trong 1 Macroblock, quá trình mã hoá sẽ giải mã block nhằm mục đích tạo ra block tham

chiếu cho lần dự đoán kế tiếp

Block hiệu D'n cộng với P khôi phục lại block Bộ lọc có nhiệm vụ giảm nhiễu trong từng block Nhiều block được khôi phục sẽ tạo thành bức tranh tham

chiểu F'n

Trang 33

2 Bộ giải mã (Decoder)

Hình 2.8: Sơ đồ bộ giải mã

Bộ giải mã hóa nhận được 1 luồng dữ liệu nén từ NAL và giải mã entropy nhưng

thành phần cơ bản của dữ liệu để tạo ra tập các hệ số được lượng tử hóa X Những hệ số này được "scale" và chuyển đổi ngược thành Dn Sử dụng thông tin tiêu đề được giải mã

từ lượng bit, bộ giải mã tạo ra khối dự đoán PRED, phân biệt với khối PRED được tạo ở bộ

mã hóa

2.6.2 Cấu trúc

Hình 2.9: cấu trúc mã hoá dữ liệu của H.264

1 Định dạng video (Video Format)

H.264 hỗ trợ mã hóa và giải mã video 4:2:0 quét liên tục hoặc xen kẽ Khung quét xen kẽ bao gồm 2 trường (trên và dưới) tách biệt theo thời gian với định dạng mặc định

2 Định dạng dữ liệu được mã hóa

H.264 phân biệt lớp mã hóa video (Video Coding layer VCL) và lớp mạng trừu tượng (Network Abstraction Layer – NAL) Đầu ra của quá trình mã hóa là dữ liệu lớp

mã hóa video VCL (chuỗi bit biểu diễn dữ liệu video đã được mã hóa) sẽ được ánh xạ

Trang 34

vào các đơn vị của lớp mạng trừu tượng- NAL trước khi truyền dẫn hay lưu trữ Mỗi đơn vị NAL bao gồm chuỗi byte thô về thứ tự tải, và một tập các thông tin ứng với dữ liệu video hay còn gọi là thông tin header Một chuỗi video được mã hóa được biểu diễn bởi chuỗi các đơn vị NAL mà có thể được truyền dẫn trên các mạng gói hay luồng bit trên đường truyền hay lưu ra file Mục đích của việc phân chia các lớp VCL và NAL là để phân biệt đặc tính mã hóa tại lớp VCL và đặc tính truyền dẫn tại lớp NAL

Hình 2.10: Chuỗi đơn vị NAL

3 Slice

Hình 2 11: Slices

Một ảnh video được mã hóa gồm một hay nhiều slice Mỗi slice bao gồm số nguyên các khối macro Số lượng khối macro trong một bức ảnh có thể không cố định Có sự phụ thuộc lẫn nhau tối thiểu giữa các slice đã được mã hóa để giúp giảm sự lan truyền lỗi Chuẩn mã hoá H.264 có 5 loại slice được mã hóa và một ảnh được mã hóa có thể bao gồm nhiều loại slice khác nhau, ví dụ ảnh được mã hóa trong profile cơ bản có thể bao gồm các slice I và P và ảnh được mã hóa ở profile chính hay mở rộng có thể gồm I,P,B slice Header slice (phần thông tin mào đầu) định nghĩa loại slice và ảnh mã hóa mà slice đó thuộc về và có thể kèm theo các thông tin hướng dẫn liên quan đến quản lý ảnh tham chiếu Phần dữ liệu của slice bao gồm chuỗi các khối macro được mã hóa và chỉ thị bỏ qua (không được mã hóa)

Trang 35

khối macro Mỗi khối macro bao gồm chuỗi các thành phần header và dữ liệu dư thừa được mã hóa

Bảng 2.1: Các loại slice

Loại Slice Mô tả Profile

I (Intra) Chỉ bao gồm khối macro I (mỗi khối

hoặc khối macro được dự đoán từ

dữ liệu được mã hóa trước đó trongcùng một slice)

Tất cả

P (Predicted) Bao gồm khối macro P (mỗi khối

macro hoặc vùng macro được dự đoán từ danh sách các ảnh trong list

0 hoặc là khối macro I

Tất cả

B (Dự đoán hai chiều) Bao gồm các khối macro B( mỗi

khối hay một vùng khối macro được

dự đoán từ danh sách ảnh list 0 hoặc list 1) hoặc là khối macro I

Mở rộng hoặc chính

SP (Switching P) Tạo điều kiện thuận lợi cho việc

chuyển đổi giữa các luồng dữ liệu

đã được mã hoá, chứa macroblock loại P hoặc I

Mở rộng

SI (Switching I) Tạo điều kiện thuận lợi cho việc

chuyển đổi giữa các luồng dữ liệu

đã được mã hoá, chứa macroblock loại SI (một dạng đặc biệt của macroblock mã hoá kiểu intra)

Mở rộng

Trang 36

Hình 2.12: Cấu trúc của slice

4 Macroblock

Hình 2.13: MacroBlock

Một khối macro bao gồm các dữ liệu được mã hóa ứng với vùng 16x16 mẫu của khung video.( 16x16 mẫu độ chói, 8x8 Cb và 8x8 Cr) và bao gồm các thành phần cú pháp theo bảng ở Khối macro được đánh số theo thứ tự quét trong khung

Bảng 2.2: Các thành phần cấu trúc của Macroblock

Mb_type Xác định liệu khối macro là loại I hay P, xác định kích

cỡ một vùng trong khối macro Mb_pred Xác định chế độ mã hóa trong ( khối macro intra), danh

sách tham chiếu List 0 hay List 1 và mã hóa các vector chuyển động khác nhau cho mỗi phần của khối macro

Trang 37

Sub_mp_pred Xác định kích cỡ khối macro con Danh sách tham chiếu

List 0 hay 1 cho mỗi vùng khối macro và mã hóa các vector chuyển động khác nhau cho mỗi vùng con

Coded_block_pattern Xác định khỗi 8x8 nào ( độ chói hay sắc) sẽ mang hệ số

biến đổi Mb_qp_delta Thay đổi tham số lượng tử hóa

Residual Hệ số biến đổi đã được mã hóa ứng với mẫu dư thừa sau

khi dự đoán

5 Ảnh tham chiếu(Reference Picture)

Hình 2.14: Ảnh tham chiếu và bù chuyển động

Bộ mã hóa H.264 có thể sử dụng hai hoặc nhiều các ảnh được mã hóa trước

đó để làm tham chiếu cho dự đoán bù chuyển động cho mã hóa ngoài các khối macro hoặc phân tách khối macro Điều này cho phép bộ mã hóa tìm kiếm khối macro giống nhất với khối macro được tách ra từ bức ảnh vừa được mã hóa Bộ mã hóa và giải mã luôn giữ một hoặc hai danh sách các ảnh tham chiếu, bao gồm ảnh

đã vừa được mã hóa hay giải mã (xuất hiện trước hoặc sau ảnh hiện tại) Mã hóa ngoài các khối macro hay vùng của khối macro trong slice P được dự đoán từ một danh sách các ảnh –list 0 Mã hóa ngoài khối macro và vùng các khối macro trong slide B có thể được dự đoán từ hai danh sách list 0 và list 1

Trang 38

2.6.3 Profile

Hình 2.15: Các profile

H.264 định nghĩa 3 profile trong đó mỗi profile hỗ trợ 1 tập cụ thể các hàm

mã hóa và chỉ ra những gì đươc yêu cầu của bộ mã hóa/giải mã phù hợp với từng profile Base profile hỗ trợ mã hóa trong và liên khung(sử dụng slice I và slice P )

và phương pháp mã hóa entropy CAVLC Main profile bao gồm video quét xen kẽ,

mã hóa liên khung sử dụng slice B, mã hóa liên khung dùng dự đoán có trọng số và phương pháp mã hóa entropy CABAC Extended profile không hỗ trợ video quét xen kẽ và phương pháp mã hóa entropy CABAC nhưng có thêm chế độ cho phép việc chuyển đổi giữa các luồng bit được mã hóa

Ứng dụng tiềm năng của profile Baseline bao gồm thoại video, hội thảo truyền hình, và truyền thông không dây Ứng dụng tiềm năng của Main profile là truyền hình quảng bá và lưu trữ dữ liệu Profile mở rộng có thể hữu ích trong ứng dụng streaming Tuy nhiên mỗi profile có sự mềm dẻo đủ để hỗ trợ một loại ứng dụng khác nhau

Trang 39

2.6.4 Một số kỹ thuật trong H.264

1 Dự đoán nội khung (Intra Prediction)

Trong dự đoán nội khung, các block được dự đoán từ các block trong cùng slice của khung hiện tại Các kiểu dự đoán intra trong H.264 bao gồm: 9 chế độ dự đoán bock intra_4x4 (kích cỡ 4x4) cho độ chói, 4 chế độ dự đoán block intra_16x16 (kích cỡ 16x16) cho độ chói, 4 chế độ dự đoán cho 2 đại diện của thành phần màu, cùng với với chế độ dự đoán I_PCM Trong đó các chế độ dự đoán intra_4x4 phù hợp với các vùng ảnh có độ phúc tạp về các chi tiết cao, các chế độ dự đoán intra16x16 phù hợp với các vùng đơn giản của ảnh Chế độ I_PCM cho phép bộ mã hóa bỏ qua các tiến trình dự đoán và chuyển đổi thay vào đó bộ mã hóa sẽ gửi trực tiếp các giá trị của các mẫu được mã hóa I_PCM được sử dụng cho các trường hợp như: để bộ mã hóa biểu diễn chính xác giá trị của các mẫu có các tham số lượng tử rất nhỏ, cung cấp một cách biểu diễn chính xác các nội dung bất thường của ảnh … Với các trường hợp đó thì chế độ này hiệu quả hơn là các chế độ intra khác

Các chuẩn trước thì dự đoán intra được điều khiển trong miền không gian chuyển đổi, trái lại dự đoán Intra trong H.264 luôn luôn được điều khiển trong miền không gian bằng việc tham chiếu các mẫu bên cạnh đã được mã hóa trước đó (ở bên trái, hoặc phía trên của block được dự đoán)

Hình 2.16: Dự đoán nội suy

Trang 40

Hình 2.17: Dự đoán intra 4x4

Hình 2.18: Các chế độ dự đoán intra_4x4

¾ Chế độ dự đoán Intra_16x16:

Khi sử dụng chế Intra_16x16, tất cả các thành phần độ chói của một MB được

dự đoán Có 4 chế độ dự đoán intra16x16 là dự đoán theo chiều dọc, dự đoán theo chiều ngang, dự đoán DC, dự đoán phẳng như được thể hiện trong hình dưới đây:

Định dạng
Số trang	109
Dung lượng	2,95 MB