1. Trang chủ
  2. » Giáo án - Bài giảng

Bài giảng truyền thông đa phương tiện - ảnh, video, audio, VoIP

119 213 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 119
Dung lượng 3,48 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

MỤC LỤCMỞ ĐẦU ......................................................................................................................... 3CHƯƠNG 1: TỔNG QUAN VỀ TRUYỀN THÔNG ĐA PHƢƠNG TIỆN ................. 41.1. Giới thiệu chung về truyền thông đa phƣơng tiện ............................................. 41.1.1. Một số khái niệm cơ bản ............................................................................. 51.1.2. Các ứng dụng truyền thông đa phƣơng tiện ................................................ 61.2. Các thành phần của hệ thống truyền thông đa phƣơng tiện ............................. 111.3. Dữ liệu đa phƣơng tiện .................................................................................... 131.4. Kỹ thuật nén dữ liệu ......................................................................................... 141.5. Truyền dữ liệu đa phƣơng tiện ......................................................................... 171.6. Các phƣơng pháp truyền dữ liệu đa phƣơng tiện ............................................. 181.6.1. Mô hình download .................................................................................... 181.6.2. Mô hình Streaming .................................................................................... 19CHƯƠNG 2: CÁC PHƢƠNG PHÁP NÉN DỮ LIỆU ĐA PHƢƠNG TIỆN .............. 212.1. Phƣơng pháp nén ảnh ....................................................................................... 212.1.1. Ảnh số và các định dạng file ..................................................................... 212.1.2. Phƣơng pháp nén ảnh JPEG ...................................................................... 262.1.3. Phƣơng pháp nén ảnh JPEG2000 .............................................................. 442.2. Các chuẩn biểu diễn và nén video .................................................................... 472.2.1. Nguyên tắc cơ bản về nén Video .............................................................. 472.2.2. Các chuẩn nén MPEG ............................................................................... 482.2.3. Các chuẩn nén MPEG1, MPEG2, MPEG4 ........................................... 542.2.4. Chuẩn tổ chức Multimedia MPEG21 ...................................................... 632.2.5. Các chuẩn nén video H.261, H.263 ............................................................. 632.2.6. Các chuẩn nén mới H.264MPEG4 Part 10 ................................................ 662.2.7. Các chuẩn hệ thống AudioVisual – H.3xx ................................................... 672.3. Các chuẩn biểu diễn và nén âm thanh ................................................................. 672.3.1. Âm thanh ...................................................................................................... 672.3.2. Kỹ thuật âm thanh số .................................................................................... 682.3.3. Nén âm thanh theo chuẩn MPEG ................................................................. 692.3.4. Các chuẩn nén âm thanh ............................................................................... 692.3.5. Các chuẩn tái hiện (surround) âm thanh số .................................................. 722.4. Các chuẩn biểu diễn và nén tiếng nói ................................................................. 732.4.1. Tổng quan về xử lý tiếng nói ........................................................................ 732.4.2. Các chuẩn nén tiếng nói ITUT G7.xx .........CHƯƠNG 3: CÔNG NGHỆ TRUYỀN DỮ LIỆU ĐA PHƢƠNG TIỆN3.1. Các mạng IP ..................................................................................................... 743.1.1. Tổng quan về internet, khái niệm và các giao thức .................................. 743.1.2. Các hệ thống tên miền Internet và địa chỉ ................................................. 753.1.3. Các giao thức IPv4 và IPv6 ....................................................................... 753.2. Công nghệ mạng không dây ............................................................................ 783.2.1. Tổng quan về mạng không dây ................................................................. 783.2.2. Các mạng PAN (Bluetooth) ...................................................................... 803.2.3. Các mạng LAN ......................................................................................... 813.2.4. Các mạng di động Wireless Voice Network ............................................. 833.2.5. Đảm bảo chất lƣợng dịch vụ (Internet QoS) ............................................. 863.3. Dịch vụ VoIP ................................................................................................... 893.4. Dịch vụ VPN .................................................................................................... 933.5. Công nghệ truyền hình số ................................................................................ 94CHƢƠNG 4: THIẾT BỊ TRUYỀN THÔNG ĐA PHƢƠNG TIỆN ............................. 964.1. Thiết bị kết nối .................................................................................................... 964.2. Các thiết bị lƣu trữ .............................................................................................. 974.2.1. Ðĩa từ tính ..................................................................................................... 984.2.2. Ðĩa từ quang ................................................................................................ 1014.2.3. Ðĩa quang học ............................................................................................. 1024.2.4. Băng từ Magnetic tape ............................................................................. 1034.2.5. Thẻ SD – Secure Digital Card .................................................................... 1044.2.6. Ổ đĩa lai SSHD ........................................................................................... 1044.3. Các thiết bị vàora ............................................................................................. 1054.3.1. Các thiết bị vào ........................................................................................... 1054.3.2. Các thiết bị ra .............................................................................................. 1114.4. Thiết bị đọc ....................................................................................................... 1184.5. Thiết bị đầu cuối ............................................................................................... 119

Trang 1

MỤC LỤC

MỞ ĐẦU 3

CHƯƠNG 1: TỔNG QUAN VỀ TRUYỀN THÔNG ĐA PHƯƠNG TIỆN 4

1.1 Giới thiệu chung về truyền thông đa phương tiện 4

1.1.1 Một số khái niệm cơ bản 5

1.1.2 Các ứng dụng truyền thông đa phương tiện 6

1.2 Các thành phần của hệ thống truyền thông đa phương tiện 11

1.3 Dữ liệu đa phương tiện 13

1.4 Kỹ thuật nén dữ liệu 14

1.5 Truyền dữ liệu đa phương tiện 17

1.6 Các phương pháp truyền dữ liệu đa phương tiện 18

1.6.1 Mô hình download 18

1.6.2 Mô hình Streaming 19

CHƯƠNG 2: CÁC PHƯƠNG PHÁP NÉN DỮ LIỆU ĐA PHƯƠNG TIỆN 21

2.1 Phương pháp nén ảnh 21

2.1.1 Ảnh số và các định dạng file 21

2.1.2 Phương pháp nén ảnh JPEG 26

2.1.3 Phương pháp nén ảnh JPEG2000 44

2.2 Các chuẩn biểu diễn và nén video 47

2.2.1 Nguyên tắc cơ bản về nén Video 47

2.2.2 Các chuẩn nén MPEG 48

2.2.3 Các chuẩn nén MPEG-1, MPEG-2, MPEG-4 54

2.2.4 Chuẩn tổ chức Multimedia MPEG-21 63

2.2.5 Các chuẩn nén video H.261, H.263 63

2.2.6 Các chuẩn nén mới H.264/MPEG-4 Part 10 66

2.2.7 Các chuẩn hệ thống AudioVisual – H.3xx 67

2.3 Các chuẩn biểu diễn và nén âm thanh 67

2.3.1 Âm thanh 67

2.3.2 Kỹ thuật âm thanh số 68

2.3.3 Nén âm thanh theo chuẩn MPEG 69

2.3.4 Các chuẩn nén âm thanh 69

2.3.5 Các chuẩn tái hiện (surround) âm thanh số 72

2.4 Các chuẩn biểu diễn và nén tiếng nói 73

2.4.1 Tổng quan về xử lý tiếng nói 73

2.4.2 Các chuẩn nén tiếng nói ITU-T G7.xx Error! Bookmark not defined CHƯƠNG 3: CÔNG NGHỆ TRUYỀN DỮ LIỆU ĐA PHƯƠNG TIỆN 74

Trang 2

3.1 Các mạng IP 74

3.1.1 Tổng quan về internet, khái niệm và các giao thức 74

3.1.2 Các hệ thống tên miền Internet và địa chỉ 75

3.1.3 Các giao thức IPv4 và IPv6 75

3.2 Công nghệ mạng không dây 78

3.2.1 Tổng quan về mạng không dây 78

3.2.2 Các mạng PAN (Bluetooth) 80

3.2.3 Các mạng LAN 81

3.2.4 Các mạng di động Wireless Voice Network 83

3.2.5 Đảm bảo chất lượng dịch vụ (Internet QoS) 86

3.3 Dịch vụ VoIP 89

3.4 Dịch vụ VPN 93

3.5 Công nghệ truyền hình số 94

CHƯƠNG 4: THIẾT BỊ TRUYỀN THÔNG ĐA PHƯƠNG TIỆN 96

4.1 Thiết bị kết nối 96

4.2 Các thiết bị lưu trữ 97

4.2.1 Ðĩa từ tính 98

4.2.2 Ðĩa từ quang 101

4.2.3 Ðĩa quang học 102

4.2.4 Băng từ - Magnetic tape 103

4.2.5 Thẻ SD – Secure Digital Card 104

4.2.6 Ổ đĩa lai SSHD 104

4.3 Các thiết bị vào/ra 105

4.3.1 Các thiết bị vào 105

4.3.2 Các thiết bị ra 111

4.4 Thiết bị đọc 118

4.5 Thiết bị đầu cuối 119

Trang 3

MỞ ĐẦU Học phần cung cấp cho sinh viên các kiến thức về:

- Các khái niệm cơ bản về truyền thông đa phương tiện

- Các chuẩn mã hoá ảnh

- Các chuẩn mã hoá video

- Các chuẩn mã hoá âm thanh

- Các chuẩn mã hoá tiếng nói

- Các mạng IP, wireless

- Các giao thức truyền thông đa phương tiện

- Các ứng dụng trong truyền thông đa phương tiện

Nhằm giúp sinh viên phát triển sự hiểu biết về các nguyên tắc cơ bản về các hệ thống đa phương tiện và chúng được ứng dụng và phát triển như thế nào trong thực tế Ngoài ra nhằm tạo cho sinh viên cơ hội tiếp cận thực sự chuyên sâu về môn học Nhưng cũng tạo điều kiền cho sinh viên tự học, phát triển năng lực, điểm mạnh, điểm yếu của mỗi cá nhân

Trang 4

CHƯƠNG 1: TỔNG QUAN VỀ TRUYỀN THÔNG ĐA PHƯƠNG TIỆN 1.1 Giới thiệu chung về truyền thông đa phương tiện

Khi công nghệ phát triển, người tiêu dùng ngày càng đòi hỏi khắt khe hơn Trong thời đại của thông tin tốc độ cao, chúng ta mong muốn nhận được các thông tin ngay tức thì và đồng thời, thông qua nhiều cách thức khác nhau Nhu cầu này giải thích tại sao các kênh tin tức trên truyền hình thường xuyên có các dòng chữ chạy phía dưới màn hình trong khi phát th ảnh viên nói và các hình ảnh đã thâu băng trước

đó trôi qua Nhu cầu đó giải thích tại sao các website ngày nay ngoài nội dung và các siêu liên kết còn gồm thêm các hình ảnh đồ hoạ, hoạt ảnh và âm thanh

Những nhu cầu này đã mở rộng cách chúng ta làm việc, học tập và giải trí Nói một cách đơn giản, các thông tin “một chiều” không còn phù hợp với hầu hết chúng ta nữa Thông tin, các bài học, trò chơi và mua sắm sẽ lôi cuốn hơn là khiến chúng ta chú

ý hơn nếu chúng ta có thể tiếp cận và sắp xếp chúng trong các cách thức khác nhau, thậm chí theo một ý thích nào đó mà chúng ta chợt nảy ra Những nhu cầu này và các tiến bộ về công nghệ đã tương quan mật thiết với nhau để đưa nghệ thuật và khoa học truyền thông đa phương tiện lên một tầm cao mới, dẫn đến kết quả là các sản phẩm có khả năng đan kết văn bản, hình ảnh đồ hoạ, hoạt ảnh, âm thanh và video

Khi chúng ta sử dụng các sản phẩm này - cho dù là một bộ bách khoa toàn thư trên web hay một trò chơi video trên CD - thì có nghĩa là chúng ta không đơn thuần chỉ làm việc với một chương trình máy tính Chúng ta đã trải nghiệm qua một sự kiện truyền thông đa phương tiện Các sản phẩm truyền thông đa phương tiện ngày nay đều thu hút nhiều giác quan cùng một lúc và đáp ứng với nhu cầu thay đổi của chúng

ta với tốc độ ngày càng gia tăng

Cùng với sự phát triển rộng rãi của công nghệ thông tin, truyền thông đa phương tiện giống như một cơn bão tiến vào cuộc sống hiện đại của chúng ta, nó làm thay đổi cách chúng ta nghĩ, cách chúng ta hành động, thậm chí cả cách chúng ta sống

Truyền thông đa phương tiện là việc ứng dụng công nghệ thông tin trong việc sáng tạo, thiết kế những sản phẩm mang tính đa phương tiện và tương tác ứng dụng trong các lĩnh vực truyền thông, quảng cáo, giáo dục và giải trí

Đó là việc thiết kế đồ họa, trò chơi điện tử, làm hoạt hình 3D, thiết kế web, biên tập âm thanh, phim ảnh… tất cả đều thực hiện trên máy tính Hầu hết các sản phẩm truyền thông (quảng cáo, truyền hình, Internet,…) và giải trí hiện đại (game, điện ảnh, hoạt hình,…) chúng ta sử dụng ngày nay đều là sản phẩm của ngành truyền thông đa phương tiện

Có thể nói, truyền thông đa phương tiện là sự kết hợp giữa công nghệ thông tin

và mỹ thuật, trong đó máy tính là công cụ chủ yếu cho việc sáng tạo, xây dựng các sản

Trang 5

phẩm truyền thông, giải trí,… và ứng dụng đồ họa cho tất cả các lĩnh vực khác của đời sống xã hội

Thực tiễn cho thấy các dịch vụ thông tin ngày nay không chỉ đơn thuần là cung cấp dữ liệu, số liệu mà đòi hỏi sự trực quan và tương tác cao Do đó, các hình thức, loại hình, cũng như yêu cầu về chất lượng dịch vụ truyền thông đa phương tiện ngày càng phong phú, đa dạng Truyền thông đa phương tiện cũng là nền tảng quan trọng cho nhiều hoạt động kinh tế, xã hội như: báo chí, truyền hình, quảng cáo, PR, xây dựng nhãn hiệu, tiếp thị, giải trí, giáo dục, mỹ thuật đa phương tiện, đồ họa kiến trúc,

và các hoạt động truyền thông khác

Tại Việt Nam, truyền thông đa phương tiện là một ngành nghề mới và đang phát triển rất nhanh Vào thời điểm này, số lượng chuyên gia cao cấp trong nước có thể tạo ra những sản phẩm truyền thông linh hoạt và đa văn hóa hiện còn rất khan hiếm

Phần dưới đây sẽ giới thiệu cho các bạn các khái niệm cơ bản về truyền thông đa phương tiện và giải thích cách hoạt động của các yếu tố truyền thông đa phương tiện

1.1.1 Một số khái niệm cơ bản

a Thế nào là phương tiện?

Trong suốt chiều dài lịch sử, thông tin đã được chuyển tải thông qua một phương tiện duy nhất Âm thanh, chẳng hạn như giọng nói của con người, chính là một loại phương tiện đó và qua nhiều thế kỉ trước khi chữ viết được sử dụng rộng dãi thì nói chuyện là một cách thức chủ yếu để trao đổi thông tin Sau này con người bắt đầu

kể chuyện và để lại thông tin về cuộc sống của mình thông qua hình vẽ và các bức ảnh

Sự ra đời của chữ viết đã cho con người một phương tiện khác nữa để diễn đạt ý nghĩ của mình Ngày nay, con người thường sử dụng lời nói, âm thanh, chữ viết, âm nhạc, văn bản, hình ảnh, đồ họa, hoạt ảnh và video để truyền tải thông tin Những thứ này là tất cả các loại phương tiện khác nhau và mỗi phương tiện thường được dùng để biểu đạt các loại thông tin nhất định

Như vậy trong ý nghĩa này, phương tiện chỉ đơn giản là một cách thức dễ truyền đạt thông tin

b Thế nào là đa phương tiện?

Dữ liệu đa phương tiện gồm dữ liệu về: văn bản, hình ảnh, âm thanh, hình động…

Đa phương tiện có nhiều loại, những phương tiện công cộng về đa phương tiện: Radio, vô tuyến, quảng cáo, phim, ảnh

Ví dụ: Giáo viên sử dụng bảng đen trong lớp học để viết các lời giải thích cho bài giảng của họ

Trang 6

+ Multimedia là ứng dụng được kết hợp từ hai hay nhiều phương tiện nhằm mục đích tạo ra các sản phẩm một cách hiệu quả nhất cùng với sự hỗ trợ của cả âm thanh và hình ảnh

+ Là thông tin kết hợp từ nhiều dạng thông tin và được thể hiện một cách đồng thời

+ Multimedia là một hệ thống kỹ thuật dùng để trình diễn các dữ liệu và thông tin, sử dụng đồng thời các hình thức chữ viết, âm thanh, hình ảnh, động hình qua hệ thống Computer, trong đó tạo khả năng tương tác giữa người sử dụng và hệ thống

+ Thuật ngữ đa phương tiện dùng để chỉ các thông tin như dữ liệu, tiếng nói, đồ họa, hình ảnh tĩnh, âm thanh và phim ảnh được các mạng truyền đi cùng thời điểm

c Thế nào là truyền thông đa phương tiện?

Kể từ lâu con người đã khám phá ra rằng các thông điệp sẽ trở nên tác động hơn (có nghĩa là người nghe sẽ hiểu và nhớ chúng dễ hơn) khi chúng được biểu đạt thông qua một kết hợp của các phương tiện khác nhau Loại kết hợp này chính là ý nghĩa của thuật ngữ truyền thông đa phương tiện

Truyền thông đa phương tiện: là sử dụng nhiều hơn một loại phương tiện vào

cùng một thời điểm

Sử dụng phim ảnh, truyền hình kết hợp nhiều loại phương tiện (âm thanh, video, hoạt ảnh, hình ảnh tĩnh và chữ) để tạo ra nhiều loại thông điệp khác nhau có khả năng cung cấp thông tin

Thuật ngữ truyền thông đa phương tiện dùng để chỉ các thông tin như dữ liệu, tiếng nói, đồ họa, hình ảnh tĩnh, âm thanh và phim ảnh được các mạng truyền đi cùng thời điểm

Hay: Truyền tải sản phẩm ĐPT dưới dạng khác nhau

1.1.2 Các ứng dụng truyền thông đa phương tiện

1.1.2.1 Video streaming

+ Video Streaming thường được sử dụng trong lĩnh vực giải trí hoặc dạy học, dùng để lưu trữ các file video hoặc các bài học, cung cấp cho người dùng các tiện ích như tìm kiếm, liệt kê, và khả năng hiển thị hoặc hiển thị lại các dữ liệu video theo yêu cầu Video Streaming được thể hiện dưới hai dạng: Video theo yêu cầu (on demand)

và Video thời gian thực (live event)

+ Video theo yêu cầu là các dữ liệu video được lưu trữ trên multimedia server

và được truyền đến người dùng khi có yêu cầu, người dùng có toàn quyền để hiển thị cũng như thực hiện các thao tác (tua, dừng, nhẩy qua …) với các đoạn dữ liệu này

+Video thời gian thực là các dữ liệu video được convert trực tiếp từ các nguồn cung cấp dữ liệu theo thời gian thực (máy camera, microphone, các thiết bị phát dữ liệu

Trang 7

video ) Các dữ liệu này sẽ được multimedia phát quảng bá thành các kênh người dùng

sẽ chỉ có quyền truy nhập bất kỳ kênh ưa thích nào để hiển thị dữ liệu mà không được thực hiện các thao tác tua, dừng trên các dữ liệu đó (giống như TV truyền thống)

1.1.2.2 Hội nghị truyền hình

 Khái niệm hội nghị truyền hình

Hội nghị truyền hình (VideoConferencing) là hệ thống thiết bị (bao gồm cả phần cứng và phần mềm) truyền tải hình ảnh và âm thanh giữa hai hoặc nhiều địa điểm

từ xa kết nối qua đường truyền mạng Internet, WAN hay LAN, để đưa tín hiệu âm thanh và hình ảnh của các phòng họp đến với nhau như đang ngồi họp cùng một phòng họp; Thiết bị này cho phép hai hoặc nhiều địa điểm cùng đồng thời liên lạc hai chiều thông qua video và truyền âm thanh

Là sự hoạt động tương tác giữa tín hiệu audio, video trong thời gian thực Nó được ứng dụng trong hội họp từ xa giúp những người tham gia không tốn thời gian đi lại mà vẫn có thể gặp mặt nhau, mà lại tiết kiệm nhiều chi phí khác

 Lịch sử phát triển

Vào những năm 80 của thế kỷ XX, Hội nghị truyền hình đã mở ra một hướng mới cho thế giới trong việc trao đổi thông tin khi các đối tượng cần giao lưu ở các vị trí khác nhau mà không có khái niệm về mặt địa lý Khác với các phương tiện trao đổi thông tin khác như điện thoại, dữ liệu, Hội nghị truyền hình cho phép mọi người tiếp xúc với nhau, nói chuyện với nhau thông qua tiếng nói và hình ảnh bằng hình ảnh trực quan Việc sử dụng công nghệ hội nghị truyền hình, cho thấy hiệu quả sử dụng của nó

đã đem lại lợi ích hiệu quả kinh tế rõ rệt, ứng dụng truyền hình cho việc giao lưu, gặp

gỡ, hội nghị, hội thảo, đào tạo, chăm sóc sức khỏe từ xa trong ngành y tế, các lĩnh vực khác trong nền kinh tế là sự hợp tác, nghiên cứu và phát triển không ngừng đã đem lại lợi ích và hiệu quả kinh tế vô cùng to lớn cho xã hội

1 Thế hệ đầu tiên của hệ thống thiết bị hội nghị truyền hình được thực hiện qua mạng kỹ thuật số đa dịch vụ ISDN dựa trên tiêu chuẩn H.230 của Tổ chức ITU

2 Thế hệ thứ hai của hệ thống thiết bị hội nghị truyền hình ứng dụng cho máy tính cá nhân và công nghệ thông tin và vẫn dựa vào mạng ISDN và các thiết bị

mã hoá/giải mã, nén/giải nén - CODEC;

3 Thế hệ thứ ba của hệ thống thiết bị hội nghị truyền hình ra đời trên cơ sở mạng cục bộ LAN phát triển rất nhanh và có mặt ở khắp mọi nơi trên thế giới Hiện nay, công nghệ truyền hình với chất lượng cao sử dụng chuẩn H.230 có tính ưu việt, đã và đang thay thế dần các phương tiện thông tin khác và đã được ứng dụng vào tất các các ngành kinh tế quốc dân từ quốc phòng, chăm sóc sức khỏe, đào tạo, nghiên cứu khoa học, v.v và cuối cùng là một công nghệ truyền thông không thể thiếu được trong ngành kinh tế quốc dân

Trang 8

Công nghệ hiện đại nhất hiện nay của hệ thống thiết bị hội nghị truyền hình là

sử dụng theo tiêu chuẩn công nghệ H.323 qua giao thức IP Khi công nghệ HD (High Definition) chính thức ra nhập thị trường Với chất lượng hình ảnh rõ nét gấp 10 lần so với chuẩn SD (Standard Definition), độ phân giải hình ảnh đạt đến 720p, nén Video chuẩn H.264, âm thanh AAC-LD, hội nghị truyền hình HD thực sự thoả mãn được nhu cầu “giao tiếp ảo” Công nghệ HD giúp các các tổ chức, doanh nghiệp thay thế các cuộc họp dày đặc bằng những cuộc họp trực tuyến

 Công nghệ sử dụng

Hệ thống thiết bị hội nghị truyền hình là một hệ thống thiết bị điện tử (bao gồm

cả phần cứng và phần mềm) sử dụng công nghệ kỹ thuật số, nén (coder/decoder) âm thanh và video trong thời gian thực Giải pháp hội nghị truyền hình dựa trên công nghệ

IP với sự hỗ trợ nhiều giao thức (H.320, H.323, SIP, SCCP) cho phép triển khai hệ thống Hội nghị truyền hình tiên tiến nhưng vẫn tận dụng được cơ sở hạ tầng có sẵn

 Các thiết bị cần thiết cho một hệ thống hội nghị truyền hình bao gồm:

1 Video đầu vào: video camera hoặc webcam

2 Video đầu ra: màn hình máy tính, truyền hình hoặc máy chiếu

3 Âm thanh đầu vào: micro, CD/DVD, cassette player, hoặc bất kỳ nguồn nào của

ổ cắm âm thanh preamp

4 Âm thanh đầu ra: loa phóng thanh đi kèm với các thiết bị hiển thị hoặc điện thoại

5 Truyền dữ liệu: số điện thoại mạng hoặc tương tự, LAN hoặc Internet

 Thiết bị cơ bản bao gồm:

- Camera: Thu tín hiệu hình ảnh

- Micro: Thu tín hiệu âm thanh

- DECODE: Xử lý mã hóa nhận và truyền tín hiệu âm thanh và hình ảnh và truyền qua đường truyền

- Màn hình hiển thị: Hiển thị hình ảnh của các phòng họp từ xa

- Loa: Phát tín hiệu âm thanh của các phòng họp từ xa

- MCU: Thiết bị quản lý và xử lý đa điểm

- Lưu Trữ: Ghi lại nội dung cuộc họp

- Show Present: Thường là phần mềm có chức năng trình chiếu tài liệu tại một máy tính lên hình ảnh của hội nghị

Tùy theo từng hãng sản xuất sử dụng công nghệ khác nhau nhưng đều đi qua một số chuẩn giao thức bắt tay nhau như H:323, H:264 nên các sản phẩm của các hãng khác nhau vẫn bắt tay được với nhau

 Một số tiêu chuẩn trong hội nghị truyền hình

Trang 9

Các hệ thống hội nghị truyền hình để làm việc được trong môi trường mạng phải tuân thủ các tiêu chuẩn chung (về truyền dẫn, mã hóa âm thanh, hình ảnh, điều khiển dữ liệu, ) do liên minh viễn thông quốc tế ITU-T qui định

Dưới đây là một số chuẩn:

Chuẩn truyền thông:

- H.320: được khuyến nghị cho các mạng chuyển mạch kênh như ISDN hoặc

kênh riêng (leased-line) H.320 hỗ trợ cho cả liên lạc điểm-điểm và đa điểm

- H.321: được khuyến nghị cho các mạng B-ISDN và ATM H.321 hỗ trợ cho cả liên lạc điểm - điểm và đa điểm

- H.322: được khuyến nghị cho các mạng chuyển mạch gói như Frame Relay

- H.323: được xây dựng dựa trên các đặc tả sẵn có của H.320, có bổ xung thêm

các đặc tính nhằm hỗ trợ cho truyền thông đa phương tiện thời gian thực (Real Time Multimedia) trên các mạng chuyển mạch gói như LAN, WAN, Internet…

- H.324: được khuyến nghị cho các mạng PSTN, POTs là các mạng điện thoại

thường

- SIP- Session Initiation Protocol là tiêu chuẩn được áp dụng phổ biến trong hoạt

động truyền thông VoiIP Giao thức này chủ yếu dùng để thiết lập và phân tách các cuộc gọi điện thoai

Mã hoá Video:

- H.261: Chuẩn mã hoá Video H.261 được ITU công bố vào năm 1990 Nó được

thiết kế cho dữ liệu ở các tốc độ bằng cấp số nhân của 64Kbit/s hay còn gọi là p*64Kbit/s (trong đó p bằng 1 đến 30) Thuật toán mã hoá là sự lai ghép giữa việc dự đoán trước hình ảnh, biến đổi mã và bù lại các chuyển động Dự đoán trước hình ảnh nhằm loại bỏ việc lặp lại thời gian Biến đổi mã nhằm loại bỏ việc lặp lại không gian Hướng của các di chuyển được dùng để bù lại các chuyển động H.261: hỗ trợ cho hai độ phân giải, QCIF (Quarter Common Intermediate Format) và CIF (Common Intermediate Format)

- H.263: là một tiêu chuẩn của ITU-T được công nhận vào những năm

1995/1996 Ban đầu nó được thiết kế cho nhu cầu truyền thông ở tốc độ thấp (dưới 64Kbit/s) Sau đó H.263 được sử dụng để thay thế cho H.261 ở hầu hết các ứng dụng Thuật toán mã hoá của H.263 cũng tương tự như H.261, chỉ có một vài bổ xung và thay đổi nhằm tăng cường khả năng xử lý và sửa lỗi H.263

hỗ trợ cho năm độ phân giải khác nhau:

+ QCIF (Quarter Common Intermediate Format)

+ CIF (Common Intermediate Format)

+ SQCIF (SQCIF = ½ QCIF)

+ 4CIF (4CIF = 4 x CIF)

Trang 10

+ 16CIF (16CIF = 16 x CIF)

- H.264: là chuẩn nén video thế hệ 3 được đề ra bởi ITU-T Nó còn có tên là

MPEG-4 Part 10 hoặc AVC (for Advanced Video Coding) Đây là chuẩn phát triển bởi ITU-T Video Coding Experts Group (VCEG) và ISO/IEC Moving Picture Experts Group (MPEG) Lợi ích chính của chuẩn mới này là nó cung

cấp hình ảnh video rất rõ nét ở băng thông thấp H.264 là một tiêu chuẩn nén

video, và hiện đang là một trong các định dạng phổ biến nhất được sử dụng để ghi âm nén phân phối và video độ nét cao

Mã hoá Audio:

- G.711: Điều biến mã Pulse các tần số thoại (PCM) trong đó tín hiệu audio 3.1

kHz analogue được mã thành các luồng 48, 56 hoặc 64 kbps stream Chỉ được dùng khi không có thể dùng được chuẩn nào khác

- G.722: Mã hóa audio 7 kHz thành các luồng 48, 56 hoặc 64 kbps Chất lượng

cao nhưng chiếm nhiều băng thông

- G.722.1: Mã hóa audio 7 kHz ở 24 và 32 kbps với tỉ lệ mất khung thấp

- G.722.1: Annex C - Chuẩn ITU có nguồn gốc từ Siren 14 của Polycom - mã

hóa audio 14 kHz

- G.722.2: Mã hóa lời nói ở khoảng 16 kbps sử dụng Adaptive Multi-Rate

Wideband, AMR-WB Bao gồm 5 chế độ: 6.60, 8.85, 12.65, 15.85 và 23.85 kbps

- G.723.1: Mã hóa 3.4 kHz cho viễn thông ở 5.3 kbps và 6.4 kbps

- G.728: Mã hóa 3.4 kHz Low Delay Code Excited Linear Prediction

(LD-CELP) trong đó âm thanh 3.4 kHz analogue được mã thành luồng 16 kbps Chuẩn này cung cấp chất lượng tốt ở tốc độ thấp

- G.729 A/B: Mã hóa 3.4 kHz với âm thanh gần bằng chất lượng điện thoại cố

ddịnh, âm thanh được mã thành luồng 8 kbps sử dụng phương pháp AS-CELP Phụ lục A là mã giảm hóa bớt độ phức tạp, phụ lục B hỗ trợ triệt lặng và cung cấp âm thanh nền dễ chịu Ngoài ra mỗi nhà sản xuất còn có các chuẩn mã hoá riêng cho chất lượng âm thanh rất cao nếu sử dụng thiết bị đồng nhất của một hãng Ví dụ: các chuẩn PT716plus, PT724, Siren14, Siren22 của Polycom

Các chuẩn điều khiển:

- H.221: định nghĩa cấu trúc khung truyền cho các ứng dụng âm thanh hình ảnh

trong các kênh từ 64 tới 1920 Kbps; được dùng trong H.320

- H.223: xác dịnh giao thức phối kênh theo gói cho các giao dịch đa phương tiện

tốc độ thấp; Annex A và B xử lý các lỗi kênh nhẹ và vừa của máy mobile giống như được dùng trong 3G-324M

Trang 11

- H.224: xác định giao thức điều khiển thời gian thực cho các ứng dụng đơn công

sử dụng các kênh H.221 LSD, HSD và HLP

- H.225: xác định các dạng truyền phối kênh để đóng gói và đồng bộ luồng thông

tin trong mạng LAN không được đảm bảo QoS

- H.231: xác định thiết bị MCU sử dụng để kết nối nhiều hơn 3 hệ thống H.320

vào 1 hội nghị

- H.233: Các hệ thống đảm bảo bí mật cho các dịch vụ âm thanh hình ảnh, dùng

cho các thiết bị H.320

- H.234: Hệ thống xác thực và quản lý chìa khóa mã hóa cho các dịch vụ âm

thanh hình ảnh, dùng cho các thiết bị H.320

- H.235: An ninh và mã hóa cho cầu đầu cuối H.323 và H.245

- H.239: định nghĩa vai trò quản lý và các kênh cho các đầu cuối

- H.300-Series: Làm sao để có thể dữ liệu và cộng tác qua web thực hiện được

đồng thời với hình ảnh video trong 1 hội nghị, cho phép các đầu cuối hỗ trợ H.239 nhận và gửi nhiều luồng riêng rẽ thoại, video và cộng tác dữ liệu

- H.241:định nghĩa các thủ tục video mở rộng và các tín hiệu điều khiển các đầu

cuối H.300-Series multimedia

- H.242: định nghĩa các thủ tục điều khiển và giao thức để thiết lập liên lạc giữa

các đầu cuối trên các kênh digital tới 2 Mbps; dùng cho H.320

 Lợi ích của hội nghị truyền hình

Hội nghị truyền hình là một bước phát triển đột phá của công nghệ thông tin, nó cho phép những người tham dự tại nhiều địa điểm từ những quốc gia khác nhau có thể nhìn thấy và tao đổi trực tiếp với nhau qua màn hình tivi như đang họp trong cùng một hội trường Công nghệ này đã được ứng dụng rộng rãi trong nhiều lĩnh vực, đặc biệt trong hội họp và hội thảo Ngoài ra, hội nghị truyền hình còn được ứng dụng rộng rãi trong giáo dục đào tạo, an ninh quốc phòng, y tế và chăm sóc sức khỏe

- Tiết kiệm thời gian di chuyển

- Tiết kiệm kinh phí

- Thực hiện cuộc họp trực tuyến giữa nhiều địa điểm khác nhau

- Nhanh chóng tổ chức cuộc họp

- Lưu trữ toàn bộ nội dung cuộc họp

- An toàn bảo mật

- Chất lượng hội nghị ổn định

1.2 Các thành phần của hệ thống truyền thông đa phương tiện

a Thế nào là một hệ truyền thông đa phương tiện?

Các hệ thống thông tin đa phương tiện dùng nhiều phương tiện giao tiếp khác nhau (văn bản, dữ liệu ghi, dữ liệu số, đồ họa, hình ảnh, âm thanh …) Nhiều ứng dụng

Trang 12

là đa phương tiện theo ý nghĩa là chúng dùng nhiều dạng trên Tuy nhiên, thuật ngữ

“đa phương tiện” thường được dùng để mô tả các hệ thống phức tạp hơn nhất là các hệ thống hỗ trợ hình ảnh và âm thanh Các thông tin mới chủ yếu được tạo ra bên ngoài máy tính Lời nói, nhạc, hình ảnh, phim được chuyển từ dạng Analog (tương tự) sang dạng (digital) số trước khi được dùng trong các ứng dụng trong máy tính Ngược lại, với văn bản, đồ họa và thậm chí phim hoạt hình đều được tạo trên máy tính và vì vậy

nó chỉ đáp ứng những mục tiêu nhất định, không thể mở rộng ứng dụng được

Một hệ nền máy tính, mạng thông tin hay dụng cụ mềm là một hệ đa phương tiện nếu nó hỗ trợ ứng dụng tương tác cho ít nhất là một trong các dạng thông tin sau Không kể văn bản và đồ họa: âm thanh, hình ảnh tĩnh hoặc phim video chuyển động

Hình 1.1: Hệ thống đa phương tiện

Hệ thống đa phương tiện (Multimedia System) là hệ thống có khả năng xử lý dữ

liệu đa phương tiện và các ứng dụng

Hệ thống đa phương tiện được đặc trưng hóa bởi khả năng xử lý, lưu trữ, xây dựng, điều khiển và hiển thị các thông tin đa phương tiện

b Các thành phần của hệ thống truyền thông đa phương tiện

Như đã nói ở trên, môn học này bàn về việc truyền dữ liệu đa phương tiện trên hệ thống mạng truyền thông (Internet, mạng diện rộng)

Hình 1.2 thể hiện mô hình client/server để truyền dữ liệu đa phương tiện hai đầu

Ở phía nguồn, dữ liệu đa phương tiện được nén và lưu trữ Qua hệ thống điều khiển từ phía server, các dữ liệu này sẽ được gửi đi qua mạng tùy theo yêu cầu của người dùng Giao thức ở tầng application/transport sẽ được dùng để truyền dữ liệu tới máy khách,

dữ liệu này sẽ được lưu trong bộ đệm hoặc thiết bị lưu trữ, từ đó được giải mã và được hiển thị cho người dùng

Trang 13

Hình 1.2: Sơ đồ khối cơ bản của 1 hệ thống đa phương tiện

Đặc trưng duy nhất của mô hình hệ thống này là: Các thành phần của hệ thống sẽ thực hiện công việc một cách tuần tự theo các bước trong quá trình truyền dữ liệu Do

đó, nếu 1 thành phần hoạt động không tốt sẽ ảnh hưởng tới toàn bộ hệ thống

Tóm lại, các thành phần của hệ thống truyền thông đa phương tiện bao gồm:

 Dữ liệu đa phương tiện

 Hệ thống lưu trữ

 Bộ đệm

 Mạng truyền thông

 Thiết bị xử lý, hiển thị

 Các đặc trưng của hệ thống đa phương tiện:

- Hệ thống đa phương tiện phải được điều khiển bởi máy tính

- Hệ thống đa phương tiện là tích hợp

- Thông tin phải được thể hiện dưới dạng số

- Giao diện của dạng hiển thị cuối là tương tác được

1.3 Dữ liệu đa phương tiện

Dữ liệu đa phương tiện cần được hiểu là nhiều loại dữ liệu sẽ được thu thập, gửi

đi và hiển thị một cách đồng thời Có rất nhiều loại dữ liệu: đơn giản nhất là dữ liệu văn bản thô, văn bản đã định dạng, và các dạng dữ liệu khác như ảnh đồ họa, âm thanh, video…

Ta có thể phân loại các loại dữ liệu trên ra thành 2 loại, theo ngữ cảnh của việc truyền dữ liệu đa phương tiện

- Loại thứ nhất: dữ liệu rời rạc (discrete media) gồm các loại dữ liệu mà khi

hiển thị không bị bó buộc chặt chẽ về thời gian Ví dụ ta có thể nhận 1 bức ảnh

Trang 14

từ web server để hiển thị trong web browser Tùy theo thông lượng mạng mà thời gian nhận bức ảnh có thể nhanh hay chậm trước khi nó được giải mã và hiển thị

- Loại thứ 2: dữ liệu liên tục Dữ liệu này có một yêu cầu chặt chẽ về thời gian

hiển thị và các thông tin này được nhúng bên trong dữ liệu Ta có thể thấy ngay

ví dụ đó là dữ liệu video, audio Dữ liệu video thường được mã hóa theo các frame được hiển thị tuần tự với một tần số nào đó, ví dụ 25 hình/giây (frame per second fps) Do đó để hiển thị các đối tượng video một cách đúng đắn, thì không chỉ cần nhận dữ liệu video một cách chính xác mà còn cần phải giải mã

và hiển thị chúng theo đúng trình tự và thời điểm Nếu không làm được điều đó thì video hiển thị sẽ bị hỏng, chất lượng thấp Do đó lưu lượng mạng dành cho

dữ liệu đa phương tiện có thể coi là lưu lượng cố định do sự cần thiết duy trì bộ định thời chặt chẽ

Từ đó ta thấy, thách thức trong truyền thông đa phương tiện nói chung và đặc

biệt là truyền thông dữ liệu đa phương tiện liên tục, đó là phải đảm bảo tính vẹn toàn của cả dữ liệu và thời gian hiển thị (presentation timing) Hơn nữa, dữ liệu đa phương tiện thông thường là sự kết hợp của nhiều dòng dữ liệu khác nhau và được đồng bộ với nhau Do đó, độ phức tạp sẽ được nhân lên nhiều lần và phải đồng bộ

giữa các dòng dữ liệu với nhau

Các vấn đề chính trong truyền thông đa phương tiện:

+ Dung lượng rất lớn + Băng thông giới hạn + Truyền liên tục + Kết hợp nhiều loại thông tin + Chi phí cho việc truyền tin lớn

1.4 Kỹ thuật nén dữ liệu

Nén dữ liệu (Data compression) là việc chuyển định dạng thông tin sử dụng ít

bit hơn cách thể hiện ở dữ liệu gốc

Nén dữ liệu là cần thiết vì giảm được nguồn tài nguyên cũng như dung lượng lưu trữ hay băng thông đường truyền Tuy nhiên, vì dữ liệu nén cần được giải nén nên

sẽ đòi hỏi nhiều phần cứng và xử lý

Mục đích của nén dữ liệu là để làm cho một tập tin nhỏ hơn bằng cách giảm thiểu lượng dữ liệu hiện tại Khi một tập tin được nén, nó có thể là giảm xuống ít nhất

là 25% so với kích thước gốc, làm cho nó dễ dàng hơn để gửi đến những người khác trên internet

Tùy theo dữ liệu có bị thay đổi trước và sau khi giải nén không, người ta chia nén thành hai loại: Nguyên vẹn (lossless) và bị mất dữ liệu (lossy)

Trang 15

 Nén không mất dữ liệu (lossless compression)

Dữ liệu, đặc biệt là văn bản, đồ họa luôn chứa trong nó những chuỗi thông tin giống hệt nhau lặp đi lặp lại Việc nén dữ liệu được thực hiện bằng cách thay thế nhiều

ký tự thông tin lặp đi lặp lại bằng các ký tự khác, và tạo ra chỉ một bản sao của những đoạn dữ liệu bị lặp lại này Cũng có cách khác tỉ mỉ hơn dùng những mã có độ dài khác nhau mã hóa cho các ký tự khác nhau giúp cho các ký tự này chiếm ít chỗ hơn Cách gì thì cách nhưng phải làm sao vừa thu nhỏ được kích thước file vừa giữ được sự toàn vẹn của dữ liệu

Các thuật toán nén không mất dữ liệu thường dựa trên giả thuyết dư thừa trong

dữ liệu và thể hiện dữ liệu chính xác hơn mà không mất các thông tin Nén mà không làm mất dữ liệu là khả thi vì tất cả các dữ liệu thực tế đều có dư thừa Ví dụ một hình ảnh có thể có các vùng màu sắc không thay đổi trong nhiều pixel Thay vì ghi nhận từng pixel như đỏ, đỏ, đỏ dữ liệu có thể được ghi là 279 điểm ảnh đỏ liên tiếp

Dựa theo mức áp dụng thuật toán nén người ta chia nén thành các dạng sau:

- Nén tệp tin: Đây là dạng thức nén truyền thống và thuật toán nén được áp dụng cho từng tệp tin riêng lẻ Tuy vậy nếu 2 tệp tin giống nhau thì vẫn được nén 2 lần và được ghi 2 lần Chỉ các byte trùng lắp trong 1 file được loại trừ để giảm kích thước Tùy dữ liệu nhưng thông thường khả năng giảm sau khi nén chỉ từ 2-3 lần

- Loại trừ trùng lắp file: Đây là dạng thức nén mà thuật toán nén được áp dụng cho nhiều tập tin Các file giống hệt nhau sẽ chỉ được lưu một lần Ví dụ một thư điện tử có tệp tin đính kèm được gửi cho 1000 người Chỉ có một bản đính kèm được lưu và vì vậy có thể giảm khá nhiều Thông thường có thể giảm từ 5-

 Nén có mất dữ liệu (lossy compression)

Hay gặp nhất trong công nghệ thông tin là nén hình ảnh và âm thanh Chuẩn nén tín hiệu số gồm có các chuẩn sau:

- Chuẩn MJPEG: Đây là một trong những chuẩn cổ nhất mà hiện nay vẫn sử dụng MJPEG (Morgan JPEG) Chuẩn này hiện chỉ sử dụng trong các thiết bị DVR rẻ tiền, chất lượng thấp Không những chất lượng hình ảnh kém, tốn tài nguyên xử lí, cần nhiều dung lượng ổ chứa, và còn hay làm lỗi đường truyền

Trang 16

- Chuẩn MPEG2: Chuẩn MPEG là một chuẩn thông dụng Đã được sử dụng rộng rãi trong hơn một thập kỉ qua Tuy nhiên, kích thước fle lớn so với những chuẩn mới xuất hiện gần đây, và có thể gây khó khăn cho việc truyền dữ liệu

Ví dụ như trong MPEG-2, nơi mà nội dung được tạo ra từ nhiều nguồn như video ảnh động, đồ họa, văn bản… và được tổ hợp thành chuỗi các khung hình phẳng, mỗi khung hình (bao gồm các đối tượng như người, đồ vật, âm thanh, nền khung hình…) được chia thành các phần tử ảnh pixels và xử lý đồng thời, giống như cảm nhận của con người thông qua các giác quan trong thực tế Các pixels này được mã hoá như thể tất cả chúng đều là các phần tử ảnh video ảnh động Tại phía thu của người sử dụng, quá trình giải mã diễn ra ngược với quá trình mã hoá không khó khăn

Vì vậy có thể coi MPEG-2 là một công cụ hiển thị tĩnh, và nếu một nhà truyền thông truyền phát lại chương trình của một nhà truyền thông khác về một sự kiện, thì logo của nhà sản xuất chương trình này không thể loại bỏ được Với MPEG-2, bạn có thể bổ sung thêm các phần tử đồ hoạ và văn bản vào chương trình hiển thị cuối cùng (theo phương thức chồng lớp), nhưng không thể xoá bớt các đồ hoạ và văn bản có trong chương trình gốc

- Chuẩn MPEG-4: Mpeg-4 là chuẩn cho các ứng dụng MultiMedia Mpeg-4 trở thành một tiêu chuẩn cho nén ảnh kỹ thuật truyền hình số, các ứng dụng về đồ hoạ và Video tương tác hai chiều (Games, Videoconferencing) và các ứng dụng Multimedia tương tác hai chiều (World Wide Web hoặc các ứng dụng nhằm phân phát dữ liệu Video như truyền hình cáp, Internet Video ) Mpeg-4 đã trở thành một tiêu chuẩn công nghệ trong quá trình sản xuất, phân phối và truy cập vào các hệ thống Video Nó đã góp phần giải quyết vấn đề về dung lượng cho các thiết bị lưu trữ, giải quyết vấn đề về băng thông của đường truyền tín hiệu Video hoặc kết hợp cả hai vấn đề trên

Với MPEG-4, các đối tượng khác nhau trong một khung hình có thể được mô

tả, mã hoá và truyền đi một cách riêng biệt đến bộ giải mã trong các dòng cơ bản ES (Elementary Stream) khác nhau Cũng nhờ xác định, tách và xử lý riêng các đối tượng (như nhạc nền, âm thanh xa gần, đồ vật, đối tượng ảnh video như con người hay động vật, nền khung hình …), nên người sử dụng có thể loại bỏ riêng từng đối tượng khỏi khuôn hình Sự tổ hợp lại thành khung hình chỉ được thực hiện sau khi giải mã các đối tượng này

- H.264 H.264 (MPEG-4 AVC hay MPEG-4 part 10), hiện đang là phương thức tiên tiến nhất trong lĩnh vực nén video H.264 cho chất lượng hình ảnh tốt nhất khi có cùng dung lượng so với các chuẩn nén khác H.264 cũng được ứng dụng như thuật nén chính trong video độ phân giải cao (HD)

 Các phương pháp nén mất mát thông tin: Lượng tử hóa vô hướng PCM & DPCM, Lượng tử hóa vecto, Mã hóa biến đổi (biến đổi côsin rời rạc, biến đổi Furie), mã hóa băng con …

Trang 17

1.5 Truyền dữ liệu đa phương tiện

Với 2 loại dữ liệu đa phương tiện đã bàn ở trên, ta chỉ tập trung vào truyền dữ liệu liên tục trong phần còn lại của môn học Chúng ta có thể phân lớp việc truyền dữ liệu đa phương tiện liên tục thành 2 loại: truyền thời gian thực và truyền bán thời gian thực (soft-real-time delivery)

Truyền thời gian thực: dữ liệu phải truyền từ nguồn và hiển thị tại đích với một

độ trễ cho trước Truyền thời gian thực thường được sử dụng để người dùng tương tác

với nhau như: Internet Phone, đàm thoại video từ xa (Hình 1.3)

Hình 1.3: Truyền dữ liệu liên tục thời gian thực trong hội đàm video

Truyền dữ liệu bán thời gian thực: Không cho trước thời gian trễ, thay vào đó, hệ thống phải truyền sao cho đảm bảo tính toàn vẹn của dữ liệu và toàn vẹn thời gian hiển thị, đồng thời giảm thời gian trễ ở mức tối đa Ví dụ của việc truyền dữ liệu bán thời gian thực là dịch vụ video theo yêu cầu (Video On Demand) Hệ thống này có thể có

độ trễ ban đầu lớn để đổi lấy chất lượng video mịn trong quá trình play (Hình 1.4)

Hình 1.4: Truyền dữ liệu bán thời gian thực trong hệ thống VOD

Trang 18

1.6 Các phương pháp truyền dữ liệu đa phương tiện

Việc truyền dữ liệu trên mạng máy tính không đã được thực hiện từ lâu, và có rất nhiều phương pháp khác nhau để áp dụng Trong đó phương pháp download là phương pháp phổ biến nhất để truyền dữ liệu đa phươn tiện từ server tới client

1.6.1 Mô hình download

Mô hình download được mô tả trong hình 1.5: Client gửi 1 yêu cầu tới server để

chỉ ra đối tượng dữ liệu cần download; server sẽ lấy đối tượng dữ liệu đó (có thể từ hệ thống file nội bộ) và truyền nó tới client qua mạng dùng một số giao thức application/transport Có thể lấy ví dụ trong WWW

Hình 1.5: Tương tác giữa client và server trong mô hình download

Đặc điểm của phương pháp: Trước tiên đối tượng dữ liệu phải được nhận về

toàn bộ và lưu trong bộ đệm hoặc file trước khi được giải mã và hiển thị Khi đối tượng dữ liệu đã được client nhận đầy đủ thì việc giải mã và trình diễn dữ liệu đó sẽ được thực hiện như trên hệ thống file nội bộ của client Mô hình này hoạt động tốt trong một số ứng dụng nhưng lại không phù hợp với dữ liệu liên tục

Giả sử quá trình download như trong hình 1.6 , bỏ qua thời gian xử lý, thời gian

từ khi bắt đầu yêu cầu đến khi có thể hiển thị được dữ liệu được tính theo kích thước của đối tượng dữ liệu và tốc độ truyền Với những ứng dụng như WWW thì dữ liệu thường là văn bản HTML, hoặc ảnh nhỏ thì độ trễ này tương đối nhỏ

Tuy nhiên, với đối tượng dữ liệu liên tục thì độ trễ có thể sẽ rất lớn, đến mức không chấp nhận được Ví dụ, một dữ liệu video thời lượng 2 giờ được nén MPEG2 với tần só bit trung bình 6Mbps sẽ có kích thước khoảng 5.4GB Và truyền đi trong mạng với tốc độ 8Mbps thì người dùng sẽ phải chờ khoảng 1.5 giờ trước khi có thể xem video

Hình 1.6: Thời gian bắt đầu trễ trong mô hình download

Trang 19

Nhược điểm cơ bản của mô hình download (được thể hiện trên hình 1.7) là nó yêu cầu phải download toàn bộ đối tượng video về thì mới bắt đầu xem được Trong khi đối với nhiều loại dữ liệu rời rạc thì yêu cầu này là cần thiết, thì dữ liệu liên tục như video có đặc trưng là một phần dữ liệu của nó có thể được giải mã (decoded) và hiển thị (play back) Dữ liệu video được cấu thành từ các frame, và ta có thể xem khi toàn bộ dữ liệu của 1 frame được client nhận về

Hình 1.7: Thời gian trễ để download 5.4 GB video

Từ đặc điểm này mà người ta có thể cải tiến mô hình download thành mô hình Streaming như sau:

1.6.2 Mô hình Streaming

Trong mô hình streaming, dữ liệu liên tục sẽ được phát lại trong khi quá trình

nhận dữ liệu về vẫn tiếp diễn (minh họa trong hình 1.8) Sau khi gửi yêu cầu tới server

để bắt đầu quá trình streaming client sẽ đợi gói dữ liệu đầu tiên tới và bắt đầu phát lại (play), trong khi nhận gói dữ liệu thứ 2, và cứ như thế Do đó, quá trình phát lại và quá trình nhận dữ liệu được thực hiện theo dòng gần song song (pipeline)

Trang 20

Hình 1.8: Play từng phần dữ liệu trong mô hình streaming

So sánh với mô hình download thì cần phải đáp ứng thêm 2 yêu cầu sau để mô hình streaming có thể hoạt động Thứ nhất, dữ liệu đa phương tiện phải có thể chia nhỏ thành các đoạn độc lập, các đoạn này có thể được giải mã và phát lại Hầu hết các dữ liệu liên tục như audio, video đều có tính chất này Thứ hai, để bảo toàn bộ định thời trong khi hiển thị hay trình diễn (presenting) , ta cần đảm bảo các đoạn dữ liệu sẽ được nhận về trước

thời điểm dự kiến sẽ hiển thị nó Đây chính là yêu cầu về tính liên tục, một trong các

tham số chủ đạo trong thiết kế và đánh giá hệ thống đa phương tiện liên tục

Trang 21

CHƯƠNG 2: CÁC PHƯƠNG PHÁP NÉN DỮ LIỆU ĐA PHƯƠNG TIỆN 2.1 Phương pháp nén ảnh

Định nghĩa:

Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất định Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh

Độ phân giải của ảnh: Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị

Các giai đoạn trong quá trình xử lý ảnh:

- Thu nhận hình ảnh: Đây là giai đoạn đầu tiên và quan trọng nhất trong toàn bộ

quá trình xử lý ảnh Ảnh nhận được tạ đây chính là ảnh gốc để đưa vào xử lý tại

Trang 22

các giai đoạn sau, trường hợp ảnh gốc có chất lượng kém hiệu quả của các bước

xử lý tiếp theo sẽ bị giảm

Thiết bị thu nhận: Có thể là các ống ghi hình chân không hoặc các thiết bị cảm

biến quang điện bán dẫn CCD

- Tiền xử lý ảnh: Giai đoạn xử lý tương đối đơn giản nhằm nâng cao chất lượng

ảnh để trợ giúp cho các quá trình xử lý nâng cao tiếp theo, Ví dụ: tăng độ tương phản, làm nổi đường biên, khử nhiễu v.v

- Phân đoạn: Là quá trình tách hình ảnh thành các phần hoặc vật thế riêng biệt

Đây là một trong những vấn đề khó giải quyết nhất trong lĩnh vực xử lý ảnh Nếu thực hiện tách quá chi tiết thì bài toán nhận dạng các thành phần được tách

ra trở nên phức tạp, còn ngược lại nếu quá trình phân đoạn được thực hiện quá thô hoặc phân đoạn sai thì kết quả nhận được cuối cùng sẽ không chính xác

- Biểu diễn và mô tả: là quá trình xử lý tiếp sau khâu phân đoạn hình ảnh Các

vật thể sau khi phân đọan có thể được mô tả dưới dạng chuỗi các điểm ảnh tạo nên ranh giới một vùng, hoặc tập hợp tất cả các điểm ảnh nằm trong vùng đó Phương pháp mô tả thông qua ranh giới vùng thường được sử dụng khi cần tập trung sự chú ý vào hình dạng bên ngòai của chi tiết ảnh như độ cong, các góc cạnh v.v Biểu diễn vùng thường được sử dụng khi chúng ta quan tâm tới đặc tính bên trong của vùng ảnh như đường vân (texture) hay hình dạng skeletal

- Nén ảnh: Bao gồm các biện pháp giảm thiểu dung lượng bộ nhớ cần thiết để

lưu trữ hình ảnh, hay giảm băng thông kênh truyền, cần thiết để truyền tín hiệu hình ảnh số

- Nhận dạng: Là quá trình phân loại vật thể dựa trên cơ sở các chi tiết mô tả vật

thể đó( ví dụ các phương tiện giao thông có trong ảnh)

Các quá trình xử lý liệt kê ở trên đều được thực hiện dưới sự giám sát và điều khiển dựa trên cơ sở các kiến thức về lĩnh vực xử lý ảnh Các kiến thức cơ bản có thể đơn giản như vị trí vùng ảnh nơi có những thông tin cần quan tâm, như vậy có thể thu nhỏ vùng tìm kiếm

Trường hợp phức tạp hơn, cơ sở kiến thức có thể chứa danh sách tất cả những hư hỏng có thể gặp trong quá trình kiểm sóat chất lượng thành phẩm hoặc các ảnh vệ tinh có độ chi tiết cao trong các hệ thống theo dõi sự thay đổi môi trường trong một vùng Ngoài việc điều khiển họat động của từng modul xử lý ảnh (hình 2.1.3), cơ sở kiến thức còn sử dụng để thực hiện việc điều khiển tương tác giữa các modules

2.1.1.2 Các định dạng File Ảnh

Các định dạng file ảnh (JPEG, TIFF, GIF và PNG) khác nhau có ý nghĩa khác nhau về chất lượng hình ảnh cũng như dung lượng ổ đĩa cần cho việc lưu trữ

Trang 23

JPEG, TIFF, GIF và PNG là 4 định dạng file dữ liệu chính trong lưu trữ ảnh Các loại máy ảnh số và phần mềm xử lý ảnh hỗ trợ tương thích với loại định dạng file ảnh nào đều có liệt kê rõ trong phần thông số kỹ thuật đi kèm sản phẩm

Tùy vào từng trường hợp mà mỗi định dạng file ảnh có ưu thế riêng hay bộc lộ hạn chế Chẳng hạn JPEG là định dạng phổ biến nhất với đa số người dùng máy ảnh gia đình nhưng định dạng này tuy là lựa chọn hoàn hảo khi trao đổi qua email nhưng lại là lựa chọn khá tệ hại cho việc lưu làm tư liệu về lâu dài

Lựa chọn sai định dạng cho mục đích sử dụng có thể dẫn đến việc làm mất dữ liệu, sai lệch thông tin lưu trữ Ví dụ khi chọn đính kèm ảnh có định dạng dung lượng quá lớn có thể khiến chương trình email treo hàng giờ đồng hồ Hoặc việc nén file có thể bị lỗi khi chọn sai định dạng file ảnh

Cho nên việc hiểu rõ về các định dạng file ảnh sẽ giúp việc lưu trữ và sử dụng dữ liệu thêm linh hoạt và tránh được những sự cố về giảm chất lượng ảnh hay treo máy, hao dung lượng ổ đĩa

a Định dạng file JPEG

JPEG là viết tắt của Joint Photographic Experts Group Đây là định dạng tập tin hầu hết các loại máy ảnh số và phần mềm xử lý ảnh đều hỗ trợ tương thích File JPEG cũng là định dạng file ảnh phổ biến nhất trên Internet

Định dạng JPEG có dung lượng nhỏ, nhẹ

Ưu điểm: dung lượng nhỏ, nhẹ Việc đính kèm file ảnh cho email hay upload

/download file JPEG trên các website luôn thuận tiện và nhanh chóng với định dạng file này

Sở dĩ file JPEG nhỏ gọn hơn hầu hết các định dạng file khác bởi vì cơ chế lưu trữ hình ảnh của dạng file này là nén dữ liệu theo tỉ lệ nhất định File JPEG thông thường có thể chiếm dung lượng chỉ 1/10 so với tập tin dữ liệu gốc

Khi email hay thao tác trên Internet, dung lượng tập tin là yếu tố quan trọng hàng đầu, cho nên các file dữ liệu JPEG là lựa chọn tối ưu nhằm giúp thao tác được

Trang 24

nhanh chóng, tránh các lỗi treo máy hay timeout (do máy chủ không hồi đáp các lệnh

xử lý quá lâu) hoặc làm quá tải hộp thư người nhận

Nhược điểm: Cái giá cho tốc độ xử lý nhanh chóng của JPEG trên các ứng

dụng Internet khiến dân nhiếp ảnh rất miễn cưỡng khi lựa chọn Trong quá trình nén

dữ liệu của file JPEG, dữ liệu ảnh trên các pixel bị thay đổi, các vùng ảnh quá nhỏ không thể nén được sẽ bị xóa vĩnh viễn Việc này khiến cho màu sắc và các chi tiết trên ảnh kém sắc nét chút đỉnh so với file gốc

Mỗi lần một file JPEG được lưu, quá trình nén dữ liệu làm cho chất lượng ảnh giảm đi một chút Không những thế, sự giảm chất lượng ảnh này được bảo lưu liên tục: Càng chỉnh sửa nhiều trên file JPEG càng khiến nó mau hỏng hoặc chất lượng hình ảnh ngày càng xấu hơn

Chất lượng ảnh giảm dần trong quá trình sử dụng khiến JPEG là định dạng file

“làm mất dữ liệu” Khái niệm này tả rõ khuyết điểm của file JPEG: Chất lượng ảnh mất dần sau mỗi lần lưu Do vậy, định dạng JPEG là lựa chọn tối ưu trong việc email hay tải lên Internet để chia sẻ hình ảnh, nhưng tuyệt đối không phải là lựa chọn sáng suốt cho mục đích lưu trữ hình ảnh làm tư liệu về lâu dài

Trang 25

Khuyết điểm duy nhất của file TIFF chính là dung lượng cồng kềnh Do định dạng tập tin này lưu trữ toàn bộ thông tin của các pixel trong dữ liệu nén chung của bức ảnh nên dung lượng của nó luôn lớn hơn rất nhiều nếu so với file JPEG Điều này khiến việc lưu trữ file TIFF luôn tốn nhiều dung lượng bộ nhớ

Với những ai quan tâm đến chất lượng hình ảnh và sợ file bị hỏng, TIFF luôn là lựa chọn hàng đầu về độ tin cậy Nhưng luôn nhớ rằng file TIFF nén cũng không giảm dung lượng bao nhiêu so với file TIFF không nén

c Định dạng file PNG

PNG (Portable Network Graphics) cũng là định dạng file bảo lưu dữ liệu, không làm mất chất lượng ảnh trong lưu trữ và nén file Tương tự như file TIFF, hình ảnh định dạng PNG thích hợp để lưu trữ tư liệu lâu dài

Định dạng PNG bảo lưu chất lượng dữ liệu nén còn vượt trội hơn TIFF

Có thể người dùng thường không để ý thấy sự khác biệt nhỏ về file PNG: Định dạng file này thậm chí bảo lưu chất lượng dữ liệu nén còn vượt trội hơn file TIFF (file PNG nén cho ra dữ liệu với chất lượng cao hơn) PNG cũng là định dạng file được nhiều chương trình phần mềm xử lý ảnh hỗ trợ

d Định dạng file GIF

File GIF (Graphic Interface Format) là định dạng dữ liệu sử dụng rộng rãi trong

đồ họa và thế giới ảnh số nhưng dạng file này tuyệt đối không phù hợp để lưu trữ hình ảnh Tập tin định dạng GIF bị giới hạn ở bảng màu 256 màu nên không thể cho ra hình ảnh chân thực của file dữ liệu gốc

Trang 26

Các chuyên viên thiết kế đồ họa thường dùng định dạng GIF để lưu logo hoặc các hình ảnh có ít màu sắc Tương tự file JPEG, dung lượng nhỏ gọn khiến định dạng GIF là lựa chọn lý tưởng cho các ứng dụng web

Chọn định dạng nào?

Việc chọn định dạng file nào trong số nhiều định dạng tùy thuộc vào mục đích lưu trữ và sử dụng ảnh Nếu lưu trữ tư liệu lâu dài, TIFF và PNG là lựa chọn số 1 Ngược lại, không ai muốn nhận một email đính kèm tập tin kềnh càng có thể gây treo máy hay làm tràn hộp thư với các định dạng này Cho nên khi sử dụng online, các file nhỏ gọn hơn như định dạng JPEG lại là lựa chọn tốt hơn hẳn mặc dù JPEG không đảm bảo được chất lượng hình ảnh

Cách tốt nhất trong việc chọn lựa định dạng file ảnh chính là sử dụng linh hoạt các định dạng này bằng cách:

- Lưu trữ bản chính của file ảnh bằng định dạng TIFF hoặc PNG trong một thư mục gốc

- Khi cần sử dụng cho các mục đích online như email, tải lên website các thao tác đòi hỏi tính chất nén nhỏ gọn của file ảnh, hãy copy từ tập tin ảnh gốc và lưu chuyển đổi thành định dạng JPEG rồi thao tác trên bản copy này

Việc kết hợp các định dạng file ảnh linh hoạt thế này sẽ giúp việc chia sẻ hay ứng dụng ảnh trên Internet nhanh gọn mà lại lưu trữ tư liệu ảnh an toàn đảm toàn chất lượng cao cho kho ảnh gốc

2.1.2 Phương pháp nén ảnh JPEG

2.1.2.1 Giới thiệu về chuẩn JPEG

JPEG - viết tắt của nhóm từ Joint Photographic Experts Group Nó được CCITT (International Telegraph and Telephone Consultative Committee) công nhận

và đã được công nhận là chuẩn ISO năm 1991 Là một trong những phương pháp nén ảnh hiệu quả, có tỉ lệ nén ảnh tới vài chục lần

Phương pháp nén ảnh JPEG được dùng phổ biến nhất để nén dữ liệu ảnh số Với các hình đồ họa đơn giản thì thường được nén phương pháp GIF, PNG

Chuẩn JPEG được sử dụng để mã hóa ảnh đa mức xám, ảnh màu Nó không cho kết quả ổn định lắm với ảnh đen trắng

Phương pháp nén ảnh theo thuẩn JPEG có thể cho hệ số nén tới 80:1 hay lớn hơn, nhưng bạn phải chịu mất thông tin (ảnh sau khi bung nén khác với ảnh ban đầu), lượng thông tin mất mát tăng dần theo hệ số nén Tuy nhiên sự mất mát thông tin này không bị làm một cách cẩu thả JPEG tiến hành sửa đổi thông tin ảnh khi nén sao cho

Trang 27

ảnh mới gần giống như ảnh cũ, khiến phần đông mọi người không nhận thấy sự khác biệt Và bạn hoàn toàn có thể quản lý sự mất mát này bằng cách hạn chế hệ số nén Như thế người dùng có thể cân nhắc giữa cái lợi của việc tiết kiệm bộ nhớ và mức độ mất thông tin của ảnh, để chọn phương án thích hợp

 Đặc điểm của chuẩn nén ảnh JPEG

- Tỷ lệ nén cao

- Sử dụng nhiều tham số để hiệu chỉnh các tỉ lệ nén, chất lượng nén

- Rất tốt cho các loại ảnh đen trắng và các ảnh có tone thay đổi liên tục

- Không quá phức tạp cho cả phần mềm và phần cứng

2.1.2.2 Nguyên lý nén ảnh JPEG

Phương pháp nén ảnh JPEG dựa trên nguyên lý sau: ảnh màu trong không gian của 3 màu RGB (red Green Blue) được biến đổi về hệ YUV (hay YCbCr) (điều này không phải là nhất thiết, nhưng nếu thực hiện thì cho kết quả nén cao hơn) theo công thức:

Sử dụng ba tham số Y, Cb, Cr; Y ứng với brightness (Độ sáng, độ chói) Cb,Cr ( phiên bản biến thể của thành phần U và V) là hai thành phần ứng với Hue (sắc màu) và Saturation (độ đậm nhạt) Với y thuộc khoảng [16, 235 , khi đó việc chuyển không gian màu được thực hiện theo công thức sau:

và V Phương pháp JPEG đã nắm bắt phát hiện này để tách những thông tin thừa của ảnh Tỉ số nén thành phần Y của ảnh nhỏ hơn so với U, V, bởi người ta ít nhận thấy sự thay đổi của U và V so với Y

Trang 28

Hình 2.1: Mô hình màu RGB, YUV

Sự chuyển đổi không gian màu YCbCr cho phép nén ảnh lớn nhất và cho ra cùng một chất lượng ảnh Tuy nhiên nhiều ảnh JPEG chất lượng cao không áp dụng trường hợp này và thay vì giữ chúng trong không gian màu RGB, mỗi vùng được nén

và lượng tử hóa tách biệt với những giới hạn cùng chất lượng

JPEG cũng được sử dụng cho nhiều ứng dụng với ảnh động bởi vì nó cho chất lượng ảnh khôi phục khá tốt và ít tính toán hơn so với nén MPEG JPEG nén hình ảnh được sử dụng rộng rãi trong việc phát triển trang web so với bitmap (phần mở rộng bmp) Những ảnh JPEG chiếm không gian ít hơn và do đó có thể được tải về nhanh

chóng khi chúng ta truy cập một trang web

2.1.2.3 Sơ đồ mã hóa và giải nén JPEG

Nén JPEG có thể thực hiện bởi bốn phương mã hóa đó là:

+ Mã tuần tự (sequential DCT-based): ảnh được mã hóa theo kiểu quét từ trái qua phải, từ trên xuống dưới dựa trên khối DCT

+ Mã hóa lũy tiến (progressive DCT-base): ảnh được mã hóa bằng kiểu quét phức hợp theo chế độ phân giải không gian cho các ứng dụng trên kiểu băng hẹp và do đó thời gian truyền dẫn dài

+ Mã hóa không tổn thất (lossless): ảnh được đảm bảo khôi phục chính xác cho mỗi giá trị mẫu của nguồn Thông tin không cần thiết sẽ mới cắt bỏ cho nên hiệu quả nén thấp hơn so với phương pháp có tổn thất

+ Mã hóa phân cấp (hierarchical): ảnh được mã hóa ở chế độ phân giải không gian phức hợp, để cho những ảnh có độ phân giải thấp có thể được truy xuất và hiển thị mà không cần giải nén như những ảnh có độ phân giải trong không gian cao hơn

Mã hóa không tổn thất không sử dụng cho video động bởi vì nó cung cấp một tỉ

lệ nén không đủ cao Tỉ lệ nén ảnh tĩnh có thể đạt từ 1/10 đến 1/50 mà không làm ảnh

Trang 29

hưởng đến chất lượng hiển thị của ảnh Khai triển DCT được chọn là kỹ thuật then chốt trong JPEG vì nó cho ảnh nén chất lượng tốt nhất tại tốc độ bit thấp và giải thuật chuyển đổi nhanh và dễ dàng thực hiện bằng phần cứng

Hình 2.2: Sơ đồ mã hóa và giải nén JPEG theo DCT

Tất cả các block có cùng kích thước và mỗi block là một ma trận điểm ảnh 8×8 pixel được lấy từ một ảnh màn hình theo chiều từ trái sang phải, từ trên xuống dưới Kích thước block là 8×8 được chọn bởi hai lý do sau:

+ Thứ nhất, qua việc nghiên cứu cho thấy hàm tương quan suy giảm rất nhanh khi khoảng cách giữa các pixel vượt quá 8

+ Thứ hai, là sự tiện lợi cho việc tính toán và thiết kế phần cứng Nói chung, độ phức tạp về tính toán sẽ tăng nếu kích thước block tăng

Dung lượng lưu trữ ảnh cũng phụ thuộc vào loại ảnh quét Nếu quét liên tục thì các block bao gồm các mẫu từ các dòng liên tục (lúc này nén ảnh theo-frame) Ngược lại, trong trường hợp quét cách dòng, trong một block chỉ có các mẫu của một nửa ảnh Tóm lại, việc chia hình ảnh thành các ảnh con (block) sẽ thực sự có ý nghĩa cho bước chuyển vị tiếp theo

Trang 30

2.1.2.4 uá trình nén JPEG theo DCT

Hình 2.3: Công đoạn mã hóa ảnh JPEG theo DCT

Quá trình giải nén là quá trình ngƣợc lại:

Hình 2.4: Công đoạn mã giải nén ảnh JPEG theo DCT

a uá trình phân khối

Chuẩn JPEG phân ảnh thành các khối 8x8 để giảm thời gian tính toán cũng nhƣ làm tăng độ chính xác khi tính toán

Trang 31

Hình 2.5: Quá trình phân khối ảnh

Do các điểm ảnh lân cận có độ tương quan cao, do đó phép biến đổi DCT cho từng khối nhỏ sẽ tập trung năng lượng vào một số ít các hệ số biến đổi Việc loại bớt một số hệ số năng lượng thấp trong các khối chỉ tạo ra mất mát thông tin cục bộ giúp nâng cao chất lượng ảnh

có giá trị sẽ gần hoặc bằng 0 Quá trình biến đổi DCT thuận (FDCT) dùng trong tiêu chuẩn JPEG được định nghĩa như sau:

Trang 32

Hàm biến đổi DCT ngược (một chiều):

Trong đó: - X(k) là chuỗi kết quả

- x(m): là giá trị của mẫu m

- k: chỉ số của hệ số khai triển

Biến đổi DCT là một trong những công đoạn quan trọng trong JPEG Nhiệm vụ của nó là tập trung năng lượng vào một số các giá trị để giải tương quan tốt nhất nhằm nâng cao tỉ số nén

Trong đó:

- f(j,k): các mẫu gốc trong khối 8×8 pixel

- F(u,v): các hệ số của khối DCT 8×8

DTC có một tính chất quan trọng, đó là tính biến đổi thuận nghịch Có nghĩa là:

Từ các khối các hệ số DTC có thể hồi phục được giá trị biên độ các điểm ảnh ban đầu theo công thức chuyển đổi ngược sau:

Trang 33

Hình 2.6: Biểu diễn ma trận trước và sau khi biến đổi DCT

Phương trình trên là một liên kết của hai phương trình DCT một chiều, một cho tần số ngang và một cho tần số đứng Giá trị trung bình của block 8x8 chính là hệ số thứ nhất (khi u,v= 0)

Phương trình này cộng tất cả các giá trị pixel trong khối 8×8 và chia kết quả cho 8 Kết quả phép tính bằng 8 lần giá trị pixel trung bình trong khối Do đó hệ số thứ nhất được gọi là hệ số DC Các hệ số khác, dưới giá trị thành phần một chiều, biểu diễn các tần số cao hơn theo chiều dọc Các hệ số ở về phía bên phải của thành phần một chiều biểu thị các tần số cao hơn theo chiều ngang Hệ số trên cùng ở cận phải (0,7) sẽ đặc trưng cho tín hiệu có tần số cao nhất theo phương nằm ngang của ma trận 8×8, và hệ số hàng cuối bên trái (7,0) sẽ đặc trưng cho tín hiệu có tần số cao nhất theo phương thẳng đứng Còn các hệ số khác ứng với những phối hợp khác nhau của các tần số theo chiều dọc và chiều ngang

Nếu dùng quá trình DCT cho các tín hiệu số thành phần Y, Cr,Cb thì các tín hiệu Cr,Cb có biên độ cực đại ±128 ( giá trị nhị phân trong hệ thống lấy mẫu 8 bit), còn tín hiệu Y có một khoảng cực đại từ 0 đến 255 giá trị nhị phân Để đơn giản việc thiết kế bộ mã hóa DCT, tín hiệu Y được dịch mức xuống dưới bằng cách trừ 128 từ từng giá trị pixel trong khối để có khoảng cực đại của tín hiệu giống như đối với các tín hiệu CR và CB Ở phần giải mã DCT, giá trị này (128) được cộng vào các giá trị pixel chói Giá trị hệ số DC của khối DCT có một khoảng từ –1024 đến 1016 Đối với

Trang 34

hệ số AC ( với u,v=1,2, ,7), C(u) và C(v)=1 và các giá trị cực đại của nó nằm trong khoảng ±1020 theo phương trình FDCT Khối 8×8 các giá trị của hệ số DCT đưa ra 1 giá trị DC lớn (ví dụ =591), biểu diễn độ sáng trung bình của khối 8×8 và các giá trị rất nhỏ của các thành phần tần số cao theo chiều ngang và chiều đứng

Để loại bỏ một số giá trị không cần thiết thì chúng ta cần chia với bảng trọng số Q50

Bảng trọng số Q(u,v)

Tóm lại, DCT làm giảm độ tương quan không gian của thông tin trong block Điều đó cho phép biễu diễn thích hợp ở miền DCT do các hệ số DCT có xu hướng có phần dư thừa ít hơn Điều này có nghĩa là DCT gói một phần lớn năng lượng tín hiệu vào các thành phần biến đổi có tần số tương đối thấp để lưu trữ hoặc truyền dẫn, tạo 0

và các giá trị rất thấp đối với thành phần tần số cao Nhờ đặc tính của hệ thống nhìn của mắt người, các hệ số DCT có thể được mã hóa phù hợp, chỉ các hệ số DCT quan trọng nhất mới được mã hóa và truyền đi DCT thuận kết hợp với DCT nghịch sẽ không cho tổn thất nếu độ dài từ mã của hệ số là 13 đến 14 bits cho tín hiệu video đầu vào được số hóa bằng các mẫu dài 8 bit Nếu hệ số được lượng tử hóa bằng 11 bit (hoặc ngắn hơn), thì nén bằng DCT sẽ có tổn hao.Sau khi thực hiên DCT năng lượng tập trung chủ yếu ở miền tần số thấp

c Lượng tử hóa

Bước tiếp theo của quá trình nén trong ảnh là lượng tử hóa các hệ số F(u,v) sao cho làm giảm được số lượng bit cần thiết Các hệ số tương ứng với tần số thấp có các giá trị lớn hơn, và như vậy nó chứa phần năng lượng chính của tín hiệu, do đó phải lượng tử hóa với độ chính xác cao Riêng hệ số một chiều đòi hỏi độ chính xác cao nhất, bởi lẽ nó biểu thị giá trị độ chói trung bình của từng khối phần tử ảnh

Trang 35

 Nguyên tắc lượng tử

Hệ thống thị giác của chúng ta quan sát rất tốt với những sự thay đổi nhỏ về độ sáng trong một miền tương đối rộng (thành phần tần số thấp) nhưng ngược lại đối với các thành phần tần số cao Chính điều này giúp ta giảm các thông tin đối với các thành phần tần số cao Điều này được thực hiện bằng cách chia các tần số cho các hằng số cố định và làm tròn tới giá trị số nguyên gần nhất

Sau quá trình này giá trị các thành phần tần số cao được làm tròn tới giá trị 0 trong khi đó các thành phần tần thấp cũng nhỏ đi chính vì thế làm giảm số bit cho mỗi giá trị của các thành phần tần số thấp

Hệ số bảng lượng tử hóa thuận được xác định theo biểu thức:

Các giá trị Fq (u, v) sẽ được mã hóa trong các công đoạn tiếp theo

Bất kỳ một sai sót nào trong quá trình lượng tử hệ số một chiều đều có khả năng nhận biết dễ dàng bởi nó làm thay đổi mức độ chói trung bình của khối Ngược lại, với các hệ số tương ứng với tần số cao và có các giá trị nhỏ, thì có thể biểu diễn lại bằng tập giá trị nhỏ hơn hẳn các giá trị cho phép

- Các hệ số tương ứng với thành phần tần số cao (AC) có giá trị nhỏ nên cho phép sai

số, ta có thể chia với một số lớn hơn

Sau đây là bảng hằng số chuẩn cho quá trình lượng tử hóa:

Trang 36

 Quá trình lượng tử hóa

Tại mỗi vị trí của X người ta chia giá trị tại đó cho các hằng số tại vị trí tương ứng sau đó làm tròn với số nguyên gần nhất

VD: F(0,0) = round = round ( -25.9375) = -26

Cần phải xác định là trong quá trình lượng tử hóa có trọng số nào xảy ra mất thông tin, gây tổn hao Đây là bước tổn hao duy nhất trong thuật toán nén Mức độ tổn hao phụ thuộc vào giá trị các hệ số trên bảng lượng tử Các thành phần DC và tần số thấp

là các thông số nhạy cảm nhất của khối pixel gốc Hệ số DC sẽ được lượng tử với độ chính xác 12 bit nhằm tránh các nhiễu xuất hiện giữa các khối điểm ảnh Ngược lại, các hệ số tần số cao có thể lượng tử hóa thô với độ chính xác 2 bit-do khả năng cảm nhận của mắt người giảm ở tần số cao Theo đó, hệ số chia trong bảng lượng tử hóa là nhỏ đối với các hệ số có tần số thấp và tăng từ từ đối với các hệ số có tần số cao hơn.Việc biến đổi sao cho chất lượng hình ảnh do mắt người cảm nhận tốt, phụ thuộc vào các thành phần tần số và sự biến đổi chi tiết ảnh từng vùng trong miền không gian Các ảnh càng chi tiết thì hệ số thành phần tần số cao càng lớn

d Mã hóa Entropy

Mã hóa entropy là dạng đặc biệt của phương pháp nén không mất dữ liệu

Để mã hóa entropy các hệ số được lượng tử hóa Fq(u,v), trước hết, cần biến đổi mảng hai chiều của các hệ số Fq(u,v) thành chuỗi số một chiều bằng cách quét zig-zag

Để nâng cao hiệu quả nén cho mỗi bộ hệ số người ta thường xếp chúng lại theo thứ tự Zigzac.Tác dụng sắp xếp lại theo thứ tự Zigzac là tạo ra nhiều loạt hệ số giống nhau.Ta biết rằng năng lượng của khối hệ số sẽ giảm dần từ góc trên bên trái xuống góc dưới bên phải vì vậy việc lấy Zigzac sẽ tạo điều kiện cho các hệ số sấp xỉ nhau

Trang 37

Việc xử lý 64 hệ số của khối 8x8 pixel bằng cách quét zig-zag làm tăng tối đa chuỗi các giá trị 0 và do vậy làm tăng hiệu quả nén khi dùng RLC

 Mã hóa độ dài chạy (RLC)

Các giá trị lượng tử hóa có thể chỉ biểu diễn nhờ các từ mã có độ dài cố định hay đồng đều, tức là các giá trị lượng tử hóa biễu diễn bằng cùng một số bit Tuy nhiên hiệu quả của việc mã hóa không cao Để cải tiến hiệu quả người ta dùng mã hóa entropy Mã hóa entropy dùng những đặc tính thống kê của tín hiệu được mã hóa Một tín hiệu, ở đây là giá trị pixel hoặc các hệ số chuyển vị, có chứa một lượng thông tin (entropy) tùy theo những xác suất của những giá trị hay sự kiện khác nhau xuất hiện

Ví dụ những từ mã nào ít xảy ra hơn sẽ có nhiều thông tin hơn từ mã hay xảy ra Khi dùng mã hóa entropy có hai vấn đề đặt ra: thứ nhất, mã hóa entropy làm tăng độ phức tạp và yêu cầu bộ nhớ lớn hơn so với mã độ dài cố định

Kỹ thuật RLC được dùng để mã hóa có hiệu quả các hệ số DCT đã lượng tử hóa hơn là dùng trực tiếp cho số liệu ảnh Sau quá trình quét zig-zag ở trên, RLC sẽ được thực thi Một hệ số khác 0 sau giá trị DC được mã hóa bằng 1 từ mã bao gồm 2 thông số: số

Trang 38

lượng 0 chạy trước 1 hệ số riêng khác 0 và mức của nó sau khi lượng tử hóa RLC thực chất là việc thay thế các hệ số có giá trị 0 bằng số lượng các chữ số 0 xuất hiện

Hình dưới biểu diễn ví dụ về RLC: Ở đây, giá trị 10 không có giá trị 0 nào trước đó được biễu diễn bằng <0,10>; giá trị –2 có hai giá trị 0 đứng trước được biễu diễn bằng <2,-2>v.v Riêng một dấu đặc biệt là End of Block (EOB) được dùng để cho biết tất cả các hệ số tiếp theo trong khối bằng 0 Trong ví dụ này, ta có một chuỗi

49 từ mã với giá trị 0 Như vậy chỉ xét riêng 49 từ mã giá trị 0 được nén xuống chỉ còn

3 từ mã Điều này chứng tỏ hiệu suất nén rất cao của mã hóa RLC Nén bằng mã RLC

là quá trình nén không tổn hao

Quá trình được minh họa bằng ví dụ sau:

(Các hệ số DCT của khối dữ liệu sau mã hóa VLC còn 89 bit)

 Mã hóa độ dài thay đổi VLC

Các từ mã RLC tiếp tục được mã hóa bằng cách đặt các từ mã ngắn cho các

Trang 39

thấp Tại đầu ra VLC, tất cả các từ mã của cùng một khối DCT được kết hợp tạo thành một dòng tín hiệu ra Trong ví dụ trên, số liệu tương ứng với khối DCT ban đầu (8x8x8 bit =512 bit) được giảm thành 89 bits sau khi mã hóa VLC Hệ số nén trong trường hợp này bằng 512/89=5,75 Hệ số nén cũng thường được tính bằng số bit biễu diễn điểm ảnh

Mã hóa VLC tự nó là một kỹ thuật mã hóa không tổn thất, nó cho phép giảm thêm tốc độ dòng bit (đã được giải tương quan, làm tròn và giảm qua quá trình lượng

tử hóa Tại đầu ra VLC, tất cả các từ mã của cùng một khối DCT được kết hợp tạo thành một dòng tín hiệu ra Trong ví dụ trên, số liệu tương ứng với khối DCT ban đầu (8x8x8 bit =512 được giảm thành 89 bits sau khi mã hóa VLC Rõ ràng chúng ta thấy được rằng tỉ lệ nén là rất cao

- Với thành phần DC: Giá trị sai lệch hệ số DC sẽ được mã hóa nhờ bảng phân loại và bảng Huffman (dựa vào đặc tính thống kê của tín hiệu)

- Với thành phần AC: Hệ số AC cũng được mã hóa nhờ bảng phân loại (giống như DC) và bảng Huffman (nhưng khác DC)

Quá trình mã hóa VLC cho hệ số DC và các hệ số AC được mô tả trong sơ đồ khối sau:

Hình 2.7: Mã hoá entropy thành phần DC

Trang 40

Bảng 1 Bảng phân loại và bảng Huffman cho thành phần DC chói

Hình 2.8: Mã hoá entropy thành phần AC

Bảng 2 Bảng Huffman các hệ số AC

Ngày đăng: 19/08/2019, 22:56

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w