Cả màu sắc và độ chói mà nó sẽ được biến đổi thành một dãy tín hiệu nhịphân là một dãy các số 0 và 1 để tiễn xử lý và truyền dẫn.Việc nghiên cứu nhằm làm giảm băng thông yêu cầu đã được
Trang 1Trờng đại học vinhKhoa điện tử viễn thông
Giảng viên hớng dẫn : Th.S Đặng thái sơn
Sinh viên thực hiện : Trần Hữu thắng Lớp : 47K - ĐTVT
Niên khóa : 2006 - 2011
Vinh, 2011
Trang 2LỜI NÓI ĐẦU
Ngày nay, chương trình truyền hình ngày càng giữ vai trò không thểthiếu trong đời sống xã hội Sự phát triển của khoa học kỹ thuật đã trải quanhiều bước chuyển biến lớn, hệ thống truyền hình cũng thay đổi theo từnggiai đoạn phát triển
Trong những năm gần đây công nghệ truyền hình đang chuyển sangmột bước ngoặt - quá trình chuyển đổi từ công nghệ Analog sang công nghệDigital Quá trình đó là một cuộc cách mạng, nó làm thay đổi cách suy nghĩ,cách tiếp xúc, phương thức sản xuất chương trình truyền hình, nâng cấp chấtlượng tín hiệu, tính linh họat và khả năng hội nhập vào môi trường thông tinchung
Công nghệ số đã và đang phát triển rất mạnh, truyền hình số đang dầnthay thế hoàn toàn truyền hình tương tự trên thế giới nói chung và ở Việt Namnói riêng
Để hiểu sâu hơn về lĩnh vực này, cho nên em đã chọn đề tài: ‘‘ Tìm hiểu
kỹ thuật nén trong truyền hình số ’’ để làm đồ án tốt nghiệp
Trong quá trình làm đề tài, em đã cố gắng rất nhiều song do kiến thứchạn chế nên không thể tránh khỏi những thiếu sót Em rất mong nhận đượcnhững nhận xét phản hồi, đóng góp ý kiến từ thầy cô và bạn bè
Cuối cùng, em cũng xin chân thành cảm ơn các thầy giáo, cô giáo trongKhoa Điện Tử Viễn Thông Trường Đại Học Vinh Đặc biệt là thầy giáo,
ThS Đặng Thái Sơn đã tận tình hướng dẫn em hoàn thành bản đồ án tốt
nghiệp này
Vinh, ngày tháng năm 2011
Sinh viên thực hiện
Trần Hữu Thắng
Trang 3TÓM TẮT ĐỒ ÁN
Trong đồ án này, em đã trình bày về ‘‘ Tim hiểu kỹ thuật nén trong truyền hình số ’’ Với nội dung gồm 3 chương như sau :
Chương 1 : Giới thiệu về truyền hình số
Trong chương này, chúng ta đã tìm hiểu về sơ đồ khối của hệ thống truyền hình số, những đặc điểm, những ưu điểm nổi trội của truyền hính số sovới truyền hình tương tự
Chương 2 : Tổng quan về nén
Trong chương này, chúng ta đã tìm hiểu sâu hơn về các kỹ thuật được
sử dụng để nén tín hiệu, các mã được dùng trong các thuật toán nén Qua đó,rút ra nén ảnh là quá trình sử dụng các phép biến đổi để loại bỏ đi các loại dưthừa và loại bỏ tính có nhớ của nguồn dữ liệu, tạo ra nguồn dữ liệu mới cólượng thông tin nhỏ hơn Đồng thời sử dụng các dạng mã hoá có khả năng tậndụng xác suất xuất hiện của các mẫu sao cho số lượng bít sử dụng để mã hoámột lượng thông tin nhất định là nhỏ nhất mà vẫn đảm bảo được chất lượngtheo yêu cầu
Chương 3: Nén video theo chuẩn MPEG
Trong chương này, chúng ta đã tìm hiểu về các chuẩn nén MPEG sửdụng để nén video Đó là chuẩn nén MPEG - 1, MPEG – 2, MPEG – 4 Qua
đó ta thấy, MPEG không phải là một công cụ nén đơn lẻ mà ưu điểm của nénảnh dùng MPEG chính là ở chỗ MPEG có một tập hợp các công cụ mã hoáchuẩn, chúng có thể được kết hợp với nhau một cách linh động để phục vụcho một loạt các ứng dụng khác nhau
Trang 4MỤC LỤC
LỜI NÓI ĐẦU 1
TÓM TẮT ĐỒ ÁN 2
MỤC LỤC 3
DANH SÁCH HÌNH VẼ 5
DANH SÁCH BẢNG BIỂU 7
CÁC THUẬT NGỮ VIẾT TẮT 8
Chương 1 GIỚI THIỆU VỀ TRUYỀN HÌNH SỐ 9
1.1 Mở đầu 9
1.2 Hệ thống truyền hình số 9
1.2.1 Sơ đồ khối hệ thống truyền hình số 9
1.2.2 Đặc điểm của truyền hình số 11
1.2.3 Ưu điểm của truyền hình số 12
Chương 2 TỔNG QUAN VỀ NÉN TÍN HIỆU 14
2.1 Khái niệm chung 14
2.1.1 Phân loại 16
2.2 Một số dạng mã hóa 16
2.2.1 Mã hóa VLC 16
2.2.2 Mã hóa RLC 17
2.2.3 Mã hóa dự đoán 17
2.2.4 Mã hóa chuyển đổi 19
2.3 Một số công nghệ nén 21
2.3.1 Nén Video bằng phương pháp DPCM 21
2.3.2 Nén Video bằng công nghệ mã hóa chuyển đổi 28
2.3.3 Sự kết hợp của các công nghệ nén 39
Chương 3 NÉN VIDEO THEO CHUẨN MPEG 42
3.1 Khái quát về các tiêu chuẩn nén 42
3.2 Nén tín hiệu Video theo MPEG – 1 43
Trang 53.2.1 Các thành phần ảnh cơ bản trong chuẩn nén MPEG 45
3.2.2 Sự phân loại ảnh MPEG 50
3.2.3 Tiêu chuẩn MPEG – 1 53
3.2.4 Hệ thống nén MPEG – 1 55
3.3 Nén tín hiệu Video theo MPEG- 2 58
3.3.1 Tiêu chuẩn nén Video MPEG – 2 58
3.3.2 Khả năng co giãn của MPEG – 2 61
3.3.3 Profile và Level 62
3.4 Ghép kênh Audio – Video số theo tiêu chuẩn MPEG – 2 64
3.4.1 Hệ thống truyền tín hiệu MPEG – 2 64
3.4.2 Dòng dữ liệu đóng gói, dòng chương trình và dòng truyền tải 66
3.4.3 Dòng truyền tải MPEG – 2 70
3.4.4 Định thời và đồng bộ sử dụng dòng truyền tải MPEG – 2 77
KẾT LUẬN 80
TÀI LIỆU THAM KHẢO 81
Trang 6DANH SÁCH CÁC HÌNH VẼ
Hình 1.1 Sơ đồ khối hệ thống truyền hình số 10
Hình 2.1 Sơ đồ nén và giải nén 14
Hình 2.2 Bộ mã hóa DPCM 18
Hình 2.3 Bộ giải mã DPCM 19
Hình 2.4 Quá trình mã hoá chuyển đổi hai chiều 20
Hình 2.5 Quá trình giải mã chuyển đổi hai chiều 20
Hình 2.6 Véc tơ chuyển động giữa hai khung kế tiếp 25
Hình 2.7 Mã hoá, giải mã DPCM 28
Hình 2.8 Đặc tuyến của bộ đệm dữ liệu 34
Hình 2.9 Quét các hệ số DCT 35
Hình 2.10 Nén ảnh theo công nghệ Transform Coding 38
Hình 2.11 Giải mã DCT 39
Hình 2.12 Mã hóa DCT dự báo có bù chuyển động (Bộ mã hóa MPEG -2) 40 Hình 3.1 Cấu trúc Macroblock của các dạng lấy mẫu 46
Hình 3.2 Cấu trúc các nhóm ảnh 47
Hình 3.3 Cấu trúc dòng dữ liệu Video MPEG 48
Hình 3.4 Bộ đệm dữ liệu 48
Hình 3.5 Cấu trúc lớp dữ liệu trong MPEG 50
Hình 3.6 Nội suy bù chuyển động 51
Hình 3.7 Thứ tự truyền dẫn và thứ tự hiển thị ảnh 52
Hình 3.8 Sơ đồ khối mã hoá MPEG-1 57
Hình 3.9 Sơ đồ khối bộ giải mã MPEG – 1 58
Hình 3.10 Cú pháp dòng bít MPEG – 2 61
Hình 3.11 Mô tả kích thước Payload 64
Hình 3.12 Hệ thống truyền tải MPEG -2 65
Hình 3.13 Cấu trúc gói PES 66
Trang 7Hình 3.14 Định dạng dòng chương trình, dòng truyền tải từ dòng đóng gói
PES 67
Hình 3.15 Cấu trúc gói truyền tải (Transport stream packet - TS) trong tiêu chuẩn MPEG – 2 68
Hình 3.16 Định dạng truyền tải MPEG – 2 70
Hình 3.17 Dòng truyền tải đa chương trình 74
Hình 3.18 Mối quan hệ giữa các bảng PSI 76
Hình 3.19 Thông tin đồng hồ hệ thống PCR 78
Hình 3.20 Sự đồng bộ hóa thu phát 79
Trang 8DANH SÁCH BẢNG BIỂU
Bảng 2.1 Trọng lượng tử hóa của chuẩn JPEG cho tín hiệu chói và tín hiệu
màu 33
Bảng 2.2 Giá trị hệ số AC và phân hạng 36
Bảng 2.3 Bảng mã hóa Huffman cho hệ số DC 37
Bảng 3.1 Chuẩn nén MPEG 43
Bảng 3.2 Dạng thức cơ bản của CSIF 53
Bảng 3.3 Các tham số mặc định trong chuẩn MPEG – 1 54
Bảng 3.4 Dạng lớp của cú pháp dóng bít MPEG – 2 60
Bảng 3.5 Các mức của kích cỡ ảnh 63
Bảng 3.6 Các giá trị của số PID 69
Trang 9Truyền hình số là một hệ thống truyền hình mới, trong đó các thiết bị
kỹ thuật số đều làm việc theo nguyên lý kĩ thuật số Theo nguyên lý đó thì từmột ảnh quang học do camera thu được qua hệ thống ống kính, thay vì đượcđổi thành tín hiệu điện biến thiên tương tự như hình ảnh quang học nói trên
Trang 10(Cả màu sắc và độ chói) mà nó sẽ được biến đổi thành một dãy tín hiệu nhịphân (là một dãy các số 0 và 1) để tiễn xử lý và truyền dẫn.
Việc nghiên cứu nhằm làm giảm băng thông yêu cầu đã được bắt đầu
từ sau thế chiến II, một vài giải pháp kỹ thuật đã được đưa vào năm 1960.Mặc dù vậy, việc thực hiện các giải pháp này vẫn còn phải đợi cho đến khi có
sự tiến bộ vượt bậc trong việc chế tạo các vi mạch với mức độ tích hợp cao,
có khả năng thực hiện các thuật toán trong thời gian thực Hầu hết các nướclớn đã công bố kế hoạch thực hiện truyền hình số và phát thanh số vào năm
2000 Để thực hiện, họ dựa vào các tiêu chuẩn truyền hình số mới nghiên cứu
ra gần đây
1.2 Hệ thống truyền hình số
1.2.1 Sơ đồ khối hệ thống truyền hình số
Một hệ thống truyền hình số theo tiêu chuẩn có thể coi gồm 3 thànhphần chính sau:
- Khối mã hoá và nén
- Khối ghép kênh và mã hoá truyền dẫn
- Khối điều chế RF phát sóng
Mã hoá kênh
Điều chế số
Mã hoá nguồn
Biến đổi A/D
Giải
Giải mã Biến
đổi
T/h Truyền
hình số
T/h Truyền
Trang 11Hình 1.1 Sơ đồ khối hệ thống truyền hình số
Nguyên lý làm việc của hệ thống :
+ Phía thu:
- Quá trình xử lý của hệ thống thu ngược lại với quá trình xử lý của
hệ thống phát Tín hiệu cao tần thu qua bộ tunenr được giải điều chếcao tần Tín hiệu tần số thấp được giải mã hoá kênh, giải mã truyềndẫn rồi đưa đến bộ giải mã ghép kênh Tín hiệu được đưa đến bộ
Trang 12giải mã ghép kênh được đến bộ chuyển đổi D/A của Audio và Video
và đưa đến máy thu phát tương tự
1.2.2 Đặc điểm của truyền hình số
a Yêu cầu về băng tần
Yêu cầu về băng tần là một sự khác nhau rõ nhất giữa truyền hình số vàtruyền hình tương tự Truyền hình số yêu cầu băng tần rộng hơn
b Tỷ lệ công suất/ Công suất tạp âm (Signal/Noise )
Một trong những ưu điểm lớn nhất của tín hiệu số là khả năng chốngnhiễm trong quá trình xử lý tại các khâu truyền dẫn và ghi
Với truyền hình số, nhiễu là các bít lỗi (VD Xung “on” chuyểnthành “off”)
Nhiễu trong truyền hình số được khắc phục nhờ các mạch và các mãsửa lỗi Bằng các mạch này có thể khôi phục lại các dòng bít như ban đầu.Khi có quá nhiều bít lỗi, sự ảnh hưởng của nhiễu được làm giảm bằng cáchche lỗi
Tuy nhiên, trong truyền hình quảng bá, truyền hình số gặp phải vấn đềkhó khăn khi thực hiện kiểm tra chất lượng ở các điểm trên kênh truyền Tạiđây cần phải sử dụng các bộ biến đổi tương tự - số Đây là công việc lớn cókhối lượng lớn và phức tạp
c Méo phi tuyến
Truyền hình số không bị ảnh hưởng bởi méo phi tuyến trong quá trìnhghi và truyền
d Chồng phổ (Aliasing)
Truyền hình số được lấy mẫu theo cả chiều thẳng đứng và chiều ngang,nên có khả năng xảy ra chồng phổ theo cả hai hướng Theo chiều thẳng đứngchồng phổ trong hai hệ thống tương tự là như nhau Độ lớn của méo chồngphổ, theo chiều ngang phụ thuộc vào méo do chồng phổ theo chiều ngang, có
Trang 13thể thực hiện bằng cách sử dụng tần số lấy mẫu lớn hơn hai lần thành phầntần số cao nhất trong hệ thống tương tự.
e Giá thành và độ phức tạp
Mạch số luôn có cấu trúc phức tạp hơn mạch tương tự, nên giá thànhcủa thiết bị sô cao hơn nhiều so với thiết bị tương tự Nhưng với sự phát triểncủa các ngành công nghiệp truyền thông số và công nghiệp máy tính đã ra đờicác mạch tích hợp cỡ lớn LSI (Large Scale Integration) và rất lớn VLSI đãlàm giảm giá thành của trang thiết bị số
f Xử lý tín hiệu
Truyền hình số có thể xử lý và chuyển đổi tốt các chức năng mà hệthống tương tự không làm được hoặc gặp nhiều khó khăn Sau biết đổi A/Dtruyền hình còn lại là một chuỗi các bít “0” và “1” do đó có thể thao tác cáccông việc phức tạp mà không làm giảm chất lượng hình ảnh Khả năng nàyđược tăng lên nhờ vệc lưu trữ các biét trong bộ nhớ và có thể đọc ra với tốc
độ nhanh
Với truyền hình số cho phép các trạm truyền hình đồng kênh thực hiện
ở một khoảng cách gần nhau hơn so với hệ thống tương tự mà không bị nhiễu
g Hiệu ứng bóng ma (Ghost)
Hiện tượng này xảy ra trong hệ thống tương tự do tín hiệu truyền đếnmáy thu theo nhiều đường Việc tránh nhiễu đồng kênh của hệ thống số cũnglàm giảm đi hiện tượng này trong truyền hình quảng bá
1.2.3 Ưu điểm của truyền hình số
Những năm gần đây các hãng và các tổ chức đang tập trung nghiêncứu, thiết kế để đưa ra hệ thống truyền hình số Truyền hình số đang dần trởthành hiện thực và sẽ dần thay thế hệ thống truyền hình tương tự với các ưuđiểm nổi trội như sau:
- Tín hiệu số ít nhạy với các dạng méo xảy ra trên đường truyền
Trang 14- Ít bị tác động của các nhiễu so với truyền hình tương tự.
- Có khả năng phát hiện lỗi và sửa sai
- Tính linh hoạt, đa dạng trong quá trình xử lý tín hiệu (Có hệ số nén rấtlớn so với tín hiệu tương tự)
- Tính phân cấp (Kênh có thể được sử dụng chỉ phát một chương trình
độ phân dải cao hoặc một vài chương trình truyền hình tiêu chuẩn)
- Có thể truyền được nhiều loại hình thông tin khác nhau với cách xử lýgiống nhau
- Tiết kiệm được năng lượng, cùng với một công suất phát sóng , diệntích phủ sóng rộng hơn so với công nghệ truyền hình tương tự
Trang 15TỔNG QUAN VỀ NÉN TÍN HIỆU2.1 Khái niệm chung
a Định nghĩa
Nén tín hiệu số là biểu diễn tín hiệu số với số bít ít hơn nhưng thông tinphải được bảo toàn hoặc mất mát có thể chấp nhận được
Các loại nén:
+ Nén tín hiệu số : Digital Signal Compression
+ Nén số liệu : Data Compression
+ Giảm số liệu : Data Reduction
+ Giảm tốc độ bít : Bit Rale Reduction
+ Mã hóa nguồn : Source Coding
b Mục đích của nén tín hiệu số
- Để giảm dung lượng phải lưu trữ
- Giảm băng thông truyền dẫn
- Làm giảm tốc độ bít của các dòng dữ liệu tốc độ cao mà vẫn đảm bảochất lượng hình ảnh, âm thanh cần truyền tải
Phát Truyền dấn hay lưu trữ Thu
Hình 2.1 Sơ đồ nén và giải nén
c Các thông số về nén
Tỉ số nén: Ví dụ 100Mbit/s nén 20Mbit/s (tỷ số nén 5:1)
Phần trăm nén: Ví dụ 100Mb/s nén 20Mb/s (tương đương nén 80%)
Số bít /Symbol: Ví dụ cần 8 bit/pixel nén 2 bit/pixel (tỷ số nén 4:1 %)
Trang 16d Bản chất của nén
Khác với nguồn dữ liệu một chiều như nguồn âm, đặc tuyến đa chiềucủa nguồn ảnh cho thấy: Nguồn ảnh chứa nhiều sự dư thừa hơn các nguồnthông tin khác Đó là:
Sự dư thừa về mặt không gian (Spatial redundancy): các điểm ảnh kềnhau trong một mành có nội dung gần giống nhau
Sự dư thừa về mặt thời gian (Temporal redundancy): các điểm ảnh cócùng vị trí ở các mành kề nhau rất giống nhau
Sự dư thừa về mặt cảm nhận của con người: Mắt người nhạy cảm hơnvới các thành phần tần số thấp và ít nhạy cảm với sự thay đổi nhanh, tần sốcao Do vậy, có thể coi nguồn hình ảnh là nguồn có nhớ
Nén ảnh là quá trình sử dụng các phép biến đổi để loại bỏ đi các loại dưthừa và loại bỏ tính có nhớ của nguồn dữ liệu, tạo ra nguồn dữ liệu mới cólượng thông tin nhỏ hơn Đồng thời sử dụng các dạng mã hoá có khả năng tậndụng xác suất xuất hiện của các mẫu sao cho số lượng bít sử dụng để mã hoámột lượng thông tin nhất định là nhỏ nhất mà vẫn đảm bảo được chất lượngtheo yêu cầu
+ Các thành phần thông tin:
Thông tin chứa trong một tín hiệu có thể được chia làm 2 thành phầnchính:
- Lượng tin hay entropy hay độ bất định (uncertainty)
- Độ dư thừa (redemdancy)
+ Tuỳ theo nội dung của thông tin, phần entropy lại được chia thành 2 phần:
- Thông tin phù hợp (irrelevancy): Thông tin không có giá trị đối với hệthống cảm thụ chủ quan của con người
Trang 17- Thông tin cốt lõi tức là phần còn lại của entropy: Thông tin này cóthể chia thành nhiều phần nhỏ khác nhau tuỳ theo mức độ quan trọngđối với sự cảm thụ của con người.
2.1.1 Phân loại
Các thuật toán nén có thể chia làm hai loại đó là: Nén không tổn hao vànén có tổn hao
Thuật toán nén không tổn hao không làm suy giảm, tổn hao dữ liệu, do
đó ảnh được khôi phục hoàn toàn chính xác so với ảnh nguồn Tỷ lệ nénthông thường khoảng 2:1 Không thể đảm bảo cố định tỷ lệ nén do đó tốc độ
dữ liệu đầu ra thay đổi sẽ gây khó khăn cho việc lưu trữ và truyền thông
Thuật toán nén có tổn hao chấp nhận loại bỏ một số thông tin khôngquan trọng như các thông tin không quá nhạy cảm với cảm nhận của mắtngười để đạt hiệu quả nén cao hơn, do vậy ảnh khôi phục lại gần giống vớiảnh gốc Thuật toán nén có tổn hao cho ta tỷ lệ nén cao hơn (có thể lên tới100:1) có thể có một tỷ lệ nén cố định thích hợp cho việc truyền thông
2.2 Một số dạng mã hóa sử dụng
2.2.1 Mã hoá VLC (Variable Length Coding) - Mã hoá Huffman
Trong các dạng mã hoá thì mã hoá Huffman là dạng được sử dụng phổbiến nhất Bảng mã Huffman có thể cho độ dài mã trung bình để mã hoá chomột mẫu là nhỏ nhất do tận dụng được xác suất xuất hiện cao nhất sẽ đượcgắn với một từ mã có độ dài ngắn nhất Mặc dù có độ dài mã thay đổi song
mã Huffman vẫn có khả năng giải mã đúng do có thuộc tính tiền tố duy nhất(không có bất cứ từ mã nào là phần đầu của từ mã tiếp theo)
Phương pháp mã hoá Huffman trở nên nặng nề khi số tin của nguồnquá lớn Trong trường hợp này, người ta dùng một biện pháp phụ để giảm nhẹcông việc mã hoá Trước tiên, liệt kê các tin của nguồn theo thứ tự xác suấtgiảm dần Sau đó ghép thành từng tin có tổng xác suất gần bằng nhau Dùng
Trang 18một mã để mã hoá các tin trong cùng một nhóm Sau đó xem nhóm tin nhưmột khối tin và dùng phương pháp Huffman để mã hoá các khối tin Từ mãcuối cùng tương ứng với mỗi tin của nguồn gồm hai phần: Một phần là mãHuffman và một phần là mã đều Mã Huffman chỉ tối ưu khi đã biết trước xácxuất của mã nguồn và mỗi biểu trưng của mã nguồn được mã hoá bằng số bitnguyên.
Một Symbol (8 bít) có 256 Symbol khác nhau, có những Symbol xuấthiện nhiều, có những Symbol xuất hiện ít Những Symbol xuất hiện nhiều thìgán cho từ mã có độ dài bít ngắn hơn những Symbol xuất hiện ít Trong mộtdòng bít, lấy xác suất xuất hiện của các Symbol để gán mã, kết quả cho mộtdòng bít ngắn hơn nhưng vẫn đảm bảo được thông tin đầy đủ
2.2.2 Mã hoá RLC (Run Length Coding)
Loại mã hoá này chính là các ký hiệu nguồn (hoặc các ký hiệu ở đầu racủa bộ lượng tử) có độ dài thay đổi được mã hoá thành các từ mã có độ dài cốđịnh, tiếp tục mã hoá các từ mã này thành lần nữa bởi mã hoá Huffman Loại
mã hoá này được áp dụng nhiều trong các phương pháp ảnh tĩnh, nén Video
Mã hoá RLC rất hiệu quả khi gặp một loại các ký hiệu giống nhau(RUN) xuất hiện liên tiếp (Ví dụ: 100 bít 0 liền nhau được biểu diễn: (0,100);
80 bít 1 liền nhau được biểu diễn; (1,80) Tóm lại: Mỗi “Run” được biểu diễnbằng một cặp (LEVEL, RUN), trong đó: LEVEL biểu thị giá trị 1 bít hay 1 kýhiệu; RUN biểu thị số lần lặp lại của một bít hay một ký hiệu
Các từ mã sau khi được mã hoá RLC thì lại được mã hoá VLC (Mã hoáHuffman)
2.2.3 Mã hóa dự đoán (Predictive coding)
Nguồn ảnh chứa một thông tin rất lớn, nếu mã hóa trực tiếp nguồn tinnày theo PCM, tốc độ dòng bít thu được sẽ rất cao Mặt khác, nguồn ảnh lạichứa đựng thừa và tính “có nhớ”, giữa các điểm ảnh lân cận có mối quan hệ
Trang 19tương hỗ với nhau Do đó mã hóa dự đoán được xây dựng trên nguyên tắc cơbản sau:
- Lợi dụng mối quan hệ tương hỗ này, từ các giá trị điểm ảnh lân cận,theo một nguyên tắc nào đó có thể tạo nên một giá trị gần giống điểm ảnhhiện hành Giá trị này gọi là giá “dự báo”
- Loại bỏ đi tính “có nhớ” của nguồn tín hiệu bằng một bộ lọc đặc biệt
có đáp ứng đầu ra là hiệu giữa tín hiệu vào s (n) và giá trị dự báo cho nó
- Thay vì lượng tử hóa trực tiếp các mẫu điểm ảnh, mã hóa dự đoánlượng tử và mã hóa các “sai số dự báo” tại đầu ra bộ lọc
“Sai số dự báo” là sự chênh lệch giữa trị dự báo và giá trị thực sự củamẫu hiện hành Do nguồn “sai số dự báo” là nguồn không có nhớ và chứađựng lượng thông tin thấp, nên số bít cần mã hóa sẽ giảm đi rất nhiều
Phương pháp tạo điểm ảnh dựa trên tổng giá trị của các điểm dự đoán
và sai số dự báo gọi là “Điều xung mã vi sai - DPCM”.
e(k) i(k)
Trang 20
Hình 2.3 Bộ giải mã DPCM
i (k): Mẫu điểm tuần tự
e (k): Chênh lệch dự đoán (sai số dự đoán)
e (k): Giá trị dự đoán của e (k) với lỗi lượng tử quy định (k)
2.2.4 Mã hóa chuyển đổi (Transform Coding)
Trong phương pháp mã hóa chuyển đổi, tính có nhớ của nguồn tín hiệuđược loại bỏ đi bằng một phép biến đổi Một khối các điểm ảnh được chuyểnsang miền tần số theo một ma trận biến đổi phù hợp Từ khối N giá trị mẫuđiểm lân cận
Phép biến đổi này có tính thuận nghịch, các hệ số này hoàn toàn có thể hồiphục thành giá trị tín hiệu ban đầu bằng phép chuyển đổi ngược
So với giá trị thực của điểm ảnh, nguồn các hệ số là không có nhớ Mặtkhác thông tin của nguồn ảnh tập trung phần lớn ở các thành phần tần số thấpnên trong khối các hệ số, thông tin cũng tập trung tại một số ít các hệ số
việc mã hóa trực tiếp các mẫu Số lượng bít mã hóa còn có thể giảm hơn nữanếu lợi dụng đặc điểm của mắt người không nhạy cảm với sai số ở tần số cao
Trang 21Bởi vậy, có thể sử dụng bước lượng tử thô cho các hệ số ứng với tần số cao
mà không làm giảm sút chất lượng ảnh khôi phục
Hình 2.5 Quá trình giải mã chuyển đổi hai chiều
Ảnh số được chia thành các khối cỡ pxq Các khối này sẽ được chuyểnđổi sang miền tần số Các hệ số biến đổi sẽ được lượng tử hóa và mã hóa Quátrình giải mã sẽ được áp dụng phép biến đổi ngược đối với các hệ số để khôiphục ảnh ban đầu
Trong mã hóa chuyển đổi, điều quan trọng là phải chọn được phép biếnđổi phù hợp có khả năng giảm tối đa mối quan hệ tương hỗ giữa các điểm ảnhtrong cùng một khối Bản thân phép biến đổi trong mã hóa chuyển đổi khôngnén dữ liệu Song nếu lượng tử hóa các hệ số, rất nhiều hệ số tần số cao sẽquy tròn về giá trị 0 Việc lựa chọn bảng lượng tử và số bít mã hóa cho các hệ
số cũng rất quan trọng do phần lớn hiệu suất nén dữ liệu tập trung trong quátrình này Cuối cùng mã hóa entropy được chọn để giảm tối đa tốc độ dòngbít
Trang 22Phép biến đổi tốt nhất cho bình phương sai số của ảnh khôi phục nhỏnhất là phép biến đổi Karhumen - Loeve (KL) nhưng phép biến đổi này khôngphù hợp cho nhiều ứng dụng của ảnh số Do vậy, trong nén ảnh số sử dụngphổ biến cho một phép biến đổi khác gọi là “phép biến đổi cosin rời rạc”.Biến đổi cosin 1 chiều (1D - DCT) dành cho một dãy các điểm ảnh Việcchuyển đổi một khối nxm điểm ảnh sang miền tần số được thực hiện bằngchuyển đổi DCT 2 chiều (2D - DCT).
2.3 Một số công nghệ nén
2.3.1 Nén Video bằng phương pháp DPCM
Đây là phương pháp nén ảnh hiệu quả, nguyên lý cơ bản của phươngpháp này là: Chỉ chuyển tải tín hiệu vi sai giữa mẫu và giá trị dự báo (đượctạo ra từ các mẫu trước đó)
a Kỹ thuật tạo dự báo
Nếu trực tiếp lượng tử hóa, mã hóa các mẫu của một nguồn ảnh với đầy
đủ thông tin dư thừa và quan hệ tương hỗ giữa các điểm ảnh thì hiệu suất nén
sẽ rất thấp do lượng thông tin của nguồn quá lớn Do vậy, trong các côngnghệ nén cần loại bỏ đi tính có nhớ của nguồn tín hiệu tức là thực hiện “giảitương hỗ” (decorelation) giữa các điểm lân cận nhau
Trong công nghệ nén “Điều xung mã vi sai” DPCM, quá trình giảitương hỗ được thực hiện bằng một bộ lọc có đáp ứng đầu ra là một hiệu sốgiữa các mẫu điểm liên tiếp đầu vào và một giá trị “dự báo” của mẫu điểm đótạo được dựa trên các giá trị mẫu lân cận theo một quy tắc nhất định
+ Sai số dự báo (Prediction error):
Sai số dự báo: Là sự chênh lệch giữa giá trị dự báo và giá trị thực Nókhông làm tổn thất thông tin dẫn đến suy giảm chất lượng ảnh Giá trị sai sốnày quyết định đến tốc độ bít giảm đi nhiều hay ít, tức ảnh hưởng đến hiệusuất nén
Trang 23Bộ tạo dự báo có nhiệm vụ tạo ra giá trị điểm tiếp theo từ giá trị cácđiểm đã truyền tải trước đó có được lưu trữ Quá trình tạo dự báo càng tốt thì
sự sai khác giữa giá trị thực của mẫu hiện hành và trị dự báo cho nó (sai số dựbáo - yếu tố đánh giá chất lượng dự báo) càng nhỏ Khi đó tốc độ dòng bítcàng được giảm nhiều
Chất lượng tạo dự báo bằng màn hiển thị tín hiệu sai số dự báo, ảnhtạo được càng đen tức giá trị tín hiệu này càng nhỏ và việc tạo dự báocàng chính xác
+ Tạo dự báo cho ảnh truyền hình - các phương thức thực hiện:
Dự báo cho ảnh truyền hình được thực hiện với dòng dữ liệu ảnh đơnthuần (không chứa đựng tín hiệu âm thanh) Phương pháp quét điển hìnhtrong truyền hình là quét các dòng, các dòng không được quét liên tiếp nhau
mà chia làm hai mành: mành chẵn chứa thông tin của dòng chẵn, mành lẻgồm các dòng lẻ xuất hiện giữa hai mành chẵn liên tiếp nhau Một khung(frame) tương ứng với một ảnh sẽ gồm một mành chẵn và một mành lẻ kềnhau Từ phương pháp quét đó các phương pháp tạo dự báo sau:
- Tạo dự báo trong mành (Intrafield Prediction):
Chỉ sử dụng các điểm thuộc nửa ảnh (một mành) để tạo dự báo Dự báotrong mành không tận dụng được quan hệ giữa các điểm ảnh lân cận nhautheo chiều đứng nên có thể cho sai số dự báo cao
- Tạo dự báo trong ảnh (Intraframe Prediction):
Với sự hỗ trợ của một bộ nhớ mành, dự báo trong ảnh sử dụng tất cảcác điểm thuộc cả hai mành của một khung để tạo dự báo Như vậy, sẽ lợidụng được quan hệ tương hỗ của các điểm lân cận theo cả phương ngang vàphương đứng nên dự báo chính xác hơn, cho sai số dự báo nhỏ hơn
- Tạo dự báo liên mành (Intraframe Prediction):
Trang 24Phương pháp tạo dự báo này sử dụng cả khung hiện hành và khungtham chiếu khác Dự báo liên mành chỉ sử dụng một mành (chẵn hoặc lẻ) ởcác khung khác nhau.
- Tạo dự báo liên ảnh (Interframe Prediction):
Phương pháp này sử dụng cả hai mành ở các ảnh kề nhau
+ Sự giảm tốc dòng bit từ việc tạo giá trị dự báo:
Bằng một số phép toán, chúng ta có thể thấy được hiệu suất của côngnghệ DPCM so với lượng tử và mã hóa trực tiếp biên độ các điểm ảnh nhờPCM tuyến tính Nếu biến đổi PCM tuyến tính các điểm ảnh để có trung bình
PCM / 2 (q) + C1
C hằng số phụ thuộc vào lượng tử hóa và mật độ phân bố
Tương tự, tốc độ dòng bit của DPCM cùng với giá trị trung bình bình
DPCM / 2(q) }+C 2
2DPCM là năng lượng một chiều tín hiệu sai số dự báo
DPCM / 2(q)}+C 1 - C 2.Trong công nghệ DPCM do sử dụng mã hóa Entropy (mã hóa
DPCM cho nên tốc độ dòng bítgiảm dần đi nhiều nếu sử dụng điều xung mã vi sai Đó là hiệu suất nén củacông nghệ DPCM
b Lượng tử hóa sai số dự báo
Trang 25Giá trị biên độ vi sai phụ thuộc vào tính chất ảnh Trong vùng ảnhthuần nhất, giá trị này thường nhỏ Đối với các rìa ảnh và ảnh có nhiều chitiết, giá trị dự báo kém chính xác đi dẫn đến sai số dự báo sẽ tăng lên Donhững đặc điểm này, nếu sử dụng bộ lượng tử hóa tuyến tính với một bướclượng tử, sẽ gây nhiều lỗi:
- Tại vùng ảnh thuần nhất, giá trị dự báo vi sai xấp xỉ bằng 0, bướclượng tử gây ra nhiễu hạt
- Tại vùng ảnh có rìa hoặc nhiều chi tiết, bậc độ tương bản giữa cácđiểm ảnh cao dẫn tới một số giá trị sai số dự báo lớn làm quá tải thang lượng
tử Độ dốc tín hiệu giải mã không theo kịp độ dốc tín hiệu thực tế tại các rìa.Bởi vậy các nét ảnh không rõ ràng
c Khái niệm bù chuyển động (motion compensation) và vector chuyển động (motion vector)
Trong dòng tín hiệu video thông thường, các khung liền nhau thườnggiống nhau Do vậy trong dự báo Interframe một chiều (tức lấy khung liềntrước làm ảnh dự báo cho khung liền sau), giá trị dự báo rất gần giá trị ảnhthực tế dẫn tới sai số dự báo nhỏ, tốc độ dòng bit dữ liệu nhỏ
Khi có chuyển động xảy ra, các điểm có cùng vị trí trong hai khung liềnnhau là rất đặc biệt Do vậy sai số dự báo sẽ tăng lên, tốc độ bít tăng lên vàhiệu suất nén giảm Với trường hợp ảnh động, nếu chọn ảnh dự báo là khungliền trước sẽ không hợp lý Để tạo một khung dự báo tối ưu ở đây ta phải sửdụng khái niệm “Bù chuyển động” (Motion compensation)
Quá trình tìm kiếm hướng chuyển động của vật thế là “ước lượngchuyển động’’ (Motion estimation) Kết quả về sự chuyển dịch của vật thểtheo hai hướng x,y được phản ánh bằng giá trị vector gọi là “vector chuyểnđộng” (Motion vector)
Khi có chuyển động, ảnh dự báo không phải là ảnh kề trước đó mà làảnh có bù chuyển động
Trang 26Giá trị sai số dự báo:
P = khung trước đó - khung hiện hành + vector chuyển động.Nên vẫn giữ được giá trị rất nhỏ Nếu quan sát sai số dự báo, ta dễ thấyđược chất lượng dự báo có bù chuyển động Ảnh tạo bởi tín hiệu sai số biếnđổi có bù chuyển động đen hơn rất nhiều với trường hợp dự báo không bùchuyển động
d Ước lượng chuyển động bằng phương pháp tìm kiếm khối tương đồng (Block matching)
Có nhiều thuật toán “ước lượng chuyển động” nhưng sử dụng phổ biếnnhất là “Block matching” Kỹ thuật “Block matching” dự đoán chuyển độngcủa một khối kích thước (nxm) điểm ảnh trong khung hình hiện tại bằng sựtương quan với các điểm ở khung hình trước đó và sau đó Khối này được sosánh với khối tương ứng bằng cách tìm kiếm trong vùng kích thước (m+2p x
n x 2p) ở khung hình trước đó hoặc sau
Hình 2.6 Véc tơ chuyển động giữa hai khung kế tiếp
Trong các hệ thống triển khai MPEG điển hình, match block (hay còngọi là Macroblock) là 16 x 16 điểm và thông số p = 6 có nhiều kỹ thuật Blockmatching cho dự đoán vecto chuyển động đã được phát triển và có giá trịtrong khoa học như:
động
Khung trước (n)
Khung hiện hành (n+1)
Trang 27- Giải thuật tìm kiếm vét cạn.
- Giải thuật ba bước tìm kiếm
- Giải thuật tìm kiếm logarit hai chiều
- Giải thuật tìm kiếm hai hướng liên hợp
- Giải thuật tìm kiếm một chiều song song có thứ bậc
- Giải thuật kết cấu có phân tầng, phân loại khác nhau giữa các điểmảnh
Những kỹ thuật Block matching cho dự đoán chuyển động để tìm kiếmvecto chuyển động bằng giá trị hàm nhỏ nhất, có giá trị hàm sau:
+ Hàm giá trị chênh lệch tuyệt đối (MAD: Mean - Absolute - Difference)
/ ) ,
( ) , ( /
1 ) ,
2 /
2 /
2 /
dy j dx i G j i F mn
dy dx
m j
n n i
G (i,j) Đại diện cho Macroblock giống nhau từ khung hình tham khảo (quá khứ hoặc tương lai)
(dx,dy): Đại diện cho vecto tìm kiếm địa phương
Đối với hệ thống MPEG điển hình, có m=n=16, p=6 thì hàm MADtrở thành:
/ ) , ( ) , ( / 256
1 ) ,
dx MAD
j i
/
2 /
2 /
2 /
)]
, ( ) , ( [
1 ) ,
mn dy dx
m j
n n i
Trang 28j i
dy j dx i G j i F
dy j dx i xG j i F dy
dx
¦}
) , ( ) , ( {
) , ( ) , ( )
, (
Trong đó, hàm giá trị chênh lệch tuyệt đối được xem như tốt nhất chocác ứng dụng của video vì nó dễ thực hiện trong phần cứng Hàm MSD vàCCF có hiệu quả tuy nhiên quá phức tạp để thực hiện phần cứng
Để giảm bớt tính toán phức tạp các giá trị hàm MAD, MSD, CCF thìGhavani và Mills đã đề nghị tiêu chí cho block matching đơn giản gọi là:Phân loại sự khác biệt giữa các điểm ảnh (PDC - Pixel DifferenceClasification)
j i
j i dy dx T dy
0 trong các trường hợp còn lại
Với t là một giá trị ngưỡng xác định trước
e Hệ thống DPCM có bù chuyển động
Bộ tạo dự báo ở bên thu có khối nhớ khung (frame memory or framestore) lưu trữ dữ liệu khung trưóc đó để tính toán đo đạc chuyển động bằngcách so sánh giữa khung cũ và khung mới Từ đó tạo dựng khung dự báo có
bù chuyển động ở đầu ra bộ tạo dự báo Việc thực hiện đo đạc chuyển động ởbên phát căn cứ vào khung hiện tại mà bên thu chưa có Bởi vậy, một phép đonhư vậy không thể đồng thời tiến hành ở cả bên thu và bên phát mặc dù thôngtin vectơ chuyển động là cần cho bên thu để tạo dự báo Cho nên thông tin vềchuyển động (các vectơ chuyển động của các MB (Macroblock)) được truyền
Trang 29tới bên thu nhờ một kênh phụ Hệ thống DPCM có bù chuyển động là hệthống có bộ tạo dự báo không nhân quả.
2.3.2 Nén Video bằng công nghệ mã hóa chuyển đổi
Công nghệ mã hóa chuyển đổi có một vai trò quan trọng trong nén ảnhtruyền hình Nếu công nghệ DPCM chỉ cho ảnh chất lượng cao tại tốc độdòng bit cao thì công nghệ nén “mã hóa chuyển đổi - Tranform Coding” cókhả năng sử dụng cùng một thuật toán cho một dải tốc độ bit và chỉ làm suygiảm chất lượng ảnh phục hồi tại tốc độ dòng bít vô cùng thấp
a Xử lý giải mã tương hỗ trong công nghệ TC
ee
e
q
Bộ tạo dự báo
V=tín hiệu đầu vào e=V-P= sai số dự báo
Bộ mã hoá DPCM
Trang 30Trong khi công nghệ “điều xung mã vi sai” DPCM xử lý tín hiệu trongmiền thời gian thì công nghệ nén “mã hóa chuyển đổi TC” xử lý tín hiệutrong miền tần số Việc loại bỏ tính có nhớ của nguồn tín hiệu được thực hiệnbằng một phép biến đổi có tính thuận nghịch, chuyển một khối các điểm ảnhtrong miền thời gian thành khối các hệ số trong miền tần số (mỗi hệ số đạidiện cho một tần số tín hiệu của khối) bằng phép biến đổi thuận và hồi phụccác điểm ảnh từ khối các hệ số bằng phép chuyển đổi nghịch.
Phép biến đổi phù hợp nhất cho nén tín hiệu video là phép biến đổicosin rời rạc (Discrete consine tranform - DCT), thay vì lượng tử hóa và
mã hóa trực tiếp biên độ điểm ảnh, người ta sẽ lượng tử hóa và mã hóa các
hệ số DCT
b Biến đổi cosin rời rạc (Discrete consine tranform - DCT)
DCT là phép biến đổi giá trị một khối các điểm ảnh thành một khối các
hệ số trong miền tần số
Công thức tính toán cho DCT - 2D với ma trận vuông giá trị điểm NxNsinh ra ma trận vuông hệ số tuần tự như sau:
] 2
) 1 2 ( cos ] 2
) 1 2 ( cos[
) , ( )
( ).
( 2
1 ) ,
u x y
x f v
C u C N v
u
v
N u
Trang 31] 2
) 1 2 ( cos ] 2
) 1 2 ( cos[
) , ( ) ( ) ( 2
1 ) ,
u x v
u F v C u C N
y x
v
N x
- Thứ hai: Là thuận tiện cho việc tính toán và thiết kế mạch cứng
Khối 8x8 sau đó được biến đổi với vùng tần số bằng biến đổi 2-DDCT Đầu ra bộ biến đổi sẽ là 64 giá trị biểu diễn các hệ số của các thànhphần tần số trong khối 8x8 Như vậy, hầu hết các thông tin về khối nằm ởvùng tần số thấp và giá trị các hệ số tần số cao rất nhỏ do giá trị các pixel gầnnhau thường giống nhau
Như vậy biểu thức biến đổi DCT thuận cho nén ảnh số như sau:
] 16
) 1 2 ( cos ] 16
) 1 2 ( cos[
) , ( )
( ) ( 4
1 ) ,
i f v
C u C v u F
k j
1 ) 0 , 0 (
k j
k i j F
Hệ số này =1/8 tổng giá trị các điểm ảnh trong khối, đại diện cho mứcnăng lượng trung bình của các điểm ảnh, gọi là hệ số DC (tần số = 0) Các hệ
số còn lại, đại diện cho các thành phần tần số không gian cao hơn, gọi là các
hệ số AC Sự biến đổi (mức chênh lệch) giá trị biên độ các điểm ảnh theohướng nào càng lớn thì các hệ số AC theo hướng đó càng cao Nếu trong khốiảnh có sự dư thừa không gian lớn thì rất nhiều hệ số AC xấp xỉ hoặc bằng 0
Trang 32Trên thực tế, phép biến đổi DCT cho một giá trị hệ số DC cao và cácgiá trị hệ số AC rất nhỏ Giá trị điểm - điểm của khối thay đổi theo hướng nàocàng nhiều thì giá trị các hệ số AC theo hướng tương ứng càng cao.
Bản thân DCT không nén dữ liệu, nó không làm giảm tốc độ bít Bởivậy, để nén dữ liệu người ta cần lượng tử hóa các hệ số DCT theo một bảngtrọng số nhất định sao cho các hệ số khác 0 ứng với lượng thông tin trong mộtkhối là nhỏ nhất Đồng thời các hệ số DCT cũng được quét theo một cách đặcbiệt để số hệ số 0 đi liền nhau liền nhất nhằm giảm bớt số bit cần dùng cho
mã hóa hệ số DCT
c Lượng tử hóa các hệ số DCT
Quá trình lượng tử hóa và mã hóa các hệ số DCT chính là quá trình làmgiảm tốc độ bit vì bản thân phép biến đổi DCT không nén thông tin Đây làkhâu nhạy cảm nhất trong một hệ thống nén vì nó quyết định trực tiếp chấtlượng ảnh khôi phục
+ Đặc tính thị giác của mắt người:
Mắt người không nhạy cảm với các thành phần tần số cao tức là kémphát hiện sai số tại những vùng ảnh có nhiêù chi tiết, biến đổi nhanh Sự phângiải theo hướng xiên thì ít ảnh hưởng tới chất lượng ảnh hơn các hướng ngang
và thẳng đứng Điều này có nghĩa là sai số lượng tử của cá hệ số DCT khácnhau là không đều Sai số của các hệ số tần số cao cũng như hệ số theo đườngchéo ít ảnh hưởng hơn tới chất lượng ảnh khôi phục
+ Lượng tử hóa lấy mẫu từng vùng (zonal sampling):
Phương pháp lượng tử hóa các hệ số DCT đơn giản nhất là lấy mẫutheo từng vùng, theo nguyên tắc sau: Loại bỏ một phần hệ số tần số cao mà
mã hóa phần còn lại bằng số lượng bit cố định, có thể hiểu đây như một bộlượng tử cửa một bước lượng tử duy nhất Phương pháp này đơn giản nhưngrất nhiều hạn chế:
Trang 33- Không tận dụng được đặc tính thị giác của con người là không nhạycảm với tần số cao, cũng như không tận dụng được đặc tính khó nhận biết sai
số trong vùng ảnh có độ linh hoạt cao
- Từ mã có độ dài cố định không cho sự tối ưu trong việc giảm tốc độbit Đặc biệt khi dùng đồng bộ lượng tử hóa tuyến tính Một từ mã sẽ đượctruyền đi cho dù giá trị hệ số lượng tử là 0, có rất nhiều hệ số DCT sau khilượng tử trở về giá trị 0 dẫn đến hiệu suất nén rất thấp
+ Lượng tử hóa có trọng số:
Đây là phương pháp lượng tử hóa tối ưu cho nén ảnh Trong đó sửdụng bộ lượng tử hóa tuyến tính có một dải các bước lượng tử Mỗi hệ sốDCT khác nhau sẽ được lượng tử tuyến tính theo bước lượng tử phù hợp.Bước lượng tử này được quyết định dựa trên nhiều yếu tố Đó là:
Bảng trọng số HVS weighiting table:
Đặc tính cảm nhận của mắt người chỉ nhạy cảm với tần số thấp vàhướng biến đổi dọc, ngang mà không nhạy cảm với tần số cao cũng như sựthay đổi theo hướng chéo, dẫn đến mức độ quan trọng của các hệ số tuỳ thuộcvào vị trí Những hệ số tần số cao và theo hướng chéo có thể được lượng tửhóa theo bước lượng tử thô hơn Điều này đã được nghiên cứu và liệt kê trongmột bảng trọng số dành cho lượng tử hóa gọi là HVS Ví dụ bảng trọng sốđược mặc định trong tiêu chuẩn nén JPEG như sau:
Bảng 2.1 Trọng lượng tử hóa của chuẩn JPEG cho tín hiệu chói và tín hiệu màu
Trang 34Mức độ linh hoạt của từng vùng ảnh:
Trong vùng ảnh có độ linh hoạt cao, lỗi mã hóa khó nhận biết hơn nêntại đây có thể sử dụng bước lượng tử hóa lớn hơn Người ta tiến hành phânđoạn ảnh và đo đạc mức linh hoạt M cho từng đoạn, từ đó tạo ra một tác nhân
linh hoạt càng cao và chỉ được đánh giá cho hệ số AC bởi hệ số DC chưanăng lượng trung bình của khối Chỉ có các hệ số AC xác định độ tương phản
và biến thiên giá trị các điểm ảnh trong khối
Đặc tuyến của bộ đệm dữ liệu:
Có thể dễ dàng nhận thấy số bit truyền tải của mỗi đoạn ảnh này tuỳthuộc vào nội dung của đoạn ảnh đó Đối với đoạn ảnh có độ tương phản thấp,
số bit mã hóa sẽ thấp vì năng lượng của cả đoạn sẽ tập trung vào hệ số DC.Với vùng ảnh có hoạt tính cao, ngoài hệ số DC còn có một số các hệ số ACcần mã hóa dẫn đến làm tăng số bit Trong khi đó, tốc độ các kênh truyên tảiluôn là hằng số, nên các bit mã hóa phải được đưa qua một bộ nhớ đệm đểđiều chỉnh tốc độ bít đầu ra không thay đổi cho dù có sự biến thiên của tốc độbit đầu vào
Trang 35f (B) tác động lên thang lượng tử B càng lớn (bộ đệm càng đầy) thì trọng sốcàng nhỏ tức bước lượng tử càng lớn để giảm bớt tốc độ bít đầu vào.
Hình 2.8 Đặc tuyến của bộ đệm dữ liệu
và AC tần số thấp, bước lượng tử thô dành cho các hệ số AC tần số cao
d Quét các hệ số DCT
Trang 36QuÐt Zigzag QuÐt Alternate
Dòng số là dòng truyền tải các bít nối tiếp nhau theo thời gian Do vậycần một quá trình sắp xếp các hệ số DCT đã lượng tử trong ma trận hai chiềuthành một dãy chiều nối tiếp nhau quá trình đó gọi là quét hệ số DCT
Qua nghiên cứu ta thấy rằng; có hai dạng thức quét cho hệ số “0” đứngcạnh nhau lớn nhất, tạo thuận lợi cho việc giảm tốc độ bít khi mã hóa Đó làquét “zig zag” và quét luân phiên “alternate”
Hình 2.9 Quét các hệ số DCT
e Mã hóa các hệ số DCT
Sau khi quét, các hệ số DCT gồm rất nhiều hệ số 0 đi liền nhau nênđược mã hóa bằng loạt dài RLC (run length coding) rồi tiếp tục mã hóaHuffman VLC (variable length coding) sao cho giảm tối thiểu được tốc độdòng bit Việc mã hóa được quy định bởi các bảng mã, ứng với mẫu đầu vàođối chiếu theo bảng mã sẽ cho từ mã đầu ra tương ứng
Trang 38Bảng 2.4 Bảng mã hóa Huffman cho hệ số DC
Vi sai giá trị DC Hạng Từ mã cho tín hiệu màu Từ mã cho tín hiệu chói
f Hệ thống nén Video công nghệ mã hóa chuyển đổi
Nguyên tắc hoạt động của hệ thống nén ảnh sử dụng công nghệ “mãhóa chuyển đổi” như sau:
định dạng khối, các mẫu điểm sẽ được sắp xếp thành các khối 8x8 Bốn khối
MB sẽ được xử lý lượng tử, mã hóa độc lập với nhau Các MB điểm ảnh đượcchuyển đổi sáng vùng tần số bằng bộ chuyển đổi cosin rời rạc DCT Khối hệ
số DCT được lượng tử hóa và mã hóa theo RLC và VLC Bộ lượng tử hóa sẽ
Trang 39chịu sự tác động của 4 yếu tố sau, để cho bước lượng tử phù hợp với từng hệ
số DCT:
- Trọng số của bảng HVS
- Sự phân loại năng lượng khối
- Tín hiệu điều khiển chiếm cứ bộ nhớ
quét
Bộ đệm VLC
RLC Zig - Zag
Lượng tử hóa DTC
Bảng trọng số HVS
Y
C R
C B
Phân loại năng lượng khối
Lựa chọn tốc độ bit đầu ra
Block ID
Điều khiển chiếm cứ
bộ đệm
Giả định dạng Block
và Macroblock
IDCT
Giải lượng tử hóa
Quét Zigzag ngược
RLC VLC
Bảng trọng
số HVS Bảng mã
Huffman
Trang 40Hình 2.11 Giải mã DCT
2.3.3 Sự kết hợp của các công nghệ nén
Nếu sử dụng một cách tách biệt, không có công nghệ nén nào có khảnăng tạo một quá trình nén có dòng bít ra tốc độ thấp mà vẫn đảm bảo chấtlượng ảnh đạt yêu cầu Bởi vậy mọi cách thức nén hiện nay đều là sự kếthợp chuẩn xác giữa các công nghệ nén Sự kết hợp này sau đó được chuẩnhóa trở thành các tiêu chuẩn nén: JPEG, JPIG, MPEG, kết hợp các côngnghệ nén được hiểu là tạo ra một quá trình nén nhiều bậc nhằm đạt đượchiệu suất nén cao Tiêu chuẩu nén phổ biến hiện nay là MPEG, sử dụng kếthợp cả hai công nghệ nén “Điều xung mã vi sai” DPCM và “mã hóachuyển đổi” - TC Sự kết hợp này còn được gọi là “DPCM/DCT cân bằng”
Sơ đồ quá trình nén như sau:
IDTC
Mã hóa VLC
Giải lượng
tử hóa
Lượng
tử hóa DCT
Trễ cố định Ước lượng
Bù chuyển
động
Ghép kênh