Nghiên cứu phát triển một số giải pháp nén ảnh tiên tiến cho màn hình tinh thể lỏng

Khi xem xét trong khoảng thời gian những năm nghiên cứu đầu tiên của luận án cuối năm 2009 đến đầu năm 2011, một số giải pháp nén ảnh khung hình được đề xuất trong [[5], [19], [21]] là n

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

NGUYỄN HỮU TÀI

NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ GIẢI PHÁP NÉN ẢNH TIÊN TIẾN CHO MÀN HÌNH TINH THỂ LỎNG

LUẬN ÁN TIẾN SĨ HỆ THỐNG THÔNG TIN

Hà Nội – 2015

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

NGUYỄN HỮU TÀI

NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ GIẢI PHÁP NÉN ẢNH TIÊN TIẾN CHO MÀN HÌNH TINH THỂ LỎNG

CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN

MÃ SỐ: 62480104

LUẬN ÁN TIẾN SĨ HỆ THỐNG THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC:

1 PGS TS NGUYỄN THỊ HOÀNG LAN

2 GS TS LÊ ĐÌNH CHƠN TÂM

Hà Nội − 2015

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi Các số liệu, kết quả nêu trong luận án là trung thực và chưa từng được ai công bố trong bất cứ một công trình nào khác

Trang 4

LỜI CẢM ƠN

Tôi xin gửi lời tri ân đến PGS TS Nguyễn Thị Hoàng Lan – Viện Công nghệ Thông tin và Truyền thông – Đại học Bách khoa Hà Nội và TS Lê Đình Chơn Tâm – Giáo sư Đại học Sherbrooke – Canada, công sức và tấm lòng của Thầy Cô đã giúp cho tôi vượt qua những khó khăn trở ngại để có thể hoàn thành luận án này

Tôi cũng xin gửi lời cảm ơn tới các Thầy Cô trong Bộ môn Truyền thông và Mạng máy tính đã tạo điều kiện giúp đỡ và đóng góp nhiều ý kiến quý báu giúp tôi hoàn thiện luận án nghiên cứu Cảm ơn các Thầy Cô trong Viện Công nghệ Thông Tin và Truyền thông đã truyền thụ những kiến thức bổ ích trong quá trình tôi học tập và nghiên cứu tại trường

Cảm ơn các Thầy Cô cùng các Bạn đồng nghiệp trong khoa Công nghệ Thông tin – Đại học Khoa học Huế đã luôn quan tâm và động viên tôi trong quá trình tôi làm nghiên cứu sinh

Cuối cùng, tôi xin gửi tấm lòng ân tình tới Gia đình tôi, đặc biệt đến người bạn đời của tôi, người luôn sẻ chia và động viên cùng như gánh vác nhiều khó khăn vất vả trong gia đình để tôi được toàn tâm toàn ý học tập và nghiên cứu

Mặc dù đã rất cố gắng nhưng do thời thời gian và kiến thức còn hạn chế nên luận án chắc còn có nhiều thiếu sót Tôi rất mong nhận được những ý kiến đóng góp quý báu từ Quý Thầy Cô, các Bạn đồng nghiệp và những người quan tâm

Trang 5

MỤC LỤC

MỤC LỤC i

DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT iv

DANH MỤC HÌNH VẼ vii

DANH MỤC BẢNG xi

CHƯƠNG 1: MỞ ĐẦU 1

1.1 Đặt vấn đề 1

1.2 Tình hình nghiên cứu trên thế giới 3

1.3 Mục tiêu và phạm vi nghiên cứu của luận án 5

1.4 Phương pháp nghiên cứu 5

1.5 Ý nghĩa khoa học và thực tiễn của đề tài 6

1.6 Bố cục luận án 7

CHƯƠNG 2: TỔNG QUAN VỀ VẤN ĐỀ NÉN ẢNH CHO MÀN HÌNH TINH THỂ LỎNG 9

2.1 Lịch sử phát triển của màn hình tinh thể lỏng và vấn đề chất lượng hiện thị hình ảnh động 9

2.1.1 Lịch sử phát triển của màn hình tinh thể lỏng 9

2.1.2 Vấn đề chất lượng hiển thị hình ảnh động trên màn hình tinh thể lỏng 11

2.2 Overdrive – một kỹ thuật tăng tốc độ đáp ứng cho các phần tử tinh thể lỏng 12 2.3 Mô hình hệ thống Overdrive và yêu cầu nén ảnh giảm bộ nhớ khung hình 14

2.3.1 Mô hình hệ thống overdrive 14

2.3.2 Vấn đề yêu cầu nén ảnh khung hình cho màn hình tinh thể lỏng 15

2.3.3 Các đặc trưng của phương pháp nén ảnh áp dụng cho hệ thống Overdrive 17

2.4 Mô hình hệ thống nén ảnh dùng cho hệ thống overdrive 18

2.4.1 Hệ thống nén ảnh khung hình 18

2.4.2 Các độ đo hiệu năng giải pháp nén ảnh khung hình 20

2.4.3 Mối tương quan giữa chất lượng nén và chất lượng ảnh hiển thị trên màn hình tinh thể lỏng 22

2.4.4 Một số yêu cầu đặc trưng và tiêu chí đánh giá hệ thống nén ảnh cho màn hình tinh thể lỏng 23

2.5 Một số cơ sở lý thuyết trong nén ảnh 26

2.5.1 Các phép biến đổi áp dụng trong nén ảnh 27

2.5.2 Lượng tử hoá 33

2.5.3 Gán từ mã dạng độ dài đồng nhất 37

2.5.4 Khái quát về một số phương pháp mã hóa ảnh thực hiện cho màn hình 38

2.6 Tổng quan về các giải pháp nén ảnh cho màn hình tinh thể lỏng 42

2.6.1 Khái quát về các giải pháp nén ảnh cho hệ thống overdrive 42

Trang 6

2.6.2 Một số hướng tiếp cận các giải pháp nén và định hướng nghiên cứu 46

CHƯƠNG 3: PHÂN TÍCH VÀ ĐỀ XUẤT MỘT SỐ GIẢI PHÁP NÉN ẢNH DỰA TRÊN MÃ HÓA KHỐI VÀ BIẾN ĐỔI KHÔNG GIAN MÀU 61

3.1 Nghiên cứu cải tiến và phát triển giải pháp nén ảnh dựa trên mã hóa khối và biến đổi không gian màu 61

3.1.1 Tóm tắt 6 giai đoạn nghiên cứu phát triển giải pháp 61

3.1.2 Môi trường thực nghiệm cài đặt và các bộ dữ liệu 62

3.2 Khắc phục hiện tượng nhiễu khối trong AHIC với đề xuất cải tiến MAIC 64

3.2.1 Nhiễu khối trong AHIC – Nguyên nhân và giải pháp khắc phục 64

3.2.2 Phát triển phương pháp lượng tử tối ưu sai số “Midrise Uniform Quantizer” 65

3.2.3 Đề xuất giải pháp cải tiến MAIC giúp khắc phục nhiễu khối 65

3.2.4 Đánh giá độ phức tạp của MAIC so với AHIC 67

3.2.5 Kết quả thực nghiệm và đánh giá 68

3.3 Cải thiện chất lượng ảnh nén với kỹ thuật trao đổi bit theo nội dung CBBET 73 3.3.1 Ưu và nhược điểm khi lượng tử hóa với sự phân phối bit đồng đều 73

3.3.2 Đề xuất kỹ thuật trao đổi bit theo nội dung CBBET 75

3.3.3 Đề xuất giải pháp cải tiến AAIC trên cơ sở tích hợp CBBET vào MAIC 79

3.3.4 Đánh giá độ phức tạp của AAIC so với MAIC và AHIC 80

3.4 Cải thiện chất lượng nén với kỹ thuật phân phối bit CBBDT 84

3.4.1 Ưu và nhược điểm của kỹ thuật trao đổi bit CBBET 84

3.4.2 Đề xuất kỹ thuật phân phối bit CBBDT dựa trên giá trị bước lượng tử - giải pháp AHAIC 85

3.4.3 Cải tiến hiệu năng của AHAIC bằng sơ đồ nén ACAIC 91

3.5 Đề xuất giải pháp nén RAIC 96

3.5.1 Cải thiện hiệu năng cho bộ lượng tử hóa với kỹ thuật mã hóa lượng tử MMAUQC 96

3.5.2 Tối ưu hóa kỹ thuật phân phối bit với RBBDT 99

3.5.3 Đề xuất mô hình lượng tử đa thích nghi MAQC 101

3.5.4 Đề xuất giải pháp nén RAIC 103

3.5.5 Đánh giá độ phức tạp tính toán của giải pháp nén RAIC 104

3.6 Đề xuất ARAIC nâng cao hiệu năng nén RAIC 108

3.6.1 Giải pháp đề xuất ARAIC 108

3.6.2 Sơ đồ thuật toán mã hóa/giải mã cho MAQC 110

3.6.3 Phân tích đánh giá khả năng nâng cao hiệu năng của giải pháp đề xuất 111

3.7 Kết luận chương 3 115

Trang 7

CHƯƠNG 4: PHÂN TÍCH VÀ ĐỀ XUẤT MỘT SỐ GIẢI PHÁP NÉN ẢNH

DỰA TRÊN BIẾN ĐỔI WAVELET VÀ LỰA CHỌN THÍCH NGHI 117

4.1 Đề xuất cải tiến DAMS với sự tích hợp cơ chế ngưỡng thích nghi - giải pháp DBMAIC 118

4.1.1 Đề xuất kỹ thuật ngưỡng thích nghi ATT 119

4.1.2 Đề xuất thuật toán lượng tử thích nghi AQC 121

4.1.3 Thực nghiệm và đánh giá cho giải pháp DBMAIC 121

4.2 Đề xuất áp dụng biến đổi “Wavelet Lifting integer to integer” để cải thiện độ phức tạp - giải pháp WLT-MAIC 126

4.2.1 Độ phức tạp trong kiến trúc thực hiện của DAMS và DBMAIC 126

4.2.2 Sơ đồ “Wavelet Lifting” 127

4.2.3 Đề xuất giải pháp WLT-MAIC 129

4.2.4 Sơ đồ thuật toán mã hóa và giải mã DAMS-AT 130

4.2.5 Phân tích đánh giá khả năng nâng cao hiệu năng của giải pháp đề xuất 131

4.2.6 Thực nghiệm và đánh giá cho giải pháp WLT-MAIC 131

4.3 So sánh và phân tích đánh giá hai giải pháp nén theo hai hướng tiếp cận 134

4.3.1 So sánh thực nghiệm và phân tích đánh giá 134

4.3.2 Một số kết luận và khuyến nghị 142

4.4 So sánh ARAIC và WLT-MAIC với những giải pháp tiên tiến nổi bật trong thời gian gần đây 143

4.5 Kết luận chương 4 145

CHƯƠNG 5: KẾT LUẬN 146

5.1 Tóm tắt nội dung nghiên cứu và kết quả mới của luận án 146

5.1.1 Những nội dung nghiên cứu chính của luận án 146

5.1.2 Các kết quả mới của luận án 147

5.2 Hướng phát triển 148

TÀI LIỆU THAM KHẢO 149

DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ CỦA LUẬN ÁN 151

PHỤ LỤC 1: THỬ GIẢI PHÉP NÉN WLT-MAIC TRÊN MỘT SỐ VIDEO CLIP CỦA QUALCOMM CANADA 152

PHỤ LỤC 2: THỐNG KÊ XÁC XUẤT CỦA “ZERO MEAN SIGNAL” TRONG MÔ HÌNH AAIC 160

Trang 8

DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT

Ký hiệu và chữ

AAIC Mã hóa nén ảnh tiên tiến thích nghi

Advanced Adaptive Image Coding

ACAIC Mã hóa nén ảnh tiên tiến có tính thích nghi theo nội dung

Advanced Content-Adaptive Image Coding

AHAIC Mã hóa nén ảnh tiên tiến có tính thích nghi cao

Advanced High-Adaptive Image Coding

AHIC Bộ mã hóa nén ảnh tiên tiến kết hợp (lai)

Advanced Hybrid Image Codec

Adaptive Multi-level Block Truncation Coding

Adaptive Quantization Coding

Advanced Robust Adaptive Image Coding

Adaptive Threshold Controller

Adaptive-Threshold Technique

Block Truncation Coding

Content-Based Bit Distribution Technique

CBBET Kỹ thuật trao đổi bit dựa trên nội dung

Content-based Bit Exchange Techniques

Current Frame

Compression Ratio

DWT-based Adaptive Mode Selection

DBMAIC Mã hóa nén ảnh dựa trên phép biến đổi wavelet đa thích nghi

DWT-Based Multi-Adaptive Image Coding

Trang 9

DCT Biến đổi cosine rời rạc

Discrete Cosine Transform

Dynamic Scattering Method

Discrete Wavelet Transform

FFD / Overdrive

Kỹ thuật tăng tốc độ đáp ứng cho các phần tử tinh thể lỏng qua cơ chế tăng điện áp

Feedforward Driving

Finite Impulse Response

High Compression Ratio Image Coding

High-Definition

High-Definition Television

Hybrid Image Coding

Liquid Crystal

Liquid Crystal Displays

MAIC Mã hóa nén ảnh thích nghi theo giá trị trung bình

Mean Adaptive Image Coding

Multiple Adaptive Quantization Coding

Min-Max Adaptive Uniform Quantization Coding

Mean Squared Error

Midrise Uniform Quantizer

Pulse Code Modulation

Previous Frame

Trang 10

PSNR Tỷ số tín hiệu mức đỉnh trên nhiễu

Peak Signal-to-Noise Ratio

Robust Adaptive Image Coding

RBBDT Kỹ thuật phân phối bit tối ưu dựa trên giá trị phạm vi

Range-based Bit Distribution Technique

SBB-BTC Mã hóa cắt khối dựa trên mặt phẳng bit

Single Bit Plane based Block Truncation Coding

TFT Transistor công nghệ “Thin Film” đối với một phần tử ảnh màn hình

Thin-Film Transistor

Ultra High-Definition

VQ-BTC Mã hóa cắt khối dựa trên lượng tử hóa vector

Vector Quantizer based Block Truncation Coding

WLT-MAIC

Mã hóa nén ảnh đa thích nghi dựa trên biến đổi wavelet số nguyên

Wavelet Lifting integer to integer Transform based Multi-Adaptive Image Codin

Trang 11

DANH MỤC HÌNH VẼ

Hình 1.1 Minh họa hiện tượng mờ chuyển động 1

Hình 1.2 Mô hình một hệ thống overdrive trong màn hình tinh thể lỏng 2

Hình 2.1 Mô tả cấu tạo màn hình TFT-LCD 10

Hình 2.2 Minh họa hiện tượng Motion-Blur trên màn hình tinh thể lỏng 11

Hình 2.3 Sơ đồ khối của màn hình tinh thể lỏng 15inch XGA dùng kỹ thuật FFD 12

Hình 2.4 Đồ thị độ chói - thời gian đáp ứng mô tả cách thức xác định điện áp tăng tốc 12

Hình 2.5 Minh họa giải pháp tăng tốc độ chuyển đổi mức xám thông qua cơ chế hiệu chỉnh tăng ngưỡng điện áp 13

Hình 2.6 So sánh thời gian đáp ứng 13

Hình 2.7 Mô hình một hệ thống overdrive có sử dụng kỹ thuật nén ảnh nhằm giảm yêu cầu về dung lượng và tốc độ truy xuất dữ liệu của bộ nhớ khung hình 15

Hình 2.8 Phạm vi áp dụng của bài toán nén ảnh khung hình cho màn hình tinh thể lỏng độ phân giải cao 16

Hình 2.9 Mô hình với ba thành phần chính trong một hệ thống nén ảnh áp dụng trong truyền thông 18

Hình 2.10 Mô hình khái quát với bốn thành phần chính trong một hệ thống nén ảnh áp dụng cho overdrive trong màn hình tinh thể lỏng 19

Hình 2.11 Đồ thị biến thiên của PSNR theo MSE 21

Hình 2.12 Minh họa 64 hàm cơ bản của 8×8 DCT 28

Hình 2.13 Phân tích đa phân giải 3 mức và khôi phục của tín hiệu dùng cấu trúc lọc kiểu kim tự tháp (pyramidal filter structure) 30

Hình 2.14 Quy trình xử lý dòng-cột của DWT hai chiều 31

Hình 2.15 Sơ đồ phân tích và tổng hợp tín hiệu hai chiều theo cấu trúc băng tần con 32

Hình 2.16 Kết quả biến đổi DWT trên ảnh số hai chiều theo kiến trúc kim tự tháp sử dụng bộ lọc Wavalet Daubechies 4 - hệ số 32

Hình 2.17 Ánh xạ vào – ra của một bộ lượng tử hóa dạng Midrise 33

Hình 2.18 Xấp xỉ của hàm Px(x) bởi các hằng số phân đoạn 35

Hình 2.19 Ánh xạ vào – ra của một bộ lượng tử hóa tối ưu và sai số lượng tử 37

Hình 2.20 Mô hình khái quát cho một bộ mã hóa lượng tử thích nghi 40

Hình 2.21 Sơ đồ mã hóa ảnh sử dụng biến đổi 40

Hình 2.22 Sơ đồ cơ bản của chuẩn nén ảnh JPEG 41

Hình 2.23 Sơ đồ thuật toán bộ nén JPEG2000 42

Hình 2.24 Những giải pháp nén đã được đề xuất áp dụng trong hệ thống overdrive của màn hình tinh thể lỏng 47

Trang 12

Hình 2.25 Sơ đồ khối của bộ mã hóa AQC 49

Hình 2.26 Chất lượng ảnh nén của giải pháp AHIC được so sánh với giải pháp chỉ áp dụng kỹ thuật BTC 49

Hình 2.27 Sơ đồ giải pháp nén AHIC 50

Hình 2.28 Hiện tượng nhiễu khối (blocking effect) trên ảnh khôi phục của AHIC 51

Hình 2.29 Hiện tượng kém chất lượng trên thành phần màu sắc (Cb và Cr) trên ảnh khôi phục của AHIC 52

Hình 2.30 Sơ đồ khối và kiến trúc của AM-BTC 53

Hình 2.31 Ảnh khôi phục của AM-BTC và sai số của nó 54

Hình 2.32 Minh chứng cho hiện tượng rung động trong giải pháp nén AM-BTC 55

Hình 2.33 Mô hình hệ thống của DAMS và bộ mã hóa thích nghi 57

Hình 2.34 Hiệu ứng khối (blocking) và nhiễu (noise) trên ảnh khôi phục của DAMS 59

Hình 2.35 Số bit dư thừa khi kết thúc quá trình nén của DAMS 60

Hình 3.1 Sơ đồ mô tả sơ lược các bước nghiên cứu phát triển 61

Hình 3.2 Đồ thị hàm lượng tử Midrise Uniform Quantizer với 8 mức lượng tử 65

Hình 3.3 Sơ đồ khối của giải pháp nén MAIC 66

Hình 3.4 Sơ đồ bộ lượng tử hóa MUQ (MUQ Encoder & Decoder) 67

Hình 3.5 So sánh hiệu năng của AHIC với MAIC trên chuỗi hình CIF Foreman 69

Hình 3.6 So sánh hiệu năng của AHIC với MAIC trên chuỗi hình CIF Bus 69

Hình 3.7 So sánh sự mất mát thông tin giữa AHIC và MAIC trên một khung hình của chuỗi khung hình CIF Foreman 70

Hình 3.8 So sánh sự mất mát thông tin (hay error) giữa 2 giải pháp nén AHIC và MAIC trên một khung hình của chuỗi khung hình CIF Bus 71

Hình 3.9 Minh họa ảnh độ chói Y của 8 bock 4×4 đầu vào cho quá trình lượng tử hóa 74

Hình 3.10 Sai số phát sinh khi lượng tử hóa với phân phối đều bởi bộ lượng tử 4×4-AQC Chất lượng ảnh khôi phục đạt được PSNR=33.00 dB 74

Hình 3.11 Sai số phát sinh khi lượng tử hóa với phân phối không đồng đều bởi bộ lượng tử 4×4-AQC 75

Hình 3.12 Sơ đồ khối cho bộ mã hóa CBBET và bộ Bit Selector 76

Hình 3.13 Sơ đồ khối cho bộ mã hóa và giải mã của AAIC 80

Hình 3.14 So sánh chất lượng nén và sự mất mát thông tin giữa 3 giải pháp nén AHIC, MAIC và AAIC trên một khung hình của chuỗi khung hình CIF Foreman 81

Hình 3.15 So sánh hiệu năng của AAIC với MAIC và AHIC 82

Hình 3.16 So sánh hiệu năng của AAIC với AHIC (chỉ trên thành phần độ chói Y) 83

Hình 3.17 Sai số phát sinh khi lượng tử hóa với phân phối không đồng đều bởi bộ lượng tử 4×4-AQC 84

Trang 13

Hình 3.18 Sơ đồ bộ mã hóa và giải mã theo kỹ thuật phân phối bít (CBBDT) dựa trên giá

trị bước lượng tử 86

Hình 3.19 Sơ đồ khối cho bộ mã hóa (encoder) và giải mã (decoder) của giải pháp nén

AHAIC (ở đây Q=2) 88

Hình 3.20 So sánh chất lượng ảnh của các giải pháp trên chuỗi khung hình CIF Hall 89

Hình 3.21 So sánh chất lượng nén và sự mất mát thông tin giữa 3 giải pháp nén AHIC,

AAIC và AHAIC trên một khung hình của chuỗi khung hình CIF Hall 90

Hình 3.22 Sơ đồ bộ mã hóa và giải mã theo kỹ thuật phân phối bít (CBBDT) dựa trên giá

trị tuyệt đối lớn nhất của khối 93

Hình 3.23 So sánh chất lượng ảnh của các giải pháp nén trên chuỗi CIF Hall 93

Hình 3.24 So sánh chất lượng nén và sự mất mát thông tin giữa AHIC, AHAIC và ACAIC

trên một khung hình của chuỗi khung hình CIF Hall 95

Hình 3.25 Kỹ thuật lượng tử MUQ với 3bit/pixel - Mối liên hệ giữa bước lượng tử hóa

Qstep và sự phân bố các giá trị (hay điểm ảnh) trong một khối 97

Hình 3.26 Kỹ thuật lượng tử MMAUQC với 3bit/pixel - Mối liên hệ giữa bước lượng tử

hóa Qstep và sự phân bố các giá trị trong một khối dạng “zero min signal” 98

Hình 3.27 Mô tả đặc tính vào-ra của một bộ lượng tử hóa đều 3bit/pixel với đầu vào dạng

“zero min signal” 99

Hình 3.28 Sơ đồ khối của mô hình lượng tử đa thích nghi MAQC 102

Hình 3.29 Sơ đồ khối của bộ mã hóa và giải mã RAIC 104

Hình 3.30 So sánh chất lượng ảnh của các giải pháp nén trên chuỗi khung hình CIF

Foreman 105

Hình 3.31 So sánh chất lượng ảnh nén và sai số một cách trực quan trên ảnh Foreman 106

Hình 3.32 Sơ đồ bộ nén (Encoder) và giải nén (Decoder) của ARAIC 108

Hình 3.33 Sơ đồ bộ nén và giải nén MAQC áp dụng trong ARAIC 109

Hình 3.34 Sơ đồ thuật toán mã hóa và giải mã MAQC 111

MobileCalendar 113

Cheerleader 113

Hình 3.37 So sánh chất lượng hình ảnh nén và sai số một cách trực quan trên một khung

hình của chuỗi khung hình CIF MobileCalendar 114

Hình 4.1 Sơ đồ quá trình các đề xuất cải tiến kế thừa và phát triển theo hướng áp dụng

biến đổi wavelet và lựa chọn thích nghi 117

Hình 4.2 Sơ đồ khối của bộ mã hóa DBMAIC, được tích hợp với một bộ điều khiển

ngưỡng thích nghi 118

Trang 14

Hình 4.3 Sơ đồ khối của bộ mã hóa DAMS-AT áp dụng trong DBMAIC 118

Hình 4.4 Mối liên hệ giữa chất lượng ảnh và các hằng số C2 & C3 của DBMAIC 122

Hình 4.7 Mối liên hệ giữa chất lượng ảnh và các hằng số Min-Threshold & Max-Threshold của DBMAIC 122

Hình 4.8 Sự thay đổi của ngưỡng (threshold) 123

Hình 4.9 So sánh hiệu năng của các giải pháp nén 123

Hình 4.10 So sánh giá trị bit dư thừa trong hai giải pháp DBMAIC và DAMS 124

Hình 4.11 Sự cải thiện hiệu ứng nhiễu khối và nhiễu đốm trên ảnh khôi phục của DBMAIC 124

Hình 4.12 So sánh trực quan chất lượng ảnh và sai số 126

Hình 4.13 Sơ đồ “Wavelet Lifting” (nguồn [26]) 127

Hình 4.14 Sơ đồ khối cho bộ mã hóa WLT-MAIC 129

Hình 4.15 Sơ đồ khối cho bộ mã hóa DAMS-AT áp dụng cho WLT-MAIC với 6 khối 4×8 đầu vào theo trật tự ưu tiên định trước 129

Hình 4.16 Sơ đồ thuật toán mã hóa và giải mã DAMS-AT 130

Hình 4.17 So sánh hiệu năng của các giải pháp nén 132

Hình 4.18 So sánh trực quan chất lượng ảnh và sai số giữa hai giải pháp nén DBMAIC và WLT-MAIC 133

Hình 4.19 So sánh hiệu năng của các giải pháp nén thuộc hai hướng tiếp cận 135

Hình 4.20 So sánh trực quan sai số giữa một số giải pháp nén thuộc hai hướng tiếp cận Trị tuyệt đối sai số được khuếch đại lên 12 lần rồi biến đổi âm bản 137

Hình 4.21 So sánh hiệu năng của các giải pháp nén thuộc hai hướng tiếp cận 138

Hình 4.22 Giá trị PSNR trung bình của các giải pháp nén khi đánh giá trên 25 chuỗi khung hình với tổng số 8765 hình ảnh 138

Hình 4.23.Giá trị Entropy trung bình của mỗi chuỗi khung hình 140

Hình 4.24 So sánh chất lượng ảnh của các giải pháp nén trên chuỗi CIF MobileCalendar 140

Hình 4.25 So sánh trực quan sai số giữa một số giải pháp nén thuộc hai hướng tiếp cận 142 Hình 4.26 So sánh hiệu năng nén của 4 giải pháp ARAIC, WLT-MAIC, LTC và SAMS 144

Hình 5.1 Sơ đồ quá trình đề xuất cải tiến và phát triển các giải pháp nén ảnh của luận án trên cơ sở kế thừa hai giải pháp AHIC và DAMS cùng một số lý thuyết nền tảng 147

Trang 15

DANH MỤC BẢNG

Bảng 2.1 Điện áp tăng tốc áp dụng để chuyển đổi từ mức độ chói hiện tại sang mức độ

chói tiếp theo ở mức 60cd/m2 với thời gian đáp ứng 16.7ms 13

Bảng 2.2 Yêu cầu dung lượng và tốc độ truyền tải dữ liệu của bộ nhớ khung hình trên Ti-vi chuẩn HD và UHD 14

Bảng 2.3 Lượng tử hóa tối ưu MSE cho mật độ Gaussian 35

Bảng 2.4 Một ví dụ gán từ mã dạng độ dài đồng nhất cho thông điệp với 8 trạng thái 38

Bảng 2.5 Chất lượng nén trung bình của AHIC so với giải pháp chỉ áp dụng kỹ thuật lượng tử hóa BTC [19] 49

Bảng 2.6 Chất lượng ảnh khôi phục của một số giải pháp nén 53

Bảng 3.1 Các chuỗi khung hình định dạng CIF sử dụng trong thực nghiệm 63

Bảng 3.2 Các hình ảnh sử dụng trong thực nghiệm được lấy từ tập dữ liệu ảnh “LIVE image quality assessment database release 2” 64

Bảng 3.3 Trung bình cộng kết quả chất lượng ảnh nén cho mỗi giải pháp 72

Bảng 3.4 Đánh giá mức độ cải thiện chất lượng ảnh nén của MAIC so với AHIC 72

Bảng 3.5 Các lượng tử đều tối ưu cho tín hiệu có giá trị trung bình bằng không, phương sai đơn vị và mật độ Gaussian 77

Bảng 3.6 Kết quả chất lượng ảnh nén trung bình của các giải pháp 83

Bảng 3.7 Đánh giá mức độ cải thiện chất lượng ảnh nén của AAIC so với AHIC 83

Bảng 3.8 Kết quả chất lượng ảnh nén trung bình cho các giải pháp 90

Bảng 3.9 Kết quả cải thiện của AHAIC so với AHIC 90

Bảng 3.10 Kết quả cải thiện của AHAIC so với AAIC 91

Bảng 3.11 So sánh kết quả trung bình chất lượng ảnh nén khi sử dụng công thức tính phân phối bit (3.9) hay (3.10) trong giải pháp AHAIC 91

Bảng 3.13 Đánh giá mức độ cải thiện chất lượng ảnh nén của ACAIC so với AHIC 95

Bảng 3.14 Đánh giá mức độ cải thiện chất lượng ảnh nén của ACAIC so với AHAIC 96

Bảng 3.15 Minh họa cho tình huống mã hóa lượng tử BTC với sai số lớn 103

Bảng 3.17 Đánh giá mức độ cải thiện chất lượng của RAIC so với một số giải pháp 107

Bảng 3.19 Đánh giá mức độ cải thiện chất lượng của ARAIC so với một số giải pháp 115

Bảng 4.1 Các hệ số của bộ lọc wavelet Le Gall 5/3-tap 128

Trang 16

CHƯƠNG 1: MỞ ĐẦU

1.1 Đặt vấn đề

Trong những năm gần đây, chúng ta đã được chứng kiến sự thông dụng của công nghệ

màn hình tinh thể lỏng, hay thường được gọi tắt là công nghệ LCD (Liquid Crystal

Display), qua những chiếc ti-vi tinh thể lỏng (LCD và LED1) trong các hộ gia đình, cho

đến các màn hình tinh thể lỏng dùng cho máy tính cá nhân trong các văn phòng, các màn

hình quan sát và điều khiển trong công nghiệp, và nổi bật hơn cả là hàng tỷ chiếc điện

thoại di động đang nằm trong túi của hàng tỷ người trên toàn thế giới Sự phát triển và

thành công của công nghệ tinh thể lỏng là kết quả của những nghiên cứu cải tiến không

ngừng, nhằm đưa chất lượng hình ảnh hiển thị và độ phân giải ngày một cao hơn, điện

năng tiêu thụ ngày một hiệu quả, giá thành sản phẩm ngày một hợp lý hơn với người tiêu

dùng

Một trong số các vấn đề của công nghệ tinh thể lỏng trong thời kỳ đầu của quá trình

phát triển là tình trạng đáp ứng chậm chạp của các phần tử tinh thể lỏng, gây nên hiện

tượng mờ chuyển động (motion-blur, xem Hình 1.1) Để khắc phục, K Nakanishi và các

đồng nghiệp đã đề xuất giải pháp tăng tốc độ đáp ứng cho các phần tử tinh thể thông qua

cơ chế tăng ngưỡng điện áp với tên gọi “overdrive” vào năm 2001 [25] Kỹ thuật overdrive

đã tạo nên bước đột phá trong công nghệ tinh thể lỏng giúp tạo ra những sản phẩm có khả

năng hiển thị hình ảnh chuyển động với chất lượng cao

(a) Kỹ thuật điều khiển thông thường (b) Tăng tốc với overdrive

Hình 1.1 Minh họa hiện tượng mờ chuyển động (motion-blur) khi áp dụng kỹ thuật

điều khiển (dẫn động) thông thường (a), và khả năng cải thiện chất lượng hình ảnh hiển thị

bằng kỹ thuật tăng tốc overdrive (b) trên màn hình tinh thể lỏng của hãng LG

1 Màn hình LED (điôt phát quang) thực chất là màn hình tinh thể lỏng (LCD) nhưng được áp dụng kỹ

thuật chiếu sáng bằng đèn điôt phát quang (LED) thay cho đèn huỳnh quang lạnh (Cold cathode fluorescent

lamp - CCFL) [35]

Vùng hình ảnh chuyển động hiện thị bị mờ

Trang 17

Mô hình hệ thống overdrive trong màn hình tinh thể lỏng được trình bày trong Hình

1.2, gồm hai thành phần: (1) Bộ nhớ khung hình (frame memory); và (2) bộ điều khiển

tăng tốc overdrive Trong đó, bộ nhớ khung hình có chức năng lưu trữ dữ liệu ảnh hiện thị

đủ khung hình hiện tại (Fn) và đồng thời cung cấp dữ liệu ảnh khung hình ở thời điểm

trước (Fn-1) cho hệ thống overdrive Bộ điều khiển overdrive có chức năng cung cấp điện

áp tăng tốc cho mỗi điểm ảnh trên màn hình dựa trên thông tin ảnh khung hình hiện tại (Fn)

và ảnh khung hình ở thời điểm trước (Fn-1) Nguyên lý hoạt động của hệ thống overdrive

được mô tả chi tiết trong mục 2.2

Hình 1.2 Mô hình một hệ thống overdrive trong màn hình tinh thể lỏng [24]

Hiện nay các nhà sản xuất đang cần áp dụng các chuẩn định dạng Ti-vi độ phân giải

cao (High-Definition Television) và siêu cao (Ultra High-Definition Television) đối với

các thiết bị màn hình tinh thể lỏng, với tốc độ hiện thị khung hình lên mức 60fps đến

120fps Từ đó làm nảy sinh hai vấn đề sau đối với bộ nhớ khung hình:

(1) Yêu cầu dung lượng bộ nhớ tăng cao theo sự tăng trưởng số điểm ảnh trên màn

hình Mức 640×480×24bit  7.1Mb với chuẩn VGA, 3840×2160×24bit  189.8Mb với

chuẩn UHD 2160p (4K), và 7680×4320×24bit  759.4Mb với chuẩn UHD 4320p (8K)

(2) Yêu cầu băng thông ở mức rất cao, cụ thể với UHD 2160p (4K) áp dụng tốc độ

hiện thị khung hình 120fps sẽ là 3840×2160×24bit×120×2  44.5Gbit/s, hay UHD 4320p

(8K) với 120fps sẽ là 7680×4320×24bit×120×2  178Gbit/s

Với yêu cầu cao về dung lượng và tốc độ băng thông, sẽ đẩy giá thành của bộ nhớ

khung hình lên cao, góp phần làm tăng giá thành của sản phẩm màn hình tinh thể lỏng Từ

đó bài toán nén ảnh khung hình áp dụng vào trong hệ thống overdrive đã được đặt ra nhằm

mục đích thu nhỏ dung lượng dữ liệu ảnh khung hình trước khi nó được lưu trữ lên bộ nhớ

khung hình (frame memory), giúp giảm yêu cầu dung lượng đối với bộ nhớ khung hình,

Overdrive

(LUT)

Dữ liệu khung hình thời điểm trước, F n-1

Overdriven Frame

Dữ liệu khung hình hiện tại

F n

Frame memory

Dữ liệu khung hình

Trang 18

đồng thời cũng giúp giảm được yêu cầu băng thông đối với bộ nhớ khung hình khi lượng

dữ liệu mà nó cần trao đổi (ghi/đọc) trở nên ít đi vì đã được nén lại Khi yêu cầu về dung

lượng và băng thông đối với bộ nhớ khung hình được giảm xuống sẽ kéo theo sự cải thiện

về giá thành của sản phẩm màn hình tinh thể lỏng

Xuất phát từ yêu cầu thực tiễn trên, nhiều nghiên cứu đã được triển khai nhằm tìm ra

những giải pháp nén ảnh khung hình áp dụng phù hợp và hiệu quả trên hệ thống overdrive

của màn hình tinh thể lỏng Kết quả đã có khá nhiều các giải pháp nén ảnh khung hình cho

màn hình tinh thể lỏng được đề xuất qua các bài báo [[5], [9], [10], [11], [12], [13], [14],

[15], [17], [18], [19], [20], [21], [22], [24], [28]] Khi xem xét trong khoảng thời gian

những năm nghiên cứu đầu tiên của luận án (cuối năm 2009 đến đầu năm 2011), một số

giải pháp nén ảnh khung hình được đề xuất trong [[5], [19], [21]] là những giải pháp mới

được đề xuất, thể hiện được hiệu năng nén cao so với những giải pháp nén được đề xuất

trước đó trên một số tiêu chí như: tỷ số nén khá cao, chất lượng ảnh khá tốt, và độ phức tạp

tính toán không cao hay ở mức chấp nhận được Nhưng trải qua quá trình nghiên cứu phân

tích về mặt lý thuyết cũng như thực nghiệm, chúng tôi đã phát hiện ra nhiều khiếm khuyết

còn tồn tại trong các giải pháp nói trên về mặt chất lượng ảnh khôi phục cũng như độ phức

tạp tính toán Từ thực trạng đó, đã mở ra hướng nghiên cứu cải tiến một số giải pháp nén

ảnh khung hình cho màn hình tinh thể lỏng đã được các tác giả nước ngoài đề xuất, nhằm

nâng cao hiệu quả áp dụng vào hệ thống overdrive, hoặc tiến xa hơn sẽ nghiên cứu đề xuất

các giải pháp nén tiên tiến về mặt hiệu năng, nhằm mang lại hiệu quả cao khi áp dụng vào

hệ thống overdrive trong màn hình tinh thể lỏng

1.2 Tình hình nghiên cứu trên thế giới

Hiện nay, nhiều giải pháp nén ảnh khung hình khác nhau đã được đề xuất áp dụng cho

hệ thống overdriver trong màn hình tinh thể lỏng Từ giải pháp đơn giản chỉ áp dụng phép

biến đổi không gian màu và kỹ thuật mã hóa lượng tử BTC (block truncation coding) trong

[13] với tỷ số nén (compression ratio) CR = 3 đến 3.42 Cho đến các giải pháp nén có kiến

trúc phức tạp hơn, sử dụng phối hợp nhiều kỹ thuật biến đổi và lượng tử hóa khác nhau

nhằm tăng chất lượng ảnh khôi phục hay tỷ số nén, đã được đề xuất trong các bài báo [[9],

[10], [12], [14], [15], [17], [18], [20], [21], [24], [28]] Sau cùng, và cũng đáng được chú ý

hơn cả, là một số giải pháp nén có tỷ số nén cao đi cùng với chất lượng ảnh khôi phục khá

tốt, dựa trên mô hình kiến trúc khá đơn giản như đề xuất trong [19], hay không quá phức

tạp và có thể thực hiện được theo thời gian thực, như trong [5]

Nhìn chung, các giải pháp đã được đề xuất nói trên, đặc biệt là những giải pháp tiên

tiến về hiệu năng mới được đề xuất gần đây như Advanced Hybrid Image Codec (AHIC)

Trang 19

trong [19], Adaptive Multi-level Block Truncation Coding (AM-BTC) trong [21] hay

DWT-based Adaptive Mode Selection (DAMS) trong [5], đều là những giải pháp có nhiều

ưu điểm nổi trội khi so sánh với các giải pháp đã được đề xuất trước đó như: tỷ số nén cao,

chất lượng ảnh khôi phục khá tốt và độ phức tạp tính toán không cao (với AHIC và

AM-BTC) hay không quá cao (với DAMS) Mặc dù vậy, qua quá trình nghiên cứu và phân tích

thực nghiệm, chúng tôi nhận thấy các giải pháp này vẫn còn mắc phải một số nhược điểm

sau:

 Advanced Hybrid Image Codec (AHIC): Ảnh khôi phục dễ bị mắc phải hiện tượng

nhiễu khối (hay blocking effect), kỹ thuật lượng tử hóa chưa thật sự tối ưu, mô hình

kiến trúc thực thi còn nhiều điểm chưa thật sự hợp lý, và cuối cùng là khả năng thích

nghi theo sự thay đổi của tín hiệu ảnh chưa cao dẫn đến chất lượng ảnh khôi phục còn

rất thấp trong một số tình huống

 Adaptive Multi-level Block Truncation Coding (AM-BTC): Ảnh khôi phục có sai số

lớn ở thành phần độ chói Y (luminance) là thành phần nhạy cảm với mắt người Và hơn

thế nữa, trong một số tình huống khi quan sát trên một chuỗi các khung hình, sai số

trên ảnh khôi phục đã gây ra hiện tượng rung hình (vibrate effect) như nhìn qua một

đám lửa ở những vùng ảnh nhiều chi tiết và ít thay đổi Chính vì hiện tượng chập chờn

tác động lên vùng ảnh có ít sự thay đổi nên khuyết điểm này dễ dàng được nhận ra qua

quan sát bằng thị giác Nhược điểm này sẽ khiến cho giải pháp AM-BTC khó có thể

ứng dụng trên thực tiễn vì sẽ làm suy giảm chất lượng hiển thị hình ảnh trên màn hình

tinh thể lỏng, dù rằng những kết quả thực nghiệm đánh giá trên số đo PSNR của giải

pháp AM-BTC thường đạt kết quả khá cao

 DWT-based Adaptive Mode Selection (DAMS): Giải pháp này sử dụng một giá trị

ngưỡng (threshold) cố định đã làm hạn chế khả năng thích nghi của DAMS và là

nguyên nhân gây ra hiện tượng nhiễu khối ở thành phần màu (chroma) của ảnh khôi

phục và nhiều đốm trên các chi tiết đường nét Yêu cầu khá cao về độ phức tạp tính

toán khi sử dụng phép biến đổi wavelet 2-chiều với bộ lọc Daubechies 4/4 - hệ số, đòi

hỏi phải tính toán trên trường số thực Và cuối cùng là đa số phép lượng tử hóa trong

giải pháp này cũng yêu cầu xử lý trên trường số thực làm cho độ phức tạp tính toán

tăng cao

Sơ lược thực trạng trên cho thấy vấn đề nghiên cứu các giải pháp nén ảnh áp dụng vào

trong công nghệ màn hình tinh thể lỏng vẫn đang cần các nghiên cứu cải tiến và phát triển,

để ngày càng có được các giải pháp hoàn thiện hơn với hiệu năng cao hơn

Trang 20

1.3 Mục tiêu và phạm vi nghiên cứu của luận án

Mục tiêu của luận án là nghiên cứu phát triển các giải pháp tiên tiến nén dữ liệu ảnh

khung hình áp dụng cho màn hình tinh thể lỏng độ phân giải cao, trên cơ sở phân tích các

công trình đã có để đề xuất cải tiến cải thiện hiệu năng Nghiên cứu kế thừa và phát triển

đề xuất các giải pháp nén mới nâng cao hiệu năng so với những giải pháp hiện đã được đề

xuất

Theo một số các tiêu chí đánh giá hiệu năng nén gồm: chỉ số nén, chất lượng nén, và

độ phức tạp tính toán

Phạm vi nghiên cứu của luận án bao gồm:

1 Nghiên cứu phát triển các giải pháp nén ảnh áp dụng cho màn hình tinh thể lỏng độ

phân giải cao nhằm tăng cường hiệu năng nén

2 Nghiên cứu đề xuất cải tiến các giải pháp để khắc phục những nhược điểm còn tồn tại

trong một số giải pháp nén tiên tiến như AHIC, DAMS, nhằm nâng cao hiệu năng của

giải pháp nén về cải thiện chất lượng ảnh, giảm độ phức tạp tính toán

3 Nghiên cứu phân tích các ưu và nhược điểm của các giải pháp nén ảnh đã có Từ đó đề

xuất xây dựng các giải pháp nén mới thể hiện được nhiều ưu điểm vượt trội về chất

lượng ảnh, tỷ số nén, độ phức tạp tính toán hay sơ đồ thực hiện, có khả năng thích nghi

theo sự thay đổi của tín hiệu ảnh, tránh mắc phải các khuyết điểm về thị giác

1.4 Phương pháp nghiên cứu

- Xác định rõ mục tiêu và phạm vi nghiên cứu

- Phương pháp nghiên cứu kế thừa và phát triển trên cơ sở nghiên cứu phân tích tổng

quan các giải pháp đã đề xuất, cải tiến nâng cao hiệu năng và phát triển đề xuất giải

pháp mới

- Phương pháp nghiên cứu kết hợp giữa lý thuyết và nghiên cứu thực nghiệm cài đặt

chương trình kiểm chứng kết quả, biện luận và giải thích

1 Về nghiên cứu lý thuyết:

 Nghiên cứu cơ sở lý thuyết về tín hiệu ảnh và các phép biến đổi tín hiệu ảnh:

Kỹ thuật thay đổi tần số lấy mẫu của tín hiệu (Downsampling, Upsampling)

dùng kỹ thuật lọc số (Filter), chuyển đổi không gian màu (RGB, YCbCr), phép

biến đổi cosin rời rạc DCT (Discrete Cosine Transform), biến đổi sóng con rời

rạc DWT (Discrete Wavelet Transform), kỹ thuật Lifting

 Nghiên cứu cơ sở lý thuyết về lượng tử hóa và một số phương pháp lượng tử

như: Phương pháp tối ưu sai số trung bình bình phương hay lượng tử hóa

Trang 21

Lloyd-Max, phương pháp lượng tử hóa tối ưu với đầu vào có phân phối đều,

các phương pháp lượng tử hóa thích nghi

 Dùng một số độ đo đánh giá chất lượng nén: Độ đo sai số trung bình bình

phương MSE (Mean Squared Error), độ đo tỷ số tín hiệu mức đỉnh /nhiễu

PSNR (Peak Signal-to-Noise Ratio)

2 Về nghiên cứu thực nghiệm:

 Đã tiến hành cài đặt lập trình thực nghiệm trên môi trường máy tính PC cho hầu

hết các giải pháp nén tiên tiến được xem xét và đánh giá trong luận án

 Tạo lập môi trường thực nghiệm phù hợp với môi trường thực tế của bài toán

thông qua công cụ Simulink để có những quan sát trực quan và đưa ra những

đánh giá phù hợp với bài toán

 Thực nghiệm đo lường, thống kê số liệu tạo cơ sở cho các phân tích đánh giá

1.5 Ý nghĩa khoa học và thực tiễn của đề tài

Ý nghĩa khoa học của luận án được thể hiện trong đề xuất hai giải pháp tiên tiến nén

ảnh khung hình, nâng cao về hiệu năng nén nhằm áp dụng cho hệ thống màn hình tinh thể

lỏng, “Advanced Robust Adaptive Image Coding” và “Wavelet Lifting Transform base

Multi-Adaptive Image Coding”, tương ứng với hai hướng tiếp cận khác nhau mà luận án đã

thực hiện Đề xuất phát triển về kỹ thuật lượng tử hóa, kỹ thuật tối ưu hóa quá trình lượng

tử các khối ảnh thông qua giải pháp phân phối bit, những kỹ thuật mới được đề xuất này

không bị bó hẹp trong lĩnh vực nén ảnh khung hình cho màn hình tinh thể lỏng mà chúng

có khả năng áp dụng cho lĩnh vực nén ảnh nói chung

Ý nghĩa thực tiễn của luận án được thể hiện qua các giải pháp nén đề xuất hướng áp

dụng vào công nghệ màn hình tinh thể lỏng cho phép sản xuất thế hệ màn hình tinh thể

lỏng có độ phân giải cao, chất lượng hiển thị hình ảnh tốt với một giá thành thấp hơn Ví

dụ với chuẩn công nghệ màn hình UHD 8K (Ultra High Definition) Đến thời điểm này,

năm 2015, nhiều nhà sản xuất màn hình tinh thể lỏng trên thế giới đã cho ra đời thế hệ màn

hình chuẩn UHD 8K có độ phân giải 7680×4320 với tốc độ khung hình là 120fps (frames

per second), dẫn đến yêu cầu về tốc độ truy xuất dữ liệu bộ nhớ khung hình bị đẩy lên đến

mức 178 GB/s, một tốc độ quá cao so với nền tảng công nghệ sản xuất bộ nhớ DRAM hay

DDRAM hiện tại, khiến cho giá thành thiết kế bộ nhớ khung hình trở nên rất đắt đỏ Từ đó

vấn đề nén ảnh khung hình càng trở nên bức thiết hơn nhằm giảm tốc độ truy xuất dữ liệu

bộ nhớ, tiến đến hạ giá thành sản phẩm Để trong tương lai gần sản phẩm thật sự phù hợp

với túi tiền của đa số người tiêu dùng Giúp người tiêu dùng có cơ hội bắt kịp được với sự

chuyển mình của ngành công nghiệp sản xuất nội dung truyền hình và video, khi mà phần

Trang 22

lớn các hãng truyền thông và sản xuất nội dung video lớn trên thế giới, các hãng truyền

hình lớn trên các châu lục đã và đang bắt đầu quá trình chuyển đổi sang chuẩn UHD

Tóm lại, có thể khẳng định rằng đề tài của luận án này thật sự mang nhiều ý nghĩa

khoa học và thực tiễn

1.6 Bố cục luận án

Bố cục của luận án gồm 5 chương, ngoài hai chương MỞ ĐẦU và KẾT LUẬN, ba

chương còn lại tập trung vào trình bày lý thuyết tổng quan cũng những kết quả nghiên cứu

mà luận án đã đạt được, cụ thể:

Chương 2: Trình bày sơ lược về lịch sử phát triển của công nghệ màn hình tinh thể

lỏng và kỹ thuật tăng tốc overdrive giúp tăng tốc độ đáp ứng của các phần tử tinh thể lỏng

Một số cơ sở lý thuyết áp dụng trong bài toán nén ảnh khung hình Nghiên cứu tổng quan

về lĩnh vực nén ảnh khung hình trong hệ thống overdrive Phân tích và thực nghiệm nhằm

đánh giá ưu và nhược điểm của một số giải pháp nén ảnh tiên tiến đã được đề xuất áp dụng

cho màn hình tinh thể lỏng Trên cơ sở đó đưa ra một số định hướng nghiên cứu cải tiến

Chương 3: Nghiên cứu và phân tích sâu hơn các khuyết điểm trong một số giải pháp

nén ảnh tiên tiến sử dụng nền tảng cơ bản là các kỹ thuật mã hóa khối và biến đổi không

gian màu Từ đó đề xuất các kỹ thuật khắc phục áp dụng vào trong các sơ đồ giải pháp cải

tiến nhằm nâng cao hiệu năng nén Nghiên cứu đề xuất áp dụng lý thuyết phân phối bít vào

nén ảnh khung hình cùng một số kỹ thuật lượng tử hóa tối ưu, dựa vào đó từng bước nâng

cao chất lượng nén và giảm độ phức tạp tính toán qua từng giải pháp Kết quả đã đạt được

một số đề xuất cải tiến có tính kế thừa từng bước một nhằm nâng cao chất lượng ảnh hay

cải thiện độ phức tạp tính toán Sau cùng, luận án đã đi đến được một giải pháp nén ảnh

khung hình có tính tiên tiến về hiệu năng với tên gọi ARAIC, mang lại sự cải tiến vượt trội

về chất lượng ảnh, giảm độ phức tạp tính toán và sơ đồ kiến trúc thực thi có phần tinh gọn

Tất cả các đề xuất trong chương này đều được cài đặt thực nghiệm, phân tích, so sánh và

đánh giá

Chương 4: Nghiên cứu và phân tích các nhược điểm của giải pháp nén ảnh DAMS Từ

đó tìm kiếm giải pháp khắc phục thông qua các đề xuất như kỹ thuật ngưỡng thích nghi, kỹ

thuật biến đổi wavelet lifting integer to integer, và một số điều chỉnh về sơ đồ giải pháp

Trải qua hai giai đoạn nghiên cứu cải tiến và phát triển có tính kế thừa: Giai đoạn một luận

án đã đưa ra đề xuất cải tiến DAMS bằng cách tích hợp kỹ thuật ngưỡng thích nghi để hình

thành nên giải pháp DBMAIC cho khả năng thích nghi cao và mang lại chất lượng ảnh

vượt trội; Giai đoạn hai là cải thiện độ phức tạp tính toán của DBMAIC với kỹ thuật biến

đổi tín hiệu ảnh Wavelet Lifting Integer to Integer, cùng một số cải tiến về mặt lượng tử để

Trang 23

hình thành nên giải pháp WLT-MAIC Những phân tích và đánh giá cho thấy tính tiến tiến

của WLT-MAIC thể hiện qua hiệu năng vượt trội của nó so với giải pháp gốc DAMS

Trong chương này cũng đồng thời đưa ra các so sánh và đánh giá giữa hai hướng tiếp cận

trong luận án Tập trung một số phân tích và đánh giá so sánh trên hai kết quả tốt nhất của

hai hướng tiếp cận là ARAIC và WLT-MAIC, các so sánh và đánh giá nhằm thể hiện rõ

những ưu - khuyết điểm và đưa ra những nhận định hay khuyến nghị đối với nhà sản xuất

khi chọn lựa giải pháp Cuối cùng là phần so sánh đánh giá với 2 giải pháp nén tiên tiến nổi

bật nhất mới được đề xuất trên thế giới vào cuối giai đoạn nghiên cứu của luận án là LTC

[22] và SAMS [11]

Chương 5: Tóm tắt các nội dung nghiên cứu chính của luận án Trình bày cô đọng các

kết quả mới mà luận án đã đạt được, và cuối cùng là nêu lên hướng phát triển tiếp theo của

luận án

Trang 24

CHƯƠNG 2: TỔNG QUAN VỀ VẤN ĐỀ NÉN ẢNH CHO

MÀN HÌNH TINH THỂ LỎNG

Trong chương này luận án sẽ trình bày sơ lược về lịch sử phát triển của màn hình tinh

thể lỏng và kỹ thuật tăng tốc overdrive, vấn đề nén ảnh áp dụng cho hệ thống overdrive của

của màn hình tinh thể lỏng, mối tương quan giữa chất lượng nén và chất lượng ảnh hiển thị

trên màn hình, một số yêu cầu đặc trưng cho hệ thống nén ảnh trên màn hình tinh thể lỏng,

tổng quan về nén ảnh nhằm giảm bộ nhớ khung hình trong màn hình tinh thể lỏng Và sau

cùng là một số cơ sở lý thuyết có liên quan Kỹ thuật nén ảnh trình bày trong chương này

sẽ được giới hạn trong không gian hai chiều (chiều rộng và chiều cao)

2.1 Lịch sử phát triển của màn hình tinh thể lỏng và vấn đề chất

lượng hiện thị hình ảnh động

2.1.1 Lịch sử phát triển của màn hình tinh thể lỏng

Ngày nay, trong giai đoạn phát triển bùng nổ của các thiết bị kỹ thuật số thì màn hình

tinh thể lỏng trở nên quá gần gũi với chúng ta Chúng ta có thể thấy màn hình tinh thể lỏng

được lắp đặt trong khá nhiều thiết bị Từ đồng hồ kỹ thuật số, cho đến máy tính cá nhân,

điện thoại di động, ti-vi LCD và ti-vi LED trong các hộ gia đình, hay các thiết bị giải trí

đang rất thời thượng và được đông đảo giới trẻ đón nhận như máy tính bảng, máy đọc

sách,…v.v

Để có được sự phát triển và ứng dụng mãnh mẽ như ngày nay thì màn hình tinh thể

lỏng đã có một lịch sử phát triển lâu dài qua nhiều giai đoạn Mốc lịch sử đầu tiên phải kể

đến đó là và năm 1888, nhà thực vật học và hóa học người Áo, Friedrich Reinitzer, đã tìm

ra các phần tử tinh thể (liquid-crystal) trong chất béo được chiết xuất từ cà-rốt Đến năm

1962, nhà nghiên cứu Richard Williams đã tạo mẫu dạng sọc (stripe-patterns) trong một

lớp mỏng của vật liệu tinh thể lỏng bằng cách ứng dụng tác động điện áp lên các tinh thể

Hiệu ứng này được dựa trên sự tạo hình bất ổn định điện-thủy động lực

(electro-hydrodynamic instability forming) Năm 1958, Dr Glenn Brown là người viết bài báo đầu

tiên nghiên cứu về màn hình tinh thể lỏng ở Mỹ Giữa những năm 1964 và 1968, tại trung

tâm nghiên cứu RCA David Sarnoff ở Princeton, bang New Jersey của Mỹ, một nhóm các

kỹ sư và các nhà khoa học dẫn đầu bởi George Heilmeier với Louis Zanoni và Lucian

Barton, đã phát minh ra một phương pháp sử dụng điện áp để điều khiển ánh sáng phản xạ

từ các phần tử tinh thể lỏng, nó minh chứng cho màn hình tinh thể lỏng đầu tiên Công việc

Trang 25

của họ đã mở ra một ngành công nghiệp toàn cầu sản xuất hàng triệu màn hình tinh thể

lỏng từ đó đến nay

Màn hình tinh thể lỏng của Heilmeier sử dụng phương pháp tán xạ động mà ông gọi là

DSM (Dynamic Scattering Method), trong đó một vật mang điện được áp dụng để sắp xếp

lại các phân tử vì thế chúng có thể tán xạ ánh sáng Thiết kế DSM làm việc kém và đã

được chứng minh là quá tốn năng lượng Nó đã được thay thế bởi một phiên bản cải tiến,

sử dụng các tinh thể dạng xoắn hay còn gọi là các tinh thể nematic hoạt động hiệu quả hơn,

phát minh bởi James Fergason vào năm 1969 Nhà phát minh sáng chế James Fergason

nắm giữ một số bằng sáng chế cơ bản trong lĩnh vực màn hình tinh thể lỏng vào đầu những

năm 1970, bao gồm cả bằng sáng chế ở Mỹ có tính then chốt mang số hiệu US3,731,986

cho "Display Devices Utilizing Liquid Crystal Light Modulation" Năm 1972, Công ty

International Liquid Crystal (ILIXCO) thuộc sở hữu của James Fergason đã sản xuất đồng

hồ màn hình tinh thể lỏng hiện đại đầu tiên dựa trên bằng sáng chế của James Fergason

Đến năm 1973, Hãng Sharp đã sản xuất ra chiếc máy tính di động đầu tiên sử dụng màn

hình màn hình tinh thể lỏng theo công nghệ DSM (nguồn [4], [27])

Hình 2.1 Mô tả cấu tạo màn hình TFT-LCD

Năm 1979, Walter Spear và Peter LeComber đã tạo ra màn hình màu đầu tiên dùng

công nghệ TFT (Thin-Film Transistor) Năm 1985, Seiko-Epson công bố sản phẩm “TV

set” màu thương mại đầu tiên, nó có kích thước hiển thị là 2 inch Năm 1992, Sharp đã

phát triển thành công sản phẩm màn hình tinh thể lỏng kích thước 16.5 inch tương thích

với việc hiển thị hình ảnh đa phương tiện (multimedia-compatible) Năm 2004, hãng

Philips đã trưng bày một màn hình tinh thể lỏng 20 inch theo công nghệ hiện thị ba chiều

(3-D) tại hội chợ thương mại CeBIT ở Hannover nước Đức Năm 2005, hãng Sammung đã

phát triển màn hình lớn nhất thế giới lúc bấy giờ có kích thước 82 inch hiển thị theo chuẩn

định dạng có độ phân giải cao “Full HD” dùng công nghệ TFT Cho đến thời điểm hiện

nay, năm 2014, thì hầu hết các hãng sản xuất màn hình tinh thể lỏng lớn trên thế giới đều

đã cho ra đời các sản phẩm màn hình tinh thể lỏng độ phân giải UHD 4K, mặc dù hiện tại

Trang 26

giá thành của chúng còn rất đắt Và trong một tương lai không xa, các sản phẩm màn hình

tinh thể lỏng độ phân giải UHD 8K có thể sẽ trở nên phổ biến

2.1.2 Vấn đề chất lƣợng hiển thị hình ảnh động trên màn hình tinh thể lỏng

Như đã nói ở trên, màn hình tinh thể lỏng đã trở nên rất phổ biến trên thị trường thiết

bị giải trí gia dụng cũng như trong công nghiệp Tuy nhiên, điểm yếu của nó là hiện tượng

hiển thị không rõ nét, hay bị nhòe, đối với các cảnh động, được gọi là hiệu ứng

motion-blur, được minh họa qua Hình 2.2 Nguyên nhân là do các phần tử tinh thể lỏng đáp ứng lại

sự thay đổi độ sáng khi chuyển đổi từ khung hình trước sang khung hình sau với một tốc

độ chậm (slow response) Trong tình huống xấu nhất, các phần tử tinh thể xoắn nematic có

thể phải mất khoảng 67-84ms để hoàn thành việc chuyển đổi độ sáng [25], trong khi đó

theo chuẩn hiển thị hình ảnh chuyển động thì mỗi giây cần hiển thị tối thiểu 30 khung hình,

hay nói cách khác là tốc độ đáp ứng của các phần tử phải không vượt quá 33ms Để giải

quyết vấn đề trên, người ta đã từng nghiên cứu và phát triển các chất tinh thể lỏng mới có

thời gian đáp ứng nhanh hơn Tuy nhiên, rất đáng tiết là những kết quả mang lại không đủ

để cải thiện tốc độ đáp ứng chậm đối với các mức xám, vì vấn đề thời gian đáp ứng chậm

liên quan đến động lực của tinh thể (LC operation dynamics) [25] Một vài phương pháp

tiếp cận khác để giải quyết vấn đề tốc độ đáp ứng chậm là phát triển và hoàn thiện mô hình

tinh thể lỏng mới như “OCB” hay “MVA Driven by Oblique Electric Field” Tuy nhiên,

những mô hình mới này có yêu cầu khác biệt về thiết kế (design), xử lý (process), và

nguyên liệu Bởi vậy, chúng có một số bất lợi như ảnh hưởng đến hiệu năng hiển thị với lợi

nhuận và năng suất Do đó, những mô hình mới này vẫn không thành công trong việc

chuyển đổi thành các sản phẩm

Hình 2.2 Minh họa hiện tượng Motion-Blur trên màn hình tinh thể lỏng

Một hướng nghiên cứu khác có tính thực tiễn hơn nhằm giải quyết vấn đề trên đã được

K Nakanishi, S Takahashi, H Oura và các đồng nghiệp đề xuất trong [25] với tên gọi kỹ

thuật FFD (Feedforward Driving) Kỹ thuật này giúp cải thiện tốc độ đáp ứng của các phần

tử tinh thể xuống dưới 20ms, bằng cách ghép thêm vào hệ thống một mạch FFD trên nền

kiến trúc truyền thống của màn hình tinh thể lỏng sử dụng các tinh thể xoắn nematic Kỹ

thuật FFD có thể được mô ta qua Hình 2.3 Kỹ thuật FFD còn được biết đến với tên gọi

khác là kỹ thuật “overdrive” cho màn hình tinh thể lỏng

Illustration of Motion Blur

Trang 27

Hình 2.3 Sơ đồ khối của màn hình tinh thể lỏng 15inch XGA dùng kỹ thuật FFD [25]

2.2 Overdrive – một kỹ thuật tăng tốc độ đáp ứng cho các phần

tử tinh thể lỏng

Như đã đề cập ở phần trước, kỹ thuật overdrive giúp tăng tốc độ đáp ứng cho các phần

tử tinh thể Khả năng tăng tốc cho các phần tử tinh thể của overdrive dựa trên ý tưởng khá

đơn giản là: điện áp liên quan đến động lực chuyển động của các tinh thể, vì vậy điện áp

càng lớn thì tốc độ chuyển động càng cao, hay nói cách khác là các phần tử tinh thể sẽ đáp

ứng nhanh hơn khi điện áp được tăng lên Vì vậy hệ thống overdrive sẽ sinh ra một điện áp

hợp lý cao hơn mức điện áp vốn được áp dụng trong kỹ thuật cũ trước đây để cải thiện tốc

độ đáp ứng xuống mức dưới 20ms

Hình 2.4 Đồ thị độ chói - thời gian đáp ứng mô tả cách thức xác định điện áp tăng tốc

Hình 2.4 mô tả cách thức để xác định điện áp tăng tốc Giả sử rằng độ chói hiện tại

đang thể hiện tại một điểm ảnh (x,y) nào đó trên màn hình là 105 cd/m2

, và sang khung hình tiếp theo chúng ta cần giảm về mức 60 cd/m2, thì mức điện áp được áp dụng sẽ lần

lượt là 1.31V và 1.75V Dưới điều kiện điện áp thay đổi đơn giản từ 1.31V đến 1.75V thì

thời gian đáp ứng sẽ kéo dài đến 45ms Để hoàn thành việc chuyển đổi từ mức độ chói hiện

tại (105 cd/m2) sang mức độ chói kế tiếp (60 cd/m2) với ngưỡng thời gian đáp ứng mong

muốn là 16.7ms thì mức điện áp cần áp dụng phải tăng từ 1.75V lên mức 2.27V như trong

Hình 2.4 Và Bảng 2.1 cho phép chúng ta xác định được mức điện áp tăng tốc cần phải áp

Trang 28

dụng để chuyển đổi từ một trong các mức độ chói hiện tại sang mức độ chói tiếp theo ở

mức 60cd/m2 với thời gian đáp ứng là 16.7ms (nguồn [25])

Bảng 2.1 Điện áp tăng tốc áp dụng để chuyển đổi từ mức độ chói hiện tại sang mức

độ chói tiếp theo ở mức 60cd/m 2

với thời gian đáp ứng 16.7ms (nguồn [25])

Độ chói hiện tại [cd/m2

Từ đó chúng ta thấy rằng kỹ thuật overdrive được thực hiện dựa vào một bảng tra

(Lookup Table) được chứa trong ROM (xem Hình 2.3) nhằm xác định ra mức điện áp tăng

tốc cần áp dụng trên một điểm ảnh, dựa vào cặp giá trị mức chói của điểm ảnh đó trong

quá khứ và hiện tại, với thời gian chuyển đổi trong ngưỡng 16.7ms Khái niệm overdrive

được minh họa một cách khái quát và trực quan hơn qua Hình 2.5 dưới đây:

Hình 2.5 Minh họa giải pháp tăng tốc độ chuyển đổi mức xám (hay độ chói) thông

qua cơ chế hiệu chỉnh tăng ngưỡng điện áp

Hình 2.6 So sánh thời gian đáp ứng (nguồn [25]) (a) Kỹ thuật điều khiển (dẫn động)

thông thường (b) Kỹ thuật overdrive

Hình 2.6 cho thấy khả năng cải thiện thời gian chuyển đổi mức sáng trên màn hình

tinh thể lỏng khi áp dụng kỹ thuật tăng tốc overdrive (hình (b)) so với khi không áp dụng

Trang 29

kỹ thuật tăng tốc overdrive (hình (a)) Dễ thấy là thời gian chuyển đổi giữa hai mức sáng

bất kỳ đã được cải thiện xuống dưới mức 16.7ms

2.3 Mô hình hệ thống Overdrive và yêu cầu nén ảnh giảm bộ nhớ

khung hình

2.3.1 Mô hình hệ thống overdrive

Kỹ thuật overdrive có thể được áp dụng trên các hệ thống màn hình tinh thể lỏng với

mô hình đơn giản thể hiện qua Hình 1.2 (trang 2) Có thể mô tả hoạt động của hệ thống

overdrive đơn giản như sau: Khi giá trị một điểm ảnh trong khung hình hiện tại (Fn) được

chuyển đến thì nó cần tham chiếu đến giá trị cũng của điểm ảnh đó nhưng trong khung

hình thời điểm trước đó (Fn-1) được lưu trữ trong bộ nhớ khung hình (Frame Memory), sử

dụng cặp giá trị này làm chìa khóa tìm kiếm trong một bảng tra (Lookup table), để cho ra

kết quả là giá trị hiệu điện thế tăng tốc cần áp dụng lên phần tử tinh thể tại điểm ảnh đang

xét để tăng tốc độ đáp ứng của nó, giúp cho điểm ảnh hiển thị chính xác trong khoảng thời

gian chuyển đổi ngắn

Với sự ra đời của các chuẩn định dạng truyền hình và video độ phân giải cao (HD) và

siêu cao (UHD) đã đẩy yêu cầu về dung lượng bộ nhớ lưu trữ khung hình tăng lên mức cao

hay rất cao, cùng với yêu cầu về băng thông bộ nhớ cũng tăng vọt theo sự tăng trưởng của

độ phân giải và khả năng hiển thị khung hình với tốc độ cao của thiết bị màn hình Bảng

2.2 thể hiện yêu cầu về dung lượng và băng thông của bộ nhớ dùng trong màn hình tinh thể

lỏng, theo các chuẩn định dạng HD 720p/1080p hay UHD 4K/8K khi thiết kế tốc độ hiển

thị khung hình ở các mức 30, 60 hay 120 khung hình trên một giây

Bảng 2.2 Yêu cầu dung lượng và tốc độ truyền tải dữ liệu của bộ nhớ khung hình trên

Ti-vi chuẩn HD và UHD

(Mbit)

Băng thông (Gbit/s)

Trang 30

Trong hệ thống overdrive hoạt động ở tốc độ 120 khung hình một giây, thì sẽ cần 120

lần ghi dữ liệu ảnh khung hình vào bộ nhớ và 120 lần đọc dữ liệu ảnh khung hình từ bộ

nhớ một cách đồng bộ Vậy tổng số dữ liệu trao đổi với bộ nhớ trong một giây là:

(120+120) * Dung lượng dữ liệu ảnh khung hình Từ đó cho chúng ta công thức tính yêu

cầu dung lượng và băng thông đối với bộ nhớ khung hình cho bảng trên là: Yêu cầu dung

lượng: (Số cột × Số dòng) × 24bit; Yêu cầu băng thông: (Tốc độ khung hình × 2) × Yêu cầu

dung lượng Ví dụ với UHD 4320p /120fps (8K): Yêu cầu dung lượng =

Thông thường bộ nhớ khung hình được thiết kế bởi bộ nhớ DRAM [25][18], mà giá

thành của DRAM lại phụ thuộc vào dung lượng và tốc độ trao đổi dữ liệu [18] Khi yêu

cầu về dung lượng và tốc độ trao đổi dữ liệu của bộ nhớ DRAM bị đẩy lên cao đã làm tăng

giá thành của sản phẩm màn hình Điều đó làm nảy sinh nhu cầu áp dụng kỹ thuật nén ảnh

khung hình vào hệ thống overdrive để giảm yêu cầu về dung lượng và tốc độ trao đổi dữ

liệu của bộ nhớ DRAM, tiến đến giảm giá thành của sản phẩm màn hình tinh thể lỏng

2.3.2 Vấn đề yêu cầu nén ảnh khung hình cho màn hình tinh thể lỏng

Hình 2.7 Mô hình một hệ thống overdrive có sử dụng kỹ thuật nén ảnh nhằm giảm yêu

cầu về dung lượng và tốc độ truy xuất dữ liệu của bộ nhớ khung hình

Mô hình của một hệ thống overdrive trong màn hình tinh thể lỏng có sử dụng kỹ thuật

nén ảnh nhằm giảm yêu cầu về dung lượng và tốc độ trao đổi dữ liệu của bộ nhớ khung

hình được thể hiện qua Hình 2.7 Trong đó, dữ liệu của ảnh khung hình hiện tại (Fn) được

nén lại bởi bộ nén (frame encoder) để giảm dung lượng trước khi chuyển vào frame

memory, đồng thời bộ giải nén (frame decoder) sẽ đọc dữ liệu nén trong frame memory để

Overdrive

(LUT)

Dữ liệu khôi phục của khung hình thời điểm trước

Overdriven Frame

Dữ liệu khung hình hiện tại

Fn

Frame memory

Dữ liệu khung hình

Frame encoder

Frame decoder

𝐹 𝑛−1Codec module

Trang 31

khôi phục lại dữ liệu ảnh khung hình ở thời điểm trước đó (Fn-1) cung cấp cho bộ

overdrive, nhằm phối hợp với dữ liệu của ảnh khung hình hiện tại để tìm ra điện áp tăng

tốc

Hình 2.8 thể hiện phạm vi áp dụng của bài toán nén ảnh khung hình cho màn hình

tinh thể lỏng là ở khâu tái tạo và hiển thị

Hình 2.8 Phạm vi áp dụng của bài toán nén ảnh khung hình cho màn hình tinh thể

lỏng độ phân giải cao

Ở đây có một số khái niệm cần làm rõ:

+ Ảnh khung hình trong hệ thống overdrive, chính là một ảnh để có thể hiện thị đầy đủ

trên màn hình tinh thể lỏng, có số điểm ảnh tương ứng với độ phân giải màn hình được xác

định bởi nhà sản xuất Do đó ảnh khung hình của màn hình tinh thể lỏng độ phân giải cao

sẽ có số điểm ảnh rất lớn, và đòi hỏi cao về dung lượng frame memory để lưu trữ

+ Tốc độ hiển thị khung hình của màn hình tinh thể lỏng được xác định bởi nhà sản

xuất chứ không phụ thuộc vào định dạng video cần hiển thị Hiện nay hầu hết các nhà sản

xuất đều đã cho ra đời các sản phẩm màn hình có tốc độ khung hình là 120fps, độ phân giải

siêu cao (4K đến 8K), các sản phẩm này thường có bộ chuyển đổi cho phép chuyển đổi độ

phân giải và tốc độ khung hình của nguồn dữ liệu đầu vào cho phù hợp với các thông số

của màn hình trước khi được chuyển đến hệ thống hiện thị

Vấn đề đặt ra cho bài toán nén ảnh khung hình cho màn hình tinh thể lỏng độ phân

giải cao là:

- Đầu vào là ảnh khung hình có độ phân giải cao, với rất nhiều điểm ảnh cần xử lý

- Đầu ra để phục vụ cho khâu hiện thị ảnh trên màn hình

tinh thể lỏng phục vụ cho khâu

tái tạo và hiển thị

Áp dụng các chuẩn nén ảnh/video thông dụng: JPEG, MPEG, AVI,

Trang 32

- Bộ nén (codec) phải thực hiện đồng thời hai nhiệm vụ nén dữ liệu (encode) và giải nén

dữ liệu (decode) với khối lượng dữ liệu lớn trong một khoảng thời gian ngắn, ví dụ với

màn hình có tốc độ 120fps thì khoảng thời gian chỉ ở mức 1/120 giây Vì vậy bộ nén

phải đảm bảo tốc độ xử lý cao

- Chất lượng ảnh phải cao để đảm bảo độ trung thực cho hệ thống hiển thị

- Tỷ số nén lớn và độ phức tạp tính toán không cao để đảm bảo tính thực tiễn khi triển

khai áp dụng thực tiễn

Với những yêu cầu trên, có thể thấy giải quyết bài toán nén ảnh khung hình cho màn

hình tinh thể lỏng độ phân giải cao là một nhiệm vụ không đơn giản Cần có những nghiên

cứu để có thể đưa ra được các giải pháp nén phù hợp với những yêu cầu nói trên Để có thể

triển khai áp dụng vào thực tiễn nhằm giảm giá thành cho hệ thống overdrive

2.3.3 Các đặc trưng của phương pháp nén ảnh áp dụng cho hệ thống

Overdrive

Từ bối cảnh thực tế của bài toán nén ảnh khung hình và mô hình hệ thống overdrive có

áp dụng các khối nén và giải nén ở trên, có thể rút ra một số đặt trưng của phương pháp

nén ảnh áp dụng cho hệ thống Overdrive như sau:

1 Bài toán nén ảnh khung hình trong màn hình tinh thể lỏng là nhằm mục đích giảm

yêu cầu về dung lượng và tốc độ trao đổi dữ liệu (hay băng thông) của bộ nhớ

khung hình trong hệ thống overdrive, giúp giảm giá thành chế tạo hệ thống

overdrive tiến đến giảm giá thành sản phẩm Khác với phần lớn các phương pháp

nén ảnh hay video thông thường vốn nhằm mục đích giảm dung lượng lưu trữ trên

các thiết bị nhớ hoặc giảm băng thông trên đường truyền mạng

2 Tỷ số nén đạt được phải có tính ổn định, ví dụ Cr = 2, 3, 4, hay 6, để các nhà sản

xuất có thể xác định được chính xác thông số cần chế tạo Đây cũng là điểm khác

biệt so với các phương pháp nén ảnh thông thường nhằm giảm dung lượng lưu trữ

như chuẩn JPEG hay JPEG2000, với tỷ số nén phụ thuộc phần lớn vào nội dung

của ảnh và mức độ tổn hao mà người dùng chọn lựa

3 Sự tổn hao do nén phải ở mức thấp để giảm thiểu ảnh hưởng (gián tiếp qua hệ

thống overdrive) đến chất lượng hiện thị hình ảnh trên màn hình Từ đó yêu cầu

đặt ra cho các giải pháp nén ảnh khung hình là chất lượng ảnh khôi phục phải cao

Đồng thời hình ảnh hiện thị trên màn hình phải đảm bảo tính trung thực về thị giác

trong bối cảnh các hình ảnh được hiển thị liên tục (60fps hay 120fps), tránh hay

giảm thiểu các hiện tượng nhiễu (noise), rung (vibrate effect), khối (blocking

effect) vốn rất nhạy cảm với mắt người xem khi quan sát chuỗi hình ảnh liên tục

Đây là điểm khác biệt so với các chuẩn nén ảnh JPEG hay JPEG2000 Bối cảnh áp

dụng thông thường của JPEG hay JPEG2000 là nén các bức ảnh rời rạc (không thể

hiện tính liên tục của chuyển động như trong video), các hình ảnh giải nén sau đó

thường được in ấn hay hiển thị rời rạc, do đó một số khiếm khuyết về đường nét

chi tiết trên ảnh nén cũng khó được người xem nhận ra khi quan sát thông thường

Trang 33

Đây chính là một trong các yêu tố giúp những chuẩn nén ảnh như JPEG hay

JPEG2000 nâng tỷ số nén lên rất cao, đổi lại bằng sự suy giảm chất lượng ảnh khôi

phục, nhưng vẫn dễ dàng nhận được sự chấp nhận của người dùng

4 Đảm bảo khả năng thực hiện theo thời gian thực (real time), hay nói cách khác là

tốc độ xử lý phải đảm bảo sự đồng bộ giữa các bộ phận trong hệ thống overdrive

theo đúng tốc độ được đặt ra cho toàn bộ hệ thống Đồng thời yêu cầu độ phức tạp

tính toán và kiến trúc thực thi cho giải pháp phải ở mức chấp nhận được theo

nghĩa: không yêu cầu một kiến trúc phần cứng cồng kềnh phức tạp, năng lực xử lý

mạnh (High-Powered Processors), vì như thế sẽ làm cho giá thành của hệ thống

overdrive tăng lên, làm giảm hay mất đi tính khả thi về mặt kinh tế Đây cũng là

điểm khác biệt so với các giải pháp nén ảnh thông thường, vốn chỉ nén các bức ảnh

rời rạc để lưu trữ nên chủ yếu đặt nặng vấn đề tỷ số nén, không đòi hỏi quá cao về

mặt tốc độ, và có thể chấp nhận các thuật toán khá phức tạp vì không đòi hỏi sự

đồng bộ khắc khe

2.4 Mô hình hệ thống nén ảnh dùng cho hệ thống overdrive

2.4.1 Hệ thống nén ảnh khung hình

Từ các đặc trưng của giải pháp nén ảnh áp dụng cho hệ thống overdrive là phải có tỷ

số nén ổn định, theo nghĩa phải đạt được tỷ số nén luôn nhỏ hơn hoặc bằng một hằng số

Và hơn thế nữa là một tỷ số nén cao nhằm tối đa hóa hiệu xuất cải thiện dung lượng bộ nhớ

và băng thông, vì vậy các giải pháp nén ảnh đề xuất áp dụng cho hệ thống overdrive nói

chung đều ở dạng có mất mát thông tin (lossy) hoặc mất mát rất ít thông tin (near-lossless),

thường áp dụng kỹ thuật mã hóa với độ dài từ mã cố định (Fixed-Length Codeword) để

luôn đạt được một tỷ số nén ở mức đáng kể và có tính ổn định, có thể áp dụng lên phần

cứng (hardware)

Dựa trên mô hình áp dụng cho các giải pháp nén ảnh trong truyền thông nói chung với

ba thành phần chính gồm: Biến đổi, Lƣợng tử hóa, và Mã hóa (Hình 2.9) Cùng với sự

phân tích các đặc trưng riêng mà một giải pháp nén áp dụng cho hệ thống overdrive cần có

Chúng tôi đề nghị mô hình khái quát chung với ít nhiều chi tiết dễ hiểu cho giải pháp nén

ảnh áp dụng vào hệ thống overdrive như thể hiện trong Hình 2.10 sau đây:

Hình 2.9 Mô hình với ba thành phần chính trong một hệ thống nén ảnh áp dụng trong

Lượng tử hóa (Quantization)

Mã hóa (Encode)

Dữ liệu nén (Data coded)

Trang 34

Hình 2.10 Mô hình khái quát với bốn thành phần chính trong một hệ thống nén ảnh

áp dụng cho overdrive trong màn hình tinh thể lỏng

Về mặt nguyên lý, mô hình chung giải pháp nén ảnh áp dụng cho hệ thống overdrive

trong màn hình tinh thể lỏng sử dụng ba thành phần chính như đã nêu trong mô hình chung

của giải pháp nén cho truyền thông Tuy nhiên có một số điểm khác sau:

- Mã hóa: có hai kỹ thuật mã hóa chính là gán từ mã có cùng độ dài (uniform-length hay

fixed-length) vốn rất đơn giản và sẽ cho ra một tỷ số nén cố định và gán từ mã với độ

dài biến đổi (variable-length) dựa trên số liệu thống kê hay độ đo entropy của thông tin

với độ phức tạp tính toán khá cao và không đảm bảo một tỷ số nén ổn định cần thiết

cho mô hình nén trong hệ thống overdrive Qua nghiên cứu các giải pháp nén ảnh cho

màn hình tinh thể lỏng đã được đề xuất, tất cả đều sử dụng kỹ thuật gán từ mã cố định

Đó chính là lý do cho đề xuất chỉ sử dụng dạng uniform-length codeword assignment

trong luận án này

- Bộ đệm dòng: để nhấn mạnh số dòng cần tích lũy (không thể là toàn bộ bức ảnh) trước

khi thực hiện các công đoạn biến đổi hay lượng tử, được xem xét như một phần của sự

phức tạp trong kiến trúc thực thi của giải pháp nén

Một số tính chất sau cũng cần được đảm bảo khi nghiên cứu đề xuất một giải pháp nén

ảnh cho hệ thống ovedrive trong màn hình tinh thể lỏng:

 Các phép biến đổi và lượng tử hóa xử lý với dữ liệu đầu vào là các dòng ảnh (line

image) hoặc khối ảnh (block image), và việc lựa chọn kích thước của dòng ảnh hay

khối ảnh luôn cần được cân nhắc và đánh giá, bởi ngoài mối liên hệ đến chất lượng

và tỷ số nén nó còn liên quan đến kích thước bộ đệm dòng (N-line buffer), vốn

được thiết kế bởi SRAM nhằm đảm bảo tốc độ liên kết giữa memory (cache) và bộ

xử lý ảnh được đồng bộ Vì vậy việc xem xét đánh giá hay nghiên cứu đề xuất các

giải pháp nén ảnh cho overdrive rất cần xem xét đến yếu tố kích thước bộ đệm

dòng như là một phần chủ đề của sự phức tạp cho phần cứng

 Để tăng hiệu quả của giải pháp nén ảnh, thông thường người ta có xu hướng sử

dụng kết hợp một vài phép biến đổi với nhau, song trong lựa chọn này nhất thiết

phải chú ý đến độ phức tạp tính toán và khả năng thực hiện thời gian thực

 Việc chọn lựa giải pháp mã hóa cũng cần có chú ý tương tự Để đảm bảo độ phức

tạp tính toán chung của cả giải pháp nén, và khả năng thực hiện thời gian thực

Như đã được đề cập ở trên, rõ ràng phương pháp nén ảnh áp dụng cho hệ thống

overdrive có những đặc trưng riêng, chuyên biệt cho bài toán nén nhằm giảm dung lượng

Biến đổi (Transformation)

Lượng tử hóa (Quantization)

vào cho LCD

(dạng tuần tự)

Bộ đệm dòng (N-Line buffer)

Gán từ mã có cùng độ dài (Uniform-Length Codeword Assignment )

Dữ liệu nén (Data coded)

Trang 35

cũng như tốc độ truyền tải dữ liệu của bộ nhớ khung hình Trong phần tiếp theo luận án sẽ

trình bày chi tiết về một số độ đo hiệu năng giải pháp nén ảnh khung hình làm công cụ cho

việc xem xét và đánh giá các giải pháp nén ảnh khung hình

2.4.2 Các độ đo hiệu năng giải pháp nén ảnh khung hình

2.4.2.1 Tỷ số nén

Tỷ số nén ảnh là một số đo dung lượng (DL) của ảnh gốc (ảnh chưa nén) chia cho

dung lượng ảnh đã được nén (hay mã hóa) và được kí hiệu là Cr (Compression Ratio):

Đối với phần lớn các giải pháp nén ảnh cho màn hình tinh thể lỏng sử dụng phương

pháp mã hóa khối ảnh, có nghĩa là ảnh được chia ra theo các khối bằng nhau rồi lần lượt

mã hóa từng khối theo thứ tự, với đầu vào bằng nhau sẽ luôn tạo đầu ra là dòng bit dữ liệu

đã được mã hóa có kích thước giống nhau, vì thế tỷ số nén còn được tính bởi công thức:

( 𝑛 𝑛) ( 𝑛 𝑛) (2.1 c)

Ví dụ: Trên một ti-vi LCD chuẩn full HD, thì ảnh khung hình của nó sẽ là một ảnh

màu có kích thước 1920×1080 với 3 kênh màu RGB-24bit Khi được áp dụng giải pháp

nén theo khối với kích thước khối là 32×4 sẽ được chia ra làm 16200 khối Giả sử mỗi khối

đầu vào sẽ được nén lại với 512bit dữ liệu mã hóa, thì tỷ số nén sẽ được tính là:

( ) ( ) Trong một số trường hợp, khi mà kích thước của ảnh khung hình không phải là bội số

của kích thước khối ảnh (block), thì người ta thường sử dụng phương án bổ sung thêm các

dòng ảnh hoặc cột ảnh (hoặc cả hai) để sau đó ảnh có thể chia thành các khối đồng kích

thước

2.4.2.2 Chất lƣợng nén - Các độ đo sai số

Để đánh giá sự khác biệt của ảnh khôi phục sau khi nén so với ảnh gốc qua một đại

lượng đo lường thể hiện bằng một con số, giúp dễ dàng đánh giá và so sánh đối chiếu,

người ta thường sử dụng một số độ đo sau:

 Sai số trung bình bình phương (Mean Squared Error -MSE)

 Tỷ số tín hiệu mức đỉnh /nhiễu (Peak Signal-to-Noise Ratio - PSNR)

Gọi 𝐹 và 𝐹 lần lượt là các ma trận dữ liệu ảnh gốc và dữ liệu ảnh khôi phục sau khi

nén Trong không gian màu RGB ảnh được biểu diễn bởi ba ảnh đơn sắc tương ứng với ba

thành phần màu Red, Green và Blue, vì vậy 𝐹 (𝐹 𝐹 𝐹 ) và 𝐹 (𝐹 𝐹 𝐹 ) trong đó

Trang 36

mỗi thành phần là một ma trận hai chiều có kích thước M dòng và N cột tương ứng với

kích thước của ảnh Gọi L là giá trị mức đỉnh của tín hiệu ảnh, với ảnh màu RGB-24bit hay

8bit cho mỗi kênh màu thì L = 28 – 1 = 255 Các độ đo MSE và PSNR cho mỗi thành phần

ảnh đơn sắc cũng như ảnh màu RGB được tính theo các công thức sau:

( ∑ ∑ (𝐹 ( 𝑛) − 𝐹 ( 𝑛))

( ) (2.5) (

Trong hai độ đo trên, độ đo PSNR được sử dụng phổ biến hơn cả trong lĩnh vực nén

ảnh nhờ tính dễ hiểu và dễ so sánh hợp lý của nó so với MSE Có thể nói độ đo PSNR

được sử dụng trong hầu hết các đánh giá khoa học về chất lượng nén ảnh Có thể lý giải

điều này qua đồ thị biến thiên của PSNR theo MSE như Hình 2.11 dưới đây:

Hình 2.11 Đồ thị biến thiên của PSNR theo MSE (với L=255)

Có thể nói PSNR chính là một phiên bản đảo chiều của MSE và kéo giãn những giá trị

MSE rất bé (hay ứng với ảnh nén chất lượng cao, hình đẹp) ra trên một khoảng rộng để dễ

bề so sánh đánh giá, và ngược lại những giá trị MSE lớn (hay ứng với ảnh nén chất lượng

0 20 40 60 80 100

Trang 37

thấp, hình xấu) sẽ được nén lại trên một khoảng hẹp Theo các chuyên gia, với thang đo

PSNR thì ảnh khoảng từ 30dB trở lên có thể xem là có chất lượng; dưới 30dB, chất lượng

tương đối thấp

2.4.3 Mối tương quan giữa chất lượng nén và chất lượng ảnh hiển thị trên

màn hình tinh thể lỏng

Để thấy được sự tác động của những sai số khi nén ảnh lên chất lượng hình ảnh hiển

thị trên màn hình tinh thể lỏng chúng ta hãy xem xét trên một thành phần tín hiệu màu R

trong 3 tín hiệu màu RGB của ảnh, và tại thời gian t Với ký hiệu dữ liệu hình ảnh tại thời

điểm t và (t-1) ứng với thành phần màu R là các ma trận dữ liệu được biểu diễn dưới dạng

hàm tín hiệu số ( 𝑛) và ( 𝑛), trong đó m và n xác định tọa độ của điểm ảnh

trên khung hình, và R xác định thành phần màu Theo cơ chế hoạt động của hệ thống

overdrive có áp dụng kỹ thuật nén ảnh (Hình 2.7), thì ảnh khung hình tại thời điểm (t-1) là

( 𝑛) được nén (tất nhiên là cùng với các kênh màu còn lại) rồi ghi lên vùng bộ nhớ

khung hình, và đến thời điểm t sẽ thực hiện giải nén để thu được ̂ ( 𝑛) Mối liên hệ

giữa ( 𝑛) và ̂ ( 𝑛) được xác định qua công thức:

̂ ( 𝑛) ( 𝑛) ( 𝑛) (2.10) với ( 𝑛) là sai số phát sinh do mã hóa trên thành phần màu R của ảnh

Xét tại một điểm ảnh ( 𝑛 ) bất kỳ trên màn hình trên kênh màu R Đến thời điểm t

điểm ảnh này cần phải chuyển đổi từ mức ( 𝑛 ) lên mức ( 𝑛 ) Vậy giá trị

chênh lệch để tham chiếu tăng ngưỡng điện áp sẽ là:

( 𝑛 ) ( 𝑛 ) − ( 𝑛 ) (2.11) Nhưng trên thực tế, hệ thống sẽ hoạt động theo cơ chế tham chiếu bộ nhớ nên sẽ chỉ có

được giá trị khôi phục ̂ ( 𝑛 ), và nó sẽ điều khiển để chuyển đổi từ mức

̂ ( 𝑛 ) lên mức ( 𝑛 ), giá trị chênh lệch tham chiếu để tăng áp là:

( 𝑛 ) ( 𝑛 ) − ̂ ( 𝑛 ) (2.12) Giá trị xác định theo công thức (2.12) sẽ là cơ sở để tham chiếu đến ngưỡng

điện áp tăng tốc

Từ (2.10), (2.11) và (2.12) chúng ta có:

( 𝑛 ) ( 𝑛 ) − ( 𝑛 ) (2.13)

Rõ ràng:

Trang 38

 Nếu ( 𝑛 ) : thì độ chênh lệch tham chiếu để điều khiển tăng tốc sẽ là

( 𝑛 ) ( 𝑛 ), là một giá trị chính nên màn hình sẽ được

điều khiển tăng áp chính xác Dẫn đến hiển thị điểm ảnh chuẩn xác

 Nếu ( 𝑛 ) : thì độ chênh lệch tham chiếu để điều khiển tăng tốc

sẽ là ( 𝑛 ) ( 𝑛 ) − , là một giá trị sai lệch nên tất yếu

sẽ dẫn đến điện áp tham chiếu sai lệch, làm cho điểm ảnh trên màn hình không hiển

thị chính xác giá trị điểm ảnh ( 𝑛 ) như mong muốn

Từ đó chúng ta có thể kết luận rằng, mọi khác biệt giữa ảnh gốc và ảnh khôi phục (hay

chính là sai số mã hóa) sẽ tác động gián tiếp lên hình ảnh hiển thị trên màn hình tinh thể

lỏng thông qua hệ thống overdrive, và nó làm suy giảm chất lượng hình ảnh hiển thị trên

màn hình Sự suy giảm này sẽ tác động trực tiếp lên cảm nhận của người xem thông qua thị

giác, vì vậy chúng ta cần xem xét chất lượng nén không chỉ qua các đại lượng đo lường

như MSE hay PSNR mà còn phải xem xét đến các hiện tượng mà ảnh nén có thể mắc phải

như hiệu ứng nhiễu khối (blocking effect), hiện tượng rung động (vibration) tại một cường

độ mức xám cố định, hay hiện tượng các đường nét có tính giả tạo (false contours) vốn

không được xem xét đánh giá đúng mức trong các đại lượng đo lường MSE hay PSNR

2.4.4 Một số yêu cầu đặc trƣng và tiêu chí đánh giá hệ thống nén ảnh cho

1 Đảm bảo tỷ số nén cố định: giải pháp nén phải đạt được tỷ số nén có cố định, để từ

đó xác định được chính xác dung lượng bộ nhớ cần thiết kế cho hệ thống ovedrive

Bởi vậy phương pháp nén dữ liệu ảnh cho màn hình tinh thể lỏng thường dùng mã

hóa với từ mã có độ dài cố định (fixed-length/uniform-length codeword)

2 Độ phức tạp tính toán hay kiến trúc thực thi ở mức chấp nhận đƣợc và đảm

bảo xử lý thời gian thực: độ phức tạp tính toán (hay kiến trúc thực thi) của giải

pháp nén phải ở một mức độ vừa phải xem xét trong mối liên hệ với tỷ số nén và

chất lượng ảnh đạt được Bởi nếu độ phức tạp tính toán quá cao sẽ đòi hỏi phải được

xử lý bởi các bộ xử lý mạnh (High-Powered Processors), mà một bộ xử lý như vậy

sẽ có giá thành cao, làm cho bài toán mất tính khả thi về mặt kinh tế Theo các nhận

định của chuyên gia, để đảm bảo khả năng thực thi theo thời gian thực một cách

Trang 39

giản tiện, thì thuật toán xử lý nên ở dạng tuyến tính, tránh sử dụng các phương pháp

lặp với số lần không xác định hay số bước lặp lớn

3 Chất lượng ảnh cao - Hạn chế các hiệu ứng tiêu cực về mặt thị giác: Chất lượng

ảnh khôi phục phải ở mức cao để tránh hiện tượng hệ thống overdrive hoạt động quá

sai lệch làm ảnh hưởng lớn đến chất lượng hình ảnh hiển thị trên màn hình, sẽ khiến

sản phẩm khó được người tiêu dùng chấp nhận Chất lượng ảnh khôi phục không chỉ

phải đạt chất lượng cao theo các thang đo chất lượng ảnh như MSE hay PSNR, mà

còn phải hạn chế được các hiệu ứng tiêu cực về mặt thị giác như hiệu ứng nhiễu

khối (blocking effect), hiện tượng rung động hay lay động (vibration effect) của

vùng ảnh không hoặc rất ít thay đổi, hay hiện tượng giả tạo (false contours) các

đường nét trong ảnh Các hiệu ứng tiêu cực này tuy không làm suy giảm đáng kể

chất lượng ảnh khi đánh giá theo các độ đo MSE hay PSNR, song chúng lại mang

lại cảm giác khó chịu khi quan sát bằng thị giác một khi nó tác động lên hình ảnh

hiển thị trên màn hình tinh thể lỏng thông qua cơ chế overdrive, khiến người tiêu

dùng khó có thể chấp nhận Trong luận án này, một vài tiêu chuẩn khách quan

(objective) có thể gắn với tiêu chuẩn thị giác chủ quan (subjective) như SSIM [32],

sẽ không được đề cập đến Lý do chính là những tiêu chuẩn này phải được cục bộ

hóa một cách đặc biệt vào từng vùng trong ảnh Một đánh giá mang tính toàn cục

cho nguyên một khung hình sẽ không định nổi sự khác biệt

4 Kích thước bộ đệm dòng (line-buffer): Là thành phần đầu tiên trong mô hình của

một hệ thống nén ảnh áp dụng cho overdrive (Hình 2.10) Khi xem xét tỷ số nén cần

được đặt trong mối tương quan với bộ đệm dòng, bởi đây là thành phần khá đắt đỏ

trong thiết kế phần cứng Nên một giải pháp nén có đạt được tỷ số nén cao song lại

đòi hỏi kích thước bộ đệm dòng lớn sẽ làm giảm đi một phần tính hiệu quả

Hiện nay, ngưỡng tỷ số nén mà các giải pháp nén ảnh tiên tiến áp dụng cho màn hình

tinh thể lỏng đạt được là Cr = 6:1 Nếu tăng tỷ số nén lên các mức giá trị cao hơn như 8:1

hay 12:1 thì các giải pháp hiện tại cho chất lượng ảnh quá thấp nên không thể đáp ứng

được yêu cầu Từ thực tế đó, luận án này sẽ tập trung nghiên cứu cải thiện hai đặc trưng

chính yếu trong bốn đặc trưng nêu trên đó là: (1) Cải thiện chất lượng nén - Hạn chế các

hiệu ứng tiêu cực về mặt thị giác như nhiễu khối hay hiện tượng giả tạo của các đường nét

trong ảnh (false contours); (2) Cải thiện độ phức tạp tính toán hay kiến trúc thực thi của

giải pháp nén nhằm mang đến khả năng thực thi trên một phần cứng đơn giản

2.4.4.2 Một số tiêu chí đánh giá giải pháp nén ảnh cho màn hình tinh thể lỏng

Để đánh giá giải pháp nén ảnh cho hệ thống overdrive của màn hình tinh thể lỏng,

chúng tôi dựa trên 3 tiêu chí cơ bản là: Chất lượng ảnh, tỷ số nén, và cuối cùng là độ phức

Trang 40

tạp tính toán được xem xét trong mối liên hệ với yêu cầu kiến trúc thực thi

1 Chất lƣợng ảnh nén: Như đã được đề cập trong mục 2.4.3, chất lượng ảnh nén

(cách gọi vắn tắt của chất lượng ảnh khôi phục sau quá trình nén và giải nén) ảnh

hưởng gián tiếp đến chất lượng hình ảnh hiện thị trên màn hình, vì vậy chất lượng

ảnh nén được xem xét không chỉ qua giá trị số đo chất lượng ảnh như MSE hay

PSNR (công thức (2.5) và(2.9)), mà còn phải được xem xét đến các triệu chứng mà

ảnh nén có thể mắc phải như hiệu ứng nhiễu khối (blocking effect), hiện tượng rung

động (vibration) tại một cường độ mức xám cố định, hay hiện tượng giả tạo của các

đường nét trong ảnh (false contours) vốn không được đánh giá hiệu quả và đúng

mức trong các đại lượng đo lường như MSE hay PSNR, song lại rất nhạy cảm với

mắt người, dễ khiến cho người tiêu dùng có những đánh giá tiêu cực về chất lượng

hiển thị hình ảnh của màn hình tinh thể lỏng

2 Tỷ số nén: là một trong những yếu tố quan trọng chủ chốt để đánh giá hiệu năng của

một giải pháp nén ảnh áp dụng cho màn hình tinh thể lỏng, bởi nó tác động trực tiếp

lên giá thành sản phẩm hệ thống overdrive thông qua mức độ cải thiện dung lượng

và tốc độ truyền tải của bộ nhớ khung hình Hiển nhiên là một giải pháp nén cho tỷ

số nén cao chưa hẳn là một giải pháp tối ưu, giải pháp đó có thể sẽ không có tính

thực tiễn nếu chất lượng ảnh mà nó mang lại quá thấp khiến đa số người tiêu dùng

không chấp nhận cho dù giá thành có rẻ hơn đáng kể đi chăng nữa Bên cạnh đó tỷ

số nén đạt được còn phải xem xét trong mối tương quan với độ phức tạp của kiến

trúc thực thi, bởi khiến trúc thực thi càng phức tạp (hay yêu cầu càng cao về hiệu

năng tính toán) thì giá thành của hệ thống nén càng đội lên cao, làm giảm đi tỷ suất

cải thiện về giá thành trên tổng thể

3 Độ phức tạp tính toán và kiến trúc thực thi: Khái niệm độ phức tạp tính toán

trong bài toán nén ảnh áp dụng cho màn hình tinh thể lỏng nhằm giảm giá thành sản

phẩm sẽ có những đặc điểm khác so với cách đánh giá độ phức tạp tính toán cho các

thuật giải thông thường, vốn có mục tiêu là tiết kiệm thời gian thực hiện chương

trình phần mềm Ở đây các giải pháp nén ảnh phải được triển khai trong môi trường

hệ nhúng trên thiết bị màn hình Vì vậy, độ phức tạp tính toán ở đây không chỉ được

đánh giá đơn thuần trên số lượng phép toán cần thực hiện, mà các khía cạnh khác

như: yêu cầu xử lý tuần tự hay song song, yêu cầu về kiến trúc và xung nhịp của bộ

xử lý để đảm bảo khả năng xử lý thời gian thực cũng là những yếu tố quan trọng

trên thực tiễn Lấy một ví dụ minh họa về vấn đề này: Cho hai giải pháp nén A và B

với giả thiết rằng chúng có số phép toán và quy trình xử lý gần như nhau, ngoại trừ

giải pháp A yêu cầu một số phép tính toán phải được xử lý trên dữ liệu nguyên 32

Định dạng
Số trang	176
Dung lượng	5,96 MB