Khi xem xét trong khoảng thời gian những năm nghiên cứu đầu tiên của luận án cuối năm 2009 đến đầu năm 2011, một số giải pháp nén ảnh khung hình được đề xuất trong [[5], [19], [21]] là n
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
NGUYỄN HỮU TÀI
NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ GIẢI PHÁP NÉN ẢNH TIÊN TIẾN CHO MÀN HÌNH TINH THỂ LỎNG
LUẬN ÁN TIẾN SĨ HỆ THỐNG THÔNG TIN
Hà Nội – 2015
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
NGUYỄN HỮU TÀI
NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ GIẢI PHÁP NÉN ẢNH TIÊN TIẾN CHO MÀN HÌNH TINH THỂ LỎNG
CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN
MÃ SỐ: 62480104
LUẬN ÁN TIẾN SĨ HỆ THỐNG THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1 PGS TS NGUYỄN THỊ HOÀNG LAN
2 GS TS LÊ ĐÌNH CHƠN TÂM
Hà Nội − 2015
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi Các số liệu, kết quả nêu trong luận án là trung thực và chưa từng được ai công bố trong bất cứ một công trình nào khác
Trang 4LỜI CẢM ƠN
Tôi xin gửi lời tri ân đến PGS TS Nguyễn Thị Hoàng Lan – Viện Công nghệ Thông tin và Truyền thông – Đại học Bách khoa Hà Nội và TS Lê Đình Chơn Tâm – Giáo sư Đại học Sherbrooke – Canada, công sức và tấm lòng của Thầy Cô đã giúp cho tôi vượt qua những khó khăn trở ngại để có thể hoàn thành luận án này
Tôi cũng xin gửi lời cảm ơn tới các Thầy Cô trong Bộ môn Truyền thông và Mạng máy tính đã tạo điều kiện giúp đỡ và đóng góp nhiều ý kiến quý báu giúp tôi hoàn thiện luận án nghiên cứu Cảm ơn các Thầy Cô trong Viện Công nghệ Thông Tin và Truyền thông đã truyền thụ những kiến thức bổ ích trong quá trình tôi học tập và nghiên cứu tại trường
Cảm ơn các Thầy Cô cùng các Bạn đồng nghiệp trong khoa Công nghệ Thông tin – Đại học Khoa học Huế đã luôn quan tâm và động viên tôi trong quá trình tôi làm nghiên cứu sinh
Cuối cùng, tôi xin gửi tấm lòng ân tình tới Gia đình tôi, đặc biệt đến người bạn đời của tôi, người luôn sẻ chia và động viên cùng như gánh vác nhiều khó khăn vất vả trong gia đình để tôi được toàn tâm toàn ý học tập và nghiên cứu
Mặc dù đã rất cố gắng nhưng do thời thời gian và kiến thức còn hạn chế nên luận án chắc còn có nhiều thiếu sót Tôi rất mong nhận được những ý kiến đóng góp quý báu từ Quý Thầy Cô, các Bạn đồng nghiệp và những người quan tâm
Trang 5MỤC LỤC
MỤC LỤC i
DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT iv
DANH MỤC HÌNH VẼ vii
DANH MỤC BẢNG xi
CHƯƠNG 1: MỞ ĐẦU 1
1.1 Đặt vấn đề 1
1.2 Tình hình nghiên cứu trên thế giới 3
1.3 Mục tiêu và phạm vi nghiên cứu của luận án 5
1.4 Phương pháp nghiên cứu 5
1.5 Ý nghĩa khoa học và thực tiễn của đề tài 6
1.6 Bố cục luận án 7
CHƯƠNG 2: TỔNG QUAN VỀ VẤN ĐỀ NÉN ẢNH CHO MÀN HÌNH TINH THỂ LỎNG 9
2.1 Lịch sử phát triển của màn hình tinh thể lỏng và vấn đề chất lượng hiện thị hình ảnh động 9
2.1.1 Lịch sử phát triển của màn hình tinh thể lỏng 9
2.1.2 Vấn đề chất lượng hiển thị hình ảnh động trên màn hình tinh thể lỏng 11
2.2 Overdrive – một kỹ thuật tăng tốc độ đáp ứng cho các phần tử tinh thể lỏng 12 2.3 Mô hình hệ thống Overdrive và yêu cầu nén ảnh giảm bộ nhớ khung hình 14
2.3.1 Mô hình hệ thống overdrive 14
2.3.2 Vấn đề yêu cầu nén ảnh khung hình cho màn hình tinh thể lỏng 15
2.3.3 Các đặc trưng của phương pháp nén ảnh áp dụng cho hệ thống Overdrive 17
2.4 Mô hình hệ thống nén ảnh dùng cho hệ thống overdrive 18
2.4.1 Hệ thống nén ảnh khung hình 18
2.4.2 Các độ đo hiệu năng giải pháp nén ảnh khung hình 20
2.4.3 Mối tương quan giữa chất lượng nén và chất lượng ảnh hiển thị trên màn hình tinh thể lỏng 22
2.4.4 Một số yêu cầu đặc trưng và tiêu chí đánh giá hệ thống nén ảnh cho màn hình tinh thể lỏng 23
2.5 Một số cơ sở lý thuyết trong nén ảnh 26
2.5.1 Các phép biến đổi áp dụng trong nén ảnh 27
2.5.2 Lượng tử hoá 33
2.5.3 Gán từ mã dạng độ dài đồng nhất 37
2.5.4 Khái quát về một số phương pháp mã hóa ảnh thực hiện cho màn hình 38
2.6 Tổng quan về các giải pháp nén ảnh cho màn hình tinh thể lỏng 42
2.6.1 Khái quát về các giải pháp nén ảnh cho hệ thống overdrive 42
Trang 62.6.2 Một số hướng tiếp cận các giải pháp nén và định hướng nghiên cứu 46
CHƯƠNG 3: PHÂN TÍCH VÀ ĐỀ XUẤT MỘT SỐ GIẢI PHÁP NÉN ẢNH DỰA TRÊN MÃ HÓA KHỐI VÀ BIẾN ĐỔI KHÔNG GIAN MÀU 61
3.1 Nghiên cứu cải tiến và phát triển giải pháp nén ảnh dựa trên mã hóa khối và biến đổi không gian màu 61
3.1.1 Tóm tắt 6 giai đoạn nghiên cứu phát triển giải pháp 61
3.1.2 Môi trường thực nghiệm cài đặt và các bộ dữ liệu 62
3.2 Khắc phục hiện tượng nhiễu khối trong AHIC với đề xuất cải tiến MAIC 64
3.2.1 Nhiễu khối trong AHIC – Nguyên nhân và giải pháp khắc phục 64
3.2.2 Phát triển phương pháp lượng tử tối ưu sai số “Midrise Uniform Quantizer” 65
3.2.3 Đề xuất giải pháp cải tiến MAIC giúp khắc phục nhiễu khối 65
3.2.4 Đánh giá độ phức tạp của MAIC so với AHIC 67
3.2.5 Kết quả thực nghiệm và đánh giá 68
3.3 Cải thiện chất lượng ảnh nén với kỹ thuật trao đổi bit theo nội dung CBBET 73 3.3.1 Ưu và nhược điểm khi lượng tử hóa với sự phân phối bit đồng đều 73
3.3.2 Đề xuất kỹ thuật trao đổi bit theo nội dung CBBET 75
3.3.3 Đề xuất giải pháp cải tiến AAIC trên cơ sở tích hợp CBBET vào MAIC 79
3.3.4 Đánh giá độ phức tạp của AAIC so với MAIC và AHIC 80
3.3.5 Kết quả thực nghiệm và đánh giá 81
3.4 Cải thiện chất lượng nén với kỹ thuật phân phối bit CBBDT 84
3.4.1 Ưu và nhược điểm của kỹ thuật trao đổi bit CBBET 84
3.4.2 Đề xuất kỹ thuật phân phối bit CBBDT dựa trên giá trị bước lượng tử - giải pháp AHAIC 85
3.4.3 Cải tiến hiệu năng của AHAIC bằng sơ đồ nén ACAIC 91
3.5 Đề xuất giải pháp nén RAIC 96
3.5.1 Cải thiện hiệu năng cho bộ lượng tử hóa với kỹ thuật mã hóa lượng tử MMAUQC 96
3.5.2 Tối ưu hóa kỹ thuật phân phối bit với RBBDT 99
3.5.3 Đề xuất mô hình lượng tử đa thích nghi MAQC 101
3.5.4 Đề xuất giải pháp nén RAIC 103
3.5.5 Đánh giá độ phức tạp tính toán của giải pháp nén RAIC 104
3.5.6 Kết quả thực nghiệm và đánh giá 104
3.6 Đề xuất ARAIC nâng cao hiệu năng nén RAIC 108
3.6.1 Giải pháp đề xuất ARAIC 108
3.6.2 Sơ đồ thuật toán mã hóa/giải mã cho MAQC 110
3.6.3 Phân tích đánh giá khả năng nâng cao hiệu năng của giải pháp đề xuất 111
3.6.4 Kết quả thực nghiệm và đánh giá 112
3.7 Kết luận chương 3 115
Trang 7CHƯƠNG 4: PHÂN TÍCH VÀ ĐỀ XUẤT MỘT SỐ GIẢI PHÁP NÉN ẢNH
DỰA TRÊN BIẾN ĐỔI WAVELET VÀ LỰA CHỌN THÍCH NGHI 117
4.1 Đề xuất cải tiến DAMS với sự tích hợp cơ chế ngưỡng thích nghi - giải pháp DBMAIC 118
4.1.1 Đề xuất kỹ thuật ngưỡng thích nghi ATT 119
4.1.2 Đề xuất thuật toán lượng tử thích nghi AQC 121
4.1.3 Thực nghiệm và đánh giá cho giải pháp DBMAIC 121
4.2 Đề xuất áp dụng biến đổi “Wavelet Lifting integer to integer” để cải thiện độ phức tạp - giải pháp WLT-MAIC 126
4.2.1 Độ phức tạp trong kiến trúc thực hiện của DAMS và DBMAIC 126
4.2.2 Sơ đồ “Wavelet Lifting” 127
4.2.3 Đề xuất giải pháp WLT-MAIC 129
4.2.4 Sơ đồ thuật toán mã hóa và giải mã DAMS-AT 130
4.2.5 Phân tích đánh giá khả năng nâng cao hiệu năng của giải pháp đề xuất 131
4.2.6 Thực nghiệm và đánh giá cho giải pháp WLT-MAIC 131
4.3 So sánh và phân tích đánh giá hai giải pháp nén theo hai hướng tiếp cận 134
4.3.1 So sánh thực nghiệm và phân tích đánh giá 134
4.3.2 Một số kết luận và khuyến nghị 142
4.4 So sánh ARAIC và WLT-MAIC với những giải pháp tiên tiến nổi bật trong thời gian gần đây 143
4.5 Kết luận chương 4 145
CHƯƠNG 5: KẾT LUẬN 146
5.1 Tóm tắt nội dung nghiên cứu và kết quả mới của luận án 146
5.1.1 Những nội dung nghiên cứu chính của luận án 146
5.1.2 Các kết quả mới của luận án 147
5.2 Hướng phát triển 148
TÀI LIỆU THAM KHẢO 149
DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ CỦA LUẬN ÁN 151
PHỤ LỤC 1: THỬ GIẢI PHÉP NÉN WLT-MAIC TRÊN MỘT SỐ VIDEO CLIP CỦA QUALCOMM CANADA 152
PHỤ LỤC 2: THỐNG KÊ XÁC XUẤT CỦA “ZERO MEAN SIGNAL” TRONG MÔ HÌNH AAIC 160
Trang 8DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT
Ký hiệu và chữ
AAIC Mã hóa nén ảnh tiên tiến thích nghi
Advanced Adaptive Image Coding
ACAIC Mã hóa nén ảnh tiên tiến có tính thích nghi theo nội dung
Advanced Content-Adaptive Image Coding
AHAIC Mã hóa nén ảnh tiên tiến có tính thích nghi cao
Advanced High-Adaptive Image Coding
AHIC Bộ mã hóa nén ảnh tiên tiến kết hợp (lai)
Advanced Hybrid Image Codec
Adaptive Multi-level Block Truncation Coding
Adaptive Quantization Coding
Advanced Robust Adaptive Image Coding
Adaptive Threshold Controller
Adaptive-Threshold Technique
Block Truncation Coding
Content-Based Bit Distribution Technique
CBBET Kỹ thuật trao đổi bit dựa trên nội dung
Content-based Bit Exchange Techniques
Current Frame
Compression Ratio
DWT-based Adaptive Mode Selection
DBMAIC Mã hóa nén ảnh dựa trên phép biến đổi wavelet đa thích nghi
DWT-Based Multi-Adaptive Image Coding
Trang 9DCT Biến đổi cosine rời rạc
Discrete Cosine Transform
Dynamic Scattering Method
Discrete Wavelet Transform
FFD / Overdrive
Kỹ thuật tăng tốc độ đáp ứng cho các phần tử tinh thể lỏng qua cơ chế tăng điện áp
Feedforward Driving
Finite Impulse Response
High Compression Ratio Image Coding
High-Definition
High-Definition Television
Hybrid Image Coding
Liquid Crystal
Liquid Crystal Displays
MAIC Mã hóa nén ảnh thích nghi theo giá trị trung bình
Mean Adaptive Image Coding
Multiple Adaptive Quantization Coding
Min-Max Adaptive Uniform Quantization Coding
Mean Squared Error
Midrise Uniform Quantizer
Pulse Code Modulation
Previous Frame
Trang 10PSNR Tỷ số tín hiệu mức đỉnh trên nhiễu
Peak Signal-to-Noise Ratio
Robust Adaptive Image Coding
RBBDT Kỹ thuật phân phối bit tối ưu dựa trên giá trị phạm vi
Range-based Bit Distribution Technique
SBB-BTC Mã hóa cắt khối dựa trên mặt phẳng bit
Single Bit Plane based Block Truncation Coding
TFT Transistor công nghệ “Thin Film” đối với một phần tử ảnh màn hình
Thin-Film Transistor
Ultra High-Definition
VQ-BTC Mã hóa cắt khối dựa trên lượng tử hóa vector
Vector Quantizer based Block Truncation Coding
WLT-MAIC
Mã hóa nén ảnh đa thích nghi dựa trên biến đổi wavelet số nguyên
Wavelet Lifting integer to integer Transform based Multi-Adaptive Image Codin
Trang 11DANH MỤC HÌNH VẼ
Hình 1.1 Minh họa hiện tượng mờ chuyển động 1
Hình 1.2 Mô hình một hệ thống overdrive trong màn hình tinh thể lỏng 2
Hình 2.1 Mô tả cấu tạo màn hình TFT-LCD 10
Hình 2.2 Minh họa hiện tượng Motion-Blur trên màn hình tinh thể lỏng 11
Hình 2.3 Sơ đồ khối của màn hình tinh thể lỏng 15inch XGA dùng kỹ thuật FFD 12
Hình 2.4 Đồ thị độ chói - thời gian đáp ứng mô tả cách thức xác định điện áp tăng tốc 12
Hình 2.5 Minh họa giải pháp tăng tốc độ chuyển đổi mức xám thông qua cơ chế hiệu chỉnh tăng ngưỡng điện áp 13
Hình 2.6 So sánh thời gian đáp ứng 13
Hình 2.7 Mô hình một hệ thống overdrive có sử dụng kỹ thuật nén ảnh nhằm giảm yêu cầu về dung lượng và tốc độ truy xuất dữ liệu của bộ nhớ khung hình 15
Hình 2.8 Phạm vi áp dụng của bài toán nén ảnh khung hình cho màn hình tinh thể lỏng độ phân giải cao 16
Hình 2.9 Mô hình với ba thành phần chính trong một hệ thống nén ảnh áp dụng trong truyền thông 18
Hình 2.10 Mô hình khái quát với bốn thành phần chính trong một hệ thống nén ảnh áp dụng cho overdrive trong màn hình tinh thể lỏng 19
Hình 2.11 Đồ thị biến thiên của PSNR theo MSE 21
Hình 2.12 Minh họa 64 hàm cơ bản của 8×8 DCT 28
Hình 2.13 Phân tích đa phân giải 3 mức và khôi phục của tín hiệu dùng cấu trúc lọc kiểu kim tự tháp (pyramidal filter structure) 30
Hình 2.14 Quy trình xử lý dòng-cột của DWT hai chiều 31
Hình 2.15 Sơ đồ phân tích và tổng hợp tín hiệu hai chiều theo cấu trúc băng tần con 32
Hình 2.16 Kết quả biến đổi DWT trên ảnh số hai chiều theo kiến trúc kim tự tháp sử dụng bộ lọc Wavalet Daubechies 4 - hệ số 32
Hình 2.17 Ánh xạ vào – ra của một bộ lượng tử hóa dạng Midrise 33
Hình 2.18 Xấp xỉ của hàm Px(x) bởi các hằng số phân đoạn 35
Hình 2.19 Ánh xạ vào – ra của một bộ lượng tử hóa tối ưu và sai số lượng tử 37
Hình 2.20 Mô hình khái quát cho một bộ mã hóa lượng tử thích nghi 40
Hình 2.21 Sơ đồ mã hóa ảnh sử dụng biến đổi 40
Hình 2.22 Sơ đồ cơ bản của chuẩn nén ảnh JPEG 41
Hình 2.23 Sơ đồ thuật toán bộ nén JPEG2000 42
Hình 2.24 Những giải pháp nén đã được đề xuất áp dụng trong hệ thống overdrive của màn hình tinh thể lỏng 47
Trang 12Hình 2.25 Sơ đồ khối của bộ mã hóa AQC 49
Hình 2.26 Chất lượng ảnh nén của giải pháp AHIC được so sánh với giải pháp chỉ áp dụng kỹ thuật BTC 49
Hình 2.27 Sơ đồ giải pháp nén AHIC 50
Hình 2.28 Hiện tượng nhiễu khối (blocking effect) trên ảnh khôi phục của AHIC 51
Hình 2.29 Hiện tượng kém chất lượng trên thành phần màu sắc (Cb và Cr) trên ảnh khôi phục của AHIC 52
Hình 2.30 Sơ đồ khối và kiến trúc của AM-BTC 53
Hình 2.31 Ảnh khôi phục của AM-BTC và sai số của nó 54
Hình 2.32 Minh chứng cho hiện tượng rung động trong giải pháp nén AM-BTC 55
Hình 2.33 Mô hình hệ thống của DAMS và bộ mã hóa thích nghi 57
Hình 2.34 Hiệu ứng khối (blocking) và nhiễu (noise) trên ảnh khôi phục của DAMS 59
Hình 2.35 Số bit dư thừa khi kết thúc quá trình nén của DAMS 60
Hình 3.1 Sơ đồ mô tả sơ lược các bước nghiên cứu phát triển 61
Hình 3.2 Đồ thị hàm lượng tử Midrise Uniform Quantizer với 8 mức lượng tử 65
Hình 3.3 Sơ đồ khối của giải pháp nén MAIC 66
Hình 3.4 Sơ đồ bộ lượng tử hóa MUQ (MUQ Encoder & Decoder) 67
Hình 3.5 So sánh hiệu năng của AHIC với MAIC trên chuỗi hình CIF Foreman 69
Hình 3.6 So sánh hiệu năng của AHIC với MAIC trên chuỗi hình CIF Bus 69
Hình 3.7 So sánh sự mất mát thông tin giữa AHIC và MAIC trên một khung hình của chuỗi khung hình CIF Foreman 70
Hình 3.8 So sánh sự mất mát thông tin (hay error) giữa 2 giải pháp nén AHIC và MAIC trên một khung hình của chuỗi khung hình CIF Bus 71
Hình 3.9 Minh họa ảnh độ chói Y của 8 bock 4×4 đầu vào cho quá trình lượng tử hóa 74
Hình 3.10 Sai số phát sinh khi lượng tử hóa với phân phối đều bởi bộ lượng tử 4×4-AQC Chất lượng ảnh khôi phục đạt được PSNR=33.00 dB 74
Hình 3.11 Sai số phát sinh khi lượng tử hóa với phân phối không đồng đều bởi bộ lượng tử 4×4-AQC 75
Hình 3.12 Sơ đồ khối cho bộ mã hóa CBBET và bộ Bit Selector 76
Hình 3.13 Sơ đồ khối cho bộ mã hóa và giải mã của AAIC 80
Hình 3.14 So sánh chất lượng nén và sự mất mát thông tin giữa 3 giải pháp nén AHIC, MAIC và AAIC trên một khung hình của chuỗi khung hình CIF Foreman 81
Hình 3.15 So sánh hiệu năng của AAIC với MAIC và AHIC 82
Hình 3.16 So sánh hiệu năng của AAIC với AHIC (chỉ trên thành phần độ chói Y) 83
Hình 3.17 Sai số phát sinh khi lượng tử hóa với phân phối không đồng đều bởi bộ lượng tử 4×4-AQC 84
Trang 13Hình 3.18 Sơ đồ bộ mã hóa và giải mã theo kỹ thuật phân phối bít (CBBDT) dựa trên giá
trị bước lượng tử 86
Hình 3.19 Sơ đồ khối cho bộ mã hóa (encoder) và giải mã (decoder) của giải pháp nén
AHAIC (ở đây Q=2) 88
Hình 3.20 So sánh chất lượng ảnh của các giải pháp trên chuỗi khung hình CIF Hall 89
Hình 3.21 So sánh chất lượng nén và sự mất mát thông tin giữa 3 giải pháp nén AHIC,
AAIC và AHAIC trên một khung hình của chuỗi khung hình CIF Hall 90
Hình 3.22 Sơ đồ bộ mã hóa và giải mã theo kỹ thuật phân phối bít (CBBDT) dựa trên giá
trị tuyệt đối lớn nhất của khối 93
Hình 3.23 So sánh chất lượng ảnh của các giải pháp nén trên chuỗi CIF Hall 93
Hình 3.24 So sánh chất lượng nén và sự mất mát thông tin giữa AHIC, AHAIC và ACAIC
trên một khung hình của chuỗi khung hình CIF Hall 95
Hình 3.25 Kỹ thuật lượng tử MUQ với 3bit/pixel - Mối liên hệ giữa bước lượng tử hóa
Qstep và sự phân bố các giá trị (hay điểm ảnh) trong một khối 97
Hình 3.26 Kỹ thuật lượng tử MMAUQC với 3bit/pixel - Mối liên hệ giữa bước lượng tử
hóa Qstep và sự phân bố các giá trị trong một khối dạng “zero min signal” 98
Hình 3.27 Mô tả đặc tính vào-ra của một bộ lượng tử hóa đều 3bit/pixel với đầu vào dạng
“zero min signal” 99
Hình 3.28 Sơ đồ khối của mô hình lượng tử đa thích nghi MAQC 102
Hình 3.29 Sơ đồ khối của bộ mã hóa và giải mã RAIC 104
Hình 3.30 So sánh chất lượng ảnh của các giải pháp nén trên chuỗi khung hình CIF
Foreman 105
Hình 3.31 So sánh chất lượng ảnh nén và sai số một cách trực quan trên ảnh Foreman 106
Hình 3.32 Sơ đồ bộ nén (Encoder) và giải nén (Decoder) của ARAIC 108
Hình 3.33 Sơ đồ bộ nén và giải nén MAQC áp dụng trong ARAIC 109
Hình 3.34 Sơ đồ thuật toán mã hóa và giải mã MAQC 111
Hình 3.35 So sánh chất lượng ảnh của các giải pháp nén trên chuỗi khung hình CIF
MobileCalendar 113
Hình 3.36 So sánh chất lượng ảnh của các giải pháp nén trên chuỗi khung hình CIF
Cheerleader 113
Hình 3.37 So sánh chất lượng hình ảnh nén và sai số một cách trực quan trên một khung
hình của chuỗi khung hình CIF MobileCalendar 114
Hình 4.1 Sơ đồ quá trình các đề xuất cải tiến kế thừa và phát triển theo hướng áp dụng
biến đổi wavelet và lựa chọn thích nghi 117
Hình 4.2 Sơ đồ khối của bộ mã hóa DBMAIC, được tích hợp với một bộ điều khiển
ngưỡng thích nghi 118
Trang 14Hình 4.3 Sơ đồ khối của bộ mã hóa DAMS-AT áp dụng trong DBMAIC 118
Hình 4.4 Mối liên hệ giữa chất lượng ảnh và các hằng số C2 & C3 của DBMAIC 122
Hình 4.5 Mối liên hệ giữa chất lượng ảnh và các hằng số C1 & C2 của DBMAIC 122
Hình 4.6 Mối liên hệ giữa chất lượng ảnh và các hằng số C1 & C2 của DBMAIC 122
Hình 4.7 Mối liên hệ giữa chất lượng ảnh và các hằng số Min-Threshold & Max-Threshold của DBMAIC 122
Hình 4.8 Sự thay đổi của ngưỡng (threshold) 123
Hình 4.9 So sánh hiệu năng của các giải pháp nén 123
Hình 4.10 So sánh giá trị bit dư thừa trong hai giải pháp DBMAIC và DAMS 124
Hình 4.11 Sự cải thiện hiệu ứng nhiễu khối và nhiễu đốm trên ảnh khôi phục của DBMAIC 124
Hình 4.12 So sánh trực quan chất lượng ảnh và sai số 126
Hình 4.13 Sơ đồ “Wavelet Lifting” (nguồn [26]) 127
Hình 4.14 Sơ đồ khối cho bộ mã hóa WLT-MAIC 129
Hình 4.15 Sơ đồ khối cho bộ mã hóa DAMS-AT áp dụng cho WLT-MAIC với 6 khối 4×8 đầu vào theo trật tự ưu tiên định trước 129
Hình 4.16 Sơ đồ thuật toán mã hóa và giải mã DAMS-AT 130
Hình 4.17 So sánh hiệu năng của các giải pháp nén 132
Hình 4.18 So sánh trực quan chất lượng ảnh và sai số giữa hai giải pháp nén DBMAIC và WLT-MAIC 133
Hình 4.19 So sánh hiệu năng của các giải pháp nén thuộc hai hướng tiếp cận 135
Hình 4.20 So sánh trực quan sai số giữa một số giải pháp nén thuộc hai hướng tiếp cận Trị tuyệt đối sai số được khuếch đại lên 12 lần rồi biến đổi âm bản 137
Hình 4.21 So sánh hiệu năng của các giải pháp nén thuộc hai hướng tiếp cận 138
Hình 4.22 Giá trị PSNR trung bình của các giải pháp nén khi đánh giá trên 25 chuỗi khung hình với tổng số 8765 hình ảnh 138
Hình 4.23.Giá trị Entropy trung bình của mỗi chuỗi khung hình 140
Hình 4.24 So sánh chất lượng ảnh của các giải pháp nén trên chuỗi CIF MobileCalendar 140
Hình 4.25 So sánh trực quan sai số giữa một số giải pháp nén thuộc hai hướng tiếp cận 142 Hình 4.26 So sánh hiệu năng nén của 4 giải pháp ARAIC, WLT-MAIC, LTC và SAMS 144
Hình 5.1 Sơ đồ quá trình đề xuất cải tiến và phát triển các giải pháp nén ảnh của luận án trên cơ sở kế thừa hai giải pháp AHIC và DAMS cùng một số lý thuyết nền tảng 147
Trang 15DANH MỤC BẢNG
Bảng 2.1 Điện áp tăng tốc áp dụng để chuyển đổi từ mức độ chói hiện tại sang mức độ
chói tiếp theo ở mức 60cd/m2 với thời gian đáp ứng 16.7ms 13
Bảng 2.2 Yêu cầu dung lượng và tốc độ truyền tải dữ liệu của bộ nhớ khung hình trên Ti-vi chuẩn HD và UHD 14
Bảng 2.3 Lượng tử hóa tối ưu MSE cho mật độ Gaussian 35
Bảng 2.4 Một ví dụ gán từ mã dạng độ dài đồng nhất cho thông điệp với 8 trạng thái 38
Bảng 2.5 Chất lượng nén trung bình của AHIC so với giải pháp chỉ áp dụng kỹ thuật lượng tử hóa BTC [19] 49
Bảng 2.6 Chất lượng ảnh khôi phục của một số giải pháp nén 53
Bảng 3.1 Các chuỗi khung hình định dạng CIF sử dụng trong thực nghiệm 63
Bảng 3.2 Các hình ảnh sử dụng trong thực nghiệm được lấy từ tập dữ liệu ảnh “LIVE image quality assessment database release 2” 64
Bảng 3.3 Trung bình cộng kết quả chất lượng ảnh nén cho mỗi giải pháp 72
Bảng 3.4 Đánh giá mức độ cải thiện chất lượng ảnh nén của MAIC so với AHIC 72
Bảng 3.5 Các lượng tử đều tối ưu cho tín hiệu có giá trị trung bình bằng không, phương sai đơn vị và mật độ Gaussian 77
Bảng 3.6 Kết quả chất lượng ảnh nén trung bình của các giải pháp 83
Bảng 3.7 Đánh giá mức độ cải thiện chất lượng ảnh nén của AAIC so với AHIC 83
Bảng 3.8 Kết quả chất lượng ảnh nén trung bình cho các giải pháp 90
Bảng 3.9 Kết quả cải thiện của AHAIC so với AHIC 90
Bảng 3.10 Kết quả cải thiện của AHAIC so với AAIC 91
Bảng 3.11 So sánh kết quả trung bình chất lượng ảnh nén khi sử dụng công thức tính phân phối bit (3.9) hay (3.10) trong giải pháp AHAIC 91
Bảng 3.12 Kết quả chất lượng ảnh nén trung bình cho các giải pháp 95
Bảng 3.13 Đánh giá mức độ cải thiện chất lượng ảnh nén của ACAIC so với AHIC 95
Bảng 3.14 Đánh giá mức độ cải thiện chất lượng ảnh nén của ACAIC so với AHAIC 96
Bảng 3.15 Minh họa cho tình huống mã hóa lượng tử BTC với sai số lớn 103
Bảng 3.16 Kết quả chất lượng ảnh nén trung bình cho các giải pháp 107
Bảng 3.17 Đánh giá mức độ cải thiện chất lượng của RAIC so với một số giải pháp 107
Bảng 3.18 Kết quả chất lượng ảnh nén trung bình cho các giải pháp 114
Bảng 3.19 Đánh giá mức độ cải thiện chất lượng của ARAIC so với một số giải pháp 115
Bảng 4.1 Các hệ số của bộ lọc wavelet Le Gall 5/3-tap 128
Trang 16CHƯƠNG 1: MỞ ĐẦU
1.1 Đặt vấn đề
Trong những năm gần đây, chúng ta đã được chứng kiến sự thông dụng của công nghệ
màn hình tinh thể lỏng, hay thường được gọi tắt là công nghệ LCD (Liquid Crystal
Display), qua những chiếc ti-vi tinh thể lỏng (LCD và LED1) trong các hộ gia đình, cho
đến các màn hình tinh thể lỏng dùng cho máy tính cá nhân trong các văn phòng, các màn
hình quan sát và điều khiển trong công nghiệp, và nổi bật hơn cả là hàng tỷ chiếc điện
thoại di động đang nằm trong túi của hàng tỷ người trên toàn thế giới Sự phát triển và
thành công của công nghệ tinh thể lỏng là kết quả của những nghiên cứu cải tiến không
ngừng, nhằm đưa chất lượng hình ảnh hiển thị và độ phân giải ngày một cao hơn, điện
năng tiêu thụ ngày một hiệu quả, giá thành sản phẩm ngày một hợp lý hơn với người tiêu
dùng
Một trong số các vấn đề của công nghệ tinh thể lỏng trong thời kỳ đầu của quá trình
phát triển là tình trạng đáp ứng chậm chạp của các phần tử tinh thể lỏng, gây nên hiện
tượng mờ chuyển động (motion-blur, xem Hình 1.1) Để khắc phục, K Nakanishi và các
đồng nghiệp đã đề xuất giải pháp tăng tốc độ đáp ứng cho các phần tử tinh thể thông qua
cơ chế tăng ngưỡng điện áp với tên gọi “overdrive” vào năm 2001 [25] Kỹ thuật overdrive
đã tạo nên bước đột phá trong công nghệ tinh thể lỏng giúp tạo ra những sản phẩm có khả
năng hiển thị hình ảnh chuyển động với chất lượng cao
(a) Kỹ thuật điều khiển thông thường (b) Tăng tốc với overdrive
Hình 1.1 Minh họa hiện tượng mờ chuyển động (motion-blur) khi áp dụng kỹ thuật
điều khiển (dẫn động) thông thường (a), và khả năng cải thiện chất lượng hình ảnh hiển thị
bằng kỹ thuật tăng tốc overdrive (b) trên màn hình tinh thể lỏng của hãng LG
1 Màn hình LED (điôt phát quang) thực chất là màn hình tinh thể lỏng (LCD) nhưng được áp dụng kỹ
thuật chiếu sáng bằng đèn điôt phát quang (LED) thay cho đèn huỳnh quang lạnh (Cold cathode fluorescent
lamp - CCFL) [35]
Vùng hình ảnh chuyển động hiện thị bị mờ
Trang 17Mô hình hệ thống overdrive trong màn hình tinh thể lỏng được trình bày trong Hình
1.2, gồm hai thành phần: (1) Bộ nhớ khung hình (frame memory); và (2) bộ điều khiển
tăng tốc overdrive Trong đó, bộ nhớ khung hình có chức năng lưu trữ dữ liệu ảnh hiện thị
đủ khung hình hiện tại (Fn) và đồng thời cung cấp dữ liệu ảnh khung hình ở thời điểm
trước (Fn-1) cho hệ thống overdrive Bộ điều khiển overdrive có chức năng cung cấp điện
áp tăng tốc cho mỗi điểm ảnh trên màn hình dựa trên thông tin ảnh khung hình hiện tại (Fn)
và ảnh khung hình ở thời điểm trước (Fn-1) Nguyên lý hoạt động của hệ thống overdrive
được mô tả chi tiết trong mục 2.2
Hình 1.2 Mô hình một hệ thống overdrive trong màn hình tinh thể lỏng [24]
Hiện nay các nhà sản xuất đang cần áp dụng các chuẩn định dạng Ti-vi độ phân giải
cao (High-Definition Television) và siêu cao (Ultra High-Definition Television) đối với
các thiết bị màn hình tinh thể lỏng, với tốc độ hiện thị khung hình lên mức 60fps đến
120fps Từ đó làm nảy sinh hai vấn đề sau đối với bộ nhớ khung hình:
(1) Yêu cầu dung lượng bộ nhớ tăng cao theo sự tăng trưởng số điểm ảnh trên màn
hình Mức 640×480×24bit 7.1Mb với chuẩn VGA, 3840×2160×24bit 189.8Mb với
chuẩn UHD 2160p (4K), và 7680×4320×24bit 759.4Mb với chuẩn UHD 4320p (8K)
(2) Yêu cầu băng thông ở mức rất cao, cụ thể với UHD 2160p (4K) áp dụng tốc độ
hiện thị khung hình 120fps sẽ là 3840×2160×24bit×120×2 44.5Gbit/s, hay UHD 4320p
(8K) với 120fps sẽ là 7680×4320×24bit×120×2 178Gbit/s
Với yêu cầu cao về dung lượng và tốc độ băng thông, sẽ đẩy giá thành của bộ nhớ
khung hình lên cao, góp phần làm tăng giá thành của sản phẩm màn hình tinh thể lỏng Từ
đó bài toán nén ảnh khung hình áp dụng vào trong hệ thống overdrive đã được đặt ra nhằm
mục đích thu nhỏ dung lượng dữ liệu ảnh khung hình trước khi nó được lưu trữ lên bộ nhớ
khung hình (frame memory), giúp giảm yêu cầu dung lượng đối với bộ nhớ khung hình,
Overdrive
(LUT)
Dữ liệu khung hình thời điểm trước, F n-1
Overdriven Frame
Dữ liệu khung hình hiện tại
F n
Frame memory
Dữ liệu khung hình
Trang 18đồng thời cũng giúp giảm được yêu cầu băng thông đối với bộ nhớ khung hình khi lượng
dữ liệu mà nó cần trao đổi (ghi/đọc) trở nên ít đi vì đã được nén lại Khi yêu cầu về dung
lượng và băng thông đối với bộ nhớ khung hình được giảm xuống sẽ kéo theo sự cải thiện
về giá thành của sản phẩm màn hình tinh thể lỏng
Xuất phát từ yêu cầu thực tiễn trên, nhiều nghiên cứu đã được triển khai nhằm tìm ra
những giải pháp nén ảnh khung hình áp dụng phù hợp và hiệu quả trên hệ thống overdrive
của màn hình tinh thể lỏng Kết quả đã có khá nhiều các giải pháp nén ảnh khung hình cho
màn hình tinh thể lỏng được đề xuất qua các bài báo [[5], [9], [10], [11], [12], [13], [14],
[15], [17], [18], [19], [20], [21], [22], [24], [28]] Khi xem xét trong khoảng thời gian
những năm nghiên cứu đầu tiên của luận án (cuối năm 2009 đến đầu năm 2011), một số
giải pháp nén ảnh khung hình được đề xuất trong [[5], [19], [21]] là những giải pháp mới
được đề xuất, thể hiện được hiệu năng nén cao so với những giải pháp nén được đề xuất
trước đó trên một số tiêu chí như: tỷ số nén khá cao, chất lượng ảnh khá tốt, và độ phức tạp
tính toán không cao hay ở mức chấp nhận được Nhưng trải qua quá trình nghiên cứu phân
tích về mặt lý thuyết cũng như thực nghiệm, chúng tôi đã phát hiện ra nhiều khiếm khuyết
còn tồn tại trong các giải pháp nói trên về mặt chất lượng ảnh khôi phục cũng như độ phức
tạp tính toán Từ thực trạng đó, đã mở ra hướng nghiên cứu cải tiến một số giải pháp nén
ảnh khung hình cho màn hình tinh thể lỏng đã được các tác giả nước ngoài đề xuất, nhằm
nâng cao hiệu quả áp dụng vào hệ thống overdrive, hoặc tiến xa hơn sẽ nghiên cứu đề xuất
các giải pháp nén tiên tiến về mặt hiệu năng, nhằm mang lại hiệu quả cao khi áp dụng vào
hệ thống overdrive trong màn hình tinh thể lỏng
1.2 Tình hình nghiên cứu trên thế giới
Hiện nay, nhiều giải pháp nén ảnh khung hình khác nhau đã được đề xuất áp dụng cho
hệ thống overdriver trong màn hình tinh thể lỏng Từ giải pháp đơn giản chỉ áp dụng phép
biến đổi không gian màu và kỹ thuật mã hóa lượng tử BTC (block truncation coding) trong
[13] với tỷ số nén (compression ratio) CR = 3 đến 3.42 Cho đến các giải pháp nén có kiến
trúc phức tạp hơn, sử dụng phối hợp nhiều kỹ thuật biến đổi và lượng tử hóa khác nhau
nhằm tăng chất lượng ảnh khôi phục hay tỷ số nén, đã được đề xuất trong các bài báo [[9],
[10], [12], [14], [15], [17], [18], [20], [21], [24], [28]] Sau cùng, và cũng đáng được chú ý
hơn cả, là một số giải pháp nén có tỷ số nén cao đi cùng với chất lượng ảnh khôi phục khá
tốt, dựa trên mô hình kiến trúc khá đơn giản như đề xuất trong [19], hay không quá phức
tạp và có thể thực hiện được theo thời gian thực, như trong [5]
Nhìn chung, các giải pháp đã được đề xuất nói trên, đặc biệt là những giải pháp tiên
tiến về hiệu năng mới được đề xuất gần đây như Advanced Hybrid Image Codec (AHIC)
Trang 19trong [19], Adaptive Multi-level Block Truncation Coding (AM-BTC) trong [21] hay
DWT-based Adaptive Mode Selection (DAMS) trong [5], đều là những giải pháp có nhiều
ưu điểm nổi trội khi so sánh với các giải pháp đã được đề xuất trước đó như: tỷ số nén cao,
chất lượng ảnh khôi phục khá tốt và độ phức tạp tính toán không cao (với AHIC và
AM-BTC) hay không quá cao (với DAMS) Mặc dù vậy, qua quá trình nghiên cứu và phân tích
thực nghiệm, chúng tôi nhận thấy các giải pháp này vẫn còn mắc phải một số nhược điểm
sau:
Advanced Hybrid Image Codec (AHIC): Ảnh khôi phục dễ bị mắc phải hiện tượng
nhiễu khối (hay blocking effect), kỹ thuật lượng tử hóa chưa thật sự tối ưu, mô hình
kiến trúc thực thi còn nhiều điểm chưa thật sự hợp lý, và cuối cùng là khả năng thích
nghi theo sự thay đổi của tín hiệu ảnh chưa cao dẫn đến chất lượng ảnh khôi phục còn
rất thấp trong một số tình huống
Adaptive Multi-level Block Truncation Coding (AM-BTC): Ảnh khôi phục có sai số
lớn ở thành phần độ chói Y (luminance) là thành phần nhạy cảm với mắt người Và hơn
thế nữa, trong một số tình huống khi quan sát trên một chuỗi các khung hình, sai số
trên ảnh khôi phục đã gây ra hiện tượng rung hình (vibrate effect) như nhìn qua một
đám lửa ở những vùng ảnh nhiều chi tiết và ít thay đổi Chính vì hiện tượng chập chờn
tác động lên vùng ảnh có ít sự thay đổi nên khuyết điểm này dễ dàng được nhận ra qua
quan sát bằng thị giác Nhược điểm này sẽ khiến cho giải pháp AM-BTC khó có thể
ứng dụng trên thực tiễn vì sẽ làm suy giảm chất lượng hiển thị hình ảnh trên màn hình
tinh thể lỏng, dù rằng những kết quả thực nghiệm đánh giá trên số đo PSNR của giải
pháp AM-BTC thường đạt kết quả khá cao
DWT-based Adaptive Mode Selection (DAMS): Giải pháp này sử dụng một giá trị
ngưỡng (threshold) cố định đã làm hạn chế khả năng thích nghi của DAMS và là
nguyên nhân gây ra hiện tượng nhiễu khối ở thành phần màu (chroma) của ảnh khôi
phục và nhiều đốm trên các chi tiết đường nét Yêu cầu khá cao về độ phức tạp tính
toán khi sử dụng phép biến đổi wavelet 2-chiều với bộ lọc Daubechies 4/4 - hệ số, đòi
hỏi phải tính toán trên trường số thực Và cuối cùng là đa số phép lượng tử hóa trong
giải pháp này cũng yêu cầu xử lý trên trường số thực làm cho độ phức tạp tính toán
tăng cao
Sơ lược thực trạng trên cho thấy vấn đề nghiên cứu các giải pháp nén ảnh áp dụng vào
trong công nghệ màn hình tinh thể lỏng vẫn đang cần các nghiên cứu cải tiến và phát triển,
để ngày càng có được các giải pháp hoàn thiện hơn với hiệu năng cao hơn
Trang 201.3 Mục tiêu và phạm vi nghiên cứu của luận án
Mục tiêu của luận án là nghiên cứu phát triển các giải pháp tiên tiến nén dữ liệu ảnh
khung hình áp dụng cho màn hình tinh thể lỏng độ phân giải cao, trên cơ sở phân tích các
công trình đã có để đề xuất cải tiến cải thiện hiệu năng Nghiên cứu kế thừa và phát triển
đề xuất các giải pháp nén mới nâng cao hiệu năng so với những giải pháp hiện đã được đề
xuất
Theo một số các tiêu chí đánh giá hiệu năng nén gồm: chỉ số nén, chất lượng nén, và
độ phức tạp tính toán
Phạm vi nghiên cứu của luận án bao gồm:
1 Nghiên cứu phát triển các giải pháp nén ảnh áp dụng cho màn hình tinh thể lỏng độ
phân giải cao nhằm tăng cường hiệu năng nén
2 Nghiên cứu đề xuất cải tiến các giải pháp để khắc phục những nhược điểm còn tồn tại
trong một số giải pháp nén tiên tiến như AHIC, DAMS, nhằm nâng cao hiệu năng của
giải pháp nén về cải thiện chất lượng ảnh, giảm độ phức tạp tính toán
3 Nghiên cứu phân tích các ưu và nhược điểm của các giải pháp nén ảnh đã có Từ đó đề
xuất xây dựng các giải pháp nén mới thể hiện được nhiều ưu điểm vượt trội về chất
lượng ảnh, tỷ số nén, độ phức tạp tính toán hay sơ đồ thực hiện, có khả năng thích nghi
theo sự thay đổi của tín hiệu ảnh, tránh mắc phải các khuyết điểm về thị giác
1.4 Phương pháp nghiên cứu
- Xác định rõ mục tiêu và phạm vi nghiên cứu
- Phương pháp nghiên cứu kế thừa và phát triển trên cơ sở nghiên cứu phân tích tổng
quan các giải pháp đã đề xuất, cải tiến nâng cao hiệu năng và phát triển đề xuất giải
pháp mới
- Phương pháp nghiên cứu kết hợp giữa lý thuyết và nghiên cứu thực nghiệm cài đặt
chương trình kiểm chứng kết quả, biện luận và giải thích
1 Về nghiên cứu lý thuyết:
Nghiên cứu cơ sở lý thuyết về tín hiệu ảnh và các phép biến đổi tín hiệu ảnh:
Kỹ thuật thay đổi tần số lấy mẫu của tín hiệu (Downsampling, Upsampling)
dùng kỹ thuật lọc số (Filter), chuyển đổi không gian màu (RGB, YCbCr), phép
biến đổi cosin rời rạc DCT (Discrete Cosine Transform), biến đổi sóng con rời
rạc DWT (Discrete Wavelet Transform), kỹ thuật Lifting
Nghiên cứu cơ sở lý thuyết về lượng tử hóa và một số phương pháp lượng tử
như: Phương pháp tối ưu sai số trung bình bình phương hay lượng tử hóa
Trang 21Lloyd-Max, phương pháp lượng tử hóa tối ưu với đầu vào có phân phối đều,
các phương pháp lượng tử hóa thích nghi
Dùng một số độ đo đánh giá chất lượng nén: Độ đo sai số trung bình bình
phương MSE (Mean Squared Error), độ đo tỷ số tín hiệu mức đỉnh /nhiễu
PSNR (Peak Signal-to-Noise Ratio)
2 Về nghiên cứu thực nghiệm:
Đã tiến hành cài đặt lập trình thực nghiệm trên môi trường máy tính PC cho hầu
hết các giải pháp nén tiên tiến được xem xét và đánh giá trong luận án
Tạo lập môi trường thực nghiệm phù hợp với môi trường thực tế của bài toán
thông qua công cụ Simulink để có những quan sát trực quan và đưa ra những
đánh giá phù hợp với bài toán
Thực nghiệm đo lường, thống kê số liệu tạo cơ sở cho các phân tích đánh giá
1.5 Ý nghĩa khoa học và thực tiễn của đề tài
Ý nghĩa khoa học của luận án được thể hiện trong đề xuất hai giải pháp tiên tiến nén
ảnh khung hình, nâng cao về hiệu năng nén nhằm áp dụng cho hệ thống màn hình tinh thể
lỏng, “Advanced Robust Adaptive Image Coding” và “Wavelet Lifting Transform base
Multi-Adaptive Image Coding”, tương ứng với hai hướng tiếp cận khác nhau mà luận án đã
thực hiện Đề xuất phát triển về kỹ thuật lượng tử hóa, kỹ thuật tối ưu hóa quá trình lượng
tử các khối ảnh thông qua giải pháp phân phối bit, những kỹ thuật mới được đề xuất này
không bị bó hẹp trong lĩnh vực nén ảnh khung hình cho màn hình tinh thể lỏng mà chúng
có khả năng áp dụng cho lĩnh vực nén ảnh nói chung
Ý nghĩa thực tiễn của luận án được thể hiện qua các giải pháp nén đề xuất hướng áp
dụng vào công nghệ màn hình tinh thể lỏng cho phép sản xuất thế hệ màn hình tinh thể
lỏng có độ phân giải cao, chất lượng hiển thị hình ảnh tốt với một giá thành thấp hơn Ví
dụ với chuẩn công nghệ màn hình UHD 8K (Ultra High Definition) Đến thời điểm này,
năm 2015, nhiều nhà sản xuất màn hình tinh thể lỏng trên thế giới đã cho ra đời thế hệ màn
hình chuẩn UHD 8K có độ phân giải 7680×4320 với tốc độ khung hình là 120fps (frames
per second), dẫn đến yêu cầu về tốc độ truy xuất dữ liệu bộ nhớ khung hình bị đẩy lên đến
mức 178 GB/s, một tốc độ quá cao so với nền tảng công nghệ sản xuất bộ nhớ DRAM hay
DDRAM hiện tại, khiến cho giá thành thiết kế bộ nhớ khung hình trở nên rất đắt đỏ Từ đó
vấn đề nén ảnh khung hình càng trở nên bức thiết hơn nhằm giảm tốc độ truy xuất dữ liệu
bộ nhớ, tiến đến hạ giá thành sản phẩm Để trong tương lai gần sản phẩm thật sự phù hợp
với túi tiền của đa số người tiêu dùng Giúp người tiêu dùng có cơ hội bắt kịp được với sự
chuyển mình của ngành công nghiệp sản xuất nội dung truyền hình và video, khi mà phần
Trang 22lớn các hãng truyền thông và sản xuất nội dung video lớn trên thế giới, các hãng truyền
hình lớn trên các châu lục đã và đang bắt đầu quá trình chuyển đổi sang chuẩn UHD
Tóm lại, có thể khẳng định rằng đề tài của luận án này thật sự mang nhiều ý nghĩa
khoa học và thực tiễn
1.6 Bố cục luận án
Bố cục của luận án gồm 5 chương, ngoài hai chương MỞ ĐẦU và KẾT LUẬN, ba
chương còn lại tập trung vào trình bày lý thuyết tổng quan cũng những kết quả nghiên cứu
mà luận án đã đạt được, cụ thể:
Chương 2: Trình bày sơ lược về lịch sử phát triển của công nghệ màn hình tinh thể
lỏng và kỹ thuật tăng tốc overdrive giúp tăng tốc độ đáp ứng của các phần tử tinh thể lỏng
Một số cơ sở lý thuyết áp dụng trong bài toán nén ảnh khung hình Nghiên cứu tổng quan
về lĩnh vực nén ảnh khung hình trong hệ thống overdrive Phân tích và thực nghiệm nhằm
đánh giá ưu và nhược điểm của một số giải pháp nén ảnh tiên tiến đã được đề xuất áp dụng
cho màn hình tinh thể lỏng Trên cơ sở đó đưa ra một số định hướng nghiên cứu cải tiến
Chương 3: Nghiên cứu và phân tích sâu hơn các khuyết điểm trong một số giải pháp
nén ảnh tiên tiến sử dụng nền tảng cơ bản là các kỹ thuật mã hóa khối và biến đổi không
gian màu Từ đó đề xuất các kỹ thuật khắc phục áp dụng vào trong các sơ đồ giải pháp cải
tiến nhằm nâng cao hiệu năng nén Nghiên cứu đề xuất áp dụng lý thuyết phân phối bít vào
nén ảnh khung hình cùng một số kỹ thuật lượng tử hóa tối ưu, dựa vào đó từng bước nâng
cao chất lượng nén và giảm độ phức tạp tính toán qua từng giải pháp Kết quả đã đạt được
một số đề xuất cải tiến có tính kế thừa từng bước một nhằm nâng cao chất lượng ảnh hay
cải thiện độ phức tạp tính toán Sau cùng, luận án đã đi đến được một giải pháp nén ảnh
khung hình có tính tiên tiến về hiệu năng với tên gọi ARAIC, mang lại sự cải tiến vượt trội
về chất lượng ảnh, giảm độ phức tạp tính toán và sơ đồ kiến trúc thực thi có phần tinh gọn
Tất cả các đề xuất trong chương này đều được cài đặt thực nghiệm, phân tích, so sánh và
đánh giá
Chương 4: Nghiên cứu và phân tích các nhược điểm của giải pháp nén ảnh DAMS Từ
đó tìm kiếm giải pháp khắc phục thông qua các đề xuất như kỹ thuật ngưỡng thích nghi, kỹ
thuật biến đổi wavelet lifting integer to integer, và một số điều chỉnh về sơ đồ giải pháp
Trải qua hai giai đoạn nghiên cứu cải tiến và phát triển có tính kế thừa: Giai đoạn một luận
án đã đưa ra đề xuất cải tiến DAMS bằng cách tích hợp kỹ thuật ngưỡng thích nghi để hình
thành nên giải pháp DBMAIC cho khả năng thích nghi cao và mang lại chất lượng ảnh
vượt trội; Giai đoạn hai là cải thiện độ phức tạp tính toán của DBMAIC với kỹ thuật biến
đổi tín hiệu ảnh Wavelet Lifting Integer to Integer, cùng một số cải tiến về mặt lượng tử để
Trang 23hình thành nên giải pháp WLT-MAIC Những phân tích và đánh giá cho thấy tính tiến tiến
của WLT-MAIC thể hiện qua hiệu năng vượt trội của nó so với giải pháp gốc DAMS
Trong chương này cũng đồng thời đưa ra các so sánh và đánh giá giữa hai hướng tiếp cận
trong luận án Tập trung một số phân tích và đánh giá so sánh trên hai kết quả tốt nhất của
hai hướng tiếp cận là ARAIC và WLT-MAIC, các so sánh và đánh giá nhằm thể hiện rõ
những ưu - khuyết điểm và đưa ra những nhận định hay khuyến nghị đối với nhà sản xuất
khi chọn lựa giải pháp Cuối cùng là phần so sánh đánh giá với 2 giải pháp nén tiên tiến nổi
bật nhất mới được đề xuất trên thế giới vào cuối giai đoạn nghiên cứu của luận án là LTC
[22] và SAMS [11]
Chương 5: Tóm tắt các nội dung nghiên cứu chính của luận án Trình bày cô đọng các
kết quả mới mà luận án đã đạt được, và cuối cùng là nêu lên hướng phát triển tiếp theo của
luận án
Trang 24CHƯƠNG 2: TỔNG QUAN VỀ VẤN ĐỀ NÉN ẢNH CHO
MÀN HÌNH TINH THỂ LỎNG
Trong chương này luận án sẽ trình bày sơ lược về lịch sử phát triển của màn hình tinh
thể lỏng và kỹ thuật tăng tốc overdrive, vấn đề nén ảnh áp dụng cho hệ thống overdrive của
của màn hình tinh thể lỏng, mối tương quan giữa chất lượng nén và chất lượng ảnh hiển thị
trên màn hình, một số yêu cầu đặc trưng cho hệ thống nén ảnh trên màn hình tinh thể lỏng,
tổng quan về nén ảnh nhằm giảm bộ nhớ khung hình trong màn hình tinh thể lỏng Và sau
cùng là một số cơ sở lý thuyết có liên quan Kỹ thuật nén ảnh trình bày trong chương này
sẽ được giới hạn trong không gian hai chiều (chiều rộng và chiều cao)
2.1 Lịch sử phát triển của màn hình tinh thể lỏng và vấn đề chất
lượng hiện thị hình ảnh động
2.1.1 Lịch sử phát triển của màn hình tinh thể lỏng
Ngày nay, trong giai đoạn phát triển bùng nổ của các thiết bị kỹ thuật số thì màn hình
tinh thể lỏng trở nên quá gần gũi với chúng ta Chúng ta có thể thấy màn hình tinh thể lỏng
được lắp đặt trong khá nhiều thiết bị Từ đồng hồ kỹ thuật số, cho đến máy tính cá nhân,
điện thoại di động, ti-vi LCD và ti-vi LED trong các hộ gia đình, hay các thiết bị giải trí
đang rất thời thượng và được đông đảo giới trẻ đón nhận như máy tính bảng, máy đọc
sách,…v.v
Để có được sự phát triển và ứng dụng mãnh mẽ như ngày nay thì màn hình tinh thể
lỏng đã có một lịch sử phát triển lâu dài qua nhiều giai đoạn Mốc lịch sử đầu tiên phải kể
đến đó là và năm 1888, nhà thực vật học và hóa học người Áo, Friedrich Reinitzer, đã tìm
ra các phần tử tinh thể (liquid-crystal) trong chất béo được chiết xuất từ cà-rốt Đến năm
1962, nhà nghiên cứu Richard Williams đã tạo mẫu dạng sọc (stripe-patterns) trong một
lớp mỏng của vật liệu tinh thể lỏng bằng cách ứng dụng tác động điện áp lên các tinh thể
Hiệu ứng này được dựa trên sự tạo hình bất ổn định điện-thủy động lực
(electro-hydrodynamic instability forming) Năm 1958, Dr Glenn Brown là người viết bài báo đầu
tiên nghiên cứu về màn hình tinh thể lỏng ở Mỹ Giữa những năm 1964 và 1968, tại trung
tâm nghiên cứu RCA David Sarnoff ở Princeton, bang New Jersey của Mỹ, một nhóm các
kỹ sư và các nhà khoa học dẫn đầu bởi George Heilmeier với Louis Zanoni và Lucian
Barton, đã phát minh ra một phương pháp sử dụng điện áp để điều khiển ánh sáng phản xạ
từ các phần tử tinh thể lỏng, nó minh chứng cho màn hình tinh thể lỏng đầu tiên Công việc
Trang 25của họ đã mở ra một ngành công nghiệp toàn cầu sản xuất hàng triệu màn hình tinh thể
lỏng từ đó đến nay
Màn hình tinh thể lỏng của Heilmeier sử dụng phương pháp tán xạ động mà ông gọi là
DSM (Dynamic Scattering Method), trong đó một vật mang điện được áp dụng để sắp xếp
lại các phân tử vì thế chúng có thể tán xạ ánh sáng Thiết kế DSM làm việc kém và đã
được chứng minh là quá tốn năng lượng Nó đã được thay thế bởi một phiên bản cải tiến,
sử dụng các tinh thể dạng xoắn hay còn gọi là các tinh thể nematic hoạt động hiệu quả hơn,
phát minh bởi James Fergason vào năm 1969 Nhà phát minh sáng chế James Fergason
nắm giữ một số bằng sáng chế cơ bản trong lĩnh vực màn hình tinh thể lỏng vào đầu những
năm 1970, bao gồm cả bằng sáng chế ở Mỹ có tính then chốt mang số hiệu US3,731,986
cho "Display Devices Utilizing Liquid Crystal Light Modulation" Năm 1972, Công ty
International Liquid Crystal (ILIXCO) thuộc sở hữu của James Fergason đã sản xuất đồng
hồ màn hình tinh thể lỏng hiện đại đầu tiên dựa trên bằng sáng chế của James Fergason
Đến năm 1973, Hãng Sharp đã sản xuất ra chiếc máy tính di động đầu tiên sử dụng màn
hình màn hình tinh thể lỏng theo công nghệ DSM (nguồn [4], [27])
Hình 2.1 Mô tả cấu tạo màn hình TFT-LCD
Năm 1979, Walter Spear và Peter LeComber đã tạo ra màn hình màu đầu tiên dùng
công nghệ TFT (Thin-Film Transistor) Năm 1985, Seiko-Epson công bố sản phẩm “TV
set” màu thương mại đầu tiên, nó có kích thước hiển thị là 2 inch Năm 1992, Sharp đã
phát triển thành công sản phẩm màn hình tinh thể lỏng kích thước 16.5 inch tương thích
với việc hiển thị hình ảnh đa phương tiện (multimedia-compatible) Năm 2004, hãng
Philips đã trưng bày một màn hình tinh thể lỏng 20 inch theo công nghệ hiện thị ba chiều
(3-D) tại hội chợ thương mại CeBIT ở Hannover nước Đức Năm 2005, hãng Sammung đã
phát triển màn hình lớn nhất thế giới lúc bấy giờ có kích thước 82 inch hiển thị theo chuẩn
định dạng có độ phân giải cao “Full HD” dùng công nghệ TFT Cho đến thời điểm hiện
nay, năm 2014, thì hầu hết các hãng sản xuất màn hình tinh thể lỏng lớn trên thế giới đều
đã cho ra đời các sản phẩm màn hình tinh thể lỏng độ phân giải UHD 4K, mặc dù hiện tại
Trang 26giá thành của chúng còn rất đắt Và trong một tương lai không xa, các sản phẩm màn hình
tinh thể lỏng độ phân giải UHD 8K có thể sẽ trở nên phổ biến
2.1.2 Vấn đề chất lƣợng hiển thị hình ảnh động trên màn hình tinh thể lỏng
Như đã nói ở trên, màn hình tinh thể lỏng đã trở nên rất phổ biến trên thị trường thiết
bị giải trí gia dụng cũng như trong công nghiệp Tuy nhiên, điểm yếu của nó là hiện tượng
hiển thị không rõ nét, hay bị nhòe, đối với các cảnh động, được gọi là hiệu ứng
motion-blur, được minh họa qua Hình 2.2 Nguyên nhân là do các phần tử tinh thể lỏng đáp ứng lại
sự thay đổi độ sáng khi chuyển đổi từ khung hình trước sang khung hình sau với một tốc
độ chậm (slow response) Trong tình huống xấu nhất, các phần tử tinh thể xoắn nematic có
thể phải mất khoảng 67-84ms để hoàn thành việc chuyển đổi độ sáng [25], trong khi đó
theo chuẩn hiển thị hình ảnh chuyển động thì mỗi giây cần hiển thị tối thiểu 30 khung hình,
hay nói cách khác là tốc độ đáp ứng của các phần tử phải không vượt quá 33ms Để giải
quyết vấn đề trên, người ta đã từng nghiên cứu và phát triển các chất tinh thể lỏng mới có
thời gian đáp ứng nhanh hơn Tuy nhiên, rất đáng tiết là những kết quả mang lại không đủ
để cải thiện tốc độ đáp ứng chậm đối với các mức xám, vì vấn đề thời gian đáp ứng chậm
liên quan đến động lực của tinh thể (LC operation dynamics) [25] Một vài phương pháp
tiếp cận khác để giải quyết vấn đề tốc độ đáp ứng chậm là phát triển và hoàn thiện mô hình
tinh thể lỏng mới như “OCB” hay “MVA Driven by Oblique Electric Field” Tuy nhiên,
những mô hình mới này có yêu cầu khác biệt về thiết kế (design), xử lý (process), và
nguyên liệu Bởi vậy, chúng có một số bất lợi như ảnh hưởng đến hiệu năng hiển thị với lợi
nhuận và năng suất Do đó, những mô hình mới này vẫn không thành công trong việc
chuyển đổi thành các sản phẩm
Hình 2.2 Minh họa hiện tượng Motion-Blur trên màn hình tinh thể lỏng
Một hướng nghiên cứu khác có tính thực tiễn hơn nhằm giải quyết vấn đề trên đã được
K Nakanishi, S Takahashi, H Oura và các đồng nghiệp đề xuất trong [25] với tên gọi kỹ
thuật FFD (Feedforward Driving) Kỹ thuật này giúp cải thiện tốc độ đáp ứng của các phần
tử tinh thể xuống dưới 20ms, bằng cách ghép thêm vào hệ thống một mạch FFD trên nền
kiến trúc truyền thống của màn hình tinh thể lỏng sử dụng các tinh thể xoắn nematic Kỹ
thuật FFD có thể được mô ta qua Hình 2.3 Kỹ thuật FFD còn được biết đến với tên gọi
khác là kỹ thuật “overdrive” cho màn hình tinh thể lỏng
Illustration of Motion Blur
Trang 27Hình 2.3 Sơ đồ khối của màn hình tinh thể lỏng 15inch XGA dùng kỹ thuật FFD [25]
2.2 Overdrive – một kỹ thuật tăng tốc độ đáp ứng cho các phần
tử tinh thể lỏng
Như đã đề cập ở phần trước, kỹ thuật overdrive giúp tăng tốc độ đáp ứng cho các phần
tử tinh thể Khả năng tăng tốc cho các phần tử tinh thể của overdrive dựa trên ý tưởng khá
đơn giản là: điện áp liên quan đến động lực chuyển động của các tinh thể, vì vậy điện áp
càng lớn thì tốc độ chuyển động càng cao, hay nói cách khác là các phần tử tinh thể sẽ đáp
ứng nhanh hơn khi điện áp được tăng lên Vì vậy hệ thống overdrive sẽ sinh ra một điện áp
hợp lý cao hơn mức điện áp vốn được áp dụng trong kỹ thuật cũ trước đây để cải thiện tốc
độ đáp ứng xuống mức dưới 20ms
Hình 2.4 Đồ thị độ chói - thời gian đáp ứng mô tả cách thức xác định điện áp tăng tốc
Hình 2.4 mô tả cách thức để xác định điện áp tăng tốc Giả sử rằng độ chói hiện tại
đang thể hiện tại một điểm ảnh (x,y) nào đó trên màn hình là 105 cd/m2
, và sang khung hình tiếp theo chúng ta cần giảm về mức 60 cd/m2, thì mức điện áp được áp dụng sẽ lần
lượt là 1.31V và 1.75V Dưới điều kiện điện áp thay đổi đơn giản từ 1.31V đến 1.75V thì
thời gian đáp ứng sẽ kéo dài đến 45ms Để hoàn thành việc chuyển đổi từ mức độ chói hiện
tại (105 cd/m2) sang mức độ chói kế tiếp (60 cd/m2) với ngưỡng thời gian đáp ứng mong
muốn là 16.7ms thì mức điện áp cần áp dụng phải tăng từ 1.75V lên mức 2.27V như trong
Hình 2.4 Và Bảng 2.1 cho phép chúng ta xác định được mức điện áp tăng tốc cần phải áp
Trang 28dụng để chuyển đổi từ một trong các mức độ chói hiện tại sang mức độ chói tiếp theo ở
mức 60cd/m2 với thời gian đáp ứng là 16.7ms (nguồn [25])
Bảng 2.1 Điện áp tăng tốc áp dụng để chuyển đổi từ mức độ chói hiện tại sang mức
độ chói tiếp theo ở mức 60cd/m 2
với thời gian đáp ứng 16.7ms (nguồn [25])
Độ chói hiện tại [cd/m2
Từ đó chúng ta thấy rằng kỹ thuật overdrive được thực hiện dựa vào một bảng tra
(Lookup Table) được chứa trong ROM (xem Hình 2.3) nhằm xác định ra mức điện áp tăng
tốc cần áp dụng trên một điểm ảnh, dựa vào cặp giá trị mức chói của điểm ảnh đó trong
quá khứ và hiện tại, với thời gian chuyển đổi trong ngưỡng 16.7ms Khái niệm overdrive
được minh họa một cách khái quát và trực quan hơn qua Hình 2.5 dưới đây:
Hình 2.5 Minh họa giải pháp tăng tốc độ chuyển đổi mức xám (hay độ chói) thông
qua cơ chế hiệu chỉnh tăng ngưỡng điện áp
Hình 2.6 So sánh thời gian đáp ứng (nguồn [25]) (a) Kỹ thuật điều khiển (dẫn động)
thông thường (b) Kỹ thuật overdrive
Hình 2.6 cho thấy khả năng cải thiện thời gian chuyển đổi mức sáng trên màn hình
tinh thể lỏng khi áp dụng kỹ thuật tăng tốc overdrive (hình (b)) so với khi không áp dụng
Trang 29kỹ thuật tăng tốc overdrive (hình (a)) Dễ thấy là thời gian chuyển đổi giữa hai mức sáng
bất kỳ đã được cải thiện xuống dưới mức 16.7ms
2.3 Mô hình hệ thống Overdrive và yêu cầu nén ảnh giảm bộ nhớ
khung hình
2.3.1 Mô hình hệ thống overdrive
Kỹ thuật overdrive có thể được áp dụng trên các hệ thống màn hình tinh thể lỏng với
mô hình đơn giản thể hiện qua Hình 1.2 (trang 2) Có thể mô tả hoạt động của hệ thống
overdrive đơn giản như sau: Khi giá trị một điểm ảnh trong khung hình hiện tại (Fn) được
chuyển đến thì nó cần tham chiếu đến giá trị cũng của điểm ảnh đó nhưng trong khung
hình thời điểm trước đó (Fn-1) được lưu trữ trong bộ nhớ khung hình (Frame Memory), sử
dụng cặp giá trị này làm chìa khóa tìm kiếm trong một bảng tra (Lookup table), để cho ra
kết quả là giá trị hiệu điện thế tăng tốc cần áp dụng lên phần tử tinh thể tại điểm ảnh đang
xét để tăng tốc độ đáp ứng của nó, giúp cho điểm ảnh hiển thị chính xác trong khoảng thời
gian chuyển đổi ngắn
Với sự ra đời của các chuẩn định dạng truyền hình và video độ phân giải cao (HD) và
siêu cao (UHD) đã đẩy yêu cầu về dung lượng bộ nhớ lưu trữ khung hình tăng lên mức cao
hay rất cao, cùng với yêu cầu về băng thông bộ nhớ cũng tăng vọt theo sự tăng trưởng của
độ phân giải và khả năng hiển thị khung hình với tốc độ cao của thiết bị màn hình Bảng
2.2 thể hiện yêu cầu về dung lượng và băng thông của bộ nhớ dùng trong màn hình tinh thể
lỏng, theo các chuẩn định dạng HD 720p/1080p hay UHD 4K/8K khi thiết kế tốc độ hiển
thị khung hình ở các mức 30, 60 hay 120 khung hình trên một giây
Bảng 2.2 Yêu cầu dung lượng và tốc độ truyền tải dữ liệu của bộ nhớ khung hình trên
Ti-vi chuẩn HD và UHD
(Mbit)
Băng thông (Gbit/s)
Trang 30Trong hệ thống overdrive hoạt động ở tốc độ 120 khung hình một giây, thì sẽ cần 120
lần ghi dữ liệu ảnh khung hình vào bộ nhớ và 120 lần đọc dữ liệu ảnh khung hình từ bộ
nhớ một cách đồng bộ Vậy tổng số dữ liệu trao đổi với bộ nhớ trong một giây là:
(120+120) * Dung lượng dữ liệu ảnh khung hình Từ đó cho chúng ta công thức tính yêu
cầu dung lượng và băng thông đối với bộ nhớ khung hình cho bảng trên là: Yêu cầu dung
lượng: (Số cột × Số dòng) × 24bit; Yêu cầu băng thông: (Tốc độ khung hình × 2) × Yêu cầu
dung lượng Ví dụ với UHD 4320p /120fps (8K): Yêu cầu dung lượng =
Thông thường bộ nhớ khung hình được thiết kế bởi bộ nhớ DRAM [25][18], mà giá
thành của DRAM lại phụ thuộc vào dung lượng và tốc độ trao đổi dữ liệu [18] Khi yêu
cầu về dung lượng và tốc độ trao đổi dữ liệu của bộ nhớ DRAM bị đẩy lên cao đã làm tăng
giá thành của sản phẩm màn hình Điều đó làm nảy sinh nhu cầu áp dụng kỹ thuật nén ảnh
khung hình vào hệ thống overdrive để giảm yêu cầu về dung lượng và tốc độ trao đổi dữ
liệu của bộ nhớ DRAM, tiến đến giảm giá thành của sản phẩm màn hình tinh thể lỏng
2.3.2 Vấn đề yêu cầu nén ảnh khung hình cho màn hình tinh thể lỏng
Hình 2.7 Mô hình một hệ thống overdrive có sử dụng kỹ thuật nén ảnh nhằm giảm yêu
cầu về dung lượng và tốc độ truy xuất dữ liệu của bộ nhớ khung hình
Mô hình của một hệ thống overdrive trong màn hình tinh thể lỏng có sử dụng kỹ thuật
nén ảnh nhằm giảm yêu cầu về dung lượng và tốc độ trao đổi dữ liệu của bộ nhớ khung
hình được thể hiện qua Hình 2.7 Trong đó, dữ liệu của ảnh khung hình hiện tại (Fn) được
nén lại bởi bộ nén (frame encoder) để giảm dung lượng trước khi chuyển vào frame
memory, đồng thời bộ giải nén (frame decoder) sẽ đọc dữ liệu nén trong frame memory để
Overdrive
(LUT)
Dữ liệu khôi phục của khung hình thời điểm trước
Overdriven Frame
Dữ liệu khung hình hiện tại
Fn
Frame memory
Dữ liệu khung hình
Frame encoder
Frame decoder
𝐹 𝑛−1Codec module
Trang 31khôi phục lại dữ liệu ảnh khung hình ở thời điểm trước đó (Fn-1) cung cấp cho bộ
overdrive, nhằm phối hợp với dữ liệu của ảnh khung hình hiện tại để tìm ra điện áp tăng
tốc
Hình 2.8 thể hiện phạm vi áp dụng của bài toán nén ảnh khung hình cho màn hình
tinh thể lỏng là ở khâu tái tạo và hiển thị
Hình 2.8 Phạm vi áp dụng của bài toán nén ảnh khung hình cho màn hình tinh thể
lỏng độ phân giải cao
Ở đây có một số khái niệm cần làm rõ:
+ Ảnh khung hình trong hệ thống overdrive, chính là một ảnh để có thể hiện thị đầy đủ
trên màn hình tinh thể lỏng, có số điểm ảnh tương ứng với độ phân giải màn hình được xác
định bởi nhà sản xuất Do đó ảnh khung hình của màn hình tinh thể lỏng độ phân giải cao
sẽ có số điểm ảnh rất lớn, và đòi hỏi cao về dung lượng frame memory để lưu trữ
+ Tốc độ hiển thị khung hình của màn hình tinh thể lỏng được xác định bởi nhà sản
xuất chứ không phụ thuộc vào định dạng video cần hiển thị Hiện nay hầu hết các nhà sản
xuất đều đã cho ra đời các sản phẩm màn hình có tốc độ khung hình là 120fps, độ phân giải
siêu cao (4K đến 8K), các sản phẩm này thường có bộ chuyển đổi cho phép chuyển đổi độ
phân giải và tốc độ khung hình của nguồn dữ liệu đầu vào cho phù hợp với các thông số
của màn hình trước khi được chuyển đến hệ thống hiện thị
Vấn đề đặt ra cho bài toán nén ảnh khung hình cho màn hình tinh thể lỏng độ phân
giải cao là:
- Đầu vào là ảnh khung hình có độ phân giải cao, với rất nhiều điểm ảnh cần xử lý
- Đầu ra để phục vụ cho khâu hiện thị ảnh trên màn hình
tinh thể lỏng phục vụ cho khâu
tái tạo và hiển thị
Áp dụng các chuẩn nén ảnh/video thông dụng: JPEG, MPEG, AVI,
Trang 32- Bộ nén (codec) phải thực hiện đồng thời hai nhiệm vụ nén dữ liệu (encode) và giải nén
dữ liệu (decode) với khối lượng dữ liệu lớn trong một khoảng thời gian ngắn, ví dụ với
màn hình có tốc độ 120fps thì khoảng thời gian chỉ ở mức 1/120 giây Vì vậy bộ nén
phải đảm bảo tốc độ xử lý cao
- Chất lượng ảnh phải cao để đảm bảo độ trung thực cho hệ thống hiển thị
- Tỷ số nén lớn và độ phức tạp tính toán không cao để đảm bảo tính thực tiễn khi triển
khai áp dụng thực tiễn
Với những yêu cầu trên, có thể thấy giải quyết bài toán nén ảnh khung hình cho màn
hình tinh thể lỏng độ phân giải cao là một nhiệm vụ không đơn giản Cần có những nghiên
cứu để có thể đưa ra được các giải pháp nén phù hợp với những yêu cầu nói trên Để có thể
triển khai áp dụng vào thực tiễn nhằm giảm giá thành cho hệ thống overdrive
2.3.3 Các đặc trưng của phương pháp nén ảnh áp dụng cho hệ thống
Overdrive
Từ bối cảnh thực tế của bài toán nén ảnh khung hình và mô hình hệ thống overdrive có
áp dụng các khối nén và giải nén ở trên, có thể rút ra một số đặt trưng của phương pháp
nén ảnh áp dụng cho hệ thống Overdrive như sau:
1 Bài toán nén ảnh khung hình trong màn hình tinh thể lỏng là nhằm mục đích giảm
yêu cầu về dung lượng và tốc độ trao đổi dữ liệu (hay băng thông) của bộ nhớ
khung hình trong hệ thống overdrive, giúp giảm giá thành chế tạo hệ thống
overdrive tiến đến giảm giá thành sản phẩm Khác với phần lớn các phương pháp
nén ảnh hay video thông thường vốn nhằm mục đích giảm dung lượng lưu trữ trên
các thiết bị nhớ hoặc giảm băng thông trên đường truyền mạng
2 Tỷ số nén đạt được phải có tính ổn định, ví dụ Cr = 2, 3, 4, hay 6, để các nhà sản
xuất có thể xác định được chính xác thông số cần chế tạo Đây cũng là điểm khác
biệt so với các phương pháp nén ảnh thông thường nhằm giảm dung lượng lưu trữ
như chuẩn JPEG hay JPEG2000, với tỷ số nén phụ thuộc phần lớn vào nội dung
của ảnh và mức độ tổn hao mà người dùng chọn lựa
3 Sự tổn hao do nén phải ở mức thấp để giảm thiểu ảnh hưởng (gián tiếp qua hệ
thống overdrive) đến chất lượng hiện thị hình ảnh trên màn hình Từ đó yêu cầu
đặt ra cho các giải pháp nén ảnh khung hình là chất lượng ảnh khôi phục phải cao
Đồng thời hình ảnh hiện thị trên màn hình phải đảm bảo tính trung thực về thị giác
trong bối cảnh các hình ảnh được hiển thị liên tục (60fps hay 120fps), tránh hay
giảm thiểu các hiện tượng nhiễu (noise), rung (vibrate effect), khối (blocking
effect) vốn rất nhạy cảm với mắt người xem khi quan sát chuỗi hình ảnh liên tục
Đây là điểm khác biệt so với các chuẩn nén ảnh JPEG hay JPEG2000 Bối cảnh áp
dụng thông thường của JPEG hay JPEG2000 là nén các bức ảnh rời rạc (không thể
hiện tính liên tục của chuyển động như trong video), các hình ảnh giải nén sau đó
thường được in ấn hay hiển thị rời rạc, do đó một số khiếm khuyết về đường nét
chi tiết trên ảnh nén cũng khó được người xem nhận ra khi quan sát thông thường
Trang 33Đây chính là một trong các yêu tố giúp những chuẩn nén ảnh như JPEG hay
JPEG2000 nâng tỷ số nén lên rất cao, đổi lại bằng sự suy giảm chất lượng ảnh khôi
phục, nhưng vẫn dễ dàng nhận được sự chấp nhận của người dùng
4 Đảm bảo khả năng thực hiện theo thời gian thực (real time), hay nói cách khác là
tốc độ xử lý phải đảm bảo sự đồng bộ giữa các bộ phận trong hệ thống overdrive
theo đúng tốc độ được đặt ra cho toàn bộ hệ thống Đồng thời yêu cầu độ phức tạp
tính toán và kiến trúc thực thi cho giải pháp phải ở mức chấp nhận được theo
nghĩa: không yêu cầu một kiến trúc phần cứng cồng kềnh phức tạp, năng lực xử lý
mạnh (High-Powered Processors), vì như thế sẽ làm cho giá thành của hệ thống
overdrive tăng lên, làm giảm hay mất đi tính khả thi về mặt kinh tế Đây cũng là
điểm khác biệt so với các giải pháp nén ảnh thông thường, vốn chỉ nén các bức ảnh
rời rạc để lưu trữ nên chủ yếu đặt nặng vấn đề tỷ số nén, không đòi hỏi quá cao về
mặt tốc độ, và có thể chấp nhận các thuật toán khá phức tạp vì không đòi hỏi sự
đồng bộ khắc khe
2.4 Mô hình hệ thống nén ảnh dùng cho hệ thống overdrive
2.4.1 Hệ thống nén ảnh khung hình
Từ các đặc trưng của giải pháp nén ảnh áp dụng cho hệ thống overdrive là phải có tỷ
số nén ổn định, theo nghĩa phải đạt được tỷ số nén luôn nhỏ hơn hoặc bằng một hằng số
Và hơn thế nữa là một tỷ số nén cao nhằm tối đa hóa hiệu xuất cải thiện dung lượng bộ nhớ
và băng thông, vì vậy các giải pháp nén ảnh đề xuất áp dụng cho hệ thống overdrive nói
chung đều ở dạng có mất mát thông tin (lossy) hoặc mất mát rất ít thông tin (near-lossless),
thường áp dụng kỹ thuật mã hóa với độ dài từ mã cố định (Fixed-Length Codeword) để
luôn đạt được một tỷ số nén ở mức đáng kể và có tính ổn định, có thể áp dụng lên phần
cứng (hardware)
Dựa trên mô hình áp dụng cho các giải pháp nén ảnh trong truyền thông nói chung với
ba thành phần chính gồm: Biến đổi, Lƣợng tử hóa, và Mã hóa (Hình 2.9) Cùng với sự
phân tích các đặc trưng riêng mà một giải pháp nén áp dụng cho hệ thống overdrive cần có
Chúng tôi đề nghị mô hình khái quát chung với ít nhiều chi tiết dễ hiểu cho giải pháp nén
ảnh áp dụng vào hệ thống overdrive như thể hiện trong Hình 2.10 sau đây:
Hình 2.9 Mô hình với ba thành phần chính trong một hệ thống nén ảnh áp dụng trong
Lượng tử hóa (Quantization)
Mã hóa (Encode)
Dữ liệu nén (Data coded)
Trang 34Hình 2.10 Mô hình khái quát với bốn thành phần chính trong một hệ thống nén ảnh
áp dụng cho overdrive trong màn hình tinh thể lỏng
Về mặt nguyên lý, mô hình chung giải pháp nén ảnh áp dụng cho hệ thống overdrive
trong màn hình tinh thể lỏng sử dụng ba thành phần chính như đã nêu trong mô hình chung
của giải pháp nén cho truyền thông Tuy nhiên có một số điểm khác sau:
- Mã hóa: có hai kỹ thuật mã hóa chính là gán từ mã có cùng độ dài (uniform-length hay
fixed-length) vốn rất đơn giản và sẽ cho ra một tỷ số nén cố định và gán từ mã với độ
dài biến đổi (variable-length) dựa trên số liệu thống kê hay độ đo entropy của thông tin
với độ phức tạp tính toán khá cao và không đảm bảo một tỷ số nén ổn định cần thiết
cho mô hình nén trong hệ thống overdrive Qua nghiên cứu các giải pháp nén ảnh cho
màn hình tinh thể lỏng đã được đề xuất, tất cả đều sử dụng kỹ thuật gán từ mã cố định
Đó chính là lý do cho đề xuất chỉ sử dụng dạng uniform-length codeword assignment
trong luận án này
- Bộ đệm dòng: để nhấn mạnh số dòng cần tích lũy (không thể là toàn bộ bức ảnh) trước
khi thực hiện các công đoạn biến đổi hay lượng tử, được xem xét như một phần của sự
phức tạp trong kiến trúc thực thi của giải pháp nén
Một số tính chất sau cũng cần được đảm bảo khi nghiên cứu đề xuất một giải pháp nén
ảnh cho hệ thống ovedrive trong màn hình tinh thể lỏng:
Các phép biến đổi và lượng tử hóa xử lý với dữ liệu đầu vào là các dòng ảnh (line
image) hoặc khối ảnh (block image), và việc lựa chọn kích thước của dòng ảnh hay
khối ảnh luôn cần được cân nhắc và đánh giá, bởi ngoài mối liên hệ đến chất lượng
và tỷ số nén nó còn liên quan đến kích thước bộ đệm dòng (N-line buffer), vốn
được thiết kế bởi SRAM nhằm đảm bảo tốc độ liên kết giữa memory (cache) và bộ
xử lý ảnh được đồng bộ Vì vậy việc xem xét đánh giá hay nghiên cứu đề xuất các
giải pháp nén ảnh cho overdrive rất cần xem xét đến yếu tố kích thước bộ đệm
dòng như là một phần chủ đề của sự phức tạp cho phần cứng
Để tăng hiệu quả của giải pháp nén ảnh, thông thường người ta có xu hướng sử
dụng kết hợp một vài phép biến đổi với nhau, song trong lựa chọn này nhất thiết
phải chú ý đến độ phức tạp tính toán và khả năng thực hiện thời gian thực
Việc chọn lựa giải pháp mã hóa cũng cần có chú ý tương tự Để đảm bảo độ phức
tạp tính toán chung của cả giải pháp nén, và khả năng thực hiện thời gian thực
Như đã được đề cập ở trên, rõ ràng phương pháp nén ảnh áp dụng cho hệ thống
overdrive có những đặc trưng riêng, chuyên biệt cho bài toán nén nhằm giảm dung lượng
Biến đổi (Transformation)
Lượng tử hóa (Quantization)
vào cho LCD
(dạng tuần tự)
Bộ đệm dòng (N-Line buffer)
Gán từ mã có cùng độ dài (Uniform-Length Codeword Assignment )
Dữ liệu nén (Data coded)
Trang 35cũng như tốc độ truyền tải dữ liệu của bộ nhớ khung hình Trong phần tiếp theo luận án sẽ
trình bày chi tiết về một số độ đo hiệu năng giải pháp nén ảnh khung hình làm công cụ cho
việc xem xét và đánh giá các giải pháp nén ảnh khung hình
2.4.2 Các độ đo hiệu năng giải pháp nén ảnh khung hình
2.4.2.1 Tỷ số nén
Tỷ số nén ảnh là một số đo dung lượng (DL) của ảnh gốc (ảnh chưa nén) chia cho
dung lượng ảnh đã được nén (hay mã hóa) và được kí hiệu là Cr (Compression Ratio):
Đối với phần lớn các giải pháp nén ảnh cho màn hình tinh thể lỏng sử dụng phương
pháp mã hóa khối ảnh, có nghĩa là ảnh được chia ra theo các khối bằng nhau rồi lần lượt
mã hóa từng khối theo thứ tự, với đầu vào bằng nhau sẽ luôn tạo đầu ra là dòng bit dữ liệu
đã được mã hóa có kích thước giống nhau, vì thế tỷ số nén còn được tính bởi công thức:
( 𝑛 𝑛) ( 𝑛 𝑛) (2.1 c)
Ví dụ: Trên một ti-vi LCD chuẩn full HD, thì ảnh khung hình của nó sẽ là một ảnh
màu có kích thước 1920×1080 với 3 kênh màu RGB-24bit Khi được áp dụng giải pháp
nén theo khối với kích thước khối là 32×4 sẽ được chia ra làm 16200 khối Giả sử mỗi khối
đầu vào sẽ được nén lại với 512bit dữ liệu mã hóa, thì tỷ số nén sẽ được tính là:
( ) ( ) Trong một số trường hợp, khi mà kích thước của ảnh khung hình không phải là bội số
của kích thước khối ảnh (block), thì người ta thường sử dụng phương án bổ sung thêm các
dòng ảnh hoặc cột ảnh (hoặc cả hai) để sau đó ảnh có thể chia thành các khối đồng kích
thước
2.4.2.2 Chất lƣợng nén - Các độ đo sai số
Để đánh giá sự khác biệt của ảnh khôi phục sau khi nén so với ảnh gốc qua một đại
lượng đo lường thể hiện bằng một con số, giúp dễ dàng đánh giá và so sánh đối chiếu,
người ta thường sử dụng một số độ đo sau:
Sai số trung bình bình phương (Mean Squared Error -MSE)
Tỷ số tín hiệu mức đỉnh /nhiễu (Peak Signal-to-Noise Ratio - PSNR)
Gọi 𝐹 và 𝐹 lần lượt là các ma trận dữ liệu ảnh gốc và dữ liệu ảnh khôi phục sau khi
nén Trong không gian màu RGB ảnh được biểu diễn bởi ba ảnh đơn sắc tương ứng với ba
thành phần màu Red, Green và Blue, vì vậy 𝐹 (𝐹 𝐹 𝐹 ) và 𝐹 (𝐹 𝐹 𝐹 ) trong đó
Trang 36mỗi thành phần là một ma trận hai chiều có kích thước M dòng và N cột tương ứng với
kích thước của ảnh Gọi L là giá trị mức đỉnh của tín hiệu ảnh, với ảnh màu RGB-24bit hay
8bit cho mỗi kênh màu thì L = 28 – 1 = 255 Các độ đo MSE và PSNR cho mỗi thành phần
ảnh đơn sắc cũng như ảnh màu RGB được tính theo các công thức sau:
( ∑ ∑ (𝐹 ( 𝑛) − 𝐹 ( 𝑛))
( ∑ ∑ (𝐹 ( 𝑛) − 𝐹 ( 𝑛))
( ∑ ∑ (𝐹 ( 𝑛) − 𝐹 ( 𝑛))
( ) (2.5) (
Trong hai độ đo trên, độ đo PSNR được sử dụng phổ biến hơn cả trong lĩnh vực nén
ảnh nhờ tính dễ hiểu và dễ so sánh hợp lý của nó so với MSE Có thể nói độ đo PSNR
được sử dụng trong hầu hết các đánh giá khoa học về chất lượng nén ảnh Có thể lý giải
điều này qua đồ thị biến thiên của PSNR theo MSE như Hình 2.11 dưới đây:
Hình 2.11 Đồ thị biến thiên của PSNR theo MSE (với L=255)
Có thể nói PSNR chính là một phiên bản đảo chiều của MSE và kéo giãn những giá trị
MSE rất bé (hay ứng với ảnh nén chất lượng cao, hình đẹp) ra trên một khoảng rộng để dễ
bề so sánh đánh giá, và ngược lại những giá trị MSE lớn (hay ứng với ảnh nén chất lượng
0 20 40 60 80 100
Trang 37thấp, hình xấu) sẽ được nén lại trên một khoảng hẹp Theo các chuyên gia, với thang đo
PSNR thì ảnh khoảng từ 30dB trở lên có thể xem là có chất lượng; dưới 30dB, chất lượng
tương đối thấp
2.4.3 Mối tương quan giữa chất lượng nén và chất lượng ảnh hiển thị trên
màn hình tinh thể lỏng
Để thấy được sự tác động của những sai số khi nén ảnh lên chất lượng hình ảnh hiển
thị trên màn hình tinh thể lỏng chúng ta hãy xem xét trên một thành phần tín hiệu màu R
trong 3 tín hiệu màu RGB của ảnh, và tại thời gian t Với ký hiệu dữ liệu hình ảnh tại thời
điểm t và (t-1) ứng với thành phần màu R là các ma trận dữ liệu được biểu diễn dưới dạng
hàm tín hiệu số ( 𝑛) và ( 𝑛), trong đó m và n xác định tọa độ của điểm ảnh
trên khung hình, và R xác định thành phần màu Theo cơ chế hoạt động của hệ thống
overdrive có áp dụng kỹ thuật nén ảnh (Hình 2.7), thì ảnh khung hình tại thời điểm (t-1) là
( 𝑛) được nén (tất nhiên là cùng với các kênh màu còn lại) rồi ghi lên vùng bộ nhớ
khung hình, và đến thời điểm t sẽ thực hiện giải nén để thu được ̂ ( 𝑛) Mối liên hệ
giữa ( 𝑛) và ̂ ( 𝑛) được xác định qua công thức:
̂ ( 𝑛) ( 𝑛) ( 𝑛) (2.10) với ( 𝑛) là sai số phát sinh do mã hóa trên thành phần màu R của ảnh
Xét tại một điểm ảnh ( 𝑛 ) bất kỳ trên màn hình trên kênh màu R Đến thời điểm t
điểm ảnh này cần phải chuyển đổi từ mức ( 𝑛 ) lên mức ( 𝑛 ) Vậy giá trị
chênh lệch để tham chiếu tăng ngưỡng điện áp sẽ là:
( 𝑛 ) ( 𝑛 ) − ( 𝑛 ) (2.11) Nhưng trên thực tế, hệ thống sẽ hoạt động theo cơ chế tham chiếu bộ nhớ nên sẽ chỉ có
được giá trị khôi phục ̂ ( 𝑛 ), và nó sẽ điều khiển để chuyển đổi từ mức
̂ ( 𝑛 ) lên mức ( 𝑛 ), giá trị chênh lệch tham chiếu để tăng áp là:
( 𝑛 ) ( 𝑛 ) − ̂ ( 𝑛 ) (2.12) Giá trị xác định theo công thức (2.12) sẽ là cơ sở để tham chiếu đến ngưỡng
điện áp tăng tốc
Từ (2.10), (2.11) và (2.12) chúng ta có:
( 𝑛 ) ( 𝑛 ) − ( 𝑛 ) (2.13)
Rõ ràng:
Trang 38 Nếu ( 𝑛 ) : thì độ chênh lệch tham chiếu để điều khiển tăng tốc sẽ là
( 𝑛 ) ( 𝑛 ), là một giá trị chính nên màn hình sẽ được
điều khiển tăng áp chính xác Dẫn đến hiển thị điểm ảnh chuẩn xác
Nếu ( 𝑛 ) : thì độ chênh lệch tham chiếu để điều khiển tăng tốc
sẽ là ( 𝑛 ) ( 𝑛 ) − , là một giá trị sai lệch nên tất yếu
sẽ dẫn đến điện áp tham chiếu sai lệch, làm cho điểm ảnh trên màn hình không hiển
thị chính xác giá trị điểm ảnh ( 𝑛 ) như mong muốn
Từ đó chúng ta có thể kết luận rằng, mọi khác biệt giữa ảnh gốc và ảnh khôi phục (hay
chính là sai số mã hóa) sẽ tác động gián tiếp lên hình ảnh hiển thị trên màn hình tinh thể
lỏng thông qua hệ thống overdrive, và nó làm suy giảm chất lượng hình ảnh hiển thị trên
màn hình Sự suy giảm này sẽ tác động trực tiếp lên cảm nhận của người xem thông qua thị
giác, vì vậy chúng ta cần xem xét chất lượng nén không chỉ qua các đại lượng đo lường
như MSE hay PSNR mà còn phải xem xét đến các hiện tượng mà ảnh nén có thể mắc phải
như hiệu ứng nhiễu khối (blocking effect), hiện tượng rung động (vibration) tại một cường
độ mức xám cố định, hay hiện tượng các đường nét có tính giả tạo (false contours) vốn
không được xem xét đánh giá đúng mức trong các đại lượng đo lường MSE hay PSNR
2.4.4 Một số yêu cầu đặc trƣng và tiêu chí đánh giá hệ thống nén ảnh cho
1 Đảm bảo tỷ số nén cố định: giải pháp nén phải đạt được tỷ số nén có cố định, để từ
đó xác định được chính xác dung lượng bộ nhớ cần thiết kế cho hệ thống ovedrive
Bởi vậy phương pháp nén dữ liệu ảnh cho màn hình tinh thể lỏng thường dùng mã
hóa với từ mã có độ dài cố định (fixed-length/uniform-length codeword)
2 Độ phức tạp tính toán hay kiến trúc thực thi ở mức chấp nhận đƣợc và đảm
bảo xử lý thời gian thực: độ phức tạp tính toán (hay kiến trúc thực thi) của giải
pháp nén phải ở một mức độ vừa phải xem xét trong mối liên hệ với tỷ số nén và
chất lượng ảnh đạt được Bởi nếu độ phức tạp tính toán quá cao sẽ đòi hỏi phải được
xử lý bởi các bộ xử lý mạnh (High-Powered Processors), mà một bộ xử lý như vậy
sẽ có giá thành cao, làm cho bài toán mất tính khả thi về mặt kinh tế Theo các nhận
định của chuyên gia, để đảm bảo khả năng thực thi theo thời gian thực một cách
Trang 39giản tiện, thì thuật toán xử lý nên ở dạng tuyến tính, tránh sử dụng các phương pháp
lặp với số lần không xác định hay số bước lặp lớn
3 Chất lượng ảnh cao - Hạn chế các hiệu ứng tiêu cực về mặt thị giác: Chất lượng
ảnh khôi phục phải ở mức cao để tránh hiện tượng hệ thống overdrive hoạt động quá
sai lệch làm ảnh hưởng lớn đến chất lượng hình ảnh hiển thị trên màn hình, sẽ khiến
sản phẩm khó được người tiêu dùng chấp nhận Chất lượng ảnh khôi phục không chỉ
phải đạt chất lượng cao theo các thang đo chất lượng ảnh như MSE hay PSNR, mà
còn phải hạn chế được các hiệu ứng tiêu cực về mặt thị giác như hiệu ứng nhiễu
khối (blocking effect), hiện tượng rung động hay lay động (vibration effect) của
vùng ảnh không hoặc rất ít thay đổi, hay hiện tượng giả tạo (false contours) các
đường nét trong ảnh Các hiệu ứng tiêu cực này tuy không làm suy giảm đáng kể
chất lượng ảnh khi đánh giá theo các độ đo MSE hay PSNR, song chúng lại mang
lại cảm giác khó chịu khi quan sát bằng thị giác một khi nó tác động lên hình ảnh
hiển thị trên màn hình tinh thể lỏng thông qua cơ chế overdrive, khiến người tiêu
dùng khó có thể chấp nhận Trong luận án này, một vài tiêu chuẩn khách quan
(objective) có thể gắn với tiêu chuẩn thị giác chủ quan (subjective) như SSIM [32],
sẽ không được đề cập đến Lý do chính là những tiêu chuẩn này phải được cục bộ
hóa một cách đặc biệt vào từng vùng trong ảnh Một đánh giá mang tính toàn cục
cho nguyên một khung hình sẽ không định nổi sự khác biệt
4 Kích thước bộ đệm dòng (line-buffer): Là thành phần đầu tiên trong mô hình của
một hệ thống nén ảnh áp dụng cho overdrive (Hình 2.10) Khi xem xét tỷ số nén cần
được đặt trong mối tương quan với bộ đệm dòng, bởi đây là thành phần khá đắt đỏ
trong thiết kế phần cứng Nên một giải pháp nén có đạt được tỷ số nén cao song lại
đòi hỏi kích thước bộ đệm dòng lớn sẽ làm giảm đi một phần tính hiệu quả
Hiện nay, ngưỡng tỷ số nén mà các giải pháp nén ảnh tiên tiến áp dụng cho màn hình
tinh thể lỏng đạt được là Cr = 6:1 Nếu tăng tỷ số nén lên các mức giá trị cao hơn như 8:1
hay 12:1 thì các giải pháp hiện tại cho chất lượng ảnh quá thấp nên không thể đáp ứng
được yêu cầu Từ thực tế đó, luận án này sẽ tập trung nghiên cứu cải thiện hai đặc trưng
chính yếu trong bốn đặc trưng nêu trên đó là: (1) Cải thiện chất lượng nén - Hạn chế các
hiệu ứng tiêu cực về mặt thị giác như nhiễu khối hay hiện tượng giả tạo của các đường nét
trong ảnh (false contours); (2) Cải thiện độ phức tạp tính toán hay kiến trúc thực thi của
giải pháp nén nhằm mang đến khả năng thực thi trên một phần cứng đơn giản
2.4.4.2 Một số tiêu chí đánh giá giải pháp nén ảnh cho màn hình tinh thể lỏng
Để đánh giá giải pháp nén ảnh cho hệ thống overdrive của màn hình tinh thể lỏng,
chúng tôi dựa trên 3 tiêu chí cơ bản là: Chất lượng ảnh, tỷ số nén, và cuối cùng là độ phức
Trang 40tạp tính toán được xem xét trong mối liên hệ với yêu cầu kiến trúc thực thi
1 Chất lƣợng ảnh nén: Như đã được đề cập trong mục 2.4.3, chất lượng ảnh nén
(cách gọi vắn tắt của chất lượng ảnh khôi phục sau quá trình nén và giải nén) ảnh
hưởng gián tiếp đến chất lượng hình ảnh hiện thị trên màn hình, vì vậy chất lượng
ảnh nén được xem xét không chỉ qua giá trị số đo chất lượng ảnh như MSE hay
PSNR (công thức (2.5) và(2.9)), mà còn phải được xem xét đến các triệu chứng mà
ảnh nén có thể mắc phải như hiệu ứng nhiễu khối (blocking effect), hiện tượng rung
động (vibration) tại một cường độ mức xám cố định, hay hiện tượng giả tạo của các
đường nét trong ảnh (false contours) vốn không được đánh giá hiệu quả và đúng
mức trong các đại lượng đo lường như MSE hay PSNR, song lại rất nhạy cảm với
mắt người, dễ khiến cho người tiêu dùng có những đánh giá tiêu cực về chất lượng
hiển thị hình ảnh của màn hình tinh thể lỏng
2 Tỷ số nén: là một trong những yếu tố quan trọng chủ chốt để đánh giá hiệu năng của
một giải pháp nén ảnh áp dụng cho màn hình tinh thể lỏng, bởi nó tác động trực tiếp
lên giá thành sản phẩm hệ thống overdrive thông qua mức độ cải thiện dung lượng
và tốc độ truyền tải của bộ nhớ khung hình Hiển nhiên là một giải pháp nén cho tỷ
số nén cao chưa hẳn là một giải pháp tối ưu, giải pháp đó có thể sẽ không có tính
thực tiễn nếu chất lượng ảnh mà nó mang lại quá thấp khiến đa số người tiêu dùng
không chấp nhận cho dù giá thành có rẻ hơn đáng kể đi chăng nữa Bên cạnh đó tỷ
số nén đạt được còn phải xem xét trong mối tương quan với độ phức tạp của kiến
trúc thực thi, bởi khiến trúc thực thi càng phức tạp (hay yêu cầu càng cao về hiệu
năng tính toán) thì giá thành của hệ thống nén càng đội lên cao, làm giảm đi tỷ suất
cải thiện về giá thành trên tổng thể
3 Độ phức tạp tính toán và kiến trúc thực thi: Khái niệm độ phức tạp tính toán
trong bài toán nén ảnh áp dụng cho màn hình tinh thể lỏng nhằm giảm giá thành sản
phẩm sẽ có những đặc điểm khác so với cách đánh giá độ phức tạp tính toán cho các
thuật giải thông thường, vốn có mục tiêu là tiết kiệm thời gian thực hiện chương
trình phần mềm Ở đây các giải pháp nén ảnh phải được triển khai trong môi trường
hệ nhúng trên thiết bị màn hình Vì vậy, độ phức tạp tính toán ở đây không chỉ được
đánh giá đơn thuần trên số lượng phép toán cần thực hiện, mà các khía cạnh khác
như: yêu cầu xử lý tuần tự hay song song, yêu cầu về kiến trúc và xung nhịp của bộ
xử lý để đảm bảo khả năng xử lý thời gian thực cũng là những yếu tố quan trọng
trên thực tiễn Lấy một ví dụ minh họa về vấn đề này: Cho hai giải pháp nén A và B
với giả thiết rằng chúng có số phép toán và quy trình xử lý gần như nhau, ngoại trừ
giải pháp A yêu cầu một số phép tính toán phải được xử lý trên dữ liệu nguyên 32