Đặc điểm của phép biến đổi DCT là tín hiệu hình ảnh trong miền không gian chuyển sang miền tần số thì các thành phần DC và các thành phần AC mang hầu hết các thông tin chứa trong ảnh gốc. Trong đó, DC là thành phần quan trọng nhất mang độ chói trung bình của ảnh, thành phần AC chứa các thông tin về chi tiết của ảnh. Sau đó khi qua khối lượng tử hóa, các hệ số ít quan trọng sẽ bị loại bỏ bớt và chỉ giữ lại một số hệ số đầu tiên gọi là hệ số DCT.DCT làm giảm độ tương quan không gian của thông tin trong block. Điều này có nghĩa là cho phép biểu diễn thích hợp ở miền DCT do các hệ số DCT có xu hướng có phần dư thừa ít hơn. Điều này có nghĩa là DCT gói một phần lớn năng lượng tín hiệu vào các thành phần biến đổi có tần số tương đối thấp để lưu trữ hoặc truyền dẫn, tạo 0 và các giá trị rất thấp đối với thành phần tần số cao.
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
─────── * ───────
Đề tài 5 : Phương pháp mã hóa nén dựa trên phép biến đổi (Transform Coding) và ứng dụng.
GV hướng dẫn : PGS.TS Nguyễn Thị Hoàng Lan
BÀI TẬP LỚN
XỬ LÝ DỮ LIỆU ĐA PHƯƠNG TIỆN
Trang 2Phân công công việc
Tìm hiểu chung về phương pháp nén dựa trên phép biến đổi – Lương Cao Phong
Tìm hiểu và phân biệt rõ các đặc điểm của 2 phép biến đổi được dùng các chuẩn nén hiện nay: DCT và DWT – Ngô Hồng Hải
Tìm hiểu thuật toán DCT trong nén ảnh JPEG – Nguyễn Văn Khỏe
Cài đặt thuật thoán DCT trong nén ảnh JPEG và đánh giá thử nghiệm vai trò của DCT trong nén ảnh JPEG – Hoàng Hữu Hợi
Trang 3Tổng quan về phương pháp nén ảnh
Nén ảnh là một kỹ thuật mã hóa các ảnh số hóa nhằm giảm số lượng các bit dữ liệu cần thiết để biểu diễn ảnh
Mục đích là giảm đi những chi phí trong việc lưu trữ ảnh và chi phí thời gian để truyền ảnh đi xa trong truyền thông nhưng vẫn đảm bảo được chất lượng của ảnh
Trang 4Tìm hiểu chung về phương pháp nén ảnh dựa trên phép biến đổi (Transform
Coding)
Một phép biến đổi là một hàm toán học được sử dụng để biến đổi một tập các giá trị này thành một tập các giá trị khác và tạo ra một cách biểu diễn mới cho cùng một nguồn tin
Sơ đồ chung
Biến đổi thuận Lượng tử hóaMã hóa
Trang 5Đặc điểm của phép biến đổi DCT
Đặc điểm của phép biến đổi DCT là tín hiệu hình ảnh trong miền không gian chuyển sang miền tần số thì các thành phần DC
và các thành phần AC mang hầu hết các thông tin chứa trong ảnh gốc Trong đó, DC là thành phần quan trọng nhất mang độ chói trung bình của ảnh, thành phần AC chứa các thông tin về chi tiết của ảnh Sau đó khi qua khối lượng tử hóa, các hệ số ít quan trọng sẽ bị loại bỏ bớt và chỉ giữ lại một số hệ số đầu tiên gọi là hệ số DCT
DCT làm giảm độ tương quan không gian của thông tin trong block Điều này có nghĩa là cho phép biểu diễn thích hợp ở miền DCT do các hệ số DCT có xu hướng có phần dư thừa ít hơn Điều này có nghĩa là DCT gói một phần lớn năng lượng tín hiệu vào các thành phần biến đổi có tần số tương đối thấp để lưu trữ hoặc truyền dẫn, tạo 0 và các giá trị rất thấp đối với thành phần tần số cao
Trang 6Đặc điểm của phép biến đổi DCT
Nhờ đặc tính của hệ thống nhìn của mắt người, các hệ số DCT có thể được mã hóa phù hợp, chỉ các hệ số DCT quan trọng nhất mới được mã hóa và truyền đi
DCT thuận kế hợp với DCT nghịch sẽ không bao giờ tổn thất nếu độ dài từ mã của hệ số là 13 đến 14 bít cho tín hiệu video đầu vào được số hóa bằng các mẫu dài 8 bit Nếu hệ số được lượng tử hóa bằng 11 bít hoặc ngắn hơn thì nén DCT sẽ có tổn hao
Trang 7Đặc điểm của phép biến đổi DWT
Wavelet là phép biến đổi được sử dụng để phân tích các tín hiệu không ổn định-là những tín hiệu có đáp ứng tần số thay đổi theo thời gian, và cho biết khi nào thì những tần số đó xuất hiện
Phép biến đổi Wavelet sử dụng một hàm đơn( sóng mẹ), tất cả các hàm khác có được bằng cách thay đổi kích thước của hàm( biến đổi tỉ lệ và tịnh tiến hàm đơn, được gọi là các sóng con)
Biến đổi Wavelet dù chỉ làm việc với các tín hiệu một chiều nhưng sau khi biến đổi xong ta thu được một hàm số hai biến hoặc một tập các cặp giá trị W(a, b) minh họa các thành phần tần số khác nhau của tín hiệu xảy ra tại thời điểm t
Trang 8Nguyên lý nén ảnh JPEG
Nguyên lý của phương pháp nén JPEG là:
Cắt hình ảnh thành từng khối nhỏ, phân tích tất cả các dữ liệu về màu sắc, độ sáng mà các khối đó chứa bằng các phương trình ma trận
Ảnh màu trong không gian RGB (Red, Green, Blue) được chuyển đổi qua hệ YUV Trong khi thị giác của con người lại rất nhạy cảm với hệ Y, ít nhạy cảm hơn nhiều với hệ U, V Hệ thống sẽ nén thành phần Y của ảnh ở mức độ ít hơn nhiều so với U và V
Dùng biến đổi Cosin rời rạc, sau đó lượng hóa và mã hóa theo phương pháp Huffman
Khi giải nén ảnh, các bước thực thi sẽ làm ngược lại quá trình nói trên
Trang 9Các bước trong nén ảnh JPEG
Mã hoá biến đổi DCT
Nguyên tắc chính của phương pháp mã hoá này là biến đổi tập các giá trị pixel của ảnh trong miền không gian sang một tập các giá trị khác trong miền tần số sao cho các hệ số trong tập giá trị mới này có tương quan giữa các điểm ảnh gần nhau nhỏ hơn
Trang 10Các bước trong nén ảnh JPEG
Sơ đồ mã hóa và giải mã dùng biến đổi DCT
Trang 11Biến đổi DCT
Vì ảnh gốc có kích thước rất lớn cho nên trước khi đưa vào biến đổi DCT, ảnh được phân chia thành các khối vuông, mỗi khối này thường có kích thước 8 x
8 pixel và biểu diễn các mức xám của 64 điểm ảnh, các mức xám này là các số nguyên dương có giá trị từ 0 đến 255 Việc phân khối này sẽ làm giảm được một phần thời gian tính toán các hệ số chung, mặt khác biến đổi cosin đối với các khối nhỏ sẽ làm tăng độ chính xác khi tính toán với dấu phẩy tĩnh, giảm thiểu sai số do làm tròn sinh ra
Trang 12Biến đổi DCT
Biến đổi DCT là một công đoạn chính trong các phương pháp nén sử dụng biến đổi 2 công thức ở đây minh hoạ cho 2 phép biến đổi DCT thuận nghịch đối với mỗi khối ảnh có kích thước 8 x 8 Giá trị x(n1, n2) biểu diễn các mức xám của ảnh trong miền không gian, X(k1, k2) là các hệ số sau biến đổi DCT trong miền tần số
Trang 13Biến đổi DCT
Mỗi khối 64 điểm ảnh sau biến đổi DCT thuận sẽ nhận được 64 hệ số thực DCT (bảng 1) Mỗi hệ số này có chứa một trong 64 thành phần tần số không gian hai chiều Hệ số với tần số bằng không theo cả hai hướng (tương ứng với k1 và k2 bằng 0) được gọi là hệ số một chiều DC, hệ số này chính là giá trị trung bình của 64 điểm ảnh trong khối 63 hệ số còn lại gọi là các hệ số xoay chiều AC Hệ số một chiều DC tập trung phần lớn năng lượng của ảnh
Trang 14Biến đổi DCT
Các bước của quá trình mã hóa biến đổi DCT đối với 1 khối
Trang 15Biến đổi DCT
Biến đổi DCT không làm mất thông tin vì DCT là một biến đổi tuyến tính chuyển các giá trị của điểm ảnh từ miền không gian thành các hệ số trong miền tần số Nếu biến đổi DCT thuận và nghịch được tính toán với độ chính xác tuyệt đối và nếu các hệ số DCT không phải qua bước lượng tử và mã hoá thì ảnh thu được sau biến đổi DCT ngược sẽ giống hệt ảnh gốc
Trang 16Cài đặt thuật toán DCT trong nén ảnh
Sơ đồ nén và giải nén ảnh
Trang 17Cài đặt thuật toán DCT trong nén ảnh
Công thức biến đổi DCT với block 8x8
Biến đổi DCT thuận
Biến đổi DCT nghịch
Trong đó:
f(j,k) – các mẫu gốc trong khối 8x8 pixel F(u,v) – các hệ số của khối DCT 8x8 C(u),C(v) =
Trang 18Đánh giá vài trò của DCT trong nén ảnh
Tách thành phần mang tần số thấp (mang độ chói trung bình của các điểm ảnh) và thành phần mang tần số cao (chứa thông tin chi tiết của ảnh) Do đó có thể loại bỏ một số thành phần tần số cao không quan trọng -> giảm độ dư thừa của ảnh
Ảnh hưởng trực tiếp đến việc cho lại chất lượng ảnh được khôi phục tốt hay xấu trong quá trình lượng tử hóa
Giảm độ tương quan không gian của thông tin block DCT gói một phần lớn năng lượng tín hiệu vào các thành phần biến đổi
có tần số tương đối thấp để lưu trữ hoặc truyền dẫn, tạo 0 và các giá trị rất thấp đối với thành phần tần số cao -> tăng tỷ số nén