Trong kỹ thuật này các khối ảnh kích thước 8x8 được áp dụng để thực hiện DCT, sau đó lượng tử hóa các hệ số rồi mã hóa entropy sau lượng tử.. Biến đổi DCT 1 chiều DCT một chiều biến
Trang 1CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN
BÁO CÁO BÀI TẬP LỚN
Giảng viên: NGUYỄN ĐÌNH HÓA
Nhóm 3:
Thành viên:
Nguyễn Thị Hương - B12DCCN172 Phạm Thị Diễm - B12DCCN156
Lê Thị Hằng - B12DCCN163
Trang 2I CÁC KĨ THUẬT XỬ LÍ ẢNH
1 Tổng quan về xử lý ảnh
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh
“tốt hơn” hoặc một kết luận
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong không gian và nó có thể xem như một hàm n biến P(c1, c2, , cn)
Trang 3I CÁC KĨ THUẬT XỬ LÍ ẢNH
Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều
Sơ đồ tổng quát của một hệ thống xử lý ảnh:
Trang 5I CÁC KĨ THUẬT XỬ LÍ ẢNH
2.2 Nắn chỉnh biến dạng
Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử
Để khắc phục người ta sử dụng các phép chiếu, các phép chiếu thường được xây dựng trên tập các điểm điều khiển
Trang 6I CÁC KĨ THUẬT XỬ LÍ ẢNH
2.3 Khử nhiễu
Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh:
Nhiễu hệ thống: là nhiễu có quy luật có thể khử bằng các phép biến đổi
Nhiễu ngẫu nhiên: vết bẩn không rõ nguyên nhân → khắc phục bằng các phép lọc
Trang 7I CÁC KĨ THUẬT XỬ LÍ ẢNH
Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ thuật nội suy Kỹ thuật này nhằm tăng cường độ mịn cho ảnh
2.5 Trích chọn đặc điểm
Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng
trong quá trình xử lý ảnh Có thể nêu ra một số đặc điểm của ảnh sau đây:
Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm uốn v.v
Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực hiện lọc vùng (zonal filtering)
Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng => hữu ích trong việc trích trọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng
Trang 8I CÁC KĨ THUẬT XỬ LÍ ẢNH
2.6 Nhận dạng
Nhận dạng ảnh là quá trình liên quan đến mô tả đối tượng mà người ta muốn đặc tả nó Thường đi sau quá trình trích chọn các đặc tính của đối tượng.
Có 2 kiểu mô tả đối tượng:
mô tả theo tham số ( nhận dạng theo tham số)
mô tả theo cấu trúc ( nhận dạng theo cấu trúc)
2.7 Nén ảnh
Mục đích: giảm không gian lưu trữ, thuận tiện truyền thông trên mạng.
Phương pháp:
Nén không mất thông tin: khai thác các thông tin dư thừa.
Nén mất thông tin: khai thác các thông tin dư thừa và các thông tin không liên quan.
Hiện nay có một số chuẩn nén hay dùng: JPEG, MPEG (JPEG -2000, MPEG-4)
Trang 9II PHƯƠNG PHÁP CHUYỂN ĐỔI COSINE RỜI RẠC
1 Tổng quan
2 Biến đổi DCT
a Biến đổi DCT 1 chiều
b Biến đổi DCT 2 chiều
3 Vai trò của biến đổi DCT
Trang 10II PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC1.Tổng quan
DCT biến đổi thông tin ảnh từ miền không gian sang miền tần số để có thể biểu diễn dưới dạng gọn hơn
DCT đã trở thành tiêu chuẩn quốc tế cho các hệ thống mã chuyển vị bởi nó
có đặc tính gói năng lượng tốt, cho kết quả là số thực và có các thuật toán nhanh để thể hiện chúng.
Khai triển DCT được chọn là kỹ thuật then chốt trong JPEG vì nó cho ảnh nén chất lượng tốt nhất tại tốc độ bit thấp và giải thuật chuyển đổi nhanh và dễ dàng thực hiện bằng phần cứng
Trang 11II PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
Vậy JPEG là gì ?
JPEG (Joint Photographic Experts Group) là chuẩn nén số quốc tế đầu tiên được định ra cho nén ảnh tĩnh có tông màu liên tục gồm cả ảnh đơn sắc và ảnh màu Trong kỹ thuật này các khối ảnh kích thước 8x8 được áp dụng để thực hiện DCT, sau đó lượng tử hóa các hệ số rồi mã hóa entropy sau lượng tử
Công nghệ nén ảnh JPEG là một trong những công nghệ nén ảnh hiệu quả, cho phép làm việc với các ảnh có nhiều màu và kích cỡ lớn
Trang 12II PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
Sơ đồ mã hóa và giải mã dùng biến đổi DCT
Trang 13II PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
2 Biến đổi DCT
a Biến đổi DCT 1 chiều
DCT một chiều biến đổi biên độ tín hiệu tại các điểm rời rạc theo thời gian hoặc không gian thành chuỗi các hệ số rời rạc, mỗi hệ số biểu diễn biên độ của một thành phần tần số nhất định có trong tín hiệu gốc
Hệ số đầu tiên biểu diễn mức DC trung bình của tín hiệu Từ trái sang phải, các
hệ số thể hiện các thành phần tần số không gian cao hơn của tín hiệu và được gọi
là các hệ số AC Thông thường, nhiều hệ số AC có giá trị sẽ gần hoặc bằng 0
Quá trình biến đổi DCT thuận (FDCT) dùng trong tiêu chuẩn JPEG được định nghĩa như sau:
Trang 14II PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
Hàm biến đổi DCT ngược (1 chiều ):
Trong đó: X(k) là chuỗi kết quả
x(m) là giá trị của mẫu m
k-chỉ số của hệ số khai triển
m-chỉ số của mẫu
N- số mẫu có trong tín hiệu
Trang 15II PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
b Biến đổi DCT 2 chiều
Vì ảnh gốc có kích thước rất lớn cho nên trước khi đưa vào biến đổi DCT, ảnh được phân chia thành các khối vuông, mỗi khối này thường có kích thước 8 x 8 pixel và biểu diễn các mức xám của 64 điểm ảnh, các mức xám này là các số nguyên dương có giá trị từ 0 đến 255 Việc phân khối này sẽ làm giảm được phần thời gian tính toán các hệ số chung, mặt khác biến đổi cosin đối với các khối nhỏ sẽ làm tăng độ chính xác khi tính toán với dấu phẩy tĩnh, giảm thiểu sai số do làm tròn sinh ra
Biến đổi DCT là một công đoạn chính trong các phương pháp nén sử dụng biến đổi 2 công thức ở đây minh hoạ cho 2 phép biến đổi DCT thuận nghịch đối với mỗi khối ảnh có kích thước 8 x 8 Giá trị f(i, j) biểu diễn các mức xám của ảnh trong miền không gian, F(u, v) là các hệ số sau biến đổi DCT trong miền tần số
Trang 16II PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
trong đó:
f(j,k)- các mẫu gốc trong khối 8×8 pixel
F(u,v)-các hệ số của khối DCT 8×8
Phương trình trên là một liên kết của hai phương trình DCT một chiều, một cho tần số ngang và một cho tần số đứng Giá trị trung bình của block 8x8 chính là
hệ số thứ nhất (khi u,v= 0)
Trang 17II PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
Các bước của quá trình mã hóa biến đổi DCT đối với 1 khối
Trang 18II PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
Lượng tử hóa
Bước tiếp theo của quá trình nén trong ảnh là lượng tử hóa các hệ số
F(u,v) sao cho làm giảm được số lượng bit cần thiết
Các hệ số tương ứng với tần số thấp có các giá trị lớn hơn, và như vậy
nó chứa phần năng lượng chính của tín hiệu, do đó phải lượng tử hóa với độ chính xác cao Riêng hệ số một chiều đòi hỏi độ chính xác cao nhất, bởi lẽ nó biểu thị giá trị độ chói trung bình của từng khối phần tử ảnh
Sau quá trình này giá trị các thành phần tần số cao được làm tròn tới giá
trị 0 trong khi đó các thành phần tần thấp cũng nhỏ đi chính vì thế làm giảm số bit cho mỗi giá trị của các thành phần tần số thấp
Trang 19II PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
Ma trận lượng tử
Tại mỗi vị trí của X người ta chia giá trị tại đó cho các hằng số tại vị trí tương ứng sau đó làm tròn với số nguyên gần nhất
Trang 20II PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
Trang 21II PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
Chú ý : hệ số chia trong bảng lượng tử hóa là nhỏ đối với các hệ số có tần
số thấp và tăng từ từ đối với các hệ số có tần số cao hơn.Việc biến đổi sao cho chất lượng hình ảnh do mắt người cảm nhận tốt, phụ thuộc vào các
thành phần tần số và sự biến đổi chi tiết ảnh từng vùng trong miền không gian Các ảnh càng chi tiết thì hệ số thành phần tần số cao càng lớn
Qúa trình mã hóa hay nén
Để mã hóa entropy các hệ số được lượng tử hóa Fq(u,v), trước hết, cần biến đổi mảng hai chiều của các hệ số Fq(u,v) thành chuỗi số một chiều bằng các phương pháp quét toàn bộ các điểm ảnh của tệp ảnh đó
Trang 22II PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
Có một số phương pháp quét như:
Trang 23II PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
Để nâng cao hiệu quả nén cho mỗi bộ hệ số người ta thường xếp chúng lại theo thứ tự Zigzac Tác dụng sắp xếp lại theo thứ tự Zigzac là tạo ra nhiều loạt hệ số giống nhau Ta biết rằng năng lượng của khối hệ số sẽ giảm dần từ góc trên bên trái xuống góc dưới bên phải vì vậy việc lấy Zigzac sẽ tạo điều kiện cho các hệ số sấp xỉ nhau.
Việc xử lý 64 hệ số của khối 8x8 pixel bằng cách quét zig-zag làm tăng tối đa chuỗi các giá trị 0 và do vậy làm tăng hiệu quả nén khi dùng RLC.
Trang 24VI PHÂN MẢNH, ĐỊNH VỊ CỞ SỞ DỮ LIỆU
Mã hóa entropy: mã hóa RLC
Nén bằng mã RLC là quá trình nén không tổn hao
Sau quá trình quét zig-zag ở trên, RLC sẽ được thực thi Một hệ số khác 0 sau giá trị DC được mã hóa bằng 1 từ mã bao gồm 2 thông số: số lượng 0 chạy trước
1 hệ số riêng khác 0 và mức của nó sau khi lượng tử hóa RLC thực chất là việc thay thế các hệ số có giá trị 0 bằng số lượng các chữ số 0 xuất hiện
Ở đây, giá trị 10 không có giá trị 0 nào trước đó được biễu diễn bằng <0,10>; giá trị –2 có hai giá trị 0 đứng trước được biễu diễn bằng <2,-2>v.v
Trang 25VI PHÂN MẢNH, ĐỊNH VỊ CỞ SỞ DỮ LIỆU
Trang 26II PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
3 Vai trò của biến đổi DCT
Vai trò chủ yếu của phương pháp DCT là giảm độ dư thừa dữ liệu trong pixcel ở miền tần số cao Bởi vì bất kì một giá trị pixcel nào đó cũng có thể dự đoán từ các giá trị pixcel lân cận của nó nên thông tin từ các pixcel riêng lẻ là tương đối nhỏ
Không những vậy sau khi biến đổi DCT thì hàm giải tương quan giảm đi một cách đáng kể.Chính vì vậy mà hiệu suất nén đạt được tỉ số nén cao
Điều quan trọng là khối DCT đóng vai trò quan trọng trong quá trình lượng tử hóa khi thiết kế hệ thống nén video vì nó ảnh hưởng trực tiếp đến việc cho lại chất lượng ảnh khôi phục tốt hay xấu.Có thể nói chính điều đó đã làm lên môt chuẩn JPEG được ứng dựng rộng rãi như vậy