Phương pháp mã hoá dựa vào biểu diễn ảnh

Một phần của tài liệu NGHIÊN CỨU CÁC PHƯƠNG PHÁP NÉN ẢNH SÓ (Trang 74 - 79)

Chương 3: TÌM HIỂU CÁC KỸ THUẬT NÉN ẢNH SỐ

3.4 Phương pháp mã hóa thế hệ thứ hai

3.4.2 Phương pháp mã hoá dựa vào biểu diễn ảnh

Như đã biết, trong xử lý ảnh, tuỳ theo các ứng dụng mà ta cần toàn bộ ảnh hay chỉ những đặc tính quan trọng của ảnh. Các phương pháp phân vùng ảnh nêu trong chương sáu như hợp vùng, tách, tách và hợp là rất hữu ích và có thể ứng dụng để nén ảnh. Có thể có nhièu phương pháp khác, song dưới đây chúng ta chỉ đề cập tới 2 phương pháp: vùng gia tăng và phương pháp tách-hợp.

a) Mã hoá dựa vào vùng gia tăng

Kỹ thuật vùng gia tăng thực chất là hợp các vùng có cùng một số tính chất nào đó. Kết quả của nó là một ảnh được phân đoạn giống như một ô trong trò xếp chữ (puzzle). Tuy nhiên, cần lưu ý rằng tất cả các đường bao thu được không tạo nên một ảnh giống ảnh gốc.

Như nêu trong chương Sáu (mục 6.3), việc xác định tính chất miền đồng nhất xác định độ phức tạp của phương pháp. Để đơn giản, tiêu chuẩn chọn ở đây là khoảng mức xám. Như vậy, miền đồng nhất là tập hợp các điểm ảnh có mức xám thuộc khoảng đã chọn. Cũng cần lưu ý thêm rằng, ảnh gốc có thể gồm có đường bao và các kết cấu (texture). Trong miền texture, độ xám biến đổi rất chậm. Do vậy, nếu không chú ý sẽ chia ảnh thành quá nhiều miền và gây nên các bao giả. Giải pháp để khắc phục hiện tượng này là dùng một bộ lọc thích hợp hay lọc trung vị.

Sau giai đoạn này, ta thu được ảnh phân đoạn với các đường biên kín, độ rộng 1 pixel. Để loại bỏ các đường bao giả, ta có thể dùng phương pháp gradient (xem chương 5). Sau khi đã thu được các đường bao đúng, người ta tiến hành mã hoá (xấp xỉ) đường bao bởi các đường cong hình học, thí dụ bởi các đoạn thẳng hay đường cong. Nếu ảnh gốc có độ phân giải không thích hợp, người ta dùng khoảng 1.3 bit cho một điểm biên.

Phương pháp này thể hiện ưu điểm: đó là mô hình tham số. Các tham số ở đây là số vùng, độ chính xác mô tả. Tất nhiên tham số khoảng mức xám là quan trọng nhất vì nó có ảnh hưởng đến tỷ số nén. Một tham số cũng không kém phần quan trọng là số điểm của các đường bao bị coi là giả. Thường số điểm này không vượt quá 20 điểm.

NGHIÊN CỨU CÁC PHƯƠNG PHÁP NÉN ẢNH SỐ 73 b) Phương pháp tách - hợp

Cũng như đã chỉ ở trên, phương pháp tách-hợp khắc phục được một số nhược điểm của phương pháp phân vùng dựa vào tách vùng hay hợp vùng. Trong phương pháp mã hoá này, người ta thay tiêu chuẩn chọn vùng đơn giản ở trên bằng một tiêu chuẩn khác hiệu quả hơn.

Nguyên tắc chung của phương pháp là theo mô hình biên - texture. Nhìn chung đường biên dễ nhạy cảm với mắt người, còn texture thì ít nhạy cảm hơn.

Người ta mong muốn rằng đường phân ranh giữa các vùng là đồng nhất với các đường bao. Lưu ý rằng, cần quyết định phân vùng một phần của ảnh sao cho nó không được vắt chéo đường bao. Đây là một tiêu chuẩn kiểm tra quan trọng. Các đường bao thường nhận được bởi các bộ lọc thông cao, đẳng hướng.

Để có thể quản lý các điểm thuộc một vùng một cách tốt hơn, tiêu chuẩn kiểm tra thứ hai cũng được xem xét đó là dấu: " các điểm nằm về một phía của đường bao có cùng dấu".

Nhìn chung, phương pháp gồm 2 giai đoạn. Giai đoạn đầu thực hiện việc tách vùng. Giai đoạn sau thực hiện hợp vùng.

Quá trình tách thực hiện trước. Người ta chia ảnh gốc thành các vùng nhỏ kích thước 9 x 9. Tiếp theo, tiến hành xấp xỉ các vùng ảnh đó bằng một đa thức có bậc nhỏ hơn 3. Sau quá trình tách, ta thu được trong một số vùng của ảnh, các hình vuông liên tiếp. Chúng sẽ tạo nên một miền gốc lớn và không nhất thiết vuông. Như vậy, trong trường hợp này phải xấp xỉ bằng rất nhiều các đa thức giống nhau. Rõ ràng là việc mã hoá riêng biệt các đa thức là điều kém hiệu quả và người ta nghĩ đến hợp các vùng để giảm độ dư thừa này.

Quá trình hợp được tiến hành như sau: Nếu 2 vùng có thể xấp xỉ bởi 2 đa thức tương tự, người ta hợp chúng làm một và chỉ dùng một đa thức xấp xỉ. Nếu mức độ thay đổi là thấp, ta sẽ có nhiều cặp vùng tương tự. Để có thể nhận được kết quả không phụ thuộc vào lần hợp đầu, người ta xây dựng đồ thị "Vùng kế cận". Các nút của đồ thị này là các vùng và các liên hệ biểu diễn mối không tương đồng. Sự liên hệ với mức không tương đồng thấp chỉ ra rằng 2 vùng cần hợp lại.

Sau bước hợp này, đồ thị được cập nhật lại và quá trình hợp được lặp lại cho đến khi tiêu chuẩn là thoả. Quá trình hợp dừng có thể quyết định bởi chất lượng ảnh nén hay một tiêu chuẩn nào khác.

Ta có thể thấy rằng phương pháp này khá phức tạp song bù lại nó cho tỷ số nén khá cao ( 60 : 1 ) .

NGHIÊN CỨU CÁC PHƯƠNG PHÁP NÉN ẢNH SỐ 74 3.4.3 Kỹ thuật mã hoá băng con

Tư tưởng chính của kỹ thuật mã hoá băng con là: các ảnh được lấy mẫu ở đầu vào được phân ly thành các băng tần khác nhau (gọi là các tín hiệu băng con).

Yêu cầu của kỹ thuật này là làm thế nào các băng con không bị chồng chéo lên nhau. Để có thể phân ly tín hiệu ở bộ mã hoá (encoder) thành các băng con, ảnh được cho qua một bank lọc (filter bank) gọi là bank lọc phân tích và mỗi đầu ra của bank lọc băng con được lấy mẫu xuống hệ số 2. Các đầu ra băng con tần số được lẫy mẫu xuống sẽ lần lượt được: lượng tử hoá độc lập bằng các bộ lọc vô hướng khác nhau, mã hoá entropy, lưu trữ và truyền đi. Ở phía bộ giải mã (decoder), quá trình được thực hiện ngược lại: giải lượng tử băng con tần số, lấy mẫu lên với hệ số 2, cho đi qua bank lọc băng con tổng hợp rồi cộng tất cả các đầu ra của bộ lọc để khôi phục lại ảnh.

Các bộ lọc băng con thường được thiết kế xấp xỉ thoả mãn tiêu chuẩn của các đáp ứng tần số không chồng chéo. Mục đích là để giải tương quan các hệ số tần số kết quả. Đây chính là tính chất quan trọng mà quá trình lọc băng con cố gắng đạt được. Các bộ lọc băng con được thiết kế để là các xấp xỉ với các bộ lọc chọn tần số lý tưởng, trong đó đáp ứng tổng hợp từ tất cả các bộ lọc bao trùm tất cả băng tần của ảnh. Tuy nhiên trong thực tế, sự tương quan tổng không bao giờ đạt được do những bộ lọc này chỉ xấp xỉ với các bộ lọc lý tưởng.

Hình dưới đây là sơ đồ tổng quát giải thích kỹ thuật mã hoá băng con.

Sơ đồ 3.4.4.3a minh hoạ kỹ thuật mã hoá băng con – M băng con

NGHIÊN CỨU CÁC PHƯƠNG PHÁP NÉN ẢNH SỐ 75 Các bộ lọc sử dụng trong mã hoá băng con là các b lc gương t phương – QMF (quardrature mirror filters), do vậy chúng ta chỉ cần thiết kế các bộ lọc thông thấp có đáp ứng H() còn đáp ứng của các bộ lọc thông cao là H(+) chỉ là sự dịch pha 180 so với bộ lọc thông thấp. Sự chính xác của bộ lọc phụ thuộc vào các hệ số của bộ lọc.

Một trong các phương pháp mã hoá băng con đó là áp dụng sự phân ly cây bát phân để phân ly dữ liệu ảnh thành các băng tần khác nhau. Ý tưởng của phương pháp này là: trước tiên lọc và lược bỏ ảnh để phân ly ảnh thành các băng con tần số cao và thấp, sau đó tiếp tục phân ly nhưng chỉ áp dụng cho băng con tần số thấp để tạo thành các băng con tần số cao và thấp để tiếp tục lược bỏ. Kỹ thuật này rất phổ biến và cũng được áp dụng trong các bộ mã sử dụng biến đổi Wavelet. Đầu ra của các băng con sau khi đã giản lược sẽ được lượng tử hoá và mã hoá độc lập. Mỗi băng con sẽ sử dụng bộ lượng tử hoá riêng và mỗi bộ lượng tử hoá này có tốc độ lấy mẫu riêng (bít/mẫu).

Như vậy rõ ràng mã hoá băng con không đạt được sự nén, mà nó chỉ thực hiện việc giải tương quan giữa ảnh gốc và tập trung năng lượng của ảnh vào một số băng con. Nén chỉ đạt được là do sự lược bỏ ảnh (decimation) và do sự lượng tử hoá (quantization).

Sơ đồ 3.4.4.3b minh hoạ quá trình phân ly băng con cây bát phân

Trong các hệ thống mã hoá băng con hai chiều thực tế, người ta chia miền tần số - không gian hai chiều của ảnh gốc thành các băng khác nhau ở bất kỳ mức nào.

Hình dưới đây minh hoạ việc phân ly 2 ảnh mẫu thành 4 băng con LL, HL, LH và HH ở mức đầu tiên.

NGHIÊN CỨU CÁC PHƯƠNG PHÁP NÉN ẢNH SỐ 76

Hình 3.4.4.3 Phân ly hai ảnh mẫu thành bốn băng con

Nhược điểm của kỹ thuật mã hoá băng con:

Một trong những vấn để chủ yếu của kỹ thuật mã hoá băng con đó là giải quyết bài toán cấp phát bít (là số bít cấp cho mỗi băng con) để đạt được hiệu suất cao nhất. Một trong những cách thực hiện là sử dụng ý tưởng cấp phát bít tối ưu cho mỗi đầu ra băng con đã được lượng tử hoá. Tuy nhiên cách này chủ yếu thích hợp cho trường hợp tốc độ cao (≥1bít/mẫu).

Trước khi đi vào nghiên cứu kỹ thuật mã hoá dựa trên phép biến đổi, chúng ta sẽ tổng kết một số nhược điểm của kỹ thuật mã hoá băng con như sau:

- Kỹ thuật mã hoá băng con không xác định được hệ thống mã hoá tối ưu cho các ứng dụng tốc độ bít thấp.

- Việc cấp phát bít tối ưu sẽ thay đổi khi tốc độ bít tổng thay đổi, điều này làm quá trình mã hoá phải lặp lại hoàn toàn cho mỗi tốc độ bít xác định.

- Không hoàn toàn giải tương quan cho tất cả các băng tần, đấy là do các bộ lọc không phải là lý tưởng và có sự chồng chéo nhỏ giữa các băng tần liền kề. Do vậy luôn luôn tồn tại một sự tương quan nhỏ giữa các băng tần kề nhau và dữ liệu sẽ không được nén hoàn toàn.

- Kỹ thuật mã hoá băng con không hiệu quả khi thực hiện bù chuyển động trong video vì rất khó để thực hiện đánh giá chuyển động ở các băng con (sai số dự đoán là rất lớn).

Một phần của tài liệu NGHIÊN CỨU CÁC PHƯƠNG PHÁP NÉN ẢNH SÓ (Trang 74 - 79)

Tải bản đầy đủ (PDF)

(117 trang)