XỬ LÍ ẢNHI • Xử lí ảnh số II • Các giai đoạn,thành phần chính trong hệ thống XLAIII • Ứng dụng IV • Số hóa ảnh,Lượng tử hóa V • Các tiêu chuẩn lấy mẫu VI • Phương pháp xác đinh và dự đo
Trang 1THÀNH VIÊN NHÓM: Trần Văn Hải Nguyễn Đức Duy Phan Văn Duy Phan Anh Minh Phạm Văn Nam Nguyễn Hoàng Phi
GVHD: Chu Hồng Hải
XỬ LÝ ÂM THANH
HÌNH ẢNH
Trang 2XỬ LÍ ẢNH
I • Xử lí ảnh số
II • Các giai đoạn,thành phần chính trong hệ thống XLAIII • Ứng dụng
IV • Số hóa ảnh,Lượng tử hóa
V • Các tiêu chuẩn lấy mẫu
VI • Phương pháp xác đinh và dự đoán biên ảnh
Trang 4XỬ LÍ ẢNH
*Tại sao cần xử lí ảnh số
*Tại sao phải nén tín hiệu?
-Ảnh được sủ dụng mọi lúc, mọi nơi
-Hạn chế về không gian lưu trữ và tốc độ đường truyền
Trang 6XỬ LÍ ẢNH
A.Các giai đoạn chính của hệ thống sử lí ảnh
II Các giai đoạn,thành phần chính của hệ thống xử lí ảnh
Trang 7XỬ LÍ ẢNH
A.Các giai đoạn chính của hệ thống sử lí ảnh
II Các giai đoạn,thành phần chính của hệ
thống xử lí ảnh
+ Thu nhận ảnh: - Qua các camera (tương tự, số)
- Từ vệ tinh qua các bộ cảm ứng (Sensors)
- Qua các máy quét ảnh (Scaners)
+ Số hóa ảnh: Biến đổi ảnh tương tự thành ảnh rời rạc để
xử lý bằng máy tính: Thông qua quá trình lấy mẫu (rời rạc
về mặt không gian) và lượng tử hóa(rời rạc về mặt biên độ)
Trang 8XỬ LÍ ẢNH
A.Các giai đoạn chính của hệ thống sử lí ảnh
II Các giai đoạn,thành phần chính của hệ
Trang 9XỬ LÍ ẢNH
B Các thành phần chính của hệ thống xử lí ảnh
II Các giai đoạn,thành phần chính của hệ thống xử lí ảnh
Trang 10XỬ LÍ ẢNH
III Các ứng dụng của xử lí ảnh
-Trong lĩnh vực địa chất, hình ảnh nhận được từ vệ tinh có thể được phân tích để xác định cấu trúc bề mặt trái đất
- Trong ngành khí tượng học, ảnh nhận được từ hệ thống
vệ tinh theo dõi thời tiết cũng được xử lý, nâng cao chất lượng và ghép hình để tạo ra ảnh bề mặt trái đất
- Xử lý ảnh còn được sử dụng nhiều trong các hệ thống
quản lý chất lượng và số lượng hàng hóa trong các dây truyền tự động, ví dụ như hệ thống phân tích ảnh để
phát hiện bọt khí bên vật thể đúc bằng nhựa
Trang 11XỬ LÍ ẢNH
IV Số hóa ảnh
• Phương pháp chung để số hóa ảnh là lấy mẫu theo
Trang 12về mặt không gian, nhưng liên tục về mặt biên độ.
• Tiến trình lượng hóa: lượng tử hóa về mặt biên độ (độ sáng) cho dòng ảnh vừa được rời rạc hóa
Trang 13XỬ LÍ ẢNH
IV Lượng tử hóa
• Lượng hóa ảnh nhằm ánh xạ từ một biến liên tục
u(biểu diễn giá trị độ sáng) sang một biến rời rạc u*
với các giá trị thuộc tập hữu hạn
• Cơ sở lý thuyết của lượng hóa là chia dải độ sáng biến
thiên từ Lmin đến Lmax thành một số mức (rời rạc và
nguyên)- Phải thỏa mãn tiêu chí về độ nhậy của mắt
Thường Lmin=0, Lmax là số nguyên dạng
(Thường chọn B=8, mỗi điểm ảnh sẽ được mã hóa 8 bít)
Trang 14XỬ LÍ ẢNH
Ảnh tương tự và lượng tử hóa
Trang 15XỬ LÍ ẢNH
V Các tiêu chuẩn lấy mẫu
• Tiêu chuẩn 4:4:4: Tín hiệu chói và màu được lấy mẫu tại tất cả các điểm lấy mẫu trên dòng tích cực của tín hiệu video Cấu trúc lấy mẫu trực giao
Trang 16chói
Trang 17một tín hiệu màu Tại dòng chẵn chỉ lấy mẫu tín hiệu màu
CR, tại dòng lẻ lấy mẫu tín hiệu CB Như vậy, nếu tần số lấy mẫu tín hiệu chói là fD, Thì tần số lấy mẫu tín hiệu màu sẽ là fD/2.
Trang 19XỬ LÍ ẢNH
VI Các phương pháp xác định đường biên
1- Phương pháp phát hiện đường biên trực tiếp dựa trên các phân tích về sự thay đổi độ chói của ảnh Kỹ thuật chủ yếu dùng để phát hiện biên là dùng đạo hàm Khi lấy đạo hàm bậc nhất của ảnh ta có phương pháp gradient, khi lấy đạo hàm bậc hai ta có kỹ thuật
Laplace.
2- Phương pháp phát hiện đường biên trong ảnh màu: phân tích
ảnh màu thành các ảnh đơn sắc (R,G,B) và xác định đường biên trên cơ sở sự thay đổi màu sắc trong các ảnh đơn sắc nói trên.
3- Phân tích ảnh thành vùng theo các đặc điểm đặc trưng (thí dụ kết cấu bề mặt (texture)), ranh giới giữa các vùng chính là đường biên của ảnh.
Trang 23TV
Trang 24NÉN ẢNH
Ví dụ:
- Một camera số (4Mpixel)
Dữ liệu ban đầu – 24bits, 5.3M pixels 16M bytes
256M memory card ($30-50) 16 pictures
Nén JPEG
ảnh thô
(16M bytes) compressed JPEG file (1M bytes)
compression ratio=16 256 pictures
II MỤC ĐÍCH CỦA NÉN ẢNH
Trang 26NÉN ẢNH
III CÁC KHÁI NIỆM NẾN ẢNH
• Dư thừa dữ liệu:
- Sự phân bố kí tự
- Sự lặp lại ký tự
- Sự phân bố của các chuỗi ký tự
- Dư thừa trong pixel (Interpixel Redundancy)
- Dư thừa tâm lý thị giác
Trang 27NÉN ẢNH
• Sự phân bố ký tự
- Một số ký tự (pixel) xuất hiện với tần suất lớn hơn so với các
ký tự khác trong dữ liệu gốc (ảnh) Ta có thể thay thế các ký
tự này bằng từ mã nhị phân ít bít hơn và các ký tự xuất hiện nhiều hơn bằng từ mã nhị phân có nhiều bit hơn.
- Dùng mã hóa Huffman để mã hóa loại dư thừa này.
III CÁC KHÁI NIỆM NẾN ẢNH
Trang 28NÉN ẢNH
• Sự lặp lại các ký tự:
- Một chuỗi các ký tự (bit 1 hoặc 0) được lặp lại nhiều lần
Ta có thể mã hóa chuỗi lặp đó bằng ít bit hơn Đây chính
là nguyên tắc hoạt động của mã hóa RLC ( Run-Length Coding)
III CÁC KHÁI NIỆM NẾN ẢNH
Trang 29NÉN ẢNH
• Sự lặp lại của các chuỗi ký tự:
• Một số chuỗi ký tự (pixel) có tần suất xuất hiện tương đối cao.
• Có thể mã hóa các chuỗi đó bằng từ mã ít bít hơn
• Để xử lý loại dư thừa này ta sử dụng phương pháp mã hóa LWZ (mã hóa kiểu từ điển)
III CÁC KHÁI NIỆM NÉN ẢNH
Trang 30IV PHÂN LOẠI NÉN ẢNH
Trang 31NÉN ẢNH
JPEG decoder
original raw image (262,144 bytes)
compressed JPEG file
0
IV PHÂN LOẠI NÉN ẢNH
Trang 32IV PHÂN LOẠI NÉN ẢNH
Trang 33NÉN ẢNH
V PHƯƠNG PHÁP NÉN ẢNH
+ Các phương pháp nén mất thông tin:
- Lấy mẫu phụ sắc độ Điều này lợi dụng thực tế là mắt
người nhận thấy sự thay đổi không gian của độ sáng mạnh hơn so với màu sắc, bằng cách lấy trung bình hoặc bỏ một số thông tin sắc độ trong ảnh.
- Mã hóa chuyển đối Đây là phương pháp phổ biến nhất
- Nen Fractal.
Trang 34NÉN ẢNH
V PHƯƠNG PHÁP NÉN ẢNH
+ Các phương pháp nén không mất thông tin:
- Mã hóa thay đổi độ dài được sử dụng trong phương thức mặc định trong PCX và là một trong những điều có thể có trong BMP, TGA, TIFF
- Mã hóa Entropy
- Mã chuỗi
Trang 35NÉN ẢNH
VI SƠ ĐỒ KHỐI HỆ THỐNG NÉN ẢNH
Bộ chuyển đổi: thường dùng phép biến đổi Cosin rời rạc để tập trung năng lượng tín hiệu vào một số lượng nhỏ các hệ số khai triển để thực hiện phép nén hiệu quả hơn là dùng tín hiệu nguyên thủy.
Bộ lượng tử hoá: tạo ra một lượng ký hiệu giới hạn cho ảnh nén với hai kỹ thuật:
lượng tử vô hướng (thực hiện lượng tử hoá cho từng phần dữ liệu) và lượng tử vectơ (thực hiện lượng tử hoá một lần một khối dữ liệu) Quá trình này không thuận nghịch.
Bộ mã hoá: gán một từ mã, một dòng bit nhị phân cho mỗi ký hiệu
Trang 37Các tiêu chuẩn nén ảnh
• JPEG (The Joint Photographic Expert Group): dùng cho nén ảnh tĩnh, phát triển bởi sự kết hợp giữa ITU-TS (the International Telecommunications Union-Telecommunication Sector)
và ISO (International Standards Organization)
• MPEG-1, MPEG-2, MPEG-4, MPEG-7: do Ủy ban ISO IEC/JTC1/SC29- /WG11 phát triển cho mã hoá kết hợp giữa video và audio.
• H.261: do Nhóm nghiên cứu XI phát triển và được biết rộng rãi như tiêu chuẩn mã hoá video cho các dịch vụ nghe nhìn tốc độ nx 64Kbps.
• ITU-TS H.263 cho các ứng dụng điện thoại thấy hình tốc độ dưới 64Kbps.
Trang 38Các kỹ thuật mã hoá entropy (mã hóa không tổn thất)
• Huffman
• Lempel Ziv – Wench (LZW)
Trang 39o Tạo cây huffman
Dựa vào mô hình thống kê tính tần suất xuất hiện các ký tự Gán cho các ký tự có tần xuất cao bằng một từ mã ngắn, các
ký tự có tần xuất thấp bằng một từ mã dài.
Trang 40• Được Jacob Braham Ziv đưa ra lần đầu tiên năm 1977, sau đó phát triển thành một họ giải thuật nén từ điển là
LZ.
• Năm 1984, Terry Welch cải tiến giải thuật LZ thành một
giải thuật tốt hơn :LZW
• Dùng để giảm dư thữa trong pixel
• Không cần biết trước xác suất phân bố của các pixel
• Thường được dùng để nén các loại văn bản, ảnh đen trắng, ảnh màu, ảnh đa mức xám Và là chuẩn nén cho các dạng ảnh GIF và TIFF
Mã LZW
Trang 42• Từ điển được xây dựng đồng thời với quá trình đọc dữ liệu Sự có mặt của một chuỗi con trong từ điển khẳng định rằng chuỗi đó đã từng xuất hiện trong phần dữ liệu đã đọc
• Thuật toán liên tục “tra cứu ” và cập nhật từ điển sau mỗi lần đọc một kí tự ở dữ liệu đầu vào
• Do kích thước bộ nhớ không phải vô hạn và để đảm bảo tốc độ tìm kiếm, từ điển chỉ giới hạn 4096 ở phần
tử dùng để lưu lớn nhất là 4096 giá trị của các từ mã Như vậy độ dài lớn nhất của mã là 12 bít(4096= 212)
Mã LZW
Trang 45Giới thiệu chuẩn JPEG
• JPEG là một tiêu chuẩn nén ảnh được áp dụng trong nhiều lĩnh vực: Lưu trữ ảnh, Fax màu, camera số,…
• Công nghệ JPEG nén hiệu quả với tỷ lệ đạt mức vài chục lần (hệ số nén 80:1)
• Xử lý tốt mất mát thông tin trong quá trình nén khiến
người nhìn không nhận ra sự khác biệt
• Ảnh đã nén sau khi giải mã trùng khớp với ảnh ban đầu
• Nguyên lý nén đơn giản, dựa vào sự thiếu nhạy cảm của mắt người với không gian màu U,V để ẩn giấu các thông tin dư thừa trong ảnh
Trang 461 Chuyển ảnh ban đầu thành các block 8x8
• Block là một ma trận điểm ảnh 8x8 pixel
• Mục đích: tính toán DCT cho từng vùng dư thừa dữ liệu khác nhau
• Tất cả các block có cùng kích thước và mỗi block là một
ma trận điểm ảnh 8×8 pixel được lấy từ một ảnh màn
hình theo chiều từ trái sang phải, từ trên xuống dưới
Kích thước block là 8×8 được chọn bởi hai lý do sau:
o Kích thước block lớn làm tăng độ phức tạp thuật toán
o Khoảng cách giữa các pixel vượt quá 8 sẽ làm cho hàm tương quan suy giảm nhanh
Trang 472 Biến đổi Cosin rời rạc DCT (Discrete Cosine Transform)
DCT (Discrete Cosine Transform): biến đổi dữ
liệu dưới dạng biên độ thành dữ liệu dưới dạng
tần số Mục đích: loại bỏ sự dư thừa dữ liệu trong
không gian DCT chia thành 2 loại:
• DCT một chiều.
• DCT hai chiều.
Thuật toán DCT là phần quan trọng nhất trong
nén ảnh JPEG, mình sẽ sử dụng DCT hai chiều
cho code nên trong bài viết này mình xin giới
thiệu qua về DCT-2d
Trang 482D-DCT
Trang 49Chuẩn JPEG
Trang 51Chuyển ảnh thành các MB
Tất cả các block có cùng kích thước và mỗi block là một ma trận điểm ảnh 8 8 pixel được lấy từ một ảnh màn hình theo chiều từ trái sang phải, từ trên xuống dưới Kích thước MB là 8 8 được chọn bởi hai lý do sau:
1 Qua việc nghiên cứu cho thấy hàm tương quan suy giảm rất nhanh khi khoảng cách giữa các pixel vượt quá 8
2 Tiện lợi cho việc tính toán và thiết kế phần cứng Nói chung, độ phức tạp về tính toán sẽ tăng nếu kích thước block tăng
Trang 52Chuyển mức điểm ảnh (trừ 128)
Ví Dụ:
-128
Trang 53Biến đổi DCT
Ví Dụ:
Biến đổi DCT và làm tròn các hệ số
DCT
Trang 54Lượng tử hóa
Ví dụ:
Sử dụng Ma trận lượng tử hóa (Q)
Trang 55Chia các phần tử của ma trận DCT với các phần tử tương ứng của
ma trận lượng tử hóa ở trên theo công thức:
Trang 56Quét zig-zag các hệ số lượng tử hóa DCT.
Trang 58Ví dụ
Trang 59Mã hóa DC
Trang 61Bảng mã DC
Trang 62Mã hóa AC
Trang 63Bảng mã AC
Trang 64Mã hóa AC
Trang 65Ví dụ: DC coefficient of the previous block is 60
Biết rằng hệ sô DC của khối trước là 60 Hãy mã hóa ma trận ảnh thành mã nhị phân.
Cho ma trận ảnh lượng tử:
Trang 66Kết quả
• “11011001, 100010, 001, 1111100001, 0110, 0110, 000,1010”
Trang 68TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI
THÀNH PHỐ HỒ CHÍ MINH
Trang 69• Yêu cầu về hiệu suất nén với tỉ số nén cao
Trang 70TỔNG QUAN
• Hệ thống nén JPEG2000 có tỉ lệ xuyên âm thấp hơn các công nghệ JPEG truyền thống
• Cho phép tách các phân giải khác nhau, các điểm ảnh, các miền quan tâm, các thành phần và hơn nữa, tất cả chúng được đưa vào một dòng bít nén riêng rẽ
• JPEG2000 sử dụng kỹ thuật biến đổi sóng con rời rạc (DWT) dùng mã hóa số học
Trang 71CÁC TÍNH NĂNG CỦA JPEG2000
Trang 72CÁC TÍNH NĂNG CỦA JPEG2000
• Sử dụng cùng một cơ chế nén ảnh cho cả hai dạng thức nén.
• Truy nhập và giải nén tại mọi thời điểm trong khi nhận dữ
liệu.
• Khả năng vượt trội trong khôi phục lỗi.
Trang 73PHƯƠNG PHÁP NÉN ẢNH THEO CHUẨN
Ảnh nén
Xử lý trước
biến đổi Biến đổi liên thành phần
Lượng tử hóa
SƠ ĐỒ NÉN ẢNH TRONG JPEG2000
Trang 74Bước 1: Xử lý trước biến đổi
• Giai đoạn đảm bảo dữ liệu đưa vào nén ảnh có dạng đối
xứng qua 0
CÁC BƯỚC THỰC HIỆN NÉN ẢNH
Trang 75Bước 2: Biến đổi liên thành phần
• Loại bỏ tính tương quan
Trang 76Bước 3: Biến đổi riêng các thành phần
• Sử dụng biến đổi WAVELET Chia tín hiệu thành các băng con và mỗi băng sẽ được mã hóa riêng rẽ
• Thường sử dụng hàm Wavelet Daubechies
CÁC BƯỚC THỰC HIỆN NÉN ẢNH
Trang 77Bước 4: Lượng tử hóa
• Cho phép đạt tỉ lệ nén cao hơn bằng cách thể hiện các
giá trị biến đổi với độ chính xác tương ứng cần thiết với mức chi tiết của ảnh cần nén
• Các hệ số biến đổi sẽ được lượng tử hoá theo phép lượng
tử hoá vô hướng
CÁC BƯỚC THỰC HIỆN NÉN ẢNH
Trang 78Bước 5: Mã hóa
• Các hệ số biến đổi sẽ được lượng tử hoá theo phép lượng
tử hoá vô hướng
• Trong thực tế sử dụng 2 phương pháp phổ biến là SPIHT
và EZW
CÁC BƯỚC THỰC HIỆN NÉN ẢNH
Trang 79SPIHT (Set Partitioning in HierarchicalTrees)
• Phương pháp mã hoá phân cấp theo phân vùng
• SPIHT được thiết kế tối ưu cho truyền dẫn luỹ tiến
• Sử dụng kỹ thuật embedded coding- Có nghĩa là: một ảnh sau nén với kích cỡ (lưu trữ) lớn (tỷ lệ nén thấp) sẽ chứa chính dữ liệu sau nén của ảnh có kích cỡ (lưu trữ) nhỏ (tỷ lệ nén cao)
Trang 80EZW(Embedded Zerotree Wavelet Encoder)
• Cũng dựa trên phương pháp mã hóa lũy tiến
• Phương pháp này chủ yếu dựa trên khái niệm về cây
zero (zerotree)
Trang 81Bài tập
Trang 83CHUẨN JPEG2000 VÀ NÉN ẢNH MÀU
• Giải nén: Làm ngược lại các bước trên
Xử lý sau biến đổi
Giải mã
Biến đổi ngược liên thành phần
Biến đổi ngược riêng thành phần
Gải lượng
tử hóa Ảnh
nén
Trang 84Các chuẩn nén ảnh hiện nay
Trang 85Ưu điểm của chuẩn nén JPEG2k
Trang 86Bài tập
Trang 87• Nén tín hiệu video theo chuẩn MPEG là phương pháp nén ảnh động không làm dư thừa không gian như JPEG
mà còn làm giảm dư thừa thời gian giữa các khung ảnh, đây là khác biệt so với JPEG là chuẩn nén ảnh tĩnh chỉ làm giảm dư thừa không gian trong một khung ảnh
• Trong chuẩn MPEG, người ta quy định 3 loại khung ảnh phụ thuộc vào phương pháp nén:nén trong khung ảnh (khung I),nén ước đoán ( khung P ) và nén nội suy 2
chiều theo thời gian ( khung B )
MPEG
Trang 88Chuẩn MPEG bao gồm các tiêu chuẩn nén video có tốc độ luồng bit khác nhau
MPEG
Trang 89• MPEG-1 ~ 1-1.5Mbps (early 90s)
• For compression of 320x240 full-motion video at rates around 1.15Mb/s
• Applications: video storage (VCD)
• MPEG-2 ~ 2-80Mbps (mid 90s)
• For higher resolutions
• Support interlaced video formats and a number of features for HDTV
• Address scalable video coding
• Also used in DVD
• MPEG-4 ~ 9-40kbps (later 90s)
• For very low bit rate video and audio coding
• Applications: interactive multimedia and video telephony
• MPEG-21 ~ ongoing
MPEG
Trang 90• Tiêu chuẩn MPEG là sự kết hợp giữa nén trong ảnh và nén liên ảnh
• Phương pháp nén có tổn hao dựa trên sự biến đổi DCT
• Bù chuyển động
MPEG
Trang 91Cấu trúc dòng bit MPEG
Trang 92Ứng dụng MPEG trong truyền thông đa phương tiện
Trang 93Ứng dụng MPEG trong truyền thông đa phương tiện
Trang 94THANK YOU