1.1 Giới thiệu về hệ thống xử lý ảnh. 1.1.1 Thu nhận ảnh. 1.1.2 Tiền xử lý ảnh. 1.1.3 Phân Đoạn ảnh. 1.1.4 Biểu diễn ảnh. 1.1.5 Nhận dạng và nội suy ảnh. 1.1.6 Cơ sở tri thức. 1.1.7 Biểu diễn ( mô tả) ảnh. 1.2 Những vấn đề cơ bản trong hệ thống xử lý ảnh. 1.2.1 Điểm ảnh. 1.2.2 Độ phân giải của ảnh. 1.2.3 Mức xám của ảnh. 1.2.4 Định nghĩa ảnh số. 1.2.5 Quan hệ giữa các điểm ảnh. 1.2.6 Các thành phần cơ bản của hệ thống xử lý ảnh. 1.3.1 Biến đổi ảnh. 1.3.2 Nén ảnh.
Trang 1Chương 1: Giới Thiệu Xử Lý Ảnh
Chương 1
GIỚI THIỆU XỬ LÝ ẢNH
1.1 Giới thiệu về hệ thống xử lý ảnh
Xử lý ảnh là một ngành khoa học còn tương ñối mới mẻ so với nhiều ngành khoa học khác Hiện nay nó ñang là một trong những lĩnh vực ñược quan tâm và ñã trở thành môn học chuyên ngành của sinh viên hệ kỹ sư, cử nhân ngành Công nghệ Thông tin, ðiều khiển Tự ñộng…
Nhờ có công nghệ số hóa hiện ñại, ngày nay con người ñã có thể xử lý tín hiệu nhiều chiều thông qua nhiều hệ thống khác nhau, từ những mạch số ñơn giản cho ñến những máy tính song song cao cấp Mục tiêu của xử lý này có thể chia làm
ba hướng như sau:
• Xử lý ảnh ban ñầu ñể có ñược ảnh mới theo một yêu cầu xác ñịnh (ví dụ như ảnh mờ cần xử lý ñể ñược ảnh rõ hơn)
• Phân tích ảnh ñể thu ñược các thông tin ñặc trưng giúp cho việc phân loại, nhận biết ảnh (ví dụ phân tích ảnh vân tay ñể trích chọn các ñặc trưng vân tay)
• Hiểu ảnh ñầu vào ñể có những mô tả về ảnh ở mức cao hơn, sâu hơn (ví dụ từ ảnh một tai nạn giao thông phác họa hiện trường tai nạn)
Trong bài giảng này, chúng ta sẽ tập trung vào những khái niệm cơ bản của xử lý ảnh và tập trung vào vấn ñề trong phạm vi ảnh 2 – chiều, còn ảnh nhiều chiều không ñược xét kỹ ở ñây
Lĩnh vực ứng dụng:
• Sản xuất và kiểm tra chất lượng
• Di chuyển của Robot
• Các phương tiện ñi lại tự trị
• Công cụ hướng dẫn cho người mù
Trang 2• Nhận dạng ñối
• Ứng dụng tron
• Sản xuất, hiệu
• Chinh phục vũ
Với những ứng dụn
ngay từ bây giờ tìm hiểu,
ðể dễ tưởng tượng,
từ thế giới ngoài ñược thu
Trước ñây, ảnh thu qua C
Gần ñây, với sự phát tri
Camera, sau ñó nó ñược
theo (Máy ảnh số hiện
nhận từ vệ tinh, có thể qué
các bước cơ bản trong xử
H Tín hiệu ảnh thuộc lo
• Ảnh tĩnh trong không
S là giá trị biên ñộ (ñ
• Phân loại ảnh:
− Ảnh tương tự S(
Chương 1
ối tượng, nhận dạng mặt
ng y học chỉnh video
ũ trụ…
ng to lớn của công nghệ xử lý ảnh, chúng làm việc với một trong những thế giới ñầy xét các bước cần thiết trong xử lý ảnh ð thu nhận qua các thiết bị thu (như Camer Camera là các ảnh tương tự (loại Camera riển của công nghệ, ảnh màu hoặc ñen tr
c chuyển trực tiếp thành ảnh số tạo thuận nay là một thí dụ gần gũi) Mặt khác, ản quét từ ảnh chụp bằng máy quét ảnh Hình
ử lý ảnh
Hình 1.1 Các bước cơ bản trong xử lý ảnh loại tín hiệu ña chiều: tọa ñộ (x,y,z), ñộ sán không gian 2 chiều ñược ñịnh nghĩa là một hàm
ộ (ñược biểu diễn bằng màu sắc) tại vị trí khô
S(x,y): (x,y) liên tục, S liên tục
g 1: Giới Thiệu Xử Lý Ảnh
chúng ta hãy bắt tay vào
ầy tiềm năng này ðầu tiên, ảnh tự nhiên era, máy chụp ảnh) era ống kiểu CCIR) trắng ñược lấy ra từ
ận lợi cho xử lý tiếp ảnh cũng có thể tiếp Hình 1.1 dưới ñây mô tả
nh sáng(λ), thời gian(t)
àm 2 biến S(x,y), với
rí không gian (x,y)
Trang 3Chương 1: Giới Thiệu Xử Lý Ảnh
− Ảnh số S(m,n): (m,n) rời rạc, S rời rạc
• Một ảnh (gồm một tập các ñiểm ảnh) có thể xem như bao gồm tập các ảnh con (các vùng ảnh) Thuật ngữ gọi là ROIs – vùng quan tâm (Regions of Interest)
• Ảnh số trong không gian rời rạc thu ñược từ ảnh tương tự trong không gian liên tục thông qua quá trình số hóa Quá trình số hóa có thể hiểu ñơn giản như sau:
− Ảnh tương tự ñược chia thành M hàng, N cột
− Giao của hàng và cột ñược gọi là: pixel
− Giá trị biên ñộ của pixel tại tọa ñộ nguyên (m,n) là s(m,n): là trung bình
ñộ sáng trong pixel ñó S(m,n) ≤ L (L số mức xám dùng biểu diễn ảnh)
• M, N thường ñược chọn là M=N=2K (K=8,9,10) L =2B, B là số bít mã hóa cho
ñộ sáng (biên ñộ) mỗi pixel
• Ảnh số ñược biểu diễn bởi ma trận 2 chiều Các phần tử của nó là biểu diễn cho các pixel số hóa
• Ta ký hiệu 1 ảnh số là S(M,N) Ta nói ảnh có ñộ phân giải MxN Ký hiệu s(m,n)
ñể chỉ ra một phần tử ảnh
Hình 1.2 Sơ ñồ phân tích xử lý ảnh và các lưu ñồ thông tin giữa các khối 1.1.1 Thu nhận ảnh (Image Acquisition)
Trang 4là ảnh tương tự (loại cam
có loại camera ñã số ho
photodiode tạo cường ñộ
Camera thường dùng
một ảnh thu nhận ñược ph
cảnh)
1.1.2 Tiền xử lý ảnh (Im
Sau bộ thu nhận, ảnh
lý ñể nâng cao chất lượng
tương phản ñể làm ảnh rõ
Chương 1
mera ống chuẩn CCIR với tần số 1/25, mỗi ả hoá (như loại CCD – Change Coupled
ộ sáng tại mỗi ñiểm ảnh
dùng là loại quét dòng: ảnh tạo ra có dạng hai
ợc phụ thuộc vào thiết bị thu, vào môi trường
Hình 1.3 Thu nhận ảnh
nh (Image Processing) ảnh có thể nhiễu ñộ tương phản thấp nên cần
ng Chức năng chính của bộ tiền xử lý là
õ hơn, nét hơn
Hình 1.4 Tiền xử lý ảnh
g 1: Giới Thiệu Xử Lý Ảnh
ỗi ảnh 25 dòng), cũng pled Device) là loại
hai chiều Chất lượng
ng (ánh sáng, phong
ần ñưa vào bộ tiền xử
là lọc nhiễu, nâng ñộ
Trang 51.1.3 Phân ñoạn ảnh (Im
Phân vùng ảnh là tác
phân tích, nhận dạng ảnh
cho mục ñích phân loại b
thành các từ, các chữ, các
phức tạp khó khăn nhất
của ảnh Kết quả nhận dạn
1.1.4 Biểu diễn ảnh (Ima
ðầu ra ảnh sau phân
cộng với mã liên kết với c
thích hợp là cần thiết cho x
hiện ảnh gọi là trích chọn ñ
của ảnh dưới dạng các thôn
này với ñối tượng khác tr
trên phong bì thư, chúng
này với ký tự khác
Chương 1
Image Segmentation) tách một ảnh ñầu vào thành các vùng thành
nh Ví dụ: ñể nhận dạng chữ (hoặc mã vạch)
ại bưu phẩm, cần chia các câu, chữ về ñịa c các số (hoặc các vạch) riêng biệt ñể nhận trong xử lý ảnh và cũng dễ gây lỗi, làm ạng ảnh phụ thuộc rất nhiều vào công ñoạn
Hình 1.5: Phân ñoạn ảnh
nh (Image Representation) phân ñoạn chứa các ñiểm ảnh của vùng ảnh
i các vùng lận cận Việc biến ñổi các số li
t cho xử lý tiếp theo bằng máy tính Việc chọn c
ọn ñặc trưng (Feature Selection) gắn với vi thông tin ñịnh lượng hoặc làm cơ sở ñể phân trong phạm vi ảnh nhận ñược Ví dụ: tron
ta miêu tả các ñặc trưng của từng ký tự gi
g 1: Giới Thiệu Xử Lý Ảnh
thành phần ñể biểu diễn ạch) trên phong bì thư
ịa chỉ hoặc tên người
ận dạng ðây là phần làm mất ñộ chính xác
ạn này
(ảnh ñã phân ñoạn)
ố liệu này thành dạng chọn các tính chất ñể thể
i việc tách các ñặc tính
ể phân biệt lớp ñối tượng : trong nhận dạng ký tự
ự giúp phân biệt ký tự
Trang 6Chương 1: Giới Thiệu Xử Lý Ảnh
Hình 1.6 Biểu diễn ảnh số 1.1.5 Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)
Nhận dạng ảnh là quá trình xác định ảnh Quá trình này thường thu được bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước Nội suy là phán đốn theo ý nghĩa trên cơ sở nhận dạng Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thư cĩ thể được nội suy thành mã điện thoại Cĩ nhiều cách phân loại ảnh khác nhau về ảnh Theo lý thuyết về nhận dạng, các mơ hình tốn học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản:
• Nhận dạng theo tham số
• Nhận dạng theo cấu trúc
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa học và cơng nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người… 1.1.6 Cơ sở tri thức (Knowledge Base)
Như đã nĩi ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng điểm ảnh, mơi trường để thu ảnh phong phú kéo theo nhiễu Trong
(1,1)
(2,1) (1,2)
(2,2) (1,3)
(2,3) (1,4)
(2,4)
(1,j)
(2,j) (1,j+1)
(2,j+1)
(1,n-1)
(2,n-1) (1,n)
(2,n)
(3,1)
(4,1) (3,2)
(4,2) (3,3)
(4,3) (3,4)
(4,4)
(3,j)
(4,j) (3,j+1)
(4,j+1)
(3,n-1)
(4,n-1) (3,n)
(4,n)
(i,1)
(i+1,1) (i,2)
(i+1,2) (i,3)
(i+1,3) (i,4)
(i+1,4)
(i,j)
(i+1,j) (i,j+1)
(i+1,j+1)
(i,n-1)
(i+1,n-1)
(3,n)
(i+1,n)
(m-1,1)
(m,1) (m-1,2)
(m,2) (m-1,3)
(4,3) (m-1,4)
(4,4)
(m-1,j)
(4,j)
(m-1,j+1)
(4,j+1)
(m-1,n-1)
(m,n-1) (m-1,n)
(m,n)
Digital Image Representation
x
y
Trang 7nhiều khâu xử lý và phân
học ñảm bảo tiện lợi cho
và xử lý ảnh theo cách của
ñã xử lý theo các phương
ñược phát huy Trong tài
cách sử dụng các cơ sở tri t
Hìn 1.1.7 Biểu diễn (mô tả) ả
Từ Hình 1.1, ảnh sau
khâu tiếp theo ñể phân tíc
lượng bộ nhớ cực lớn và
Thông thường, các ảnh thô
theo các ñặc ñiểm của ảnh
ảnh (Boundary), vùng ảnh
• Biểu diễn bằng mã lo
• Biểu diễn bằng mã xí
• Biểu diễn bằng mã t
Chương 1
phân tích ảnh ngoài việc ñơn giản hóa các
ho xử lý, người ta mong muốn bắt chước q
ủa con người Trong các bước xử lý ñó, nh ương pháp trí tuệ con người Vì vậy, ở ñâ tài liệu, chương 6 về nhận dạng ảnh có nêu tri thức ñó
nh 1.7 Các cơ sở tri thức trong xử lý ảnh
ô tả) ảnh sau khi số hoá sẽ ñược lưu vào bộ nhớ, ho hân tích Nếu lưu trữ ảnh trực tiếp từ các ảnh
à không hiệu quả theo quan ñiểm ứng d thô ñó ñược ñặc tả (biểu diễn) lại (hay ñơ ảnh ñược gọi là các ñặc trưng ảnh (Image F ảnh (Region) Một số phương pháp biểu diễn loạt dài (Run-Length Code)
ã xích (Chaine -Code)
ã tứ phân (Quad-Tree Code)
g 1: Giới Thiệu Xử Lý Ảnh
các phương pháp toán
c quy trình tiếp nhận nhiều khâu hiện nay
ây các cơ sở tri thức nêu một vài ví dụ về
hoặc chuyển sang các ảnh thô, ñòi hỏi dung dụng và công nghệ ñơn giản là mã hoá)
ge Features) như: biên diễn thường dùng:
Trang 8Chương 1: Giới Thiệu Xử Lý Ảnh
Hình 1.8: Biểu diễn ảnh mã loạt dài
Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị phân Một vùng ảnh R có thể mã hoá ñơn giản nhờ một ma trận nhị phân:
S(m, n) = 1 nếu (m, n) thuộc R S( m, n) = 0 nếu (m, n) không thuộc R Trong ñó: S(m, n) là hàm mô tả mức xám ảnh tại tọa ñộ (m, n) Với cách biểu diễn trên, một vùng ảnh ñược mô tả bằng một tập các chuỗi số 0 hoặc 1 Giả
sử chúng ta mô tả ảnh nhị phân của một vùng ảnh ñược thể hiện theo toạ ñộ (x, y), các chiều và ñặc tả chỉ ñối với giá trị “1” khi ñó dạng mô tả có thể là: (x, y)r; trong ñó (x, y) là toạ ñộ, r là số lượng các bit có giá trị “1” liên tục theo chiều ngang hoặc dọc
Phương pháp này thường dùng ñể biểu diễn ñường biên ảnh Một ñường bất
kỳ ñược chia thành các ñoạn nhỏ Nối các ñiểm chia, ta có các ñoạn thẳng kế tiếp ñược gán hướng cho ñoạn thẳng ñó tạo thành một dây xích gồm các ñoạn Các hướng có thể chọn 4, 8, 12, 24,… mỗi hướng ñược mã hoá theo số thập phân hoặc số nhị phân thành mã của hướng
Phương pháp mã tứ phân ñược dùng ñể mã hoá cho vùng ảnh Vùng ảnh ñầu tiên ñược chia làm bốn phần thường là bằng nhau Nếu mỗi vùng ñã ñồng nhất (chứa toàn ñiểm ñen (1) hay trắng (0)), thì gán cho vùng ñó một mã và không chia tiếp Các vùng không ñồng nhất ñược chia tiếp làm bốn phần theo thủ
Trang 9Chương 1: Giới Thiệu Xử Lý Ảnh
tục trên cho ñến khi tất cả các vùng ñều ñồng nhất Các mã phân chia thành các vùng con tạo thành một cây phân chia các vùng ñồng nhất
Trên ñây là các thành phần cơ bản trong các khâu xử lý ảnh Trong thực tế, các quá trình sử dụng ảnh số không nhất thiết phải qua hết các khâu ñó tùy theo ñặc ñiểm ứng dụng Hình 1.2 cho sơ ñồ phân tích và xử lý ảnh và lưu ñồ thông tin giữa các khối một cách khá ñầy ñủ Ảnh sau khi ñược số hóa ñược nén, lưu lại ñể truyền cho các hệ thống khác sử dụng hoặc ñể xử lý tiếp theo Mặt khác, ảnh sau khi số hóa có thể bỏ qua công ñoạn nâng cao chất lượng (khi ảnh ñủ chất lượng theo một yêu cầu nào ñó) ñể chuyển tới khâu phân ñoạn hoặc bỏ tiếp khâu phân ñoạn chuyển trực tiếp tới khâu trích chọn ñặc trưng Hình 1.2 cũng chia các nhánh song song như: nâng cao chất lượng ảnh có hai nhánh phân biệt: nâng cao chất lượng ảnh (tăng ñộ sáng, ñộ tương phản, lọc nhiễu) hoặc khôi phục ảnh (hồi phục lại ảnh thật khi ảnh nhận ñược bị méo) …
• Histogram (biểu ñồ xám) mô tả sự phân bố của cấp ñộ sáng của một ảnh theo số lượng pixel mang cùng một giá trị
Hình 1.9 Histogram ảnh xám
• Histogram của ảnh màu: Giá trị vector của histogram, h(g,1,b) như sau:
− h(g+1,1,1) = các pixel trong I với cường ñộ sáng màu ñỏ là g
− h(g+1,1,2) = các pixel trong I với cường ñộ sáng màu xanh lá là g
− h(g+1,1,3) = các pixel trong I với cường ñộ sáng màu xanh lam là g
Trang 101.2 Những vấn ñề cơ b
1.2.1 ðiểm ảnh (Picture
Gốc của ảnh (ảnh tự
bằng máy tính (số), ảnh
một ảnh liên tục thành m
ñộ sáng (mức xám) Kho
người không phân biệt
ñiểm ảnh (PEL: Picture El
mỗi pixel ứng với cặp tọa ñ
ðiểm ảnh (Pixel) là
nhất ñịnh Kích thước và
cho mắt người cảm nhận
số gần như ảnh thật Mỗi p
Chương 1
Hình 1.10 Histogram ảnh màu
ơ bản trong hệ thống xử lý ảnh
cture Element)
ự nhiên) là ảnh liên tục về không gian và cần phải ñược số hoá Số hoá ảnh là sự một tập ñiểm phù hợp với ảnh thật về vị oảng cách giữa các ñiểm ảnh ñó ñược thi ñược ranh giới giữa chúng Mỗi một ñi Element) hay gọi tắt là Pixel Trong khuôn
a ñộ (x, y)
một phần tử của ảnh số tại toạ ñộ (x, y) v
và khoảng cách giữa các ñiểm ảnh ñó ñược c
sự liên tục về không gian và mức xám
ỗi phần tử trong ma trận ñược gọi là một phầ
Hình 1.11 ðiểm ảnh
g 1: Giới Thiệu Xử Lý Ảnh
và ñộ sáng ðể xử lý
ự biến ñổi gần ñúng
ị trí (không gian) và thiết lập sao cho mắt ñiểm như vậy gọi là khuôn khổ ảnh hai chiều,
với ñộ xám hoặc màu
ợc chọn thích hợp sao (hoặc màu) của ảnh
ột phần tử ảnh
Trang 11Chương 1: Giới Thiệu Xử Lý Ảnh
• Ảnh có thể xem là một hàm 2 biến chứa các thông tin như biểu diễn của một ảnh Các mô hình biểu diễn ảnh cho ta một mô tả logic hay ñịnh lượng của hàm này Dựa vào phần tử ñặc trưng của ảnh ñó là pixel Giá trị pixel có thể là một giá trị vô hướng, hoặc là 1 vector (3 thành phần trong trường hợp ảnh màu)
• Ta có thể biểu diễn ảnh bằng hàm toán học, hoặc các ma trận ñiểm Trong
mô hình toán học, ảnh hai chiều ñược biểu diễn nhờ các hàm hai biến, ñó là
) , ( ) , ( )
, (m n S k l m k n l S
−
−
= ∑ ∑
∞
−∞
=
∞
−∞
=
Với 0 m,k M 1, 0 n,l N 1
• S: ảnh
• (m,n): Tọa ñộ của Pixel trong miền không gian (2D)
• s(m,n): ðộ sáng (Mức xám) của pixel (m,n)
thường là 255, nghĩa là chúng ta sử dụng thang mức xám 8 bit 0≤s(m,n)≤255 Với 0 m M 1, 0 n N 1 , ta gọi ñó là ảnh số M x N
Hình 1.12 a Ảnh thật 10x10; b Ảnh ñược zoom; c Mô tả ảnh bằng ma trận ñiểm
• Mô hình cảm nhận ảnh: Là mô hình biểu diễn thông qua các thuộc tính cảm nhận ảnh (màu sắc, cường ñộ sáng), các thuộc tính về thời gian, các cảm nhận về phối
Trang 12Chương 1: Giới Thiệu Xử Lý Ảnh
• Mô hình cục bộ: Là mô hình biểu diễn thể hiện mối tương quan cục bộ của các phần tử ảnh (ứng dụng cho các bài toán xử lý và nâng cao chất lượng ảnh)
• Mô hình tổng thể: Là mô hình biểu diễn ảnh xem ảnh như là một tập hợp các ñối tượng, và các ñối tượng này có mối quan hệ không gian với nhau (ứng dụng cho các bài toán phân nhóm và nhận dạng ảnh)
1.2.2 ðộ phân giải của ảnh (Resolution)
ðộ phân giải (Resolution) của ảnh là mật ñộ ñiểm ảnh ñược ấn ñịnh trên một ảnh số ñược hiển thị
Theo ñịnh nghĩa, khoảng cách giữa các ñiểm ảnh phải ñược chọn sao cho mắt người vẫn thấy ñược sự liên tục của ảnh Việc lựa chọn khoảng cách thích hợp tạo nên một mật ñộ phân bố, ñó chính là ñộ phân giải và ñược phân bố theo trục x và y trong không gian hai chiều
ðộ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là một lưới ñiểm theo chiều ngang màn hình: 320 ñiểm, chiều dọc 200 ñiểm ảnh (320*200) Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hình CGA 17” ñộ phân giải 320*200 Lý do: cùng một mật ñộ (ñộ phân giải) nhưng diện tích màn hình rộng hơn thì ñộ mịn (liên tục của các ñiểm) kém hơn
1.2.3 Mức xám của ảnh (grey Level)
Một ñiểm ảnh (pixel) có hai ñặc trưng cơ bản là vị trí (x, y) của ñiểm ảnh và ñộ xám của nó Dưới ñây chúng ta xem xét một số khái niệm và thuật ngữ thường dùng trong xử lý ảnh
trị số tại ñiểm ñó
mức phổ dụng Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit) ñể biểu diễn mức xám: Mức xám dùng 1 byte biểu diễn: 28=256 mức, tức là từ 0 ñến 255)