LỜI NÓI ĐẨUTrong nlỉữỉig nủm gần dây, xứ /v tín lìiêii ỈÌỎI chung và xử /v ảnlỉ nói riêng, dặc bỉêt lù ảnh so phứt triển hết sức mụtìh mẻ Cúc kỹ thuật xử /v ảnh cíươc áp dung va cap nlì
Trang 1TS HỒ VĂN SUNG
Trang 3TS H Ỗ Y Ả N S U N G
XỬ LÝ ẢNH SỐ
I V T H U V ê T V À TH Ự C H à N H V Ớ I M í m n í ỉ
e n
NHÀ XUẤT BẢN KHOA HỌC VÀ KỸ THUẬT
HÀ NÔI
Trang 5LỜI NÓI ĐẨU
Trong nlỉữỉig nủm gần dây, xứ /v tín lìiêii ỈÌỎI chung và xử /v ảnlỉ nói riêng, dặc bỉêt lù ảnh so phứt triển hết sức mụtìh mẻ Cúc kỹ thuật xử /v ảnh cíươc áp dung
va cap nlìâĩ không nhữỉu> ỉronạ các côn ỊỊ trình cơ bân như thị giác máy tính, mát nhìn nhân tao mả cà trong những cỏnq nghê mớỉ nhất như truyền hỉnh sô IP T V , trong V sinh hoc và ghỉ ảnh công hưởng từ 3D hay trong robots vả người máy.
X ử lý ảnh số được phát tnên nhằm muc (lích số hóa và mã hóa các bức ủỉìlỉ
d ế dơn gtcỉn hóa cúc quả trình truyền ílìôỉìiỊ, ỈN ấn vả lưu giữ Một muc ĩiêiỉ quan trong kìỉác của xứ lỷ ánh là cải thiện chất lương và khôi phục ảnh nhằm hiểu biết nhiêu hơn nội dung thông tin clĩứa írong mỗi bức ảnh; chưng lìỌìì như các bức ciìĩh
c h ụ p b ê m ặ t c á c l i à ỉ ì h t ỉ n h x a XÓI d o v ờ t i n h iịửỉ v ề h o ặ c c ú c cỉnì ì n ộ i SOI, ả n h c ộ n g
hưởng từ trong khảo sát V học Mót bùi toán quan trọng nữa trong xử lý ảnlĩ sổ là phản đoạn và mô tả ảnhy nhầm tạo nên các àỉìỉì ÌÌỈÌƯ mộí tín hiệu lốỉ vào cho một lỉê thống nhìn nhân tạo hay thỉ giác máy tính nhằm tách các thông tin và đo lường các cỉổỉ tương chứa tioììg mổỉ bức ánh ílìỉỉ clươc Tất cả cúc nhiệm vụ trên cìéỉi có chang một niỉic clích lả dúp ứng nhu cầu thông íỉỉì vù hiểu biết ngày một lớn của con người.
Đê cíạĩ cỉươc các ĨĨĨUC tiêu nói trên, \ử lý ảnh số sứ dung các máy tính s ố làm cóng cụ tính toán day nhất Hay HÓI khúc di, ỉhùnlỉ ĩ lũi của xứ ỉỷ ciiỉlỉ s ổ gắn cìỉủĩ VỚI cúc công cụ tính toán số, qua viêc lựa chon rừ áp dụng cúc gỏỉ phán mềm Gói phần mém hiệu quà nhất vản lủ phần mèm M A T L A B Cũỉìg ạiốiìg như cúc môn học khác, hâu lìếí cúc klìái niêm lý íììiỉxêt của xử lý ảnh s ổ dã được cáp nlỉàĩ trong gói phun mém ììùy M A T L A B CUỈỈÍ* cấp tììỏỉ lương lớn cúc /lủỉn, cúc
M 'fỉle s, giúp ta vân c h u i d ê \ử lý cúc hình ánh tì ong tlìế qiới ĩhỉCc Trong cuốn sách nay, cìmng t()ỉ cùnq da tạo clươc nlìirii M -Jiles trong moi trường làm viec
M A T L A B, tử nlìữỉì^ lììỉĩlì ảnh thu (lươc b ằ n m á x chitì s ố Nhữnạ ánh này lủ những ảnh mầu sử dụng tì ong cúc chương tì ình mô phỏng cho các khái niệm lý thuyết Ngoài ra , môt s ổ ảnh mưu rất (hển hình, dược mủc cỈỊtìlì trong hôp cóng
cụ của M A T L A B (I P T ) cũng cĩươc sử dunẹ, ạóp phấn làm phonq phú vù chê)} hình I ìoú cho các phương pháp phân tích lý thuyết; chẳng Ìĩạtì như các phép chiếu \ụ Radon ĩroỉìg khi thu ảnh cộng hưàtiỉị íừ (M R Ỉ).
Các ííỉì hiệu hình ánh đươc mô tả bởi mảng dữ liệu nhiều ch iều ; chímq vừa
có rinh chất xác đinh lan thống kê Biểu diễn ảnh í heo quan điểm tín hiệu xác dinh được tiê hiện trong chương 1 Chương 2 dành cho việc hiếu diễn tín hiệu hình ánh theo qian điểm th ố n g kê Chúng tôi dành trọn chương 3 đ ể mô tú những phép biến
đ ổ ỉ hai chiêu quan trong nhất Đó là những phép hiến đổi 2D như: D F T -2 D, biến đỏỉ D C T-2D, các phép biến đôi kh ô n g gian như bìêh đổỉ R a d o n, các phép chiếu
3
Trang 6tia ĩronẹ ẹ/ỉ/ và xử /v ảnh CÔỈIS> Ììỉíờỉìg íừ 3D Tìonạ chtrơỉìg 3 nà\\ những bỏ loc tuyến tính 2D cũng cĩươc (lể cáp cìcn Toàn bó chươỉìg 4 (ỉ ỉ rơi su (lung il(; mó tá
p h é p b ỉ ế t ì đ ổ i s ó n g c o n ( \ v a v e l c t s ) v à b ỏ s ó n g c o n ( M a v c l e í p a c k c í s ì m ò i v à ìicu
chiểu Bài vì những phép bìếìì dôi này dan ạ đươc sứ chiỉìg trong các cóng nghê hiên dại nhất Chương 5 mó ta cúc Ả Ỳ thỉiàĩ khỏi plỉỉỉc anh sau khỉ \ ứ ỉý Chương 6 trình bàv các kỹ thiiủĩ cải thiên va nàn g cao chát lương rua anh ĩlìỉi cìươc Chương 7 tiêu các kỹ thuật nén và mã hoá ảnh Chương 8 \ ử lý ánh hình thái
vù chương 9, chươMỊ caổì củng cua sách mỏ í à cúc pìĩiHỉng pháp phùn tích, phàn đoạn và tách các đường viền Pháỉỉ lớn ỉìôỉ dung cùa clỉiíơtií’ này dùỉìỉỊ dè
mỏ tà biến đổ ỉ W aíershed, hờỉ vì nó lù plvf'ơno nèỉi chu YỮK dè tách các dường
v i ề n v à đ o c á c d á c t r ư n g c ù n g n h ư n h à n d a n g c ú c c ìố \ t ư ơ n g c ỏ ỉ r o i ì Ị * m ô í b ứ c
ĩ ranh, bức àỉììì.
Toàn bộ nộỉ dang cùa Cỉiốìì súch dươc ĩô chức và tìỉtììì bày sao cho cỏ lính liên tục, logic và thống nhất M ồi chương (ỉươc bối dầu bàng những cơ sớ và nguyên tắc /ý thuyết, tiếp đến lù ứng dụng vù tlỉực íììi thực tế Các quan dỉểììi lý íhnyếí và
sự thực thi ĩhưc tế thể hiện trong các chương trình pluỉn mém hoặc cúc M-fỉles Chúng tôi c ố gắng nêu bật các quan dỉểm lý thuyết trước khỉ dưa ra những chương trình thực hiên và cúc ví clụ imnìi hoa ỳ úp ngưởi đọc nlỉán thức sâu sắc hơn tầm quan trọng vù ỷ nghĩa thực tiễn cũng như những phương pháp ĩhưc hỉèỉĩ mỗi \ấn dề được trình bầy trong sách
Xử lỷ ảnh là môt lĩnh vực róng lớn, nang dông vù hấp clchỉ \'ì thê khỉ biên soạn cuốn sách này, chúng ĨÔI muốn cung cấp cho ban cloc, nhất lù các ban sinlì viên hay các lìơc viên cao học của các trườềig Đ ại hoc Công nghê, cà Điện ỉử \'iễn thông lảu cô tig nghệ Thông íỉỉì hay các trường Đ ai hoc Khoa hoc T ư t ĩ h i é n, những kiến thức cơ bản ỉ)hất cả về cơ sờ lý thuyết lan những côiìịị cu thưc lìùỉilỉ (từ han d(h
cỏ thể tiếp thu vù tự mình mô phóng và phút tnến (ôfii> nghê Yớỉ mong tììỉtoỉì â\\ chúng íôỉ dã co gắn ạ chon lọc và trình hây những tìỏỉ (lung quan tìOỉĩịị vù tluéỉ íhưc, dông ĩhờĩ cập nhát clươc nlìữỉìíỊ thông tiỉì vù những còng ca mới nhất vê xử lý ánh hiên đưnq tổn tại hoâ( dang tlươc quan ỉúìti ỊỊịịììỊỚn cứu Tuy nhiên trong (Ịỉiủ trình soạn ĩiìào có thè cồn có những khiếm klỉuyớì Chúng tôi \ịfì chân thành (âỉìi
T * y
á c g i á
Trang 7CHƯƠNÍỈ 1
1.1 X Ử L Ý Á N H S Ố L À ( ỉ ì ?
M ô t bức á n h m ộ t m à u cỉươc dinh n ghĩa như m ộ t h à m của dộ súng 2 chiéu (2-
D ) f ( x , y ) ; t r o n s đ ó X v à y l à h a i b i ế n s ố k h ô n g g i a n G i á t r ị c ủ a h à m f t ạ i đ i ể m ( x , y )
tí lệ VỚI đ ổ s á n g c ù a ánh tại đ iể m d ó nên được gọi là cường độ cúa ảnh; nó c hính là
mức xúm c ù a á n h tại đ iể m (x,v) đó N ế u ta có m ô t bức ảnh nhiều m ầ u , thì hàm f là
A n h s ố ỉà a n h f ( x y ) d ư ơ c s ò h ó a c a v ê t o a d ô k h ô n g g i a n l ầ n v ê đ ộ s á n g N ó
thì goi là m á t ạ c ù a mức xám N h ư vâv, m ột ánh số dược biểu thi b ằ n g môl m à n g
dữ liêu VỚI môt số luợng hữu han các phần tử mỏi phần tử có một vi trí và giá tri
riêng bièt MỎI p h ầ n tử cùa m á n g này dược goi là m ộ t pixel, hay peỉ c h o môt phần
t ừ c ủ m ộ t b ứ c t r a n h
Xử lv ánh số sử dụng các máy tính số; chúng được phát triển để đáp ứng ba vấn dể chính vếu liên quan đến các bức tranh và ánh là:
• S ổ hóa và m ã hứa các bức án h dế đ ơ n gián h ó a các q u á trinh truvền thõng, in ấn và lưu giữ ánh
• CÙI thiên chất lương và khói plìiic ả n h đ ể h i ế u b i ế t n h i ề u h ơ n n ộ i d u n g
• Phàn tloạn và mô tá ánh, n h à m tạo nên các ảnh n h ư m ộ t tín hiệu lối
vào cho một hê thống nhìn nhân tao hoặc đê tách các tìiỏng tin chứa
trong m ó t ánh thu đươc
1.2 B I Ể U D I Ễ N M Ô T Á N I I s ố
1.2.1 Ả n h sỏ là gi?
t r o n g d ó X v à y l à h a i b i ế n s ố k h ô n g g i a n G i á t r i c ủ a h à m f ứ n g VỚI g i á t r i c ù a c ậ p toa dô (x,y) đươc gọi là cường (lộ cúa ánh tiu điểm đó Nó chính là độ sáng cùa ảnh
tại đ iế m đó T huât n g ữ mức xúm d ù n g dế chi cường độ ciia các ảnh đơn mầu Các
á n h m ầ u là tố h ợ p c ú a các ả n h 2 -D th à n h phần C h ẳ n g hạn, trong hệ thống m ầu
RGB, mộl ảnh máu chứa ba ảnh thành phần là dỏ (R), xanh lá cây (G) và xanh nước biên (B) Vì thế, nhiều kỹ thuât xử lý ánh dơn mầu có thể mở rộng cho các ảnh đa mầu bằng cách xử lý ba ánh thành phần này môt cách riêng biệt
Môt ánh có thê là hên tuc cả vổ các biến số không gian X và y cũng như về
bicn đô f Việc c h u y ê n đổi m ô t ảnh liên tục thành m ột ản h số cần phải thực hiện
quá trình số hóa cả biến số không gian lẫn biên đô Số hóa các giá trị tọa độ được gọi là sự lấy mẫu; còn số hóa các giá trị biên đô đươc gọi là lượng tứ lióa. Khi đó,
X, y và các giá tri biên độ cúa f là những đại lượng rời rạc và hữu hạn. Những ảnh
n h ư \ ậ y đư ợ c gọi là ành số.
5
Trang 8T r o n g m ô t a n h , m ỗ i p i x o l t ư ơ i m i h i í ’ V Ớ I m ổ t p h ầ c ủ a m ỏ i v â t t h ế v à t l ý trong th ế giới thực 3D Vât thổ vât lý này dirơc m inh họa bời các án h sáng ph án xa
và h ấp thụ trên víu thể đó Ả n h s á n e phản xa di đốn biến tử ( c am era c h ẳ n g han) và tạo ra ảnh f(x,y) C ư ờ n g độ á n h sáng phàn xa thu dươc tai mỏi VI trí của vât the dặc
t r ư n g cho giá tri của mỗi p h ầ n t ử á n h t ạ i VI trí đ ó M ỗ i phán t ử ánh g ọ i l à m ô t pixcl
ả n h G i á t r i c ủ a m ỗ i p i x e l đ ặ c t r ư n s c h o c ư ờ n g đ ỏ s á i m t a i VI t r í đ ổ , n ê n n ó c ũ n g
thành từ n h ữ n g s ố thực M a trận VỚI các phần tử số ihue dó còn đirơc 201 là nuíỉtịi
dữ liệu ảnh MỎI p h ầ n tử c ủ a m a trận đó được gọi là m ót pixel Già sứ m a tràn có M hàng và N cột, ta nói rà n g ảnh có kích thước M x N Các giá t r i của các tọa độ ( X A )
m ột ảnh số dược biểu thị dưới d a n ° m a trân sau:
/ ( ( ) , ( ) ) f ( ( ) j ) f ( ( ) N - I )
1.2.2 Biêu diễn ảnh dưới dạng ma tran
f ( x y ) =
f ( ỉ , 0 ) j ( U )
( 1 1 )
T r o n g m ộ t số tài liệu, c h ả n g han như trong M A T L A B , mót ánh số c ò n dược biểu thị dưới d ạ n g
f ( 2 , l ) f ( 2 ,2 ) f ( 2 , N )
f ( M l ) U M 2 ) Ỉ ( M N )
R õ ràng, c ả hai cách biểu diẻn là như nhau; c ô n g thức (1.2) là c ò n g thức (1.1) dịch g ố c toa đô s a n g phải 1 đơn v ị ; có nghĩa là f( 1 ,1) = 1(0.0) Đ ê th u à n ticn,
ta sẽ sử d ụ n g biếu d iễ n (1.2) đê’ m ô tả ánh số Với cách hiểu diển này thì f(i.j) VỚI 1
< i < N v à l < j < M k ý hiệu m ộ t pixel n ằ m ờ h à n g i và c ộ t j Giá tri cùa f(i,j) nằm trong v ù n g 0 < f(i,j) < G C h ả n g hạn phần tử f(5,3) là giá tr i của pixcl n ă m ở h à n a thứ 5 và cột th ứ 3 c ủ a m a trận f T h ô n g thường, người ta biếu diễn ánh dưới d ạ n g
m a trận v u ô n g N x N M a trận l x N thì đươc goi là m ộ t véctơ liùiìỊỊ, trong khi m a tràn
M x l thì được goi là m ộ t véctơcột. M a trận 2 x 2 là m ột vớ hướng.
Đối với m ộ t ảnh s ố thì giá trị lớn nhất c ủ a m ỗ i pixel là G thường được biểu thị dưới d ạ n g Cr = 2 m Với c á c h biểu diễn này thì s ố bít b cần đổ m ã hóa hav lưu giữ
m ô t ảnh số c ó kích thước M x N là:
Trang 9b = MxNxm (1-3)
2 6 2 1 4 4 b v t e s 8 b í t V ì v à v d e g i á m b ớ t l ư ơ n g b í t c ầ n l ư u g i ữ t r o n g b ò n h ớ , c ầ n p h a i
giám m và N m à k h ò n g làm giâm chất lương cùa anh Việc giàm m và N liên quan đến
m ô t d a i l ư o n g r ấ t q u n t r ọ n g t r o n g x ử l ý á n h , d ó l a d ỏ p h â n g ĩ á i c ủ a ả n h
Đó phan ỊỊiái của m ô t ánh biểu thi có bao nhiêu chi tiết c h ứ a trong ảnh m à ta còn có the p hân biệt đươc R õ ràng là, đ ộ phân giải của m ộ t ảnh phụ thuộc cả kích thước N c ủ a ả nh ỉẫn đ ộ lớn m c ủ a các pixeL Nếu giữ m k h ô n g đổi và tảng N thì trên ảnh sẽ xuất hiện hiệu ứng bùn cửt c ò n nếu giữ N k h ô n g đổi và tă n g m thì các đườĩìg viển c ủ a ản h sẽ bị sai lệch nhiều Thực tế c h o thấy m ột bức tranh c à n g nhiều chi tiết thì nó đươc cải thiên càng ít khỉ giữ N không dổi và tăng m D o đó đối với những bức hoa c ó nhiêu chi tiết, c h ã n g hạn như bức họa các đ á m m â y , thi s ố lượng các mức xám k h ố n g đ ó n g vai trò q u a n trong
T ro n g M A T L A B , các m a trận được lưu giữ dưới dạng các biến với các tên
n h ư A, a, R G B , real_aray,
1.2.3 C á c q u i đ ị n h về t ọ a độ
C á c VI t r í t r o n g m ộ t á n h c ó t h ế b i ể u t h i t r o n g n h i ề u h ệ t ọ a đ ồ k h á c n h a u , t u ỳ
thuốc vào n g ữ cánh Ở đây, ta chi xét hai hệ tọa độ chính Đ ó là hệ toa dô pixel và
hê ỉ oa dô khôn ạ gian.
T o a đ ô pixel
P h ư ơ n g p h ấ p th u ận tiên nhất đế biểu thi các VỊ trí cùa m ộ t á nh là sứ d ụ n g các toa đ ố pixel Tror.g hộ toa đô này, ả n h dược xứ lý như m ộ t lưới các phẩn tứ rời rac,
s ắ p x ế p t ừ t r ê n x ố n g d ư ớ i v t ừ t r á i s a n g p h ả i n h ư t r ô n h ì n h 1 1 s a u đ â y
h-w
-r
Ỷ
H ỉn h L I lỉệ ĩoa (lộ pi.xel.
Đ ố i VỚI các toa độ pixel thì thành phần r (hàng) tãng từ trên xuống dưới,
tro n g khi th à n h p h ầ n c (cột) thì tăng từ trái sang phải Các tọa đ ộ pixel là nhữ n g giá trị n g u y ê n bắt đ ầ u từ 1 đ ế n hết chiều dài của hàng và cột
7
Trang 10Giữa tọa đ ỏ pixcl và tọa d ô d ù n g d ể m ỏ tả m ộ t m a tran là hoàn toàn tương đương Sự tương d ư ơ n g n à y giúp ta hiểu rõ hơn q u an hê giữa m a tràn (lữ liêu anh và cách dể hiển thi á n h dó C h ả n g hạn, d ữ liêu đôi với pixei ỏ' h à n g thứ 5 và cót 3 dirơc iưu eiữ trong p h ầ n từ m a trận (5,3)
C á c t ọ a d ô k h ô n g g i a n
N h ư đ à nói, trong h ệ tọa đ ộ pixcl, m ộ t pixel đươc xứ lý n h ư inôt đơn \1 rời rạc được xác đ ịn h m ộ t c á c h d u y nhất n h ờ m ộ t c ã p toa dô r iê n g rẽ, c h ả n g han n h ư (5,3) Với c á c h biểu d iễ n này thì m ộ t vị trí n h ư (5.5,3-2) là k h ô n g có ý n g h ĩa nữa
T u y nhièn, tro n g hệ tọa đ ộ k h ô n g gian, các vị trí trong m ộ t ả n h là n h ữ n g V I trí trong
m ộ t măt phầng, đươc m ô tả b ằ n g m ộ t cặp tọa độ(x,y), k h ô n g phải là (r, c) như trong
hê tọa đô pixel Vớ) hệ tọa đ ộ k h ô n g gian này, thì vị trí (5.5, 3.2) lại có ý n ghĩa
Hình 1.2 m i n h h o a m ộ t hệ tọa độ k h ô n s s i a n được sử d ụ n g đ ể m ô tá các ảnh Lưu Ý rằng y tâng từ trên x u ố n g dưới n h ư trên hình 1.2
0 5
0.5
1
2
4
4 5
y
H ì n h 1.2 Hệ tọa đ ô k h ô n g gian
T ừ hai hình vẽ trên ta thấy, trong hệ tọa d ộ k h ô n g gian, tâ m d i ể m c ù a pixel
n à o d ó đ ồ n g n h ấ t VỚI c á c t ọ a đ ộ p i x e l c ủ a p i x e l đ ó T u y n h i ê n , h a i h ệ t o a đ ộ c ò n c ỏ
sự khác nhau là VI trí c ủ a ánh ở g óc trái trên cùng là ( 1, 1) trong khi ờ tọa độ không
gian, nó lại là (0.1Í, 0.5) Sư kh á c nhau này là do hẹ tọa độ pixel là lừi rạc, tio n g khi
hê tọa đô k h ô n g gian là liên tục Sự khác n h a u nữa là thứ tư c ủ a c á c t h à n h phần nam
n g an g và th ẳ n g đ ứ n g trong các hê tọa đ ộ này: trong hệ tọa đô pixcl là (r,c), trong khi hệ tọa đ ộ k h ô n g gian là (x.y)
N h ư vậy nếu lọa đ ộ k h ô n g gian (x,y) chỉ n h ận n h ữ n g giá tri n g u y ê n , băt đâu
M , đ ồ n g t h ờ i c h o n X = c ; y = r , t h ì t ọ a đ ộ k h ô n g g i a n s ẽ đ ồ n g n h ấ t VỚI h ê t o a d ộ
tọa đ ộ pixel cúa á n h đó C h ắ n g hạn tâm đ iếm c ù a pixc! ở h à n g 5 và cột 3 có toa dô
k h ô n g gian là x=3; y=5
1.2 4 B iể u d i ễ n ả n h d ư ó i d ạ n g v é c tơ
T ro n g xử lý ảnh, để thuận tiện cho việc tính toán, các m ả n g d ữ liệu ả n h N x N thường được viết dưới d ạ n g véctơ Với cá c h biểu diễn n à y thì m ả n g dữ liệu ảnh f(n, ,n2), với 1 < ri) < N và 1 < n 2 < N được c h u y ể n thành véctơ N 2X1 f có d a n g n h ư sau: