Biến ngôn ngữ Một biến ngôn ngữ được đặc trưng bởi tập 5 yếu tố x,Tx,X,G,M trong đó x là tên của biến; Tx là tập hợp các thuật ngữ của x, nó là các giá trị ngôn ngữ haythuật ngữ ngôn ngữ
Trang 1TRƯỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THÔNG
TRẦN THỊ HIẾU
LOGIC MỜ ỨNG DỤNG TRONG BÀI TOÁN NHẬN DẠNG CHỮ VIẾT TAY
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Thái Nguyên, năm 2013
Trang 2ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THÔNG
TRẦN THỊ HIẾU
LOGIC MỜ ỨNG DỤNG TRONG BÀI TOÁN NHẬN DẠNG CHỮ VIẾT TAY
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học: TS Vũ Vinh Quang
Thái Nguyên, năm 2013
Trang 3Trước hết, tôi xin chân thành gửi lời cảm ơn sâu sắc đến thầy giáo TS Vũ Vinh Quang, người đã tận tình hướng dẫn và tạo mọi điều kiện cho tôi trong quá trình làm luận
Trong khoảng thời gian ngắn, với kiến thức của bản thân còn hạn chế nênluận văn không tránh khỏi những thiếu sót về mặt khoa học, tôi rất mong nhận đượcnhững đóng góp ý kiến của các Thầy, cô giáo cùng bạn bè để luận văn được hoànchỉnh hơn
Xin trân trọng cảm ơn!
Thái Nguyên, tháng 7 năm 2013
Học viên
Trần Thị Hiếu
Trang 4Chương 1 LOGIC MỜ VÀ BÀI TOÁN NHẬN DẠNG CHỮ VIẾT TAY 2
1.1 Các khái niệm cơ bản 2
1.2 Các phép toán trên tập mờ 4
1.2.1 Phép giao 4
1.2.2 Phép hợp 5
1.2.3 Phép phủ định 7
1.3 Suy luận mờ 8
1.3.1 Nguyên lý suy rộng và quan hệ mờ 8
1.3.2 Luật mờ 10
1.4 Điều khiển mờ (Fuzzy Control) 16
1.5 Nhận dạng mờ (Fuzzy Pattern Recornition) 19
1.5.1 Bài toán nhận dạng 19
1.5.2 Phân nhóm và vai trò trong thực tế 20
Chương 2 LÝ THUYẾT NHẬN DẠNG ẢNH 21
2.1 Các khái niệm cơ bản 21
2.1.1 Khái niệm ảnh số 21
2.1.2 Phân loại ảnh số 21
2.1.3 Khái niệm mức xám đồ 22
2.2 Lý thuyết nhận dạng ảnh 22
2.2.1 Lý thuyết xử lý ảnh 2D 22
2.2.2 Nâng cao chất lượng ảnh 27
2.2.3 Phân loại ảnh và tìm biên ảnh 36
2.2.4 Quy trình nhận dạng ảnh 37
Chương 3 BÀI TOÁN NHẬN DẠNG CHỮ VIẾT TAY 43
3.1 Mô hình bài toán 43
3.2 Các bước tiến hành bài toán nhận dạng chữ viết 44
Trang 53.2.2 Tách mẫu và chuẩn hoá 46
3.2.3 Xây dựng thư viện mẫu cho các ký tự 46
3.2.4 Hệ suy luận học cho bài toán nhận dạng chữ viết tay 46
KẾT LUẬN 53
TÀI LIỆU THAM KHẢO 54
Trang 6Hình 1.1: Một số hàm liên thuộc cơ bản 3
Hình 1.2 : Đồ thị minh hoạ nguyên lý suy rộng mờ 9
Hình 1.3: Hàm liên thuộc của biến ngôn ngữ T(tuổi) 11
Hình 1.4: Mô hình suy luận mờ với một luật-một tiên đề 14
Hình 1.5: Mô hình suy luận mờ một luật-nhiều tiền đề 14
Hình 1.6 : Mô hình suy luận mờ hai luật hai tiên đề 15
Hình 1.7: Cấu trúc cơ bản của bộ điều khiển mờ 16
Hình 1.8: Cấu trúc cơ bản của hệ chuyên gia 17
Hình 1.9: Quá trình nhận dạng 19
Hình 2.1 : Toán tử tuyến tính 24
Hình 2.2: Mặt nạ bộ lọc tuyến tính 3 3 25
Hình 2.3 : Toán tử điểm ảnh 26
Hình 2.4: Mô hình nhiễu 27
Hình 2.5: Lọc ngược khôi phục ảnh nguyên gốc 29
Hình 1.6: Một số các mặt nạ không gian trung bình 33
Hình 2.7: Mặt nạ lọc thông thấp 33
Hình 2.8: Cửa sổ lọc giả trung vị 34
Hình 2.9: Phương pháp lưới 39
Hình 2.10: Phương pháp cung 40
Hình 2.11: Biểu diễn mẫu bằng tập kí hiệu 42
Hình 3.1 : Các công đoạn của bài toán nhận dạng ảnh 44
Hình 3.2 : Ba mẫu chữ cần đọc 47
Hình 3.3 : Ký tự cần nhận dạng 47
Hình 3.4: Giao diện chương trình nhận dạng 48
Hình 3.5: Vẽ chữ cần nhận dạng 49
Hình 3.6: Kết quả nhận dạng sau khi vẽ chữ 49
Hình 3.7: Mở file ảnh ký tự cần nhận dạng 50
Hình 3.8: Giao diện sau khi mở file ảnh ký tự 51
Hình 3.9: Kết quả sau khi nhận dạng ảnh ký tự 51
Hình 3.10: Ghi ký tự ra file ảnh 52
Trang 8LỜI MỞ ĐẦU
Công nghệ tri thức là chuyên ngành tích hợp tri thức con người với các hệthống máy tính Các đặc tính tiêu biểu của các hệ thống dựa trên tri thức thể hiện ởviệc xử lí chuyển trạng thái chứ không dựa vào thể hiện cứng nhắc của trạng thái.Các quyết định về các xử lí dữ liệu cũng là một phần tri thức của hệ thống Lúc đóngười ta đề cập nhiều đến tri thức thủ tục
Để giải vấn đề người ta tăng cường các thủ tục suy diễn với cơ chế kết hợpcác luật với các lập luận logic Lập luận logic dùng để rút ra kết luận từ các sự kiệnxem là đúng đắn
Ở các giai đoạn trước, việc truyền đạt cho máy luôn cần thiết phải đảm bảotính chính xác và duy nhất, điều này làm cho các thao tác của máy trở nên khôcứng và tạo ra một khoảng cách rất xa giữa người và máy về “độ thông minh” trongviệc giải quyết các bài toán kỹ thuật cũng như trong cuộc sống hàng ngày
Hai lĩnh vực quan trọng phải kể đến là lý thuyết về mạng nơron và logic mờ,chúng là chìa khoá để tạo ra các hệ thống kỹ thuật vừa đảm bảo tính xác và nhanhchóng trong vận hành, vừa có khả năng học từ các mẫu dữ liệu thống kê, lại có khảnăng thông minh và mềm hoá trong quá trình ra quyết định
Đối với các cán bộ kỹ thuật trong ngành Điện tử viễn thông, lý thuyết về xử
lý tín hiệu trong đó có tín hiệu hình ảnh là những kiến thức không thể thiếu Nhậndạng ảnh, đặc biệt là nhận dạng ký tự cũng là một mảng đề tài đáng quan tâm Việcnhận dạng ký tự nhất là với chữ viết tay sẽ tiết kiệm rất nhiều thời gian cho viêcnhập và lưu trữ dữ liệu
Ý thức được vấn đề trên, tôi xin hoàn thành luận văn tốt nghiệp với đề tài
“Logic mờ ứng dụng trong bài toán nhận dạng chữ viết tay” Nội dung đề tài
Trang 9Chương 1 LOGIC MỜ VÀ BÀI TOÁN NHẬN DẠNG CHỮ VIẾT TAY
Trong chương 1, luận văn đề cập đến các vấn đề sau: Một số khái niệm về logic mờnhư: Các phép toán trên tập mờ, Suy Luận Mờ, Điều khiển mờ (Fuzz Control), Nhậndạng mờ (Fuzzy Pattern Recornition), mô hình của bài toán nhận dang Trong chươngnày, luận văn đã tham khao một số tài liệu sau: [3], [4] , [6] và [7]
1.1 Các khái niệm cơ bản
Cơ sở của logic mờ là việc ánh xạ từ các biến x đầu vào thuộc tập A thànhcác biến y đầu ra thuộc tập B
Nói cách khác, giá trị x=a không được xác định rõ là có thuộc hay khôngthuộc tập B, và khái niệm mờ được đưa ra để làm nền tảng cho logic mờ và điềukhiển mờ sau này
Cơ chế cơ bản của logic mờ sau này có dạng là tập hợp các trạng thái nếu…thì hay còn gọi là những quy luật
Tập mờ được coi là phần mở rộng của tập kinh điển Nếu X là một khônggian nền (một tập nền) và những phần tử của nó được biểu thị bằng x, thì một tập
mờ A trong X được xác định bởi một cặp các giá trị:
là, hàm liên thuộc ánh xạ mỗi một phần tử của X tới một giả trị liên thuộc trongkhoảng [0,1]
Như vậy, kiến trúc của một tập mờ phụ thuộc vào hai yếu tố: không gian nền
và hàm liên thuộc phù hợp Sự đặc biệt của hàm thuộc là nó mang tính chủ quan với
Trang 10ý nghĩa là với cùng định nghĩa một khái niệm nhưng với mỗi người khác nhau thìhàm thuộc có thể xây được xây dựng khác nhau.
Các hàm liên thuộc được xây dựng từ những hàm cơ bản như: Kết nối hành
vi, hàm bậc nhất, hình thang, hình tam giác, hàm phân bố Gaussian, đường congxichma, đường cong đa thức bậc hai và bậc ba Hình 1.1 dưới đây mô tả một vàidạng hàm thuộc cơ bản:
0 20 40 60 80 100 0
0.2 0.4 0.6 0.8 1
0.2 0.4 0.6 0.8 1
0.2 0.4 0.6 0.8 1
0.2 0.4 0.6 0.8 1
Hình 1.1: Một số hàm liên thuộc cơ bản
Có rất nhiều sự lựa chọn rộng rãi để chúng ta có thể lựa chọn hàm liên thuộc
ưa thích Ngoài 11 hàm liên thuộc ra, bộ công cụ logic mờ trong MATLAB cũngcho phép chúng ta tạo hàm liên thuộc của chình mình nếu chúng ta nhận thấy cáchàm liên thuộc được định nghĩa sẵn là chưa đủ Nhưng với những hàm liên thuộcngoại lai này, không có nghĩa là chắc chắn sẽ đưa ra được một hệ thống đầu ra mờhoàn hảo
Để biểu diễn một tập mờ, tùy thuộc vào không gian nền và hàm liên thuộc làrời rạc hay liên tục mà ta có các cách biểu diễn như sau:
Trang 11i ( ) /
( ) /
A i i
x X A X
Kết hợp: v(P1 AND (P2 AND P3)) = v((P1 AND P2) AND P3)
Điểm giao nhau của hai tập mờ A và B được xỏc định tổng quỏt bởi mộtỏnh xạ nhị phõn T, tập hợp của hai hàm liờn thuộc sẽ là như sau:
Toỏn hạng chuẩn T là một ỏnh xạ bậc hai T(•) thỏa món:
Đường biờn: T(0,0) = 0; T(a,1) = T(a,1) = a (1.4)
Đơn điệu: T(a,b) T(c,d) nếu a c và d d (1.5)
Giao hoỏn: T(a,b) = T(b,a) (1.6)
Kết hợp: T(a, T(b,c)) = T(T(a,b),c) (1.7)
Nếu X là tập hợp các đối t ợng rời rạc
Trang 12Yêu cầu đầu tiên tác động một cách khái quát tới những tập xoắn Yêu cầuthứ hai làm giảm những giá trị liên thuộc trong A hoặc B, không thể đưa ra kết quảlàm tăng giá trị liên thuộc ở điểm giao A, B Yêu cầu thứ ba chỉ ra rằng thứ tự củatoán hạng bên trong tập mờ là không khác nhau Cuối cùng, yêu cầu thứ tư cho phépchúng ta đưa ra điểm giao nhau của bất kỳ phần tử nào của tập ở bên trong thứ tựcủa từng cặp.
Trên cơ sở đó, người ta thường sử dụng một số phép toán giao thỏa mãnchuẩn T-norm như sau:
Min (Zadeh 1965): T(x,y) = min(x,y) (1.8)
Chuẩn Lukasiewicz: T(x,y) = max{x + y – 1,0} (1.10)
Min nilpotent: T , min , 1
a Một hàm T-chuẩn T gọi là liên tục nếu T là hàm liên tục trên [0,1]2
b Hàm T gọi là Archimed nếu T(x,x) < x với mọi 0<x<1
c Hàm T gọi là chặt nếu T tăng chặt trên (0,1)2
Định lý 1 (Ling 1965) Một T-chuẩn T liên tục và Archimed khi và chỉ khi cómột hàm f :0 , 1 0 , , liên tục, giảm chặt với f(1)=0 sao cho:
Định lý 2 (Schweizer and Sklar 1983) T là một T-chuẩn liên tục và chặt khi
và chỉ khi tồn tại một tự đồng cấu φ của đoạn [0,1] sao cho
T(x,y)= φ-1(φ(x).φ(y)) với mọi x,y [0,1]
Trang 13 Đường biên: S(1,1) = 1; S(a,0) = s(0,a) = a (1.14)
Đơn điệu: S(a,b) S(c,d) nếu a c và b d (1.15)
Chuẩn Lukasiewicz: T(x,y) = min{x + y ,1} (1.20)
Min nilpotent: S , max , 1 (1.21)
Trang 14*Định nghĩa 2 : Cho S là T- đối chuẩn, khi ấy:
- S gọi là liên tục nếu đó là hàm liên tục trên miền xác định
- S là Archimed nếu S(x,y) > x với mỗi 0 < x < 1
- S gọi là chặt nếu S là hàm tăng tại mỗi điểm (x,y) (0,1)2
*Định lý 2: S là T - đối chuẩn liên tục và Archimed khi và chỉ khi có mộthàm liên tục, tăng chặt g: [0,1] [0,] với g(0)=0, sao cho:
1
,
Ở đây g(-1) tựa hàm ngược g-1 của hàm g cho bởi biểu thức :
g(-1)(x)=g-1(x) với x < g(1), còn g(-1)(x)=1, trong các trường hợp khác
*Định lý 3: Mỗi T- đối chuẩn S liên tục là chặt khi và chỉ khi có một tự đồngcấu φ: [0,1] [0,1] sao cho:
Điều kiện biên: N(0) = 1 và N(1) = 0
Đơn điệu: N(A) N(B) nếu A B
Trang 15 Sugeno:
sx
x x
N S
1
1 )
Yager: N w (x) = (1-x w ) 1/w (1.25)
Định lý biểu diễn: Tìm các biểu diễn khác nhau của một toán tử có thể là “thóiquen toán học” Song chúng sẽ trở nên rất có ích khi chúng ta cần tìm những lớp mớitrong vùng đang làm việc nhưng có thêm những tính chất mong muốn nào đó
*Định nghĩa 3: Hàm φ: [a,b] gọi là một tự động cấu (automorphism) củađoạn [a,b] nếu nó là hàm liên tục, tăng chặt và φ(a)=a, φ(b)=b
*Định lý 4: (Ovchinnikov,Rouben,1991), Hàm N: [0,1] [0,1] là hàm phủđịnh mạnh khi có một tự đồng cấu φ của đoạn [0,1] sao cho:
1
1
*Định lý 5: (Fodor 1993) Hàm n: [0,1] [0,1] là hàm phủ định chặt khi vàchỉ khi có hai phép tự đồng cấu ψ,φ sao cho n(x)=ψ(1-φ(x))
f thành một ánh xạ giữa các tập mờ Đặc biệt hơn, giả sử f là một hàm số từ khônggian X vào không gian Y và A là một tập mờ trên X được định nghĩa bởi:
A= µ A (x 1 )/ x 1 + µ A (x 2 )/ x 2 + … + µ A (x n )/ x n
Nguyên lý này suy rộng phát biểu rằng ảnh của tập mờ A dưới ánh xạ f là tập
mờ B thỏa mãn như sau:
B = f(a) = µ A (x 1 )/ y 1 + µ A (x 2 )/ y 2 + … + µ A (x n )/ y n (1.26) Với y i = f(x i ), i= 1…n
Nói cách khác, tập mờ B có thể được xác định thông qua các giá trị của hàm
f tại x 1 , x 2 ,…, x n Nếu f là ánh xạ nhiều - một thì tồn tại x 1 , x 2X, x 1 x 2 mà f(x 1 ) =
Trang 16f(x 2 )= y* , y* Y Trong trường hợp này mức độ phụ thuộc của B tại y = y* là mức
độ phụ thuộc lớn nhất của A tại x=x1 và x=x2 do vậy ta có:
)) ( ( max )
(
) (
y f x
Tổng quát hơn giả sử hàm f là một ánh xạ tử không gian n chiều X1x X
2 x … X nx và A 1 , A 2 ,… A 1 là n tập mờ trong X 1 ,X 2 ,…X n thì nguyên lý suy rộng phát biểu rằng tập mờ B qua ánh xạ f là:
o y o y
x i A i x
x x x x x B
i n
n
) ( f neu
0 ) ( f neu ) ( min max 1 -1 -) , ,
, )( , ,
, ( 1 2 1 2
(1.28)
Trang 17-2 0 2 -3
-2 -1 0 1 2 3
X
y = f(x)
-2 0 2 0
0.2 0.4 0.6 0.8 1
Do phu thuoc
B
Hình 1.2 : Đồ thị minh hoạ nguyên lý suy rộng mờ
Hình 1.2 minh họa nguyên lý suy rộng mờ Đồ thị dưới cùng biểu diễn tập
mờ A, đồ thị phía trên bên trái biểu thị hàm y = f(x) và đồ thị bên phải là tập mờ Btạo thành qua nguyên lý suy rộng
1.3.1.2 Quan hệ mờ
Quan hệ hai ngôi mờ là một tập mờ trong không gian X Y ánh xạ mỗi phần
tử thuộc không gian này vào một mức độ phụ thuộc giữa 0 và 1 nó có ứng dụng rấtlớn trong điều khiển mờ và ra quyết định
Cho X và Y là hai không gian nền thì:
R={((x,y),µ B (x,y))| (x,y) X Y } (1.29)
là một quan hệ hai ngôi mờ trong không gian X Y
Quan hệ hai ngôi mờ thường được mô tả dưới các dạng sau:
x gần với y (x,y là các số)
x phụ thuộc vào y (x,y là các sự kiện)
x và y giống nhau(x,y là người vật…)
Nếu x lớn thì y nhỏ
Trang 18Cách diễn giải cuối “nếu x là A thì y là B” được lặp lại thường xuyên trong
hệ suy luận mờ Quan hệ mờ trong các không gian khác nhau có thể được kết hợpthông qua phép hợp thành Có rất nhiều phép hợp thành khác nhau được sử dụngtrong quan hệ mờ, nổi tiếng nhất là luật hợp thành max-min được phát minh bởiZadeh
Gọi R1 và R2 là hai quan hệ mờ trong không gian X Y và X Y , luật hợpthành Max-min của R1 và R2 là một tập mờ được xác định bởi:
R 1 º R 2 ={(x,z), max min[µ R1 (x,y), µ R2 (y,z)]| x X, y Y, z Z} (1.30)
Hoặc tương đương
µ R1º R2 (x,z) = max min [µ R1 (x,y), µ R2 (y,z)] = y R1(x,y) R2(y,z) (1.31)
Với cách hiểu rằng và đại diện cho phép toán Max và Min Khi R1 và
R2 được biểu diễn dưới dạng ma trận, phép tính toán R1º R2 gần giống như phépnhân ma trận ngoại trừ phép x và + được thay thế bằng phép và đó chính là lý
do để ta gọi là luật hợp thành Max-Min
Dưới đây là một số tính chất chung của quan hệ mờ hai ngôi và phép hợp thànhMax-Min, với R,S,T là các quan hệ hai ngôi trên không gian X Y , Y Z , Z W :
Kết hợp: R º (S º T) = (R º S) º T
Phân phối với phép hợp: R º(S T) = (R ºS) (R ºT)
Phân phối với phép giao: R º(S T) = (R ºS) (R ºT)
Đơn điệu: S T => R º S R º T
Mặc dù luật hợp thành Max-Min được sử dụng rất rộng rãi nhưng nó không
dễ dàng và chủ động trong các quá trình kiểm tra toán học, vì vậy luật hợp thànhMax-Prod được đưa ra như là một cải tiến của luật hợp thành Max-Min:
R1oR2( x , z ) maxyminR1( x , y ) R2( y , z ) (1.32)
Trang 191.3.2 Luật mờ
1.3.2.1 Biến ngôn ngữ
Một biến ngôn ngữ được đặc trưng bởi tập 5 yếu tố (x,T(x),X,G,M) trong đó
x là tên của biến; T(x) là tập hợp các thuật ngữ của x, nó là các giá trị ngôn ngữ haythuật ngữ ngôn ngữ; X là không gian nền; G là luật cú pháp tạo ra các thuật ngữtrong T(x); và M là luật ngữ nghĩa liên kết mỗi giá trị ngôn ngữ A với nghĩa M(A)của nó, M(A) xác định một tập mờ trên X
Ta xét một ví dụ: Nếu tuổi là một biến ngôn ngữ thì tập hợp các thuật ngữT(tuổi) có thể là:
T(tuổi)={trẻ, không trẻ, rất trẻ, không quá trẻ trung niên, không phải trungniên… già, không già, già hơn, không quá già, không quá già và không quá trẻ…}
Hình 1.3: Hàm liên thuộc của biến ngôn ngữ T(tuổi)
Mỗi thuật ngữ trong T(tuổi) được đặc trưng bởi một tập mờ trong không giannền X=[0,100] Thông thường chúng ta dùng “tuổi trẻ” để gán giá trị “trẻ” cho biếntuổi Ngược lại khi tuổi được xem như là giá trị số chúng ta sử dụng phương trình
“tuổi=20” Luật cú pháp nói lên cách mà giá trị ngôn ngữ trong tập thuật ngữT(tuổi) được gán Luật ngữ nghĩa xác định hàm thuộc của mỗi giá trị ngôn ngữtrong tập thuật ngữ Từ ví dụ trên ta thấy, tập các thuật ngữ bao gồm một vài thuậtngữ chính (trẻ, trung niên, già) được biến đổi bới các phép phủ định (không), cáctrạng từ (rất, hơn, khá ) và các liên từ ( và, hoặc)
Trang 201.3.2.2 Cấu trúc luật
Một luật nếu-thì mờ (còn gọi là luật mờ, phép kéo theo mờ, hoặc câu điềukiện mờ) thường có dạng:
IF <X là A> THEN <Y là B>
Trong đó A,B là các giá trị ngôn ngữ được xác định bởi các tập mờ trongkhông gian nền X và Y Thông thường “x là A” được gọi là tiên đề hay giả thuyết,còn “y là B” được gọi là kết quả hay kết luận Các ví dụ của luật nếu-thì mờ rộngkhắp trong các diễn giải ngôn ngữ hàng ngày như:
Nếu áp suất cao thì thể tích nhỏ
Nếu đường trơn thì việc lái xe rất nguy hiểm
Nếu quả cà chua màu đỏ thì nó chín
Luật nếu-thì mờ thường được viết tắt dưới dạng A =>B miêu tả quan hệ giữahai biến x và y, điều này cho thấy rằng luật nếu-thì mờ xác định một quan hệ haingôi R trên không gian tích XxY
Nói chung có hai cách diễn dịch luật mờ A =>B Nếu ta diễn dịch
R = A B = A B (1.34)
R = A B = A (AB) (1.35)
R = A B = ( A B) B (1.36)
r (x,y) = sup{c| A (x)*c B (y) and 0 c 1) } (1.37)
Mặc dù 4 công thức trên có hình thức khác nhau nhưng chúng đều trở về
dạng các định quen thuộc R = A B = A B khi A và B là hai giá trị logic.
Trang 21Dựa trên hai cách diễn dịch và các phép toán T-chuẩn và S chuẩn, một số phươngpháp hiệu quả được thành lập để tính toán quan hệ mờ R = A B Tất cả cácphương pháp này đề sử dụng phép kéo theo.
Phép kéo theo (Implication) là một hàm số I:[0,1]2 [0,1] thỏa mãn các điềukiện sau:
Nếu x z thì I(x,y) I(z,y) với mọi y [0,1]
Nếu y u thì I(x,y) I(x,u) với mọi x [0,1]
Dạng kéo theo thứ nhất: IS1(x,y) = S(n(x),y) (1.38)
Dạng kéo theo thứ hai: IS2 = S(T(x,y),n(x)) (1.39)
Có thể minh họa luật modus ponens :
Giả thiết 1 (sự kiện): x là A
Giả thiết 2 (luật): Nếu x là A thì y là B
Suy diễn (kết luận): y là B
Tuy nhiên, trong suy diễn của con người, luật modus ponens được sử dụngtheo cách thức xấp xỉ điều này được minh họa như sau :
Giả thiết 1 (sự kiện): x là A’
Giả thiết 2 (luật): Nếu x là A thì y là B
Trang 22Suy diễn (kết luận): y là B’
Trong đó A’ gần với A và B’ gần với B Khi A, B, A’, B’ là các tập mờ trêncác không gian nền tương ứng thì thuật toán trên được gọi là suy luận xấp xỉ haysuy diễn mờ Sử dụng luật hợp thành mờ đã nêu ở trên ta có thể thành lập thuật toánsuy diễn mờ như sau:
Gọi A, A’ và B là các tập mờ trên không gian X, X và Y Giả thiết phép kéotheo mờ A B được diễn giải như một quan hệ mờ trên không gian XxY thì tập mờ
B suy ra từ “ x là A” và luật mờ “nếu x là A thì y là B” được xác định bởi:
max min , , ,
hay tương đương:
Các trường hợp có thể có của phép suy diễn mờ bao gồm:
Trang 231.4.3.1 Suy diễn với một luật với một tiên đề
Hình 1.4: Mô hình suy luận mờ với một luật-một tiên đề
Đây là trường hợp đơn giản nhất như đã được minh họa ở trên Biến đổi ta có:
1.4.3.2 Suy luận một luật với nhiều tiên đề
Một luật nếu … thì mờ với hai tiên đề thường được viết dưới dạng: “nếu x là
A và y là B thì z là C” và được minh họa như sau :
Giả thiết 1 (sự kiện): x là A’ và y là B’
Giả thiết 2 (luật): Nếu x là A và y là B thì z là C
Suy diễn (kết luận): z là C’
Luật mờ trong giả thiết 2 có thể đưa về dạng : AxB C từ đó ta tính được:
C’ = (A’xB’) º R = A’ º(AxB C) = [A’ º(A C)] [B’ º(B C)] (1.43)
)]
( ) ( ) ( [ )]
( ) ( [ ) (
2 1
,
' '
' '
'
z w
w z y
y x
x
z y
x y
x z
C C
B B
y A
A x
C B
A B
A y C
Trang 24Hình 1.5: Mô hình suy luận mờ một luật-nhiều tiền đề
Ta lại có:
) ( )
(
) ( ) ( ) ( )
( ) ( )
(
) ( ' )
( '
' '
, '
y y
z y
x y
x z
C B o B C
A o A
C B
A B
A y x C
1.4.3.3 Nhiều luật mờ với nhiều tiên đề.
Sự suy diễn của luật mờ phức hợp được tiến hành như hợp của các quan hệ
mờ tương ứng với luật mờ Do vậy ta có:
Giả thiết 1 ( Sự kiện ): x là A’ và y là B’
Giả thiết 2 ( Luật ): nếu x là A1 và y là B1 thì z là C1
Giả thiết 3 ( Luật ): nếu x là A2 và y là B2 thì z là C2
Suy diễn ( kết luận ): z là C’
Chúng ta có thể sử dụng suy diễn mờ được trình bày trong hình vẽ 1.7 dướiđây như một thuật toán suy luận để tìm được kết quả của tập mờ đầu ra C’
Hình 1.6 : Mô hình suy luận mờ hai luật hai tiên đề
C’ 2
Trang 25Để xác định thuật toán suy diễn mờ, gọi R1 A1xB1 C1và R2 A2xB2 C2
Do phép hợp thành Max-Min º có tính chất phân phối với phép nên:
C’ = (A’x B’) º (R 1R 2 ) = [ (A’xB’) º R 1(A’xB’) º R 2 ] = C 1 ’ C 2 ’ (1.46)
Với C1’, C2’ là tập mờ được suy diễn từ luật 1 và 2 Hình vẽ 2.7 cho thấy vềmặt hình học thuật toán suy diễn mờ với luật phức hợp và nhiều tiền đề
1.4 Điều khiển mờ (Fuzzy Control)
Cấu trúc cơ bản
Cấu trúc cơ bản của một bộ điều khiển dựa vào logic mờ (fuzzy logic controlFLC) gồm bốn thành phần chính: khâu mờ hoá (a fuzzifier), một cơ sở các luật mờ(a fuzzy rule base), một môtơ suy diễn (ac inference engine) và khâu giải mờ (adefuzzifier) Nếu đầu ra sau công đoạn giải mờ không phải là một tín hiệu điềukhiển (thường gọi là tín hiệu điều chỉnh) thì chúng ta có môt hệ quyết định dựa trên
Cơ sởluật mờ
Mờ hóa Suy diễnMô tơ Giải mờ tượngĐối
Trang 26thông ngầm, quản lý nhóm các thang máy (Fujitec, 1988), Điều khiển việc hoà Clotrong các nhà máy lọc nước, điều khiển hệ thống máy bơm làm sạch nước(Yagishita, 1985), điều khiển hệ thống năng lượng và điều khiển phản ứng hạt nhân,(Bernart, 1988, Kinoshita), v.v cho tới giám sát các sự cố trên đường cao tốc(Hsiao, 1993), các thiết bị phần cứng mờ (Fuzzy Hardware Devices, Togai vàWatanabe, 1986, nhóm cộng tác với giáo sư Yamakawa, 1986, 1987, 1988 )
Trong số những ứng dụng thực sự thành công trong thực tiễn còn phải nhắcđến bộ FLC dùng trong quản lý sân bay (Clymer,1992) các hệ thống điều khiểnđường sắt và hệ thống cần cẩu Container (Yasunobu và Miyamoto,1985) một ứngdụng rất hay của điều khiển mờ là hệ điều khiển “The Camera Tracking ControlSystems” của Nasa 1992,…
Chúng ta cũng không thể không nhắc tới các máy móc được dùng trong giađình dùng FLC đang bán trên thị trường thế giới: Máy điều hoà nhiệt độ -Mishubitshi, máy giặt Hitachi, các Video Camera của Sanyo, T4i Camera Cannon-Máy hút bụi lò sấy của Microware Ovent- Toshiba…
Các hệ chuyên gia mờ (Fuzzy Expert Systems)
Các hệ chuyên gia (Expert System) là một nhánh của bộ môn Trí tuệ nhântạo (Artifical Intelligence) sử dụng các trí thức chuyên biệt để giải quyết bài toán ởgiai đoạn dùng các chuyên gia- con người Chúng phát triển vào những năm 1970
và được ứng dụng trong khá nhiều lĩnh vực Ngày nay đối với hệ chuyên gia thì
thực chất hiểu là các hệ thống trong đó có sử dụng Công nghệ hệ chuyên gia (Expert System Techology) bao gồm các ngôn ngữ hệ chuyên gia chuyên dụng, các
chương trình và cả các phần cứng được thiết kế nhằm vận hành và phát triển hệchuyên gia
Hiện nay trong các sách báo người ta thường dùng từ đồng nghĩa là “Hệ chuyên gia trên cơ sở tri thức” (Knowledge- Based Expert System) Sau đây là cấu
trúc cơ bản của hệ chuyên gia:
Trang 27Hình 1.8: Cấu trúc cơ bản của hệ chuyên gia
Lý thuyết mờ và logic mờ có nhiều ưu điểm trong biểu diễn tri thức của cácchuyên gia Cho nên việc đưa các luật mờ và đặc biệt là biến ngôn ngữ và hàmthuộc đã xuất hiện khá sớm Các hệ chuyên gia trình bày dưới đây đã sử dụng cácluật mờ (fuzzy rules)
CADIAG-2, Adlassnig et al.,1985 Y (internal medicine)
EMERGE, Hudson, Cohen, 1988 Phân tích đau ngực
ESP, Zlmmermann, 1989 Kế hoạch mức chiến lược
FAULT, Whalen et al., 1987 Kế toán
OPAL, Bensana et al., 1988 Lập lịch công tác
Thực tiễn đã dẫn tới cần phối hợp tốt hơn hai loại công nghệ này, đó là nhucầu về nghiên cứu các hệ chuyên gia mờ (fuzzy expert systems) Những nghiên cứusau đây là ví dụ:
- FESS- một hệ chuyên gia mờ tái sử dụng, Hall và Kandell, 1993
- Hệ chuyên gia mờ có mục đích tổng quát, Schneider và Kandel, 1994
- Những khung cho hệ chuyên gia mờ, Umano, Hatono và Tamura (fuzzyexpert systems shells), 1994
- Công trình của Whalen và Schott, 1992 Tạo ra mạng suy diễn ngôn ngữ
mờ ( Fuzzy linguistic interence network generator)
Chúng ta không khó khăn khi chỉ ra các ứng dụng thực tiễn của hệ chuyêngia mờ Sau đây là một vài ví dụ:
Người
dùng
Giao diệnĐối thoạiĐiều chỉnh tri thức
Cơ sở tri thức
Mô tơ suy diễn
Trang 28- Von Altrorck và Krause đã phát triển hệ chuyên gia mờ giành cho côngnghiệp ôtô của MecrCedes-Benz của Cộng hoà liên bang Đức,1994
- Hệ Emerge của Hudsson và Cohen 1992 là hệ chuyên gia y học trên cơ sởcác luật mờ trợ giúp cho phòng cấp cứu và đưa ra lời chỉ dẫn về kiểm tracác hiện tượng đau
- Hệ EAR của López de Mántaras et al, dành cho việc chuẩn đoán y học,còn hệ FLING của Whalen và Schott năm 1992 thì trợ giúp cho việc nắmbắt và phân tích tri thức
- Về các hệ mờ EDFRAME/CADIAG- IV, 1996, Fuzzy KBWean, 1998 vàFuzzy-ARDS 1999 đang sử dụng tại Viên cộng hoà Áo
1.5 Nhận dạng mờ (Fuzzy Pattern Recornition)
1.5.1 Bài toán nhận dạng
Nhiều thông tin hằng ngày chúng ta cần thu nhận và xử lý nhiều khi có hìnhdạng phức tạp Bộ môn nhận dạng cung cấp cho chúng ta một số phương pháp đểphát hiện những cấu trúc chính và một số nét cơ bản của hình dạng đó Cách tiếpcận chính với các bài toán nhận dạng là: Phân lớp tuyến tính, tiếp cận thống kê,
lý thuyết mờ, các perceptrons, phân lớp cơ sở tri thức dựa vào kỹ thuật của trí tuệnhân tạo
Nghĩ tới việc tiếp cận lý thuyết mờ là hoàn toàn tự nhiên vì hình dạng quansát được, các thông tin nhận được thường rất mờ Một số kết quả đã được công bố(ví dụ: Bezdek năm 1981, Pedrrycz năm 1990 hay là Bezdek và Pal năm 1992), và
đã ứng dụng thành công trong xử lý ảnh (nhận dạng chữ viết tay), nhận dạng tiếng
nói, robot thông minh, nhận dạng các đối tượng hình học…
Trang 29Hình 1.9: Quá trình nhận dạng
Bây giờ ta nói thêm về một số khái niệm :
- Dữ liệu (data) thu được từ quá trình vật lý hoặc là các hiện tượng Dữ liệu(theo nghĩa rộng) có thể ở dạng định tính định lượng, dạng số, hình, hay một đoạnvăn, ngôn ngữ hay tổ hợp các dạng trên
- Không gian các dáng (Pattern Space) còn được gọi là cấu trúc (Structure)
đó là tập các dáng vẻ, kiểu dáng, trong đó thông tin được tổ chức sao cho chúng cóthể góp phần phát hiện mối liên hệ giữa các biến Nói chung số chiều của khônggian các dáng cần ít hơn số chiều của không gian dữ liệu
- Không gian các đặc tả (Feature Space) là không gian nằm giữa khônggian dữ liệu và không gian phân lớp Nói chung số chiều của không gian đặc tả phải
ít hơn nhiều số chiều không gian dữ liệu Vấn đề khó khăn là chọn những đặc tả nàocho đủ phản ánh những nét quan trọng nhất của đối tượng Không gian phân lớp dĩnhiên phải chứa được các lớp mà người nghiên cứu muốn phân Tuy nhiên thực chất
có bao nhiêu lớp phân biệt thì nhiều khi ngay từ đầu cũng khó xác định
Một nhận xét cũng nên để ý là tính mờ không chỉ trong không gian dữ liệu
mà còn nằm trong không gian các đặc tả và trong các thuật toán phân lớp
1.5.2 Phân nhóm và vai trò trong thực tế
Hiện nay các chuyên gia đang nghiên cứu về nhận dạng mờ có thể chia theo
4 nhóm đề tài chính:
- Nhận dạng tĩnh các đối tượng 3 chiều, có mầu
Dữ liệu Biến đổi Thu gọn số chiều Thuật toán quyết định Kết quả
Không gian pattern
Không gian đặc tả Không gian phân lớp
Trang 30- Nhận dạng động các đối tượng 3 chiều có mầu
- Nhận dạng theo công nghệ hiển thị (Visual Ricogition) các đối tượng 3chiều có màu
- Nhận dạng động các biểu hiện của con người(Human Expressions)
Ai cũng hiểu được tầm quan trọng của các vấn đề nhận dạng các đối tượngđộng 3 chiều trong quốc phòng an ninh, ngành viễn thám Nhưng ngay đối vớingành dân sự độ quan trọng của đề tài này cũng được phản ảnh qua bảng tổng kếtsau cuộc thăm dò ý kiến của hơn 200 chuyên gia hang đầu về công nghệ mờ đượctiến hành (1989) bởi 2 giáo sư A Ishakawwa và T.L Willson (Các con số ghi trongbảng tính theo % của các ý kiến )
Cao Trung Bình Thấp
1 Nhận dạng tĩnh dùng công nghệ mờ
- Các hệ robot sản xuất dùng công nghệ hiển thị
-Các hệ theo dõi tự động dùng công nghệ hiển thị
- Các hệ vận tải robot dùng công nghệ hiển thị
2.Nhận dạng động dùng công nghệ mờ
-Các hệ robot sản xuất dùng công nghệ hiển thị
-Các hệ theo dõi tự động dùng công nghệ hiển thị
84.080.842.9
81.878.3
16.019.247.6
9.113.0
009.5
9.18.7
Chương 2
LÝ THUYẾT NHẬN DẠNG ẢNH
Trong chương 2, luận văn đề cập tới những vấn đề sau: Các khái niệm cơ bảnbao gồm: Khái niệm ảnh số, Phân loại ảnh số, Khái niệm mức xám đồ Lý thuyếtnhận dạng ảnh gồm: Lý thuyết xử lý ảnh 2D, Nâng cao chất lượng ảnh, Phân loạiảnh và tìm biên ảnh, Lý thuyết nhận dạng ảnh Trong chương này, luận văn đã thamkhao một số tài liệu [1] và [9]
Trang 312.1 Các khái niệm cơ bản
2.1.1 Khái niệm ảnh số
Ảnh trong thực tế là một ảnh liên tục về không gian và giá trị cường độ sáng
Để có thể xử lý ảnh bằng máy tính người ta cần thiết phải số hoá ảnh Trong quátrình số hoá, ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấymẫu (rời rạc hoá về không gian) và lượng hoá thành phần giá trị mà về nguyên tắcbằng mắt thường không phân biệt được hai điểm gần nhau Một ảnh sẽ là một tậphợp các phần tử ảnh (Picture Element) hay còn gọi là Pixel
Như vậy, ảnh số là một tập hợp các điểm ảnh Khi được số hoá, nó thườngđược biểu diễn bởi một mảng hai chiều I(n,p) với n là số dòng và p là số cột Ta nóiảnh gồm n x p Pixels Người ta thường ký hiệu I(x,y) để chỉ một pixel I chính là giátrị cường độ ánh sáng của điểm ảnh tại Pixel đó Thường giá trị n chọn bằng p vàbằng 256 Ảnh có thể được biểu diễn với các độ phân giải khác nhau Một pixel cóthể được lưu trữ trên 1, 4, 8 hay 24 bit tuỳ thuộc vào cường độ sáng cần phân biệtcủa ảnh và số lượng thành phần mầu cơ bản chứa trong ảnh đó
2.1.2 Phân loại ảnh số
Người ta thường chia ảnh số ra làm ba loại chính là:
Ảnh đen trắng: mỗi phần tử ảnh nhận một trong hai giá trị tương ứng vớihai mức sáng đen và trắng (còn gọi là ảnh nhị phân)
Ảnh xám (ảnh đa mức xám): Các phần tử ảnh chứa thông số về cường độánh đã được mã hoá thành N mức(8, 256 hoặc nhiều hơn) tương ứng với 3 bit, 8 bithoặc hơn nữa Ảnh xám có một đặc trưng là lược đồ xám (histogram) Ảnh xámđược gọi là ảnh grayscale
Ảnh mầu: mỗi phần tử được ảnh lưu trữ trong ảnh dạng một cấu trúc có 3trường chứa thông tin về 3 màu cơ bản là đỏ, xanh, lơ (red, bue, green) Màu của
Trang 32ảnh sẽ là giá trị tổng hợp của 3 giá trị trên Mỗi trường biểu diễn giá trị có thể dùng
8 bit, 16 bit hoặc 24 bit để mã hoá
Như vậy ảnh mầu là ảnh mang thông tin về đối tượng đầy đủ nhất so với ảnhđen trắng và ảnh xám Tuy nhiên tất cả cách biểu diễn này đều chỉ là sự mô phỏng
hệ màu trong tự nhiên Thực tế thì một ảnh màu được phân biệt qua 3 thuộc tính là
độ chói (Brighness), sắc thái màu (Hue), và độ bão hoà (Saturation) Tuy nhiên vớikhả năng cảm nhận của mắt người thì cách biểu diễn ảnh dưới dạng cấu trúc 3 màuRBG chất lượng ảnh thu được có thể chấp nhận được
( thường N= 255) Trục tung y biểu diễn số điểm ảnh trong ảnh ứng với mức xám tương
ứng trên trục hoành Như vậy ta có thể biểu diễn mức xám đồ bằng hàm y=f(x) với f(x)
là một hàm rời rạc có giá trị bằng số điểm ảnh trong ảnh có mức xám x.
tử ảnh g[m,n], như vậy ở đây ta đã áp dụng lý thuyết xử lý tín hiệu số trong mộtkhông gian hai chiều thay vì không gian một chiều như thông thường
Trang 33Một hệ thống xử lý ảnh sẽ tiếp nhận ảnh số g[m,n] và đưa ra ảnh đã được xử
lý g’[m,n] Trên phương diện xử lý tín hiệu số thì chức năng của hệ thống này sẽđược đặc trưng bằng hàm truyền đạt H của nó Ta có thể thể hiện mối quan hệ nàynhư sau:
'[ , ] ( [ , ])
Đối với không gian 2D ta cũng có các cách tiếp cận khác nhau để khảo sát hệthống Cách thứ nhất có thể khảo sát trực tiếp trên miền không gian điểm ảnh [m,n].Những tác động của hàm truyền H sẽ được tính toán trực tiếp với các điểm ảnh Một sốcông cụ cơ bản thường được sử dụng là toán tử điểm ảnh, tích chập hay các bộ lọc
Cách tiếp cận thứ hai của hệ thống xử lý số 2D là biến đổi tín hiệu sang mộtmiền không gian khác và thực hiện khảo sát trong miền không gian đó Sau khikhảo sát xong ở miền không gian này ta lại biến đổi ngược để đưa tín hiệu về miềnkhông gian điểm ảnh Việc biến đổi tín hiệu sang xử lý ở một miền không gian khác lànhằm làm nổi bật các đặc tính của tín hiệu nhằm làm cho việc phân tích và xử lý thuậntiện hơn.Trong lý thuyết xử lý tín hiệu số ta có thể thực hiện biến đổi về miền khônggian thời gian hay miền không gian tần số nhằm thực hiện các xử lý thích hợp
Dưới đây chúng ta sẽ tiến hành xem xét một số các khái niệm cơ bản trongmột hệ thống xử lý số tín hiệu hai chiều
2.2.1.1 Khảo sát trực tiếp trong miền không gian điểm ảnh
Đáp ứng xung:
Tương tự như trong không gian một chiều, trong không gian 2D ta cũng cókhái niệm về xung đơn vị như sau Xung đơn vị δ[m,n] được định nghĩa theo côngthức:
0 n 0, m khi 1
, n
m
(2.2)
Trang 34Đáp ứng xung của một hệ thống chính là tín hiệu đầu ra khi tín hiệu đầu vào
là xung đơn vị Như vậy đáp ứng xung h[m,n] của hệ thống có thể định nghĩa nhưsau:
Với một dịch chuyển [α,β]] ta có đáp ứng xung h[m,n; α,β]] (được gọi là hàm
phân tán điểm- PSF: Point Spread Function) như sau:
Trang 35Tích chập trong miền không gian tuyến tính bất biến thể hiện mối quan hệ
đầu ra, đầu vào của hệ thống và đáp ứng xung h[m,n] được cho bởi công thức sau:
7
7 , hoặc 9 9 Còn g[m,n] là ma trận điểm ảnh có kích thước M N
Tích chập hai ma trận h[m,n] với g[m,n] cho ma trận g’[m,n] Kích thước của ma trận g’[m,n] là P Q với P= M+K – L còn Q = N+L-1.
n
pq po
q q
f f
f
f f
f
f f
f
h h h
g g
g g
g g
1
11 10
0
01 00 33
32 31
23 22 21
13 12 11
p1
1
11 10
0
01 00
* h h
h h h h g
g g
số bộ lọc với mục đích tách các chi tiết của ảnh để xử lý riêng
Trong miền không gian điểm ảnh, bộ lọc thường sử dụng là một mặt nạ dichuyển khắp mặt phẳng ảnh Tâm của cửa sổ mặt nạ sẽ là điểm chịu tác động lọc,giá trị của các điểm lân cận trong mặt nạ sẽ có ảnh hưởng đến giá trị ra của điểmtrung tâm Tùy theo quan hệ giá trị ra của điểm trung tâm với giá trị của các điểmlân cận mà ta chia thành hai bộ lọc tuyến tính và phi tuyến
+ Lọc tuyến tính:
Điểm trung tâm của mặt nạ sẽ có giá trị bằng tổng số trọng số của các điểmthuộc mặt nạ ( bao gồm giá trị của chính bản thân nó) Tổng này là một tổ hợp tuyếntính của các điểm lân cận Chính vì thế mà nó được gọi là lọc tuyến tính Giả sử taxét một mặt nạ lọc 3 3
Trang 36Bộ lọc phi tuyến cũng tương tự bộ lọc tuyến tính Tuy nhiên đối với lọc phituyến thì giá trị ra của điểm trung tâm không phải là tổ hợp tuyến tính của các điểmlân cận mà nó biểu diễn bởi một hàm phi tuyến.
Toán tử điểm ảnh:
Phần trên đã xét một số các phép biến đổi tác động lên không gian điểmảnh nhằm biến đổi ảnh Bây giờ ta sẽ xét đến phép biến đổi tác động lên từngđiểm ảnh để biến đổi giá trị cường độ của nó Hàm biến đổi như vậy gọi là hàmtoán tử điểm ảnh
Tác động của toán tử điểm ảnh có thể được mô tả như sau: Giả sử giá trị
cường độ sáng của điểm ảnh ban đầu g[m,n] là u và giá trị cường độ sáng của điểm ảnh sau khi biến đổi g’[m,n] là v và gọi hàm toán tử điểm ảnh là T thì:
g’[m,n] = T(g[m,n]) <=> v= T(u) với 0< u,v < N- 1 (2.9)Với N là số mức cường độ sáng của ảnh trước khi biến đổi g[m,n] Hàm T cóthể là một hàm tuyến tính hoặc phi tuyến
Toán tử điểm ảnh có thể coi như hoạt động giống như một bản tra LUT (look
up table) với N cột tra Nó thực hiện phép biến đổi nhanh giữa các giá trị u và các giá trị v mà không cần phải tính toán Tương ứng với mỗi giá trị u vào sẽ có một giá trị v ra Điều này làm cho quá trình biến đổi ảnh nhanh hơn rất nhiều
Trang 37Hình 2.3 : Toán tử điểm ảnh
2.2.1.2 Thực hiện phép biến đổi không gia.
Phép biến đổi không gian như trên đã nói là nhằm đưa tín hiệu biểu diễn sangmột vùng không gian mới mà tại không gian đó các đặc trưng của tín hiệu sẽ thểhiện rõ hơn và bởi vậy mà giúp cho quá trình xử lý thuận tiện hơn
Trong kỹ thuật xử lý ảnh, ta thường dùng phép biến đổi Fourier để đưa tínhiệu ảnh về miền không gian tần số Sau khi xử lý ta lại dùng biến đổi Fourierngược để đưa tín hiệu quay về không gian điểm ảnh Hai phép biến đổi Fourierthường được sử dụng nhiều là biến đổi Fourier rời rạc và biến đổi Fourier nhanh
2.2.2 Nâng cao chất lượng ảnh
2.2.2.1.Khôi phục ảnh
Nhiễu và mô hình nhiễu:
Ảnh được coi là một miền đồng nhất về mức xám, tức là các điểm ảnh lâncận có sự biến đổi liên tục về mức xám.Như vậy sau quá trình số hóa thì trong mỗicửa sổ đang xét các điểm ảnh đều có giá trị gần bằng như nhau Thực tế quan sát cóđiểm ảnh có giá trị khác hơn nhiều so với các điểm ảnh khác Đó chính là nhiễu.Như vậy, nhiễu trong ảnh số được xem như là sự dịch chuyển đột ngột của tín hiệuthu nhận trên một khoảng cách nhỏ
Trang 38yếu tố tác động tạo thành nhiễu Do đó tín hiệu g’(x,y) có thể chứa các thành phần nhiễu
trong đó Quá trình thu nhận ảnh có nhiễu có thể mô tả một cách trực quan như sau :
Hình 2.4: Mô hình nhiễu
+ Mô hình rời rạc:
Trên cơ sở mô hình nhiễu liên tục, ta có thể xây dựng một mô hình nhiễu rời
rạc tương ứng với ảnh số Khi đó g(x,y) sẽ chuyển thành ảnh rời rạc g[m,n], ảnh liên
tục g’(x,y) sẽ chuyển thành ma trận điểm ảnh g’[m,n] và nhiễu cũng phân bố rời rạc
tại các điểm ảnh η[m,n] Giả sử H là hàm tuyến tính bất biến trong phạm vi M N (
Các tín hiệu nhiễu thường được chia thành các loại chính như sau:
Nhiễu do thiết bị thu nhận ảnh là loại nhiễu gây ra do giới hạn nhiễu xạ và
quang sai của thấu kính, nhiễu do bộ phận cảm quang, ảnh mờ nhòe do ống kính,
nhiễu do rung động trong quá trình thu nhận
Nhiễu ngẫu nhiên độc lập là các loại nhiễu gây ra do ảnh hưởng của môi
trường xung quanh, do ảnh hưởng của khí quyển
Hệ thống thu nhận ảnh HẢnh gốc
g(x,y)
Tín hiệu nhiễu η(x,y)
Tín hiệu ảnh g’(x,y)
Trang 39Nhiễu do vật quan sát Đây là nhiễu gây ra do bề mặt của bản thân vật có độnhám gồ ghề Chính nhiễu này gây hiện tượng tán xạ của các tia đơn sắc và sinh rahiện tượng nhiễu lốm đốm.
Thường người ta xấp xỉ các loại nhiễu bằng các quá trình tuyến tính bất biến
vì có nhiều công cụ tuyến tính có thể giải quyết vấn đề khôi phục ảnh hơn là cáccông cụ phi tuyến Việc xử lý nhiễu bằng cách xấp xỉ tuyến tính cũng giúp cho côngviệc dễ dàng hơn trong trường hợp dùng cách biến đổi phi tuyến
Các kỹ thuật lọc nhiễu
+ Lọc nhiễu tuyến tính
Trong phần này chúng ta sẽ xét hai kỹ thuật lọc tuyến tính hay sử dụng là lọcngược và lọc giả ngược
► Lọc ngược (inverse filter):
Nguyên lý của lọc ngược là sử dụng hàm ngược của đáp ứng xung h[m,n] đểkhôi phục lại một ảnh xấp xỉ ảnh nguyên gốc g[m,n] từ ảnh g’[m,n] đã biết nguyên
lý này được biểu diễn mô tả theo sơ đồ sau:
Hình 2.5: Lọc ngược khôi phục ảnh nguyên gốc.
Như vậy ảnh khôi phục g*[m,n] sẽ được tính theo công thức:
g m n, g m n h' , 1m n,
Trong đó h-1[m,n ] chính là hàm của bộ lọc ngược Vì H-1(H(x)) = x nên ta cógiá trị đầu ra g*[m,n] bằng giá trị vào g[m,n] Như vậy ta đã khôi phục được ảnhg[m,n] nhờ dùng hàm ngược của đáp ứng xung h[m,n]
Nếu dùng biến đổi Fourier ta có:
Trang 40
' ,, ' ,
] , [
] , [ ] , [
] , [ ] , [
'
v u H
v u N v u H
v u G v u
(2.13) Nếu H[u,v] = 0 hoặc khá nhỏ thì hệ thống khôi phục sẽ không ổn định (hàm
H T [u,v] không xác định) Đây chính là nhược điểm của phương pháp lọc ngược.
Tuy bộ lọc ngược có khả năng ngăn nhiễu do hệ thống nhận ảnh gây ra khá tốtnhưng việc thiết kế bộ lọc này lại là khá phức tạp
► Lọc giả ngược (Pseudoinverse filter):
Kỹ thuật lọc này khắc phục được nhược điểm của kỹ thuật lọc ngược là làm
cho hàm H T [u,v] luôn xác định:
1 khi H[u,v]
[ , ][ , ]
Với ε là một giá trị cho trước
Trong trường hợp ảnh nguyên gốc g[m,n] chuyển động tịnh tiến theo phương
x và y sinh ra hiện tượng nhòe ảnh thì H T [u,v] sẽ được xác định theo các thông số
chuyển động, và lọc giả ngược có khả năng khôi phục được ảnh nhòe này
+ Lọc nhiễu lốm đốm:
Ta đã biết nhiễu lốm đốm gây ra do tính chất gồ ghề của bề mặt vật thể gây
ra hiện tượng tán xạ các tia đơn sắc Phần này ta sẽ nghiên cứu một kỹ thuật lọcnhiễu lốm đốm là kỹ thuật trung bình thống kê sử dụng bộ lọc đồng cầu