Logic mờ ứng dụng trong bài toán nhận dạng chữ viết tay

Biến ngôn ngữ Một biến ngôn ngữ được đặc trưng bởi tập 5 yếu tố x,Tx,X,G,M trong đó x là tên của biến; Tx là tập hợp các thuật ngữ của x, nó là các giá trị ngôn ngữ haythuật ngữ ngôn ngữ

Trang 1

TRƯỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THÔNG

TRẦN THỊ HIẾU

LOGIC MỜ ỨNG DỤNG TRONG BÀI TOÁN NHẬN DẠNG CHỮ VIẾT TAY

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Thái Nguyên, năm 2013

Trang 2

ĐẠI HỌC THÁI NGUYÊN

TRƯỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THÔNG

TRẦN THỊ HIẾU

LOGIC MỜ ỨNG DỤNG TRONG BÀI TOÁN NHẬN DẠNG CHỮ VIẾT TAY

Chuyên ngành: Khoa học máy tính

Mã số: 60.48.01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Người hướng dẫn khoa học: TS Vũ Vinh Quang

Thái Nguyên, năm 2013

Trang 3

Trước hết, tôi xin chân thành gửi lời cảm ơn sâu sắc đến thầy giáo TS Vũ Vinh Quang, người đã tận tình hướng dẫn và tạo mọi điều kiện cho tôi trong quá trình làm luận

Trong khoảng thời gian ngắn, với kiến thức của bản thân còn hạn chế nênluận văn không tránh khỏi những thiếu sót về mặt khoa học, tôi rất mong nhận đượcnhững đóng góp ý kiến của các Thầy, cô giáo cùng bạn bè để luận văn được hoànchỉnh hơn

Xin trân trọng cảm ơn!

Thái Nguyên, tháng 7 năm 2013

Học viên

Trần Thị Hiếu

Trang 4

Chương 1 LOGIC MỜ VÀ BÀI TOÁN NHẬN DẠNG CHỮ VIẾT TAY 2

1.1 Các khái niệm cơ bản 2

1.2 Các phép toán trên tập mờ 4

1.2.1 Phép giao 4

1.2.2 Phép hợp 5

1.2.3 Phép phủ định 7

1.3 Suy luận mờ 8

1.3.1 Nguyên lý suy rộng và quan hệ mờ 8

1.3.2 Luật mờ 10

1.4 Điều khiển mờ (Fuzzy Control) 16

1.5 Nhận dạng mờ (Fuzzy Pattern Recornition) 19

1.5.1 Bài toán nhận dạng 19

1.5.2 Phân nhóm và vai trò trong thực tế 20

Chương 2 LÝ THUYẾT NHẬN DẠNG ẢNH 21

2.1 Các khái niệm cơ bản 21

2.1.1 Khái niệm ảnh số 21

2.1.2 Phân loại ảnh số 21

2.1.3 Khái niệm mức xám đồ 22

2.2 Lý thuyết nhận dạng ảnh 22

2.2.1 Lý thuyết xử lý ảnh 2D 22

2.2.2 Nâng cao chất lượng ảnh 27

2.2.3 Phân loại ảnh và tìm biên ảnh 36

2.2.4 Quy trình nhận dạng ảnh 37

Chương 3 BÀI TOÁN NHẬN DẠNG CHỮ VIẾT TAY 43

3.1 Mô hình bài toán 43

3.2 Các bước tiến hành bài toán nhận dạng chữ viết 44

Trang 5

3.2.2 Tách mẫu và chuẩn hoá 46

3.2.3 Xây dựng thư viện mẫu cho các ký tự 46

3.2.4 Hệ suy luận học cho bài toán nhận dạng chữ viết tay 46

KẾT LUẬN 53

TÀI LIỆU THAM KHẢO 54

Trang 6

Hình 1.1: Một số hàm liên thuộc cơ bản 3

Hình 1.2 : Đồ thị minh hoạ nguyên lý suy rộng mờ 9

Hình 1.3: Hàm liên thuộc của biến ngôn ngữ T(tuổi) 11

Hình 1.4: Mô hình suy luận mờ với một luật-một tiên đề 14

Hình 1.5: Mô hình suy luận mờ một luật-nhiều tiền đề 14

Hình 1.6 : Mô hình suy luận mờ hai luật hai tiên đề 15

Hình 1.7: Cấu trúc cơ bản của bộ điều khiển mờ 16

Hình 1.8: Cấu trúc cơ bản của hệ chuyên gia 17

Hình 1.9: Quá trình nhận dạng 19

Hình 2.1 : Toán tử tuyến tính 24

Hình 2.2: Mặt nạ bộ lọc tuyến tính 3 3 25

Hình 2.3 : Toán tử điểm ảnh 26

Hình 2.4: Mô hình nhiễu 27

Hình 2.5: Lọc ngược khôi phục ảnh nguyên gốc 29

Hình 1.6: Một số các mặt nạ không gian trung bình 33

Hình 2.7: Mặt nạ lọc thông thấp 33

Hình 2.8: Cửa sổ lọc giả trung vị 34

Hình 2.9: Phương pháp lưới 39

Hình 2.10: Phương pháp cung 40

Hình 2.11: Biểu diễn mẫu bằng tập kí hiệu 42

Hình 3.1 : Các công đoạn của bài toán nhận dạng ảnh 44

Hình 3.2 : Ba mẫu chữ cần đọc 47

Hình 3.3 : Ký tự cần nhận dạng 47

Hình 3.4: Giao diện chương trình nhận dạng 48

Hình 3.5: Vẽ chữ cần nhận dạng 49

Hình 3.6: Kết quả nhận dạng sau khi vẽ chữ 49

Hình 3.7: Mở file ảnh ký tự cần nhận dạng 50

Hình 3.8: Giao diện sau khi mở file ảnh ký tự 51

Hình 3.9: Kết quả sau khi nhận dạng ảnh ký tự 51

Hình 3.10: Ghi ký tự ra file ảnh 52

Trang 8

LỜI MỞ ĐẦU

Công nghệ tri thức là chuyên ngành tích hợp tri thức con người với các hệthống máy tính Các đặc tính tiêu biểu của các hệ thống dựa trên tri thức thể hiện ởviệc xử lí chuyển trạng thái chứ không dựa vào thể hiện cứng nhắc của trạng thái.Các quyết định về các xử lí dữ liệu cũng là một phần tri thức của hệ thống Lúc đóngười ta đề cập nhiều đến tri thức thủ tục

Để giải vấn đề người ta tăng cường các thủ tục suy diễn với cơ chế kết hợpcác luật với các lập luận logic Lập luận logic dùng để rút ra kết luận từ các sự kiệnxem là đúng đắn

Ở các giai đoạn trước, việc truyền đạt cho máy luôn cần thiết phải đảm bảotính chính xác và duy nhất, điều này làm cho các thao tác của máy trở nên khôcứng và tạo ra một khoảng cách rất xa giữa người và máy về “độ thông minh” trongviệc giải quyết các bài toán kỹ thuật cũng như trong cuộc sống hàng ngày

Hai lĩnh vực quan trọng phải kể đến là lý thuyết về mạng nơron và logic mờ,chúng là chìa khoá để tạo ra các hệ thống kỹ thuật vừa đảm bảo tính xác và nhanhchóng trong vận hành, vừa có khả năng học từ các mẫu dữ liệu thống kê, lại có khảnăng thông minh và mềm hoá trong quá trình ra quyết định

Đối với các cán bộ kỹ thuật trong ngành Điện tử viễn thông, lý thuyết về xử

lý tín hiệu trong đó có tín hiệu hình ảnh là những kiến thức không thể thiếu Nhậndạng ảnh, đặc biệt là nhận dạng ký tự cũng là một mảng đề tài đáng quan tâm Việcnhận dạng ký tự nhất là với chữ viết tay sẽ tiết kiệm rất nhiều thời gian cho viêcnhập và lưu trữ dữ liệu

Ý thức được vấn đề trên, tôi xin hoàn thành luận văn tốt nghiệp với đề tài

“Logic mờ ứng dụng trong bài toán nhận dạng chữ viết tay” Nội dung đề tài

Trang 9

Chương 1 LOGIC MỜ VÀ BÀI TOÁN NHẬN DẠNG CHỮ VIẾT TAY

Trong chương 1, luận văn đề cập đến các vấn đề sau: Một số khái niệm về logic mờnhư: Các phép toán trên tập mờ, Suy Luận Mờ, Điều khiển mờ (Fuzz Control), Nhậndạng mờ (Fuzzy Pattern Recornition), mô hình của bài toán nhận dang Trong chươngnày, luận văn đã tham khao một số tài liệu sau: [3], [4] , [6] và [7]

1.1 Các khái niệm cơ bản

Cơ sở của logic mờ là việc ánh xạ từ các biến x đầu vào thuộc tập A thànhcác biến y đầu ra thuộc tập B

Nói cách khác, giá trị x=a không được xác định rõ là có thuộc hay khôngthuộc tập B, và khái niệm mờ được đưa ra để làm nền tảng cho logic mờ và điềukhiển mờ sau này

Cơ chế cơ bản của logic mờ sau này có dạng là tập hợp các trạng thái nếu…thì hay còn gọi là những quy luật

Tập mờ được coi là phần mở rộng của tập kinh điển Nếu X là một khônggian nền (một tập nền) và những phần tử của nó được biểu thị bằng x, thì một tập

mờ A trong X được xác định bởi một cặp các giá trị:

là, hàm liên thuộc ánh xạ mỗi một phần tử của X tới một giả trị liên thuộc trongkhoảng [0,1]

Như vậy, kiến trúc của một tập mờ phụ thuộc vào hai yếu tố: không gian nền

và hàm liên thuộc phù hợp Sự đặc biệt của hàm thuộc là nó mang tính chủ quan với

Trang 10

ý nghĩa là với cùng định nghĩa một khái niệm nhưng với mỗi người khác nhau thìhàm thuộc có thể xây được xây dựng khác nhau.

Các hàm liên thuộc được xây dựng từ những hàm cơ bản như: Kết nối hành

vi, hàm bậc nhất, hình thang, hình tam giác, hàm phân bố Gaussian, đường congxichma, đường cong đa thức bậc hai và bậc ba Hình 1.1 dưới đây mô tả một vàidạng hàm thuộc cơ bản:

0 20 40 60 80 100 0

0.2 0.4 0.6 0.8 1

Hình 1.1: Một số hàm liên thuộc cơ bản

Có rất nhiều sự lựa chọn rộng rãi để chúng ta có thể lựa chọn hàm liên thuộc

ưa thích Ngoài 11 hàm liên thuộc ra, bộ công cụ logic mờ trong MATLAB cũngcho phép chúng ta tạo hàm liên thuộc của chình mình nếu chúng ta nhận thấy cáchàm liên thuộc được định nghĩa sẵn là chưa đủ Nhưng với những hàm liên thuộcngoại lai này, không có nghĩa là chắc chắn sẽ đưa ra được một hệ thống đầu ra mờhoàn hảo

Để biểu diễn một tập mờ, tùy thuộc vào không gian nền và hàm liên thuộc làrời rạc hay liên tục mà ta có các cách biểu diễn như sau:

Trang 11

i ( ) /

( ) /

A i i

x X A X

 Kết hợp: v(P1 AND (P2 AND P3)) = v((P1 AND P2) AND P3)

Điểm giao nhau của hai tập mờ A và B được xỏc định tổng quỏt bởi mộtỏnh xạ nhị phõn T, tập hợp của hai hàm liờn thuộc sẽ là như sau:

Toỏn hạng chuẩn T là một ỏnh xạ bậc hai T(•) thỏa món:

 Đường biờn: T(0,0) = 0; T(a,1) = T(a,1) = a (1.4)

 Đơn điệu: T(a,b)  T(c,d) nếu a  c và d  d (1.5)

 Giao hoỏn: T(a,b) = T(b,a) (1.6)

 Kết hợp: T(a, T(b,c)) = T(T(a,b),c) (1.7)

Nếu X là tập hợp các đối t ợng rời rạc

Trang 12

Yêu cầu đầu tiên tác động một cách khái quát tới những tập xoắn Yêu cầuthứ hai làm giảm những giá trị liên thuộc trong A hoặc B, không thể đưa ra kết quảlàm tăng giá trị liên thuộc ở điểm giao A, B Yêu cầu thứ ba chỉ ra rằng thứ tự củatoán hạng bên trong tập mờ là không khác nhau Cuối cùng, yêu cầu thứ tư cho phépchúng ta đưa ra điểm giao nhau của bất kỳ phần tử nào của tập ở bên trong thứ tựcủa từng cặp.

Trên cơ sở đó, người ta thường sử dụng một số phép toán giao thỏa mãnchuẩn T-norm như sau:

 Min (Zadeh 1965): T(x,y) = min(x,y) (1.8)

 Chuẩn Lukasiewicz: T(x,y) = max{x + y – 1,0} (1.10)

 Min nilpotent: T ,  min ,  1

a Một hàm T-chuẩn T gọi là liên tục nếu T là hàm liên tục trên [0,1]2

b Hàm T gọi là Archimed nếu T(x,x) < x với mọi 0<x<1

c Hàm T gọi là chặt nếu T tăng chặt trên (0,1)2

Định lý 1 (Ling 1965) Một T-chuẩn T liên tục và Archimed khi và chỉ khi cómột hàm f :0 , 1 0 , , liên tục, giảm chặt với f(1)=0 sao cho:

Định lý 2 (Schweizer and Sklar 1983) T là một T-chuẩn liên tục và chặt khi

và chỉ khi tồn tại một tự đồng cấu φ của đoạn [0,1] sao cho

T(x,y)= φ-1(φ(x).φ(y)) với mọi x,y  [0,1]

Trang 13

 Đường biên: S(1,1) = 1; S(a,0) = s(0,a) = a (1.14)

 Đơn điệu: S(a,b)  S(c,d) nếu a  c và b  d (1.15)

 Chuẩn Lukasiewicz: T(x,y) = min{x + y ,1} (1.20)

 Min nilpotent: S ,  max ,  1 (1.21)

Trang 14

*Định nghĩa 2 : Cho S là T- đối chuẩn, khi ấy:

- S gọi là liên tục nếu đó là hàm liên tục trên miền xác định

- S là Archimed nếu S(x,y) > x với mỗi 0 < x < 1

- S gọi là chặt nếu S là hàm tăng tại mỗi điểm (x,y)  (0,1)2

*Định lý 2: S là T - đối chuẩn liên tục và Archimed khi và chỉ khi có mộthàm liên tục, tăng chặt g: [0,1]  [0,] với g(0)=0, sao cho:

   1     

,

Ở đây g(-1) tựa hàm ngược g-1 của hàm g cho bởi biểu thức :

g(-1)(x)=g-1(x) với x < g(1), còn g(-1)(x)=1, trong các trường hợp khác

*Định lý 3: Mỗi T- đối chuẩn S liên tục là chặt khi và chỉ khi có một tự đồngcấu φ: [0,1]  [0,1] sao cho:

 Điều kiện biên: N(0) = 1 và N(1) = 0

 Đơn điệu: N(A)  N(B) nếu A  B

Trang 15

 Sugeno:

sx

x x

N S





 1

1 )

 Yager: N w (x) = (1-x w ) 1/w (1.25)

Định lý biểu diễn: Tìm các biểu diễn khác nhau của một toán tử có thể là “thóiquen toán học” Song chúng sẽ trở nên rất có ích khi chúng ta cần tìm những lớp mớitrong vùng đang làm việc nhưng có thêm những tính chất mong muốn nào đó

*Định nghĩa 3: Hàm φ: [a,b] gọi là một tự động cấu (automorphism) củađoạn [a,b] nếu nó là hàm liên tục, tăng chặt và φ(a)=a, φ(b)=b

*Định lý 4: (Ovchinnikov,Rouben,1991), Hàm N: [0,1] [0,1] là hàm phủđịnh mạnh khi có một tự đồng cấu φ của đoạn [0,1] sao cho:

    1   

1

*Định lý 5: (Fodor 1993) Hàm n: [0,1]  [0,1] là hàm phủ định chặt khi vàchỉ khi có hai phép tự đồng cấu ψ,φ sao cho n(x)=ψ(1-φ(x))

f thành một ánh xạ giữa các tập mờ Đặc biệt hơn, giả sử f là một hàm số từ khônggian X vào không gian Y và A là một tập mờ trên X được định nghĩa bởi:

A= µ A (x 1 )/ x 1 + µ A (x 2 )/ x 2 + … + µ A (x n )/ x n

Nguyên lý này suy rộng phát biểu rằng ảnh của tập mờ A dưới ánh xạ f là tập

mờ B thỏa mãn như sau:

B = f(a) = µ A (x 1 )/ y 1 + µ A (x 2 )/ y 2 + … + µ A (x n )/ y n (1.26) Với y i = f(x i ), i= 1…n

Nói cách khác, tập mờ B có thể được xác định thông qua các giá trị của hàm

f tại x 1 , x 2 ,…, x n Nếu f là ánh xạ nhiều - một thì tồn tại x 1 , x 2X, x 1  x 2 mà f(x 1 ) =

Trang 16

f(x 2 )= y* , y* Y Trong trường hợp này mức độ phụ thuộc của B tại y = y* là mức

độ phụ thuộc lớn nhất của A tại x=x1 và x=x2 do vậy ta có:

)) ( ( max )

(

) (

y f x



Tổng quát hơn giả sử hàm f là một ánh xạ tử không gian n chiều X1x X



2 x … X nx và A 1 , A 2 ,… A 1 là n tập mờ trong X 1 ,X 2 ,…X n thì nguyên lý suy rộng phát biểu rằng tập mờ B qua ánh xạ f là:







o y o y

x i A i x

x x x x x B

i n

n

) ( f neu

0 ) ( f neu ) ( min max 1 -1 -) , ,

, )( , ,

, ( 1 2 1 2  

(1.28)

Trang 17

-2 0 2 -3

-2 -1 0 1 2 3

X

y = f(x)

-2 0 2 0

0.2 0.4 0.6 0.8 1

Do phu thuoc

B

Hình 1.2 : Đồ thị minh hoạ nguyên lý suy rộng mờ

Hình 1.2 minh họa nguyên lý suy rộng mờ Đồ thị dưới cùng biểu diễn tập

mờ A, đồ thị phía trên bên trái biểu thị hàm y = f(x) và đồ thị bên phải là tập mờ Btạo thành qua nguyên lý suy rộng

1.3.1.2 Quan hệ mờ

Quan hệ hai ngôi mờ là một tập mờ trong không gian X  Y ánh xạ mỗi phần

tử thuộc không gian này vào một mức độ phụ thuộc giữa 0 và 1 nó có ứng dụng rấtlớn trong điều khiển mờ và ra quyết định

Cho X và Y là hai không gian nền thì:

R={((x,y),µ B (x,y))| (x,y)  X  Y } (1.29)

là một quan hệ hai ngôi mờ trong không gian X  Y

Quan hệ hai ngôi mờ thường được mô tả dưới các dạng sau:

x gần với y (x,y là các số)

x phụ thuộc vào y (x,y là các sự kiện)

x và y giống nhau(x,y là người vật…)

Nếu x lớn thì y nhỏ

Trang 18

Cách diễn giải cuối “nếu x là A thì y là B” được lặp lại thường xuyên trong

hệ suy luận mờ Quan hệ mờ trong các không gian khác nhau có thể được kết hợpthông qua phép hợp thành Có rất nhiều phép hợp thành khác nhau được sử dụngtrong quan hệ mờ, nổi tiếng nhất là luật hợp thành max-min được phát minh bởiZadeh

Gọi R1 và R2 là hai quan hệ mờ trong không gian X  Y và X  Y , luật hợpthành Max-min của R1 và R2 là một tập mờ được xác định bởi:

R 1 º R 2 ={(x,z), max min[µ R1 (x,y), µ R2 (y,z)]| x  X, y  Y, z  Z} (1.30)

Hoặc tương đương

µ R1º R2 (x,z) = max min [µ R1 (x,y), µ R2 (y,z)] =  y R1(x,y) R2(y,z) (1.31)

Với cách hiểu rằng  và đại diện cho phép toán Max và Min Khi R1 và

R2 được biểu diễn dưới dạng ma trận, phép tính toán R1º R2 gần giống như phépnhân ma trận ngoại trừ phép x và + được thay thế bằng phép  và đó chính là lý

do để ta gọi là luật hợp thành Max-Min

Dưới đây là một số tính chất chung của quan hệ mờ hai ngôi và phép hợp thànhMax-Min, với R,S,T là các quan hệ hai ngôi trên không gian X  Y , Y  Z , Z  W :

 Kết hợp: R º (S º T) = (R º S) º T

 Phân phối với phép hợp: R º(S T) = (R ºS) (R ºT)

 Phân phối với phép giao: R º(S T) = (R ºS) (R ºT)

 Đơn điệu: S T => R º S R º T

Mặc dù luật hợp thành Max-Min được sử dụng rất rộng rãi nhưng nó không

dễ dàng và chủ động trong các quá trình kiểm tra toán học, vì vậy luật hợp thànhMax-Prod được đưa ra như là một cải tiến của luật hợp thành Max-Min:

R1oR2( x , z )  maxyminR1( x , y ) R2( y , z ) (1.32)

Trang 19

1.3.2 Luật mờ

1.3.2.1 Biến ngôn ngữ

Một biến ngôn ngữ được đặc trưng bởi tập 5 yếu tố (x,T(x),X,G,M) trong đó

x là tên của biến; T(x) là tập hợp các thuật ngữ của x, nó là các giá trị ngôn ngữ haythuật ngữ ngôn ngữ; X là không gian nền; G là luật cú pháp tạo ra các thuật ngữtrong T(x); và M là luật ngữ nghĩa liên kết mỗi giá trị ngôn ngữ A với nghĩa M(A)của nó, M(A) xác định một tập mờ trên X

Ta xét một ví dụ: Nếu tuổi là một biến ngôn ngữ thì tập hợp các thuật ngữT(tuổi) có thể là:

T(tuổi)={trẻ, không trẻ, rất trẻ, không quá trẻ trung niên, không phải trungniên… già, không già, già hơn, không quá già, không quá già và không quá trẻ…}

Hình 1.3: Hàm liên thuộc của biến ngôn ngữ T(tuổi)

Mỗi thuật ngữ trong T(tuổi) được đặc trưng bởi một tập mờ trong không giannền X=[0,100] Thông thường chúng ta dùng “tuổi trẻ” để gán giá trị “trẻ” cho biếntuổi Ngược lại khi tuổi được xem như là giá trị số chúng ta sử dụng phương trình

“tuổi=20” Luật cú pháp nói lên cách mà giá trị ngôn ngữ trong tập thuật ngữT(tuổi) được gán Luật ngữ nghĩa xác định hàm thuộc của mỗi giá trị ngôn ngữtrong tập thuật ngữ Từ ví dụ trên ta thấy, tập các thuật ngữ bao gồm một vài thuậtngữ chính (trẻ, trung niên, già) được biến đổi bới các phép phủ định (không), cáctrạng từ (rất, hơn, khá ) và các liên từ ( và, hoặc)

Trang 20

1.3.2.2 Cấu trúc luật

Một luật nếu-thì mờ (còn gọi là luật mờ, phép kéo theo mờ, hoặc câu điềukiện mờ) thường có dạng:

IF <X là A> THEN <Y là B>

Trong đó A,B là các giá trị ngôn ngữ được xác định bởi các tập mờ trongkhông gian nền X và Y Thông thường “x là A” được gọi là tiên đề hay giả thuyết,còn “y là B” được gọi là kết quả hay kết luận Các ví dụ của luật nếu-thì mờ rộngkhắp trong các diễn giải ngôn ngữ hàng ngày như:

Nếu áp suất cao thì thể tích nhỏ

Nếu đường trơn thì việc lái xe rất nguy hiểm

Nếu quả cà chua màu đỏ thì nó chín

Luật nếu-thì mờ thường được viết tắt dưới dạng A =>B miêu tả quan hệ giữahai biến x và y, điều này cho thấy rằng luật nếu-thì mờ xác định một quan hệ haingôi R trên không gian tích XxY

Nói chung có hai cách diễn dịch luật mờ A =>B Nếu ta diễn dịch

R = A  B =  A B (1.34)

R = A  B =  A (AB) (1.35)

R = A  B = ( A   B) B (1.36)

 r (x,y) = sup{c|  A (x)*c   B (y) and 0  c  1) } (1.37)

Mặc dù 4 công thức trên có hình thức khác nhau nhưng chúng đều trở về

dạng các định quen thuộc R = A  B =  A B khi A và B là hai giá trị logic.

Trang 21

Dựa trên hai cách diễn dịch và các phép toán T-chuẩn và S chuẩn, một số phươngpháp hiệu quả được thành lập để tính toán quan hệ mờ R = A  B Tất cả cácphương pháp này đề sử dụng phép kéo theo.

Phép kéo theo (Implication) là một hàm số I:[0,1]2 [0,1] thỏa mãn các điềukiện sau:

 Nếu x  z thì I(x,y) I(z,y) với mọi y [0,1]

 Nếu y  u thì I(x,y)  I(x,u) với mọi x [0,1]

 Dạng kéo theo thứ nhất: IS1(x,y) = S(n(x),y) (1.38)

 Dạng kéo theo thứ hai: IS2 = S(T(x,y),n(x)) (1.39)

Có thể minh họa luật modus ponens :

Giả thiết 1 (sự kiện): x là A

Giả thiết 2 (luật): Nếu x là A thì y là B

Suy diễn (kết luận): y là B

Tuy nhiên, trong suy diễn của con người, luật modus ponens được sử dụngtheo cách thức xấp xỉ điều này được minh họa như sau :

Giả thiết 1 (sự kiện): x là A’

Giả thiết 2 (luật): Nếu x là A thì y là B

Trang 22

Suy diễn (kết luận): y là B’

Trong đó A’ gần với A và B’ gần với B Khi A, B, A’, B’ là các tập mờ trêncác không gian nền tương ứng thì thuật toán trên được gọi là suy luận xấp xỉ haysuy diễn mờ Sử dụng luật hợp thành mờ đã nêu ở trên ta có thể thành lập thuật toánsuy diễn mờ như sau:

Gọi A, A’ và B là các tập mờ trên không gian X, X và Y Giả thiết phép kéotheo mờ A B được diễn giải như một quan hệ mờ trên không gian XxY thì tập mờ

B suy ra từ “ x là A” và luật mờ “nếu x là A thì y là B” được xác định bởi:

  max min  ,  ,     , 

hay tương đương:

Các trường hợp có thể có của phép suy diễn mờ bao gồm:

Trang 23

1.4.3.1 Suy diễn với một luật với một tiên đề

Hình 1.4: Mô hình suy luận mờ với một luật-một tiên đề

Đây là trường hợp đơn giản nhất như đã được minh họa ở trên Biến đổi ta có:

1.4.3.2 Suy luận một luật với nhiều tiên đề

Một luật nếu … thì mờ với hai tiên đề thường được viết dưới dạng: “nếu x là

A và y là B thì z là C” và được minh họa như sau :

Giả thiết 1 (sự kiện): x là A’ và y là B’

Giả thiết 2 (luật): Nếu x là A và y là B thì z là C

Suy diễn (kết luận): z là C’

Luật mờ trong giả thiết 2 có thể đưa về dạng : AxB  C từ đó ta tính được:

C’ = (A’xB’) º R = A’ º(AxB C) = [A’ º(A C)] [B’ º(B C)] (1.43)

)]

( ) ( ) ( [ )]

( ) ( [ ) (

2 1

,

' '

'

z w

w z y

y x

x

z y

x y

x z

C C

B B

y A

A x

C B

A B

A y C

Trang 24

Hình 1.5: Mô hình suy luận mờ một luật-nhiều tiền đề

Ta lại có:

) ( )

(

) ( ) ( ) ( )

( ) ( )

(

) ( ' )

( '

' '

, '

y y

z y

x y

x z

C B o B C

A o A

C B

A B

A y x C

1.4.3.3 Nhiều luật mờ với nhiều tiên đề.

Sự suy diễn của luật mờ phức hợp được tiến hành như hợp của các quan hệ

mờ tương ứng với luật mờ Do vậy ta có:

Giả thiết 1 ( Sự kiện ): x là A’ và y là B’

Giả thiết 2 ( Luật ): nếu x là A1 và y là B1 thì z là C1

Giả thiết 3 ( Luật ): nếu x là A2 và y là B2 thì z là C2

Suy diễn ( kết luận ): z là C’

Chúng ta có thể sử dụng suy diễn mờ được trình bày trong hình vẽ 1.7 dướiđây như một thuật toán suy luận để tìm được kết quả của tập mờ đầu ra C’

Hình 1.6 : Mô hình suy luận mờ hai luật hai tiên đề

C’ 2

Trang 25

Để xác định thuật toán suy diễn mờ, gọi R1 A1xB1  C1và R2 A2xB2  C2

Do phép hợp thành Max-Min º có tính chất phân phối với phép  nên:

C’ = (A’x B’) º (R 1R 2 ) = [ (A’xB’) º R 1(A’xB’) º R 2 ] = C 1 ’ C 2 ’ (1.46)

Với C1’, C2’ là tập mờ được suy diễn từ luật 1 và 2 Hình vẽ 2.7 cho thấy vềmặt hình học thuật toán suy diễn mờ với luật phức hợp và nhiều tiền đề

1.4 Điều khiển mờ (Fuzzy Control)

 Cấu trúc cơ bản

Cấu trúc cơ bản của một bộ điều khiển dựa vào logic mờ (fuzzy logic controlFLC) gồm bốn thành phần chính: khâu mờ hoá (a fuzzifier), một cơ sở các luật mờ(a fuzzy rule base), một môtơ suy diễn (ac inference engine) và khâu giải mờ (adefuzzifier) Nếu đầu ra sau công đoạn giải mờ không phải là một tín hiệu điềukhiển (thường gọi là tín hiệu điều chỉnh) thì chúng ta có môt hệ quyết định dựa trên

Cơ sởluật mờ

Mờ hóa Suy diễnMô tơ Giải mờ tượngĐối

Trang 26

thông ngầm, quản lý nhóm các thang máy (Fujitec, 1988), Điều khiển việc hoà Clotrong các nhà máy lọc nước, điều khiển hệ thống máy bơm làm sạch nước(Yagishita, 1985), điều khiển hệ thống năng lượng và điều khiển phản ứng hạt nhân,(Bernart, 1988, Kinoshita), v.v cho tới giám sát các sự cố trên đường cao tốc(Hsiao, 1993), các thiết bị phần cứng mờ (Fuzzy Hardware Devices, Togai vàWatanabe, 1986, nhóm cộng tác với giáo sư Yamakawa, 1986, 1987, 1988 )

Trong số những ứng dụng thực sự thành công trong thực tiễn còn phải nhắcđến bộ FLC dùng trong quản lý sân bay (Clymer,1992) các hệ thống điều khiểnđường sắt và hệ thống cần cẩu Container (Yasunobu và Miyamoto,1985) một ứngdụng rất hay của điều khiển mờ là hệ điều khiển “The Camera Tracking ControlSystems” của Nasa 1992,…

Chúng ta cũng không thể không nhắc tới các máy móc được dùng trong giađình dùng FLC đang bán trên thị trường thế giới: Máy điều hoà nhiệt độ -Mishubitshi, máy giặt Hitachi, các Video Camera của Sanyo, T4i Camera Cannon-Máy hút bụi lò sấy của Microware Ovent- Toshiba…

 Các hệ chuyên gia mờ (Fuzzy Expert Systems)

Các hệ chuyên gia (Expert System) là một nhánh của bộ môn Trí tuệ nhântạo (Artifical Intelligence) sử dụng các trí thức chuyên biệt để giải quyết bài toán ởgiai đoạn dùng các chuyên gia- con người Chúng phát triển vào những năm 1970

và được ứng dụng trong khá nhiều lĩnh vực Ngày nay đối với hệ chuyên gia thì

thực chất hiểu là các hệ thống trong đó có sử dụng Công nghệ hệ chuyên gia (Expert System Techology) bao gồm các ngôn ngữ hệ chuyên gia chuyên dụng, các

chương trình và cả các phần cứng được thiết kế nhằm vận hành và phát triển hệchuyên gia

Hiện nay trong các sách báo người ta thường dùng từ đồng nghĩa là “Hệ chuyên gia trên cơ sở tri thức” (Knowledge- Based Expert System) Sau đây là cấu

trúc cơ bản của hệ chuyên gia:

Trang 27

Hình 1.8: Cấu trúc cơ bản của hệ chuyên gia

Lý thuyết mờ và logic mờ có nhiều ưu điểm trong biểu diễn tri thức của cácchuyên gia Cho nên việc đưa các luật mờ và đặc biệt là biến ngôn ngữ và hàmthuộc đã xuất hiện khá sớm Các hệ chuyên gia trình bày dưới đây đã sử dụng cácluật mờ (fuzzy rules)

CADIAG-2, Adlassnig et al.,1985 Y (internal medicine)

EMERGE, Hudson, Cohen, 1988 Phân tích đau ngực

ESP, Zlmmermann, 1989 Kế hoạch mức chiến lược

FAULT, Whalen et al., 1987 Kế toán

OPAL, Bensana et al., 1988 Lập lịch công tác

Thực tiễn đã dẫn tới cần phối hợp tốt hơn hai loại công nghệ này, đó là nhucầu về nghiên cứu các hệ chuyên gia mờ (fuzzy expert systems) Những nghiên cứusau đây là ví dụ:

- FESS- một hệ chuyên gia mờ tái sử dụng, Hall và Kandell, 1993

- Hệ chuyên gia mờ có mục đích tổng quát, Schneider và Kandel, 1994

- Những khung cho hệ chuyên gia mờ, Umano, Hatono và Tamura (fuzzyexpert systems shells), 1994

- Công trình của Whalen và Schott, 1992 Tạo ra mạng suy diễn ngôn ngữ

mờ ( Fuzzy linguistic interence network generator)

Chúng ta không khó khăn khi chỉ ra các ứng dụng thực tiễn của hệ chuyêngia mờ Sau đây là một vài ví dụ:

Người

dùng

Giao diệnĐối thoạiĐiều chỉnh tri thức

Cơ sở tri thức

Mô tơ suy diễn

Trang 28

- Von Altrorck và Krause đã phát triển hệ chuyên gia mờ giành cho côngnghiệp ôtô của MecrCedes-Benz của Cộng hoà liên bang Đức,1994

- Hệ Emerge của Hudsson và Cohen 1992 là hệ chuyên gia y học trên cơ sởcác luật mờ trợ giúp cho phòng cấp cứu và đưa ra lời chỉ dẫn về kiểm tracác hiện tượng đau

- Hệ EAR của López de Mántaras et al, dành cho việc chuẩn đoán y học,còn hệ FLING của Whalen và Schott năm 1992 thì trợ giúp cho việc nắmbắt và phân tích tri thức

- Về các hệ mờ EDFRAME/CADIAG- IV, 1996, Fuzzy KBWean, 1998 vàFuzzy-ARDS 1999 đang sử dụng tại Viên cộng hoà Áo

1.5 Nhận dạng mờ (Fuzzy Pattern Recornition)

1.5.1 Bài toán nhận dạng

Nhiều thông tin hằng ngày chúng ta cần thu nhận và xử lý nhiều khi có hìnhdạng phức tạp Bộ môn nhận dạng cung cấp cho chúng ta một số phương pháp đểphát hiện những cấu trúc chính và một số nét cơ bản của hình dạng đó Cách tiếpcận chính với các bài toán nhận dạng là: Phân lớp tuyến tính, tiếp cận thống kê,

lý thuyết mờ, các perceptrons, phân lớp cơ sở tri thức dựa vào kỹ thuật của trí tuệnhân tạo

Nghĩ tới việc tiếp cận lý thuyết mờ là hoàn toàn tự nhiên vì hình dạng quansát được, các thông tin nhận được thường rất mờ Một số kết quả đã được công bố(ví dụ: Bezdek năm 1981, Pedrrycz năm 1990 hay là Bezdek và Pal năm 1992), và

đã ứng dụng thành công trong xử lý ảnh (nhận dạng chữ viết tay), nhận dạng tiếng

nói, robot thông minh, nhận dạng các đối tượng hình học…

Trang 29

Hình 1.9: Quá trình nhận dạng

Bây giờ ta nói thêm về một số khái niệm :

- Dữ liệu (data) thu được từ quá trình vật lý hoặc là các hiện tượng Dữ liệu(theo nghĩa rộng) có thể ở dạng định tính định lượng, dạng số, hình, hay một đoạnvăn, ngôn ngữ hay tổ hợp các dạng trên

- Không gian các dáng (Pattern Space) còn được gọi là cấu trúc (Structure)

đó là tập các dáng vẻ, kiểu dáng, trong đó thông tin được tổ chức sao cho chúng cóthể góp phần phát hiện mối liên hệ giữa các biến Nói chung số chiều của khônggian các dáng cần ít hơn số chiều của không gian dữ liệu

- Không gian các đặc tả (Feature Space) là không gian nằm giữa khônggian dữ liệu và không gian phân lớp Nói chung số chiều của không gian đặc tả phải

ít hơn nhiều số chiều không gian dữ liệu Vấn đề khó khăn là chọn những đặc tả nàocho đủ phản ánh những nét quan trọng nhất của đối tượng Không gian phân lớp dĩnhiên phải chứa được các lớp mà người nghiên cứu muốn phân Tuy nhiên thực chất

có bao nhiêu lớp phân biệt thì nhiều khi ngay từ đầu cũng khó xác định

Một nhận xét cũng nên để ý là tính mờ không chỉ trong không gian dữ liệu

mà còn nằm trong không gian các đặc tả và trong các thuật toán phân lớp

1.5.2 Phân nhóm và vai trò trong thực tế

Hiện nay các chuyên gia đang nghiên cứu về nhận dạng mờ có thể chia theo

4 nhóm đề tài chính:

- Nhận dạng tĩnh các đối tượng 3 chiều, có mầu

Dữ liệu Biến đổi Thu gọn số chiều Thuật toán quyết định Kết quả

Không gian pattern

Không gian đặc tả Không gian phân lớp

Trang 30

- Nhận dạng động các đối tượng 3 chiều có mầu

- Nhận dạng theo công nghệ hiển thị (Visual Ricogition) các đối tượng 3chiều có màu

- Nhận dạng động các biểu hiện của con người(Human Expressions)

Ai cũng hiểu được tầm quan trọng của các vấn đề nhận dạng các đối tượngđộng 3 chiều trong quốc phòng an ninh, ngành viễn thám Nhưng ngay đối vớingành dân sự độ quan trọng của đề tài này cũng được phản ảnh qua bảng tổng kếtsau cuộc thăm dò ý kiến của hơn 200 chuyên gia hang đầu về công nghệ mờ đượctiến hành (1989) bởi 2 giáo sư A Ishakawwa và T.L Willson (Các con số ghi trongbảng tính theo % của các ý kiến )

Cao Trung Bình Thấp

1 Nhận dạng tĩnh dùng công nghệ mờ

- Các hệ robot sản xuất dùng công nghệ hiển thị

-Các hệ theo dõi tự động dùng công nghệ hiển thị

- Các hệ vận tải robot dùng công nghệ hiển thị

2.Nhận dạng động dùng công nghệ mờ

-Các hệ robot sản xuất dùng công nghệ hiển thị

-Các hệ theo dõi tự động dùng công nghệ hiển thị

84.080.842.9

81.878.3

16.019.247.6

9.113.0

009.5

9.18.7

Chương 2

LÝ THUYẾT NHẬN DẠNG ẢNH

Trong chương 2, luận văn đề cập tới những vấn đề sau: Các khái niệm cơ bảnbao gồm: Khái niệm ảnh số, Phân loại ảnh số, Khái niệm mức xám đồ Lý thuyếtnhận dạng ảnh gồm: Lý thuyết xử lý ảnh 2D, Nâng cao chất lượng ảnh, Phân loạiảnh và tìm biên ảnh, Lý thuyết nhận dạng ảnh Trong chương này, luận văn đã thamkhao một số tài liệu [1] và [9]

Trang 31

2.1 Các khái niệm cơ bản

2.1.1 Khái niệm ảnh số

Ảnh trong thực tế là một ảnh liên tục về không gian và giá trị cường độ sáng

Để có thể xử lý ảnh bằng máy tính người ta cần thiết phải số hoá ảnh Trong quátrình số hoá, ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấymẫu (rời rạc hoá về không gian) và lượng hoá thành phần giá trị mà về nguyên tắcbằng mắt thường không phân biệt được hai điểm gần nhau Một ảnh sẽ là một tậphợp các phần tử ảnh (Picture Element) hay còn gọi là Pixel

Như vậy, ảnh số là một tập hợp các điểm ảnh Khi được số hoá, nó thườngđược biểu diễn bởi một mảng hai chiều I(n,p) với n là số dòng và p là số cột Ta nóiảnh gồm n x p Pixels Người ta thường ký hiệu I(x,y) để chỉ một pixel I chính là giátrị cường độ ánh sáng của điểm ảnh tại Pixel đó Thường giá trị n chọn bằng p vàbằng 256 Ảnh có thể được biểu diễn với các độ phân giải khác nhau Một pixel cóthể được lưu trữ trên 1, 4, 8 hay 24 bit tuỳ thuộc vào cường độ sáng cần phân biệtcủa ảnh và số lượng thành phần mầu cơ bản chứa trong ảnh đó

2.1.2 Phân loại ảnh số

Người ta thường chia ảnh số ra làm ba loại chính là:

 Ảnh đen trắng: mỗi phần tử ảnh nhận một trong hai giá trị tương ứng vớihai mức sáng đen và trắng (còn gọi là ảnh nhị phân)

 Ảnh xám (ảnh đa mức xám): Các phần tử ảnh chứa thông số về cường độánh đã được mã hoá thành N mức(8, 256 hoặc nhiều hơn) tương ứng với 3 bit, 8 bithoặc hơn nữa Ảnh xám có một đặc trưng là lược đồ xám (histogram) Ảnh xámđược gọi là ảnh grayscale

 Ảnh mầu: mỗi phần tử được ảnh lưu trữ trong ảnh dạng một cấu trúc có 3trường chứa thông tin về 3 màu cơ bản là đỏ, xanh, lơ (red, bue, green) Màu của

Trang 32

ảnh sẽ là giá trị tổng hợp của 3 giá trị trên Mỗi trường biểu diễn giá trị có thể dùng

8 bit, 16 bit hoặc 24 bit để mã hoá

Như vậy ảnh mầu là ảnh mang thông tin về đối tượng đầy đủ nhất so với ảnhđen trắng và ảnh xám Tuy nhiên tất cả cách biểu diễn này đều chỉ là sự mô phỏng

hệ màu trong tự nhiên Thực tế thì một ảnh màu được phân biệt qua 3 thuộc tính là

độ chói (Brighness), sắc thái màu (Hue), và độ bão hoà (Saturation) Tuy nhiên vớikhả năng cảm nhận của mắt người thì cách biểu diễn ảnh dưới dạng cấu trúc 3 màuRBG chất lượng ảnh thu được có thể chấp nhận được

( thường N= 255) Trục tung y biểu diễn số điểm ảnh trong ảnh ứng với mức xám tương

ứng trên trục hoành Như vậy ta có thể biểu diễn mức xám đồ bằng hàm y=f(x) với f(x)

là một hàm rời rạc có giá trị bằng số điểm ảnh trong ảnh có mức xám x.

tử ảnh g[m,n], như vậy ở đây ta đã áp dụng lý thuyết xử lý tín hiệu số trong mộtkhông gian hai chiều thay vì không gian một chiều như thông thường

Trang 33

Một hệ thống xử lý ảnh sẽ tiếp nhận ảnh số g[m,n] và đưa ra ảnh đã được xử

lý g’[m,n] Trên phương diện xử lý tín hiệu số thì chức năng của hệ thống này sẽđược đặc trưng bằng hàm truyền đạt H của nó Ta có thể thể hiện mối quan hệ nàynhư sau:

'[ , ] ( [ , ])

Đối với không gian 2D ta cũng có các cách tiếp cận khác nhau để khảo sát hệthống Cách thứ nhất có thể khảo sát trực tiếp trên miền không gian điểm ảnh [m,n].Những tác động của hàm truyền H sẽ được tính toán trực tiếp với các điểm ảnh Một sốcông cụ cơ bản thường được sử dụng là toán tử điểm ảnh, tích chập hay các bộ lọc

Cách tiếp cận thứ hai của hệ thống xử lý số 2D là biến đổi tín hiệu sang mộtmiền không gian khác và thực hiện khảo sát trong miền không gian đó Sau khikhảo sát xong ở miền không gian này ta lại biến đổi ngược để đưa tín hiệu về miềnkhông gian điểm ảnh Việc biến đổi tín hiệu sang xử lý ở một miền không gian khác lànhằm làm nổi bật các đặc tính của tín hiệu nhằm làm cho việc phân tích và xử lý thuậntiện hơn.Trong lý thuyết xử lý tín hiệu số ta có thể thực hiện biến đổi về miền khônggian thời gian hay miền không gian tần số nhằm thực hiện các xử lý thích hợp

Dưới đây chúng ta sẽ tiến hành xem xét một số các khái niệm cơ bản trongmột hệ thống xử lý số tín hiệu hai chiều

2.2.1.1 Khảo sát trực tiếp trong miền không gian điểm ảnh

 Đáp ứng xung:

Tương tự như trong không gian một chiều, trong không gian 2D ta cũng cókhái niệm về xung đơn vị như sau Xung đơn vị δ[m,n] được định nghĩa theo côngthức:

0 n 0, m khi 1

, n

m

(2.2)

Trang 34

Đáp ứng xung của một hệ thống chính là tín hiệu đầu ra khi tín hiệu đầu vào

là xung đơn vị Như vậy đáp ứng xung h[m,n] của hệ thống có thể định nghĩa nhưsau:

Với một dịch chuyển [α,β]] ta có đáp ứng xung h[m,n; α,β]] (được gọi là hàm

phân tán điểm- PSF: Point Spread Function) như sau:

Trang 35

Tích chập trong miền không gian tuyến tính bất biến thể hiện mối quan hệ

đầu ra, đầu vào của hệ thống và đáp ứng xung h[m,n] được cho bởi công thức sau:

7

7  , hoặc 9  9 Còn g[m,n] là ma trận điểm ảnh có kích thước M  N

Tích chập hai ma trận h[m,n] với g[m,n] cho ma trận g’[m,n] Kích thước của ma trận g’[m,n] là P  Q với P= M+K – L còn Q = N+L-1.

n

pq po

q q

f f

f

f f

f

f f

f

h h h

g g

1

11 10

0

01 00 33

32 31

23 22 21

13 12 11

p1

1

11 10

0

01 00

* h h

h h h h g

g g

số bộ lọc với mục đích tách các chi tiết của ảnh để xử lý riêng

Trong miền không gian điểm ảnh, bộ lọc thường sử dụng là một mặt nạ dichuyển khắp mặt phẳng ảnh Tâm của cửa sổ mặt nạ sẽ là điểm chịu tác động lọc,giá trị của các điểm lân cận trong mặt nạ sẽ có ảnh hưởng đến giá trị ra của điểmtrung tâm Tùy theo quan hệ giá trị ra của điểm trung tâm với giá trị của các điểmlân cận mà ta chia thành hai bộ lọc tuyến tính và phi tuyến

+ Lọc tuyến tính:

Điểm trung tâm của mặt nạ sẽ có giá trị bằng tổng số trọng số của các điểmthuộc mặt nạ ( bao gồm giá trị của chính bản thân nó) Tổng này là một tổ hợp tuyếntính của các điểm lân cận Chính vì thế mà nó được gọi là lọc tuyến tính Giả sử taxét một mặt nạ lọc 3 3

Trang 36

Bộ lọc phi tuyến cũng tương tự bộ lọc tuyến tính Tuy nhiên đối với lọc phituyến thì giá trị ra của điểm trung tâm không phải là tổ hợp tuyến tính của các điểmlân cận mà nó biểu diễn bởi một hàm phi tuyến.

 Toán tử điểm ảnh:

Phần trên đã xét một số các phép biến đổi tác động lên không gian điểmảnh nhằm biến đổi ảnh Bây giờ ta sẽ xét đến phép biến đổi tác động lên từngđiểm ảnh để biến đổi giá trị cường độ của nó Hàm biến đổi như vậy gọi là hàmtoán tử điểm ảnh

Tác động của toán tử điểm ảnh có thể được mô tả như sau: Giả sử giá trị

cường độ sáng của điểm ảnh ban đầu g[m,n] là u và giá trị cường độ sáng của điểm ảnh sau khi biến đổi g’[m,n] là v và gọi hàm toán tử điểm ảnh là T thì:

g’[m,n] = T(g[m,n]) <=> v= T(u) với 0< u,v < N- 1 (2.9)Với N là số mức cường độ sáng của ảnh trước khi biến đổi g[m,n] Hàm T cóthể là một hàm tuyến tính hoặc phi tuyến

Toán tử điểm ảnh có thể coi như hoạt động giống như một bản tra LUT (look

up table) với N cột tra Nó thực hiện phép biến đổi nhanh giữa các giá trị u và các giá trị v mà không cần phải tính toán Tương ứng với mỗi giá trị u vào sẽ có một giá trị v ra Điều này làm cho quá trình biến đổi ảnh nhanh hơn rất nhiều

Trang 37

Hình 2.3 : Toán tử điểm ảnh

2.2.1.2 Thực hiện phép biến đổi không gia.

Phép biến đổi không gian như trên đã nói là nhằm đưa tín hiệu biểu diễn sangmột vùng không gian mới mà tại không gian đó các đặc trưng của tín hiệu sẽ thểhiện rõ hơn và bởi vậy mà giúp cho quá trình xử lý thuận tiện hơn

Trong kỹ thuật xử lý ảnh, ta thường dùng phép biến đổi Fourier để đưa tínhiệu ảnh về miền không gian tần số Sau khi xử lý ta lại dùng biến đổi Fourierngược để đưa tín hiệu quay về không gian điểm ảnh Hai phép biến đổi Fourierthường được sử dụng nhiều là biến đổi Fourier rời rạc và biến đổi Fourier nhanh

2.2.2 Nâng cao chất lượng ảnh

2.2.2.1.Khôi phục ảnh

 Nhiễu và mô hình nhiễu:

Ảnh được coi là một miền đồng nhất về mức xám, tức là các điểm ảnh lâncận có sự biến đổi liên tục về mức xám.Như vậy sau quá trình số hóa thì trong mỗicửa sổ đang xét các điểm ảnh đều có giá trị gần bằng như nhau Thực tế quan sát cóđiểm ảnh có giá trị khác hơn nhiều so với các điểm ảnh khác Đó chính là nhiễu.Như vậy, nhiễu trong ảnh số được xem như là sự dịch chuyển đột ngột của tín hiệuthu nhận trên một khoảng cách nhỏ

Trang 38

yếu tố tác động tạo thành nhiễu Do đó tín hiệu g’(x,y) có thể chứa các thành phần nhiễu

trong đó Quá trình thu nhận ảnh có nhiễu có thể mô tả một cách trực quan như sau :

Hình 2.4: Mô hình nhiễu

+ Mô hình rời rạc:

Trên cơ sở mô hình nhiễu liên tục, ta có thể xây dựng một mô hình nhiễu rời

rạc tương ứng với ảnh số Khi đó g(x,y) sẽ chuyển thành ảnh rời rạc g[m,n], ảnh liên

tục g’(x,y) sẽ chuyển thành ma trận điểm ảnh g’[m,n] và nhiễu cũng phân bố rời rạc

tại các điểm ảnh η[m,n] Giả sử H là hàm tuyến tính bất biến trong phạm vi M  N (

Các tín hiệu nhiễu thường được chia thành các loại chính như sau:

Nhiễu do thiết bị thu nhận ảnh là loại nhiễu gây ra do giới hạn nhiễu xạ và

quang sai của thấu kính, nhiễu do bộ phận cảm quang, ảnh mờ nhòe do ống kính,

nhiễu do rung động trong quá trình thu nhận

Nhiễu ngẫu nhiên độc lập là các loại nhiễu gây ra do ảnh hưởng của môi

trường xung quanh, do ảnh hưởng của khí quyển

Hệ thống thu nhận ảnh HẢnh gốc

g(x,y)

Tín hiệu nhiễu η(x,y)

Tín hiệu ảnh g’(x,y)

Trang 39

Nhiễu do vật quan sát Đây là nhiễu gây ra do bề mặt của bản thân vật có độnhám gồ ghề Chính nhiễu này gây hiện tượng tán xạ của các tia đơn sắc và sinh rahiện tượng nhiễu lốm đốm.

Thường người ta xấp xỉ các loại nhiễu bằng các quá trình tuyến tính bất biến

vì có nhiều công cụ tuyến tính có thể giải quyết vấn đề khôi phục ảnh hơn là cáccông cụ phi tuyến Việc xử lý nhiễu bằng cách xấp xỉ tuyến tính cũng giúp cho côngviệc dễ dàng hơn trong trường hợp dùng cách biến đổi phi tuyến

 Các kỹ thuật lọc nhiễu

+ Lọc nhiễu tuyến tính

Trong phần này chúng ta sẽ xét hai kỹ thuật lọc tuyến tính hay sử dụng là lọcngược và lọc giả ngược

► Lọc ngược (inverse filter):

Nguyên lý của lọc ngược là sử dụng hàm ngược của đáp ứng xung h[m,n] đểkhôi phục lại một ảnh xấp xỉ ảnh nguyên gốc g[m,n] từ ảnh g’[m,n] đã biết nguyên

lý này được biểu diễn mô tả theo sơ đồ sau:

Hình 2.5: Lọc ngược khôi phục ảnh nguyên gốc.

Như vậy ảnh khôi phục g*[m,n] sẽ được tính theo công thức:

g m n,  g m n h' ,   1m n, 

Trong đó h-1[m,n ] chính là hàm của bộ lọc ngược Vì H-1(H(x)) = x nên ta cógiá trị đầu ra g*[m,n] bằng giá trị vào g[m,n] Như vậy ta đã khôi phục được ảnhg[m,n] nhờ dùng hàm ngược của đáp ứng xung h[m,n]

Nếu dùng biến đổi Fourier ta có:

Trang 40

     

 

' ,, ' ,

] , [

] , [ ] , [

'

v u H

v u N v u H

v u G v u

(2.13) Nếu H[u,v] = 0 hoặc khá nhỏ thì hệ thống khôi phục sẽ không ổn định (hàm

H T [u,v] không xác định) Đây chính là nhược điểm của phương pháp lọc ngược.

Tuy bộ lọc ngược có khả năng ngăn nhiễu do hệ thống nhận ảnh gây ra khá tốtnhưng việc thiết kế bộ lọc này lại là khá phức tạp

► Lọc giả ngược (Pseudoinverse filter):

Kỹ thuật lọc này khắc phục được nhược điểm của kỹ thuật lọc ngược là làm

cho hàm H T [u,v] luôn xác định:

1 khi H[u,v]

[ , ][ , ]

Với ε là một giá trị cho trước

Trong trường hợp ảnh nguyên gốc g[m,n] chuyển động tịnh tiến theo phương

x và y sinh ra hiện tượng nhòe ảnh thì H T [u,v] sẽ được xác định theo các thông số

chuyển động, và lọc giả ngược có khả năng khôi phục được ảnh nhòe này

+ Lọc nhiễu lốm đốm:

Ta đã biết nhiễu lốm đốm gây ra do tính chất gồ ghề của bề mặt vật thể gây

ra hiện tượng tán xạ các tia đơn sắc Phần này ta sẽ nghiên cứu một kỹ thuật lọcnhiễu lốm đốm là kỹ thuật trung bình thống kê sử dụng bộ lọc đồng cầu

Định dạng
Số trang	89
Dung lượng	1,08 MB