1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng mạng nơron mờ cho nhận dạng chữ viết tay (hạn chế)

95 31 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 95
Dung lượng 1,44 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

❖ Phần xử lý tín hiệu Video thu đ-ợc và các mạch điều khiển đồng bộ hệ thống: Với các Camera số thì phần này có chức năng chuyển đổi tín hiệu ảnh sang dạng số.. Mỗi phần tử này sẽ cảm nh

Trang 1

-

NGUYỄN PHƯƠNG HUY

ỨNG DỤNG MẠNG NƠRON MỜ CHO NHẬN DẠNG CHỮ

VIẾT TAY (HẠN CHẾ)

LUẬN VĂN THẠC SĨ KỸ THUẬT

ĐIỆN TỬ VIỄN THÔNG

Hà Nội – 2005

Trang 2

-

NGUYỄN PHƯƠNG HUY

ỨNG DỤNG MẠNG NƠRON MỜ CHO NHẬN DẠNG CHỮ

VIẾT TAY (HẠN CHẾ)

LUẬN VĂN THẠC SĨ KỸ THUẬT

ĐIỆN TỬ VIỄN THÔNG

NGƯỜI HƯỚNG DẪN KHOA HỌC:

TS LÊ BÁ DŨNG

Hà Nội - 2005

Trang 3

Hình 1.2 Mặt nạ bộ lọc tuyến tính 3x3……… 10

Hình 1.3.Toán tử điểm ảnh……….…….11

Hình 1.4 Mô hình nhiễu………12

Hình 1.5 Lọc ng-ợc khôi phục ảnh nguyên gốc………14

Hình1.6 Một số các mặt nạ không gian trung bình……… 18

Hình1.7 Mặt nạ bộ lọc thông thấp………18

Hình1.8 Cửa sổ lọc giả trung vị………20

Hình 1.9 Ph-ơng pháp l-ới………24

Hình1.10 Ph-ơng pháp cung ……….25

Hình1.11 Biểu diễn mẫu bằng tập kí hiệu……… 27

Hình 2.1 Cấu trúc cơ bản của nơron sinh học……… …28

Hình 2.2 Nơron nhân tạo ……… 31

Hình 2.3 Mô hình toán học mạng nơron nhân tạo ………33

Hình 2.4 Nơron 1 đầu vào với hàm hoạt hoá là hàm hardlimit……… 35

Hình 2.5 Một số dạng hàm hoạt hóa trong mạng nơron nhân tạo…………36

Hình2.6 Liên kết bên trên lớp cạnh tranh……….38

Hình 2.7 Kiến trúc mạng Kohonen………39

Hình 2.8 Học có giám sát……… 40

Hình 2.9 Học không có giám sát……… 41

Hình 2.10 Học tăng c-ờng……… 41

Hình 2.11.Kiến trúc mạng Perceptron……….44

Hình2.12 Biên quyết định trong không gian mẫu……… 46

Hình2.13 Không gian mẫu khả tách tuyến tính……… 48

Hình2.14 Không gian mẫu không khả tách tuyến tính……… 48 Hình2.15 Phân tách không gian mẫu với mạng Perceptron 2 nơron lớp ra…49

Trang 4

Hình 2.18 Không gian mẫu………55

Hình2.19 Phân lớp mẫu với mạng MLP 3 lớp……… 56

Hình 2.20 Quan hệ lân cận trong lớp Kohonen……… 57

Hình 2.21 Mã hoá vecto đầu vào với mạng SOFM……….59

Hình 3.1 Một số dạng hàm thuộc cơ bản……… 62

Hình 3.2 Bảng chân lý chuẩn AND, OR, NOT………63

Hình 3.3 Đồ thị minh họa nguyên lý suy rộng mờ……… 67

Hình 3.4 Hàm liên thuộc của biến ngôn ngữ T(tuổi)………69

Hình 3.5 Mô hình suy luận mờ với một luật-một tiền đề……….72

Hình 3.6 Mô hình suy luận mờ một luật-nhiều tiền đề……….73

Hình 3.7 Mô hình suy luận mờ hai luật hai tiền đề……… 74

Hình 3.8 Mô hình suy diễn mờ Mamdani………75

Hình 3.9 Ví dụ về mô hình Mamdani một đầu vào một đầu ra………77

Hình 3.10 Mô hình mờ Sugeno……… 78

Hình 3.11 Mô hình suy luận mờ Sugeno hai đầu vào một đầu ra….……… 79

Hình 3.12 Mô hình suy luận mờ Tsukamoto……… 79

Hình 3.13 Ví dụ mô hình Tsukamoto một đầu vào-một đầu ra……… 80

Hình 4.1 Mô hình Sugeno bậc nhất hai đầu vào (a) và mạng ANFIS t-ơng đ-ơng (b)……….84

Hình 4.2 Kiến trúc mạng ANFIS cho mô hình mờ Sugeno với quá trình chuẩn hoá ở lớp cuối……… 86

Hình 4.3 Mô hình suy luận mờ Tsukamoto hai đầu vào (a) và kiến trúc mạng ANFIS t-ơng đ-ơng(b)………86

Hình 4.4 Kiến trúc mạng ANFIS với mô hình mờ Sugeno hai đầu vào và không gian đầu vào t-ơng ứng với 4 miền mờ……….87

Trang 5

Hình4.6 Hàm liên thuộc của các biến đầu vào tr-ớc và sau khi luyện mạng.95

Hình4.7 Bề mặt của không gian mẫu luyện mạng và không gian tái tạo… 96

Hình4.8 Bảng chân lý của XOR……….97

Hình 4.9.Phép AND với tích bên trái và min bên phải………98

Hình 4.10.Mặt suy diễn mờ cho XOR……….99

Hình 4.11.Hai sáu chữ in đ-ợc xây dựng trong ma trận 7x5……….100

Hình 4.12.Sơ đồ suy diễn mờ……….100

Hình 4.13.Dạng hàm thuộc các tín hiệu vào……… 101

Hình 4.14.Hệ luật mờ cho nhận dạng chữ in……….102

Hình 5.1 Các công đoạn của bài toán nhận dạng ảnh……… 106

Hình 5.2 Ba mẫu chữ cần học……… 109

Hình5.3 Ký tự cần nhận dạng……… 110

Hình 5.4 Giao diện ch-ơng trình nhận dạng……….111

Trang 6

Mở đầu

Ch-ơng I Lý thuyết xử lý và nhận dạng ảnh………… 1

1.1.ảnh số và các khái niệm cơ bản……… 1

1.1.1.Khái niệm ảnh số……… 1

1.1.2.Phân loại ảnh số……… 1

1.1.3.Khái niệm mức xám đồ……… 2

1.2 Thu nhận và l-u trữ ảnh số……… 2

1.2.1.Thu nhận ảnh……… 2

1.2.1.1.Thiết bị thu nhận ảnh……… 2

1.2.1.2.Quá trình số hoá ảnh……… 4

1.2.2.L-u trữ ảnh……… ……… 5

1.3.Một số lý thuyết xử lý và nhận dạng ảnh……… ……… 5

1.3.1.Lý thuyết xử lý ảnh 2D……… ……… 5

1.3.1.1.Khảo sát trực tiếp trong miền không gian điểm ảnh……… 8

1.3.1.2.Thực hiện phép biến đổi không gian……… 11

1.3.2.Nâng cao chất l-ợng ảnh……… ……… 12

1.3.2.1.Khôi phục ảnh……… 12

1.3.2.2.Tăng c-ờng ảnh……… 16

1.3.3.Phân đoạn ảnh và tìm biên ảnh…….……… 21

1.3.3.1.Khái niệm biên ảnh và ph-ơng pháp xác định biên……… 21

1.3.3.2.Kỹ thuật phân đoạn ảnh……… 21

1.3.4.Lý thuyết nhận dạng ảnh……… ……… 22

1.3.4.1.Các khái niệm cơ bản……… 22

1.3.4.2.Ph-ơng pháp số nhận dạng ảnh……… 24

Trang 7

2.1.Các khái niệm chung về mạng nơron……… 28

2.1.1.Mạng nơron sinh học……… ……… 28

2.1.2.Mạng nơron nhân tạo……….……… 30

2.1.2.1.Nơron nhân tạo……… 30

2.1.2.2.Mạng nơron nhân tạo……… 31

2.1.2.3.Các ứng dụng của mạng nơron ……… 32

2.2.Mô hình toán học và kiến trúc mạng nơron ……… …… 33

2.2.1.Mô hình toán học của mạng nơron ……….………… 33

2.2.1.1.Mô hình toán học của một nơron nhân tạo……… 33

2.2.1.2.Cấu trúc mạng nhân tạo……… 34

2.2.1.3.Hàm truyền (Hàm hoạt hoá)……… 35

2.2.2.Kiến trúc mạng………… ……… 36

2.3.Huấn luyện mạng……… ……… 39

2.3.1.Hoạt động của mạng……… ……… 39

2.3.2.Huấn luyện mạng……… 40

2.3.2.1.Học có giám sát……… 40

2.3.2.2.Học không có giám sát……… 40

2.3.2.3.Học tăng c-ờng……… 41

2.3.3.Một số luật học… ……… 42

2.4.Mạng Perceptron……… ……… 44

2.4.1.Kiến trúc mạng……… ……… 44

2.4.2.Huấn luyện mạng……… ……… 45

2.4.3.Khả năng ứng dụng cho nhận dạng ảnh……… 49

2.5.Mạng Perceptron đa lớp……… 49

2.5.1.Kiến trúc mạng……… ……… 50

Trang 8

2.6.Mạng Kohonen (SOFM)……….……… 56

2.6.1.Kiến trúc mạng…… ……… 56

2.6.2.Huấn luyện mạng… ……… 58

2.6.3 Khả năng ứng dụng cho nhận dạng ảnh……… 59

Ch-ơng 3 logic mờ……… 61

3.1 Khái niệm chung về logic mờ……… ……… 61

3.2 Thuật toán của logic mờ……… ……… 62

3.3 Các phép toán trên tập mờ……… 63

3.3.1.Phép giao……… 63

3.3.2.Phép hợp……… 64

3.3.3.Phép phủ định……… 65

3.4.Luật mờ và suy luận mờ……… ……… 66

3.4.1.Nguyên lý suy rộng và quan hệ mờ……… ……… 66

3.4.1.1.Nguyên lý suy rộng……… 66

3.4.1.2.Quan hệ mờ……… 67

3.4.2.Luật nếu –thì mờ………… ……… 69

3.4.2.1.Biến ngôn ngữ……… 69

3.4.2.2.Luật nếu-thì mờ……… 70

3.4.3.Suy diễn mờ……… 71

3.4.3.1.Suy diễn với một luật với một tiền đề……… 72

3.4.3.2.Suy luận một luật với nhiều tiền đề……… 73

3.4.3.3.Nhiều luật mờ với nhiều tiền đề……… 74

3.5.Một số mô hình suy luận mờ……… ……… 75

3.5.1.Hệ mờ của Mamdani……… ……… 75

3.5.2.Mô hình mờ Sugeno………… ……… 77

Trang 9

ảnh

4.1.Giới thiệu chung……… ……… 82

4.2.Kiến trúc mạng……… ……… 83

4.3 Thuật toán học lai……… ……… 87

4.3.1.Ước l-ợng bình ph-ơng tối thiểu……….…… …… 88

4.3.2.Ph-ơng pháp độ dốc lớn nhất…… ……… 91

4.4.Thuật toán học lai trong mạng ANFIS ……… 93

4.5.Mạng ANFIS với ứng dụng mô hình hoá hàm phi tuyến…… … 95

4.6.Mạng ANFIS cho nhận dạng chữ in……… 97

Ch-ơng 5: Thiết kế ứng dụng……….……… 105

5.1.Đặt vấn đề……… ……… 105

5.2.Thu nhận và xử lý mẫu……….……… 106

5.2.1.Thu nhận ảnh……… ……… 106

5.2.2.Xử lý nâng cao chất l-ợng ảnh……… ……… 107

5.2.3.Nhị phân hoá ảnh……… ……… 107

5.2.4.Tách mẫu và chuẩn hoá ……… 108

5.3.Xây dựng th- viện mẫu……….……… 109

5.4.Xây dựng hệ suy luận dạng chữ viết……… 110

5.5.Xây dựng phần mềm……….……… 111

Trang 10

Trong lịch sử phát tồn tại và phát triển của mình, con ng-ời với sức sáng tạo phi th-ờng luôn cải tạo tự nhiên, phát minh ra nhiều máy móc để phục vụ cho cuộc sống ở các giai đoạn tr-ớc, việc truyền đạt cho máy luôn cần thiết phải đảm bảo tính chính xác và duy nhất trong từng tập lệnh, điều này làm cho các thao tác của máy trở nên khô cứng và tạo ra một khoảng cách rất xa giữa người và máy về “độ thông minh” trong việc giải quyết các bài toán kỹ thuật cũng nh- trong cuộc sống hàng ngày Chính vì vậy, mong muốn tạo ra một thế hệ máy móc mới có khả năng “học” và “sáng tạo” đã hình thành từ lâu và với sự trợ giúp của các ngành khoa học hiện đại việc “tự nhiên hoá” các hệ thống kỹ thuật hay còn có thể nói là “người hoá” máy móc đã và

đang đạt đ-ợc những thành tựu đáng kể

Hai lĩnh vực quan trọng phải kể đến là lý thuyết về mạng nơron và logic

mờ, chúng là chìa khoá để tạo ra các hệ thống kỹ thuật vừa đảm bảo tính xác

và nhanh chóng trong vận hành, vừa có khả năng học từ các mẫu dữ liệu thống

kê, lại có khả năng thông minh và mềm hoá trong quá trình ra quyết định Hơn nữa, việc kết hợp hai lý thuyết trên sẽ tạo ra nhiều b-ớc đột phá mới.Có thể nói rằng, mạng nơron mờ sẽ là công nghệ của t-ơng lai

Đối với các cán bộ kỹ thuật trong ngành Điện tử viễn thông, lý thuyết

về xử lý tín hiệu trong đó có tín hiệu hình ảnh là những kiến thức không thể thiếu Nhận dạng ảnh, đặc biệt là nhận dạng ký tự cũng là một mảng đề tài

đáng quan tâm Việc nhận dạng ký tự nhất là với chữ viết tay sẽ tiết kiệm rất nhiều thời gian cho viêc nhập và l-u trữ dữ liệu

ý thức đ-ợc vấn đề trên, với sự h-ớng dẫn tận tình của Giảng viên T.S

Lê Bá Dũng, tôi xin hoàn thành luận văn tốt nghiệp cao học với đề tài “ Tìm

Trang 11

Xin ch©n thµnh c¶m ¬n!

Trang 12

Một ảnh sẽ là một tập hợp các phần tử ảnh (Picture element) hay còn đ-ợc gọi

bản chứa trong ảnh đó

1.1.2.Phân loại ảnh số

Ng-ời ta th-ờng chia ảnh số ra làm ba loại chính là:

• ảnh đen trắng: Mỗi phần tử ảnh nhận một trong hai giá trị t-ơng ứng với hai mức sáng đen và trắng (còn gọi là ảnh nhị phân)

• ảnh xám (ảnh đa mức xám): Các phần tử ảnh chứa thông số vể c-ờng độ sáng đã đ-ợc mã hoá thành N mức (8, 256 hoặc nhiều hơn) t-ơng ứng với 3

Trang 13

bít, 8 bít hoặc hơn nũa ảnh xám có một đặc tr-ng là l-ợc đồ xám

(histogram) ảnh xám đ-ợc gọi là ảnh grayscale

• ảnh mầu: Mỗi phần tử ảnh đ-ợc l-u trữ trong ảnh d-ới dạng một cấu trúc

có 3 tr-ờng chứa thông tin về 3 màu cơ bản là đỏ, xanh, lơ (red, blue,

green) Màu của ảnh sẽ là tổng hợp của 3 giá trị trên Mỗi tr-ờng biểu diễn

giá trị màu có thể dùng 8 bít, 16 bít h-ợc 24 bit để mã hoá

Nh- vậy ảnh màu là ảnh mang thông tin về đối t-ợng đầy đủ nhất so với

ảnh đen trắng và ảnh xám Tuy nhiên tất cả cách biểu diễn này đều chỉ là sự mô phỏng hệ màu trong tự nhiên Thực tế thì một màu đ-ợc phân biệt qua 3

thuộc tính là độ chói (Brightness), sắc thái màu (Hue) và độ bão hoà

(Saturation) Tuy nhiên với khả năng cảm nhận của mắt ng-ời thì cách biểu

diễn ảnh d-ới dạng cấu trúc 3 màu RGB chất l-ợng ảnh thu đ-ợc là có thể chấp nhận đ-ợc

1.1.3.Khái niệm mức xám đồ

ở trên đã chỉ ra rằng đối với cách biểu diễn ảnh d-ới dạng ảnh xám thì ta

có một đặc tr-ng là l-ợc đồ xám

L-ợc đồ xám là một hàm đ-a ra tần suất xuất hiện của mỗi mức xám

(gray level) của các điểm ảnh L-ợc đồ này đ-ợc biểu diễn trong một hệ toạ

độ vuông góc x,y Trục hoành x của hệ toạ độ biểu diễn số mức xám từ 0 đến

N (th-ờng N=255) Trục tung y biểu diễn số điểm ảnh trong ảnh ứng với mức xám t-ơng ứng trên trục hoành Nh- vậy ta có thể biểu diễn mức xám đồ bằng

hàm y=f(x), với f(x) là một hàm rời rạc có giá trị bằng số điểm ảnh trong ảnh

có mức xám x

1.2 Thu nhận và l-u trữ ảnh số

1.2.1.Thu nhận ảnh

1.2.1.1.Thiết bị thu nhận ảnh:

Trang 14

Hai thiết bị thu nhận ảnh th-ờng đ-ợc sử dụng là Camera và Scanner Chúng có nhiều loại khác nhau nh-ng cấu tạo và nguyên lý hoạt động của chúng thì nhìn chung là giống nhau

❖ Phần quang học: Bao gồm các thấu kính hội tụ các kính lọc và cơ cấu

điều chỉnh khả năng thu nhận sáng và hội tụ

❖ Phần cảm nhận ánh sáng: Là một màn nhận ảnh với các phần tử cảm nhận ánh sáng Đây là bộ phận quan trọng nhất của Camera với chức năng chuyển đổi quang -điện và tạo dòng tín hiệu Video

❖ Phần xử lý tín hiệu Video thu đ-ợc và các mạch điều khiển đồng bộ hệ thống: Với các Camera số thì phần này có chức năng chuyển đổi tín hiệu ảnh sang dạng số Hiện nay trong xử lý ảnh số, ng-ời ta th-ờng dùng Camera số CCD (Charge couple Device) Tên của Camera đ-ợc gọi theo tên của bộ phận cảm nhận ảnh (Image Sensors) CCD là một thiết bị mạch tổ hợp của các phần

tử tổ hợp ánh sáng (photosensitive elements) Mỗi phần tử này sẽ cảm nhận c-ờng độ ánh sáng t-ơng ứng với một điểm ảnh( tức là một phần tử ảnh) và biến đổi chúng thành tín hiệu điện.Các phần tử này đ-ợc bố trí thành mảng hai chiều Nh- vậy mật độ của các phần tử này sẽ quyết định chất l-ợng thu nhận

ảnh Ví dụ trong một Camera CCD độ phân giải cao th-ờng là 486 dòng với

768 phần tử cảm quang đ-ợc bố trí trong mắt l-ới kích th-ớc 10.5x11m

 Scanner:

Là một thiết bị thu nhận ảnh chuyển đổi hình ảnh thu đ-ợc thành ảnh đồ

hoạ dạng l-ới (raster graphic image) Các loại đối t-ợng dùng scanner th-ờng

Trang 15

là các văn bản cá bức ảnh hoặc tranh vẽ Ngoài ra thì ngày nay còn có cả các scanner quét vân tay

Cấu trúc của Scanner có thể kể đến 2 thành phần chính là:

❖ Các phần tử cảm nhận ánh sáng: Đ-ợc bố trí trên một băng với mật độ cao Chúng thực hiện nhiệm vụ quét từng dòng ảnh và chuyển các giá trị nhận

đ-ợcthành các tín hiệu điện Băng này cũng đ-ợc gọi là CCD

❖ Phần cơ khí: Nhằm tạo ra chuyển động tịnh tiến của băng quét dọc theo vật cần xử lý Phần này cũng bao gồm các cơ cấu điều chỉnh hoạt động của thiết bị

Khi bắt đầu thực hiện thu nhận ảnh thì đối t-ợng sẽ đ-ợc chiếu sáng bởi một nguồn sáng trong máy quét và bộ phận điều khiển sẽ thực hiện một chuyển động tịnh tiến để d-a băng quét CCD quét qua đối t-ợng một l-ợt và thu nhận ánh sáng phản xạ từ đối t-ợng Máy Scanner đ-ợc nối với máy tính

và các tín hiệu thu nhận đ-ợc sẽ đ-ợc gửi về xử lý tại máy tính Tại đây các mạch điều khiển xử lý và các phần mềm sẽ thực hiện chuyển đổi, xắp xếp các tín hiệu thu đ-ợc thành các ảnh đồ họa

Độ phân giải của Scanner một chiều phụ thuộc vào độ tích hợp (mật độ ) của các phần tử CCD trên băng quét, chiều kia phụ thuộc vào b-ớc chuyển

động của hệ thông cơ học điều khiển băng quét Th-ờng thì độ phân giải của Scanner vào khoảng 600x600 dpi Một số máy quét có độ phân giải cao có thể

Trang 16

Chùm sáng phản xạ từ vật thể là liên tục về không gian và c-ờng độ sáng nh-ng ở các thiết bị thu nhận ảnh hiện nay thì bộ phận thu nhận tín hiệu ( màn nhận ảnh CCD ) là một mạng l-ới rời rạc với mỗi ô mắt l-ới là một phần tử cảm nhận c-ờng độ ánh sáng Nh- vậy chính bộ phận thu nhận tín hiệu đã thực hiện lấy mẫu tín hiệu c-ờng độ sáng theo hai chiều Mỗi phần tử CCD sẽ thực hiện lấy mẫu tại một điểm Nh- vậy, quá trình lấy mẫu đã thực hiện chuyển đổi một hàm liên tục trong không gian 2D (đối với Scanner) hoặc 3D (đối với Camera) về một hàm rời rạc cho bởi ma trận hai chiều

Để đảm bảo có thể tái tạo lại ảnh gốc từ sau ảnh lấy mẫu mà không mất thông tin (ảnh không bị sai khác) thì quá trình lấy mẫu cần tuân theo định lý lấy mẫu

 L-ợng tử hóa ( Quantization):

Sau khi lấy mẫu, giá trị c-ờng độ sáng của các phần tử của ma trận ảnh vẫn là các giá trị liên tục Tuy nhiên trong kỹ thuật số thì ta cần những giá trị rời rạc L-ợng tử hoá sẽ thực hiện quá trình rời rạc hoá giá trị c-ờng độ của các điểm ảnh

Một ph-ơng pháp l-ợng tử th-ờng hay đ-ợc sử dụng là l-ợng tử hoá đều Tức là chia khoảng cách giữa mức c-ờng độ lớn nhất và nhỏ nhất cuả ma trận lấy mẫu thành các khoảng đều nhau Khoảng cách giữa các b-ớc kề nhau là

g đ-ợc gọi là khoảng cách l-ợng tử Các giá trị liên tục sẽ đ-ợc quy tròn về các giá tị l-ợng tử Việc quy tròn này sẽ gây ra sai số Sai số này phụ thuộc vào số mức l-ợng tử Nếu số mức l-ợng tử càng lớn thì sai số này càng nhỏ và ng-ợc lại Tuy nhiên nếu số mức l-ợng tử lớn thì sẽ kéo theo chi phí tốn kém khi ta mã hoá

Trang 17

có thể mã hoá đ-ợc 2 giá trị mức l-ợng tử Giả sử dùng N bit để mã hoá các

l-ợng tử càng lớn thì càng yêu cầu dùng nhiều bit hơn để mã hoá Đây là cái giá phải trả cho việc giảm sai số l-ợng tử hoá.Ví dụ dối với ảnh đen trắng ta chỉ cần dùng 1 bit để biểu diễn giá trị mức c-ờng độ sáng còn đối với ảnh đa mức xám 256 mức thì cần 8 bit để biểu diễn giá trị c-ờng độ sáng của mỗi phần tử ảnh Đối với ảnh màu thì số bít cần để biểu diễn phần tử ảnh có thể là

8, 16, 24, 32 tuỳ theo số l-ợng màu cần biểu diễn

1.2.2.L-u trữ ảnh

ảnh số đ-ợc l-u trữ d-ới các file với các kiểu định dạng khác nhau nh-

định dạng bitmap, định dạng TIFF, định dạng GIF, định dạng PCX, định dạng JPG ở đây ta không xét cụ thể các định dạng này mà chỉ xét một cách sơ bộ nhất về cấu trúc file l-u giữ thông tin ảnh Một file định dạng chuẩn th-ờng có

3 phần là:

 Phần Header: Chứa các thông tin xác định kiểu định dạng, các thông số mô tả chung về ảnh nh- chiều rộng, chiều cao của ảnh, độ phân giải, số màu

 Phần bảng màu: Xác định các giá trị màu chuẩn cho các điểm ảnh

 Phần dữ liệu ảnh: L-u giữ các thông tin về các điểm ảnh Th-ờng đ-ợc l-u giữ theo thứ tự t-ơng ứng với điểm ảnh Việc nén dữ liệu ảnh nếu có

Trang 18

ảnh thu đ-ợc sau quá trình thu nhận ảnh th-ờng là ảnh 2D, tức là một

ma trận hai chiều l-u giữ các giá trị c-ờng độ sáng của các điểm ảnh liên tục.Nh- vậy có thể coi tín hiệu ảnh thu đ-ợc là một tín hiệu hai chiều liên tục

trong không gian đ-ợc biểu diễn bằng hàm hai biến g(x,y) Quá trình số hoá

biến đổi ảnh liên tục sang dạng rời rạc.Lúc này tín hiệu ảnh số 2D đ-ợc biểu

diễn bởi một ma trận các phần tử ảnh g[m,n], nh- vậy ở đây ta đã áp dụng lý

thuyết xử lý số tín hiệu trong một không gian hai chiều thay vì không gian một chiều nh- thông th-ờng

Một hệ thống xử lý ảnh sẽ tiếp nhận ảnh số g[m,n] và đ-a ra ảnh đã đ-ợc

xử lý g’[m,n] Trên ph-ơng diện xử lý tín hiệu số thì chức năng của hệ thống

này sẽ đ-ợc đặc tr-ng bằng hàm truyền đạt H của nó Ta có thể thể hiện mối quan hệ này nh- sau:

g’[m,n]=H(g[m,n])

(1.1)

Đối với không gian 2D ta cũng có các cách tiếp cận khác nhau để khảo sát hệ thống Cách thứ nhất là có thể thực hiện khảo sát trực tiếp trong miền

không gian điểm ảnh [m,n] Những tác động của hàm truyền H sẽ đ-ợc tính

toán trực tiếp với các điểm ảnh Một số công cụ cơ bản th-ờng đ-ợc sử dụng

là toán tử điểm ảnh, tích chập hay các bộ lọc

Cách tiếp cận thứ hai của hệ thống xử lý số 2D là biến đổi tín hiệu sang một miền không gian khác và thực hiện khảo sát trong miền không gian đó Sau khi khảo sát xong ở miền không gian này ta lại biến đổi ng-ợc để đ-a tín hiệu quay về miền không gian điểm ảnh Việc biến đổi tín hiệu sang xử lý ở một miền không gian khác là nhằm làm nổi bật các đặc tính của tín hiệu nhằm làm cho việc phân tích và xử lý thuận tiện hơn Trong lý thuyết xử lý tín hiệu

số ta có thể thực hiện biến đổi về miền không gian thời gian hay miền không gian tần số nhằm thực hiện các xử lý thích hợp

Trang 19

D-ới đây chúng ta sẽ tiến hành xem xét một số các khái niệm cơ bản trong một hệ thống xử lý số tín hiệu hai chiều

1.3.1.1.Khảo sát trực tiếp trong miền không gian điểm ảnh:

➢ Đáp ứng xung:

T-ơng tự nh- trong không gian một chiều, trong không gian 2D ta cũng

0 , 0 khi 1 ] , [

n m

n m n

m

Đáp ứng xung của một hệ thống chính là tín hiệu đầu ra khi tín hiệu đầu

vào là xung đơn vị Nh- vậy đáp ứng xung h[m,n] của hệ thống có thể định

nghĩa nh- sau:

h[m,n]=H([m,n]) (1.3)

hàm phân tán điểm-PSP: Point Spread Function) nh- sau:

tuyến tính là sự tác động liên tục lên ảnh đầu vào g[m,n] bằng đáp ứng xung

h[m,n] để thu đ-ợc ảnh đầu ra g’[m,n] Ng-ời ta gọi h[m,n] là toán tử tuyến

tính, h[m,n] thoả mãn tính chất xếp chồng và dịch chuyển

Trang 20

➢ Tích chập:

Tích chập trong miền không gian tuyến tính bất biến thể hiện mối quan

hệ giữa đầu ra, đầu vào của hệ thống và đáp ứng xung h[m,n] đ-ợc cho theo công thức sau:

m g n m h n m

Đáp ứng xung h[m,n] th-ờng có dạng ma trận kích th-ớc KxL bằng 3x3, 5x5, 7x7, hoặc 9x9 Còn g[m,n] là ma trận điểm ảnh có kích th-ớc MxN Tích chập hai ma trận h[m,n] với g[m,n] cho ma trận g’[m,n] Kích th-ớc của ma trận g’[m,n] là PxQ với P=M+K-L còn Q=N+L-1

n n

pq po

q q

f f

f

f f

f

f f

f

h h h

g g

g g

g g

1

11 10

0

01 00

33 32 31

23 22 21

13 12 11

p1

1

11 10

0

01 00

* h h

h h

h h

g

g

g

(1.7)

] , [

* ] , [ ] , [

sử dụng một số bộ lọc với mục đích tách các chi tiết của ảnh để xử lý riêng

Trang 21

Hình 1.2: Mặt nạ bộ lọc tuyến tính 3x3

Trong miền không gian điểm ảnh, bộ lọc th-ờng sử dụng là một mặt nạ

di chuyển khắp mặt phẳng ảnh Tâm của cửa sổ mặt nạ sẽ là điểm chịu tác

động lọc Giá trị của các điểm lân cận trong mặt nạ sẽ có ảnh h-ởng đến giá trị ra của điểm trung tâm Tuỳ theo quan hệ giá trị ra của điểm trung tâm với giá trị của các điểm lân cận mà ta chia thành hai bộ lọc tuyến tính và phi tuyến

• Lọc tuyến tính:

Điểm trung tâm của mặt nạ sẽ có giá trị bằng tổng số trọng số của các

điểm thuộc mặt nạ (bao gồm giá trị của chính bản thân nó) Tổng này là một

tổ hợp tuyến tính của các điểm lân cận.Chính vì thế mà nó đ-ợc gọi là lọc tuyến tính Giả sử ta xét một mặt nạ lọc 3x3

lọc

• Lọc phi tuyến:

Bộ lọc phi tuyến cũng t-ơng tự bộ lọc tuyến tính Tuy nhiên đối với lọc phi tuyến thì giá trị ra của điểm trung tâm không phải là tổ hợp tuyến tính của các điểm lân cận mà nó biểu diễn bởi một hàm phi tuyến

➢ Toán tử điểm ảnh:

Trang 22

Phần trên đã xét một số các phép biến đổi tác động lên không gian điểm

ảnh nhằm biến đổi ảnh Bây giờ ta sẽ xét đến phép biến đổi tác động lên từng

điểm ảnh để biến đổi giá trị c-ờng độ của nó Hàm biến đổi nh- vậy gọi là hàm toán tử điểm ảnh

Tác động của toán tử điểm ảnh có thể đ-ợc mô tả nh- sau Giả sử giá trị

c-ờng độ sáng của điểm ảnh ban đầu g[m,n] là u và giá trị c-ờng độ sáng của

điểm ảnh sau khi biến đổi g’[m,n] là v và gọi hàm toán tử điểm ảnh là T thì:

g’[m,n]=T(g[m,n]) v=T(u) với 0 < u,v <N-1

(1.9)

Với N là số mức c-ờng độ sáng của ảnh tr-ớc khi biến đổi g[m,n] Hàm

T có thể là một hàm tuyến tính hoặc hàm phi tuyến

Toán tử điểm ảnh có thể coi nh- hoạt động giống nh- một bảng tra LUT

(Look Up Table) với N cột tra Nó thực hiện phép biến đổi nhanh giữa các giá

trị u và các giá trị v mà không cần phải tính toán T-ơng ứng với mỗi giá trị u vào sẽ có một giá trị v ra Điều này làm cho quá trình biến đổi ảnh nhanh hơn rất nhiều

1.3.1.2.Thực hiện phép biến đổi không gian:

Phép biến đổi không gian nh- trên đã nói là nhằm đ-a tín hiệu biểu diễn sang một vùng không gian mới mà tại không gian đó các đặc tr-ng của tín hiệu sẽ thể hiện rõ hơn và bởi vậy mà giúp cho quá trình xử lý thuận tiện hơn

Trang 23

ảnh gốc

g(x,y)

Tín hiệu nhiễu (x,y)

Hệ thống thu nhận ảnh H

Tín hiệu ảnh g’(x,y)

Hình1.4: Mô hình nhiễu

Trong kỹ thuật xử lý ảnh, ta th-ờng dùng phép biến đổi Fourier để đ-a tín hiệu ảnh về miền không gian tần số Sau khi xử lý ta lại dùng biến đổi Fourier ng-ợc để đ-a tín hiệu quay về không gian điểm ảnh Hai phép biến

đổi Fourier th-ờng đ-ợc sử dụng nhiều là biến đổi Fourier rời rạc (DFT) và biến đổi Fourier nhanh (FFT)

ảnh khác Đó chính là nhiễu Nh- vậy, nhiễu trong ảnh số đ-ợc xem nh- là sự dịch chuyển đột ngột của tín hiệu thu nhận trên một khoảng cách nhỏ

• Mô hình liên tục

Hệ thống thu nhận ảnh chuyển các hình ảnh thực của môi tr-ờng xung

quanh g(x,y) thành dạng tín hiệu ảnh g’(x,y) Tuy nhiên trong quá trình chuyển đổi có nhiều yếu tố tác động tạo thành nhiễu Do đó tín hiệu g’(x,y)

có thể chứa các thành phần nhiễu trong đó Quá trình thu nhận ảnh có nhiễu

có thể mô tả một cách trực quan nh- sau:

• Mô hình rời rạc:

Trang 24

Trên cơ sở mô hình nhiễu liên tục, ta có thể xây dựng một mô hình nhiễu

rời rạc t-ơng ứng với ảnh số Khi đó g(x,y) sẽ chuyển thành ảnh rời rạc g[m,n],

ảnh liên tục g’(x,y) sẽ chuyển thành ma trận điểm ảnh g’[m,n] và nhiễu

Các tín hiệu nhiễu th-ờng đ-ợc chia thành các loại chính nh- sau:

Nhiễu do thiết bị thu nhận ảnh là loại nhiễu gây ra do giới hạn nhiễu xạ

và quang sai của thấu kính, nhiễu do bộ phận cảm quang, ảnh mờ nhòe do ống kính, nhiễu do rung động thiết bị trong quá trình thu nhận

Nhiễu nhẫu nhiên độc lập là các loại nhiễu gây ra do ảnh h-ởng của môi tr-ờng xung quanh, do ảnh h-ởng của khí quyển

Nhiễu do vật quan sát Đây là nhiễu gây ra do bề mặt của bản thân vật có

độ nhám gồ ghề Chính nhiễu này gây hiện t-ợng tán xạ của các tia đơn sắc và sinh ra hiện t-ợng nhiễu lốm đốm

Th-ờng ng-ời ta xấp xỉ các loại nhiễu bằng các quá trình tuyến tính bất biến vì có nhiều công cụ tuyến tính có thể giải quyết vấn đề khôi phục ảnh hơn là các công cụ phi tuyến Vịêc xử lý nhiễu bằng cách xấp xỉ tuyến tính cũng giúp cho công việc dễ dàng hơn trong tr-ờng hợp dùng cách biến đổi phi tuyến

Trang 25

Nguyên lý của lọc ng-ợc là sử dụng hàm ng-ợc của đáp ứng xung h[m,n]

để khôi phục lại một ảnh xấp xỉ ảnh nguyên gốc g[m,n] từ ảnh g’[m,n] đã

biết nguyên lý này đ-ợc biễu diễn mô tả theo sơ đồ sau:

Nh- vậy ảnh khôi phục g*[m,n] sẽ đ-ợc tính theo công thức:

g*[m,n]= g’[m,n]* h -1 [m,n]

(1.11)

có giá trị đầu ra g*[m,n] cũng bằng giá trị vào g[m,n] Nh- vậy ta đã khôi

phục đ-ợc ảnh g[m,n] nhờ dùng hàm ng-ợc của đáp ứng xung h[m,n]

Nếu dùng biến đổi Fourier ta có:

] , [

] , [ ] , [ ].

, [ ] , [

' '

v u H

v u G v u H v u G v u

Qua đó ta thấy, đáp ứng tần số của bộ lọc ng-ợc là nghịch đảo của đáp

ứng tần số của hệ thu nhận ảnh Nếu đánh giá đ-ợc mức nhiễu ta có thể xấp xỉ

gần hơn với ảnh nguyên gốc:

] , [

] , [ ] , [

] , [ ] , [

'

v u H

v u N v u H

v u G v u

Nếu H[u,v]=0 hoặc khá nhỏ thì hệ thống khôi phục sẽ không ổn định (

ng-ợc Tuy bộ lọc ng-ợc có khả năng ngăn nhiễu do hệ thống nhận ảnh gây ra

khá tốt nh-ng việc thiết kế bộ lọc này lại là khá phức tạp

❖ Lọc giả ng-ợc (Pseudoinverse filter) :

Kỹ thuật lọc này khắc phục đ-ợc nh-ợc điểm của kỹ thuật lọc ng-ợc là

Hình 1.5 :Lọc ng-ợc khôi phục ảnh nguyên gốc

Trang 26

H[u, khi ] , [

1 ]

,

Trong tr-ờng hợp ảnh nguyên gốc g[m,n] chuyển động tịnh tiến theo

các thông số chuyển động, và lọc giả ng-ợc có khả năng khôi phục đ-ợc ảnh

nhoè này

• Lọc nhiễu lốm đốm:

Ta đã biết nhiễu lốm đốm gây ra do tính chất gồ ghề của bề mặt vật thể

gây ra hiện t-ợng tán xạ các tia đơn sắc Phần này ta sẽ nghiên cứu một kỹ

thuật lọc nhiễu lốm đốm là kỹ thuật trung bình thống kê sử dụng bộ lọc đồng

cầu

Kỹ thuật lọc nhiễu trung bình thống kê tiến hành thống kê các c-ờng độ

sáng của đối t-ợng ảnh bị nhiễu lốm đốm bằng N lần thu nhận độc lập và lấy

trung bình các c-ờng độ đó

Ta giả thiết hệ thống chỉ có nhiễu lốm đốm và nhiễu này có thể coi nh-

tổng vô số hạn các pha độc lập và đồng nhất Ta có thể biễu biễn nhiễu lốm

đốm nh- sau:

a[m,n]=a R [m,n] +ja l [m,n]

độ s :

S[m,n]= a[m,n] =a R 2 + a l 2 (1.15) Nh- vậy ảnh thu đ-ợc trong lần nhận thứ i ( 1, ,N ) sẽ là:

g i ’ [m,n]=g[m,n].s i [m,n]

(1.16)

Trang 27

Trị trung bình thống kê của N lần thu nhận ảnh sẽ là:

i

N n m g n m g N n m g

' '

lốm đốm

• Lọc đồng cầu:

Nếu lấy logarit 2 vế của biểu thức 1.17 ta thu đ-ợc:

log g N ’ [m,n]= log g[m,n]+ log s N [m,n] (1.18)

Ta có mô hình quan sát có nhiễu lốm đốm nh- sau:

w N [m,n]= z[m,n] +N [m,n] (1.19)

Nh- vậy là có thể tách nhiễu lốm đốm và khôi phục lại ảnh ban đầu

N [m,n] có thể mô tả gắn với nhiễu ngẫu nhiên Gauusian với mật độ phổ đ-ợc

1 N 6 / )

, (

2 2 2 1

Tăng c-ờng độ t-ơng phản là việc biến đổi biên độ ảnh đầu vào bằng hàm tuyến tính hay phi tuyến để thu đ-ợc biên độ ra lớn hơn Trong quá trình

Trang 28

thu nhận mẫu phục vụ cho bài toán nhận dạng chữ ta cần thực hiện việc tăng c-ờng độ t-ơng phản của ảnh để làm nổi bật phần chữ trên nền phần giấy Một ví dụ về tăng độ t-ơng phản bằng hàm tuyến tính cho bởi công thức sau:

b u a v a) - (u

a u 0 )

( )

f v u T

một số tr-ờng hợp cụ thể nh- sau:

= = = 1 ảnh giữ nguyên , , <1 Giãn độ t-ơng phản , , <1 co độ t-ơng phản

Kết quả sau khi việc thực hiện việc co giãn độ t-ơng phản thì mức xám

đồ sẽ biến đổi

• Tách nhiễu và phân ng-ỡng

Trong tr-ờng hợp ta biết khoảng biên độ tín hiệu ảnh vào (dải mức xám),

ta có thể dùng kỹ thuật tách nhiễu để lấy riêng khoảng biên độ này ra nh- vậy

sẽ loại bỏ đ-ợc các phần nhiễu ở ngoài khoảng đó

Ví dụ, giả thiết ta biết khoảng biên độ ảnh vào nằm trong khoảng [a,b]

thì việc tách nhiễu có thể coi là tr-ờng hợp tăng độ t-ơng phản với = và 0

N

-b u a

u

a u 0 0

Trang 29

Tr-ờng hợp đặc biệt, nếu a = b= threshold thì đầu ra sẽ chỉ còn hai mức xám là 0 và N-1 Tr-ờng hợp này gọi là sự phân ng-ỡng Phân ng-ỡng dùng

để chuyển đổi ảnh xám sang ảnh nhị phân Kỹ thuật này dùng trong bài toán nhận dạng chữ viết nhằm mục đích tạo mẫu ảnh nhị phân

➢ Sử dụng toán tử không gian:

Ta có thể sử dụng một số bộ lọc không gian (toán tử không gian) để loại

bỏ một số loại nhiễu trong ảnh

• Lọc nhiễu không gian trung bình

Trong kỹ thuật này ta sử dụng một cửa sổ lọc rà khắp mặt phẳng ảnh Cửa sổ này th-ờng có kích th-ớc 3x3 Giá trị mức xám của điểm ảnh trung tâm bộ lọc sẽ đ-ợc thay thể bằng trung bình có trọng số gia trị các mức xám của các điểm thuộc cửa sổ bộ lọc Có thể mô tả ph-ơng trình biến đổi của bộ lọc nh- sau:

1

] 2 ,

2 [

].

, [ ]

, [

k k

l n k m u l k h n

m

Với h[k,l] là các giá trị trọng số và cũng là giá trị của mặt nạ bộ lọc,

u[m,n] là các giá trị của mặt phẳng ảnh đầu vào Với việc lấy trung bình nh-

vậy, nhiễu sẽ giảm đi đáng kể

Th-ờng dùng các mặt nạ không gian trung bình nh- sau:

9

1

9 1

Trang 30

2 ) 2 (

1 ] , [



n m n

m

Các hệ số của mặt nạ Gaussian đ-ợc tính theo công thức trên và th-ờng

đ-ợc giới hạn trong 4 hoặc 6

• Lọc trung vị:

Kỹ thuật này cũng sử dụng một mặt nạ 3x3, 5x5 hoặc 7x7 di chuyển khắp mặt phẳng ảnh Điển trung tâm của mặt nạ bộ lọc là điểm ảnh đang đ-ợc xét Giá trị của điểm ảnh này sẽ đ-ợc gán bằng trung vị (median) của chuỗi số

là tập các giá trị điểm ảnh thuộc cửa sổ đang xét

Thuật toán tính toán cho bộ lọc trung vị có thể đ-ợc mô tả nh- sau:

✓ Sắp xếp các phần tử ảnh thuộc cửa sổ theo thứ tự tăng dần hoặc giảm dần

trị trung tâm cửa sổ bằng giá trị này Các phần tử khác giữ nguyên giá trị

Có thể sử dụng cửa sổ lọc trung vị dạng chữ thập để thay cho mặt nạ hình vuông Mặt nạ loại này thì kết quả thu đ-ợc sẽ khả quan hơn dùng mặt nạ hình vuông

• Lọc giả trung vị:

Lọc trung vị yêu cầu phải thực hiện một l-ợng phép tính rất lớn nên tốc

độ của bộ lọc sẽ chậm Để khắc phục đ-ợc nh-ợc điểm này ta có thể dùng lọc giả trung vị Để minh hoạ cho kỹ thuật lọc giả trung vị, ta xét ví dụ với một cửa sổ chữ thập nh- ở hình d-ới:

Trang 31

), , , max(

), , , min[max(

)]

, , min(

), , , min(

), , max[min(

2

1

5 4 3 4

3 2 3

2 1

5 4 3 4

3 2 3

2 1 3

p p p p

p p p

p p

p p p p

p p p

p p

➢ Vấn đề tăng c-ờng ảnh nhị phân:

Nh- trên đã nói, trong bài toán nhận dạng chữ thì ng-ời ta th-ờng chuyển

đổi ảnh mẫu về ảnh nhị phân tr-ớc khi xử lý mẫu Đối với ảnh nhị phân, để cho việc trích chọn đặc tr-ng mẫu đ-ợc chính xác ta cũng áp dụng một số kỹ thuật tăng c-ờng ảnh nhị phân Đó là kỹ thuật lọc điểm ảnh cô lập và kỹ thuật làm trơn biên

• Lọc điểm cô lập:

Điểm cô lập là điểm mà 8 lân cận của nó đều có giá trị khác với giá trị của nó Tức là nếu nó là điểm đen thì các điểm lân cận của nó đều là điểm trắng và ng-ợc lại Những điểm nh- vậy th-ờng mang ý nghĩa nh- là các điểm nhiễu và cần loại bỏ Ta phân biệt hai tr-ờng hợp lọc điểm cô lập nh- sau:

❖ Lọc điểm trắng cô lập:

Dùng một cửa sổ 3x3 di chuyển khắp mặt phẳng ảnh Khi điểm trung tâm

là điểm trắng thì ta sẽ tính tổng tất cả những điểm thuộc cửa sổ Nếu tổng này bằng 1 chứng tỏ điểm trung tâm là điểm cô lập trắng Ta gán giá trị điểm trung tâm về 0 (đen) Nếu tổng lớn hơn 1 thì chứng tỏ ít nhắt một điểm lân cận

điểm trung tâm là trắng và ta không thay đổi gì cả

❖ Lọc điểm đen cô lập:

Tr-ờng hợp này cũng t-ơng tự nh- tr-ờng hợp trên Khi điểm trung tâm

là đen ta sẽ tính tổng các phần tử của mặt nạ Nếu tổng của các phần tử là 8 thì chứng tỏ điểm trung tâm là một điểm đen cô lập và ta sẽ đặt nó về giá trị 1 (trắng) Nếu giá trị này nhỏ hơn 8 thì chứng tỏ có ít nhất một điểm lân cận

điểm trung tâm là điểm đen và ta không thay đổi gì cả

Trang 32

Kỹ thuật này để làm trơn biên các đối t-ợng trong ảnh Các phần tử thuộc

cửa sổ n x n sẽ đ-ợc tính tổng với nhau Nếu tổng này lớn hơn một giá trị

ng-ỡng thì điểm trung tâm sẽ là điểm đen còn ng-ợc lại thì nó là điểm trắng

1.3.3.Phân đoạn ảnh và tìm biên ảnh

1.3.3.1.Khái niệm biên ảnh và ph-ơng pháp xác định biên

Biên là nơi phân tách hai vùng có mức xám t-ơng đối khác nhau Một

điểm ảnh có thể đ-ợc coi là biên nếu ở đó có sự thay đổi đột ngột về giá trị mức xám Tập hợp tất cả các điẻm biên tạo thành biên hay đ-ờng bao của ảnh

(Boundary) Ví dụ trong ảnh nhị phân, một điểm đen có thể đ-ợc coi là biên

nếu xung quanh nó có ít nhất một điểm trắng và ng-ợc lại

Có hai ph-ơng pháp tìm biên ảnh là ph-ơng pháp trực tiếp và ph-ơng pháp gián tiếp

• Ph-ơng pháp trực tiếp:

Ph-ơng pháp này nhằm làm nổi biên dựa vào sự biến thiên về giá trị c-ờng độ sáng của ảnh Kỹ thuật chủ yếu dùng phát hiện biên ở đây là kỹ thuật đạo hàm Nếu lấy đạo hàm bậc nhất ta có ph-ơng pháp gradient, nếu lấy

đạo hàm bậc hai ta có kỹ thuật Laplace

• Ph-ơng pháp gián tiếp:

Nếu bằng cách nào đó ta phân đ-ợc ảnh thành các vùng thì đ-ờng phân ranh giới giữa các vùng đó chính là biên Việc phân vùng th-ờng dựa vào kết cấu bề mặt của ảnh

Nh- vậy kỹ thuật dò biên và kỹ thuật phân vùng ảnh là hai bài toán đối ngẫu củ nhau Thực vậy, việc dò biên để thực hiện phân lớp ảnh và một khi đã phân lớp xong thì có nghĩa là ta cũng đã phân vùng đ-ợc ảnh Ng-ợc lại, khi

đã phân vùng ảnh đã phân thành các phân lớp thì ranh giới giữa chúng chính là biên

1.3.3.2.Kỹ thuật phân đoạn ảnh

Để nhận dạng đ-ợc các đối t-ợng trong ảnh thì ta cần tách riêng từng đối t-ợng ra để nhận dạng Ví dụ đối với nhận dạng chữ viết thì ta cần tách các

Trang 33

vùng có cùng tính chất nào đó dựa theo biên hay các vùng liên thông Tiêu chuẩn xác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng độ nhám

Nếu phân vùng dựa theo các miền liên thông ta gọi là kỹ thuật phân vùng dựa theo miền đồng nhất Nếu ta phân vùng dựa vào biên thì ta gọi là kỹ thuật phân vùng theo biên.Ngoài ra còn có các kỹ thuật phân vùng theo kết cấu hay phân vùng theo biên độ

1.3.4.Lý thuyết nhận dạng ảnh

1.3.4.1.Các khái niệm cơ bản

➢ Mẫu và mô tả mẫu

Ng-ời ta mô tả tất cả những kích th-ớc vật lý có thể thu nhận đ-ợc trong

thế giới xung quanh ta bằng các mẫu (pattern) Nhận dạng mẫu chính là việc

xử lý mô tả và diễn dịch các mẫu Các mẫu th-ờng đ-ợc mô tả bằng một tập

đặc tr-ng của đối t-ợng đang xét thì ta có thể biểu diên một mẫu là

p p p n

sử dụng hai ph-ơng pháp sau:

sẽ thuộc về hai lớp phân biệt

➢ Lớp mẫu và phân lớp mẫu:

Trang 34

phân lớp (classification) của bài toán nhận dạng mà các mẫu đ-ợc nhóm lại thành từng lớp mẫu (class) riêng biệt Các lớp mẫu phân biệt chứa các mẫu

đồng dạng với nhau Mỗi lớp mẫu sẽ đ-ợc gán một cái tên Nh- vậy khi mẫu của một đối t-ợng đ-ợc quá trình phân lớp gán vào một lớp mẫu nào đó thì cũng có nghĩa là đối t-ợng đó đã đ-ợc nhận dạng

➢ Không gian mẫu và không gian diễn dịch

Các đặc tr-ng cơ bản của các đối t-ợng tạo nên các thành phần biểu diễn mẫu Tập hợp các mẫu của các đối t-ợng sẽ tạo nên không gian mẫu Còn tập các tên gọi của các đối t-ợng tạo thành không gian diễn dịch Nói một cách khác tập các mẫu chuẩn sẽ tạo thành không gian diễn dịch Nh- vậy quá trình

để “huấn luyện” cho hệ thống nhận dạng trước khi đưa vào sử dụng Quá trình huấn luyện sẽ phân lớp tập mẫu tạo thành các lớp mẫu chuẩn Việc nhận dạng các mẫu thực tế chính là việc so sánh các mẫu đó với các mẫu chuẩn để

đ-a các mẫu này vào các lớp mẫu chuẩn đã tạo ra

Ng-ợc lại, khi tập không gian diễn dịch là ch-a xác định cụ thể thì ta có nhận dạng không đ-ợc giám sát Loại nhận dạng này yêu cầu phải tự định ra

đ-ợc các lớp mẫu và xác định đ-ợc các đặc tr-ng của từng lớp mẫu Bản chất của quá trình phân lớp ở đây là phân chia các mẫu theo những qui tắc định

Trang 35

organization)

1.3.4.2.Ph-ơng pháp số nhận dạng ảnh

Ph-ơng pháp số nhận dạng ảnh biểu diễn các mẫu d-ới dạng các giá trị

số và quá trình phân lớp tập mẫu chính là quá trình thực hiện việc sắp xếp các giá trị số này thành từng lớp riêng biệt

➢ Trích chọn đặc tr-ng mẫu:

Nhiệm vụ đặt ra cho b-ớc trích chọn đặc tr-ng mẫu là phải rút ra đ-ợc các đặc tr-ng riêng của từng đối t-ợng ảnh trong tập mẫu Sau đó mỗi đặc tr-ng của đối t-ợng đ-ợc mô tả bằng các giá trị số và các giá trị này sẽ tạo thành vectơ mô tả tập mẫu Để tìm ra các đặc tr-ng riêng của đối t-ợng ta có thể xét đến các đặc tr-ng đơn giản nh- đặc tr-ng về hình học, topo Ngoài ra

có thể dùng một số ph-ơng pháp đặc biệt để có thể phát hiện đ-ợc các đặc tr-ng phức tạp hơn của đối t-ợng đặc biệt là với các tr-ờng hợp mẫu có hình dạng phức tạp Có thể kể ra đây một số ph-ơng pháp nh- sau:

• Ph-ơng pháp l-ới:

Một l-ới vuông chuẩn đ-ợc chùm lên đối t-ợng Số l-ợng điểm cắt của mỗi nan l-ới ngang và dọc với đối t-ợng sẽ là đặc tr-ng của đối t-ợng Đồng thời số l-ợng mắt l-ới vuông có trùm lên đối t-ợng theo từng chiều dọc và ngang cũng đ-ợc sử dụng làm đặc tr-ng của đối t-ợng Mỗi đ-ờng dọc và ngang của l-ới sẽ đ-ợc gán cho một trọng số nhất định Với ph-ơng pháp này, việc tiêu chuẩn hoá đối t-ợng rất quan trọng vì nó sẽ giúp cho việc xác định kích th-ớc của l-ới chuẩn đ-ợc sử dụng

Trang 36

Có thể loại bỏ ảnh h-ởng của h-ớng đối t-ợng trong ph-ơng pháp l-ới bằng cách thay thế l-ới vuông chuẩn bằng l-ới hình vành khăn, tức là các nan l-ới là các đ-ờng tròn đồng tâm (có thể coi đây là ph-ơng pháp l-ới dùng trong hệ toạ độ cực) Điểm tâm của các vòng tròn này chính là trọng tâm của

đối t-ợng và ta cần xác định điểm này tr-ớc tiên Từ điểm này ta sẽ kẻ các

đ-ờng bán kính chuẩn chia đều các đ-ờng tròn thành các cung Số l-ợng các

điểm cắt với đối t-ợng dọc theo một bán kính sẽ là đặc tr-ng của đối t-ợng T-ơng tự nh- ph-ơng pháp l-ới, số l-ợng cung của mỗi vòng tròn phủ lên đối t-ợng xét cũng coi nh- là đặc tr-ng của đối t-ợng Mỗi bán kính và vành khăn

sẽ đ-ợc gán một trọng số

➢ Kỹ thuật phân lớp mẫu:

Các đặc tr-ng của đối t-ợng đ-ợc biểu diễn bởi các giá trị số và các giá trị này đ-ợc xem là các thành phần của các vectơ biểu diễn mẫu.Khi ta đ-a vào hệ thống một tập các mẫu chuẩn thì quá trình trích chọn đặc tr-ng sẽ tạo nên các vectơ mẫu chuẩn phân bố trong không gian mẫu và với mỗi vectơ mẫu chuẩn này thì ta biết đ-ợc ánh xạ từ nó sang không gian diễn dịch, tức là biết tên của nó Nh- vậy các vectơ mẫu chuẩn đã đ-ợc phân thành các lớp mà mỗi lớp ứng với một tên Những lớp này ta gọi là lớp chuẩn

Khi đ-a các mẫu ch-a xác định (mẫu cần nhận dạng) vào hệ thống thì việc nhận dạng mẫu chính là tìm ra một quy tắc để sắp xếp vectơ biểu diễn mẫu đó vào một lớp chuẩn nào đó Để có thể đạt đ-ợc mục đích này thì tr-ớc hết cần phải tạo đ-ợc một sự phân định rõ ràng giữa các lớp chuẩn, tức là

3 điểm cắt

4 dải quạt phủ (vành khăn 2)

Hình1.10 : Ph-ơng pháp cung

Trang 37

không gian mẫu không phải lúc nào cũng đạt đ-ợc đến sự phân tách hoàn toàn sau quá trình phân lớp mẫu Nguyên nhân là do chúng ta ch-a chọn đ-ợc bộ

đặc tr-ng tối -u để phân tách đối t-ợng Bởi vậy mà có thể xảy ra tr-ờng hợp một vectơ mẫu nào đó sẽ rơi vào vùng chồng lên nhau của 2 hay nhiều lớp mẫu chuẩn Trong tr-ờng hợp này ta phải chọn lớp có xác suất cao hơn hoặc phải đánh dấu để chi ra rằng mẫu đó không phân lớp đ-ợc Quá trình xây dựng các lớp mẫu chuẩn nh- thế gọi là quá trình học Việc xây dựng một th- viện mẫu chuẩn có vai trò rất quan trọng cho khả năng nhận dạng của hệ thống

1.3.4.3.Ph-ơng pháp nhận dạng theo cấu trúc:

Bên cạnh ph-ơng pháp số, ph-ơng pháp cấu trúc là một trong những ph-ơng pháp truyền thống để nhận dạng mẫu Trong khi ở ph-ơng pháp số, ng-ời ta thực hiện việc gán ý nghĩa cho các mẫu riêng biệt thì trong ph-ơng pháp cấu trúc lại xem xét các đối t-ợng nh- là các cấu trúc phức tạp tổ hợp từ các dạng nguyên thuỷ đơn giản vf mối quan hệ giữa các dạng nguyên thuỷ này Việc mô hình hoá các quá trình nh- vậy là t-ơng đối khó khăn, bởi vậy

mà ph-ơng pháp nhận dạng theo cấu trúc vẫn ch-a đ-ợc dùng phổ biến nh- ph-ơng pháp số

➢ Xây dựng bộ ký hiệu

Tr-ớc hết, ta cần xây dựng một tập các dạng nguyên thuỷ và các mẫu sẽ

đ-ợc biểu diễn bởi các dạng nguyên thuỷ này và mối quan hệ giữa các dạng nguyên thuỷ đó Các dạng nguyên thuỷ phải đ-ợc chọn sao cho khi dạng nguyên thuỷ này đ-ợc sắp xếp theo một trật tự nào đó đối với nhau thì ta sẽ tạo ra đ-ợc tất cả các dạng cấu trúc từ đơn giản đến phức tạp của tập các đối t-ợng cần nhận dạng Các dạng nguyên thuỷ có thể đ-ợc chọn ví dụ nh- đoạn thẳng, cung, điểm ngoặt, điểm kết thúc

Để biểu diễn dạng nguyên thủy vùa quan hệ giữa chúng một cách thuận tiện ta dùng một bộ ký hiệu Mỗi ký hiệu sẽ đ-ợc đặc tr-ng cho một dạng nguyên thuỷ và một mẫu nh- vậy sẽ đ-ợc biểu diễn bằng một chuỗi ký hiệu

Trang 38

mẫu sẽ đơn giản hơn rất nhiều

➢ Kỹ thuật phân lớp mẫu:

Quá trình phân lớp mẫu là quá trình đánh giá sự t-ơng tự của các mẫu với các nguyên mẫu đại diện cho từng phân lớp tức là ta phải so sánh chuỗi kí hiệu của mẫu với chuỗi kí hiệu của các nguyên mẫu đại diện Căn cứ vào kết quả thu đ-ợc ta sẽ phana chia đ-ợc các mẫu mới vào từng phân lớp chuẩn Phần trên ta đã xét một số lý thuyết cơ bản về xử lý và nhận dạng ảnh số,

ở phần tiếp theo ta sẽ nghiên cứu lý thuyết về mạng nơron nhân tạo và các ứng dụng của nó

Hình1 11: Biểu diễn mẫu bằng tập kí hiệu

Trang 39

Ch-ơng 2 Mạng nơrơn với bài toán nhận dạng

2.1.Các khái niệm chung về mạng nơron

2.1.1.Mạng nơron sinh học

hay còn gọi là nơron Chúng có cấu trúc và chức năng t-ơng đối đồng nhất Các nhà nghiên cứu sinh học về bộ não con ng-ời đã đ-a ra kết luận rằng các nơron là đơn vị đảm nhiệm những chức năng nhất định trong hệ thần kinh bao gồm não, tuỷ sống và các dây thần kinh Hình 2.1 chỉ ra cấu tạo của hệ thống

tế bào sinh học này

Cấu trúc của một nơron đ-ợc chia thành 3 phần chính: Phần thân, hệ thống dây thần kinh tiếp nhận và sợi trục thần kinh ra Hệ thống dây thần kinh

tiếp nhận (denrite) tạo thành một mạng l-ới dày đặc xung quanh thân tế bào

Thân nơron thần kinh

Khớp (Synapse)

Sợi trục

(axon)

Nhân (body)

Nhánh

hình cây

(dendrites)

Trang 40

( chiếm diện tích khoảng 0,25 mm2).Chúng là đầu vào để đ-a các tín hiệu điện

đến thân tế bào.Thân tế bào có nhân bên trong (gọi là body hay soma) sẽ tổng

hợp các tín hiệu vào và sẽ làm thay đổi điện thế của bản thân nó Khi điện thế

này v-ợt quá một mức ng-ỡng (firing threshold) thì nhân tế bào sẽ kích thích

đ-a một xung điện ra sợi trục thần kinh ra Sợi trục thần kinh ra (gọi là trục

axon) có thể dài một vài centimet đến vài met Nó có thể phân thành nhiều

nhánh theo dạng hình cây để nối với các dây thần kinh vào của nhiều tế bào khác hoặc có thể nối trực tiếp đến thân tế bào của duy nhất một nơron Việc

kết nối này đ-ợc thực hiện nhờ các kớp nối (gọi là synapse) Số khớp nối của

mỗi nơron có thể lên tới hàng trăm ngàn Ng-ời ta tính toán rằng mạng l-ới dây thần kinh ra và các khớp nối chiếm khoảng 90% diện tích bề mặt nơron Các tín hiệu điện truyền trên các sợi dây thần kinh cũng nh- hiệu điện thế của nhân tế bào là kết quả của quá trình phản ứng và giải phóng của các chất hữu cơ đ-ợc đ-a ra từ các khớp nối dẫn đến dây thần kinh vào Xung điện đ-a ra sợi trục axon sẽ truyền tới các khớp nối với đầu vào của các nơron khác và sẽ kích thích giải phóng các chất truyền điện Tuỳ theo việc tăng hay giảm hiệu

điện thế mà ng-ời ta chia thành hai loại khớp nối là khớp nối kích thích và khớp nối ức chế C-ờng độ tín hiệu mà một tế bào thần kinh nhận đ-ợc phụ thuộc chủ yếu vào mức độ liên kết của khớp nối Các nghiên cứu chỉ ra rằng

quá trình học (learning) của mạng nơron sinh học chính là việc thay đổi mức

độ liên kết của các khớp nối Chính cấu trúc mạng nơron và mức độ liên kết của các khớp nối đã tạo nên chức năng của hệ thần kinh con ng-ời Quá trình

phát triển của hệ thần kinh là một quá trình “học“ liên tục Ngay từ khi

chúng ta sinh ra, một số cấu trúc thần kinh đơn giản đã đ-ợc hình thành Sau

đó các cấu trúc khác lần l-ợt đ-ợc xây dựng thêm nhờ quá trình học Do đó cấu trúc mạng nơron liên tục biến đổi để ngày càng phát triển hoàn thiện

Một vấn đề đặt ra là dựa trên những kết quả nghiên cứu về hệ thần kinh con ng-ời chúng ta có thể mô phỏng, xây dựng lên các hệ thần kinh nhân

Ngày đăng: 22/01/2021, 11:33

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w