1. Trang chủ
  2. » Thể loại khác

Nghiên cứu kỹ thuật nhận dạng ảnh lá cây dược liệu sử dụng mạng nơ ron

78 392 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 78
Dung lượng 2,3 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Để khắc phục được những hạn chế trên, trong nước và thế giới đã nghiên cứu và ứng dụng các tiến bộ khoa học kỹ thuật của công nghệ thông tin, cụ thể là công nghệ xử lý ảnh vào hỗ trợ nhậ

Trang 1

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

NGUYỄN XUÂN CƯỜNG

NGHIÊN CỨU KỸ THUẬT NHẬN DẠNG ẢNH

LÁ CÂY DƯỢC LIỆU SỬ DỤNG MẠNG NƠ RON

Chuyên ngành: Khoa học máy tính

Mã số: 60.48.01.01

TÓM TẮT LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

THÁI NGUYÊN, 2016

Trang 2

Công trình được hoàn thành tại:

Trường Đại học Công nghệ Thông tin và Truyền thông

- Đại học Thái Nguyên

Người hướng dẫn khoa học: TS Nguyễn Văn Tảo

Phản biện 1: TS Phạm Đức Long

Phản biện 2: PGS TS Ngô Quốc Tạo

Luận văn được bảo vệ trước hội đồng chấm luận văn họp tại: Trường Đại học Công nghệ Thông tin và Truyền thông

- Đại học Thái Nguyên, ngày 17 tháng 9 năm 2016

Có thể tìm hiểu luận văn tại:

- Trung tâm học liệu Đại học Thái Nguyên

- Thư viện trường Đại học Công nghệ Thông tin và Truyền thông

Trang 3

Thái Nguyên, ngày tháng năm 2016

Học viên

Nguyễn Xuân Cường

LỜI CAM ĐOAN

Tôi xin cam đoan những nghiên cứu của tôi về nhận dạng ảnh lá cây dược liệu sử dụng mạng nơ ron là những gì tôi viết ra không sao chép từ các tài liệu, không sử dụng các kết quả của người khác mà không trích dẫn cụ thể Tôi xin cam đoan ứng dụng này tôi trình bày trong khoá luận là do tôi tự phát triển dưới sự hướng dẫn của thầy Nguyễn Văn Tảo không sao chép ứng dụng của người khác Nếu sai tôi hoàn toàn chịu trách nhiệm theo quy định của trường Đại Học Công Nghệ Thông tin và Truyền thông- Đại Học Thái Nguyên

Trang 4

Thái Nguyên, ngày tháng năm 2016

Học viên

LỜI CẢM ƠN

Trong thời gian qua, tôi đã nhận được rất nhiều sự hướng dẫn giúp đỡ

và động viên tận tình từ nhiều phía Tất cả những điều đó đã trở thành một nguồn động lực lớn giúp tôi có thể thực hiện được đề tài nghiên cứu được giao Với tất cả sự cảm kích và trân trọng, tôi xin được gửi lời cảm ơn đến tất

cả mọi người

Trước hết tôi xin chân thành cảm ơn thầy hướng dẫn – Tiến sĩ Nguyễn Văn Tảo người đã hết sức nhiệt tình bảo ban hướng dẫn, đóng góp những ý kiến quý báu cho tôi để có thể học tập và hoàn thành khóa luận tốt nghiệp này

Xin gửi lời cảm ơn chân thành nhất đến Ban giám hiệu trường Đại học Công Nghệ Thông Tin và truyền thông – Đại học Thái Nguyên đã tạo điều kiện giúp đỡ tôi có thể thực hiện đề tài Cảm ơn các thầy cô công tác tại trường Đại học Công Nghệ Thông Tin và truyền thông – Đại học Thái Nguyên đã dạy dỗ và truyền đạt những kiến thức quí báu cho tôi trong suốt thời gian học tập và rèn luyện tại trường

Tôi xin được gửi lời biết ơn vô hạn tới cha mẹ, người thân đã nuôi dưỡng và tạo điều kiện tốt nhất cho tôi học tập sinh hoạt, ở bên tôi những lúc khó khăn nhất để chuyên tâm thực hiện khóa luận

Cuối cùng, xin cảm ơn tập thể lớp cao học CNTT K13E và đặc biệt những người bạn tốt đã ở bên tôi, khuyến khích, động viên tôi và cho tôi những lời khuyên chân thành trong cuộc sống và học tập

Xin trân trọng cảm ơn!

Trang 5

MỤC LỤC

LỜI CAM ĐOAN i

LỜI CẢM ƠN iii

MỤC LỤC v

DANH MỤC CÁC HÌNH VẼ vii

TÓM TẮT NỘI DUNG x

MỞ ĐẦU 1

1 Đặt vấn đề 1

2 Đối tượng và phạm vi nghiên cứu 3

3 Hướng nghiên cứu của đề tài 4

4 Những nội dung nghiên cứu chính 4

5 Phương pháp nghiên cứu 4

6 Ý nghĩa khoa học của đề tài 5

CHƯƠNG 1: GIỚI THIỆU VỀ MẠNG NƠ RON VÀ XỬ LÝ ẢNH SỐ 6

1.1 Giới thiệu về mạng nơ ron 6

1.1.1 Giới thiệu về mạng nơron nhân tạo 6

1.1.2 Nơron sinh học và nơron nhân tạo 10

1.2 Tổng quan về cây dược liệu 19

1.3 Giới thiệu về xử lý ảnh số 20

CHƯƠNG 2: KỸ THUẬT NHẬN DẠNG SỬ DỤNG MẠNG NƠ RON 22

2.1 Kỹ thuật trích chọn đặc trưng ảnh 22

2.1.1 Kỹ thuật phát hiện đặc trưng biên 22

2.1.2 Một số kỹ thuật phát hiện biên trực tiếp 23

2.1.3 Kỹ thuật xây dựng đặc trưng ảnh từ biên 25

2.2 Mạng nơ-ron lan truyền thẳng nhiều lớp 30

2.2.1 Mạng perceptron một lớp 30

2.2.2 Mạng perceptron nhiều lớp 32

2.2.3 Một số vấn đề cần chú ý khi sử dụng mạng MLP 43

Trang 6

CHƯƠNG 3: THỬ NGHIỆM NHẬN DẠNG ẢNH LÁ CÂY DƯỢC LIỆU 47

3.1 Giới thiệu 47

3.2 Thu thập, phân tích và xử lý dữ liệu 48

3.2.1 Thu thập dữ liệu 48

3.2.2 Xử lý dữ liệu 51

3.2.3 Hậu xử lý 51

3.3 Mạng nơron trong hệ thống nhận dạng lá cây dược liệu 51

3.4 Một số kết quả thử nghiê ̣m và đánh giá hệ thống nhận dạng lá cây dược liệu 53

3.4.1 Thử nghiệm hệ thống nhận dạng lá cây dược liệu 53

3.4.2 Đánh giá kết quả nhận dạng 61

3.4.3 Hướng phát triển trong tương lai 64

KẾT LUẬN CHUNG 65

DANH MỤC TÀI LIỆU THAM KHẢO 67

Trang 7

DANH MỤC CÁC HÌNH VẼ

Hình 1.1: Cấu trúc của một nơron sinh học điển hình 11

Hình 1.2: Nơron nhân tạo 12

Hình 1.3: Mạng tự kết hợp 15

Hình 1.4: Mạng kết hợp khác kiểu 16

Hình 1.5: Mạng truyền thẳng 16

Hình 1.6: Mạng phản hồi 17

Hình 1.7: Perceptron 17

Hình 1.8: Mạng MLP tổng quát 18

Hình 2.1: Lưu đồ kỹ thuật Prewitt Edge Detection 26

Hình 2.2: Ảnh lá cây dược liệu áp dụng thuật toán tách biên trực tiếp 27

Hình 2.3: Lưới phủ lên tập biên ảnh khi xác định tập đặc trưng điểm rút gọn27 Hình 2.4: Lưới phủ lên tập biên ảnh khi xác định tập đặc trưng điểm rút gọn với kích thước khác nhau 28

Hình 2.5: Đặc trưng ảnh lá cây dược liệu 28

Hình 2.6: Tam giác vuông biểu diễn góc đặc trưng 29

Hình 2.7: Mạng perceptron một lớp 31

Hình 2.8 Thực hiện hàm XOR bằng mạng MLP 33

Hình 2.9: Lan truyền tín hiệu trong quá trình học theo phương pháp lan truyền ngược sai số 34

Hình 2.10 Sai số E được xét là hàm của trọng số W 36

Hình 2.11 Minh họa về ý nghĩa của quán tính trong thực tế 42

Hình 2.12 Hàm sigmoid g(x) = 1/(1+e-x) 43

Hình 2.13 Nội suy hàm y = sin(x/3) + v, 0≤ x ≤ 20 sử dụng MLP 45

Hình 3.1: Các loại lá cây dược liệu dùng để nhận dạng 49

Hình 3.2: Một phần của tập ảnh huấn luyện 50

Trang 8

Hình 3.3: Một phần của tập ảnh thử nghiệm 50

Hình 3.4: Mô hình Noron trong bài toán nhận dạng mẫu 52

Hình 3.5: Giao diện hệ thống nhận dạng lá cây dƣợc liệu 53

Hình 3.6: Giao diện nhận dạng đặc trƣng của ảnh cây 54

Hình 3.7: Giao diện chức năng huấn luyện mạng nơron 55

Hình 3.8: Giao diện chức năng nhận dạng ảnh lá cây dƣợc liệu 56

Hình 3.9: Kết quả nhận dạng khi tham số khoảng cách giữa các điểm lớn 62

Trang 9

DANH MỤC CÁC BẢNG

Bảng 1.1: Một số hàm truyền thông dụng 14Bảng 3.1: Số lƣợng ảnh trong tập huấn luyện và tập thử nghiệm của mỗi loài57Bảng 3.2: Kết quả thử nghiệm nhận dạng ảnh lá cây dƣợc liệu 58Bảng 3.3: Một số kết quả thử nghiệm nhận dạng lá cây dƣợc liệu 59

Trang 10

TÓM TẮT NỘI DUNG Tóm tắt

Hiện nay nhu cầu tìm kiếm và hiểu biết thêm về thông tin các loại lá thuốc của con người là rất lớn, đòi hỏi sự phát triển của các ứng dụng nhận dạng để phục vụ nhu cầu đó cũng ngày càng cao

Việc sử dụng các hệ thống nhận dạng có một ý nghĩa hết sức quan trọng trọng và vô cùng hữu ích cho con người Các hệ thống nhận dạng giúp nâng cao khả năng tự động cũng như phân loại các đối tượng trong đời sống thực

tế Chính vì vai trò quan trọng của nó , luâ ̣n văn đã tìm hiểu và trình bày mô ̣t phương pháp nhâ ̣n diê ̣n với đối tượng là lá cây sử du ̣ng ma ̣ng nơron truyền thẳng nhiều lớp lan truyền ngược đồng thời xây dựng hê ̣ thốn g nhâ ̣n diê ̣n lá cây Kết quả đạt được bao gồm hai phần chính:

Trình bày tổng quan về nhận dạng mẫu và bài toán nhận dạng lá cây dược liệu dùng mạng nơ ron lan truyền ngược

Hệ thống hóa một số vấn đề về nhận dạng mẫu sử dụng mạng nơron Thực nghiệm: Xây dựng thành công hệ thống nhận dạng mẫu lá cây dược liệu, hệ thống đã giải quyết thành công các yêu cầu bài toán đặt ra như khả năng tìm đặc trưng ảnh, nhận dạng được các mẫu lá cây dược liệu đã được huấn luyện

Tuy hệ thống còn đơn giản nhưng đã phần nào giải quyết được bài toán nhận dạng lá cây dược liệu với độ chính xác tương đối

Trang 11

MỞ ĐẦU

1 Đặt vấn đề

Cây dược liệu có những vai trò hết sức quan trọng đối với mỗi quốc gia, đặc biệt là trong chăm sóc sức khỏe cho con người Việt Nam là một quốc gia nằm trong vùng khí hậu nhiệt đới gió mùa nóng ẩm, có nguồn tài nguyên động thực vật phong phú và đa dạng với khoảng 10.350 loài thực vật bậc cao,

800 loài rêu, 600 loài nấm và hơn 2.000 loài tảo Theo kết quả điều tra của Viện Dược liệu, cả nước ghi nhận được 3.948 loài thực vật và nấm lớn, 52 loài tảo biển, 408 loài động vật và 75 loại khoáng sản có công dụng làm thuốc Trong tổng số 3.948 loài cây thuốc, gần 90% là cây thuốc mọc tự nhiên tập trung chủ yếu trong các quần xã rừng, chỉ có gần 10% là cây thuốc trồng Trong những năm qua, công tác quản lý dược liệu đã đạt được những thành tựu như: tiến hành khảo sát, đánh giá sự phân bố của dược liệu, tạo tiền

đề xây dựng Danh mục cây thuốc Việt Nam, Danh mục động vật làm thuốc, Danh mục khoáng vật làm thuốc, Danh mục các loài cây thuốc có khả năng khai thác, Danh mục cây thuốc bị đe doạ cần bảo vệ ở Việt Nam Điều này đã được kết luận tại Hội nghị toàn quốc về Quản lý và phát triển cây dược liệu của Việt Nam được tổ chức tại TP Hạ Long tỉnh Quảng Ninh diễn ra ngày 27/12/2013

Việt Nam có 3/4 diện tích là đồi núi, rừng, điều nay cho thấy chúng ta

có một lượng lớn các loài cây dược liệu tự nhiên, hiện nay chúng ta mới phát hiện và khai thác được khoảng 3000 loài cây Trong khi theo dự báo thì chúng

ta có khoảng hàng trăm nghìn loại cây dược liệu khác nhau Như vậy, cả nước chúng ta mới phát hiện và khai thác được khoảng 30% theo trữ lượng dự báo

và do đó còn khoảng 70% cây dược liệu chưa được phát hiện và khai thác Đây là một bài toán luôn được đặt ra cho các nhà quản lý, nhà dược liệu và các nhà khoa học

Trang 12

Để khắc phục được những hạn chế trên, trong nước và thế giới đã nghiên cứu và ứng dụng các tiến bộ khoa học kỹ thuật của công nghệ thông tin, cụ thể là công nghệ xử lý ảnh vào hỗ trợ nhận dạng và phát hiện các cây dược liệu để phục vụ cho việc khai thác, vì một thực tế là khi bà con chúng ta lên rừng, hay đi đâu đó gặp những cây thuốc mà chúng ta lại không biết đó là cây gì, tác dụng của các loại cây đó, nên việc nghiên cứu đề xuất các kỹ thuật

xử lý ảnh và nhận dạng ra các cây dược liệu là việc làm rất cần thiết

Ngày nay, trên thế giới đã có nhiều nhà khoa học quan tâm nghiên cứu

và đề xuất những kỹ thuật nhận dạng ảnh các cây dược liệu [19], cụ thể: Nhóm tác giả Lee và Hong [15], đề xuất phương pháp nhận dạng ảnh cây dược liệu dựa vào đặc trưng của đường viền của lá cây dược liệu Patil và Kumar [16,18], nhận dạng cây dược liệu, tác dụng của cây dựa vào trích xuất các đặc trưng của lá từ đó tiến hành cung cấp những thông tin về thuộc tính của cây và phân loại cây theo đặc trưng tác dụng của cây [17] Nhóm tác Du, Wang và Zhang [19]; Sari, Burak và Sankur [5,9,10,11], đề xuất kỹ thuật nhận dạng cây dược liệu dựa vào hình dạng, các vùng đặc trưng của lá, đặc trưng kết cấu của lá cây dược liệu, với đề xuất này giúp chúng ta có thể xây dựng các hệ thống nhận dạng dữ liệu cây dược liệu cho kết quả tỷ lệ nhận dạng và phát hiện cao

Trang 13

Hình ảnh về lá cây dƣợc liệu đƣợc phân loại thành 3 lớp [4] Tuy nhiên, những đề xuất của các tác giả trên đều có một số hạn chế, đó

là tốc độ chậm khi tập cơ sở dữ liệu về cây, lá cây dƣợc liệu lớn, điều này cũng dẫn đến độ tin cậy giảm Để khắc phục những hạn chế trên thì nhiều công trình khác cũng đƣợc đề xuất nhƣ các kỹ thuật xử lý ảnh và nhận dạng ảnh cây dƣợc liệu dựa vào trích chọn đặc trƣng của ảnh cây, ảnh lá cây dƣợc liệu sử dụng mạng Noron tế bào [4]

Ở Việt Nam, việc nghiên cứu đề xuất các kỹ thuật xử lý ảnh vào nhận dạng ảnh cây dƣợc liệu còn rất khiêm tốn, mới chỉ tập trung vào một số nhóm tác giả [1,2,3,4] Tuy nhiên, các đề xuất mới chỉ dừng lại ở việc nghiên cứu đề

mô mà chƣa đánh giá, khắc phục đƣợc những hạn chế trên, chƣa so sánh đƣợc tốc độ nhận dạng và độ tin cậy của ảnh cây dƣợc liệu

Xuất phát từ thực tế, đề tài luận văn đƣợc chọn là “Nghiên cứu kỹ thuật

nhận dạng ảnh lá cây dược liệu sử dụng mạng Noron” dựa vào trích chọn đặc

trƣng về màu sắc, hình dạng, gân lá,… của lá cây dƣợc liệu

2 Đối tƣợng và phạm vi nghiên cứu

Đối tƣợng nghiên cứu

- Một số loại cây dƣợc liệu

- Đặc trƣng của cây dƣợc liệu, lá cây dƣợc liệu, kết cấu, màu sắc, hình dạng, gân lá cây dƣợc liệu,…

- Một số thuật toán và ứng dụng

Phạm vi nghiên cứu:

+ Nghiên cứu lý thuyết về mạng nơ ron tế bào, xử lý ảnh số

+ Nghiên cứu các kỹ thuật xử lý ảnh và nhận dạng ảnh lá cây dƣợc liệu + Biểu diễn, trích xuất và mô tả ảnh cây dƣợc liệu, các đặc trƣng của lá cây dƣợc liệu

Trang 14

+ Xây dựng chương trình thực nghiệm về nhận dạng ảnh lá cây dược liệu

3 Hướng nghiên cứu của đề tài

- Nghiên cứu lý thuyết, thu thập, phân tích các tài liệu có liên quan đến đối tượng của đề tài

- Nghiên cứu các kỹ thuật xử lý ảnh và nhận dạng ảnh lá cây dược liệu

sử dụng mạng nơ ron tế bào dựa vào các đặc trưng của lá cây dược liệu như màu sắc, kết cấu, hình dạng, gân lá,…

- Cài đặt thử nghiệm, đánh giá, quan sát và hiệu chỉnh ảnh, kết xuất được các thành phần, thuộc tính, công dụng của các cây dược liệu ra file định dạng nhằm phục vụ cho các yêu cầu thực tế

4 Những nội dung nghiên cứu chính

Dự kiến luận văn gồm: Phần mở đầu, ba chương chính, phần kết luận, tài liệu tham khảo và phụ lục Bố cục như sau:

Phần mở đầu: Nêu lý do chọn đề tài và bố cục luận văn

Chương 1: GIỚI THIỆU VỀ MẠNG NƠ RON VÀ XỬ LÝ ẢNH SỐ Chương 2: KỸ THUẬT NHẬN DẠNG ẢNH SỬ DỤNG MẠNG NƠ RON Chương 3: THỬ NGHIỆM NHẬN DẠNG ẢNH LÁ CÂY DƯỢC LIỆU

Phần kết luận: Tóm tắt các kết quả đạt được, hướng phát triển tiếp

Tài liệu tham khảo

5 Phương pháp nghiên cứu

Phương pháp nghiên cứu của đề tài luận văn được sử dụng là kết hợp giữa nghiên cứu lý thuyết với nghiên cứu thực nghiệm, cụ thể:

- Phương pháp nghiên cứu lý thuyết: Thu thập tài liệu, đọc hiểu các kiến

thức cơ bản về xử lý ảnh số; Nghiên cứu một số kỹ thuật xử lý ảnh và nhận dạng ảnh lá cây dược liệu dựa vào các đặc trưng về màu sắc, hình dạng, gân lá,… So sánh, phân tích và đánh giá các kết quả nghiên cứu với những công

Trang 15

trình của các tác giả khác đã công bố và đưa ra những phương pháp, kỹ thuật

đề xuất mới và đề xuất cải tiến

Tìm hiểu một số công cụ hỗ trợ lập trình

- Phương pháp nghiên cứu thực nghiệm:

+ Nghiên cứu xây dựng cơ sở dữ liệu ảnh huấn luyện (thu nhận ảnh lá cây dược liệu, các mẫu lá cây dược liệu, hình dạng,…)

+ Nghiên cứu, đánh giá và lựa chọn phương pháp, giải pháp công nghệ cài đặt thử nghiệm với một số mẫu dữ liệu và đánh giá kết quả

- Phương pháp trao đổi khoa học: Công bố, trao đổi, thảo luận và báo

cáo tại các hội thảo, hội nghị khoa học,…

6 Ý nghĩa khoa học của đề tài

Nghiên cứu mạng nơ ron tế bào và các ứng dụng

Nghiên cứu các kỹ thuật xử lý ảnh và nhận dạng ảnh mẫu lá cây dược liệu Nghiên cứu một số giải thuật, phương pháp để đánh giá độ tin cậy của ảnh được nhận dạng

Ứng dụng công nghệ xử lý ảnh và mạng nơ ron tế bào vào bài toán thực tế Giải quyết bài toán: Phát hiện, khai thác cây dược liệu của Việt Nam dựa vào nhận dạng ảnh lá cây dược liệu Kết quả là nhận dạng được cây dược liệu, công dụng của cây đối với việc chăm sóc sức khỏe, chữa trị bệnh cho con người

Là cơ sở khoa học nhằm hỗ trợ nâng cao hiệu quả phát hiện, khai thác các cây dược liệu của Việt Nam Đồng thời, các kết quả của đề tài sẽ còn làm

cơ sở khoa học cho việc đề xuất và xây dựng các chương trình ứng dụng cho nhiều ứng dụng thực tế trong lĩnh vực y học

Trang 16

CHƯƠNG 1: GIỚI THIỆU VỀ MẠNG NƠ RON VÀ XỬ LÝ ẢNH SỐ 1.1 Giới thiệu về mạng nơ ron

1.1.1 Giới thiệu về mạng nơron nhân tạo

1.1.1.1 Mạng nơron nhân tạo là gì?

Định nghĩa: Mạng nơron nhân tạo, Artificial Neural Network (ANN) gọi tắt là mạng nơron, neural network, là một mô hình xử lý thông tin phỏng theo

cách thức xử lý thông tin của các hệ nơron sinh học Nó được tạo lên từ một

số lượng lớn các phần tử (gọi là phần tử xử lý hay nơron) kết nối với nhau thông qua các liên kết (gọi là trọng số liên kết) làm việc như một thể thống

nhất để giải quyết một vấn đề cụ thể nào đó

Một mạng nơron nhân tạo được cấu hình cho một ứng dụng cụ thể (nhận

dạng mẫu, phân loại dữ liệu, ) thông qua một quá trình học từ tập các mẫu

huấn luyện Về bản chất học chính là quá trình hiệu chỉnh trọng số liên kết giữa các nơron

Trang 17

Tiếp bước các nghiên cứu này, năm 1949 Donald Hebb cho xuất bản

cuốn sách Organization of Behavior Cuốn sách đã chỉ ra rằng các nơron nhân

tạo sẽ trở lên hiệu quả hơn sau mỗi lần chúng được sử dụng

Những tiến bộ của máy tính đầu những năm 1950 giúp cho việc mô hình hóa các nguyên lý của những lý thuyết liên quan tới cách thức con người suy nghĩ đã trở thành hiện thực Nathanial Rochester sau nhiều năm làm việc tại các phòng thí nghiệm nghiên cứu của IBM đã có những nỗ lực đầu tiên để mô phỏng một mạng nơron Trong thời kì này tính toán truyền thống đã đạt được những thành công rực rỡ trong khi đó những nghiên cứu về nơron còn ở giai đoạn sơ khai Mặc dù vậy những người ủng hộ triết lý “thinking machines” (các máy biết suy nghĩ) vẫn tiếp tục bảo vệ cho lập trường của mình

Năm 1956 dự án Dartmouth nghiên cứu về trí tuệ nhân tạo (Artificial Intelligence) đã mở ra thời kỳ phát triển mới cả trong lĩnh vực trí tuệ nhân tạo lẫn mạng nơron Tác động tích cực của nó là thúc đẩy hơn nữa sự quan tâm của các nhà khoa học về trí tuệ nhân tạo và quá trình xử lý ở mức đơn giản của mạng nơron trong bộ não con người

Những năm tiếp theo của dự án Dartmouth, John von Neumann đã đề xuất việc mô phỏng các nơron đơn giản bằng cách sử dụng rơle điện áp hoặc đèn chân không Nhà sinh học chuyên nghiên cứu về nơron Frank Rosenblatt

cũng bắt đầu nghiên cứu về Perceptron Sau thời gian nghiên cứu này

Perceptron đã được cài đặt trong phần cứng máy tính và được xem như là mạng nơron lâu đời nhất còn được sử dụng đến ngày nay Perceptron một tầng rất hữu ích trong việc phân loại một tập các đầu vào có giá trị liên tục vào một trong hai lớp Perceptron tính tổng có trọng số các đầu vào, rồi trừ tổng này cho một ngưỡng và cho ra một trong hai giá trị mong muốn có thể Tuy nhiên Perceptron còn rất nhiều hạn chế, những hạn chế này đã được chỉ

Trang 18

ra trong cuốn sách về Perceptron của Marvin Minsky và Seymour Papert viết năm 1969

Năm 1959, Bernard Widrow và Marcian Hoff thuộc trường đại học Stanford đã xây dựng mô hình ADALINE (ADAptive LINear Elements) và MADALINE (Multiple ADAptive LINear Elements) Các mô hình này sử

dụng quy tắc học Least-Mean-Squares (LMS: Tối thiểu bình phương trung

bình) MADALINE là mạng nơron đầu tiên được áp dụng để giải quyết một bài toán thực tế Nó là một bộ lọc thích ứng có khả năng loại bỏ tín hiệu dội lại trên đường dây điện thoại Ngày nay mạng nơron này vẫn được sử dụng trong các ứng dụng thương mại

Năm 1974 Paul Werbos đã phát triển và ứng dụng phương pháp học lan truyền ngược (back-propagation) Tuy nhiên phải mất một vài năm thì phương pháp này mới trở lên phổ biến Các mạng lan truyền ngược được biết đến nhiều nhất và được áp dụng rộng dãi nhất nhất cho đến ngày nay

Thật không may, những thành công ban đầu này khiến cho con người nghĩ quá lên về khả năng của các mạng nơron Chính sự cường điệu quá mức

đã có những tác động không tốt đến sự phát triển của khoa học và kỹ thuật thời bấy giờ khi người ta lo sợ rằng đã đến lúc máy móc có thể làm mọi việc của con người Những lo lắng này khiến người ta bắt đầu phản đối các nghiên cứu về mạng nơ ron Thời kì tạm lắng này kéo dài đến năm 1981

Năm 1982 trong bài báo gửi tới viện khoa học quốc gia, John Hopfield bằng sự phân tích toán học rõ ràng, mạch lạc, ông đã chỉ ra cách thức các mạng nơron làm việc và những công việc chúng có thể thực hiện được Cống hiến của Hopfield không chỉ ở giá trị của những nghiên cứu khoa học mà còn

ở sự thúc đẩy trở lại các nghiên cứu về mạng neuron

Cũng trong thời gian này, một hội nghị với sự tham gia của Hoa Kỳ và Nhật Bản bàn về việc hợp tác/cạnh tranh trong lĩnh vực mạng nơron đã được

Trang 19

tổ chức tại Kyoto, Nhật Bản Sau hội nghị, Nhật Bản đã công bố những nỗ lực của họ trong việc tạo ra máy tính thế hệ thứ 5 Tiếp nhận điều đó, các tạp chí định kỳ của Hoa Kỳ bày tỏ sự lo lắng rằng nước nhà có thể bị tụt hậu trong lĩnh vực này Vì thế, ngay sau đó, Hoa Kỳ nhanh chóng huy động quỹ tài trợ cho các nghiên cứu và ứng dụng mạng nơ ron

Năm 1985, viện vật lý Hoa Kỳ bắt đầu tổ chức các cuộc họp hàng năm

về mạng nơ ron ứng dụng trong tin học (Neural Networks for Computing) Năm 1987, hội thảo quốc tế đầu tiên về mạng nơ ron của Viện các kỹ sư điện và điện tử IEEE (Institute of Electrical and Electronic Engineer) đã thu hút hơn 1800 người tham gia

Ngày nay, không chỉ dừng lại ở mức nghiên cứu lý thuyết, các nghiên cứu ứng dụng mạng nơron để giải quyết các bài toán thực tế được diễn ra ở khắp mọi nơi Các ứng dụng mạng nơron ra đời ngày càng nhiều và ngày càng hoàn thiện hơn Điển hình là các ứng dụng: xử lý ngôn ngữ (Language Processing), nhận dạng kí tự (Character Recognition), nhận dạng tiếng nói (Voice Recognition), nhận dạng mẫu (Pattern Recognition), xử lý tín hiệu (Signal Processing), Lọc dữ liệu (Data Filtering),…

1.1.1.3 So sánh mạng nơron với máy tính truyền thống

Các mạng nơron có cách tiếp cận khác trong giải quyết vấn đề so với máy tính truyền thống Các máy tính truyền thống sử dụng cách tiếp cận theo hướng giải thuật, tức là máy tính thực hiện một tập các chỉ lệnh để giải quyết một vấn đề Vấn đề được giải quyết phải được biết và phát biểu dưới dạng một tập chỉ lệnh không nhập nhằng Những chỉ lệnh này sau đó phải được chuyển sang một chương trình ngôn ngữ bậc cao và chuyển sang mã máy để máy tính có thể hiểu được

Trừ khi các bước cụ thể mà máy tính cần tuân theo được chỉ ra rõ ràng, máy tính sẽ không làm được gì cả Điều đó giới hạn khả năng của các máy

Trang 20

tính truyền thống ở phạm vi giải quyết các vấn đề mà chúng ta đã hiểu và biết chính xác cách thực hiện Các máy tính sẽ trở lên hữu ích hơn nếu chúng có thể thực hiện được những việc mà bản thân con người không biết chính xác là phải làm như thế nào

Các mạng nơron xử lý thông tin theo cách thức giống như bộ não con người Mạng được tạo nên từ một số lượng lớn các phần tử xử lý được kết nối với nhau làm việc song song để giải quyết một vấn đề cụ thể Các mạng nơron học theo mô hình, chúng không thể được lập trình để thực hiện một nhiệm vụ

cụ thể Các mẫu phải được chọn lựa cẩn thận nếu không sẽ rất mất thời gian, thậm chí mạng sẽ hoạt động không đúng Điều hạn chế này là bởi vì mạng tự tìm ra cách giải quyết vấn đề, thao tác của nó không thể dự đoán được

Các mạng nơron và các máy tính truyền thống không cạnh tranh nhau

mà bổ sung cho nhau Có những nhiệm vụ thích hợp hơn với máy tính truyền thống, ngược lại có những nhiệm vụ lại thích hợp hơn với các mạng nơron Thậm chí rất nhiều nhiệm vụ đòi hỏi các hệ thống sử dụng tổ hợp cả hai cách tiếp cận để thực hiện được hiệu quả cao nhất (thông thường một máy tính truyền thống được sử dụng để giám sát mạng nơron)

1.1.2 Nơron sinh học và nơron nhân tạo

lý và truyền các tín hiệu điện hóa trên các đường mòn nơron, các con đường này tạo nên hệ thống giao tiếp của bộ não

Trang 21

Hình 1.1: Cấu trúc của một nơron sinh học điển hình

Mỗi nơron sinh học có 3 thành phần cơ bản:

• Các nhánh vào hình cây ( dendrites)

• Thân tế bào (cell body)

• Sợi trục ra (axon)

Các nhánh hình cây truyền tín hiệu vào đến thân tế bào Thân tế bào tổng hợp và xử lý cho tín hiệu đi ra Sợi trục truyền tín hiệu ra từ thân tế bào này sang nơron khác Điểm liên kết giữa sợi trục của nơron này với nhánh

hình cây của nơron khác gọi là synapse Liên kết giữa các nơron và độ nhạy

của mỗi synapse được xác định bởi quá trình hóa học phức tạp Một số cấu trúc của nơron được xác định trước lúc sinh ra Một số cấu trúc được phát triển thông qua quá trình học Trong cuộc đời cá thể, một số liên kết mới được hình thành, một số khác bị hủy bỏ

Trang 22

Như vậy nơron sinh học hoạt động theo cách thức sau: nhận tín hiệu đầu

vào, xử lý các tín hiệu này và cho ra một tín hiệu output Tín hiệu output này

sau đó được truyền đi làm tín hiệu đầu vào cho các nơron khác

Dựa trên những hiểu biết về nơron sinh học, con người xây dựng nơron nhân tạo với hy vọng tạo nên một mô hình có sức mạnh như bộ não

1.1.2.2 Nơron nhân tạo

Một nơron là một đơn vị xử lý thông tin và là thành phần cơ bản của một mạng nơron Cấu trúc của một nơron được mô tả trên hình dưới

Hình 1.2: Nơron nhân tạo

Các thành phần cơ bản của một nơron nhân tạo bao gồm:

♦ Tập các đầu vào: Là các tín hiệu vào (input signals) của nơron, các tín

hiệu này thường được đưa vào dưới dạng một vector N chiều

♦ Tập các liên kết: Mỗi liên kết được thể hiện bởi một trọng số (gọi là

trọng số liên kết – Synaptic weight) Trọng số liên kết giữa tín hiệu vào thứ j

với nơron k thường được kí hiệu là w

kj Thông thường, các trọng số này được khởi tạo một cách ngẫu nhiên ở thời điểm khởi tạo mạng và được cập nhật liên tục trong quá trình học mạng

♦ Bộ tổng (Summing function): Thường dùng để tính tổng của tích các

đầu vào với trọng số liên kết của nó

Trang 23

♦ Ngưỡng (còn gọi là một độ lệch - bias): Ngưỡng này thường được đưa

vào như một thành phần của hàm truyền

♦ Hàm truyền (Transfer function) : Hàm này được dùng để giới hạn

phạm vi đầu ra của mỗi nơron Nó nhận đầu vào là kết quả của hàm tổng và ngưỡng đã cho Thông thường, phạm vi đầu ra của mỗi nơron được giới hạn trong đoạn [0,1] hoặc [-1, 1] Các hàm truyền rất đa dạng, có thể là các hàm tuyến tính hoặc phi tuyến Việc lựa chọn hàm truyền nào là tuỳ thuộc vào từng bài toán và kinh nghiệm của người thiết kế mạng Một số hàm truyền thường sử dụng trong các mô hình mạng nơron được đưa ra trong bảng 1

♦ Đầu ra: Là tín hiệu đầu ra của một nơron, với mỗi nơron sẽ có tối đa là một đầu ra

Xét về mặt toán học, cấu trúc của một nơron k, được mô tả bằng cặp biểu thức sau: [cong thuc] trong đó: x

k là tín hiệu đầu ra của nơron

Như vậy tương tự như nơron sinh học, nơron nhân tạo cũng nhận các tín hiệu đầu vào, xử lý ( nhân các tín hiệu này với trọng số liên kết, tính tổng các tích thu được rồi gửi kết quả tới hàm truyền), và cho một tín hiệu đầu ra (là kết quả của hàm truyền)

Trang 24

cả mạng nơron là một đồ thị), kiến trúc kết nối (sự tổ chức kết nối giữa các nơron) và thuật toán học (thuật toán dùng để học cho mạng)

Trang 25

Về bản chất một mạng nơ ron có chức năng như là một hàm anh xạ F: X

→ Y, trong đó X là không gian trạng thái đầu vào (input state space) và Y là không gian trạng thái đầu ra (output state space) của mạng Các mạng chỉ đơn

giản là nhiệm vụ anh xạ các vector đầu vào x X sang các vector đầu ra y

Y thong qua “bộ lọc” (filter) các trọng số Tức là y = F(x) = s(W,x), trong

đó W là ma trận trọng số lien kết Hoạt động của mạng thường là các tính toán số thực trên các ma trận

1.1.2.4 Các kiểu mô hình mạng nơron

Cách thức kết nối các nơron trong mạng xác định kiến trúc (topology) của mạng Các nơron trong mạng có thể kết nối đầy đủ (fully connected) tức

là mỗi nơron đều được kết nối với tất cả các nơron khác, hoặc kết nối cục bộ

(partially connected) chẳng hạn chỉ kết nối giữa các nơron trong các tầng

khác nhau Người ta chia ra hai loại kiến trúc mạng chính:

♦ Tự kết hợp (autoassociative): là mạng có các nơron đầu vào cũng là

các nơron đầu ra Mạng Hopfield là một kiểu mạng tự kết hợp

Hình 1.3: Mạng tự kết hợp

♦ Kết hợp khác kiểu (heteroassociative): là mạng có tập nơron đầu vào

và đầu ra riêng biệt Perceptron, các mạng Perceptron nhiều tầng (MLP: MultiLayer Perceptron), mạng Kohonen, … thuộc loại này

Trang 26

Hình 1.4: Mạng kết hợp khác kiểu

Ngoài ra tùy thuộc vào mạng có các kết nối ngược (feedback

connections) từ các nơron đầu ra tới các nơron đầu vào hay không, người ta

chia ra làm 2 loại kiến trúc mạng

♦ Kiến trúc truyền thẳng (feedforward architechture): là kiểu kiến trúc

mạng không có các kết nối ngược trở lại từ các nơron đầu ra về các nơron đầu vào; mạng không lưu lại các giá trị output trước và các trạng thái kích hoạt của nơron Các mạng nơron truyền thẳng cho phép tín hiệu di chuyển theo một đường duy nhất; từ đầu vào tới đầu ra, đầu ra của một tầng bất kì sẽ không ảnh hưởng tới tầng đó Các mạng kiểu Perceptron là mạng truyền thẳng

Hình 1.5: Mạng truyền thẳng

♦ Kiến trúc phản hồi (Feedback architecture): là kiểu kiến trúc mạng có

các kết nối từ nơron đầu ra tới nơron đầu vào Mạng lưu lại các trạng thái trước đó, và trạng thái tiếp theo không chỉ phụ thuộc vào các tín hiệu đầu vào

Trang 27

mà còn phụ thuộc vào các trạng thái trước đó của mạng Mạng Hopfield thuộc loại này

Hình 1.6: Mạng phản hồi 1.1.2.5 Perceptron

Perceptron là mạng nơron đơn giản nhất, nó chỉ gồm một nơron, nhận đầu vào là vector có các thành phần là các số thực và đầu ra là một trong hai giá trị +1 hoặc -1

Hình 1.7: Perceptron

Đầu ra của mạng được xác định như sau: mạng lấy tổng có trọng số các thành phần của vector đầu vào, kết quả này cùng ngưỡng b được đưa vào hàm truyền (Perceptron dùng hàm Hard-limit làm hàm truyền) và kết quả của hàm truyền sẽ là đầu ra của mạng

Trang 28

Hoạt động của Perceptron có thể được mô tả bởi cặp công thức sau: [Cong thuc] và y = f(u - b) = Hardlimit(u - b); y nhận giá trị +1 nếu u - b>0, ngược lại y nhận giá trị -1

Perceptron cho phép phân loại chính xác trong trường hợp dữ liệu có thể phân chia tuyến tính (các mẫu nằm trên hai mặt đối diện của một siêu phẳng)

Nó cũng phân loại đúng đầu ra các hàm AND, OR và các hàm có dạng đúng khi n trong m đầu vào của nó đúng (n ≤ m) Nó không thể phân loại được đầu

Kiến trúc của một mạng MLP tổng quát có thể mô tả như sau:

♦ Đầu vào là các vector (x1, x2, , xp) trong không gian p chiều, đầu ra

là các vector (y1, y2, ., yq) trong không gian q chiều Đối với các bài toán phân loại, p chính là kích thước của mẫu đầu vào, q chính là số lớp cần phân loại Xét ví dụ trong bài toán nhận dạng chữ số: với mỗi mẫu ta lưu tọa độ (x,y) của 8 điểm trên chữ số đó, và nhiệm vụ của mạng là phân loại các mẫu

Trang 29

này vào một trong 10 lớp tương ứng với 10 chữ số 0, 1, …, 9 Khi đó p là kích thước mẫu và bằng 8 x 2 = 16; q là số lớp và bằng 10

♦ Mỗi nơron thuộc tầng sau liên kết với tất cả các nơron thuộc tầng liền trước nó

♦ Đầu ra của nơron tầng trước là đầu vào của nơron thuộc tầng liền sau nó Hoạt động của mạng MLP như sau: tại tầng đầu vào các nơron nhận tín hiệu vào xử lý (tính tổng trọng số, gửi tới hàm truyền) rồi cho ra kết quả (là kết quả của hàm truyền); kết quả này sẽ được truyền tới các nơron thuộc tầng

ẩn thứ nhất; các nơron tại đây tiếp nhận như là tín hiệu đầu vào, xử lý và gửi kết quả đến tầng ẩn thứ 2;…; quá trình tiếp tục cho đến khi các nơron thuộc tầng ra cho kết quả

♦ Mọi hàm bất kỳ đều có thể xấp xỉ bởi một mạng MLP 3 tầng sử dụng hàm truyền sigmoid cho các nơron tầng ẩn và hàm truyền tuyến tính cho các nơron tầng ra[12,13,14]

1.2 Tổng quan về cây dược liệu

Cây dược liệu là những loài thực vật dung để chữa bệnh hoặc bồi bổ cơ thể khi con người sử dung, việc dùng thuốc trong nhân dân ta đã có từ lâu đời

Từ thời nguyên thủy tổ tiên chúng ta trong lúc tìm kiếm thức ăn, co khi ăn phải chất độc phát sinh nôn mửa hoặc rối loạn tiêu hóa, do đó cần có nhận thức phân biệt các loại nào ăn được, loại nào không ăn được

Trang 30

Kinh nghiệm dần dần tích lũy, không những giúp cho loài người biết lợi dụng tính chất của cây cỏ để làm thức ăn mà còn dùng để làm thuốc chữa bệnh, hay dùng những vị có chất độc để chế tên thuốc độc dùng trong săn bán hay trong lúc tự vệ chống ngoại sâm Lịch sử nước ta cho biết ngay từ khi lập nước, nhân dân ta đã biết chế tạo và sử dụng tên độc để chống lại kẻ thù Như vậy, việc phát minh ra thuốc đã có từ thời thượng cổ, trong quá trình đấu tranh với thiên nhiên, tìm tòi thức ăn mà có được Nguồn gốc tìm ra thức ăn, thuốc và cây có chất độc chỉ là một Về sau, dần dần con người mới biết tổng kết và đặt ra lý luận Hiện nay, đi sâu và tìm hiểu những kinh nghiệm trong nhân dân Việt Nam cũng như nhiều dân tộc khác trên thế giới, con người đã sử dụng hàng vạn loài thực vật để làm thuốc Trong quá trình chữa bệnh bằng kinh nghiệm và hiểu biết của con người, đến nay đã hình thành các khuynh hước khác nhau, chúng ta có thể phân biệt hai loại người làm thuốc Một loại chỉ có kinh nghiệm chữa bệnh, không biết hoặc ít biết lý luận Kinh nghiệm đó cứ cha truyền con nối mà tồn tại, phát huy Những người có khuynh hướng này chiếm chủ yếu tại các vùng dân tộc ít người Khuynh hướng thứ hai là những người có kinh nghiệm và có thêm phần lý luận, những người này chiếm chủ yếu ở thành thị và những người có cơ sở lý luận cho rằng vị thần nông là nhà phát minh ra thuốc Truyền thuyết kể rằng:

“Một ngày ông nếm 100 loài cây cỏ để tìm thuốc, ông đã gặp phải rất nhiều loài cây có độc nên có khi một ngày ngộ độc đến 70 lần”, rồi ông đã soạn ra sách thuốc đầu tiên gọi là “Thần nông bản thảo” Trong bộ này có ghi chép tất

cả 365 vị thuốc và là bộ sách cổ nhất Đông Y (khoảng 4000 năm nay)

1.3 Giới thiệu về xử lý ảnh số

Xử lý ảnh (XLA) là đối tượng nghiên cứu của lĩnh vực thị giác máy, là quá trình biến đổi từ một ảnh ban đầu sang một ảnh mới với các đặc tính và tuân theo ý muốn của người sử dụng Xử lý ảnh có thể gồm quá trình phân

Trang 31

tích, phân lớp các đối tượng, làm tăng chất lượng, phân đoạn và tách cạnh, gán nhãn cho vùng hay quá trình biên dịch các thông tin hình ảnh của ảnh Cũng nhờ xử lý dữ liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của tin học ứng dụng Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo bởi các chương trình Xử lý ảnh số bao gồm các phương pháp và kỹ thuật biến đổi, để truyền tải hoặc mã hoá các ảnh tự nhiên Mục đích của xử lý ảnh gồm:

Biến đổi ảnh làm tăng chất lượng ảnh

Tự động nhận dạng ảnh, đoán nhận ảnh, đánh giá các nội dung của ảnh Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình ảnh thành những phần có ý nghĩa để phân biệt đối tượng này với đối tượng khác, dựa vào đó ta có thể mô tả cấu trúc của hình ảnh ban đầu Có thể liệt kê một

số phuơng pháp nhận dạng cơ bản nhờ nhận dạng ảnh của các đối tượng trên ảnh, tách cạnh, phân đoạn hình ảnh,… Kỹ thuật này được dùng nhiều trong y học (xử lý tế bào, nhiễm sắc thể), nhận dạng chữ trong văn bản

Trang 32

CHƯƠNG 2: KỸ THUẬT NHẬN DẠNG SỬ DỤNG MẠNG NƠ RON 2.1 Kỹ thuật trích chọn đặc trưng ảnh

Trong quá trình nhận dạng mẫu, chúng ta cần phải xác định các đặc trưng của một đối tượng để từ đó có cơ sở để so sánh, đối chiếu và điều chỉnh các thành phần của máy học Đối với nhận dạng hình ảnh nói chung có hai xu hướng có thể nhắc tới trong quá trình nhận dạng; Một là sử dụng hình dạng của đối tượng để phân biệt các đối tượng với nhau; Hai là sử dụng các đặc trưng về chất liệu để phân biệt các đối tượng Đối với ảnh lá cây dược liệu do

sự sai khác về hình ảnh mặt lá và màu sắc thường không lớn, vì vậy trong nội dung luận văn sử dụng chủ yếu các đặc trưng về hình dạng để phân biệt các lá cây dược liệu với nhau

Có nhiều kỹ thuật được áp dụng khi trích chọn đặc trưng là hình dạng, nhưng nói chung có thể nhắc tới hai hướng chính khi đặc trưng hình dạng Thứ nhất là việc đặc trưng được xây dựng dựa trên việc phân tích biên của đối tượng Thứ hai là đặc trưng được xây dựng dựa trên phân tích xương của đối tượng Tuy nhiên, với đối tượng được quan tâm tới là lá cây khi tiến hành phân tích xương tôi nhận thấy xương thu được từ các đối tượng lá khá giông nhau, do đó trong phạm vi luận văn tôi lựa chọn đặc trưng chủ yếu là về hình dạng mà cụ thể sẽ phân tích sâu hơn tới các kỹ thuật xây dựng đặc trưng từ biên ảnh

2.1.1 Kỹ thuật phát hiện đặc trưng biên

Biên là vấn đề quan trọng trong trích chọn đặc điểm nhằm tiến tới hiểu ảnh Cho đến nay chưa có định nghĩa chính xác về biên, trong mỗi ứng dụng người ta đưa ra các độ đo khác nhau về biên, một trong các độ đo đó là độ đo

về sự thay đổi đột ngột về cấp xám Ví dụ: Đối với ảnh đen trắng, một điểm được gọi là điểm biên nếu nó là điểm đen có ít nhất một điểm trắng bên cạnh Tập hợp các điểm biên tạo nên biên hay đường bao của đối tượng Xuất phát

từ cơ sở này người ta thường sử dụng hai phương pháp phát hiện biên cơ bản:

Trang 33

Phát hiện biên trực tiếp: Phương pháp này làm nổi biên dựa vào sự

biến thiên mức xám của ảnh Kỹ thuật chủ yếu dùng để phát hiện biên ở đây

là kỹ thuật lấy đạo hàm Nếu lấy đạo hàm bậc nhất của ảnh ta có các kỹ thuật Gradient, nếu lấy đạo hàm bậc hai của ảnh ta có kỹ thuật Laplace Ngoài ra còn có một số các tiếp cận khác

Phát hiện biên gián tiếp: Nếu bằng cách nào đó ta phân được ảnh thành

các vùng thì ranh giới giữa các vùng đó gọi là biên Kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối ngẫu nhau vì dò biên để thực hiện phân lớp đối tượng mà khi đã phân lớp xong nghĩa là đã phân vùng được ảnh và ngược lại, khi đã phân vùng ảnh đã được phân lớp thành các đối tượng, do đó có thể phát hiện được biên

Phương pháp phát hiện biên trực tiếp tỏ ra khá hiệu quả và ít chịu ảnh hưởng của nhiễu, song nếu sự biến thiên độ sáng không đột ngột, phương pháp

tỏ ra kém hiệu quả, phương pháp phát hiện biên gián tiếp tuy khó cài đặt, song lại áp dụng khá tốt trong trường hợp này Sự khác biệt cơ bản giữa hai phương pháp này là: Phương pháp phát hiện biên trực tiếp cho ta kết quả là ảnh biên, còn phương pháp phát hiện biên trực tiếp cho ta kết quả là đường biên

2.1.2 Một số kỹ thuật phát hiện biên trực tiếp

Kỹ thuật phát hiện biên Gradient: Theo định nghĩa, gradient là một

véctơ có các thành phần biểu thị tốc độ thay đổi giá trị của điểm ảnh, ta có:

Trong đó: dx, dy là khoảng cách (tính bằng số điểm) theo hướng x và y Dựa trên kỹ thuật Gradient hình thành các thuật toán khác nhau sử dụng

để xác định biên trực tiếp từ đối tượng Dưới đây là một số kỹ thuật phát hiện biên trực tiếp

dy

y x f dy y x f fy y

y x f

dx

y x f y dx x f fx x

y x f

),(),

()

,(

),(),(

),(

Trang 35

i

i

H I

2.1.3 Kỹ thuật xây dựng đặc trưng ảnh từ biên

Dựa trên kỹ thuật phát hiện biên trực tiếp như đã trình bày ở phần trên của luận văn, tôi tìm hiểu các kỹ thuật xây dựng tập đặc trưng cho đối tượng nhận

dạng là lá cây dược liệu Các đặc trưng của lá cây dược liệu sẽ là yếu tố quyết định

trong việc tính toán ở trong mạng nơron vì thế việc tìm các đặc trưng là hết sức quan trọng Giả sử rằng ảnh đầu vào chỉ chụp một lá chúng ta sẽ sử dụng thuật toán Prewitt Edge Detection để tìm ra các đặc trưng của ảnh lá cây dược liệu

Kỹ thuật Prewitt Edge Detection

Đặc trưng Prewitt Edge Detection là một đặc trưng được xây dựng dựa trên biên của đối tượng Trong đó, đối tượng được xác định biên dựa trên một thuật toán phát hiện biên trực tiếp như đã trình bày ở trên, sau đó chúng ta xác định một tập các điểm đặc trưng rút gọn dựa trên tập biên ảnh thu được Đặc trưng Prewitt Edge Detection được xây dựng dựa trên tập điểm đặc trưng rút gọn này Chi tiết cụ thể các bước xây dựng đặc trưng Prewitt Edge Detection được trình bày trong lưu đồ giải thuật sau:

Trang 36

Hình 2.1: Lưu đồ kỹ thuật Prewitt Edge Detection

Với đặc trưng đặc trưng Prewitt Edge Detection ta xây dựng tập đặc trưng dựa trên đầu vào là ảnh lá cây dược liệu Thuật toán trích chọn gồm 3 bước cơ bản:

Bước 1: Tách biên ảnh lá cây dược liệu dựa trên thuật toán tách biên trực tiếp

Trang 37

Ảnh dược liệu trước tách biên Ảnh dược liệu sau tách biên

Hình 2.2: Ảnh lá cây dược liệu áp dụng thuật toán tách biên trực tiếp

Bước 2: Xác định tập đặc trưng điểm rút gọn, dựa trên tập biên thu được sau

quá trình tách biên ta thu được tập các điểm đặc trưng rút gọn Tập điểm đặc trưng rút gọn này sẽ làm cơ sở xây dựng các tam giác đặc trưng tại bước 3

Vì tập các điểm biên thu được khá nhiều do đó ta phải lược bướt các điển đặc trưng này bằng các tạo một ma trận lưới ép lên tập các điểm biên thu được Các điểm đặc trưng thu được là các điểm giao giữa ma trận lưới và tập điểm biên

Hình 2.3: Lưới phủ lên tập biên ảnh khi xác định tập đặc trưng điểm rút gọn

Trang 38

Dựa trên việc điều chỉnh khoảng cách (kích thước) giữa các ô của lưới

ta thu được số lượng các điểm đặc trưng khác nhau, từ đó số lượng tam giác đặc trưng thu được cũng khác nhau

Lưới lấy đặc trưng kích thước nhỏ Lưới lấy đặc trưng kích thước lớn

Hình 2.4: Lưới phủ lên tập biên ảnh khi xác định tập đặc trưng điểm rút gọn

với kích thước khác nhau

Bước 3: Xây dựng tập tam giác đặc trưng

Sau khi thu được tập các điểm đặc trưng rút gọn ta xác định được các ta giác vuống trong đó cứ hai điểm kề nhau của tập điểm đặc trưng rút gọn thu được một tam giác đặc trưng

Hình 2.5: Đặc trưng ảnh lá cây dược liệu

Trang 39

Bây giờ chúng ta sẽ đi sâu hơn vào hình tam giác vuông với cạnh huyền là đường nét đậm và hai đỉnh là hai hình vuông Tất cả các hình tam giác này của ảnh lá cây dược liệu sẽ biểu diễn đặc trưng của chiếc lá và chúng sẽ là đầu vào của mạng nơron mà chúng ta sẽ sử dụng để nhận dạng lá cây Giờ chúng ta sẽ xem xét kỹ hơn về một tam giác ví dụ như hình bên dưới:

Hình 2.6: Tam giác vuông biểu diễn góc đặc trưng

Từ tam giác vuông này chúng ta tính được sin(B) và cos(B) (cũng có thể

sử dụng sin(A), cos(A)) đây cũng chính là giá trí đại diện cho một điểm trên đặc trưng của cạnh lá cây dược liệu và hai giá trị này cũng chính là đầu vào của mạng nơron sử dụng để tính toán

Ngày đăng: 17/11/2017, 15:21

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Đỗ Năng Toàn, Phạm Việt Bình (2008), Xử lý ảnh, Nhà xuất bản Khoa học và kỹ thuật Hà Nội Sách, tạp chí
Tiêu đề: Xử lý ảnh
Tác giả: Đỗ Năng Toàn, Phạm Việt Bình
Nhà XB: Nhà xuất bản Khoa học và kỹ thuật Hà Nội
Năm: 2008
[2] Nguyễn Văn Tảo và nhóm nghiên cứu, Đề tài cấp Đại học Thái Nguyên “Nghiên cứu kỹ thuật tra cứu ảnh, ứng dụng trong tra cứu và quản lý một số loại cây dược liệu quý vùng rừng núi tỉnh Thái Nguyên”, 2013-2014 Sách, tạp chí
Tiêu đề: Nghiên cứu kỹ thuật tra cứu ảnh, ứng dụng trong tra cứu và quản lý một số loại cây dược liệu quý vùng rừng núi tỉnh Thái Nguyên
[3] Nguyễn Văn Tảo và cộng sự (2014), Sách chuyên khảo“Ứng dụng CNTT vào quản lý dữ liệu cây dược liệu”, NXB ĐHQGHN Sách, tạp chí
Tiêu đề: “Ứng dụng CNTT vào quản lý dữ liệu cây dược liệu”
Tác giả: Nguyễn Văn Tảo và cộng sự
Nhà XB: NXB ĐHQGHN
Năm: 2014
[4] Nguyễn Văn Tảo, Nguyễn Văn Huân, Lê Triệu Tuấn, (2013), “Một giải pháp thu thập và quản lý dữ liệu về cây dược liệu quý Việt Nam”, Tạp chí Khoa học và Công nghệ - ĐH Thái Nguyên.Tài liệu tiếng Anh Sách, tạp chí
Tiêu đề: Một" giải pháp thu thập và quản lý dữ liệu về cây dược liệu quý Việt Nam”", Tạp chí Khoa học và Công nghệ - ĐH Thái Nguyên
Tác giả: Nguyễn Văn Tảo, Nguyễn Văn Huân, Lê Triệu Tuấn
Năm: 2013
[5] J. Hertz, A. Krogh, and R.G. Palmer. (1991), Introduction to the Theory of Neural Computation, New York: Addison-Wesley Sách, tạp chí
Tiêu đề: Introduction to the Theory of Neural Computation
Tác giả: J. Hertz, A. Krogh, and R.G. Palmer
Năm: 1991
[6] Steve Lawrence and C. Lee Giles (2000), Overfitting and Neural Networks:Conjugate Gradient and Backpropagation, International Joint onference on Neural Networks, Como, Italy, July 24–27, 114–119, 2000 Sách, tạp chí
Tiêu đề: Overfitting and Neural Networks:Conjugate Gradient and Backpropagation
Tác giả: Steve Lawrence and C. Lee Giles
Năm: 2000
[7] Chin-Teng Lin, C.S. George Lee (1996), Neural fuzzy systems: a neuro- fuzzy synergism to intelligent systems, Prentice-Hall Inc Sách, tạp chí
Tiêu đề: Neural fuzzy systems: a neuro- fuzzy synergism to intelligent systems
Tác giả: Chin-Teng Lin, C.S. George Lee
Năm: 1996
[8] Nelson, M.C. and Illingworth, W.T. (1991), A Practical Guide to Neural Nets, Reading, MA: Addison-Wesley Sách, tạp chí
Tiêu đề: A Practical Guide to Neural Nets, Reading
Tác giả: Nelson, M.C. and Illingworth, W.T
Năm: 1991
[9] L.Wessels, E.Barnard (1992), Avoiding False Local Minima by Proper Initialization of Connections, IEEE Trans. on Neural Networks Sách, tạp chí
Tiêu đề: Avoiding False Local Minima by Proper Initialization of Connections
Tác giả: L.Wessels, E.Barnard
Năm: 1992
[10] D.E. Rumelhart; G.E. Hinton and R.J. Williams (1986), Learning internal representations by error propagation, Rumelhart, D.E. et al. (eds.):Parallel distributed processing: Explorations in the icrostructure of cognition (Cambridge MA.: MIT Press), 318-362 Sách, tạp chí
Tiêu đề: Learning internal representations by error propagation
Tác giả: D.E. Rumelhart; G.E. Hinton and R.J. Williams
Năm: 1986
[12] M. S. Prasad Babu & B.Srinivasa Rao, Leaves Recognition using Back Propagation Neural Network-Advice for Pest an Disease Control On Crops.Andhra University, Visakhapatnam-AP-India-530 003 Sách, tạp chí
Tiêu đề: Leaves Recognition using Back Propagation Neural Network-Advice for Pest an Disease Control On Crops
[13] Jyotismita Chaki, Ranjan Parekh, Plant Leaf Recognition using Shape based Features and Neural Network classifiers, International Journal of Advanced Computer Science and Applications, Vol. 2, No. 10, 2011 Sách, tạp chí
Tiêu đề: Plant Leaf Recognition using Shape based Features and Neural Network classifiers
[14] Qingfeng Wu, Changle Zhou and Chaonan Wang, Feature Extraction and Automatic Recognition of Plant Leaf Using Artificial Neural Network, Xiamen University, 361005, Fujian, P.R. China Sách, tạp chí
Tiêu đề: Feature Extraction and Automatic Recognition of Plant Leaf Using Artificial Neural Network
[15] Kue-Bum Lee and Kwang-Seok Hong, (2013), An implementation of Leaf Recognition System using Leaf Vein and Shape, International Journal of Bio-Science and Bio-Technology, Vol. 5, No. 2, South Korea Sách, tạp chí
Tiêu đề: An implementation of Leaf Recognition System using Leaf Vein and Shape
Tác giả: Kue-Bum Lee and Kwang-Seok Hong
Năm: 2013
[16] Patil J.K and Rạ Kumar, (2012), Feature extraction of diseased leaf images, Journal of Signal and Image Processing, Volume 3, Issue 1, pp. 60- 63, India Sách, tạp chí
Tiêu đề: Feature extraction of diseased leaf images
Tác giả: Patil J.K and Rạ Kumar
Năm: 2012
[17] Sarah Gillett and Anna Lawrence, (2004), Methodology for planning sustainable management of medicinal plants in India and Nepal, Oxford, OX1 3UB, UK Sách, tạp chí
Tiêu đề: Methodology for planning sustainable management of medicinal plants in India and Nepal
Tác giả: Sarah Gillett and Anna Lawrence
Năm: 2004
[18] Jayamala K. Patil and Raj Kumar, (2011), ”Advances in image processing for detection of plant diseases”, Journal of Advanced Bioinformatics Applications and Research, Vol 2, Issue 2, pp. 135-141 Sách, tạp chí
Tiêu đề: ”Advances in image processing for detection of plant diseases”
Tác giả: Jayamala K. Patil and Raj Kumar
Năm: 2011
[19] Ji-Xiang Du, Xiao-Feng Wang and Guo-Jun Zhang, (2007), “Leaf shape based plant species recognition”, China Sách, tạp chí
Tiêu đề: “Leaf shape based plant species recognition”
Tác giả: Ji-Xiang Du, Xiao-Feng Wang and Guo-Jun Zhang
Năm: 2007

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w