1. Trang chủ
  2. » Luận Văn - Báo Cáo

DATN Nhận dạng biển số xe bằng mạng nơ ron nhân tạo Có code

58 205 5

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 58
Dung lượng 3,02 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Nhận dạng sử dụng matlab, dùng mạng nơ ron nhân tạo. Vui lòng liên hệ tôi để lấy phần dữ liệu train.Nhận dạng sử dụng matlab, dùng mạng nơ ron nhân tạo. Vui lòng liên hệ tôi để lấy phần dữ liệu train.Nhận dạng sử dụng matlab, dùng mạng nơ ron nhân tạo. Vui lòng liên hệ tôi để lấy phần dữ liệu train.Nhận dạng sử dụng matlab, dùng mạng nơ ron nhân tạo. Vui lòng liên hệ tôi để lấy phần dữ liệu train.Nhận dạng sử dụng matlab, dùng mạng nơ ron nhân tạo. Vui lòng liên hệ tôi để lấy phần dữ liệu train.Nhận dạng sử dụng matlab, dùng mạng nơ ron nhân tạo. Vui lòng liên hệ tôi để lấy phần dữ liệu train.Nhận dạng sử dụng matlab, dùng mạng nơ ron nhân tạo. Vui lòng liên hệ tôi để lấy phần dữ liệu train.Nhận dạng sử dụng matlab, dùng mạng nơ ron nhân tạo. Vui lòng liên hệ tôi để lấy phần dữ liệu train.Nhận dạng sử dụng matlab, dùng mạng nơ ron nhân tạo. Vui lòng liên hệ tôi để lấy phần dữ liệu train.Nhận dạng sử dụng matlab, dùng mạng nơ ron nhân tạo. Vui lòng liên hệ tôi để lấy phần dữ liệu train.Nhận dạng sử dụng matlab, dùng mạng nơ ron nhân tạo. Vui lòng liên hệ tôi để lấy phần dữ liệu train.Nhận dạng sử dụng matlab, dùng mạng nơ ron nhân tạo. Vui lòng liên hệ tôi để lấy phần dữ liệu train.Nhận dạng sử dụng matlab, dùng mạng nơ ron nhân tạo. Vui lòng liên hệ tôi để lấy phần dữ liệu train.

Trang 1

KHOA ĐIỆN

NHẬN XÉT ĐỒ ÁN TỐT NGHIỆP

I Thông tin chung:

1 Họ và tên sinh viên: ………

Trang 2

KHOA ĐIỆN

NHẬN XÉT PHẢN BIỆN ĐỒ ÁN TỐT NGHIỆP

I Thông tin chung:

5 Họ và tên sinh viên: ……….………

6 Lớp: ……….……… Số thẻ SV: ………

7 Tên đề tài: ……….………

8 Người phản biện: ……….………… Học hàm/ học vị: …………

II Nhận xét, đánh giá đồ án tốt nghiệp:

tối đa

Điểm trừ

Điểm còn lại

1 Sinh viên có phương pháp nghiên cứu phù hợp, giải

1a - Hiểu và vận dụng được kiến thức Toán và khoa học tự

1b - Hiểu và vận dụng được kiến thức cơ sở và chuyên ngành

1c - Có kỹ năng vận dụng thành thạo các phần mềm mô phỏng,

1d - Có kỹ năng đọc, hiểu tài liệu bằng tiếng nước ngoài ứng dụng trong vấn đề nghiên cứu 10

1e - Có kỹ năng làm việc nhóm, kỹ năng giải quyết vấn đề 10

1f - Đề tài có giá trị khoa học, công nghệ; có thể ứng dụng thực tiễn: 10

2a - Bố cục hợp lý, lập luận rõ ràng, chặt chẽ, lời văn súc tích 15

2b - Thuyết minh đồ án không có lỗi chính tả, in ấn, định dạng 5

3 Tổng điểm đánh giá: theo thang 100

Quy về thang 10 (lấy đến 1 số lẻ)

3 Các tồn tại, thiếu sót cần bổ sung, chỉnh sửa:

Trang 3

Tên đề tài: Tự động nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo

Sinh viên thực hiện:

Hoàng Đức Nhật Số thẻ SV: 105140302 Lớp: 14TDH1 Dương Đức Khải Số thẻ SV: 105140344 Lớp: 14TDH2

Bản báo cáo gồm các phần theo thứ tự sau:

Trang 4

ĐẠI HỌC ĐÀ NẴNG

TRƯỜNG ĐẠI HỌC BÁCH KHOA

KHOA ĐIỆN

CỘNG HÒA XÃ HÔI CHỦ NGHĨA VIỆT NAM

Độc lập - Tự do - Hạnh phúc

NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP

Họ tên sinh viên: Dương Đức Khải Số thẻ sinh viên: 105140344

Lớp: 14TDH2 Khoa: Điện Ngành: Kỹ thuật điều khiển & tự động hóa

4.1 Tên đề tài đồ án:

Tự động nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo

4.2 Đề tài thuộc diện: ☐ Có ký kết thỏa thuận sở hữu trí tuệ đối với kết quả thực hiện

4.3 Các số liệu và dữ liệu ban đầu:

……… ……… ……

………

… ……….… ……… ………

4.4 Nội dung các phần thuyết minh và tính toán: … ………

… ………

… ………

… ………

… ………

4.5 Các bản vẽ, đồ thị ( ghi rõ các loại và kích thước bản vẽ ): … ………

… ………

… ………

… ………

4.6 Họ tên người hướng dẫn: TS Nguyễn Quốc Định 4.7 Ngày giao nhiệm vụ đồ án: …… /……./201…

4.8 Ngày hoàn thành đồ án: …… /……./201…

Đà Nẵng, ngày tháng năm 201

Trang 5

LỜI NÓI ĐẦU

Ngày nay, việc nghiên cứu trí tuệ nhân tạo và đưa nó vào các ứng dụng thực tế đang ngày càng nhiều, và ngày càng chứng tỏ được thế mạnh của mình trong các công việc đòi hỏi khả năng suy nghĩ và tính toán giống như con người Trong giao thông, trí tuệ nhân tạo (AI) đã được sử dụng trong việc đếm xe, phân tích mật độ giao thông, dự báo đông xe, tắc đường, phục vụ tối ưu hoá điều khiển đèn tín hiệu giao thông và ngày càng phát triển Và trong quá trình hoàn thành đề tài tốt nghiệp, bản thân em đã học hỏi được rất nhiều kiến thức, kinh nghiệm quý báu trong khi thực hiện đề tài với sự giúp đỡ nhiệt tình của các thầy cô trong bộ môn Tự Động Hóa - khoa Điện

Tuy đã có nhiều cố gắng trong quá trình thực hiện đề tài nhưng sẽ không tránh khỏi những sai sót, mong quý thầy cô bỏ qua và giúp đỡ để em có thể hoàn thành tốt nhiệm

vụ và củng cố kiến thức ngày càng vững vàng hơn nhằm trang bị những kiến thức cần thiết để tạo bước đệm khi ra trường đi làm

Em xin gửi lời cám ơn đến thầy Nguyễn Quốc Định, thầy là người đã hướng dẫn tận tình và tạo mọi điều kiện thuận lợi cho em hoàn thành đồ án này

Em cũng xin chân thành bày tỏ lòng biết ơn sâu sắc đến các Thầy Cô trong trường Đại Học Bách Khoa- Đại Học Đà Nẵng đặc biệt là các Thầy Cô trong bộ môn Tự Động Hóa đã truyền thụ những kiến thức quý báu cho em trong những năm học qua

Em xin chân thành cảm ơn

Trang 6

Tôi xin cam đoan đây là công trình nghiên cứu của riêng nhóm em và được sự hướng dẫn của thầy Nguyễn Quốc Định Các nội dung nghiên cứu, kết quả trong đề tài này là trung thực và chưa công bố dưới bất kỳ hình thức nào trước đây Các tài liệu tham khảo trong đồ án đã được nêu rõ trong mục tài liệu tham khảo đảm bảo về liêm chính học thuật

Sinh viên thực hiện

Trang 7

MỤC LỤC

1.1 Lý do chọn đề tài 2

1.1.1 Nhu cầu thực tế 2

1.1.2 Mong muốn mở mang kiến thức đối với lĩnh vực mới 3

1.2 Phân tích ưu nhược điểm và so sánh giữa công nghệ trí tuệ nhân tạo với công nghệ object motion 3

1.2.1 Công nghệ object motion 3

1.2.2 Công nghệ trí tuệ nhân tạo 4

1.3 Một số khái niệm 5

1.3.1 Xử lý ảnh 5

1.3.1.1 Khái niệm 5

1.3.1.2 Các phân ngành chính 5

1.3.1.3 Ứng dụng 5

1.3.2 Định dạng file ảnh 6

1.3.2.1 Khái niệm 6

1.3.2.2 Một số kiểu định dạng thường gặp 6

1.3.3 Ảnh số 8

1.3.3.1 Một số khái niệm 8

1.3.3.2 Mô tả ảnh số 8

1.3.3.3 Một số loại ảnh số 9

1.4 Giới thiệu về công nghệ trí tuệ nhân tạo 11

1.4.1 Khái niệm 11

1.4.2 Các trường phái trí tuệ nhân tạo 11

1.4.3 Ứng dụng của trí tuệ nhân tạo 12

1.5 Giới thiệu về phần mềm matlab 12

1.5.1 Khái quát 12

1.5.2 Các phép tính toán phổ biến của matlab 13

1.5.3 Các tính năng của matlab 13

1.5.4 Các ứng dụng của matlab 13

Trang 8

Chương 2: Sơ lược về mạng neural và mạng neural tích chập Trang

2.1 Sơ lược về mạng neural 14

2.1.1 Lịch sử phát triển của mạng neural 14

2.1.2 Mô hình mạng neural 16

2.1.2.1 Mô hình neural sinh học 16

2.1.2.2 Mô hình neural nhân tạo 17

2.1.3 Cấu trúc mạng neural 19

2.1.4 Các tính chất của mạng neural nhân tạo 21

2.1.5 Các luật học của mạng neural nhân tạo 21

2.2 Mạng neural tích chập (CNNs) 22

2.2.1 Định nghĩa mạng neural tích chập (CNNs) 22

2.2.2 Các thành phần của mạng neural tích chập (CNNs) 22

Chương 3: Giải thuật và quy trình thực hiện Trang 3.1 Giải thuật tổng quát 33

3.2 Quy trình thực hiện 34

3.2.1 Định vị và tách vùng chứa của biển số ra khỏi ảnh 34

3.2.1.1 Mô tả 34

3.2.1.2 Các bước thự hiện 34

3.2.1.3 Giải thuật của đoạn chương trình định vị và tách biển số 35

3.2.2 Định vị và tách từng ký tự trên biển số 37

3.2.2.1 Mô tả 37

3.2.2.2 Các bước thự hiện 37

3.2.2.3 Giải thuật của đoạn chương trình định vị và tách từng ký tự trên biển số 38 3.2.3 Xây dựng và huấn luyện mạng neural (CNNs) 39

3.2.3.1 Xây dựng mạng neural (CNNs) 39

3.2.3.2 Huấn luyện mạng neural (CNNs) 40

Chương 4: Kết quả và hướng phát triển Trang 4.1 Kết quả 41

4.2 Giới hạn của đề tài 43

4.2.1 Những giới hạn về các dụng cụ thiết bị 43

4.2.2 Những giới hạn về con người và thời gian 44

4.3 Hướng phát triển của đề tài 44

Trang 9

DANH SÁCH CÁC BẢNG, HÌNH VẼ

Hình 1.1 Apple đang phát triển công nghệ nhận diện khuôn mặt 2

Hình 1.2 Hệ thống chấm điểm công dân ở Trung Quốc 2

Hình 1.3 Giao thông thông minh 3

Hình 1.4 Công nghệ object motion 3

Hình 1.5 Công nghệ trí tuệ nhân tạo 4

Hình 1.6 Các định dạng file thông dụng 6

Hình 1.7 Một bức ảnh định dạng JPG 6

Hình 1.8 Một bức ảnh định dạng PNG 7

Hình 1.9 Một bức ảnh định dạng GIF 7

Hình 1.10 Ảnh số là một ma trận các pixel 8

Hình 1.11 Một bức ảnh nhị phân 9

Hình 1.12 Một bức ảnh xám 10

Hình 1.13 Một bức ảnh RGB 10

Hình 1.14 Công cụ toán học matlab 12

Hình 2.1 Mô hình neural sinh học 16

Hình 2.2 Mô hình neural nhân tạo 17

Hình 2.3 Mạng neural 3 lớp 19

Hình 2.4 Sơ đồ cấu trúc một số mạng neural 20

Hình 2.5 Ví dụ minh họa về CNNs 22

Hình 2.6 Có phải là X không? 23

Hình 2.7 Đặc điểm chung 23

Hình 2.8 Các feature khớp với phần trung tâm và phần cánh của X 24

Hình 2.9 Tích chập 24

Hình 2.10 Tính toán sự khớp 25

Hình 2.11 Gộp chung (pooling) 26

Hình 2.12 Tinh chỉnh các đơn vị tuyến tính (Rectified Linear Units) 27

Hình 2.13 Học sâu (Deep learning) 27

Trang 10

Hình 2.14 CNN đào tạo nhận diện mặt người 28

Hình 2.15 Cuộc bầu chọn 28

Hình 2.16 Các layer được kết nối đầy đủ 29

Hình 2.17 Lan truyền ngược 29

Hình 2.18 Phân loại dữ liệu khác 31

Hình 2.19 Phân loại dữ liệu khách hàng 31

Hình 3.1 Giải thuật tổng quát của đề tài 33

Hình 3.2 Tách biển số 34

Hình 3.3 Các biến đổi ảnh của quá trính tách biển số 34

Hình 3.4 Giải thuật của đoạn chương trình định vị và tách biển số 36

Hình 3.5 Định vị và tách từng ký tự 37

Hình 3.6 Giải thuật của đoạn chương trình định vị và tách từng ký tự của biển số 38

Hình 3.7 Các thành phần của mạng neural CNNs 39

Hình 3.8 Huấn luyện mạng neural CNNs 40

Hình 4.1 Kết quả mô phỏng biển số xe ‘51A – 212.18’ 41

Hình 4.2 Kết quả mô phỏng biển số xe ‘51A – 175.56’ 42

Hình 4.3 Kết quả mô phỏng biển số xe ‘43A – 339.94’ 42

Hình 4.4 Kết quả mô phỏng biển số xe ‘99K – 9999’ 43

DANH SÁCH CÁC CỤM TỪ VIẾT TẮT 1 JPEG - Joint Photographic Experts Group

2 PNG - Portable Network Graphics

3 GIF - Graphics Interchange Format

4 AI - Artificial Intelligence

5 CNN - Convolutional Neural Network

Trang 11

TÀI LIỆU THAM KHẢO

https://www.mathworks.com/solutions/deep-learning/convolutional-neural-network.html [5] Computer Vision Toolbox:

https://www.mathworks.com/products/computer-vision.html

Trang 12

MỞ ĐẦU

 Mục đích thực hiện đề tài:

- Hoàn thành đồ án tốt nghiệp, kết thúc khóa học

- Nâng cao kiến thức, kỹ năng

 Mục tiêu thực hiện đề tài:

- Xử lý nhận dạng được biển số xe bằng công nghệ trí tuệ nhân tạo

- Tăng độ chính xác, giảm sai số

 Phạm vi và đối tượng nghiên cứu:

- Xử lý ảnh

- Công nghệ trí tuệ nhân tạo

 Phương pháp nghiên cứu:

Sử dụng phương pháp phân tích và tổng hợp lý thuyết

 Cấu trúc đồ án tốt nghiệp:

- Các thông tin bổ trợ

- Nội dung chính (gồm 4 chương)

Trang 13

Chương 1: TỔNG QUAN VỀ ĐỀ TÀI

1.1 Lý do chọn đề tài

1.1.1 Nhu cầu thực tế

Cùng với sự phát triển của khoa học kỹ thuật, nhu cầu quản lý & kiểm soát xe cộ, máy móc, con người và xã hội ngày càng cao

Hình 1.1 Apple đang phát triển công nghệ nhận diện khuôn mặt

Hình 1.2 Hệ thống chấm điểm công dân ở Trung Quốc Với sự phức tạp vốn có và tăng không ngừng của các đối tượng, việc quản lý còn gặp vô vàn khó khăn, trở ngại Do đó, nhu cầu thực tế về một hệ thống quản lý & kiểm soát tự động sử dụng công nghệ cao để giải quyết những vấn đề đó là vô cùng cần thiết

và cấp bách

Trang 14

1.1.2 Mong muốn mở mang kiến thức đối với lĩnh vực mới

Một trong những vấn đề khá nóng hổi của nước ta là công tác quản lý giao thông

đô thị Với sự giới thiệu và giúp đỡ định hướng của thầy TS.Nguyễn Quốc Định về một

dự án giao thông thông minh đang được nghiên cứu, tiến hành ở TP.Hồ Chí Minh và

với nhu cầu của cá nhân mỗi thành viên, nhóm của em đã lựa chọn đề tài “Tự động nhận dạng biển số xe bằng công nghệ trí tuệ nhân tạo” với mục tiêu hoàn thành đồ

án tốt nghiệp và mở mang kiến thức trong một lĩnh vực vô cùng mới mẻ

Hình 1.3 Giao thông thông minh

1.2 Phân tích ưu nhược điểm và so sánh giữa công nghệ trí tuệ nhân tạo với công

nghệ object motion

1.2.1 Công nghệ object motion

 Công nghệ object motion được áp dụng khá phổ biến trong nhiều lĩnh vực như bán lẻ, an ninh, giao thông…

Công nghệ sử dụng các thuật toán lọc các lớp hình ảnh và tìm ra đặc trưng của object Các đối tượng object được định nghĩa, gán thông qua object referience, có kích thước (diện tích, chiều cao, chiều rộng), vận tốc di chuyển…

Ví dụ: Người được tham chiếu qua object referience với chiều cao từ 0,5 đến 2m, chiều rộng khoảng 0.5m, có tốc độ di chuyển nhỏ hơn 30 km/h Các object khi gán đối tượng là nhóm người, ô tô, xe tải, xe máy, vật thể cũng được định nghĩa theo các đặc tính chiều cao, diện tích, tốc độ phù hợp

Hình 1.4 Công nghệ object motion

Trang 15

 Ưu điểm:

Công nghệ sử dụng thuật toán đơn giản và tính toán không lớn nên có ưu điểm sử dụng ít tài nguyên, giá thành hệ thống phấn cứng không quá đắt, có thể phân tích được tại camera hoặc tại trung tâm quản lý

 Nhược điểm:

- Do công nghệ định nghĩa các object thông qua object referience và các thuộc tính như chiều cao, chiều rộng, kích thước, tốc độ… nên đây chính là điểm yếu cốt tử của công nghệ này

- Các object được gán thuộc tính như vậy sẽ làm cho số lượng object có thể phân loại được ít hơn do số lượng thuộc tính ít, khó phân loại Đặc biệt khả năng nâng cấp nhận biết thêm nhiều object bị giới hạn, phải chờ đợi và tốn nhiều nguồn lực cho việc lập trình và phát triển

- Với các object có các thuộc tính tương tự như vậy nên hệ thống bị nhầm lẫn dẫn đến kết quả phân tích bị sai Thực tiễn đã có rất nhiều trường hợp sai dẫn đến các cảnh báo giả gây phiền nhiễu cho khách hàng trong phân tích như: các con vật như Chó, mèo, chuột, côn trùng, lá cây…chuyển động Đếm xe, phân tích khi mật độ giao thông đông, thời tiết xấu, đếm người sai khi siêu thị đông người…

1.2.2 Công nghệ trí tuệ nhân tạo

 Công nghệ Trí tuệ nhân tạo là công nghệ mới nhất và cao cấp nhất hiện nay,

nó được ứng dụng ngày càng rộng rãi và mang lại nhiều lợi ích vô hạn

Hình 1.5 Công nghệ trí tuệ nhân tạo

 Một số ứng dụng:

- Ứng dụng trong phân tích y tế, phát hiện gãy xương, ung thư,…

- Ứng dụng để quản lý con người, giao thông, xã hội

- Ứng dụng phân tích, cảnh báo trong bảo vệ an ninh

- Ứng dụng trong giáo dục,…

Trang 16

 Ưu điểm:

- Điểm nổi trội nhất của công nghệ này chính là khả năng học tập và phát triển như một bộ não con người thực sự, điều này giúp cho hệ thống tiến hóa theo thời gian Với lượng dữ liệu, các tình huống trong cuộc sống, các sự kiện… hàng ngày do các hoạt động của con người tạo ra sẽ được thu thập, học tập và khai thác, hệ thống sẽ ngày càng giúp ích và tập trung hóa mang lại nhiều lợi ích cho người dùng

- Các vấn đề cốt tử của công nghệ cũ như Object motion phải được định nghĩa gán thuộc tính, hay nhận diện sai (do object có ít thuộc tính và thuộc tính phân loại trùng nhau rất nhiều) được giải quyết đơn giản bằng cách cho hệ thống học, việc học rất dễ dàng không cần phải lập trình hệ thống

- Khả năng tự động hóa, tiến hóa cao và nhanh giúp chi phí ngày càng giảm

 Nhược điểm:

- Hệ thống dùng nhiều dữ liệu để học tập nên đôi khi không thông minh ngay được, không sử dụng tức thời được, đây là ưu điểm nhưng cũng là nhược điểm

- Do hệ thống học tập và phân loại chính xác nên đòi hỏi nền tảng hạ tầng phục

vụ cho năng lực tính toán cao nên chi phí đầu tư ban đầu sẽ lớn, tuy nhiên lợi ích lâu dài sẽ rất lớn

- Nhận dạng biển số xe, khuôn mặt, chữ viết,…

- Xử lý ảnh trong thiên văn và y tế,…

Trang 17

Hình 1.7 Một bức ảnh định dạng JPG

Trang 18

 Định dạng PNG:

PNG là viết tắc của Portable Network Graphics, là một định dạng hình ảnh mà sử dụng phương pháp nén dữ liệu mới mà không giảm chất lượng, được tạo ra nhằm thay thế cho file GIF và đang được sử dụng nhiều trên Internet Có 2 định dạng PNG khác nhau là PNG-8 và PNG-24 PNG-8 tương đương với định dạng GIF, hỗ trợ 256 màu, màu trong suốt, đồng thời còn có dung lượng rất nhỏ (thậm chí còn nhỏ hơn file GIF) Trong khi đó, PNG-24 có thể gồm 26 triệu màu và được nén theo chuẩn Lossless, có nghĩa là file sẽ lớn hơn JPG

Hình 1.8 Một bức ảnh định dạng PNG

 Định dạng GIF:

GIF là viết tắt của Graphics Interchange Format, một định dạng hình ảnh được tạo

ra bởi CompuServe GIF sử dụng thuật nén theo chuẩn Lossless nên không bị mất dữ liệu khi nén Mỗi hình ảnh GIF có thể bao gồm tối đa 256 màu Vì hỗ trợ ít màu nên file GIF thường có dung lượng nhỏ hơn JPG rất nhiều

Đặc biệt, file GIF có khả năng lưu lại màu trong suốt và hỗ trợ hình ảnh động File GIF thường sử dụng với những hình ảnh đơn giản, ít màu sắc, hình động hay những icon nhỏ

Hình 1.9 Một bức ảnh định dạng GIF

Trang 19

1.3.3 Ảnh số

1.3.3.1 Một số Khái niệm

 Ảnh số: là tập hợp hữu hạn các điểm ảnh với mức xám phù hợp dùng để mô

tả ảnh gần với ảnh thật Số điểm ảnh xác định độ phân giải của ảnh Ảnh có

độ phân giải càng cao thì càng thể hiện rõ nét các đặt điểm của tấm hình đồng thời càng làm cho tấm ảnh trở nên thực và sắc nét hơn

 Điểm ảnh (Pixel): là một phần tử của ảnh số tại toạ độ (x, y) với độ xám

hoặc màu nhất định Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh

 Mức xám: Là kết quả của sự biến đổi tương ứng 1 giá trị độ sáng của 1

điểm ảnh với 1 giá trị nguyên dương Thông thường nó xác định trong [0, 255] tuỳ thuộc vào giá trị mà mỗi điểm ảnh được biểu diễn Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256 là mức phổ dụng

Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám Mức

xám dùng 1 byte biểu diễn gồm 256 mức, tức là từ 0 đến 255)

 Độ phân giải (Resolution): là mật độ điểm ảnh được ấn định trên một ảnh

Trang 20

- Ảnh số được xem là một ma trận mà trong đó mỗi pixel sẽ ứng với một phần

tử của ma trận

- Chiều dài và chiều rộng (đơn vị pixel) của ảnh cũng chính là chiều dài và chiều rộng (đơn vị phần tử) của ma trận đó

- Trong hình trên mô tả một ma trận hai chiều, với mỗi phần tử Aij là một

pixel của ảnh hay còn gọi là điểm ảnh Mỗi pixel chứa thông tin về tọa độ của nó và cường độ sáng Một ảnh chứa càng nhiều pixel thì càng trở nên chi tiết và ấn tượng hơn Số pixel trong một ảnh chính bằng tích của chiều dài nhân với chiều rộng theo đơn vị pixel (ixj)

- Tùy vào số chiều của ma trận và mức xám mà ta có nhiều loại ảnh số khác nhau Ví dụ như ảnh đen trắng, ảnh xám và ảnh RGB,…

1.3.3.3 Một số loại ảnh số

 Ảnh nhị phân:

Là ma trận hai chiều có giá trị xám của tất cả các điểm ảnh chỉ nhận giá trị 1 hoặc

0 Như vậy mỗi điểm ảnh trong ảnh nhị phân được biểu diễn bởi 1 bit

Hình 1.11 Một bức ảnh nhị phân

Trang 21

- Trong ảnh RGB kiểu 24bpp, mỗi điểm ảnh có chứa giá trị gồm 3 màu đỏ

(red) + xanh lục (green) + xanh dương (blue), mỗi màu có giá trị từ 0 đến

255 thể hiện cường độ màu của màu đó, nghĩa là mỗi điểm ảnh cần 24bits

hay 3bytes để biểu diễn và màu sắc của điểm ảnh đó chính là sự pha trộn của

3 giá trị màu của nó

- Đơn vị bpp nghĩa là Bits per pixel

Ví dụ: 24 Bits per pixel nghĩa là một điểm ảnh được biểu diễn bằng 24 pixel

=> với kiểu 24bpp thì ta có tối đa 16.777.216 (256x256x256) màu

Trang 22

1.4 Giới thiệu về công nghệ trí tuệ nhân tạo

1.4.1 Khái niệm

Trí tuệ nhân tạo hay trí thông minh nhân tạo (Artificial Intelligence hay Machine

Intelligence, thường được viết tắt là AI) là trí tuệ được biểu diễn bởi bất cứ một hệ thống

nhân tạo nào Thuật ngữ này thường dùng để nói đến các máy tính có mục đích không nhất định và ngành khoa học nghiên cứu về các lý thuyết và ứng dụng của trí tuệ nhân tạo

Tuy rằng trí thông minh nhân tạo có nghĩa rộng như là trí thông minh trong các tác phẩm khoa học viễn tưởng, nó là một trong những ngành trọng yếu của tin học Trí thông minh nhân tạo liên quan đến cách cư xử, sự học hỏi và khả năng thích ứng thông minh của máy móc Các ví dụ ứng dụng bao gồm các tác vụ điều khiển, lập kế hoạch và lập lịch (scheduling), khả năng trả lời các câu hỏi về chẩn đoán bệnh, trả lời khách hàng về các sản phẩm của một công ty, nhận dạng chữ viết tay, nhận dạng tiếng nói và khuôn mặt Bởi vậy, trí thông minh nhân tạo đã trở thành một môn học, với mục đích chính là cung cấp lời giải cho các vấn đề của cuộc sống thực tế Ngày nay, các hệ thống nhân tạo được dùng thường xuyên trong kinh tế, y dược, các ngành kỹ thuật và quân sự, cũng như trong các phần mềm máy tính thông dụng trong gia đình và trò chơi điện tử

1.4.2 Các trường phái trí tuệ nhân tạo

Trí tuệ nhân tạo (AI) chia thành hai trường phái tư duy: Trí tuệ nhân tạo truyền

thống và Trí tuệ tính toán

 Trí tuệ nhân tạo truyền thống hầu như bao gồm các phương pháp hiện được phân loại là các phương pháp học máy (machine learning), đặc trưng bởi hệ hình thức (formalism) và phân tích thống kê Nó còn được biết với các tên Trí tuệ nhân tạo biểu tượng, Trí tuệ nhân tạo logic, Trí tuệ nhân tạo ngăn nắp (neat AI) và Trí tuệ nhân tạo cổ điển (Good Old Fashioned Artificial Intelligence) Các phương pháp gồm có:

- Hệ chuyên gia: áp dụng các khả năng suy luận để đạt tới một kết luận Một

hệ chuyên gia có thể xử lý các lượng lớn thông tin đã biết và đưa ra các kết luận dựa trên các thông tin đó

- Lập luận theo tình huống

- Mạng Bayes

 Trí tuệ tính toán nghiên cứu việc học hoặc phát triển lặp (ví dụ: tinh chỉnh tham số trong hệ thống, chẳng hạn hệ thống connectionist) Việc học dựa trên dữ liệu kinh nghiệm và có quan hệ với Trí tuệ nhân tạo phi ký

hiệu, Trí tuệ nhân tạo lộn xộn (scruffy AI) và tính toán mềm (soft

computing) Các phương pháp chính gồm có:

- Mạng neural: các hệ thống mạnh về nhận dạng mẫu (pattern recognition)

- Hệ mờ (Fuzzy system): các kỹ thuật suy luận không chắc chắn, đã được sử dụng rộng rãi trong các hệ thống công nghiệp hiện đại và các hệ thống quản

lý sản phẩm tiêu dùng

- Tính toán tiến hóa (Evolutionary computation): ứng dụng các khái niệm sinh học như quần thể, biến dị và đấu tranh sinh tồn để sinh các lời giải ngày càng

Trang 23

tốt hơn cho bài toán Các phương pháp này thường được chia thành các thuật toán tiến hóa (ví dụ thuật toán gene) và trí tuệ bầy đàn (swarm intelligence) (chẳng hạn hệ kiến)

- Trí tuệ nhân tạo dựa hành vi (Behavior based AI): một phương pháp module

để xây dựng các hệ thống trí tuệ nhân tạo bằng tay

1.4.3 Ứng dụng của trí tuệ nhân tạo

 Trí tuệ nhân tạo (AI) được tạo ra nhằm trợ giúp hoặc thay thế con người ở rất nhiều lĩnh vực vì thế nó được ứng dụng rất rộng rãi trong:

 Trí tuệ nhân tạo đang là mục tiêu theo đuổi của nhiều ông lớn:

- Google đã và đang ứng dụng AI vào lĩnh vực xe tự hành

- Google ứng dụng AI trong việc nhận diện giọng nói

- Facebook sử dụng trí tuệ nhân tạo trong việc nhận diện hình ảnh

- Microsoft đang theo đuổi dự án điều trị ung thư bằng trí trí tuệ nhân tạo

1.5 Giới thiệu về phần mềm matlab

1.5.1 Khái quát

MATLAB là phần mềm cung cấp môi trường tính toán số và lập trình, do công

ty MathWorks thiết kế MATLAB cho phép tính toán số với ma trận, vẽ đồ thị hàm

số hay biểu đồ thông tin, thực hiện thuật toán, tạo các giao diện người dùng và liên kết với những chương trình máy tính viết trên nhiều ngôn ngữ lập trình khác

Với thư viện Toolbox, MATLAB cho phép mô phỏng tính toán, thực nghiệm

nhiều mô hình trong thực tế và kỹ thuật

Hình 1.14 Công cụ toán học matlab

Trang 24

1.5.2 Các phép tính toán phổ biến của matlab

 MATLAB được sử dụng rộng rãi trong mọi khía cạnh tính toán Dưới đây là một số phép tính toán MATLAB được sử dụng phổ biến nhất:

1.5.3 Các tính năng của matlab

 Dưới đây là các tính năng cơ bản của MATLAB:

- MATLAB là ngôn ngữ lập trình cao cấp, cho phép tính toán các con số, hình dung và phát triển ứng dụng

- Cung cấp môi trường tương tác để khảo sát, thiết kế và giải quyết các vấn

đề

- Cung cấp thư viện lớn các hàm toán học cho đại số tuyến tín, thống kê, phân tích Fourier, bộ lọc, tối ưu hóa, tích phân và giải các phương trình vi phân bình thường

- MATLAB cung cấp các đồ thị được tích hợp sẵn để hiển thị hình ảnh dữ liệu

và các công cụ để tạo đồ thị tùy chỉnh

- Giao diện lập trình của MATLAB cung cấp các công cụ phát triển để nâng cao khả năng bảo trì chất lượng mã và tối đa hóa hiệu suất

- Cung cấp các công cụ để xây dựng các ứng dụng với các giao diện đồ họa tùy chỉnh

- Cung cấp các hàm để tích hợp các thuật toán dựa trên MATLAB với các ứng dụng bên ngoài và các ngôn ngữ khác như C, Java, NET và Microsoft Excel

1.5.4 Các ứng dụng của matlab

 MATLAB được sử dụng rộng rãi như công cụ tính toán trong các lĩnh vực khoa học và kỹ thuật, bao gồm các lĩnh vực vật lý, hóa học, toán học và công nghệ MATLAB được sử dụng trong một loạt các ứng dụng bao gồm:

- Xử lý tín hiệu và truyền thông

Trang 25

Chương 2: Sơ lược về mạng neural và mạng neural tích chập

2.1 Sơ lược về mạng neural

2.1.1 Lịch sử phát triển của mạng neural

Các nghiên cứu về bộ não con người đã được tiến hành từ hàng nghìn năm nay Cùng với sự phát triển của khoa học kĩ thuật đặc biệt là những tiến bộ trong ngành điện

tử hiện đại, việc con người bắt đầu nghiên cứu các nơron nhân tạo là hoàn toàn tự nhiên

Sự kiện đầu tiên đánh dấu sự ra đời của mạng nơron nhân tạo diễn ra vào năm 1943 khi nhà thần kinh học Warren McCulloch và nhà toán học Walter Pitts viết bài báo mô tả cách thức các nơron hoạt động Họ cũng đã tiến hành xây dựng một mạng nơron đơn giản bằng các mạch điện Các nơron của họ được xem như là các thiết bị nhị phân với ngưỡng cố định Kết quả của các mô hình này là các hàm logic đơn giản chẳng hạn như

“ a OR b” hay “a AND b”

Tiếp bước các nghiên cứu này, năm 1949 Donald Hebb cho xuất bản cuốn sách Organization of Behavior Cuốn sách đã chỉ ra rằng các nơron nhân tạo sẽ trở nên hiệu quả hơn sau mỗi lần chúng được sử dụng

Những tiến bộ của máy tính đầu những năm 1950 giúp cho việc mô hình hóa các nguyên lý của những lý thuyết liên quan tới cách thức con người suy nghĩ đã trở thành hiện thực Nathanial Rochester sau nhiều năm làm việc tại các phòng thí nghiệm nghiên cứu của IBM đã có những nỗ lực đầu tiên để mô phỏng một mạng nơron Trong thời kì này tính toán truyền thống đã đạt được những thành công rực rỡ trong khi đó những nghiên cứu về nơron còn ở giai đoạn sơ khai Mặc dù vậy những người ủng hộ triết lý

“thinking machines” (các máy biết suy nghĩ) vẫn tiếp tục bảo vệ cho lập trường của mình

Năm 1956, dự án Dartmouth nghiên cứu về trí tuệ nhân tạo (Artificial Intelligence)

đã mở ra thời kỳ phát triển mới cả trong lĩnh vực trí tuệ nhân tạo lẫn mạng nơron Tác động tích cực của nó là thúc đẩy hơn nữa sự quan tâm của các nhà khoa học về trí tuệ nhân tạo và quá trình xử lý ở mức đơn giản của mạng nơron trong bộ não con người Những năm tiếp theo của dự án Dartmouth, John von Neumann đã đề xuất việc mô phỏng các nơron đơn giản bằng cách sử dụng rơle điện áp hoặc đèn chân không Nhà sinh học chuyên nghiên cứu về nơron Frank Rosenblatt cũng bắt đầu nghiên cứu về Perceptron Sau thời gian nghiên cứu này Perceptron đã được cài đặt trong phần cứng máy tính và được xem như là mạng nơron lâu đời nhất còn được sử dụng đến ngày nay Perceptron một tầng rất hữu ích trong việc phân loại một tập các đầu vào có giá trị liên tục vào một trong hai lớp Perceptron tính tổng có trọng số các đầu vào, rồi trừ tổng này cho một ngưỡng và cho ra một trong hai giá trị mong muốn có thể Tuy nhiên Perceptron còn rất nhiều hạn chế, những hạn chế này đã được chỉ ra trong cuốn sách về Perceptron của Marvin Minsky và Seymour Papert viết năm 1969

Năm 1959, Bernard Widrow và Marcian Hoff thuộc trường đại học Stanford đã xây dựng mô hình ADALINE (ADAptive LINear Elements) và MADALINE (Multiple ADAptive LINear Elements) Các mô hình này sử dụng quy tắc học Least-Mean-Squares (LMS: Tối thiểu bình phương trung bình) MADALINE là mạng nơron đầu tiên

Trang 26

được áp dụng để giải quyết một bài toán thực tế Nó là một bộ lọc thích ứng có khả năng loại bỏ tín hiệu dội lại trên đường dây điện thoại Ngày nay mạng nơron này vẫn được

sử dụng trong các ứng dụng thương mại

Năm 1974 Paul Werbos đã phát triển và ứng dụng phương pháp học lan truyền ngược ( back-propagation) Tuy nhiên phải mất một vài năm thì phương pháp này mới trở nên phổ biến Các mạng lan truyền ngược được biết đến nhiều nhất và được áp dụng rộng dãi nhất nhất cho đến ngày nay

Thật không may, những thành công ban đầu này khiến cho con người nghĩ quá lên

về khả năng của các mạng nơron Chính sự cường điệu quá mức đã có những tác động không tốt đến sự phát triển của khoa học và kỹ thuật thời bấy giờ khi người ta lo sợ rằng

đã đến lúc máy móc có thể làm mọi việc của con người Những lo lắng này khiến người

ta bắt đầu phản đối các nghiên cứu về mạng neuron Thời kì tạm lắng này kéo dài đến năm 1981

Năm 1982 trong bài báo gửi tới viện khoa học quốc gia, John Hopfield bằng sự phân tích toán học rõ ràng, mạch lạc, ông đã chỉ ra cách thức các mạng nơron làm việc và những công việc chúng có thể thực hiện được Cống hiến của Hopfield không chỉ ở giá trị của những nghiên cứu khoa học mà còn ở sự thúc đẩy trở lại các nghiên cứu về mạng neuron

Cũng trong thời gian này, một hội nghị với sự tham gia của Hoa Kỳ và Nhật Bản bàn về việc hợp tác, cạnh tranh trong lĩnh vực mạng nơron đã được tổ chức tại Kyoto, Nhật Bản Sau hội nghị, Nhật Bản đã công bố những nỗ lực của họ trong việc tạo ra máy tính thế hệ thứ 5 Tiếp nhận điều đó, các tạp chí định kỳ của Hoa Kỳ bày tỏ sự lo lắng rằng nước nhà có thể bị tụt hậu trong lĩnh vực này Vì thế, ngay sau đó, Hoa Kỳ nhanh chóng huy động quĩ tài trợ cho các nghiên cứu và ứng dụng mạng neuron

Năm 1985, viện vật lý Hoa Kỳ bắt đầu tổ chức các cuộc họp hàng năm về mạng neuron ứng dụng trong tin học (Neural Networks for Computing)

Năm 1987, hội thảo quốc tế đầu tiên về mạng neuron của Viện các kỹ sư điện và điện

tử IEEE (Institute of Electrical and Electronic Engineer) đã thu hút hơn 1800 người tham gia

Ngày nay, không chỉ dừng lại ở mức nghiên cứu lý thuyết, các nghiên cứu ứng dụng mạng nơron để giải quyết các bài toán thực tế được diễn ra ở khắp mọi nơi Các ứng dụng mạng nơron ra đời ngày càng nhiều và ngày càng hoàn thiện hơn Điển hình là các ứng dụng: xử lý ngôn ngữ (Language Processing), nhận dạng kí tự (Character Recognition), nhận dạng tiếng nói (Voice Recognition), nhận dạng mẫu (Pattern Recognition), xử lý tín hiệu (Signal Processing), Lọc dữ liệu (Data Filtering),…

Trang 27

2.1.2 Mô hình mạng neural

2.1.2.1 Mô hình neural sinh học

Mô hình của một dạng nơron sinh học được thể hiện ở hình 2.1

Hình 2.1 Mô hình neural sinh học Gồm có ba phần chính: Thân (Cell body), bên trong có nhân (Nucleus), cây (Dendrites) và trục (Axon)

Cây gồm các dây thần kinh có liên kết với thân Trục có cấu trúc đơn, dài liên kết với thân có nhiệm vụ truyền tải thông tin từ nơron Phần cuối của trục có dạng phân nhánh Trong mỗi nhánh có một cơ cấu nhỏ là khớp thần kinh (Synapse), từ đây nơron liên kết bằng tín hiệu tới các nơron khác Sự thu nhận thông tin của nơron từ các nơron khác có thể từ cây hoặc cũng có thể từ thân của nó Tín hiệu thu, nhận ở dạng các xung điện

Màng (Membrane): mỗi tế bào thần kinh có một màng, có nhiệm vụ giữ các chất nuôi tế bào không tràn ra ngoài Do đó, các phần tử nội bào và ngoại bào không bằng nhau, giữa chúng có dung dịch muối lỏng làm cho chúng bị phân ra thành các nguyên tử âm và dương Các nguyên tử dương trong màng tạo ra điện thế màng (Membrane potential), nó tồn tại trong trạng thái cân bằng lực, lực đẩy các nguyên tử dương ra khỏi tế bào bằng với lực hút của chúng vào trong tế bào

Điện thế màng là phần tử quan trọng trong quá trình truyền tin trong hệ thần kinh Khi thay đổi khả năng thẩm thấu ion của màng thì điện thế màng của tế bào bị thay đổi và tiến tới một ngưỡng nào đó, đồng thời sinh ra dòng điện, dòng điện này gây ra phản ứng kích thích làm thay đổi khả năng thẩm thấu ion của tế bào thần kinh tiếp theo

Bộ não con người gồm có gần 1011 nơron của nhiều loại khác nhau Mạng nơron

là sự tái tạo bằng kỹ thuật những chức năng của hệ thần kinh con người Trong quá trình tái tạo không phải tất cả các chức năng của bộ não con người có đều được tái tạo,

Trang 28

mà chỉ có những chức năng cần thiết Bên cạnh đó còn có những chức năng mới được tạo ra nhằm giải quyết một bài toán điều khiển đã định trước

 Xử lý thông tin trong bộ não:

Thông tin được tiếp nhận từ các giác quan và chuyển vào các tế bào thần kinh vận động và các tế bào cơ Mỗi tế bào thần kinh tiếp nhận thông tin, điện thế sẽ tăng trong thần kinh cảm giác, nếu điện thế này vượt ngưỡng, nó sẽ tạo dòng điện trong tế bào thần kinh cảm giác, ý nghĩa dòng điện đó được giải mã và lưu ở thần kinh trung ương, kết quả xử lý thông tin được gửi đến các tế bào cơ

Các khớp thần kinh chỉ cho các tín hiệu phù hợp qua chúng, còn lại các tín hiệu khác bị cản lại Lượng tín hiệu được biến đổi được gọi là cường độ khớp thần kinh đó chính là trọng số của nơron trong mạng nơron nhân tạo

Chức năng thực sự của bộ não không phụ thuộc vào vai trò của một tế bào thần kinh đơn lẻ, mà phụ thuộc vào toàn bộ các tế bào thần kinh hay các tế bào thần kinh liên kết với nhau thành một mạng thần kinh hay một mạng nơron (Neural Networks)

2.1.2.2 Mô hình neural nhân tạo

Sự thay thế những tính chất của mạng nơron sinh học bằng một mô hình toán học tương đương được gọi là mạng nơron nhân tạo Mạng nơron nhân tạo có thể được xây dựng bằng nhiều cách khác nhau.Vì vậy có rất nhiều kiểu mạng nơron nhân tạo

Có nhiều mô hình cấu trúc của nơron sinh học được đưa ra như: Perceptron (Roenblatt, 1958); Adaline (Windrow và Hoff, 1960) Nhưng thông thường, một nơron

có cấu tạo như sau:

Hình 2.2 Mô hình neural nhân tạo

Trang 29

Hàm tổng hợp: Kết hợp tất cả thông tin từ đầu vào của phần tử xử lý thứ i,

với xj là đầu vào từ môi trường hoặc đầu ra của phần tử xử lý thứ j, wij là hệ

số trọng lượng kết nối giữa xj và phần tử xử lý thứ i, i là giá trị ngưỡng của phần tử xử lý thứ i Hàm tổng hợp được định nghĩa một trong các dạng sau:

với p và wij là bán kính và tâm của hình cầu

Hàm tác động: đáp ứng đầu ra của phần tử xử lý thứ i với tín hiệu đầu vào,

Ngày đăng: 24/06/2019, 01:15

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w