ĐẠI HỌC ĐÀ NẴNGKHOA CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNGĐỒ ÁN CƠ SỞ 4ĐỀ TÀI: NHẬN DẠNG VẬT THỂ TRONG ẢNH

Chương 1 Giới thiệu1.1 Tổng quan - Bối cảnh thực hiện đề tài Công nghệ nhận dạng hình ảnh có tiềm năng lớn trong việc áp dụng rộng rãi trong các ngành công nghiệp khác nhau.. Các công t

Trang 1

ĐẠI HỌC ĐÀ NẴNG KHOA CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

ĐỒ ÁN CƠ SỞ 4

Sinh viên thực hiện : NGUYỄN ĐỨC NGỌC KỲ

Giảng viên hướng dẫn : TS LÊ VĂN MINH

Lớp : 17IT1

Đà nẵng, tháng 12 năm 2019

Trang 2

ĐẠI HỌC ĐÀ NẴNG KHOA CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

ĐỒ ÁN CƠ SỞ 4

NHẬN DẠNG VẬT THỂ TRONG ẢNH

Đà Nẵng, tháng 12 năm 2019

2

Trang 3

MỞ ĐẦU

………

Trang 4

LỜI CẢM ƠN

4

Em xin chân thành cảm ơn KHOA CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG VÀ ĐẠI HỌC ĐÀ NẴNG đã tạo điều kiện cho em thực hiện đề tài này.

Em xin gửi lời cảm ơn chân thành đến tất cả các Thầy cô đã giảng dạy chúng em trong suốt thời gian quan Cảm ơn đến thầy (cô) TS.LÊ VĂN MINH đã hướng dẫn em thực hiện đề tài này.

Nhân đây, em cũng xin bày tỏ lòng biết ơn sâu sắc đến ba mẹ và gia đình đã nuôi dạy em nên người, và luôn là chỗ dựa tinh thần vững chắc, giúp cho em vượt qua mọi khó khăn, thử thách trong cuộc sống.

Bên cạnh đó, để hoàn thành khóa thực tập này, em cũng đã nhận được rất nhiều sự giúp đỡ, những lời động viên quý báu của các bạn bè, các anh chị thân hữu, em xin hết lòng cảm ơn.

Tuy nhiên, do thời gian hạn hẹp, mặc dù đã nỗ lực hết sức mình, nhưng chắc rằng đề tài này khó tránh khỏi những thiếu sót Em rất mong nhận được sự thông cảm, chỉ bảo tận tình của thầy cô và các bạn

Trang 5

NHẬN XÉT

………

…

………

…

………

…

………

…

………

…

………

…

………

…

………

…

………

…

………

…

………

…

………

…

………

…

………

…

………

…

Trang 6

NHẬN XÉT

(Của giảng viên hướng dẫn)

………

6

Trang 7

MỤC LỤC Trang MỞ ĐẦU 3

Chương 1 Giới thiệu 9

1.1 Tổng quan 9

1.2 Phương pháp, kết quả 9

1.3 Cấu trúc đồ án 11

Chương 2 Nghiên cứu tổng quan 12

2.1 Phương pháp 12

2.2 Kết luận 12

Chương 3 Thiết kế hệ thống 13

Thiết kế chi tiết 13

Chương 4 Triển khai xây dựng 14

Chương 5 Kết luận và Hướng phát triển 16

DANH MỤC TÀI LIỆU THAM KHẢO 17

Trang 8

DANH MỤC HÌNH

Trang

Hình 1.2 – Nhãn hình 1 10

Hình 1.2 – Nhãn hình 2 11

Hình 3 – Nhãn hình 1 sơ đồ thực hiện 13

Hình 3 – Nhãn hình 2 sơ đồ làm việc 13

Hình 5 – Nhãn hình 1 ảnh ban đầu 16

Hình 5 – Nhãn hình 2 ảnh đã được xử lý, nhận dạng 16

8

Trang 9

Chương 1 Giới thiệu

1.1 Tổng quan

- Bối cảnh thực hiện đề tài

Công nghệ nhận dạng hình ảnh có tiềm năng lớn trong việc áp dụng rộng rãi trong các ngành công nghiệp khác nhau Các công ty lớn như Tesla, Google, Uber, Adobe Systems vv cũng sử dụng công nghệ nhận dạng hình ảnh Để chứng minh rằng công nghệ này đang tồn tại khắp thế giới, chúng ta hãy xem xét các số liệu thống kê gần đây Các nhà nghiên cứu dự đoán rằng thị trường toàn cầu của công nhận dạng hình ảnh sẽ đạt 38,92 tỷ USD vào năm 2021 Đó là một con số rất lớn! Vì vậy, không có thắc mắc rằng ngày càng nhiều cái gọi là ứng dụng imagetech tận dụng nhận dạng hình ảnh cho các mục đích khác nhau và trong cả kinh doanh

- Vấn đề cần giải quyết

Nhập ảnh, phân tích, thao tác và tạo ảnh

- Đề xuất nội dung thực hiện

ImageAI một thư viện python mã nguồn mở được xây dựng để

trao quyền cho các nhà phát triển xây dựng các ứng dụng và hệ thống với các khả năng Deep Learning và Computer Vision độc lập

bằng cách sử dụng một vài dòng mã đơn giản ImageAI hỗ trợ

danh sách các thuật toán Machine Learning tiên tiến để dự đoán hình ảnh, dự đoán hình ảnh tùy chỉnh, phát hiện đối tượng, phát hiện video, theo dõi đối tượng video và đào tạo dự đoán hình

ảnh ImageAI hiện hỗ trợ dự đoán và đào tạo hình ảnh bằng 4 thuật

toán Machine Learning khác nhau được đào tạo trên bộ dữ liệu

ImageNet-1000 ImageAI cũng hỗ trợ phát hiện đối tượng, phát

hiện video và theo dõi đối tượng bằng RetinaNet, YOLOv3 và TinyYOLOv3 được đào tạo trên bộ dữ liệu COCO Cuối

cùng, ImageAI cho phép bạn huấn luyện các mô hình tùy chỉnh để thực hiện phát hiện và nhận dạng các đối tượng mới ImageAI sẽ

cung cấp hỗ trợ cho các khía cạnh rộng hơn và chuyên biệt hơn của Computer Vision bao gồm và không giới hạn ở nhận dạng hình ảnh trong các môi trường đặc biệt và các lĩnh vực đặc biệt

ImageAI cung cấp 4 thuật toán và loại mô hình khác nhau để

thực hiện dự đoán hình ảnh, được đào tạo trên bộ dữ liệu

ImageNet-1000 4 thuật toán được cung cấp để dự đoán hình ảnh bao gồm:

SqueezeNet , ResNet , InceptionV3 và DenseNet

1.2 Phương pháp, kết quả

 Trình bày phương pháp triển khai thực hiện đề tài:

Hình ảnh có thể được sử dụng theo những cách khác nhau.Trong các hình ảnh phát triển phần mềm di động, web và phần mềm phục vụ cho vô

số lý do, bao gồm:

Trang 10

 Nhận dạng đối tượng

 Nhận dạng mẫu

 Định vị các bản sao (chính xác hoặc một phần)

 Tìm kiếm hình ảnh theo phân đoạn

 Xử lý hình ảnh (Retouch, )

 Cải thiện ứng dụng di động UX

 Vv

ImageAI một thư viện python mã nguồn mở được xây dựng để trao

quyền cho các nhà phát triển xây dựng các ứng dụng và hệ thống với các khả năng Deep Learning và Computer Vision độc lập bằng cách sử dụng một vài dòng mã đơn giản

 Kết quả đạt được

Dữ liệu vào

Hình 1.2 – Nhãn hình 1

10

Trang 11

Dữ liệu ra

Hình 1.2 – Nhãn hình 2 1.3 Cấu trúc đồ án

Chương 1 Giới thiệu 9

1.1 Tổng quan 9

1.2 Phương pháp, kết quả 9

1.3 Cấu trúc đồ án 11

Chương 2 Nghiên cứu tổng quan 12

2.1 Phương pháp 12

2.2 Kết luận 12

Chương 3 Thiết kế hệ thống 13

Thiết kế chi tiết 13

Chương 4 Triển khai xây dựng 14

Chương 5 Kết luận và Hướng phát triển 16

Trang 12

Chương 2 Nghiên cứu tổng quan

2.1 Phương pháp

Chương 3 Dự đoán hình ảnh

Chương 4 Phát hiện đối tượng

Chương 5 Phát hiện và theo dõi đối tượng video

+ Phát hiện và phân tích đối tượng video

+ Phát hiện đối tượng tùy chỉnh video (Theo dõi đối tượng)

+ Phân tích video trực quan

Chương 6 Đào tạo mô hình tùy chỉnh

Chương 7 Dự đoán hình ảnh tùy chỉnh

Chương 8 Đào tạo mô hình phát hiện tùy chỉnh

Chương 9 Phát hiện đối tượng tùy chỉnh

Chương 10 Phân tích & phát hiện đối tượng video tùy chỉnh

10.1 Kết luận

Thực hiện đúng theo thứ tự phương pháp đã đề ra

12

Trang 13

Chương 11 Thiết kế hệ thống

Chương 12 Thiết kế chi tiết

Hình 3 – Nhãn hình 1 sơ đồ thực hiện

Hình 3 – Nhãn hình 2 sơ đồ làm việc

Trang 14

Chương 13 Triển khai xây dựng

 Ngôn ngữ thực hiện: PYTHON

 Công cụ hỗ trợ: Visual studio IDE and Anaconda

14

Trang 15

 Mã nguồn xử lý ảnh

from imageai.Detection import ObjectDetection

import os

execution_path = os.getcwd()

detector = ObjectDetection()

detector.setModelTypeAsRetinaNet()

_best_v2.0.1.h5" ))

detector.loadModel()

in(execution_path , "image.jpg" ), output_image_path =os.path.join(ex ecution_path , "imagenew.jpg" ))

for eachObject in detections:

print(eachObject[ "name" ] , " : " , eachObject[ "percentage_proba bility" ] )

 Mã nguồn xử lý video

from imageai.Detection import VideoObjectDetection

import os

execution_path = os.getcwd()

detector = VideoObjectDetection()

detector.setModelTypeAsRetinaNet()

_best_v2.0.1.h5" ))

detector.loadModel()

h.join(execution_path, "hoathinh1" ),

tion_path, "traffic_detected" )

s =True)

print(video_path)

Trang 16

Chương 14 Kết luận

 Dữ liệu vào

Hình 5 – Nhãn hình 1 ảnh ban đầu

 Dữ liệu ra

Hình 5 – Nhãn hình 2 ảnh đã được xử lý, nhận dạng

16

Trang 17

DANH MỤC TÀI LIỆU THAM KHẢO

Tiếng Việt:

1. Python cơ bản Ebook Python tiếng Việt siêu cơ bản của Võ Tuấn Duy

Tiếng Anh:

1. A Byte of Python

2. Think Python 2nd Edition

3. Automate the Boring Stuff with Python

4. Dive into Python 3

5. Learn Python the Hard Way

6. Invent Your Own Computer Game with Python

7. Making Games with Python and Pygame

Định dạng
Số trang	17
Dung lượng	5,58 MB