1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tìm hiểu về học sâu và ứng dụng trong hệ thống mở cổng tự động dựa trên nhận dạng biển số xe

33 6 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Tìm hiểu về học sâu và ứng dụng trong hệ thống mở cổng tự động dựa trên nhận dạng biển số xe
Tác giả Lại Văn Quyết
Người hướng dẫn TS. Ngô Hữu Huy
Trường học Đại Học Thái Nguyên
Chuyên ngành Công Nghệ Thông Tin
Thể loại Đồ án tốt nghiệp
Năm xuất bản 2023
Thành phố Thái Nguyên
Định dạng
Số trang 33
Dung lượng 5,4 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

MỞ ĐẦU 1.Giới thiệuĐề tài "Tìm hiểu về học sâu và ứng dụng trong hệ thống mở cổng tự động dựa trên nhận dạng biển số xe" là một đề tài trong lĩnh vực trí tuệ nhân tạo, cụ thể là trong

Trang 1

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

LẠI VĂN QUYẾT

TÌM HIỂU VỀ HỌC SÂU VÀ ỨNG DỤNG TRONG HỆ THỐNG

MỞ CỔNG TỰ ĐỘNG DỰA TRÊN NHẬN DẠNG BIỂN SỐ XE

ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌCNGÀNH CÔNG NGHỆ THÔNG TIN

THÁI NGUYÊN, NĂM 2023

Trang 2

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC

NGÀNH CÔNG NGHỆ THÔNG TIN

Đề tài:

TÌM HIỂU VỀ HỌC SÂU VÀ ỨNG DỤNG TRONG HỆ THỐNG

MỞ CỔNG TỰ ĐỘNG DỰA TRÊN NHẬN DẠNG BIỂN SỐ XE

Sinh viên thực hiện: Lại Văn Quyết

Giáo viên hướng dẫn: TS Ngô Hữu Huy

THÁI NGUYÊN, NĂM 2023

Trang 3

CHƯƠNG 1:

LỜI CAM ĐOAN

Tôi xin cam đoan: Đồ án tốt nghiệp đại học chuyên ngành Công nghệ thông

tin, tên đề tài “Tìm hiểu về học sâu và ứng dụng trong hệ thống mở cổng tự

động dựa trên nhận dạng biển số xe” là công trình nghiên cứu, tìm hiểu và trình

bày do tôi thực hiện dưới sự hướng dẫn của TS Ngô Hữu Huy, Trường Đại họcCông nghệ Thông tin và Truyền thông - Đại học Thái Nguyên

Kết quả tìm hiểu, nghiên cứu trong luận văn là hoàn toàn trung thực, không

vi phạm bất cứ điều gì trong luật sở hữu trí tuệ và pháp luật Việt Nam Nếu sai, tôihoàn toàn chịu trách nhiệm trước pháp luật

Tất cả các tài liệu, bài báo, khóa luận, công cụ phần mềm của các tác giảkhác được sử dụng lại trong luận văn này đều được chỉ dẫn tường minh về tác giả

và đều có trong danh mục tài liệu tham khảo

Thái Nguyên, ngày …… tháng … năm 2023

Sinh viên thực hiện

LẠI VĂN QUYẾT

Trang 4

LỜI CẢM ƠN

Trước tiên em xin dành lời cảm ơn đến các Thầy Cô khoa công nghệ thông tin đã dạy dỗ, truyền đạt cho em những kiến thức cần thiết để có thể vận dụng trong thực tiễn cũng như trong đồ án này Đặc biệt em gửi lời cảm ơn thầy TS Ngô Hữu Huy

đã tận tình giúp đỡ em trong quá trình thực hiện đồ án

Do kiến thức còn bị giới hạn trong quá trình thực hiện đồ án em không thể tránh khỏi những sai sót Kính mong thầy cô có thể chỉ dẫn thêm để em rút kinh nghiệm trong những đồ án tiếp theo

Em xin chân thành cảm ơn

Thái Nguyên, ngày tháng năm 2023Sinh viên thực hiện

LẠI VĂN QUYẾT

MỤC LỤC

LỜI CAM ĐOAN 1

Trang 5

LỜI CẢM ƠN 2

M C L CỤ Ụ 3

M ĐẦẦUỞ 5

1.Giới thiệu 5

2 Mục tiêu đề tài 5

3 Giới hạn đồ án 6

4 Phạm vi kiến thức 6

CH ƯƠ NG I.C S LÝ THUYẾẾT Ơ Ở 8

1.1 Tổng quan về học sâu (deep learning) và Machine learning 8

1.1.1 Deep Learning là gì? 8

1.1.2 Ch c năng v ứ ượ t tr i c a Deep Learning ộ ủ 9

1.1.3 Cách th c ho t đ ng ứ ạ ộ 10

1.1.4 ng d ng c a Deep Learning Ứ ụ ủ 11

1.1.5 Đánh giá u và nh ư ượ c đi m c a Deep Learning ể ủ 11

1.2 Tổng quan về học máy ( Machine learning) 13

1.2.1 Machine learning là gì?? 13

1.2.2 Các ph ươ ng pháp Machine learning 13

1.2.3 So sánh h c sâu (deep learning) và h c máy (Machine learning) ọ ọ 14

1.3 Computer Vision 14

1.4 Xử lý tín hiệu 15

1.5 Hệ thống điều khiển và các thiết bị điện tử 15

CH ƯƠ NG 2 M NG Ạ N -RON Ơ TÍCH CH P (CNN) VÀ YOLOV7 Ậ 17

2.1 Tổng quát 17

2.2 Phép nhân tích chập (Convolution) 21

2.3 Cấu trúc của mạng nơ-ron tích chập (CNN) 22

1) Convolution Layer 22

2) Pooling layer 23

3) Fully connected layer 25

2.4.Tổng quan về YOLOV7 26

2.4.1 Gi i thi u vềề YOLOV ớ ệ 26

2.4.2 Kiềến trúc mô hình YOLO 26

2.4.3 Mô hình YOLO trong bài toán nh n di nậ ệ 27

Ch ươ ng 3 XÂY D NG CH Ự ƯƠ NG TRÌNH 28

3.1 Cơ sở dữ liệu 28

Trang 6

3.2 Cài đặt công cụ và thiết lập trường 28

3.2.1 Đào t o mô hình ạ 28

3.3 Quá trình huấn luyện 29

3.3.1 T i lền t p hình nh ả ậ ả 29

3.3.2 X lý tăng d li u - Data augmentaton ử ữ ệ 29

3.3.3 Xây d ng mô hình ự 29

3.3.4 Biền d ch ch ị ươ ng trình và đào t o mô hình ạ 29

3.4 Đánh giá mô hình và dự đoán 29

3.5 Xây dụng giao diện cho chương trình 29

3.6 Kết quả đào tạo 29

KẾẾT LU N Ậ 30

TÀI LI U THAM KH O Ệ Ả 31

Trang 7

MỞ ĐẦU 1.Giới thiệu

Đề tài "Tìm hiểu về học sâu và ứng dụng trong hệ thống mở cổng tự động dựa

trên nhận dạng biển số xe" là một đề tài trong lĩnh vực trí tuệ nhân tạo, cụ thể là

trong lĩnh vực học sâu và xử lý ảnh Đề tài này tập trung nghiên cứu về việc sử dụng kỹ thuật học sâu để nhận dạng biển số xe trong hệ thống mở cổng tự động.Trong thực tế, việc sử dụng hệ thống mở cổng tự động đang được ứng dụng rộng rãitrong các bãi đỗ xe, trung tâm thương mại, khu dân cư, sân bay, bến xe để giảm thiểu thời gian xếp hàng và tăng tính an toàn Tuy nhiên, một trong những vấn đề đối với hệ thống này là việc xác định được biển số xe của các phương tiện đến và

đi Việc thực hiện bằng tay tốn nhiều thời gian và không chính xác, do đó sử dụng

kỹ thuật học sâu để nhận dạng biển số xe sẽ giúp giải quyết vấn đề này

Đề tài này sẽ tập trung vào nghiên cứu các phương pháp học sâu như mạng nơ-ron tích chập (Convolutional Neural Network - CNN), mạng nơ-ron tích chập đa tầng (Multi-Layer CNN) và mạng nơ-ron hồi quy (Recurrent Neural Network - RNN) để phát triển một hệ thống nhận dạng biển số xe chính xác và nhanh chóng Sau đó, đề tài sẽ tập trung xây dựng một hệ thống mở cổng tự động sử dụng kỹ thuật này và kiểm tra hiệu quả của hệ thống bằng các thực nghiệm thực tế

Đề tài này sẽ đóng góp cho việc cải thiện tính hiệu quả và an toàn của các hệ thống

mở cổng tự động trong các bãi đỗ xe, trung tâm thương mại, khu dân cư, sân bay, bến xe Các ứng dụng của đề tài này cũng có thể được áp dụng cho các lĩnh vực khác như giám sát giao thông, an ninh

Thu thập và xử lý dữ liệu về ảnh chứa biển số xe từ các nguồn khác nhau để tạo ra tập dữ liệu đào tạo và tập dữ liệu kiểm thử

Xây dựng và huấn luyện các mô hình học sâu trên tập dữ liệu đào tạo để nhận dạng biển số xe

Trang 8

Thiết kế và xây dựng một hệ thống mở cổng tự động sử dụng kỹ thuật học sâu để nhận dạng biển số xe.

Đánh giá hiệu quả của hệ thống bằng cách đo lường độ chính xác của việc nhận dạng biển số xe trên tập dữ liệu kiểm thử và thực nghiệm trên hệ thống mở cổng tự động thực tế

Với các mục tiêu trên, đề tài hy vọng sẽ đạt được kết quả như mong đợi và đóng góp vào phát triển công nghệ trong lĩnh vực học sâu, xử lý ảnh và các ứng dụng trong đời sống

2 Dữ liệu đầu vào cho hệ thống nhận dạng biển số xe chỉ tập trung vào ảnh chứa biển số, các yếu tố khác như ánh sáng, mờ, nhiễu hay khó khăn về góc

độ đặt camera sẽ không được xem xét

3 Hiệu quả của hệ thống chỉ được đánh giá trên một số tập dữ liệu và một số trường hợp, do đó kết quả đánh giá có thể không phản ánh đầy đủ tính ứng dụng và hiệu quả của hệ thống trong tất cả các tình huống

4 Đề tài sẽ tập trung vào việc tìm hiểu và áp dụng các kỹ thuật học sâu trong

hệ thống nhận dạng biển số xe, nên không nghiên cứu về các phương pháp

xử lý ảnh khác ngoài kỹ thuật học sâu

5 Do thời gian và tài nguyên có hạn, đề tài sẽ không đi sâu vào các mô hình học sâu phức tạp và khó huấn luyện, và chỉ tập trung vào các mô hình học sâu cơ bản như CNN, Multi-Layer CNN và RNN

Tuy nhiên, đây là các giới hạn chung của đề tài và không ảnh hưởng đến tính khả thi và giá trị thực tiễn của đề tài

4 Phạm vi kiến thức

Để thực hiện được đề tài "Tìm hiểu về học sâu và ứng dụng trong hệ thống mở cổng

tự động dựa trên nhận dạng biển số xe", các kiến thức cần thiết bao gồm:

1 Kiến thức về Machine Learning và Deep Learning: Bao gồm các khái niệm

cơ bản về Supervised Learning, Unsupervised Learning, Reinforcement Learning, Neural Network, Convolutional Neural Network, Recurrent NeuralNetwork và các thuật toán liên quan

Trang 9

2 Kiến thức về Computer Vision: Bao gồm các khái niệm cơ bản về xử lý ảnh,

bộ lọc, giải thuật phân vùng, giải thuật trích xuất đặc trưng

3 Kiến thức về xử lý tín hiệu: Bao gồm các khái niệm cơ bản về xử lý tín hiệu

số, xử lý tín hiệu ảnh, xử lý tín hiệu âm thanh

4 Kiến thức về lập trình và các công cụ lập trình: Bao gồm các kiến thức về lậptrình Python, các thư viện như OpenCV, TensorFlow, Keras, PyTorch

5 Kiến thức về mạng máy tính và giao thức truyền thông: Bao gồm các kiến thức về mạng máy tính, giao thức truyền thông TCP/IP, mô hình OSI

6 Kiến thức về hệ thống điều khiển và các thiết bị điện tử: Bao gồm các kiến thức cơ bản về hệ thống điều khiển, các linh kiện điện tử và các phương phápthiết kế hệ thống điện tử

Trang 10

CHƯƠNG I.CƠ SỞ LÝ THUYẾT 1.1 Tổng quan về học sâu (deep learning) và Machine learning

1.1.1 Deep Learning là gì?

Deep learning được bắt nguồn từ thuật toán Neural network (mạng nowrron)vốn xuất phát chỉ là một ngành nhỏ của Machine Learning Deep Learning là mộtchi của ngành máy học dựa trên một tập hợp các thuật toán để cố gắng mô hình dữliệu trừu tượng hóa ở mức cao bằng cách sử dụng nhiều lớp xử lý với cấu trúc phứctạp, hoặc bằng cách khác bao gồm nhiều biến đổi phi tuyến Tương tự như cáchchúng ta học hỏi từ kinh nghiệm thuật toán, deep learning sẽ thực hiện một nhiệm

vụ nhiều lần mỗi lần tinh chỉnh nhiệm vụ một chút để cải thiện kết quả DeepLearning chỉ đơn giản là kết nối dữ liệu giữa tất cả các tế bào thần kinh nhân tạo vàđiều chỉnh chúng theo dữ liệu mẫu

Hình 1.1: Mạng lười thần kinh tích chập

Deep Learning đã giúp máy tính thực thi những việc tưởng chừng như khôngthể vào 15 năm trước: phân loại cả ngàn vật thể khác nhau trong các bức ảnh, tự tạochú thích cho ảnh, bắt chước giọng nói và chữ viết của con người, giao tiếp với conngười, hay thậm chí cả sáng tác văn, phim, ảnh, âm nhạc

Trang 11

Theo thống kê trên trang paperswithcode hiện có 16 tasks lớn mà MachineLearning có thể thực hiện trong đó có tới trên 8 tasks Deep learning đạt kết quảSOTA phải kể đến như:

1.1.2 Chức năng vượt trội của Deep Learning

Những hệ thống của Deep Learning có thể cải thiện được các hiệu suất củachúng với quyền truy cập vào dữ liệu sẽ được nhiều hơn Đặc biệt, Deep Learning

có thể giúp máy tính thực thi những công việc tưởng chừng như không thể làmđược vào 15 năm trước như: phân loại cả ngàn vật thể khác nhau trong các bức ảnh,

tự tạo chú thích cho ảnh, bắt chước giọng nói và chữ viết của con người, giao tiếpvới con người, hay thậm chí là sáng tác âm nhạc, phim ảnh,…

Đó là lý do, Deep Learning được xem là một ứng dụng thông minh có thể giải quyếtmọi nhu cầu nhận dạng mẫu mà không cần đến sự can thiệp của con người Hoạtđộng của Deep Learning dựa vào mạng lưới thần kinh nhân tạo và bao gồm nhiềutầng lớp chứa các dữ liệu mô phỏng cách thức vận hành của não người

Ví dụ: Quan sát một bức ảnh, tại sao bạn có thể nhận biết trong ảnh là con mèo hay

con chó? Đối với con người, việc quan sát và định nghĩa về điều này vô cùng đơngiản, tuy nhiên lại rất khó khăn để bạn có thể biểu đạt chúng bằng các dòng lệnh củamáy tính Nhưng nhờ có Deep Learning, vấn đề này được giải quyết một cáchnhanh chóng

Trang 12

1.1.3 Cách thức hoạt động

Xuất phát từ phương pháp của học máy: lập trình AI, Deep Learning chophép chúng ta huấn luyện một AI có thể dự đoán được các đầu ra khi dựa vào mộttập các đầu vào Phương pháp có giám sát và không giám sát đều có thể sử dụng đểhuấn luyện

Ví dụ: Dự đoán hành động của con mèo khi gặp con chuột và tiến hành huấn luyện

chúng bằng phương pháp học có giám sát

Cách thức để dự đoán hành động của con mèo tại các đầu vào sẽ được thực hiệnnhư sau:

 Bạn cần lựa chọn con mồi phù hợp

 Các bộ phận trên cơ thể của con mèo khi gặp con chuột sẽ vô cùng nhanhnhạy

 Vị trí con chuột sẽ xuất hiện

Về cơ bản, Deep Learning không quá khác biệt khi đặt cạnh những học máy thôngthường Tuy nhiên, ở ví dụ trên đây bạn cần dành khá nhiều thời gian mới có thểthiết kế được các tính năng đại diện cho con mèo Công việc cần làm là cung cấpmột hệ thống số lượng hình ảnh, video con mèo bắt chuột thì hệ thống mới có thể tựhọc được các tính năng đại diện dành cho một con mèo

Trang 13

1.1.4 Ứng dụng của Deep Learning

Thông qua những tác vụ như thị giác máy tính, nhận dạng giọng nói, robothoặc dịch máy thì hiệu suất của Deep Learning có thể vượt khá xa những hệ thốngkhác Tuy nhiên, các xây dựng hệ thống Deep Learning không mấy dễ dàng vànhanh chóng so với máy móc thông thường

Deep Learning cho phép con người ứng dụng rất nhiều vấn đề thực tế, đồng thời mởrộng lĩnh vực tổng thể của AI Ứng dụng này đã phá vỡ những cách thức làm việccủa con người bằng cách làm tối ưu hóa các loại máy móc có thể hỗ trợ, thực hiệngần hoặc giống hệt con người Deep Learning đã mang đến nhiều điều đặc biệt chođời sống khi ứng dụng thành công các lĩnh vực như: công nghệ cao, nông nghiệp,điện tử, chăm sóc sức khỏe, quốc phòng,…

Một số ứng dụng tiêu biểu của Deep Learning trong đời sống con người như: Ô tôkhông người lái, Robot giống con người, chăm sóc sức khỏe cho con người tốt hơn,phân biệt ung thư da chuyên nghiệp, chơi cờ vây, thay người nông dân chăm sóc vàtrồng trọt, nhận diện khuôn mặt trên thiết bị từ các ứng dụng Facebook, Messenger,

 Deep Learning có độ chính xác cao, đảm bảo cho các thiết bị điện tử tiêudùng có thể đáp ứng được mọi nhu cầu cũng như mong đợi của người dùng

 Cung cấp hệ thống gợi ý trên các nền tảng lớn như: Facebook, Amazon,Netflix,… cực kỳ mạnh mẽ, giúp tăng đáng kể độ tương tác của người dùng

 Khả năng nhận diện hình ảnh tốt, không chỉ xác định được đối tượng trongảnh mà còn hiểu được nội dung và ngữ cảnh trong đó

 Deep Learning rất ưu tiên và chú trọng về độ an toàn đối với những mô hình

xe “tự điều khiển”

Trang 14

 Những dữ liệu của Deep Learning được dán nhãn bởi: sự phát triển của xe

“tự điều khiển” đòi hỏi hàng triệu hình ảnh cũng như hàng ngàn giờ để xemvideo

 GPU có hiệu suất cao và kiến thức song song nên rất hiệu quả cho DeepLearning Khi kết hợp với điện toán đám mây hoặc các cụm, Deep Learningcho phép nhóm phát triển có thể giảm tối đa thời gian đào tạo đối với mạnglưới học tập chỉ với vài tuần hoặc vài giờ

Nhược điểm

 Deep Learning luôn đòi hỏi một nguồn khủng các dữ liệu đầu vào để máytính học hỏi Quy trình này mất nhiều thời gian và sức mạnh xử lý mà chỉ cócác Server chuyên nghiệp mới có thể làm được Trường hợp không đủ dữliệu đầu vào để xử lý, mọi thứ sẽ không thể diễn ra đúng như dự định củamáy tính đưa ra

 Deep Learning chưa thể nhận biết được những thứ phức tạp Bởi, kỹ thuậtcủa Deep Learning hiện chưa đảm bảo tốt để trí tuệ nhân tạo có thể rút ranhững kết luận một cách logic

Có thể thấy, những trí tuệ nhân tạo nói chung và Deep Learning nói riêng đều

là những ứng dụng công nghệ hiện đại, mang đến nhiều hữu ích tuyệt hảocho con người Tuy nhiên, hệ thống trí tuệ nhân tạo chỉ mới được phát triển ởnhững giai đoạn đầu tiên nên còn tồn tại nhiều hạn chế là điều khó tránhkhỏi

Với những viên gạch đầu tiên đầy tiềm năng, chắc chắn trong tương lai, hệthống AI sẽ còn bùng nổ mạnh mẽ, mở ra kỷ nguyên mới đầy thú vị cho conngười Hy vọng bài viết trên đây phần nào giúp bạn hiểu rõ hơn về “DeepLearning là gì?” và những tiềm năng đặc biệt của ứng dụng mang đến chocuộc sống

Trang 15

1.2 Tổng quan về học máy ( Machine learning)

1.2.1 Machine learning là gì??

Học máy (Machine Learning) là một lĩnh vực của trí tuệ nhân tạo (AI) nghiên cứu

về cách xây dựng các mô hình toán học để học từ dữ liệu và tự động cải thiện hiệu suất của chúng theo thời gian Mục tiêu của học máy là cung cấp cho máy tính khả năng học hỏi và tìm hiểu mà không cần được lập trình một cách cụ thể Điều này cho phép máy tính "học" từ các kinh nghiệm và dữ liệu và tự động tìm ra các mẫu

và quy luật tiềm ẩn trong dữ liệu để giải quyết các bài toán phức tạp

Các kỹ thuật học máy chủ yếu được chia thành ba loại chính là học có giám sát (supervised learning), học không giám sát (unsupervised learning) và học bán giám sát (semi-supervised learning)

Trong học có giám sát, mô hình học từ dữ liệu được gán nhãn (labeled data) và mụctiêu là dự đoán nhãn cho các dữ liệu mới Các ví dụ của học có giám sát là phân loại(classification) và hồi quy (regression)

Trong học không giám sát, mô hình học từ dữ liệu không gán nhãn (unlabeled data)

và mục tiêu là tìm ra cấu trúc ẩn trong dữ liệu Các ví dụ của học không giám sát là phân cụm (clustering) và giảm chiều dữ liệu (dimensionality reduction)

Trong học bán giám sát, mô hình học từ một lượng lớn các dữ liệu không gán nhãn

và một lượng nhỏ các dữ liệu được gán nhãn Mục tiêu là kết hợp thông tin từ cả dữ liệu gán nhãn và không gán nhãn để tạo ra một mô hình tốt hơn

Các ứng dụng của học máy rất đa dạng, từ phát hiện gian lận (fraud detection), phântích tín dụng (credit scoring), xử lý ngôn ngữ tự nhiên (natural language

processing), nhận dạng giọng nói (speech recognition), xử lý ảnh và video, cho đến robot tự hành và các ứng dụng trong lĩnh vực y tế

1.2.2 Các phương pháp Machine learning

1.Học có giám sát (Supervised learning): Đây là phương pháp trong đó mô hình được đào tạo bằng cách sử dụng các cặp dữ liệu đầu vào - đầu ra (input-output) đã biết Mục đích là học cách dự đoán đầu ra (output) của các dữ liệumới (chưa được đưa vào mô hình) dựa trên các đầu vào (input) được cung cấp Các thuật toán học có giám sát phổ biến bao gồm hồi quy tuyến tính (linear regression), phân loại (classification), mạng nơ-ron (neural networks),

và cây quyết định (decision trees)

2.Học không giám sát (Unsupervised learning): Đây là phương pháp mà mô hình được đào tạo bằng cách sử dụng các dữ liệu đầu vào không có đầu ra tương ứng Mục đích của học không giám sát là tìm ra các mẫu và cấu trúc trong dữ liệu mà không cần các nhãn đầu ra Các thuật toán học không giám sát phổ biến bao gồm phân cụm (clustering), giảm chiều dữ liệu

Trang 16

(dimensionality reduction), và phân tích thành phần chính (principal component analysis).

3.Học bán giám sát (Semi-supervised learning): Đây là phương pháp mà mô hình được đào tạo bằng cách sử dụng một số dữ liệu đầu vào có nhãn và một

số dữ liệu đầu vào không có nhãn Mục đích của học bán giám sát là tận dụng các dữ liệu không nhãn để cải thiện hiệu quả của mô hình Các thuật toán học bán giám sát phổ biến bao gồm học tăng cường (reinforcement learning) và mô hình hỗn hợp Gaussian (Gaussian mixture models)

1.2.3 So sánh học sâu (deep learning) và học máy (Machine learning)

Máy học và học sâu đều là hai lĩnh vực quan trọng trong lĩnh vực trí tuệ nhân tạo (AI) và thường được sử dụng để giải quyết các vấn đề phức tạp trong các lĩnh vực như nhận dạng hình ảnh, nhận dạng giọng nói, dự báo và xử lý ngôn ngữ tự nhiên.Tuy nhiên, máy học và học sâu có những điểm khác nhau sau:

- Độ sâu của mô hình: Học sâu đề cập đến việc sử dụng mạng nơ-ron đatầng với nhiều lớp ẩn để tạo ra các mô hình có độ sâu lớn Trong khi

đó, máy học thường sử dụng các mô hình tuyến tính và không có độ sâu lớn như mạng nơ-ron đa tầng

- Khả năng học: Học sâu có khả năng học tự động các đặc trưng trừu tượng và phức tạp hơn so với máy học Điều này cho phép học sâu xử

lý và giải quyết các vấn đề phức tạp hơn

- Khối lượng dữ liệu: Học sâu cần một lượng dữ liệu lớn hơn so với máy học để huấn luyện các mô hình Điều này là do các mô hình học sâu có số lượng tham số lớn hơn và cần nhiều dữ liệu để đào tạo các tham số này

- Tính diễn giải: Máy học thường có tính diễn giải cao hơn so với học sâu Điều này là do các mô hình học sâu có độ phức tạp lớn hơn và khó giải thích cách chúng hoạt động

- Tính khả dụng: Máy học được sử dụng rộng rãi hơn học sâu trong các ứng dụng do nó cần ít dữ liệu hơn và dễ triển khai hơn Trong khi đó, học sâu thường được sử dụng trong các lĩnh vực như thị giác máy tính

và xử lý ngôn ngữ tự nhiên

1.3 Computer Vision

Computer Vision (tạm dịch là "Thị giác máy tính") là một lĩnh vực của khoa học máy tính liên quan đến việc xử lý, phân tích và tạo ra thông tin từ các hình ảnh và video Computer Vision thường được sử dụng để giải quyết các vấn đề như nhận dạng, phân loại, phát hiện, theo dõi và đo lường đối tượng trong hình ảnh.Các ứng dụng của Computer Vision rất đa dạng, bao gồm nhận dạng khuôn mặt, nhận dạng vật thể, phân tích dữ liệu y tế, điều khiển các hệ thống tự động (như xe tự

Ngày đăng: 20/09/2023, 15:43

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w