1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

ỨNG DỤNG DEEP LEARNING xây DỰNG hệ THỐNG NHẬN DIỆN tư THẾ NGƯỜI

29 111 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 29
Dung lượng 23,16 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Pose Estimation ( đôi khi được dùng với thuật ngữ Skeleton Detection) là một vấn đề khá phổ biến trong lĩnh vực xử lý ảnh khi chúng ta cần xác định vị trí và tư thế của một đối tượng. Mức ý nghĩa ở đây là chúng ta phải rút ra được những đặc điểm chính, những đặc điểm đó là những đặc trưng của đối tượng ( có thể mô tả được đối tượng). Ở trong đề tài này, chúng em muốn đề cập đến bài toán Human Pose Estimation, tức là xác định và chỉ ra được một phần toàn bộ các phần chính của cơ thể con người (vd vai, khuỷu tay, cổ tay, đầu gối v.v). Ở đây chúng em trình bày một cách tiếp cận để phát hiện tư thế 2D của nhiều người trong một hình ảnh. Cách tiếp cận sử dụng một biểu diễn không theo tỷ lệ để tìm hiểu cách liên kết các bộ phận cơ thể với các cá nhân trong hình ảnh. Nhận dạng tư thế 2D của con người vấn đề kết nối các điểm chính hoặc các bộ phận, trong đó phần lớn tập trung vào việc tìm kiếm các bộ phận cơ thể của các cá nhân. Từ đó, ta suy ra dạng tư thế của nhiều người trong các hình ảnh. Trong đề tài này chúng em sử dụng thuật toán nhận tư thế con người, đã được thực hiện bằng cách sử dụng Tensorflow. Nó cũng cung cấp một số biến thể có một số thay đổi về cấu trúc mạng để xử lý thời gian thực trên CPU hoặc các thiết bị nhúng công suất thấp. Ở đây chúng em sẽ sử dụng mô hình được huấn luyện sẵn để chỉ ra các phần chính của cơ thể con người. Trong quá trình thực hiện, xuất hiện nhiều khó khăn. Đầu tiên, mỗi hình ảnh có thể chứa một số lượng người không xác định có thể xảy ra ở bất kỳ vị trí hoặc tỷ lệ nào. Thứ hai, sự tương tác giữa mọi người gây ra sự can thiệp không gian phức tạp, do tiếp xúc, tắc và khớp nối chi, làm cho việc liên kết các bộ phận trở nên khó khăn. Thứ ba, độ phức tạp thời gian chạy có xu hướng tăng theo số lượng người trong ảnh, khiến cho hiệu suất thời gian thực trở thành một thách thức. Tuy gặp một số khó khăn như trên tuy nhiên vẫn thu được kết quả cơ bản của phần nhận diện này sẽ là dạng tư thế của người sử dụng được nhận trực tiếp từ video với thời gian thực soft real time, bao gồm các điểm chính của cơ thể.   MỤC LỤC 1. GIỚI THIỆU 1 1.1 Tổng quan 1 1.2 Nhiệm vụ đề tài 1 1.3 Đối tượng phạm vi đề tài 2 1.4 Phương pháp nghiên cứu 2 1.5 Phân chia công việc nhóm 2 2. LÝ THUYẾT 3 2.1 Tổng quan về nhận diện tư thế 3 2.2 Deep Learning 4 2.3 Mạng Nơron tích chập (CNN) 8 2.4 Áp dụng CNN vào bài toán nhận diện tư thế 12 3 THIẾT KẾ VÀ THỰC HIỆN PHẦN MỀM 13 3.1 Yêu cầu đặt ra 13 3.2 Phân tích định hướng 13 3.3 Lưu đồ giải thuật 14 4 KẾT QUẢ THỰC HIỆN 18 4.1 Dữ liệu thực hiện 18 4.2 Kết quả thực hiện 19 5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 22 5.1 Kết luận 22 5.2 Hướng phát triển 22 6 TÀI LIỆU THAM KHẢO 22

Trang 1

KHOA ĐIỆN – ĐIỆN TỬ

BỘ MÔN ĐIỆN TỬ

-o0o -ĐỒ ÁN TIẾN HÀNH THỰC NGHIỆM

ỨNG DỤNG DEEP LEARNING XÂY DỰNG HỆ

THỐNG NHẬN DIỆN TƯ THẾ NGƯỜI

GVHD: TS TRƯƠNG QUANG VINH SVTH: Đinh Võ Hoàng Tuấn – 1513814

Nguyễn Đình Minh Nhật – 1512292

TP HỒ CHÍ MINH, THÁNG 6 NĂM 2019

Trang 2

LỜI CẢM ƠN

Chúng em xin gửi lời cảm ơn chân thành đến TS Trương Quang Vinh, giảng viên Bộ môn Điện tử - trường ĐH Bách Khoa Hồ Chí Minh người đã tận tình hướng dẫn, chỉ bảo chúng em trong trong thời gian thực hiện Đồ án Tiến hành thực nghiệm, chúng em đã nhận được nhiều sự giúp đỡ, đóng góp ý kiến và chỉ bảo nhiệt tình từ thầy.

Em cũng xin chân thành cảm ơn các thầy cô giáo trong trường ĐH Bách Khoa

Hồ Chí Minh đã dạy dỗ cho em kiến thức về các môn đại cương cũng như các môn chuyên ngành, giúp em có được cơ sở lý thuyết vững vàng và tạo điều kiện giúp đỡ em trong suốt quá trình học tập.

Tp Hồ Chí Minh, ngày 13 tháng 6 năm 2019

Trang 3

TÓM TẮT ĐỒ ÁN

Pose Estimation ( đôi khi được dùng với thuật ngữ Skeleton Detection) là một vấn đề khá phổbiến trong lĩnh vực xử lý ảnh khi chúng ta cần xác định vị trí và tư thế của một đối tượng Mức ý nghĩa ở đây là chúng ta phải rút ra được những đặc điểm chính, những đặc điểm đó là những đặc trưng của đối tượng ( có thể mô tả được đối tượng)

Ở trong đề tài này, chúng em muốn đề cập đến bài toán Human Pose Estimation, tức là xác định và chỉ ra được một phần/ toàn bộ các phần chính của cơ thể con người (vd vai, khuỷu tay, cổ tay, đầu gối v.v)

Ở đây chúng em trình bày một cách tiếp cận để phát hiện tư thế 2D của nhiều người trong mộthình ảnh Cách tiếp cận sử dụng một biểu diễn không theo tỷ lệ để tìm hiểu cách liên kết các

bộ phận cơ thể với các cá nhân trong hình ảnh

Nhận dạng tư thế 2D của con người - vấn đề kết nối các điểm chính hoặc các bộ phận, trong

đó phần lớn tập trung vào việc tìm kiếm các bộ phận cơ thể của các cá nhân Từ đó, ta suy ra dạng tư thế của nhiều người trong các hình ảnh

Trong đề tài này chúng em sử dụng thuật toán nhận tư thế con người, đã được thực hiện bằng cách sử dụng Tensorflow Nó cũng cung cấp một số biến thể có một số thay đổi về cấu trúc mạng để xử lý thời gian thực trên CPU hoặc các thiết bị nhúng công suất thấp Ở đây chúng

em sẽ sử dụng mô hình được huấn luyện sẵn để chỉ ra các phần chính của cơ thể con người Trong quá trình thực hiện, xuất hiện nhiều khó khăn Đầu tiên, mỗi hình ảnh có thể chứa một

số lượng người không xác định có thể xảy ra ở bất kỳ vị trí hoặc tỷ lệ nào Thứ hai, sự tương tác giữa mọi người gây ra sự can thiệp không gian phức tạp, do tiếp xúc, tắc và khớp nối chi, làm cho việc liên kết các bộ phận trở nên khó khăn Thứ ba, độ phức tạp thời gian chạy có xu hướng tăng theo số lượng người trong ảnh, khiến cho hiệu suất thời gian thực trở thành một thách thức

Tuy gặp một số khó khăn như trên tuy nhiên vẫn thu được kết quả cơ bản của phần nhận diện này sẽ là dạng tư thế của người sử dụng được nhận trực tiếp từ video với thời gian thực soft real time, bao gồm các điểm chính của cơ thể

Trang 4

MỤC LỤC

1 GIỚI THIỆU 1

1.1 Tổng quan 1

1.2 Nhiệm vụ đề tài 1

1.3 Đối tượng phạm vi đề tài 2

1.4 Phương pháp nghiên cứu 2

1.5 Phân chia công việc nhóm 2

2 LÝ THUYẾT 3

2.1 Tổng quan về nhận diện tư thế 3

2.2 Deep Learning 4

2.3 Mạng Nơ-ron tích chập (CNN) 8

2.4 Áp dụng CNN vào bài toán nhận diện tư thế 12

3 THIẾT KẾ VÀ THỰC HIỆN PHẦN MỀM 13

3.1 Yêu cầu đặt ra 13

3.2 Phân tích định hướng 13

3.3 Lưu đồ giải thuật 14

4 KẾT QUẢ THỰC HIỆN 18

4.1 Dữ liệu thực hiện 18

4.2 Kết quả thực hiện 19

5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 22

5.1 Kết luận 22

5.2 Hướng phát triển 22

6 TÀI LIỆU THAM KHẢO 22

Trang 5

DANH SÁCH HÌNH MINH HỌA

Hình 1 Kế hoạch dự án 2

Hình 2 Team contract 3

Hình 3 So sánh AI, Machine Learning, Deep Learning 5

Hình 4 Cách thức hoạt động Deep learning 6

Hình 5 Ví dụ ứng dụng deep learning 7

Hình 6 CNN có khả năng trích đặc trưng và phân lớp 8

Hình 7 CNN tính tích chập cho ảnh 10

Hình 8 Phương pháp Pooling trong CNN 11

Hình 9 Gradient Descent 11

Hình 10 15 đặc trưng trên dáng người 12

Hình 11 Kiến trúc mạng CNN 2 nhánh 13

Hình 12 PAF tương ứng kết nối khủy tay và cánh tay phải, màu sắc mã hóa hướng 14

Hình 13 Sơ đồ khối hệ thống 14

Hình 14 Heatmap 15

Hình 15 Part Affinity Fields 15

Hình 16 Điểm cổ kết nối với điểm hông phải 16

Hình 17 Line Integral 16

Hình 18 Tích phân đường tính toán 16

Hình 19 Assignment Algorithm 17

Hình 20 COCO dataset 19

Hình 21 Khởi chạy chương trình bằng Anaconda Prompt 19

Hình 22 Ảnh không có người 19

Hình 23 Trường hợp ảnh 1 người 20

Hình 24 Ảnh nhiều người 20

Hình 25 Nhận diện tương đối chính xác trường hợp tư thế khó 21

Trang 6

Hình 26 Chương trình chạy webcam 21

DANH SÁCH BẢNG SỐ LIỆU

Bảng 1 Thông số hệ thống 3

Trang 7

1 GIỚI THIỆU

1.1 Tổng quan

Mục tiêu của đề tài là xây dựng một hệ thống cho phép dùng camera ghi lại video vàdùng các giải thuật nhận dạng khung xương người, qua đó xác định tự thế người dựa trêncác phân lớp được định nghĩa sẵn Đồng thời hệ thống có thể nhận dạng dáng đi với đầuvào là ảnh tĩnh và video lưu sẵn Kết quả thu được là cơ sở thực hiện các nghiên cứu tiếptheo về dáng đi người hỗ trợ cho các hệ thống như:

- Hỗ trợ sinh hoạt: Robot chăm sóc cá nhân tại nhà, bệnh viện có thể được triển khai

trong tương lai Đối với những robot này, việc phát hiện và ước tính tư thế con người

có độ chính xác cao là cần thiết để thực hiện nhiều nhiệm vụ khác nhau, chẳng hạnnhư phát hiện ngã

- Nhân vật hoạt hình: Theo truyền thống, việc tạo hình nhân vật hoạt hình là một quá

trình thủ công Tuy nhiên, các tư thế có thể được đồng bộ hóa trực tiếp với một diễnviên ngoài đời thực thông qua các hệ thống ước tính tư thế chuyên biệt Các hệ thống

cũ dựa vào các điểm đánh dấu hoặc bộ quần áo chuyên dụng Những tiến bộ gần đâytrong ước tính tư thế và chụp chuyển động đã cho phép các ứng dụng trong thời gianthực không cần đánh dấu

- Hệ thống hỗ trợ lái xe thông minh: Tai nạn xe hơi chiếm khoảng 2% số người chết

trên toàn cầu mỗi năm Do đó, hệ thống thông minh theo dõi tư thế tài xế có thể dùngcho các cảnh báo khẩn cấp Đồng thời, các thuật toán phát hiện người đi bộ đã được

sử dụng thành công trên những chiếc xe tự hành, cho phép chiếc xe đưa ra quyết địnhthông minh hơn

- Ứng dụng y tế: Theo dõi khung xương đã được sử dụng để phát hiện các vấn đề về tư

thế như vẹo cột sống bằng cách phân tích các bất thường ở tư thế của bệnh nhân , vật

lý trị liệu và nghiên cứu về sự phát triển não bộ nhận thức của trẻ nhỏ bằng cách theodõi chức năng vận động

1.2 Nhiệm vụ đề tài

 Nội dung 1: Nghiên cứu các đặc trưng tư thế người , phân tích tư thế

tượng

Trang 8

 Nội dung 3: Xây dựng các mô hình mạng neural network ước lượng, xác định các

vị trí khớp xương trên khung xương, từ đó mô tả lại khung xương đối tượng

webcam hoặc video

1.3 Đối tượng phạm vi đề tài

 Các tập dữ liệu dáng đi, tư thế của một hoặc nhiều người

 Các mô hình mạng nơ ron và deep learning

 Các thư viện, framework hỗ trợ xử lý ảnh, deep learning với python: OpenCV,TensorFlow, Keras, OpenPose, Caffe …

1.4 Ph ương pháp nghiên cứu ng pháp nghiên c u ứu

- Nghiên cứu các bài báo liên quan

- Tìm hiểu các phương pháp xử lý ảnh, mô hình hóa

- Nghiên cứu deep learning và các mô hình neural network

- Lựa chọn, xử lý tập dữ liệu huấn liệu

- Xây dựng, thử nghiệm các thuật toán, viết chương trình hoàn chỉnh

- Thực nghiệm với đầu vào là các video, webcam

- Kiểm tra, tối ưu chương trình, đánh giá kết quả

1.5 Phân chia công vi c nhóm ệc nhóm

Kế hoạch dự án

Trang 9

Tìm thông tin đề tài, đọc paper, tài liệu

Tìm hiểu thư viện, data Xây dựng giải thuật, chọn phần mềm

Xử lý data, xây dựng mô hình học máy

Viết code chương trình, debug

Tối ưu chương trình

Báo cáo

01/03 11/03 21/03 31/03 10/04 20/04 30/04 10/05 20/05 30/05 Ngày bắt đầu Thời gian

Hình 1 Kế hoạch dự án

TEAM CONTRACT

Team name: Hoàng Tuấn + Minh Nhật Date: 01/03/2019

Team Member Roles Signature

Đinh Võ Hoàng Tuấn

Leader, study algorithms and write programs

Nguyễn Đình Minh Nhật

Study algorithms and write programs

Tasks Responsible Member

Team meeting 19 - 20h sáng, mỗi thứ 7, CN

Team rules 1 Mọi người cùng làm việc

2 Tranh cãi và thảo luận tự do

3 Tập trung vào chủ đề, không nói lan man khi họp nhóm

4 Luôn nghĩ ra các biện pháp cải tiến trong quá trình làm sản phẩm

5 Ghi chép lại các ghi chú cần thiết và quan trọng

Trang 10

Hình 2 Team contract

2 LÝ THUYẾT

2.1 T ng quan v nh n di n t th ổng quan về nhận diện tư thế ề nhận diện tư thế ận diện tư thế ệc nhóm ư ế

Phân tích tư thế của người là một bài toán phức tạp và đầy thách thức bởi phạm virộng lớn của nó Nhận dạng dáng đi, theo vết chuyển động, mô hình hóa và xác địnhngữ nghĩa của dáng đi là những vấn đề đang nhận được nhiều sự chú ý trong lĩnh vựcthị giác máy tính, cũng như cộng đồng các nhà nghiên cứu về học máy Bên cạnhnhững ứng dụng trong giám sát, tương tác người – máy, đa phương tiện và mô phỏng,việc sử dụng các hệ thống thị giác máy tính còn phục vụ cho mục tiêu chăm sóc y tếtại nhà Các hệ thống này sử dụng camera kết nối với máy tính hoặc bộ xử lý chuyêndụng để quan sát và đánh giá dáng đi của người Hiện nay đã có nhiều nghiên cứu đạtkết quả cao trong việc phân tích dáng người dựa trên nhận diện các điểm đặc trưng cơ

thể (keypoint).

Quá trình phân tích đặc trưng gồm 3 giai đoạn chính: phân đoạn để xác định đốitượng chuyển động, theo vết đối tượng, và trích xuất các đặc trưng biểu diễn thôngtin Bước đầu tiên thường là tách đối tượng cần quan tâm ra khỏi phần còn lại củaảnh, gọi là nền Trong các hệ thống chăm sóc y tế, đối tượng chuyển động là conngười Bước tiếp theo nhận diện các điểm đặc trưng trên đối tượng và theo vết Đểlàm được điều này cần sử dụng các mô hình mạng nơ ron và các kỹ thuật học sâu đểhuấn luyện với bộ dữ liệu về các keypoint Việc theo vết đối tượng có liên quan đếnviệc ước lượng tư thế, vị trí, và chuyển động của các phần trên cơ thể Ước lượng tưthế có thể xem như một bước hậu xử lý của quá trình theo vết, hoặc có thể được tíchhợp trực tiếp Bước thứ ba sử dụng kết quả theo vết và thông tin về quỹ đạo chuyểnđộng của các phần cơ thể để trích xuất các đặc trưng phù hợp

Phương pháp này là cách tiếp cận theo hướng từ trên xuống (top-down) khá hiệuquả trong trường hợp đối tượng chỉ có một người và rõ rang trong khung ảnh, tuynhiên bài toán nhận diện dáng người của nhiều người trong cùng một khung ảnh làmột thách thức không chỉ về độ chính xác mà còn về tốc độ xử lý

Trang 11

2.2 Deep Learning

Trong những năm qua, thuật ngữ "deep learning" đã dần len lỏi vào cuộc sống mỗi khi có cuộc hội thoại nào bàn về trí tuệ nhân tạo (AI), dữ liệu lớn (Big Data) và phân tích (Analytics) Và với lý do chính đáng – đây là một cách tiếp cận đầy hứa hẹntới AI khi phát triển các hệ thống tự trị, tự học, những thứ đang cách mạng hóa nhiều ngành công nghiệp

Deep learning được Google sử dụng trong các thuật toán nhận dạng giọng nói và hình ảnh, còn Netflix và Amazon thì dùng để xác định xem bạn muốn xem gì hay mua

gì tiếp theo, và các nhà nghiên cứu tại Viện Công nghệ Massachusetts (MIT) dùng để

dự đoán tương lai

Hình 3 So sánh AI, Machine Learning, Deep Learning

Nếu coi machine learning là công nghệ tiên tiến nhất, thì deep learning là "tiên tiến của tiên tiến" Machine learning lấy một vài ý tưởng cốt lõi của trí tuệ nhân tạo vàtập trung vào việc giải quyết các vấn đề thế giới thực với các neural network được thiết kế để bắt chước khả năng đưa ra quyết định của chúng ta Deep learning, đúng như tên gọi của nó, đi sâu hơn nữa vào một tập hợp các công cụ và kỹ thuật machine learning, từ đó áp dụng chúng để giải quyết bất kỳ vấn đề nào đòi hỏi "khả năng tư duy" – con người hay nhân tạo

Cách thức hoạt động :

Trang 12

Về cơ bản, deep learning là cho một hệ thống máy tính "thu" rất nhiều dữ liệu, để chúng có thể sử dụng và đưa ra các quyết định về những dữ liệu khác Dữ liệu này được nạp thông qua các neural network, tương tự như machine learning Những mạnglưới này – các cấu trúc logic yêu cầu một loạt các câu hỏi đúng/sai, hoặc trích xuất một giá trị số, của mỗi bit dữ liệu đi qua chúng và phân loại theo các câu trả lời nhận được.

Hình 4 Cách thức hoạt động Deep learning

Vì công việc của deep learning là tập trung phát triển những mạng lưới này, chúng

đã trở thành Deep Neural Network – những mạng logic phức tạp cần thiết để xử lý các bộ dữ liệu lớn, như thư viện hình ảnh của Google hay Instagram

Các hình ảnh là ví dụ tuyệt vời nhất về cách thức hoạt động của deep learning, vì chúng có chứa nhiều yếu tố khác nhau và để hiểu rõ được làm thế nào để máy tính, với não bộ một chiều chủ yếu dựa trên sự tính toán, có thể học cách giải thích chúng giống như con người Tuy vậy, deep learning có thể được áp dụng cho bất kỳ hình thức dữ liệu nào – âm thanh, video, lời nói, chữ viết, – để đưa ra những kết luận nhưthể do con người thực hiện với tốc độ rất nhanh Điều này có thể được biên soạn theo cách thủ công hoặc, trong các điều kiện tiên tiến hơn, được thu thập tự động bởi hệ thống nếu như nó được lập trình để tìm kiếm trên internet và lấy dữ liệu mà nó tìm thấy ở đó

Trang 13

Tiếp theo, nó sẽ lấy dữ liệu cần được xử lý – dữ liệu trong thế giới thực có chứa thông tin chi tiết cần nắm bắt Bằng cách so sánh dữ liệu thu được với những dữ liệu

mà nó đã "học được", nó có thể thực hiện những yêu cầu được đề ra một cách chính xác

Hình 5 Ví dụ ứng dụng deep learningĐến đây mới chỉ là phần đơn giản Khi chúng ta đi đến phần "sâu", là khi hệ thốngbắt đầu biết tích lũy kinh nghiệm, nó sẽ có thể tăng khả năng phân loại của mình bằngcách "tự tập luyện" với những dữ liệu mới mà nó nhận được Nói cách khác, nó sẽ có thể học hỏi từ chính những sai lầm của nó – giống như chúng ta, nó sẽ cải thiện độ chính xác trong những lần thực hiện tiếp theo

Vậy deep learning có thể làm được gì?

Để trả lời cho câu hỏi lí do tại sao deep learning lại được coi là bước đột phá lớn đến như vậy ta có thể đưa ra một số ví dụ về các cách thức mà deep learning đang được sử dụng trong thế giới ngày nay Những ứng dụng ấn tượng đang được triển khai

và nghiên cứu có liên quan đến deep learning bao gồm:

- Cung cấp khả năng điều hướng cho xe tự lái: Với hệ thống cảm biến và phần mềm phân tích trên buồng lái, các xe tự lái có thể học cách nhận dạng những chướng ngại vật có trên đường và có giải pháp xử lý thích hợp bằng cách sử dụng deep

learning

Trang 14

- Phục chế màu cho ảnh đen trắng: thông qua việc dạy cho máy tính cách nhận biết các vật thể và cách mà mắt người nhìn chúng, các hình ảnh và video đen trắng sẽ

có thể được tái hiện lại với đầy đủ các màu sắc phù hợp

- Dự đoán kết quả của các thủ tục pháp lý: Một nhóm các nhà nghiên cứu người Anh và Mỹ đã có thể dự đoán chính xác kết quả của một phiên tòa, sau khi hệ thống máy tính của họ được nạp sẵn những thông tin cơ bản của vụ án

- Thuốc đặc trị: Các kỹ thuật deep learning hiện đang được dùng để phát triển các loại thuốc đã được chỉnh sửa sao cho phù hợp với bộ gen của bệnh nhân

- Phân tích và báo cáo tự động: Các hệ thống có thể phân tích dữ liệu và báo cáo những thông tin chi tiết của chúng dưới dạng âm thanh tự nhiên hoặc ngôn ngữ của con người

- Chơi trò chơi: Các hệ thống deep learning đã và đang được dạy cách chơi (và giành chiến thắng) các trò chơi như cờ vây, Breakout của Atari hay Starcraft

2.3 M ng N -ron tích ch p (CNN) ạng Nơ-ron tích chập (CNN) ơng pháp nghiên cứu ận diện tư thế

Mạng Convolutional Neural Network (còn gọi tắt là CNN) ra đời từ lâunhưng gần đây mới gây sự chú ý cho giới cộng đồng khoa học cũng như chứngminh được tính hiệu quả mạnh mẽ của nó trong việc áp dụng vào phân loại vànhận dạng nhiều đối tượng trong thực tế So với các phương pháp cổ điển,thay vì phải trải qua một bước là Trích đặc trưng bằng các thuật toán nhưSIFT, SURF, các bộ lọc, HOG, Các giải thuật này có thể gặp khó khăn bịảnh hưởng bởi nhiều điều kiện lẫn nhiễu Sau đó tới bước phân loại có thể bằngSVM, NN, thì CNN tự nó xây dựng nhưng bộ trích đặc trưng thông qua quátrình học từ dữ liệu và phân lớp Do đó, CNN không chỉ giúp cho việc học dữliệu trở nên dễ dàng và chính xác hơn

Ngày đăng: 12/05/2021, 11:41

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w