Pose Estimation ( đôi khi được dùng với thuật ngữ Skeleton Detection) là một vấn đề khá phổ biến trong lĩnh vực xử lý ảnh khi chúng ta cần xác định vị trí và tư thế của một đối tượng. Mức ý nghĩa ở đây là chúng ta phải rút ra được những đặc điểm chính, những đặc điểm đó là những đặc trưng của đối tượng ( có thể mô tả được đối tượng). Ở trong đề tài này, chúng em muốn đề cập đến bài toán Human Pose Estimation, tức là xác định và chỉ ra được một phần toàn bộ các phần chính của cơ thể con người (vd vai, khuỷu tay, cổ tay, đầu gối v.v). Ở đây chúng em trình bày một cách tiếp cận để phát hiện tư thế 2D của nhiều người trong một hình ảnh. Cách tiếp cận sử dụng một biểu diễn không theo tỷ lệ để tìm hiểu cách liên kết các bộ phận cơ thể với các cá nhân trong hình ảnh. Nhận dạng tư thế 2D của con người vấn đề kết nối các điểm chính hoặc các bộ phận, trong đó phần lớn tập trung vào việc tìm kiếm các bộ phận cơ thể của các cá nhân. Từ đó, ta suy ra dạng tư thế của nhiều người trong các hình ảnh. Trong đề tài này chúng em sử dụng thuật toán nhận tư thế con người, đã được thực hiện bằng cách sử dụng Tensorflow. Nó cũng cung cấp một số biến thể có một số thay đổi về cấu trúc mạng để xử lý thời gian thực trên CPU hoặc các thiết bị nhúng công suất thấp. Ở đây chúng em sẽ sử dụng mô hình được huấn luyện sẵn để chỉ ra các phần chính của cơ thể con người. Trong quá trình thực hiện, xuất hiện nhiều khó khăn. Đầu tiên, mỗi hình ảnh có thể chứa một số lượng người không xác định có thể xảy ra ở bất kỳ vị trí hoặc tỷ lệ nào. Thứ hai, sự tương tác giữa mọi người gây ra sự can thiệp không gian phức tạp, do tiếp xúc, tắc và khớp nối chi, làm cho việc liên kết các bộ phận trở nên khó khăn. Thứ ba, độ phức tạp thời gian chạy có xu hướng tăng theo số lượng người trong ảnh, khiến cho hiệu suất thời gian thực trở thành một thách thức. Tuy gặp một số khó khăn như trên tuy nhiên vẫn thu được kết quả cơ bản của phần nhận diện này sẽ là dạng tư thế của người sử dụng được nhận trực tiếp từ video với thời gian thực soft real time, bao gồm các điểm chính của cơ thể. MỤC LỤC 1. GIỚI THIỆU 1 1.1 Tổng quan 1 1.2 Nhiệm vụ đề tài 1 1.3 Đối tượng phạm vi đề tài 2 1.4 Phương pháp nghiên cứu 2 1.5 Phân chia công việc nhóm 2 2. LÝ THUYẾT 3 2.1 Tổng quan về nhận diện tư thế 3 2.2 Deep Learning 4 2.3 Mạng Nơron tích chập (CNN) 8 2.4 Áp dụng CNN vào bài toán nhận diện tư thế 12 3 THIẾT KẾ VÀ THỰC HIỆN PHẦN MỀM 13 3.1 Yêu cầu đặt ra 13 3.2 Phân tích định hướng 13 3.3 Lưu đồ giải thuật 14 4 KẾT QUẢ THỰC HIỆN 18 4.1 Dữ liệu thực hiện 18 4.2 Kết quả thực hiện 19 5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 22 5.1 Kết luận 22 5.2 Hướng phát triển 22 6 TÀI LIỆU THAM KHẢO 22
Trang 1KHOA ĐIỆN – ĐIỆN TỬ
BỘ MÔN ĐIỆN TỬ
-o0o -ĐỒ ÁN TIẾN HÀNH THỰC NGHIỆM
ỨNG DỤNG DEEP LEARNING XÂY DỰNG HỆ
THỐNG NHẬN DIỆN TƯ THẾ NGƯỜI
GVHD: TS TRƯƠNG QUANG VINH SVTH: Đinh Võ Hoàng Tuấn – 1513814
Nguyễn Đình Minh Nhật – 1512292
TP HỒ CHÍ MINH, THÁNG 6 NĂM 2019
Trang 2LỜI CẢM ƠN
Chúng em xin gửi lời cảm ơn chân thành đến TS Trương Quang Vinh, giảng viên Bộ môn Điện tử - trường ĐH Bách Khoa Hồ Chí Minh người đã tận tình hướng dẫn, chỉ bảo chúng em trong trong thời gian thực hiện Đồ án Tiến hành thực nghiệm, chúng em đã nhận được nhiều sự giúp đỡ, đóng góp ý kiến và chỉ bảo nhiệt tình từ thầy.
Em cũng xin chân thành cảm ơn các thầy cô giáo trong trường ĐH Bách Khoa
Hồ Chí Minh đã dạy dỗ cho em kiến thức về các môn đại cương cũng như các môn chuyên ngành, giúp em có được cơ sở lý thuyết vững vàng và tạo điều kiện giúp đỡ em trong suốt quá trình học tập.
Tp Hồ Chí Minh, ngày 13 tháng 6 năm 2019
Trang 3TÓM TẮT ĐỒ ÁN
Pose Estimation ( đôi khi được dùng với thuật ngữ Skeleton Detection) là một vấn đề khá phổbiến trong lĩnh vực xử lý ảnh khi chúng ta cần xác định vị trí và tư thế của một đối tượng Mức ý nghĩa ở đây là chúng ta phải rút ra được những đặc điểm chính, những đặc điểm đó là những đặc trưng của đối tượng ( có thể mô tả được đối tượng)
Ở trong đề tài này, chúng em muốn đề cập đến bài toán Human Pose Estimation, tức là xác định và chỉ ra được một phần/ toàn bộ các phần chính của cơ thể con người (vd vai, khuỷu tay, cổ tay, đầu gối v.v)
Ở đây chúng em trình bày một cách tiếp cận để phát hiện tư thế 2D của nhiều người trong mộthình ảnh Cách tiếp cận sử dụng một biểu diễn không theo tỷ lệ để tìm hiểu cách liên kết các
bộ phận cơ thể với các cá nhân trong hình ảnh
Nhận dạng tư thế 2D của con người - vấn đề kết nối các điểm chính hoặc các bộ phận, trong
đó phần lớn tập trung vào việc tìm kiếm các bộ phận cơ thể của các cá nhân Từ đó, ta suy ra dạng tư thế của nhiều người trong các hình ảnh
Trong đề tài này chúng em sử dụng thuật toán nhận tư thế con người, đã được thực hiện bằng cách sử dụng Tensorflow Nó cũng cung cấp một số biến thể có một số thay đổi về cấu trúc mạng để xử lý thời gian thực trên CPU hoặc các thiết bị nhúng công suất thấp Ở đây chúng
em sẽ sử dụng mô hình được huấn luyện sẵn để chỉ ra các phần chính của cơ thể con người Trong quá trình thực hiện, xuất hiện nhiều khó khăn Đầu tiên, mỗi hình ảnh có thể chứa một
số lượng người không xác định có thể xảy ra ở bất kỳ vị trí hoặc tỷ lệ nào Thứ hai, sự tương tác giữa mọi người gây ra sự can thiệp không gian phức tạp, do tiếp xúc, tắc và khớp nối chi, làm cho việc liên kết các bộ phận trở nên khó khăn Thứ ba, độ phức tạp thời gian chạy có xu hướng tăng theo số lượng người trong ảnh, khiến cho hiệu suất thời gian thực trở thành một thách thức
Tuy gặp một số khó khăn như trên tuy nhiên vẫn thu được kết quả cơ bản của phần nhận diện này sẽ là dạng tư thế của người sử dụng được nhận trực tiếp từ video với thời gian thực soft real time, bao gồm các điểm chính của cơ thể
Trang 4MỤC LỤC
1 GIỚI THIỆU 1
1.1 Tổng quan 1
1.2 Nhiệm vụ đề tài 1
1.3 Đối tượng phạm vi đề tài 2
1.4 Phương pháp nghiên cứu 2
1.5 Phân chia công việc nhóm 2
2 LÝ THUYẾT 3
2.1 Tổng quan về nhận diện tư thế 3
2.2 Deep Learning 4
2.3 Mạng Nơ-ron tích chập (CNN) 8
2.4 Áp dụng CNN vào bài toán nhận diện tư thế 12
3 THIẾT KẾ VÀ THỰC HIỆN PHẦN MỀM 13
3.1 Yêu cầu đặt ra 13
3.2 Phân tích định hướng 13
3.3 Lưu đồ giải thuật 14
4 KẾT QUẢ THỰC HIỆN 18
4.1 Dữ liệu thực hiện 18
4.2 Kết quả thực hiện 19
5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 22
5.1 Kết luận 22
5.2 Hướng phát triển 22
6 TÀI LIỆU THAM KHẢO 22
Trang 5DANH SÁCH HÌNH MINH HỌA
Hình 1 Kế hoạch dự án 2
Hình 2 Team contract 3
Hình 3 So sánh AI, Machine Learning, Deep Learning 5
Hình 4 Cách thức hoạt động Deep learning 6
Hình 5 Ví dụ ứng dụng deep learning 7
Hình 6 CNN có khả năng trích đặc trưng và phân lớp 8
Hình 7 CNN tính tích chập cho ảnh 10
Hình 8 Phương pháp Pooling trong CNN 11
Hình 9 Gradient Descent 11
Hình 10 15 đặc trưng trên dáng người 12
Hình 11 Kiến trúc mạng CNN 2 nhánh 13
Hình 12 PAF tương ứng kết nối khủy tay và cánh tay phải, màu sắc mã hóa hướng 14
Hình 13 Sơ đồ khối hệ thống 14
Hình 14 Heatmap 15
Hình 15 Part Affinity Fields 15
Hình 16 Điểm cổ kết nối với điểm hông phải 16
Hình 17 Line Integral 16
Hình 18 Tích phân đường tính toán 16
Hình 19 Assignment Algorithm 17
Hình 20 COCO dataset 19
Hình 21 Khởi chạy chương trình bằng Anaconda Prompt 19
Hình 22 Ảnh không có người 19
Hình 23 Trường hợp ảnh 1 người 20
Hình 24 Ảnh nhiều người 20
Hình 25 Nhận diện tương đối chính xác trường hợp tư thế khó 21
Trang 6Hình 26 Chương trình chạy webcam 21
DANH SÁCH BẢNG SỐ LIỆU
Bảng 1 Thông số hệ thống 3
Trang 71 GIỚI THIỆU
1.1 Tổng quan
Mục tiêu của đề tài là xây dựng một hệ thống cho phép dùng camera ghi lại video vàdùng các giải thuật nhận dạng khung xương người, qua đó xác định tự thế người dựa trêncác phân lớp được định nghĩa sẵn Đồng thời hệ thống có thể nhận dạng dáng đi với đầuvào là ảnh tĩnh và video lưu sẵn Kết quả thu được là cơ sở thực hiện các nghiên cứu tiếptheo về dáng đi người hỗ trợ cho các hệ thống như:
- Hỗ trợ sinh hoạt: Robot chăm sóc cá nhân tại nhà, bệnh viện có thể được triển khai
trong tương lai Đối với những robot này, việc phát hiện và ước tính tư thế con người
có độ chính xác cao là cần thiết để thực hiện nhiều nhiệm vụ khác nhau, chẳng hạnnhư phát hiện ngã
- Nhân vật hoạt hình: Theo truyền thống, việc tạo hình nhân vật hoạt hình là một quá
trình thủ công Tuy nhiên, các tư thế có thể được đồng bộ hóa trực tiếp với một diễnviên ngoài đời thực thông qua các hệ thống ước tính tư thế chuyên biệt Các hệ thống
cũ dựa vào các điểm đánh dấu hoặc bộ quần áo chuyên dụng Những tiến bộ gần đâytrong ước tính tư thế và chụp chuyển động đã cho phép các ứng dụng trong thời gianthực không cần đánh dấu
- Hệ thống hỗ trợ lái xe thông minh: Tai nạn xe hơi chiếm khoảng 2% số người chết
trên toàn cầu mỗi năm Do đó, hệ thống thông minh theo dõi tư thế tài xế có thể dùngcho các cảnh báo khẩn cấp Đồng thời, các thuật toán phát hiện người đi bộ đã được
sử dụng thành công trên những chiếc xe tự hành, cho phép chiếc xe đưa ra quyết địnhthông minh hơn
- Ứng dụng y tế: Theo dõi khung xương đã được sử dụng để phát hiện các vấn đề về tư
thế như vẹo cột sống bằng cách phân tích các bất thường ở tư thế của bệnh nhân , vật
lý trị liệu và nghiên cứu về sự phát triển não bộ nhận thức của trẻ nhỏ bằng cách theodõi chức năng vận động
1.2 Nhiệm vụ đề tài
Nội dung 1: Nghiên cứu các đặc trưng tư thế người , phân tích tư thế
tượng
Trang 8 Nội dung 3: Xây dựng các mô hình mạng neural network ước lượng, xác định các
vị trí khớp xương trên khung xương, từ đó mô tả lại khung xương đối tượng
webcam hoặc video
1.3 Đối tượng phạm vi đề tài
Các tập dữ liệu dáng đi, tư thế của một hoặc nhiều người
Các mô hình mạng nơ ron và deep learning
Các thư viện, framework hỗ trợ xử lý ảnh, deep learning với python: OpenCV,TensorFlow, Keras, OpenPose, Caffe …
1.4 Ph ương pháp nghiên cứu ng pháp nghiên c u ứu
- Nghiên cứu các bài báo liên quan
- Tìm hiểu các phương pháp xử lý ảnh, mô hình hóa
- Nghiên cứu deep learning và các mô hình neural network
- Lựa chọn, xử lý tập dữ liệu huấn liệu
- Xây dựng, thử nghiệm các thuật toán, viết chương trình hoàn chỉnh
- Thực nghiệm với đầu vào là các video, webcam
- Kiểm tra, tối ưu chương trình, đánh giá kết quả
1.5 Phân chia công vi c nhóm ệc nhóm
Kế hoạch dự án
Trang 9Tìm thông tin đề tài, đọc paper, tài liệu
Tìm hiểu thư viện, data Xây dựng giải thuật, chọn phần mềm
Xử lý data, xây dựng mô hình học máy
Viết code chương trình, debug
Tối ưu chương trình
Báo cáo
01/03 11/03 21/03 31/03 10/04 20/04 30/04 10/05 20/05 30/05 Ngày bắt đầu Thời gian
Hình 1 Kế hoạch dự án
TEAM CONTRACT
Team name: Hoàng Tuấn + Minh Nhật Date: 01/03/2019
Team Member Roles Signature
Đinh Võ Hoàng Tuấn
Leader, study algorithms and write programs
Nguyễn Đình Minh Nhật
Study algorithms and write programs
Tasks Responsible Member
Team meeting 19 - 20h sáng, mỗi thứ 7, CN
Team rules 1 Mọi người cùng làm việc
2 Tranh cãi và thảo luận tự do
3 Tập trung vào chủ đề, không nói lan man khi họp nhóm
4 Luôn nghĩ ra các biện pháp cải tiến trong quá trình làm sản phẩm
5 Ghi chép lại các ghi chú cần thiết và quan trọng
Trang 10Hình 2 Team contract
2 LÝ THUYẾT
2.1 T ng quan v nh n di n t th ổng quan về nhận diện tư thế ề nhận diện tư thế ận diện tư thế ệc nhóm ư ế
Phân tích tư thế của người là một bài toán phức tạp và đầy thách thức bởi phạm virộng lớn của nó Nhận dạng dáng đi, theo vết chuyển động, mô hình hóa và xác địnhngữ nghĩa của dáng đi là những vấn đề đang nhận được nhiều sự chú ý trong lĩnh vựcthị giác máy tính, cũng như cộng đồng các nhà nghiên cứu về học máy Bên cạnhnhững ứng dụng trong giám sát, tương tác người – máy, đa phương tiện và mô phỏng,việc sử dụng các hệ thống thị giác máy tính còn phục vụ cho mục tiêu chăm sóc y tếtại nhà Các hệ thống này sử dụng camera kết nối với máy tính hoặc bộ xử lý chuyêndụng để quan sát và đánh giá dáng đi của người Hiện nay đã có nhiều nghiên cứu đạtkết quả cao trong việc phân tích dáng người dựa trên nhận diện các điểm đặc trưng cơ
thể (keypoint).
Quá trình phân tích đặc trưng gồm 3 giai đoạn chính: phân đoạn để xác định đốitượng chuyển động, theo vết đối tượng, và trích xuất các đặc trưng biểu diễn thôngtin Bước đầu tiên thường là tách đối tượng cần quan tâm ra khỏi phần còn lại củaảnh, gọi là nền Trong các hệ thống chăm sóc y tế, đối tượng chuyển động là conngười Bước tiếp theo nhận diện các điểm đặc trưng trên đối tượng và theo vết Đểlàm được điều này cần sử dụng các mô hình mạng nơ ron và các kỹ thuật học sâu đểhuấn luyện với bộ dữ liệu về các keypoint Việc theo vết đối tượng có liên quan đếnviệc ước lượng tư thế, vị trí, và chuyển động của các phần trên cơ thể Ước lượng tưthế có thể xem như một bước hậu xử lý của quá trình theo vết, hoặc có thể được tíchhợp trực tiếp Bước thứ ba sử dụng kết quả theo vết và thông tin về quỹ đạo chuyểnđộng của các phần cơ thể để trích xuất các đặc trưng phù hợp
Phương pháp này là cách tiếp cận theo hướng từ trên xuống (top-down) khá hiệuquả trong trường hợp đối tượng chỉ có một người và rõ rang trong khung ảnh, tuynhiên bài toán nhận diện dáng người của nhiều người trong cùng một khung ảnh làmột thách thức không chỉ về độ chính xác mà còn về tốc độ xử lý
Trang 112.2 Deep Learning
Trong những năm qua, thuật ngữ "deep learning" đã dần len lỏi vào cuộc sống mỗi khi có cuộc hội thoại nào bàn về trí tuệ nhân tạo (AI), dữ liệu lớn (Big Data) và phân tích (Analytics) Và với lý do chính đáng – đây là một cách tiếp cận đầy hứa hẹntới AI khi phát triển các hệ thống tự trị, tự học, những thứ đang cách mạng hóa nhiều ngành công nghiệp
Deep learning được Google sử dụng trong các thuật toán nhận dạng giọng nói và hình ảnh, còn Netflix và Amazon thì dùng để xác định xem bạn muốn xem gì hay mua
gì tiếp theo, và các nhà nghiên cứu tại Viện Công nghệ Massachusetts (MIT) dùng để
dự đoán tương lai
Hình 3 So sánh AI, Machine Learning, Deep Learning
Nếu coi machine learning là công nghệ tiên tiến nhất, thì deep learning là "tiên tiến của tiên tiến" Machine learning lấy một vài ý tưởng cốt lõi của trí tuệ nhân tạo vàtập trung vào việc giải quyết các vấn đề thế giới thực với các neural network được thiết kế để bắt chước khả năng đưa ra quyết định của chúng ta Deep learning, đúng như tên gọi của nó, đi sâu hơn nữa vào một tập hợp các công cụ và kỹ thuật machine learning, từ đó áp dụng chúng để giải quyết bất kỳ vấn đề nào đòi hỏi "khả năng tư duy" – con người hay nhân tạo
Cách thức hoạt động :
Trang 12Về cơ bản, deep learning là cho một hệ thống máy tính "thu" rất nhiều dữ liệu, để chúng có thể sử dụng và đưa ra các quyết định về những dữ liệu khác Dữ liệu này được nạp thông qua các neural network, tương tự như machine learning Những mạnglưới này – các cấu trúc logic yêu cầu một loạt các câu hỏi đúng/sai, hoặc trích xuất một giá trị số, của mỗi bit dữ liệu đi qua chúng và phân loại theo các câu trả lời nhận được.
Hình 4 Cách thức hoạt động Deep learning
Vì công việc của deep learning là tập trung phát triển những mạng lưới này, chúng
đã trở thành Deep Neural Network – những mạng logic phức tạp cần thiết để xử lý các bộ dữ liệu lớn, như thư viện hình ảnh của Google hay Instagram
Các hình ảnh là ví dụ tuyệt vời nhất về cách thức hoạt động của deep learning, vì chúng có chứa nhiều yếu tố khác nhau và để hiểu rõ được làm thế nào để máy tính, với não bộ một chiều chủ yếu dựa trên sự tính toán, có thể học cách giải thích chúng giống như con người Tuy vậy, deep learning có thể được áp dụng cho bất kỳ hình thức dữ liệu nào – âm thanh, video, lời nói, chữ viết, – để đưa ra những kết luận nhưthể do con người thực hiện với tốc độ rất nhanh Điều này có thể được biên soạn theo cách thủ công hoặc, trong các điều kiện tiên tiến hơn, được thu thập tự động bởi hệ thống nếu như nó được lập trình để tìm kiếm trên internet và lấy dữ liệu mà nó tìm thấy ở đó
Trang 13Tiếp theo, nó sẽ lấy dữ liệu cần được xử lý – dữ liệu trong thế giới thực có chứa thông tin chi tiết cần nắm bắt Bằng cách so sánh dữ liệu thu được với những dữ liệu
mà nó đã "học được", nó có thể thực hiện những yêu cầu được đề ra một cách chính xác
Hình 5 Ví dụ ứng dụng deep learningĐến đây mới chỉ là phần đơn giản Khi chúng ta đi đến phần "sâu", là khi hệ thốngbắt đầu biết tích lũy kinh nghiệm, nó sẽ có thể tăng khả năng phân loại của mình bằngcách "tự tập luyện" với những dữ liệu mới mà nó nhận được Nói cách khác, nó sẽ có thể học hỏi từ chính những sai lầm của nó – giống như chúng ta, nó sẽ cải thiện độ chính xác trong những lần thực hiện tiếp theo
Vậy deep learning có thể làm được gì?
Để trả lời cho câu hỏi lí do tại sao deep learning lại được coi là bước đột phá lớn đến như vậy ta có thể đưa ra một số ví dụ về các cách thức mà deep learning đang được sử dụng trong thế giới ngày nay Những ứng dụng ấn tượng đang được triển khai
và nghiên cứu có liên quan đến deep learning bao gồm:
- Cung cấp khả năng điều hướng cho xe tự lái: Với hệ thống cảm biến và phần mềm phân tích trên buồng lái, các xe tự lái có thể học cách nhận dạng những chướng ngại vật có trên đường và có giải pháp xử lý thích hợp bằng cách sử dụng deep
learning
Trang 14- Phục chế màu cho ảnh đen trắng: thông qua việc dạy cho máy tính cách nhận biết các vật thể và cách mà mắt người nhìn chúng, các hình ảnh và video đen trắng sẽ
có thể được tái hiện lại với đầy đủ các màu sắc phù hợp
- Dự đoán kết quả của các thủ tục pháp lý: Một nhóm các nhà nghiên cứu người Anh và Mỹ đã có thể dự đoán chính xác kết quả của một phiên tòa, sau khi hệ thống máy tính của họ được nạp sẵn những thông tin cơ bản của vụ án
- Thuốc đặc trị: Các kỹ thuật deep learning hiện đang được dùng để phát triển các loại thuốc đã được chỉnh sửa sao cho phù hợp với bộ gen của bệnh nhân
- Phân tích và báo cáo tự động: Các hệ thống có thể phân tích dữ liệu và báo cáo những thông tin chi tiết của chúng dưới dạng âm thanh tự nhiên hoặc ngôn ngữ của con người
- Chơi trò chơi: Các hệ thống deep learning đã và đang được dạy cách chơi (và giành chiến thắng) các trò chơi như cờ vây, Breakout của Atari hay Starcraft
2.3 M ng N -ron tích ch p (CNN) ạng Nơ-ron tích chập (CNN) ơng pháp nghiên cứu ận diện tư thế
Mạng Convolutional Neural Network (còn gọi tắt là CNN) ra đời từ lâunhưng gần đây mới gây sự chú ý cho giới cộng đồng khoa học cũng như chứngminh được tính hiệu quả mạnh mẽ của nó trong việc áp dụng vào phân loại vànhận dạng nhiều đối tượng trong thực tế So với các phương pháp cổ điển,thay vì phải trải qua một bước là Trích đặc trưng bằng các thuật toán nhưSIFT, SURF, các bộ lọc, HOG, Các giải thuật này có thể gặp khó khăn bịảnh hưởng bởi nhiều điều kiện lẫn nhiễu Sau đó tới bước phân loại có thể bằngSVM, NN, thì CNN tự nó xây dựng nhưng bộ trích đặc trưng thông qua quátrình học từ dữ liệu và phân lớp Do đó, CNN không chỉ giúp cho việc học dữliệu trở nên dễ dàng và chính xác hơn