THÀNH PHỐ HỒ CHÍ MINHBỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT NGÀNH: KHOA HỌC MÁY TÍNH LUẬN VĂN THẠC SĨ NGUYỄN THANH NHÃ MÔ HÌNH PHÂN LOẠI DÁNG ĐI CỦA CON NGƯỜI DỰA
Trang 1THÀNH PHỐ HỒ CHÍ MINH
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT
NGÀNH: KHOA HỌC MÁY TÍNH
LUẬN VĂN THẠC SĨ NGUYỄN THANH NHÃ
MÔ HÌNH PHÂN LOẠI DÁNG ĐI CỦA CON NGƯỜI DỰA TRÊN DỮ LIỆU CẢM BIẾN IMU VÀ
MÔ HÌNH MẠNG NƠ-RON TRUYỀN THẲNG
ĐA LỚP
Tp Hồ Chí Minh, tháng 3/2023
SKC007965
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT
Trang 14i
LÝ LỊCH CÁ NHÂN
I LÝ LỊCH SƠ LƯỢC
Họ & tên: Nguyễn Thanh Nhã Giới tính: Nam
Ngày, tháng, năm sinh: 09/03/1997 Nơi sinh: TP HCM Quê quán: Ấp I, Bàu Cạn, Long Thành, Đồng Nai Dân tộc: Kinh
Địa chỉ liên hệ: 13/2b, đường số 36, Tân Quy, Quận 7, TP HCM
Email: nguyenthanhnha9397@gmail.com
II QUÁ TRÌNH ĐÀO TẠO
1 Đại học:
Hệ đào tạo: Chính quy Thời gian từ: 2015 -2019
Nơi học: Trường Đại Học Sư Phạm Kỹ Thuật Tp.HCM
Ngành học: Công nghệ thông tin
III QUÁ TRÌNH CÔNG TÁC
Trang 15ii
LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của tôi
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác
Tp Hồ Chí Minh, ngày tháng năm 2023
Nguyễn Thanh Nhã
Trang 16iii
LỜI CẢM ƠN
Trải qua thời gian tham gia chương trình đào tạo sau đại học, nhất là trong khoảng 1 năm triển khai luận văn, bên cạnh sự nỗ lực của bản thân, tôi cũng không quên và chân thành cảm ơn gia đình, người thân đã luôn đôn đốc, khích lệ, chia sẻ và
hỗ trợ một ích vật chất luận văn này tôi được hoàn thành
Tiếp đến tôi xin cảm ơn Ban Giám hiệu Trường Đại học Sư phạm Kỹ thuật đã tạo môi trường học tập, Ban Chủ nhiệm cũng như Quý Thầy, Cô của Khoa Công nghệ Thông tin đã truyền cảm hứng và kiến thức hết sức quý báu Đồng thời các Nhà Khoa học, thành viên Hội đồng đã có đóng góp hết sức cởi mở để tôi càng ngày càng hoàn thiện kiến thức bản thân cũng như luận văn này
Đặc biệt xin gửi lời cảm ơn tới Người hướng dẫn khoa học -Tiến sĩ Lê Vĩnh Thịnh và Tiến sĩ Trần Thiện Huân đã luôn sâu sát tận tình hướng dẫn chuyên môn liên quan đến đề tài
Và tôi cũng gởi lời cảm ơn đến đồng nghiệp, đồng môn đã trao đổi, góp ý để tôi hoàn thành luận văn này hơn
Trân trọng!
Trang 17iv
TÓM TẮT
Trong luận văn này, mô hình phân loại 6 dáng đi của con người (dựa trên cơ
sở dữ liệu của gia tốc thu thập từ cảm biến IMU khi con người mang theo trong quá trình thực hiện bước đi) sẽ được kết hợp với mô hình Multi-Layer Perceptron Perceptron Neural Network (MLPNN)
Trong mô hình mạng Neural truyền thẳng nhiều lớp với 108 phần tử nơ-ron ngõ vào, bao gồm 105 mẫu trong một chu kỳ dáng và 3 mẫu đặc trưng của 1 chu kỳ dáng (skewness, entropy, khoảng cách giữa đỉnh cao nhất và đỉnh thấp nhất trong 1 chu kỳ dáng), 6 ngõ ra là các dáng đi cần phân loại
Sáu dáng đi của con người được phân loại bao gồm: bước đi với hai mũi bàn chân (walk on toe), bước đi với hai gót chân (walk on heel), bước lên cầu thang (up stair), đứng lên (sit up), bước đi bình thường (normal walk), bước xuống cầu thang (down stair) Kết quả đề xuất của mô hình cũng được so sánh với hai kỹ thuật data mining khác nhau cho việc phân loại 6 dáng đi này, bao gồm: Máy vectơ hỗ trợ (SVM), Thuật toán k láng giềng gần (k-NN)
Bộ dữ liệu của gia tốc được thu từ cảm biến IMU thực nghiệm trên 7 người khác nhau mang theo khi mỗi người thực hiện 6 dáng đi khác nhau và việc thực hiện đánh giá sơ đồ đề bằng phần mềm Matlab-2018b
Kết quả thu được từ thực nghiệm cho 6 loại dáng đi với độ chính xác của các thuật toán SVM, KNN, ANN-PB lần lượt là: 71.5%, 82.33% và 93.17%
Trang 18v
ABSTRACT
In this master thesis, the six human gait classification models (based on the data of the accelerometer collected from the IMU sensor when people carry it during walking) will be combined with the Multi-Layer Perceptron Perceptron Neural Network (MLPNN) model
In the multilayer feedforward neural network model with 108 inputs, including
105 samples in a shape cycle and three typical samples of the gait cycle (skewness, entropy, distance between highest peak and lowest peak in the gait cycle), six outputs are gaits to be classified
The six human gait categories are: walking on the toe, walking on heel, walking up stairs, sitting up, regular walking, and downstairs The proposed results
of the model are also compared with two different data mining techniques for classifying these 6 gaits, including Support Vector Machine (SVM) and k-Neareast Neighbor (k-NN)
An The accelerometer data set is obtained from the experimental IMU sensor
on seven different people carrying when each person performs six different gaits, and the evaluation of the diagram is done with Matlab-2018b software
The experimental results for six types of gait with the accuracy of SVM, KNN, and ANN-PB algorithms are 71.5%, 82.33%, and 93.17%, respectively
Trang 19vi
MỤC LỤC
Contents
Trang 20vii
Trang 22TAR: True Acceptance Rate
FAR: False Acceptance Rate
Trang 23x
DANH MỤC HÌNH
Hình 3 1 Nhận biết hoạt động của con người dựa trên cảm biến với deep learning
Hình 3 2 Cửa số trượt trên dữ liệu chuỗi thời gian T [11] 9Hình 3 3 Cấu trúc của mạng nơron perceptron nhiều lớp (MLPNN) [10] 9
Hình 3 8 Mạng thần kinh truyền thẳng ba lớp có m tế bào thần kinh ở lớp vào, l tế bào thần kinh ở lớp ẩn và n tế bào thần kinh ở lớp ra 14
Hình 4 5 Mạng thần kinh truyền thẳng một lớp [20] 20Hình 4 6 Mạng neural (nơ-rôn) thần kinh truyền thẳng nhiều lớp [6] 20
Trang 24xi
Hình 4 16 Ví dụ về mạng tuyến tính (a) và Adaline (b) 30
Hình 5 2 Gia tốc chung của một người khi thực hiện 6 dáng đi khác nhau 34
Hình 5 5 Minh họa lựa chọn chu kỳ và cân bằng mẫu trong các chu kỳ dáng 36Hình 5 6 Tốc độ hội tụ trong quá trình huấn luyện 41
Trang 25xii
DANH MỤC BẢNG
Bảng 4 1 So sánh phương pháp học của mạng thần kinh nhân tạo 24
Bảng 4 5 Dữ liệu biên độ âm thanh theo chất lượng viên gạch [19] 29
Bảng 5 2 Giá trị đặc trưng cho 6 dáng đi khác nhau 36Bảng 5 3 Trình bày thuật toán học lan truyền ngược sai số (BP) 37Bảng 5 4 Các kết quả so sánh khi thực hiện huấn luyện 41
Trang 261
CHƯƠNG 1: TỔNG QUAN ĐỀ TÀI
1.1 Tính cấp thiết của đề tài
Dáng đi là một hoạt động thể chất phức tạp, là kết quả của sự phối hợp và đồng
bộ của các bộ phận cơ thể khác nhau với nhau Dáng đi của con người đề cập đến cách thức hoạt động của một cá nhân Kiểu dáng đi của một cá nhân có ảnh hưởng tới nhiều yếu tố như tuổi tác, cân nặng, sức khỏe, giới tính, xã hội và điều kiện địa lý Nhận dạng dáng đi được áp dụng các lĩnh vực khác nhau như sinh trắc học, thiết kế robot sinh học, trong việc nghiên cứu các báo cáo về sự hồi phục của bệnh nhân và cải thiện thành tích của các vận động viên
1.2 Mục tiêu nghiên cứu
Phân loại dáng đi của con người có thể dựa vào nhiều dữ liệu từ nhiều nguồn khác nhau như: trích xuất hình ảnh từ video, cảm biến IMU hoặc thiết bị di động thông minh Trong luận văn này, chúng ta sẽ lấy dữ liệu thu thập từ Samwel và đồng nghiệp của anh ta để tiến hành thu thập, phân tích, tính toán phân loại dáng đi con người bao gồm sáu dáng đi: bước đi với hai mũi bàn chân (walk on toe), bước đi với hai gót chân (walk on heel), bước lên cầu thang (up stair), đứng lên (sit up), bước đi bình thường (normal walk), bước xuống cầu thang (down stair)
1.3 Đối tượng và phạm vi nghiên cứu
Đối tượng: 108 phần tử nơ-ron ngõ vào đã được xử lý mẫu bao gồm 105 mẫu
trong một chu kỳ dáng và 3 mẫu đặc trưng của 1 chu kỳ dáng (skewness, entropy, khoảng cách giữa đỉnh cao nhất và đỉnh thấp nhất trong 1 chu kỳ dáng)
Phạm vi nghiên cứu: Xác định sáu ngõ ra là các dáng cần phân loại trong mô
hình mạng nơ ron truyền thẳng đa lớp, kết quả mô hình cũng được so sánh với hai kỹ thuật data mining khác nhau cho việc phân loại 6 dáng đi này, bao gồm: Support Vector Machine (SVM), k-Nearest Neighbor (k-NN)
1.4 Cách tiếp cận và phương pháp nghiên cứu
Trang 272
Cách tiếp cận: phân tích lý thuyết xây dựng và áp dụng lý thuyết lấy đỉnh,
tách mẫu và cân bằng mẫu để phân loại trong mô hình mạng neural (nơ-rôn) truyền thẳng đa lớp
Phương pháp nghiên cứu: nghiên cứu các lý thuyết liên quan đề tài được
công bố trên các tạp chí, hội nghị khoa học Khảo sát và thống kê Mô hình được áp dụng bới lý thuyết kết hợp với chứng minh bằng thực nghiệm
1.5 Ý nghĩa thực tiễn của đề tài
Nghiên cứu này sẽ đưa ra đề xuất mô hình phân loại dáng đi của con người từ cảm biến dữ liệu IMU và mô hình mang nơ-ron truyền thẳng đa lớp và có thể được ứng dụng trong thực tế
Trang 283
CHƯƠNG 2: TỔNG QUAN LÝ THUYẾT
2.1 Dáng đi con người
Phân loại dáng đi của con người cũng là một lĩnh vực nghiên cứu quan trọng, một số kỹ thuật được thực hiện để nghiên cứu và phân tích kiểu dáng đi cho các hoạt động vận động khác nhau của con người như đi bộ, chạy và leo núi Một chu kỳ dáng
đi gồm có pha đôi và pha đơn Pha đôi được quy ước khi hai chân cùng chạm đất, pha đơn được quy ước khi một chân chạm đất gọi là chân trụ và một chân không cạm đất gọi là chân di chuyển
Năm 2017, Ahmed và đồng nghiệp trong [1] đề phương pháp phân loại giới tính dựa trên dáng đi dựa trên cảm biến kinect
Năm 2018, W Hsu và đồng nghiệp trong [2] đã sử dụng nhiều cảm biến đeo được để phân tích và phân loại dáng đi của những bệnh nhân bị rối loạn thần kinh như đa xơ cứng, bại não và bệnh nhân đột quỵ
Năm 2018, Chen và đồng nghiệp trong [3] đã đề xuất mạng nơ-ron tích chập dựa trên hiệu ứng Doppler của radar đa tĩnh để phân loại dáng đi
Năm 2019, Sabir và đồng nghiệp trong [4] thực hiện phân loại giới tính sử dụng cảm biến gia tốc của điện thoại di động
Năm 2021, Samwel và đồng nghiệp trong [5] thực hiện nhận dạng quỹ đạo của các khớp ở hai chân bằng cách sử dụng cảm biến IMU từ những kiểu đi bộ khác nhau
Trang 294
Hình 2 1 Mô hình mạng Neural Network [6]
Với mỗi node mạng Neural Network là một sigmod nơ rôn nhưng hàm active (kích hoạt) giữa chúng lại khác nhau Ứng với mỗi lớp chúng ta lại phân chia thành nhiều nút mạng khác nhau vào các thuật toán mà chúng ta có hướng cách giải quyết khác nhau
2.2.2 Tổng quan về mạng neural (nơ-rôn)
Kiến trúc mạng nơ rôn đơn giản được liên kết theo 3 lớp như Hình 2.1:
Lớp đầu vào (input layer): dùng để xử lý dữ liệu, phân loại và phân tích qua các nút đầu vào dựa vào thông tin dữ liệu mẫu từ bên ngoài đi vào mạng nơ-ron nhân tạo qua lớp đầu vào sau đó chuyển dữ liệu sang lớp tiếp theo
Lớp ẩn (hidden layer): tại lớp ẩn thì có thể có một hoặc nhiều lớp ẩn và được nhận dữ liệu từ lớp đầu vào và dựa trên đó mạng nơ-rôn có thể có một lượng lớn lớp ấn với dữ liệu đã được xử lý ở lớp đầu vào thì được
xử lý dữ liệu nâng cao và chuyên sâu hơn rồi chuyển tiếp dữ liệu sang lớp tiếp theo
Đầu ra (output layer): lớp đầu ra cho ra kết quả cuối cùng của tất cả dữ liệu được xử lý bởi mạng nơ-ron nhân tạo Lớp này có thể có một hoặc nhiều nút
Kiến trúc mạng nơ rôn chuyên sâu là tập hợp hàng triệu nơ-ron nhân tạo với nhiều lớp ẩn tạo liên kết với nhau như Hình 1.2 Trong đó trọng số được đại diện cho các kết nối giữa hai nút Nếu một nút được kích thích cho các nút còn lại thì sẽ mang
Trang 30Mạng nơ-ron được chia làm 3 loại:
Mạng nơ rôn truyền thẳng: mạng nơ-ron truyền thẳng xử lý dữ liệu theo một chiều, từ nút đầu vào đến nút đầu ra Mỗi nút trong một lớp được kết nối với tất cả các nút trong lớp tiếp theo Mạng truyền thẳng sử dụng một quy trình phản hồi để cải thiện dự đoán theo thời gian
Thuật toán lan truyền ngược được hoạt động như sau: mỗi nút đưa ra một dự đoán về nút tiếp theo trên lối đi, sau đó nút này sẽ kiểm tra tính chính xác của dự đoán Các nút sẽ chỉ định giá trị trọng số cao hơn cho những lối đi tới nhiều dự đoán chính xác hơn và giá trị trọng số thấp hơn cho các lối đi tới dự đoán không chính xác, cuối cùng đối với điểm
dữ liệu tiếp theo, các nút đưa ra dự đoán mới bằng cách sử dụng các lối
đi có trọng số cao hơn rồi lặp lại dự đoán về nút tiếp theo trên lối đi
2.2.4 Ứng dụng
Mạng nơ rôn được ứng dụng trong nhiều lĩnh vực như:
Ứng dụng phân loại các hình ảnh trong y khoa tế từ việc chẩn đoán y
tế
Bằng cách xử lý dữ liệu lịch sử của các công cụ tài chính từ việc dự đoán tài chính
Trang 316
Chuẩn đoán nhu cầu năng lượng và dự báo phụ tải điện
Quản lý chất lượng và quy trình
Phát hiện và nhận dạng hóa học hợp chất
Ngoài ứng dụng trong trong khoa học, nghiên cứu:
Thị giác máy tính là dữ liệu từ hình ảnh và video thu được từ việc trích xuất của máy tính từ đó có thể nhận diện hình ảnh như con người: hệ thống nhận diện hình ảnh trên ô tô tự lái, kiểm duyệt nội dung không
an toàn hoặc không phù hợp khỏi kho lưu trữ hình ảnh và video…
Nhận dạng giọng nói như từ việc nhận dạng và phân tích của giọng nói của con người như ngôn ngữ, âm ngữ phát ra giữa các vùng miền, độ cao giọng, độ tông khác nhau: hỗ trợ các nhân viên trực tổng đài và tự động phân loại cuộc gọi, dịch thuật cuộc trò chuyện thành văn bảng trong thời giam thực, tạo phụ đề chính xác cho video và bản ghi âm cuộc họp
2.3 Deep learning
Mạng deep learning tự rút ra các đặc điểm và học hỏi một cách độc lập hơn
Nó có thể phân tích các tập dữ liệu phi cấu trúc như tài liệu văn bản, xác định những thuộc tính dữ liệu cần ưu tiên và giải quyết các vấn đề phức tạp hơn
Ứng dụng của deep learning được sử dụng trong nhiều lịnh vực như:
Ứng dụng trong chế tạo robot
Ứng dụng trong nông nghiệp trong các hoạt động như: thu hoạch, tưới tiêu, bón phân, gieo trồng …
Ứng dụng trong điện tử: các phần mềm như facebook, messenger…
2.4 Tổng quan về mô hình phân loại dáng người dựa trên dữ liệu cảm biến IMU
và mô hình mạng neural (nơ-ron) truyển thẳng đa lớp
Việc phân loại dáng đi của con người sẽ lấy dữ liệu thu thập từ Samwel và đồng nghiệp của anh ta để tiến hành thu thập, phân tích, tính toán phân loại dáng đi con người bao gồm 6 dáng đi: bước đi với hai mũi bàn chân (walk on toe), bước đi
Trang 327
với hai gót chân (walk on heel), bước lên cầu thang (up stair), đứng lên (sit up), bước
đi bình thường (normal walk), bước xuống cầu thang (down stair)
Từ những dữ liệu mẫu mà đã thu thập từ cảm biến IMU, chúng ta sẽ tiến hành lấy đỉnh, tách mẫu và cân bằng mẫu với 108 phần tử nơ-ron ngõ vào bao gồm 105 mẫu trong một chu kỳ dáng và 3 đặc trưng của 1 chu kỳ dáng là skewness, entropy (EN), khoảng cách giữa đỉnh cao nhất và đỉnh thấp nhất trong 1 chu kỳ dáng (LE), 6 ngõ ra là các dáng cần phân loại trong mô hình mạng neural truyền thẳng đa lớp
2.5 Kết quả thu được
Kết quả mô hình cũng được so sánh với hai kỹ thuật data mining khác nhau cho việc phân loại 6 dáng đi này, bao gồm: Máy vector hỗ trợ (SVM), thuật toán k-
NN
Một tập dữ liệu thực nghiệm của gia tốc thu được từ cảm biến IMU mà 7 người khác nhau mang theo khi mỗi người thực hiện 6 dáng đi khác nhau [8] và gói phần mềm Matlab-2018b được dùng để thực hiện đánh giá sơ đồ
Trang 338
CON NGƯỜI
3.1 Khái niệm về mô hình phân lớp dáng đi con người
3.1.1 Nhân biết hoạt động của con người (HAR)
Nhận biết hoạt động của con người (HAR) là áp dụng trong các lĩnh vực phục
vụ cho sức khỏe của con người như theo dõi tình trạng sức khỏe từ hoạt động dáng
đi, nó cũng áp dụng nhiều trong lĩnh vực Internet of Things như trợ giúp cảm biến sensors, điện thoại thông minh, hình ảnh [9]
Hình 3 1 Nhận biết hoạt động của con người dựa trên cảm biến với deep
learning theo không gian và thời gian [10]
3.1.2 Cửa sổ trượt (Sliding Window)
Cho một chuỗi thời gian T có chiều dài n, để xác định chuỗi con có chiều dài
m (m < n), ta dùng cửa số trượt có kích thước n di chuyển qua từng điểm từ trái sang phải trên chuỗi thời gian T đề xác định mỗi chuỗi con [11]
Trang 349
Hình 3 2 Quan hệ giữa cửa sổ trượt và thời gian T [11]
3.1.3 Mạng nơ-rôn truyền thẳng đa lớp (MLPNN)
MLPNN là một lớp mạng nơ-ron nhân tạo truyền thẳng (ANN) để chỉ các mạng bao gồm nhiều lớp perceptron (với kích hoạt ngưỡng) Các perceptron nhiều lớp đôi khi được gọi một cách thông tục là mạng nơ-ron “ vanilla”, đặc biệt khi chúng
có một lớp ẩn duy nhất
Một MLP cơ bản ít nhất 3 lớp: lớp đầu vào, lớp ẩn và lớp đầu ra Ngoại trừ các nút đầu vào, mỗi nút là một nơ-ron sử dụng chức năng kích hoạt phi tuyến MLP sử dụng một kỹ thuật học tập có giám sát được gọi là backpropagation để đào tạo
Hình 3 3 Một loại cấu trúc của mạng neural (nơ-rôn) perceptron đa lớp
(MLPNN) [10]
3.1.4 Máy vector hỗ trợ
Máy vector hỗ trợ (SVM) là thuật toán giám sát và là một trong những thuật toán được sử dụng phổ biến nhất trong Machine Learning Ý tưởng của thuật toán SVM là xây dựng một bộ phân lớp nhằm tối đa khoảng cách tối thiểu từ mỗi lớp tới siêu phẳng phân chia Thuật toán có một số ưu điểm xử lý trên không gian số chiều cao, tiết kiệm bộ nhớ và có tính linh hoạt - phân lớp thường là phi tuyến tính [12]
Trang 35Có một vài khái niệm tương ứng người-máy như sau:
Ngôn ngữ con người Ngôn ngữ Học Máy Machine Learning
Tập tài liệu mang vào phòng
thi
Tập dữ liệu tập huấn Training set
Câu hỏi có đáp án sai Nhiễu Noise, Outlier
Câu hỏi trong đề thi Dữ liệu kiểm thử Test data point
Câu hỏi gần giống Điểm dữ liệu gần nhất Nearest Neighbor
Ví dụ dưới đây là bài toán Classification với 3 classes: Đỏ, Lam, Lục Mỗi điểm dữ liệu mới (test data point) sẽ được gán label theo màu của điểm mà nó thuộc
về Trong hình này, có một vài vùng nhỏ xem lẫn vào các vùng lớn hơn khác màu
Ví dụ có một điểm màu Lục ở gần góc 11 giờ nằm giữa hai vùng lớn với nhiều dữ liệu màu Đỏ và Lam và có thể nhiễu Dẫn đến nếu dữ liệu test rơi vào vùng này sẽ có nhiều khả năng cho kết quả không chính xác [13]
Trang 3611
Hình 3 5 Bản đồ của KNN [14]
3.1.6 Thuật toán cân bằng chuỗi thời gian (DTW)
Dynamic time warping là một thuật toán căn chỉnh time series phát triển và ứng dụng nhiều trong việc nhận dạng giọng nói Mục đích căn chỉnh hai chuỗi vec-
tơ bằng cách làm cong trục thời gian lạp lại liên tục đến khi tìm thấy dữ liệu phù hợp tối ưu giữa hai chuỗi
Ví dụ ta có hai chuỗi vec-tơ đặc trưng tương ứng A và B như dưới đây:
𝐴 = 𝑎1, 𝑎2, 𝑎3, … , 𝑎𝑖, … , 𝑎𝑛
𝐵 = 𝑏1, 𝑏2, 𝑏3, … , 𝑏𝑖, … , 𝑏𝑛Hai chuỗi được sắp xếp trên các mặt của lưới, với chuỗi A ở trên cùng và chuỗi
B ở phía bên trái Cả hai chuỗi đều bắt đầu ở phía dưới bên trái của lưới Hình 3.6:
Trang 3712
Hình 3 6 Dynamic time warping [15]
Các tối ưu hoặc hạn chế chính của thuật toán DTW phát sinh từ các quan sát
về bản chất của các đường dẫn có thể chấp nhận được qua những điều kiện sau:
Điều kiện đơn điệu: đường đi sẽ không tự quay lại, cả chỉ số I và j trong Hình 3.6 đều được giữ nguyên hoặc tăng lên, chúng không bao giờ giảm
Điều kiện liên tục: con đường tiến tới từng bước một Cả i và j chỉ có thể tăng nhiều nhất là một trên mỗi bước dọc theo con đường đi
Điều kiện biên: đường dẫn bắt đầu lần lượt dưới cùng và ở trên cùng là bên trái và bên phải
Tình trạng cửa sổ cong vênh: một con đường tốt không có khả năng đi quá xa đường chéo Khoảng cách mà đường dẫn được phép đi ang thang là chiều rộng cửa
sổ được đưa ra trước đó
Điều kiện hạn chế về độ dốc: đường đi không được quá dốc hoặc quá nông Điều này ngăn các chuỗi ngắn khớp với chuỗi quá dài Điều kện được biểu thị dưới dạng thập phân a/b, trong đó a là số bước cho phép theo cùng một hướng (ngang hoặc dọc) Sau p bước theo cùng hướng không được bước tiếp thep cùng hướng trước khi bước ít nhất b lần theo hướng chéo
Trang 3813
Sức mạnh của thuật toán DTW nằm ở chỗ, thay vì tìm kiếm tất cả các tuyến đường có thể đi qua lưới để thỏa mãn các điều kiện trên, thuật toán DTW hoạt động bằng cách theo dõi chi phí của đường đi tốt nhất đến từng điểm trong lưới và khoảng cách tổng thể tối thiểu, nhưng điều này có thể được truy ngược lị khi đến điểm cuối
3.2 Mô hình phân loại dáng đi con người
Mô hình có 3 giai đoạn: xử lý dữ liệu, rút trích đặc trưng và phân loại bằng mô hình mạng nơ-rôn Hệ thống này được mô tả bởi sơ đồ như trong Hình 3.7
Hình 3 7 Sơ đồ cho mô hình đề xuất
Về phần nghiên cứu này, chúng ta dùng tập dữ liệu thực nghiệm của gia tốc chuyển động theo ba hướng x, y, z có được bằng cách sử dụng cảm biến IMU, được chia sẽ trên mạng của Samwel [8] Ta chỉ chọn tập dữ liệu thực nghiệm của gia tốc chuyển động từ 7 người, và mỗi người thực hiện 6 dáng đi khác nhau Độ lớn của các gia tốc chuyển này được tính toán lại và cung cấp cho mô hình đề xuất
3.2.1 Giai đoạn 1: xử lý dữ liệu
Chu kỳ dáng được xác định bằng cách tính hai bước bất kỳ Các bước được tính bằng cách xử dụng thuật toán xác định đỉnh cao nhất và thấp nhất Do đó, số mẫu trong một chu kỳ dáng sẽ khác nhau Vì vậy, chu kỳ dáng cần phải thực hiện cân bằng Để vượt qua vấn đề này, thuật toán DTW (Dynamic Time Warping) được áp dụng DTW sẽ thực hiện thêm mẫu hoặc giảm mẫu trong các chu kỳ dáng khác nhau,
để tất cả chu kỳ dáng của 7 người sẽ có cùng số mẫu
3.2.2 Giai đoạn 2: thực hiện rút trích đặc trưng cho chu kỳ
Trang 3914
Thực hiện rút trích đặc trưng cho chu kỳ dáng bao gồm: skewness, entropy, khoảng cách giữa đỉnh cao nhất và đỉnh thấp nhất trong 1 chu kỳ dáng cho tất cả các mẫu trong một chu kỳ dáng Đặt 𝐵 = {𝑠1, 𝑠2, 𝑠3, … , 𝑠𝑖… , 𝑠𝑁} là tập hợp các mẫu trong một chu kỳ dáng Công thức tính skewness được tính như công thức 3.2.1, trong
đó s_i là giá trị của mẫu thứ i và giá trị trung bình của S, là độ lệch chuẩn của S, N
là số mẫu trong một chu kỳ dáng
𝑆𝑘𝑒𝑤𝑛𝑒𝑠𝑠 =∑ (𝑠𝑖−𝜇)
𝑁 𝑖=1
(𝑛−1)𝜎 3 (3.2.1) Đặc trưng Entropy của chu kỳ dáng sử dụng công thức (3.2.2)
3.2.3 Giai đoạn 3: phân loại dáng đi
Mạng nơ-rôn đa lớp được huấn luyện bởi thuật toán lan truyền ngược (MLPNN-BP), dùng để phân loại sáu dáng đi dựa vào 108 phần tử nơ-ron đặc trưng trong 1 chu kỳ dáng đi
3.3 Mô hình lan truyền ngược sai số
Hình 3 8 Mô hình mạng thần kinh truyền thẳng với ba lớp có số tế bào thần kinh ở lớp vào, lớp ẩn và lớp ra lần lượt là: m,l,n
Trang 4015
Mô hình lan truyền ngược sai số (backward propagation of errors) dùng để huấn luyện mạng neural (nơ-rôn) nhân tạo kết hợp với phương pháp tính toán gradient của hàm tổn thất, từ đó để tối ưu hóa, sử dụng nó để cập nhật các trọng số để cực tiểu hóa của hàm tổn thất Thuật toán lan truyền ngược sai số được chia thành hai giai đoạn: lan truyền và cập nhật trọng số