MẪU ĐỒ ÁN (HOẶC LUẬN VĂN ) TỐT NGHIỆP BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NGUYỄN TẤT THÀNH KHOA CÔNG NGHỆ THÔNG TIN ĐỒ ÁN CƠ SỞCHUYÊN NGÀNH TÌM HIỂU DEEP LEARNING GIẢI QUYẾT BÀI TOÁN ĐIỂM DANH Giản. CHƯƠNG I: TÌM HIỂU SÂU VỀ DEEP LEARNING Deep Learning là một trong những công nghệ được sử dụng phổ biến nhất hiện nay trong nhiều lĩnh vực. Nó đẩy nhanh sự tiến bộ trong đa dạng các lĩnh vực dịch tự động, nhận diện giọng nói,… 1: Deep learning là gì? Công nghệ Deep Learning là một phần nhỏ của Machine learning. Deep learning thường tập trung xử lý các vấn đề liên quan đến mạng thần kinh nhân tạo. Qua đó, nhằm nâng cấp các công nghệ như nhận diện giọng nói, tầm nhìn máy tính hay xử lý ngôn ngữ tự nhiên. Học sâu (deep learning): Một kỹ thuật nhỏ của tính năng Machine Learning. Cho phép máy tự đào tạo chính mình.
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NGUYỄN TẤT THÀNH
KHOA CÔNG NGHỆ THÔNG TIN
ĐỒ ÁN CƠ SỞ/CHUYÊN NGÀNH
TÌM HIỂU DEEP LEARNING GIẢI QUYẾT BÀI
TOÁN ĐIỂM DANH
Giảng viên hướng dẫn: VƯƠNG XUÂN CHÍ
Sinh viên thực hiện: LƯƠNG THỊ YẾN NHI
Trang 2
Trường Đại học Nguyễn Tất Thành
Khoa Công Nghệ Thông Tin
(Sinh viên phải đóng tờ này vào báo cáo)
Họ và tên: LƯƠNG THỊ YẾN NHI MSSV: 2000001149
Chuyên ngành: KHOA HỌC DỮ LIỆU Lớp: 20DTH2A
Email: luongnhi995010@gmail.com SĐT: 0364995010
Tên đề tài: TÌM HIỂU DEEP LEARNING GIẢI QUYẾT BÀI TOÁN ĐIỂM DANH
Gíao viên hướng dẫn: VƯƠNG XUÂN CHÍ
Thời gian thực hiện: 20/06/2022 đến 20/09/2022
MÔ TẢ ĐỀ TÀI:
Deep Learning là một nhánh của Machine Learning sử dụng mạng lưới thần kinh với nhiều lớp Một mạng lưới thần kinh sâu phân tích dữ liệu với các biểu diễn đã học tương tự như cách một người nhìn vào một vấn đề
NỘI DUNG VÀ PHƯƠNG PHÁP:
- Tìm hiểu học sâu (Deep Learning)
- Các phương pháp tiếp cận vấn đề trong học máy
- Kiến trúc mô hình FaceNet, huấn luyện dữ liệu, nhận diện khuôn mặt
- Kết luận
YÊU CẦU:
- Có kiến thúc, đam mê, hiểu biết về công nghệ mới như Mạng neural, Machine Learning Deep Learning… Đọc hiểu tài liệu tiếng Anh, kỹ năng trình bày văn bản trên máy tính tốt
- Có tác phong làm việc chăm chỉ, tinh thần trách nhiệm cao, có khả năng làm việc độc lập hoặc làm việc trong nhóm tốt
Nội dung và yêu cầu đã được thông qua Bộ môn.
Trang 3LỜI CẢM ƠN
Lời đầu tiên, em xin gửi lời cảm ơn chân thành đến giảng viên Vương Xuân Chí - thầy phụ tráchhướng dẫn bộ môn “đồ án cơ sở” đã giúp đỡ em rất nhiều trong quá trình lựa chọn cũng như là giải đáp các vấn đề đồ án để em có thể hoàn thành một cách hoàn thiện nhất
Tuy trong quá trình thực hiện đồ án còn có một vài khó khăn nhưng mai mắn là có bạn cùng nhóm san sẻ khối lượng công việc nên một phần nào đó cũng được giải quyết
Cảm ơn thầy đã tạo điều kiện tốt nhất cho em thực hiện đồ án, em mong nhận được sự quan tâm
và những ý kiến của thầy để em có thể rút ra được những kinh nghiệm tốt hơn cho những đồ án sau nữa
Trân trọng cảm ơn!
Trang 4LỜI MỞ ĐẦU
Hiện nay deep learning được áp dụng rộng rãi trong đời sống con người đặt biệt là trong môi trường học tập Kể từ sau khi thành công của AlexNet trong cuộc thi ImageNet năm
2012, Machine Learning (ML) đã trở thành một chủ đề hấp dẫn dối với sinh viên và các
kỹ sư công nghệ Các tập đoàn lớn đổ dồn tài nguyên vào phát triển các trung tâm nghiêncứu và các hệ thống tính toán để giải quyết các bài toán kinh doanh cũng như thu hút nhân tài
Những năm gần đây, AI - Artificial Intelligence (Trí Tuệ Nhân Tạo), và cụ thể hơn là Machine Learning nổi lên như một bằng chứng của cuộc cách mạng công nghiệp lần thứ
tư (1 - động cơ hơi nước, 2 - năng lượng điện, 3 - công nghệ thông tin) Trí Tuệ Nhân Tạo đang len lỏi vào mọi lĩnh vực trong đời sống mà có thể chúng ta không nhận ra Xe
tự hành của Google và Tesla, hệ thống tự tag khuôn mặt trong ảnh của Facebook, trợ lý
ảo Siri của Apple, hệ thống gợi ý sản phẩm của Amazon, hệ thống gợi ý phim của
Netflix, máy chơi cờ vây AlphaGo của Google DeepMind, chỉ là một vài trong vô vàn những ứng dụng của AI/Machine Learning Machine Learning là một tập con của AI Theo định nghĩa của Wikipedia:
Machine learning is the subfield of computer science that "gives computers the ability tolearn without being explicitly programmed" Nói đơn giản, Machine Learning là một lĩnh vực nhỏ của Khoa Học Máy Tính, nó có khả năng tự học hỏi dựa trên dữ liệu đưa vào mà không cần phải được lập trình cụ thể Những năm gần đây, khi mà khả năng tính toán của các máy tính được nâng lên một tầm cao mới và lượng dữ liệu khổng lồ được thu thập bởi các hãng công nghệ lớn, Machine Learning đã tiến thêm một bước tiến dài
và một lĩnh vực mới được ra đời gọi là Deep Learning (Học Sâu) Deep Learning đã giúpmáy tính thực thi những việc tưởng chừng như không thể vào 10 năm trước: phân loại cảngàn vật thể khác nhau trong các bức ảnh, tự tạo chú thích cho ảnh, bắt chước giọng nói
và chữ viết của con người, giao tiếp với con người, hay thậm chí cả sáng tác văn hay âm nhạc Mối quan hệ giữa Artificial Intelligence, Machine Learning, và Deep Learning đ Xuất phát từ yêu cầu thực tế, đang rất cần có nhưng nghiên cứu về vấn đề này Chính vì
Trang 5vậy chúng tôi đã chọn đề tài “Nghiên cứu mô hình học sâu (deep-learning)” làm chuyên
đề với mong muốn phần nào áp dụng vào bài toán thực tế
Một trong những ứng dụng phổ biến nhất của deep learning là vấn đề giải quyết bài toán điểm danh mà trong đó nổi bật nhất là điểm danh bằng nhận diện khuôn mặt
Dưới đây là một số hiểu biết về deep learning giải quyết bài toán điểm danh cụ thể là điểm danh nhận diện khuôn mặt
Trang 6NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN
Điểm đồ án:
TPHCM, Ngày …… tháng …… năm
Giáo viên hướng dẫn
(Ký tên, đóng dấu)
TRƯỜNG ĐẠI HỌC NGUYỄN TẤT KỲ THI KẾT THÚC HỌC PHẦN
Trang 7THÀNH HỌC KỲ III NĂM HỌC 2021-2022 TRUNG TÂM KHẢO THÍ
PHIẾU CHẤM THI TIỂU LUẬN/ĐỒ ÁN
Môn thi: ĐỒ ÁN CƠ SỞ
Lớp học phần: 20DTH1D
Nhóm sinh viên thực hiện:
1 Lương Thị Yến Nhi Tham gia đóng góp: Tìm kiếm thông
tin, soạn word
2 Ngô Dương Thuý Vy Tham gia đóng góp: Tìm kiếm thông
tin, soạn word Ngày thi: 22/9/2022 Phòng thi: L.507
Đề tài tiêủ luận/báo cáo của sinh viên:
Phần đánh giá của giảng viên (căn cứ trên trang rubrics của môn học):
Trang 8MỤC LỤC
Trang TRANG BÌA… ………I NHIỆM VỤ ĐỒ ÁN……… II LỜI CẢM ƠN………III LỜI MỞ ĐẦU………IV NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN……….V PHIẾU CHẤM THI TIỂU LUẬN………VII MỤC LỤC………VIII DANH MỤC CÁC BẢNG HÌNH………V DANH MỤC CÁC CHỮ VIẾT TẮT……….VII
Chương I:Tìm hiểu sâu về deep learning……… 1
1.Deep learning là gì? ……… 1
2.Các trường hợp sử dụng deeplearing……….1
3.Kỹ thuật của deep learning……….2
Vectorization………2
Mini-batch gradient descent………3
Bias và variance……… 5
Dropout……… 7
Activation………8
Chương II:Các phương pháp tiếp cận vấn đề trong học máy……… 11
1.Học máy là gì? ………11
2.Máy học có các loại thuật toán nào? ………12
3.Công nghệ máy học được sử dụng trong lĩnh vực gì? 16
4.Cách tiếp cận vấn đề trong máy học……… 21
Các vấn đề của máy học………21
Phương pháp tiếp cận vấn đề học máy……….….23
Chương III:Kiến trúc mô hình facenet, huấn luyện dữ liệu, nhận diện khuôn mặt……24
1.Kiến trúc mô hình facenet……….24
Mô hình facenet là gì? ……… 24
Khái quát thuật toán……… 24
Triple loss……… 25
Lựa chọn triple images input……….27
2.Huấn luyện dữ liệu………29
Huấn luyện dữ liệu……….29
Trang 9Huấn luyện dữ liệu……….29
3.Nhận diện khuôn măt……….36
Nhận diện khuôn mặt là gì? ……… 36
Các ứng dụng phổ biến……… 37
Các loại hệ thống xác thực……….…38
Các phương pháp xác thực khuôn mặt……… 38
Các thuật toán nhận diện khuôn mặt……… 40
Chương IV:Kết luận……….46
Tài liệu tham khảo………47
Trang 10DANH MỤC CÁC BẢNG HÌNH
Trang CHƯƠNG I: TÌM HIỂU SÂU VỀ DEEP LEARNING
Hình 1.Mô tả deep learning ………1
Hình 2.Mô tả kỹ thuật vectorization………2
Hình 3.Biểu đồ batch gradienet descent……… 3
Hình 4.Biểu đồ mini-batch gradient descent……… 4
Hình 5.Biểu đồ Stochastic gradient descent………4
Hình 6.Bias and variane……… 6
Hình 7.Thông số đánh giá bias và variance………6
Hình 8.Mô hình dropout……… 7
Hình 9.Mô hình neural network 2-3-3-1……….8
Hình 10.Quá trình backpropagation………9
Hình 11.Thuật toán đạo hàm……… 9
Hình 12.Đồ thị Sigmoid activation function……….10
Hình 13.Đồ thị Tanh activation function……… 10
Hình 14 Đồ thị ReLU activation function………11
Hình 15.Leaky ReLU………11
CHƯƠNG II: CÁC PHƯƠNG PHÁP TIẾP CẬN VẤN ĐỀ TRONG HỌC MÁY Hình 1.Sơ đồ máy học……… 12
Hình 2.Thuật toán máy học giám sát………13
Hình 3.Thuật toán máy học không giám sát……….14
Hình 4.Thuật toán máy học nửa giám sát……….15
Hình 5.Thuật toán máy học tăng cường………16
Hình 6.Công nghệ máy học sản xuất………17
Hình 7.Công nghệ máy học chăm sóc sức khoẻ và khoa học đời sống………18
Hình 8.Công nghệ máy học dịch vụ tài chính……… 19
Hình 9.Công nghệ máy học bán lẻ………20
Trang 11Hình 10.Công nghệ máy học truyền thông và giải trí………21
CHƯƠNG III: KIẾN TRÚC MÔ HÌNH FACENET, HUẤN LUYỆN DỮ LIỆU, NHẬN DIỆN KHUÔN MẶT Hình 1.Ví dụ về triple loss……….26
Hình 2.Nhận diện khuôn mặt……….29
Hình 3.Mô hình khối huấn luyện dữ liệu………30
Hình 4.Biểu đồ training set and test set……… 34
Hình 5.Biểu đồ sai số dự đoán validation……… 36
Hình 6.Mô tả nhận diện khuôn mặt bằng phương pháp truyền thống………39
Hình 7.Mô tả nhận diện khuôn mặt 3D……… 40
Hình 8.Thuật toán nhận diện khuôn mặt Learning similarity………42
Hình 9.Thuật toán nhận diện khuôn mặt siam network……….44
Trang 12DANH MỤC CÁC TỪ VIẾT TẮT
STT Chữ viết tắt Viết đầy đủ
Trang 13CHƯƠNG I: TÌM HIỂU SÂU VỀ DEEP LEARNING
Deep Learning là một trong những công nghệ được sử dụng phổ biến nhất hiện nay trong nhiều lĩnh vực Nó đẩy nhanh sự tiến bộ trong đa dạng các lĩnh vực dịch tự động, nhận diện giọng nói,…
1: Deep learning là gì?
Công nghệ Deep Learning là một phần nhỏ của Machine learning Deep learning thường tập trung xử lý các vấn đề liên quan đến mạng thần kinh nhân tạo Qua đó, nhằm nâng cấp các công nghệ như nhận diện giọng nói, tầm nhìn máy tính hay xử lý ngôn ngữ
tự nhiên
Học sâu (deep learning): Một kỹ thuật nhỏ của tính năng Machine Learning Cho phép máy tự đào tạo chính mình
Hình 1.Mô tả deep learning
2: Các trường hợp sử dụng Deep Learning:
Trang 14- Sử dụng khi dữ liệu của bạn phần lớn không có cấu trúc và có rất nhiều dữ liệu.
- Các thuật toán của deep learning có thể lấy dữ liệu lộn xộn hay không có nhãn
rộng rãi: video, hình ảnh, âm thanh, bản ghi, văn bản và sắp xếp đủ thứ tự cho dữ liệu đó để đưa ra dự đoán hữu ích, thiết lập hệ thống phân cấp các tính năng Từ
đó, tạo nên kết quả một hình ảnh hoặc âm thanh tạo thành một từ thông qua lời nói
3: Kỹ thuật của Deep Learning:
Một số kỹ thuật cơ bản của deep learning:
a) Vectorization:
- Việc biểu diễn bài toán dưới dạng vectorization nó không chỉ giúp code gọn lại mà
còn tăng tốc độ tính toán một cáchs đáng kể khi thực hiện các phép tính trên vector, ma trận so với for-loop
Hình 2 Mô tả kỹ thuật vectorization
- Nếu dùng for-loop mất hơn 4s để nhân 2 vector trong khi thư viện numpy để tính
chỉ mất 0.01s, tại sao?
+ Giả sử có 10 tấn hàng vận chuyển từ quận 12 đến quận 7 và bạn có một
xe tải với vận tải chỉ được 5 tấn mỗi tần Nếu chúng ta chất đầy hàng trong mỗi
Trang 15lần chở thì chỉ cần 2 lần là đã chuyển được hết số hàng Nhưng nếu chúng ta chất
1 tấn trong mỗi lần chở thì phải mất tận 10 lần để có thể vận chuyển được hết số hàng
+ Như vậy, khi nhân 2 vector ở trên chúng ta cần thực hiện 10000000 phéptính nhân 2 số Giả sử máy tính có thể tính tối đa 1000 phép tính nhân 1 lúc Chúng ta dùng for-loop giống như mỗi thời điểm chúng ta yêu cầu máy tính thực hiện một phép nhân, nên muốn nhân 2 vector ta cần 10000000 đơn vị thời gian Tuy nhiên thư viện numpy sẽ tối ưu việc tính toán bằng cách yêu cầu máy tính thực hiện 1000 phép nhân cùng lúc, tức là chỉ cần 10000000/1000 = 10000 đơn vị thời gian để hoàn thành phép nhân 2 vector Vậy nên, việc vectorization thông thường sẽ tính toán nhanh hơn
b) Mini-batch gradient descent:
- Các loại thuật toán trong mini-bacth gradient:
+ Batch gradient descent: Dùng tất cả dữ liệu trong training set cho mỗi lần thực hiện bước tính đạo hàm
Hình 3.Biểu đồ batch gradient descent
+ Mini-batch gradient descent: Dùng một phần dữ liệu trong training set cho mỗi lần thực hiện bước tính đạo hàm
Trang 16Hình 4 Biểu đồ mini-batch gradient descent
Trang 17+ Stochastic gradient descent: Chỉ dùng một dữ liệu trong training set cho mỗi lần thực hiện bước tính đạo hàm.
Hình 5 Biểu đồ Stochastic gradient descent
- Batch gradient descent thường được dùng khi số lượng dữ liệu trong training set
nhỏ hơn 2000 Với lượng dữ liệu lớn thì mini-batch gradient descent được sử dụng Nó có thể giải quyết được vấn đề lượng dữ liệu quá lớn như trong batch gradient descent, hơn nữa đỡ nhiễu và có thể dùng vectorization s với stochastic gradient descent nên thường được sử dụng trong deep learning
- Các thông số trong mini-batch gradient descent:
+ batch_size: Là size trong mini-batch gradient, nghĩa là dùng bao mhieeu dữ liệu cho mỗi lần tính và cập nhật hệ số
Trang 18+ Steps_per_epoch: Là bao nhiêu lần thực hiện bước 2 trong gradient descent trong mỗi epoch Mặc định sẽ là số lượng dữ liệu chia cho bath_size Đơn giản là mỗi epoch sẽ dùng hết các dữ liệu để tính gradient descent.
+ epochs: Số lượng epoch thực hiện trong quá trình training
c) Bias và variance:
- Bias là gì?
Bias là độ lệch, biểu thị sự chênh lệch giữa giá trị trung bình mà mô hình dự đoán
và giá trị thực tế của dữ liệu
- Variance là gì?
Variance là phương sai, biểu thị độ phân tán của các giá trị mà mô hình dự đoán sovới giá trị thực tế
- Giá trị thật dữ liệu ở giữa trung tâm các đường tròn Các dấu x là giá trị dự đoán
Nếu high bias là giá trị dự đoán rất xa tâm Tuy nhiên nếu high variance thì các giátrị dự đoán phân tán rộng dãn đến việc ra giá trị thực tế => Ta mong muốn low và low variance
Hình 6 Bias and variance
- Đánh giá bias và variance:
Trang 19+ Có 2 thông số thường được sử dụng để đánh giá bias và variance cuar mô hình làtraining set error và validation set error.
Hình 7 Thông số đánh giá bias và variance
+ Ta muốn giải quyết model là low bias và low variance Một số cách giải quyết vấn đề high bias và high variance:
Giải quyết high bias ( underfitting ): Ta cần tóc độ phức tạp của model:
Tăng số lượng hidden layer và số node trong mỗi hidden layer
Dùng nhiều epochs hơn để train model
Giải quyết high variance ( overfitting ):
Thu thập thêm dữ liệu hoặc dùng data augmentation
Trang 20Ví dụ:
Hình 8 Mô hình dropout
- Dropout hạn chế việc overfitting:
Overfitting là mô hình đang dùng phá phức tạp so với mô hình thật dữ liệu Khi ta dùng dropout như trên thì rõ ràng mô hình bên phải đơn giản hơn=> tránh
overfitting
Thêm vào đó Vì mỗi bước train model thì ngẫu nhiên (1-p%) các node bị loại bỏ nên model không thể phụ thuộc vào bất kì node nào của layer trước thay vào đó cóxun hướng trải đều weight, giống như trong L2 reularization => tránh overfitting
- Lời khuyên cho người dùng dropout:
+ Hệ số p nên ở khoảng [0.2; 0.5] Nếu p quá nhỏ thì ko có tác dụng chống
overfitting, tuy nhiên nếu p quá lớn thì gần như loại bỏ layer đấy và có thể dẫn đếnunderfitting
+ Nên dùng model lớn, phức tạp hơn vì ta có dropout chống overfitting
+ Dropout chỉ nên dùng fully connected layer, ít khhi được dùng cho convNet layer
+ Hệ số p ở các layer nên tỉ lệ với số lượng node trong FC layer đó
e) Activation funciton:
- Non-linear activation function:
Trang 21Hàm activation function được dùng sau bước tính tổng linear trong neural network
hoặc sau convolutional layer trong CNN Và hàm activation là non-linear
function.
- Vanishing và exploding gradient:
Backpropagation là thuật toán được dùng để tính đạo hàm các hệ số trong neural network với loss function rồi áp dụng gradient descent để tìm các hệ số
Hình 9 Mô hình neural network 2-3-3-1
Hình 10 Quá trình backpropagation
Trang 23Hình 12 Đồ thị Sigmoid activation function
+ Tanh activation function:
Hình 13 Đồ thị Tanh activation function
Trang 24+ ReLU activation function:
Hình 14 Đồ thị ReLU activation function
+ Leaky ReLU:
Hình 15 Leaky ReLU
CHƯƠNG II: CÁC PHƯƠNG PHÁP TIẾP CẬN VẤN ĐỀ TRONG HỌC MÁY 1: Học máy là gì?
Trang 25Máy học là môn khoa học nhằm phát triển những thuật toán và mô hình thống kê
mà các hệ thống máy tính sử dụng để thực hiện các tác vỵ dựa vào khuôn mẫu và suy luận mà không cần hướng dẫn cụ thể
Hình 1 Sơ đồ máy học
Các hệ thống máy tính sử dụng thuật toán máy học để xử lý khối lượng lớn dữ liệu trong quá khứ và xác định các khuôn mẫu dữ liệu Việc này cho phép chúng dự đoánchính xác hơn từ cùng một tập dữ liệu đầu vào cho trước
2: Máy học có các loại thuật toán nào?
Trang 26- Máy học giám sát
Các nhà khoa học dữ liệu cung cấp cho thuật toán dữ liệu đào tạo được gắn nhãn và xác định để đánh giá mối tương quan Dữ liệu mẫu chỉ định cả đầu vào
và kết quả của thuật toán
Hình 2 Thuật toán máy học giám sát
Ưu điểm: Đơn giản và thiết kế dễ dàng Hữu ích khi dự đoán một số lượng kết quả có giới hạn, phân loại dữ liệu hoặc kết hợp các kết quả thu được từ 2 thuật toán máy học
Nhược điểm: Việc phân loại hàng triệu tập dữ liệu đầu vào với giá trị kết quả được xác định tương ứng không có nhãn là thách thức
- Máy học không có giám sát
Được đào tạo dựa trên dữ liệu không gắn nhãn Các thuật toán này quét dữ liệu mới, cố gắng thiết lập kết nối có ý nghĩa giữa dữ liệu đầu vào và kết quả định
Trang 27sẵn Chúng có thể phát hiện khuôn mẫu và phân loại dữ liệu.
Hình 3 Thuật toán máy học không giám sát
Ưu điểm: Rất hữu ích trong việc phát triển khuôn mẫu và sự bất thường, cũng như tự động nhóm dữ liệu theo các hạng mục Vì dữ liệu đào tạo không cần gắn nhãn nên việc thiết lập học không giám sát rất dễ dàng, có thể sử dụng để làm sạch và xử lý dữ liệu nhằm tự động dựng mô hình chuyên sâu hơn
Nhược điểm: Thuật toán không thể đưa ra dự đoán chính xác, không thể tự táchbiệt một số loại kết quả dữ liệu cụ thể
- Máy học nửa giám sát
Trang 28-Hình 4 Thuật toán máy học nửa giám sát
Phương pháp kết hợp cả học có giám sát lẫn không có giám sát Kỹ thuật này dựa vào một lượng nhỏ dữ liệu được gắn nhãn và một lượng lớn dữ liệu không gắn nhãn để đào tạo các hệ thống Đầu tiên, dữ liệu được gắn nhãn được sử dụng để đào tạo một phần thuật toán máy học Sau đó, thuật toán đã được đào tạo một phần sẽ tự mình gắn nhãn cho dữ liệu chưa được gắn nhãn Quá trình này được gọi là giả gắn nhãn Mô hình sau đó được đào tạo lại bằng hỗn hợp
dữ liệu kết quả mà không được lập trình cụ thể
Ưu điểm: của phương pháp này là bạn không cần một lượng lớn dữ liệu được gắn nhãn Phương pháp này rất hữu ích khi làm việc với loại dữ liệu như các tài liệu dài và tốn quá nhiều thời gian để có người đọc và gắn nhãn
- Máy học tăng cường
Học tăng cường là phương pháp có giá trị thưởng được gắn với các bước khác nhau mà thuật toán phải trải qua Mục tiêu của mô hình là tích lũy nhiều điểm thưởng hết mức có thể và cuối cùng sẽ đạt được mục tiêu cuối Hầu hết các ứng dụng thực tiễn của học tăng cường trong thập niên vừa qua nằm trong lĩnh
Trang 29vực trò chơi điện tử Các thuật toán học tăng cường tiên tiến đã đạt được nhữngkết quả ấn tượng trong các trò chơi cổ điển và hiện đại, thường có kết quả vượt
xa đối thủ con người của chúng
Hình 5 Thuật toán máy học tăng cường
Ưu điểm: Hoạt động tốt nhất trong môi trường dữ liệu không chắc chắn và phức tạp
Nhược điểm: Không được sử dụng rộng rãi
3: Công nghệ máy học được sử dụng trong lĩnh cực gì?
Trang 30- Sản xuất
Hình 6 Công nghệ máy học sản xuất
Máy học có thể hỗ trợ bảo trì dự đoán, kiểm soát chất lượng và nghiên cứu đổi mới trong lĩnh vực sản xuất Công nghệ máy học cũng giúp các công ty cải thiện giải pháp hậu cần, bao gồm quản lý tài sản, chuỗi cung ứng và kho hàng