Trường Đại học Bách khoa – ĐHĐN Tóm tắt – Việc nhận dạng khuôn mặt kết hợp với trí tuệ nhân tạo học máy để dự đoán và hỗ trợ phân tích các thói quen của khách hàng là một trong những ứn
Trang 1ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA
TRƯƠNG QUỐC TUẤN
& HỖ TRỢ PHÂN TÍCH THÓI QUEN KHÁCH HÀNG
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Đà Nẵng - Năm 2017
Trang 2ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA
TRƯƠNG QUỐC TUẤN
& HỖ TRỢ PHÂN TÍCH THÓI QUEN KHÁCH HÀNG
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01.01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học: TS PHẠM MINH TUẤN
Đà Nẵng - Năm 2017
Trang 3LỜI CAM ĐOAN
Tôi cam đoan đề tài “Xây dựng hệ thống nhận dạng khuôn mặt và hỗ trợ
phân tích thói quen khách hàng” là công trình nghiên cứu của riêng tôi thực hiện, các
số liệu, kết quả nêu trong luận văn là trung thực và chưa được công bố trong bất kỳ công trình nghiên cứu nào khác, các mô tả và một số thông tin trích lọc từ một số nguồn tài liệu đã ghi rõ trong phần tham khảo đề tài Luận văn này được thực hiện trên cơ sở nghiên cứu lý thuyết và dưới sự hướng dẫn khoa học của TS Phạm Minh Tuấn
Tác giả luận văn
Trương Quốc Tuấn
Trang 4XÂY DỰNG HỆ THỐNG NHẬN DẠNG KHUÔN MẶT
& HỖ TRỢ PHÂN TÍCH THÓI QUEN KHÁCH HÀNG
Học viên: Trương Quốc Tuấn Chuyên ngành: Khoa học máy tính
Mã số:102150319 Khóa: K31 Trường Đại học Bách khoa – ĐHĐN
Tóm tắt – Việc nhận dạng khuôn mặt kết hợp với trí tuệ nhân tạo (học máy) để dự
đoán và hỗ trợ phân tích các thói quen của khách hàng là một trong những ứng dụng thiết thực và được áp dụng rộng rãi dần trong tương lai Nghiên cứu này nhằm áp dụng cho khách sạn để thu thập dữ liệu của khách hàng khi vào, nhằm tăng cường bảo mật, cảnh báo, dự báo cho khách sạn với khách hàng đó với tình trạng là bình thường hoặc bất thường
Từ việc áp dụng SDK Intel RealSense để nhận diện khuôn mặt, tác giả đã khái quát
mô hình, kỹ thuật trong việc nhận diện khuôn mặt Cùng với áp dụng mô hình học máy thông qua phương pháp hồi quy tuyến tính để cho ra kết quả dự đoán Trong đề tài nghiên cứu này, tác giả đã tóm tắt các kết quả đã đạt được và đưa ra hướng phát triển tiếp theo
Từ khóa – nhận diện khuôn mặt; thói quen, hồi quy tuyến tính, SDK Intel
Realsense, học máy
BUILDING THE FACE RECOFNITION
& SUPPORT THE ANALYSIS OF CUSTOMER HABITS Abstract - Facial recognition combined with artificial intelligence (machine
learning) to predict and support the analysis of customer habits is one of the most practical and widely adopted applications in the future This research aims to apply to the hotel to collect customer data on arrival, to enhance the hotel's security, warning, and forecasting to customers with normal or abnormal conditions
To adopting the Intel RealSense SDK for facial recognition, the author has outlined the model and technology of face recognition Along with applying machine learning model through linear regression method to produce predictive results In this research topic, the achieved results are summarized and perspective of the work is provided by author, and set out the direction of the next development
Key words - Face recognition; Habits, Linear regression, Intel Realsense SDK,
Machine learning
Trang 5MỤC LỤC
MỞ ĐẦU 1
1 Tính cấp thiết của đề tài 1
2 Mục tiêu nghiên cứu 1
3 Nội dung nghiên cứu 1
4 Đối tượng và phạm vi nghiên cứu 2
5 Phương pháp nghiên cứu 2
6 Ý nghĩa khoa học và thực tiễn 2
CHƯƠNG 1 TỔNG QUAN 5
1.1 GIỚI THIỆU, PHÂN LOẠI VỀ TRÍ TUỆ NHÂN TẠO 5
1.2 CÁC VẤN ĐỀ VỀ NHẬN DẠNG KHUÔN MẶT 6
1.2.1 Tìm hiểu về việc nhận dạng khuôn mặt (Face recognition) 6
1.2.2 Cảm xúc của khuôn mặt 19
1.3 CÁC TÁC ĐỘNG CỦA TRÍ TUỆ NHÂN TẠO VÀ ÁP DỤNG ĐIỂN HÌNH 19
1.3.1 Tác động 19
1.3.2 Các bài toán điển hình áp dụng các phương pháp TTNT 20
1.3.3 Những trí tuệ nhân tạo mạnh nhất hiện nay 20
1.4 KHÁI QUÁT SDK INTEL REALSENSE 23
CHƯƠNG 2 MÔ HÌNH NHẬN DẠNG KHUÔN MẶT & HỖ TRỢ PHÂN TÍCH THÓI QUEN KHÁCH HÀNG 26
2.1 PHÂN TÍCH BÀI TOÁN 26
2.2 MÔ HÌNH ĐỀ XUẤT 27
2.3 THIẾT KẾ 33
2.4 THUẬT TOÁN CHÍNH 35
CHƯƠNG 3 KẾT QUẢ VÀ THỰC NGHIỆM 37
3.1 MÔI TRƯỜNG PHÁT TRIỂN 37
3.1.1 Chuẩn bị cho môi trường 37
3.1.2 Setup phần SDK Intel Real Sense 37
3.1.3 Cài đặt SQL Server và Tạo Database 39
3.1.4 Setup chương trình 43
3.2 DỮ LIỆU ĐẦU VÀO 43
3.3 PHÂN TÍCH KẾT QUẢ 43
3.4 DEMO ỨNG DỤNG 49
3.4.1 Màn hình chính 49
3.4.2 Màn hình quản lý khách hàng/ đăng ký khuôn mặt 50
Trang 63.4.3 Màn hình xem danh sách khách đến 50 3.4.4 Màn hình để nhập dữ liệu train 51 3.4.5 Màn hình xem lại việc check-in và check out 51 3.4.6 Màn hình tìm kiếm thông tin theo ngày của khách hàng vào ra khách sạn 52 3.4.7 Màn hình cài đặt camera, cấu hình 52
KẾT LUẬN & KIẾN NGHỊ 53 TÀI LIỆU THAM KHẢO
QUYẾT ĐỊNH GIAO ĐỀ TÀI (Bản sao)
Trang 7DANH MỤC CÁC KÝ HIỆU, TỪ VIẾT TẮT
CÁC KÝ HIỆU:
𝝀 : ký hiệu lambda
: epsilon
CÁC CHỮ VIẾT TẮT:
AI: Artificial Intelligence – Trí tuệ nhân tạo
PCA: Principal Components Analysis – một loại phương pháp phân tích thành phần chính
LDA: Linear Discriminant Analysis – Phương pháp phân tích lớp tuyến tính EBGM: Elastic Bunch Graph Matching – Phương pháp đồ thị đàn hồi
SDK: Software Development Kit – Bộ phần mềm phát triển
Trang 9DANH MỤC CÁC HÌNH
Số hiệu
hình
Hình 1.1 Các thể loại của trí tuệ nhân tạo 5
Hình 1.3 Cấu trúc tổng quát của hệ thống nhận dạng khuôn mặt 8
Hình 1.4 Các hướng tiếp cận trích lọc đặc trưng trong nhận dạng
khuôn mặt
10
Hình 1.6 Không gian mới (p1, p2) theo hướng phân bổ mạnh nhất
của các vector trong không gian (x1, x2) tìm theo PCA
12
Hình 1.8 Mô hình lưới của các khuôn mặt khác nhau 18
Hình 1.10 Công nghệ chạm tay phía ngoài màn hình từ SDK, Camera
3D Intel [2]
23
Hình 2.1 Kiến trúc của SDK Intel RealSense [2] 28 Hình 2.2 Kiến trúc tổng quát của chương trình 33 Hình 2.3 Các bước của việc nhận dạng khuôn mặt từ SDK [2] 34 Hình 2.4 Mô hình sử dụng SDK Intel Real Sense và AI 34 Hình 2.5 Mô hình dữ liệu của phương pháp hồi quy tuyến tính [5] 35
Trang 10Hình 3.1 Download SDK Intel Real Sense 37 Hình 3.2 Màn hình install SDK Intel RealSense 38 Hình 3.3 Màn hình cài đặt lựa chọn package 38
Hình 3.6 Màn hình quản lý khách hàng/ đăng ký khuôn mặt 50 Hình 3.7 Màn hình xem danh sách khách đến 50 Hình 3.8 Màn hình theo dõi dữ liệu huấn luyện 51 Hình 3.9 Màn hình theo dõi thông tin check-in và check-out 51 Hình 3.10 Màn hình xem lại lịch sử khách hàng 52
Trang 11MỞ ĐẦU
1 Tính cấp thiết của đề tài
Ngày nay với sự phát triển của nền khoa học máy tính và việc nhận dạng hình ảnh khuôn mặt thông qua camera đã ứng dụng vào rất nhiều trong cuộc sống của chúng ta nhằm để thực hiện các việc phát hiện đối tượng, khách hàng để bảo mật, cảnh báo hoặc các ứng dụng như robot để điều khiển việc giúp đỡ tự động từ hình ảnh khuôn mặt thu nạp được
Cùng với sự phát triển của trí tuệ nhân tạo là đặc trưng của lĩnh vực dự đoán, phân tích các dự báo trong thế giới kỹ thuật số có tính học máy, đòi hỏi cần phải thu thập dữ liệu và cho hệ thống máy tính học dần các dữ liệu để phân tích đưa ra kết quả dự đoán Lĩnh vực thu thập dữ liệu khuôn mặt kết hợp với trí tuệ nhân tạo nhằm đưa ứng dụng thực tế vào cuộc sống cũng còn mới mẽ và được nhiều giới chuyên gia rất quan tâm Trong đó việc nhận dạng hình ảnh khuôn mặt và phân tích đưa ra kết quả dự đoán các hành vi, thói quen đối với khách hàng tại khách sạn cũng là một ứng dụng có tính khoa học và thực tiễn cao, giúp cho khách sạn có được đầy đủ thông tin của khách hàng khi vào khách sạn, nhằm phục vụ cho việc cảnh báo, giúp đỡ, phục vụ khách được chu đáo hơn
Vì vậy, xuất phát từ nhu cầu đấy, tôi đã chọn đề tài luận văn thạc sĩ:
“XÂY DỰNG HỆ THỐNG NHẬN DẠNG KHUÔN MẶT
& HỖ TRỢ PHÂN TÍCH THÓI QUEN KHÁCH HÀNG"
2 Mục tiêu nghiên cứu
Xây dựng ứng dụng nhận diện khuôn mặt thông qua nền tảng SDK Intel RealSense
và áp dụng thuật toán của trí tuệ nhân tạo (học máy) nhằm phân tích thói quen của đối tượng được nhận diện, đáp ứng được các bước:
- Nghiên cứu và tạo ứng dụng nhận dạng khuôn mặt dựa trên nền tảng SDK RealSense của Intel
- Sử dụng việc nhận dạng khuôn mặt này và phân tích thói quen của khách hàng
áp dụng phương pháp tính toán của Trí tuệ nhân tạo (học máy)
3 Nội dung nghiên cứu
- Tìm hiểu về việc nhận dạng khuôn mặt (face recognition) thông qua SDK Intel RealSense
- Tìm hiểu đặc tính cơ bản của khuôn mặt
- Tìm hiểu về phương pháp và thuật toán suy đoán hồi quy (linear regression)
Trang 124 Đối tượng và phạm vi nghiên cứu
4.1 Đối tượng nghiên cứu
- Nhận dạng khuôn mặt thông qua SDK RealSense của Intel
- Các đặc điểm thói quen của khách hàng
- Giải thuật tính toán theo phương pháp hồi quy tuyến tính
4.2 Phạm vi nghiên cứu
- Dựa vào dữ liệu thu thập từ Camera và nhận dạng khuôn mặt thông qua SDK
- Sau khi thực hiện việc học dữ liệu huấn luyện, dùng phương pháp suy đoán hồi quy tuyến tính và trả về kết quả, hỗ trợ, thông báo, cảnh báo các thói quen của cá nhân
- Xây dựng tập dữ liệu huấn luyện ứng với khuôn mặt
- Kiểm tra, thử nghiệm và đánh giá kết quả
6 Ý nghĩa khoa học và thực tiễn
7 Bố cục của luận văn
Luận văn được trình bày bao gồm các phần chính như sau:
MỞ ĐẦU
1 Tính cấp thiết của đề tài
2 Mục tiêu nghiên cứu
3 Nội dung nghiên cứu
Trang 134 Đối tượng và phạm vi nghiên cứu
5 Phương pháp nghiên cứu
6 Ý nghĩa khoa học và thực tiễn
1.4 KHÁI QUÁT SDK INTEL REALSENSE
CHƯƠNG 2 MÔ HÌNH NHẬN DẠNG KHUÔN MẶT & HỖ TRỢ PHÂN TÍCH THÓI QUEN KHÁCH HÀNG
2.1 PHÂN TÍCH BÀI TOÁN
2.2 MÔ HÌNH ĐỀ XUẤT
2.3 THIẾT KẾ
2.4 THUẬT TOÁN CHÍNH
CHƯƠNG 3 KẾT QUẢ VÀ THỰC NGHIỆM
3.1 MÔI TRƯỜNG PHÁT TRIỂN
3.1.1 Chuẩn bị cho môi trường 3.1.2 Setup phần SDK Intel Real Sense 3.1.3 Cài đặt SQL Server và Tạo Database 3.1.4 Setup chương trình
3.2 DỮ LIỆU ĐẦU VÀO
3.3 PHÂN TÍCH KẾT QUẢ
3.4 DEMO ỨNG DỤNG
3.4.1 Màn hình chính 3.4.2 Màn hình quản lý khách hàng/ đăng ký khuôn mặt 3.4.3 Màn hình xem danh sách khách đến
3.4.4 Màn hình để nhập dữ liệu train 3.4.5 Màn hình xem lại việc check-in và check out 3.4.6 Màn hình tìm kiếm thông tin theo ngày của khách hàng vào
ra khách sạn
Trang 143.4.7 Màn hình cài đặt camera, cấu hình
KẾT LUẬN & KIẾN NGHỊ
Trang 15CHƯƠNG 1 TỔNG QUAN
1.1 GIỚI THIỆU, PHÂN LOẠI VỀ TRÍ TUỆ NHÂN TẠO
Giới thiệu
Trí tuệ nhân tạo (tiếng Anh: Artificial Intelligence hay Machine Intelligence, thường được viết tắt là AI) là trí tuệ được biểu diễn bởi bất cứ một hệ thống nhân tạo nào Thuật ngữ này thường dùng để nói đến các máy tính có mục đích không nhất định
và ngành khoa học nghiên cứu về các lý thuyết và ứng dụng của trí tuệ nhân tạo Tuy rằng trí thông minh nhân tạo có nghĩa rộng như là trí thông minh trong khoa học viễn tưởng, nó là một trong những ngành trọng yếu của tin học Trí thông minh nhân tạo liên quan đến cách cư xử, sự học hỏi và khả năng thích ứng thông minh của máy móc Các ví dụ ứng dụng bao gồm các tác vụ điều khiển, lập kế hoạch và lập lịch (scheduling), khả năng trả lời các câu hỏi về chẩn đoán bệnh, trả lời khách hàng về các sản phẩm của một công ty, nhận dạng chữ viết tay, nhận dạng tiếng nói và khuôn mặt Ngày nay, các hệ thống nhân tạo được dùng nhiều trong các lĩnh vực kinh tế, y dược, sân bay, quân sự, [1]
Các phương pháp
Học máy (Machine learning)
Xử lý ngôn ngữ tự nhiên (Natural language processing)
Xử lý ngôn ngữ tiếng nói (Speech)
Hệ chuyên gia (Expert systems)
Dự báo, tối ưu hóa (Planning, optiomization)
Natural language processing (NLP) Speech
Expert systems
Planning, optiomization Robotics
Vision
Trang 161.2 CÁC VẤN ĐỀ VỀ NHẬN DẠNG KHUÔN MẶT
Ngày này, việc nhận dạng khuôn mặt để xác nhận cho vấn đề an toàn, các thói quen ứng với từng khuôn mặt ấy được sử dụng rộng rãi Không những thế mà việc áp dụng nhận diện khuôn mặt xong, áp dụng với việc dự đoán từ khuôn mặt để xác định hành vi, thói quen là một trong những ứng dụng rất thực tiễn và mới mẻ trong rất nhiều lĩnh vực
Trong để tài nghiên cứu này, tôi đã kết hợp việc nhận dạng khuôn mặt và trí tuệ nhân tạo (học máy) để áp dụng cho việc phân tích thói quen khách hàng tại khách sạn
1.2.1 Tìm hiểu về việc nhận dạng khuôn mặt (Face recognition)
Giới thiệu
Như chúng ta đã biết, con người khi sinh ra đã có những đặc điểm sinh học tự nhiên riêng biệt phân biệt giữa người này với người kia, rất khó có thể trùng lặp Các đặc điểm đó có thể bị thay đổi trong cuộc sống trừ những tác động khách quan hoặc chủ quan như: tai nạn, tổn thương, phẫu thuật chỉnh hình Chính bởi yếu tố riêng biệt đó, các nhà khoa học tập trung nghiên cứu, tìm hiểu đặc trưng sinh trắc của con người và áp dụng vào các biện pháp giúp nhận dạng, xác định danh tính của mỗi người Dựa vào những đặc điểm sinh trắc học của con người, các hệ thống nhận dạng sinh trắc học ra đời nhằm giải quyết nhiều vấn đề có liên quan tới bảo mật, an ninh, khoa học hay các nhu cầu khác trong cuộc sống
Các đặc trưng sinh trắc khuôn mặt là những đặc điểm riêng trên khuôn mặt mỗi người gần như không thay đổi theo thời gian, các đặc điểm này phân biệt giữa người này và người kia, rất khó có thể xảy ra trùng lặp Dựa trên nhận xét thực tế, con người
dễ dàng nhận biết các khuôn mặt và các đối tượng trong các tư thế khác nhau và điều kiện ánh sáng khác nhau, thì phải tồn tại các thuộc tính hay đặc trưng không thay đổi Chính vì thế, việc xác định danh tính, nhận dạng khuôn mặt người thông qua các đặc trưng sinh trắc học đó sẽ đảm bảo được độ chính xác, tin cậy cao
Bản thân con người có thể nhận dạng ảnh khuôn mặt của mọi người một cách dễ dàng Thậm chí, ảnh đó có thể nằm trong một ảnh nền phức tạp Tuy nhiên, đối với hệ máy thì việc nhận dạng này là một công việc rất phức tạp và khó khăn Chính vì vậy, trong những năm gần đây, lĩnh vực nhận dạng khuôn mặt đã nhận được sự quan tâm nghiên cứu lớn từ các nhà khoa học nhằm tạo ra các hệ hỗ trợ quyết định phục vụ trong rất nhiều lĩnh vực của cuộc sống
Giả sử ta có một cơ sở dữ liệu ảnh đã được lưu trong máy về một số người (Hình 1.2), bài toán nhận dạng là làm sao để khi đưa ảnh khuôn mặt của một người bất kỳ vào thì máy sẽ tự động nhận dạng ra người này trong cơ sở dữ liệu
Trang 17Hình 1.2 Mô hình nhận diện khuôn mặt
Hơn một thập kỷ qua, có rất nhiều công trình nghiên cứu về bài toán xác định khuôn mặt người từ ảnh đen trắng, ảnh xám, đến ảnh màu Các nghiên cứu đi từ bài toán đơn giản cho đến phức tạp, từ ảnh chỉ chứa một khuôn mặt người nhìn thẳng vào thiết
bị thu hình và đầu ở tư thế thẳng đứng, cho đến ảnh màu với nhiều khuôn mặt người trong cùng ảnh, khuôn mặt có quay một góc nhỏ, hay bị che khuất một phần, và với ảnh nền của ảnh phức tạp (ảnh được chụp ngoài thiên nhiên) nhằm đáp ứng nhu cầu và phân tích cần thiết của con người
Bài toán xác định khuôn mặt người là một kỹ thuật máy tính để xác định các vị trí
và các kích thước của khuôn mặt trong ảnh bất kỳ Kỹ thuật này nhận biết các đặt trưng khuôn mặt và bỏ qua những thứ khác như: toà nhà, cây cối, cơ thể,…
Hệ thống nhận diện khuôn mặt có thể giúp:
Tra cứu thông tin tội phạm
Giám sát bằng camera để phát hiện tội phạm tại các khu vực công cộng
Tìm trẻ lạc dựa vào các camera đặt ở các nơi công cộng
Phát hiện các nhân vật VIP, khách hàng có tính bình thường/bất thường khi đặt chân vào khách sạn
Phát hiện tội phạm tại các nơi công cộng
Có thể dùng trong khoa học để so sánh một thực thể với nhiều thực thể khác
v/v…
Việc nhận diện khuôn mặt làm việc như thế nào?
Trang 18Nhiệm vụ của hệ thống nhận dạng khuôn mặt là xử lý tự động thông tin từ các ảnh khuôn mặt để tìm ra độ tương tự giữa các khuôn mặt và đưa ra quyết định về tính đồng nhất giữa chúng Cấu trúc của hệ thống nhận dạng khuôn mặt được thể hiện như Hình 1.3 và gồm các khâu chức năng sau:
Hình 1.3 Cấu trúc tổng quát của hệ thống nhận dạng khuôn mặt
- Phát hiện khuôn mặt (face detection): Phát hiện khuôn mặt sẽ lấy ra tất cả các
khuôn mặt trong một hình ảnh Chức năng này làm nhiệm vụ xác định vị trí, kích
cỡ của một hoặc nhiều khuôn mặt trên ảnh chụp từ đó tách ra phần mặt Phần ảnh mặt được tách ra thường nhỏ hơn nhiều so với ảnh chụp ban đầu, nó sẽ là các khuôn mặt cần tìm và chức năng trích chọn đặc trưng sẽ sử dụng các ảnh được tách ra này
- Tiền xử lý (Pre-Processing): Bước này nhằm mục đích lọc nhiễu, nâng cao chất
lượng ảnh để chuẩn hóa ảnh cần tìm giúp cho việc tìm kiếm được hiệu quả hơn Các công việc trong bước tiền xử lý có thể là: Chuẩn hóa kích cỡ giữa ảnh trong CSDL
và ảnh cần tìm, hiệu chỉnh độ sáng, tối của ảnh, lọc nhiễu, chuẩn hóa về vị trí, tư thế ảnh mặt
- Trích chọn đặc trưng (FE): Tìm ra các đặc trưng chính của ảnh mặt, từ các đặc
trưng này hình thành các vector đặc trưng, các vector này sẽ được sử dụng để đối sánh sự giống nhau giữa ảnh mặt cần tìm và ảnh mặt trong CSDL
- Nhận dạng/Phân lớp: Bước nhận dạng (recognition) hay phân lớp
(classification), tức là xác định danh tính (identity) hay nhãn (label) của ảnh đó
là ảnh của ai
Trang 19- Dữ liệu hệ thống nhận dạng: Dữ liệu hệ thống nhận dạng được chia làm 3 tập gồm
tập huấn luyện (training set), tập tham chiếu (reference set) và tập để nhận dạng (probe set) Tập training gồm các ảnh được dùng để huấn luyện, thông thường tập này được dùng để sinh ra một không gian con là một ma trận Tập reference gồm các ảnh đã biết danh tính được chiếu vào không gian con ở bước training Sau khi thực hiện chiếu tập reference vào không gian con, hệ thống lưu lại kết quả là một
ma trận với mỗi cột của ma trận là một vector tương ứng với ảnh (định danh đã biết)
để thực hiện nhận dạng (hay phân lớp)
Hệ thống nhận dạng khuôn mặt cần đảm bảo các yêu cầu:
- Độ chính xác nhận dạng có thể chấp nhận được đối với yêu cầu của bài toán nhận dạng;
- Tốc độ vận hành cao đối với các CSDL lớn và số lượng các yêu cầu có thể giải quyết được;
- Đơn giản trong việc cài đặt, lựa chọn thiết bị và vận hành An toàn với người sử dụng
Các hướng tiếp cận trong nhận dạng khuôn mặt
- Như trong phần 1.1.2 đã trình bày, hệ thống nhận dạng khuôn mặt gồm bốn khâu chính (tiền xử lý, tách vùng mặt, trích chọn đặc trưng, đối sánh) Mỗi một khâu đều
có tác động đến độ chính xác của hệ thống Tuy nhiên, hai khâu quan trọng nhất vẫn
là trích chọn đặc trưng và đối sánh (ra quyết định) Chính vì vậy, qua khảo sát các công trình nghiên cứu liên quan đến nhận dạng khuôn mặt [x], [10] [12] , ta có thể thấy các công trình công bố đều chủ yếu tập trung vào cải tiến hai bước chính là trích chọn đặc trưng và ra quyết định
Theo định hướng tìm ra cách trích chọn đặc trưng
Trang 20Hình 1.4 Các hướng tiếp cận trích lọc đặc trưng trong nhận dạng khuôn mặt
Nhận dạng dựa trên xét tổng thể khuôn mặt (Appearance based face recognition):
Nội dung chính của hướng tiếp cận này là xem mỗi ảnh có kích thước RxC là một vector trong không gian RxC chiều Ta sẽ xây dựng một không gian mới có chiều nhỏ
hơn sao cho khi biểu diễn trong không gian đó các đặc điểm chính của một khuôn mặt không bị mất đi Trong không gian đó, các ảnh của cùng một người sẽ được tập trung lại thành một nhóm gần nhau và cách xa các nhóm khác Một số phương pháp được dùng cho loại này như:
- Trích chọn các đặc trưng tuyến tính: PCA, ICA, LDA
- Trích chọn các đặc trưng phi tuyến: KPCA, ISOMAP
Nhận dạng sử dụng mô hình về khuôn mặt (Model-based face recognition ):
Đây là phương pháp nhận dạng khuôn mặt dựa trên việc xác định các đặc trưng hình học của các chi tiết trên một khuôn mặt (như vị trí, diện tích, hình dạng của mắt, mũi, miệng…), và mối quan hệ giữa chúng (như khoảng cách của hai mắt, khoảng cách của hai lông mày…) Một số phương pháp được dùng cho loại này như:
- Nhận dạng 2D: EBGM, Active Appearance Model
- Nhận dạng 3D: 3D Morphable Model
Ưu điểm của phương pháp này là nó gần với cách mà con người sử dụng để nhận biết khuôn mặt Hơn nữa với việc xác định đặc tính và các mối quan hệ, phương pháp này có thể cho kết quả tốt trong các trường hợp ảnh có nhiều nhiễu như bị nghiêng, bị xoay hoặc ánh sáng thay đổi
Trang 21Để xây dựng một hệ thống nhận dạng khuôn mặt, người ta phải có đầu vào là một ảnh kỹ thuật số hay 1 khung hình video Hệ thống kiểm tra và cho ra kết quả hình ảnh này là ai (đã có trong cơ sở dữ liệu), việc nhận dạng này gồm 3 bước:
- Phát hiện khuôn mặt có trong hình/ video (face detection)
- Trích rút đặc trưng của khuôn mặt (feature extraction)
- Nhận dạng khuôn mặt (face recognition)
Phát hiện khuôn mặt có trong hình/ video (face detection): Chức năng chính của bước này là phát hiện ra khuôn mặt xem nó có xuất hiện ở trong một bức hình hay một đoạn video hay không? Tỉ lệ phát hiện ra khuôn mặt phụ thuộc nhiều vào điều kiện về
độ sáng, hướng khuôn mặt, biểu hiện cảm xúc trên khuôn mặt hay các yếu tố môi trường khác Để hệ thống nhận dạng hoạt động đạt hiệu quả cao thì hình ảnh khuôn mặt sau khi được phát hiện cần chuẩn hóa về kích thước, ánh sáng
Trích rút đặc trưng (feature extraction): Sau khi phát hiện ra khuôn mặt trong bức ảnh, chúng ta tiến hành trích rút những đặc trưng của khuôn mặt Bước này trích xuất ra một vector đặc trưng đại diện cho một khuôn mặt Nó phải đảm bảo được tính duy nhất của một khuôn mặt
Nhận dạng khuôn mặt (face recognition): Với hình ảnh đầu vào sau khi phát hiện ra khuôn mặt, trích rút các đặc trưng của khuôn mặt và đem so sánh các đặc trưng này với cơ sở dữ liệu khuôn mặt
Hình 1.5 Nhận diện khuôn mặt
Thuật toán nhận diện khuôn mặt hiện chia làm hai loại: Nhận diện dựa trên các đặc trưng khuôn mặt (Feature Base Face Recognition) và nhận dạng dựa trên xét tổng thể toàn khuôn mặt (Appearance Based Face Recognition)
Nhận dạng dựa trên các đặc trưng khuôn mặt
Trang 22Phương pháp này dựa trên đặc trưng của hình học trên khuôn mặt như: mắt, mũi, miệng, gò má, và khoảng cách giữa chúng như: giữa hai mắt
Ưu điểm là nó gần với cách mà con người sử dụng để nhận biết khuôn mặt Hơn nữa với việc xác định đặc tính và các mối quan hệ, phương pháp này cho kết quả tốt trong các điều kiện không có kiểm soát
Nhược điểm là cài đặt thuật toán phức tạp do việc xác định mối quan hệ giữa các đặc tính, đòi hỏi các thuật toán phức tạp và phương pháp này sẽ hoạt động không hiệu quả khi kích thước hình ảnh nhỏ vì rất khó phân biệt được các đặc tính
Nhận dạng dựa trên xét tổng thể toàn khuôn mặt
Phương pháp này là phương pháp trắc quang, có nghĩa là biến hình ảnh thành các giá trị và so sánh với giá trị mẫu để nhận biết, phổ biến nhất trong phương pháp này có
3 loại:
- Phân tích thành phần chính (PCA)
- Phân tích phân lớp tuyến tính (LDA)
- Phương pháp đồ thị đàn hồi (EBGM)
o Phân tích thành phần chính - Principal Components Analysis (PCA)
Nguyên lý chung
Hình 1.6 Không gian mới (p1, p2) theo hướng phân bổ mạnh nhất của các vector
trong không gian (x1, x2) tìm theo PCA
Trang 23PCA là một thuật toán để được sử dụng để tạo ra một ảnh mới từ ảnh ban đầu Ảnh mới này có kích thước nhỏ hơn rất nhiều so với ảnh đầu vào và vẫn mang những đặc trưng cơ bản nhất của ảnh cần nhận dạng PCA không cần quan tâm đến việc tìm ra các đặc điểm cụ thể của thực thể cần nhận dạng và mối quan hệ giữa các đặc điểm đó Tất
cả các chi tiết đó đều được thể hiện ở ảnh mới được tạo ra từ PCA Về bản chất, PCA tìm ra một không gian mới theo hướng biến thiên mạnh nhất của một tập hợp các vector trong không gian cho trước Trong không gian mới, người ta hy vọng rằng việc phân loại sẽ mang lại kết quả tốt hơn so với không gian ban đầu
Nội dung thuật toán PCA
Không gian mới được tạo bởi PCA được cấu thành từ K vector đơn vị có chiều
là N Mỗi vector được gọi là một Eigenface
- Phép biến đổi:
𝐴 =[
𝑎1
𝑎2
𝑤𝐾] 𝑣ớ𝑖 𝐾 ≪ 𝑁
Theo công thức:
W = T.A
Với T là ma trân chuyển đổi, T có kích thước KxN
Gọi M là số ảnh đầu vào, mỗi ảnh được chuyển thành vector N nhiều chiều, ta có tập hợp đầu vào X = {x1, x2, … ,xM} (xi € RN)
Trung bình của các vector đầu vào:
Gọi A = [θ1, θ2,…, θM] ta có ma trận tương quan của A là:
Gọi các giá trị riêng của C là λ1, λ2,…, λN sắp xếp theo thứ tự giảm dần, tương ứng với N vector riêng u1, u2,…, uN Các vector riêng này trực giao từng đôi một Mỗi vector riêng ui được gọi là một eigenface Tập hợp các vector ban đầu được biểu diễn trong không gian tạo bởi N eigenface theo mô tả:
Trang 24Chọn lấy K vector riêng u tương ứng với K giá trị riêng λ lớn nhất, ta có:
Vector các hệ số khai triển [w1, w2, …, wK] chính là biểu diễn mới của ảnh được tạo ra trong không gian PCA Ảnh mới xˆ vẫn giữ được các đặc điểm chính của ảnh đầu vào Vector [w1, w2, …, wK] được tính theo công thức:
Vấn đề cần giải quyết ở đây là ma trận tương quan C=A.AT có kích thước N2 Với N=180x200=36000, khối lượng tính toán sẽ rất lớn Do đó để tính được các eigenface
mà không cần tính cả ma trận C, người ta đưa ra phương pháp tính nhanh dựa vào vector riêng và giá trị riêng của ma trận L=AT.A có kích thước MxM với M là số ảnh đầu vào
Ta có thể chứng minh như sau: gọi vi, µi lần lượt là vector riêng và giá trị riêng của ma trận L:
Nhân cả 2 vế với A ta có:
Ta thấy A.vi chính là vector riêng của C=A.AT ứng với giá trị riêng µi
Đánh giá phương pháp PCA
PCA là một phương pháp làm sao để giảm số chiều của 1 tập vector ảnh mà vẫn đảm bảo được tối đa các thông tin quan trọng của ảnh đấy
Ưu điểm:
+ Lấy được các đặc tính tiêu biểu của đối tượng cần nhận dạng mà không cần xác định đặc tính và mối quan hệ giữa các đặc tính này
+ Thuật toán có thể thực hiện tốt với các hình ảnh có độ phân giải cao
+ Có thể kết hợp được với các phương pháp khác như mạng Norton
Trang 25Nhiệm vụ chính của phương pháp là tính sự biến thiên giữa các ảnh của những người khác nhau và tính sự biến thiên giữa các ảnh của cùng một người, sau đó tìm một phép biến đổi để làm cực đại tỉ số của hai sự biến thiên trên Nghĩa là, tập ảnh huấn luyện sẽ được biến đổi sang một không gian mới sao cho sự khác nhau (khoảng cách) giữa các ảnh của những người khác nhau được tăng lên tối đa, còn sự giống nhau giữa các ảnh của cùng một người được làm cực tiểu
Hình dưới là một ví dụ minh họa trực quan ý nghĩa của phép biến đổi này Hình 1.8 (a) là một cách biến đổi không tốt khi các hình chiếu của các điểm thuộc hai lớp vẫn lẫn lộn với nhau; Hình 1.8 (b) là một cách biến đổi khá tốt khi hình chiếu của các điểm thuộc cùng một lớp gần nhau, còn hình chiếu của các điểm khác lớp xa nhau
Hình 1.7 Ví dụ minh họa LDA
Trang 26 Nội dung thuật toán
Thông thường trong phương pháp LDA, sự phân bố ngoại và sự phân bố nội được dùng làm tiêu chí để phân lớp Ma trận phân bố nội được tính như sau:
Trong đó:
Trong đó là giá trị trung bình của tất cả các lớp
Không gian mới của LDA được hình thành từ tập vector W = [W1, , Wd], thỏa mãn:
Ma trận phân bố nội Sw biểu diễn sự phân bố gần nhau của các ảnh trong các lớp
và ma trận phân bố ngoại Sb mô tả sự tách biệt của các lớp Khi các ảnh được chiếu lên các vector của W, các ảnh sẽ được phân bố gần nhau trong mỗi lớp và sẽ được tách biệt giữa các lớp, càng nhiều càng tốt Nói cách khác, các vector này cực tiểu hóa mẫu số và cực đại hóa tử số của công thức trên Nếu ma trận Sw là khả nghịch, tỉ số ở công thức trên sẽ đạt cực đại khi các vector của W là các vector riêng của W là các vector riêng của Đối với bài toán nhận dạng khuôn mặt, ma trận Sw thường không khả nghịch,
vì số lượng ảnh nhỏ hơn rất nhiều so với số chiều biểu diễn ảnh Có nhiều phương pháp
khác nhau để giải quyết vấn đề của LDA như phương pháp giả nghịch đảo, phương pháp không gian con hoặc phương pháp không gian null
Trang 27 Đánh giá phương pháp LDA
LDA là một phương pháp làm sao để giảm số chiều của 1 tập vector ảnh, nhưng phải giữ càng nhiều các thông tin phân biệt giữa các lớp càng tốt
- Các đặc điểm trực quan được sử dụng dựa trên biến đổi Gabor wavelet Biến đổi này đã được chứng minh là một mô hình tốt về xử lý hình ảnh trong não bộ con người, chính xác hơn là các tế bào đơn giản trong vỏ não thị giác chính
- Các thuật toán tự so khớp: Đây là một phiên bản của thuật toán liên kết động phù hợp (DLM) do Wiskott và von der Malsburg đề xuất năm 1996, đó là một mô hình của nhận dạng các đối tượng bất biến trong não
Các đối tượng trực quan trong EGM được biểu diễn như là một đồ thị có nhãn, nơi các nút đại diện cho đặc điểm riêng biệt dựa trên Gabor wavelet và các cạnh đại diện cho khoảng cách giữa các địa điểm nút trên một hình ảnh Vì vậy, một hình ảnh của một đối tượng được biểu diễn như là một tập hợp đặc điểm riêng trong một tổ chức không gian nhất định Nếu một đối tượng mới trong một hình ảnh được nhận dạng, các đồ thị được dán nhãn của các đối tượng được lưu trữ (vì vậy được gọi là đồ thị mô hình) và được so khớp trên hình ảnh Đối với mỗi đồ thị mô hình, các vị trí của các nút trong các hình ảnh được tối ưu hóa Nhờ vậy mà đặc điểm riêng biệt của hình ảnh phù hợp với đặc điểm riêng biệt của mô hình và khoảng cách giữa các vị trí phù hợp với khoảng cách giữa các nút của mô hình Đồ thị mô hình phù hợp nhất với đối tượng được nhận dạng
và với các vị trí nút của nó trong hình ảnh, một đồ thị hình ảnh có thể được tạo ra
Elastic Bunch Graph Matching (EBGM) là một mở rộng của EGM phù hợp cho các lớp đối tượng có một cấu trúc phổ chung, chẳng hạn như những khuôn mặt trong tư thế giống hệt nhau Tất cả các trường hợp có thể của một lớp được biểu diễn bởi cùng một loại đồ thị Từ các đồ thị, một bó các đồ thị có cùng một cấu trúc được tạo ra với các nút đại diện cho kết cấu địa phương của bất kỳ đối tượng trong các lớp học (ví dụ:
Trang 28tất cả các biến thể của một con mắt bên trái) và các cạnh đại diện cho khoảng cách trung bình giữa các địa điểm nút (ví dụ: khoảng cách trung bình giữa hai mắt) Điều này cho phép tận dụng lợi thế của các tổ hợp của các đặc điểm riêng biệt đại diện cho các trường hợp của các lớp đối tượng không nhìn thấy trước Ví dụ, các kết cấu của mắt có thể được lấy từ một khuôn mặt và kết cấu của miệng từ mặt khác đại diện cho một khuôn mặt mới
mà chia sẻ các tính năng với hai gương mặt được lưu trữ Như vậy, một biểu đồ bó là một khái niệm trừu tượng đại diện cho lớp đối tượng chứ không phải là đối tượng cá nhân
Như vậy, phép biến đổi Gabor wavelet tạo ra một mô hình khuôn mặt dạng cấu trúc lưới đàn hồi liên kết động Như trên Hình 1.10, các nút trên lưới đàn hồi được gọi
là các Gabor Jet, được ký hiệu bởi các vòng tròn mô tả đặc điểm của khuôn mặt Đó là kết quả tích chập của hình ảnh đầu vào với một bộ lọc Gabor, được sử dụng để phát hiện
và trích xuất các các đặc trưng của khuôn mặt cho quá trình nhận dạng Phương pháp này có thể nhận được khuôn mặt ở mọi tư thế, nhưng phương pháp này khó thực hiện bởi nó đòi hỏi vị trí chính xác của các nút trên mô hình lưới
Hình 1.8 Mô hình lưới của các khuôn mặt khác nhau
Đánh giá phương pháp EBGM
EBGM là một phương pháp bắt nguồn từ sinh học, các đối tượng được biểu diễn như một đồ thị có nhãn, nơi các nút đại diện cho đặc điểm riêng biệt và cạnh đại diện cho khoảng cách giữa các điểm nút trên một hình ảnh
Ưu điểm:
+ Có độ chính xác cao hơn sơ với PCA và LDA Có thể áp dụng để nhận dạng hình ảnh khuôn mặt với nhiều đặc tính phi tuyến
+ Có thể áp dụng khi đặc tính của khuôn mặt thay đổi do ảnh hưởng của các yếu
tố như: điều kiện chiếu sang (ánh sang ngoài trời so với đèn huỳnh quang trong nhà), tư thế (đứng thẳng so với nghiêng) và cảm xúc khuôn mặt (cười so với giận dữ)
Trang 29Nhược điểm:
+ Khó thực hiện bởi nó đòi hỏi vị trí chính xác của các nút trên mô hình lưới
1.2.2 Cảm xúc của khuôn mặt
Trong đề tài này, tôi không đi xa quá về việc làm thế nào để nhận diện khuôn mặt
và đặc tính của khuôn mặt một cách chi tiết, mà chỉ mô tả khái quát và mô tả vài cảm xúc của khuôn mặt từ SDK RealSense đã tích hợp như bên dưới:
Tác động đầu tiên của trí tuệ nhân tạo mà chúng ta có thể dễ dàng nhận thấy chính
là lượng thất nghiệp tăng cao Nếu AI phát triển hoàn thiện với khả năng thay thế con người trong các công việc trí tuệ như chăm sóc sức khỏe, phục vụ, sản xuất theo dây chuyền tự động, công việc văn phòng Một chiếc máy tính sẽ có thể giải quyết công việc kế toán của tất cả nhân viên trong một công ty
Theo Bill Joy, người đồng sáng lập và Giám đốc khoa học của Sun Microsystems:
"Có một vấn đề rất lớn đối với xã hội loài người khi AI trở nên phổ biến, đó là chúng ta
sẽ bị lệ thuộc Khi AI trở nên hoàn thiện và thông minh hơn, chúng ta sẽ cho phép mình nghe theo những quyết định của máy móc, vì đơn giản là các cỗ máy luôn đưa ra quyết định chính xác hơn con người."
Trang 30Theo Andrew Maynard, nhà vật lý và là người giám đốc Trung tâm nghiên cứu rủi
ro khoa học tại đại học Michigan: "Khi AI kết hợp với công nghệ nano có thể là bước
tiến đột phá của khoa học, những cũng có thể là mối đe dọa lớn nhất đối với con người Trong khi Bộ quốc phòng Mỹ đang nghiên cứu dự án Autonomous Tactical Robot (EATR), trong đó các robot sẽ sử dụng công nghệ nano để hấp thụ năng lượng bằng những chất hữu cơ có thể là xác người Đó thực sự là mối đe dọa lớn nhất, khi các robot nano tự tạo ra năng lượng bằng cách ăn các chất hữu cơ từ cây cối và động vật, có thể
là cả con người Nghe có vẻ giống như trong các bộ phim viễn tưởng, nhưng đó là điều hoàn toàn có thể xảy ra Có lẽ chúng ta nên bắt đầu sợ ngay từ bây giờ."
1.3.2 Các bài toán điển hình áp dụng các phương pháp TTNT
Xử lý ngôn ngữ tự nhiên, Dịch tự động(dịch máy) và Chatterbot
Điều khiển phi tuyến và Robotics
Computer vision, Thực tại ảo và Xử lý ảnh
Lý thuyết trò chơi và Lập kế hoạch (Strategic planning)
Trò chơi TTNT và Computer game bot
Các lĩnh vực khác sử dụng phương pháp TTNT
Tự động hóa
Bio-inspired computing
Điều khiển học
Hệ thống thông minh lai
Agent thông minh
Điều khiển thông minh
1.3.3 Những trí tuệ nhân tạo mạnh nhất hiện nay
Trí tuệ nhân tạo (AI) đang giúp định hình thế giới theo cách tốt đẹp hơn, nhưng cũng có những lo ngại một ngày nào đó máy móc sẽ kiểm soát con người
Trang 31Những tên tuổi lớn đang đầu tư mạnh tay cho trí tuệ nhân tạo hiện nay gồm có Google, Facebook, Amazon, IBM, Microsoft và một số hãng khác Những hãng này đã lập ra một đối tác trí tuệ nhân tạo mới với trọng tâm nghiên cứu và định hình những hoạt động tốt nhất cho công nghệ AI
Dự án đối tác này sẽ tạo ra một diễn đàn mở về AI, nơi những người quan tâm có thể trao đổi, thảo luận, đồng thời tăng cường sự hiểu biết của cộng đồng về trí tuệ nhân tạo
Ngạc nhiên ở chỗ, Elon Musk - sáng lập SpaceX và đồng sáng lập Tesla Motors - cùng với PayPal không tham gia đối tác này Apple cũng vậy
Năm 2014, Google mua lại công ty khởi nghiệp trí tuệ nhân tạo DeepMind với giá
400 triệu USD - vốn được xem là một trong những thương vụ mua bán lớn nhất trong lĩnh vực AI
Google DeepMind vừa xây dựng một dự án AI cho hệ thống tàu điện ngầm London, sử dụng mạng thần kinh để lưu trữ dữ liệu và truy vấn các thông tin nhằm giải quyết các sự cố phát sinh
Nhiệm vụ của dự án là giúp tìm ra những tuyến đường di chuyển nhanh nhất giữa các trạm dừng để hành khách có thể đi lại nhanh hơn và thuận tiện hơn
Đầu năm vừa rồi, Google cũng ra mắt hệ thống học máy TensorFlow miễn phí cho tất cả mọi người Cơ chế học máy này có thể tìm thấy trong công nghệ nhận dạng thoại
Ngoài ra, công nghệ này còn được Facebook dùng để tạo các bản đồ chi tiết về dân
số và người truy cập Internet toàn cầu Mục đích là giúp hãng này triển khai dự án phổ cập Internet tới các vùng xa xôi, hẻo lánh
Facebook cũng có công nghệ AI học sâu dùng để nghiên cứu hành vi người dùng Năm 2010, hãng từng giới thiệu công nghệ nhận dạng khuôn mặt giúp xác định danh tính của người trong ảnh đăng trên mạng xã hội
Năm 2013, "ông trùm" Mark Zuckerberg còn lập riêng một phòng thí nghiệm chuyên về trí tuệ nhân tạo Nói chung, Facebook là gương mặt khá quen thuộc trong lĩnh vực AI
Trang 32Apple
Đầu năm vừa rồi, hãng Quả táo đã mua công ty khởi nghiệp về trí tuệ nhân tạo Emotient nhưng chưa rõ kế hoạch triển khai các dự án liên quan sẽ như thế nào Có vẻ như Apple sẽ tập trung vào công nghệ nhận diện khuôn mặt và phản ứng của khách hàng với quảng cáo
Trước đó vào tháng 10/2015, Apple mua công ty trí tuệ nhân tạo Vocal IQ nhằm phát triển Siri lên mức cao hơn, đồng thời sử dụng phần mềm trí tuệ nhân tạo giọng nói của Vocal IQ
Vocal IQ chính là tác giả của công nghệ kiểm soát giọng nói trên các mẫu xe của General Motors, cho phép người lái có thể bật hoặc tắt những chức năng nhất định trên
xe hơi bằng lệnh thoại
Elon Musk
Elon Musk đang hợp sức với nhiều hãng công nghệ khổng lồ như Amazon, LinkedIn và PayPal phát triển trí tuệ nhân tạo nguồn mở Dự án phi lợi nhuận này giúp phát triển các trí tuệ nhân tạo phục vụ cho lợi ích của con người
Cùng với "ông hoàng vật lý" Stephen Hawking, Elon Musk là người lo lắng về nguy cơ của những dạng thức trí tuệ nhân tạo không được kiểm soát
Công nghệ nhận dạng khuôn mặt này cho phép các bức ảnh có thể được chỉnh sửa dựa trên tâm trạng của người trong ảnh
IBM
Từng nổi tiếng với máy tính Watson (hệ thống máy tính có khả năng trả lời câu hỏi theo ngôn ngữ tự nhiên), IBM sử dụng trí tuệ nhân tạo để phân tích bối cảnh và ý nghĩa ẩn sau các bức ảnh, video, tin nhắn và lời thoại
Năm 2011, Watson thắng giải Jeopardy, một chương trình đố vui kiến thức
truyền hình tại Mỹ, xuất sắc vượt qua các đối thủ con người khác
IBM còn hợp tác với nhà sản xuất chip đồ họa Nvidia để nâng cấp Watson mạnh gấp 1,7 lần so với trước đây
Hiện IBM đang phát triển một ứng dụng trợ lý giảng dạy giúp soạn ra bài học dựa trên tài liệu được cung cấp Thử nghiệm này sẽ được thực hiện tại New York trong năm tới