TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN VIỆN CÔNG NGHỆ THÔNG TIN VÀ KINH TẾ SỐ ĐỀ ÁN CHUYÊN NGÀNH ĐỀ TÀI Nghiên cứu về trí tuệ nhân tạo và ứng dụng trí tuệ nhân tạo trong xây dựng Chatbot Sinh viên thực h[.]
Trang 1TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN VIỆN CÔNG NGHỆ THÔNG TIN VÀ KINH TẾ SỐ
ĐỀ ÁN CHUYÊN NGÀNH
ĐỀ TÀI:
Nghiên cứu về trí tuệ nhân tạo và ứng dụng trí tuệ nhân tạo trong xây
dựng Chatbot
Sinh viên thực hiện : Vũ Quốc Tuấn
Hà Nội, 2019
Trang 2Mục lục
Nói lời đầu 3
1 Lý do chọn đề tài 3
2 Mục tiêu của đề tài 3
3 Đối tượng và phạm vi nghiên cứu 3
4 Phương pháp nghiên cứu 3
5 Kết cấu đề tài 3
Chương 1: Cơ sở lý thuyết về trí tuệ nhân tạo 5
1.1 Khái niệm về trí tuệ nhân tạo 5
1.2 Lịch sử hình thành và phát triển của AI 5
1.3 Các lĩnh vực của AI 6
Chương 2: Tổng quan về các ứng dụng của trí tuệ nhân tạo trên thế giới và ở Việt Nam hiện nay 8
2.1 Sự ứng dụng và nghiên cứu trí tuệ nhân tạo của các tập đoàn lớn trên thế giới 8
2.2 Sự ứng dụng và nghiên cứu trí tuệ nhân tạo tại Việt Nam 13
Chương 3: Ứng dụng trí tuệ nhân tạo trong xây dựng Chatbot 15
3.1 Tổng quan về Chatbot 15
3.2 Mô tả bài toán 18
3.3 Kết luận 19
Tài liệu tham khảo 20
Trang 3Nói lời đầu
1 Lý do chọn đề tài
Ngày nay, cách mạng công nghiệp 4.0 ngày càng phát triển và được áp dụng rộng rãi vào trong cuộc sống Trong sự phát triển của cách mạng công nghiệp này, lĩnh vực kỹ thuật số đã và đang có những bước phát triển lớn, tạo những thay đổi to lớn Bên cạnh các công nghệ vạn vật kết nối (Internet Of Things) và dữ liệu lớn (Big Data), ngành công nghệ đang được mọi người quan tâm là trí tuệ nhân tạo (Artificial Intelligence), một trong những lĩnh vực được quan tâm nhất của các doanh nghiệp và tập đoàn lớn trên thế giới, thậm chí các công ty, tập đoàn này còn không tiếc bỏ ra số tiền lớn nghiên cứu, phát triển và ứng dụng AI Ở Việt Nam ngành nghiên cứu về trí tuệ nhân tạo (AI) đã không còn quá mới nhưng thực sự vẫn chưa có quá nhiều thành tựu nổi bật, cũng chưa được nhiều người hoạt động trong lĩnh vực công nghệ có thể hiểu rõ về AI, khi mà thế giới đã có những thành tựu, có những bước tiến dài trong lĩnh vực này Cũng chính vì những lý do trên nên
em đã quyết định lựa chọn đề tài “Tìm hiểu, nghiên cứu về AI và các ứng dụng AI hiện nay” làm đề tài đề án môn học
2 Mục tiêu của đề tài
Hiểu rõ một số khái niệm cơ bản của trí tuệ nhân tạo, kiến thức nền tảng nhập môn trí tuệ nhân tạo các phương pháp biểu diễn vấn đề, các phương pháp tìm kiếm, các phương pháp biểu diễn tri thức, các thuật toán suy diễn tự động, các phương pháp lập luận không chắc chắn
Áp dụng các kiến thức vào giải quyết các bài toán thực tế về xử lý các tương tác dịch vụ khách hàng Biết cách xây dựng một Chatbot đơn giản giúp hỗ trợ bài toán thực tế trên
3 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu: Kiến thức nền tảng, các khái niệm cơ bản trí tuệ nhân tạo, các phương pháp biểu diễn, phương pháp tìm kiếm, một số thuật toán
Phạm vi nghiên cứu: Ứng dụng trí tuệ nhân tạo xây dựng Chatbot
4 Phương pháp nghiên cứu
Phương pháp thu thập thông tin
5 Kết cấu đề tài
Trang 4Chương 1: Cơ sở lý thuyết về trí tuệ nhân tạo.
1.1Khái niệm trí tuệ nhân tạo
1.2Lịch sử hình thành và phát triển của trí tuệ nhân tạo
1.3Các lĩnh vực của trí tuệ nhân tạo
Chương 2: Tổng quan về các ứng dụng của trí tuệ nhân tạo trên thế giới
và ở Việt Nam hiện nay.
2.1Sự ứng dụng và nghiên cứu AI của các tập đoàn lớn trên thế giới 2.2Sự ứng dụng và nghiên cứu AI tại Việt Nam
Chương 3: Ứng dụng trí tuệ nhân tạo trong xây dựng Chatbot.
3.1Tổng quan về Chatbot
3.1.1 Khái niệm Chatbot 3.1.2 Các vấn đề liên quan 3.1.3 Vai trò của Chatbot 3.1.4 Ưu nhược điểm của Chatbot 3.2Mô tả bài toán Chatbot
3.2.1 Mô tả bài toán Chatbot 3.2.2 Thiết kế Chatbot
3.3Kết luận
Tài liệu tham khảo.
Trang 5Chương 1: Cơ sở lý thuyết về trí tuệ nhân tạo.
1.1Khái niệm về trí tuệ nhân tạo
Trí tuệ nhân tạo là trí thông minh của máy do con người tạo ra Ngay từ khi chiếc máy tính điện tử đầu tiên ra đời, các nhà khoa học máy tính đã hướng đến phát hiển hệ thống máy tính (gồm cả phần cứng và phần mềm) sao cho nó có khả năng thông minh như loài người
Mặc dù cho đến nay, ước mơ này vẫn còn xa mới thành hiện thực, tuy vậy những thành tựu đạt được cũng không hề nhỏ: chúng ta đã làm được các hệ thống (phần mềm chơi cờ vua chạy trên siêu máy tinh GeneBlue) có thể thắng được vua
cờ thế giới; chúng ta đã làm được các phần mềm có thể chứng minh được các bài toán hình học; v.v Hay nói cách khác, trong một số lĩnh vực, máy tính có thể thực hiện tốt hơn hoặc tương đương con người (tất nhiên không phải tất cả các lĩnh vực) Đó chính là các hệ thống thông minh Có nhiều cách tiếp cận để làm ra trí thông minh của máy (hay là trí tuệ nhân tạo), chẳng hạn là nghiên cứu cách bộ não người sản sinh ra trí thông minh của loài người như thế nào rồi ta bắt chước
nguyên lý đó, nhưng cũng có những cách khác sử dụng nguyên lý hoàn toàn khác với cách sản sinh ra trí thông minh của loài người mà vẫn làm ra cái máy thông minh như hoặc hơn người; cũng giống như máy bay hiện nay bay tốt hơn con chim
do nó có cơ chế bay không phải là giống như cơ chế bay của con chim
Như vậy, trí tuệ nhân tạo ở đây là nói đến khả năng của máy khi thực hiện các công việc mà con người thường phải xử lý; và khi dáng vẻ ứng xử hoặc kết quả thực hiện của máy là tốt hơn hoặc tương đương với con người thì ta gọi đó là máy thông minh hay máy đó có trí thông minh Hay nói cách khác, đánh giá sự thông minh của máy không phải dựa trên nguyên lý nó thực hiện nhiệm vụ đó có giống cách con người thực hiện hay không mà dựa trên kết quả hoặc dáng vẻ ứng xử bên ngoài của nó có giống với kết quả hoặc dáng vẻ ứng xử của con người hay không 1.2Lịch sử hình thành và phát triển của trí tuệ nhân tạo
Vào năm 1943, Warren McCulioch và Walter Pitts bắt đầu thực hiện nghiên cứu ba cơ sở lý thuyết cơ bản: triết học cơ bản và chức năng của các noron thần kinh; phân tích các mệnh đề logic; và lý thuyết dự đoán của Turing Các tác giả đã nghiên cứu đề xuât mô hình noron nhân tạo, mỗi noron đặc trưng bởi hai trạng thái
“bật”, “tắt” và phát hiện mạng noron có khả năng học
Thuật ngữ “Trí tuệ nhân tạo” (Artificial Intelligence - AI) được thiết lập bởi John McCarthy tại Hội thảo đầu tiên về chủ đề này vào mùa hè năm 1956 Đồng
Trang 6thời, ông cũng đề xuất ngôn ngữ lập trình Lisp – một trong những ngôn ngữ lập trình hàm tiêu biểu, được sử dụng trong lĩnh vực AI Sau đó, Alan Turing đưa ra
"Turing test" như là một phương pháp kiểm chứng hành vi thông minh
Thập kỷ 60, 70 Joel Moses viết chương trình Macsyma - chương trình toán học
sử dụng cơ sở tri thức đầu tiên thành công Marvin Minsky và Seymour Papert đưa
ra các chứng minh đầu tiên về giới hạn của các mạng nơ-ron đơn giản Ngôn ngữ lập trình logic Prolog ra đời và được phát triển bởi Alain Colmerauer Ted
Shortliffe xây dựng thành công một số hệ chuyên gia đầu tiên trợ giúp chẩn đoán trong y học, các hệ thống này sử dụng ngôn ngữ luật để biểu diễn tri thức và suy diễn
Vào đầu những năm 1980, những nghiên cứu thành công liên quan đến AI như các hệ chuyên gia (expert systems) – một dạng của chương trình AI mô phỏng tri thức và các kỹ năng phân tích của một hoặc nhiều chuyên gia con người
Vào những năm 1990 và đầu thế kỷ 21, AI đã đạt được những thành tựu to lớn nhất, AI được áp dụng trong logic, khai phá dữ liệu, chẩn đoán y học và nhiều lĩnh vực ứng dụng khác trong công nghiệp Sự thành công dựa vào nhiều yếu tố: tăng khả năng tính toán của máy tính, tập trung giải quyết các bài toán con cụ thể, xây dựng các mối quan hệ giữa AI và các lĩnh vực khác giải quyết các bài toán tương
tự, và một sự chuyển giao mới của các nhà nghiên cứu cho các phương pháp toán học vững chắc và chuẩn khoa học chính xác
1.3Các lĩnh vực của trí tuệ nhân tạo
Lập luận, suy diễn tự động: Khái niệm lập luận (reasoning), và suy diễn
(reference) được sử dụng rất phổ biến trong lĩnh vực AI Lập luận là suy diễn logic, dùng để chỉ một tiến trình rút ra kết luận (tri thức mới) từ những giả thiết đã cho (được biểu diễn dưới dạng cơ sở tri thức) Như vậy, để thực hiện lập luận người ta cần có các phương pháp lưu trữ cơ sở tri thức và các thủ tục lập luận trên cơ sở tri thức đó
Biểu diễn tri thức: Muốn máy tính có thể lưu trữ và xử lý tri thức thì cần có các phương pháp biểu diễn tri thức Các phương pháp biểu diễn tri thức ở đây bao gồm các ngôn ngữ biểu diễn và các kỹ thuật xử lý tri thức Một ngôn ngữ biểu diễn tri thức được đánh giá là “tốt” nếu nó có tính biểu đạt cao và các tính hiệu quả của thuật toán lập luận trên ngôn ngữ đó Tính biểu đạt của ngôn ngữ thể hiện khả năng biểu diễn một phạm vi rộng lớn các thông tin trong một miền ứng dụng Tính hiệu quả của các thuật toán lập luận thể hiện chi phí về thời gian và không gian dành
Trang 7cho việc lập luận Tuy nhiên, hai yếu tố này dường như đối nghịch nhau, tức là nếu ngôn ngữ có tính biểu đạt cao thì thuật toán lập luận trên đó sẽ có độ phức tạp lớn (tính hiệu quả thấp) và ngược lại (ngôn ngữ đơn giản, có tính biểu đạt thấp thì thuật toán lập luận trên đó sẽ có hiệu quả cao) Do đó, một thách thức lớn trong lĩnh vực
AI là xây dựng các ngôn ngữ biểu diễn tri thức mà có thể cân bằng hai yếu tố này, tức là ngôn ngữ có tính biểu đạt đủ tốt (tùy theo từng ứng dụng) và có thể lập luận hiệu quả
Lập kế hoạch: khả năng suy ra các mục đích cần đạt được đối với các nhiệm vụ đưa ra, và xác định dãy các hành động cần thực hiện để đạt được mục đích đó Học máy: là một lĩnh vực nghiên cứu của AI đang được phát triển mạnh mẽ và
có nhiều ứng dụng trong các lĩnh vực khác nhau như khai phá dữ liệu, khám phá tri thức,…
Xử lý ngôn ngữ tự nhiên: là một nhánh của AI, tập trung vào các ứng dụng trên ngôn ngữ của con người Các ứng dụng trong nhận dạng tiếng nói, nhận dạng chữ viết, dịch tự động, tìm kiếm thông tin,…
Hệ chuyên gia: cung cấp các hệ thống có khả năng suy luận để đưa ra những kết luận Các hệ chuyên gia có khả năng xử lý lượng thông tin lớn và cung cấp các kết luận dựa trên những thông tin đó Có rất nhiều hệ chuyên gia nổi tiếng như các hệ chuyên gia y học MYCIN, đoán nhận cấu trúc phân tử t ừ công thức hóa học
DENDRAL, …
Robotics
Trang 8Chương 2: Tổng quan về các ứng dụng của trí tuệ nhân tạo trên thế giới và ở Việt Nam hiện nay.
2.1Sự ứng dụng và nghiên cứu trí tuệ nhân tạo của các tập đoàn lớn trên thế giới 2.1.1 SAP - AI để biến cơ sở dữ liệu thành Intel hữu ích
HANA là nền tảng đám mây của SAP mà các công ty sử dụng để quản lý cơ sở
dữ liệu thông tin mà họ đã thu thập Nói tóm lại, nó sao chép và nhập dữ liệu có cấu trúc, chẳng hạn như giao dịch bán hàng hoặc thông tin khách hàng, từ cơ sở dữ liệu quan hệ, ứng dụng và các nguồn khác
Nền tảng có thể được cài đặt để chạy tại cơ sở thông qua các máy chủ của công
ty hoặc qua đám mây HANA lấy thông tin được thu thập từ các điểm truy cập trên toàn doanh nghiệp, bao gồm cả máy tính để bàn và điện thoại di động, giao dịch tài chính, cảm biến và thiết bị tại các nhà máy sản xuất Nếu nhân viên bán hàng của bạn sử dụng điện thoại thông minh hoặc máy tính bảng của công ty trong lĩnh vực này để ghi lại các đơn đặt hàng, dữ liệu từ các giao dịch đó có thể được HANA phân tích và hiểu để phát hiện xu hướng và sự bất thường
Walmart đã sử dụng HANA để xử lý khối lượng hồ sơ giao dịch cao (công ty vận hành hơn 11.000 cửa hàng) trong vòng vài giây Tại một hội nghị do SAP tổ chức vào năm 2015, CIO Karenann Terrell khi đó đã mô tả lý do Walmart chọn sử dụng HANA để vận hành nhanh hơn và kiểm soát chi phí văn phòng bằng cách hợp nhất các quy trình và tài nguyên cần thiết để xử lý công việc
SAP nói rằng HANA thực hiện khác với các nền tảng có thể so sánh bằng cách lưu trữ dữ liệu sao chép trong RAM thay vì trên đĩa Điều đó cho phép truy cập dữ liệu theo thời gian thực để sử dụng với các ứng dụng và phân tích được xây dựng trên nền tảng HANA để ra quyết định nhanh hơn
Mục đích của HANA và các giải pháp học máy khác là đưa ra các quyết định dựa trên dữ liệu có khả năng được thông tin tốt hơn Các công ty vừa và nhỏ, không chỉ các doanh nghiệp có thể khám phá sử dụng loại công nghệ này trong các phân khúc kinh doanh khác nhau nếu giải pháp có thể phù hợp với ngân sách của
họ Điều này có thể được tìm thấy trong mọi tổ chức cho dù đó là về nhân sự, rủi
ro hay tiếp thị, theo ông Ronen Meiri, CTO cho DMWay, nhà cung cấp dịch vụ học máy cho các phân tích dự đoán
Những lợi ích dự kiến của việc sử dụng các nền tảng học máy cho kinh doanh thông minh bao gồm giảm chi phí cơ sở hạ tầng và hiệu quả hoạt động Trong một báo cáo được tài trợ bởi SAP, 10 tổ chức sử dụng HANA cho biết họ hy vọng sẽ
Trang 9nhận được trung bình năm năm, lợi tức đầu tư là 575% Họ cũng dự kiến lợi ích trung bình hàng năm là 19,27 triệu đô la cho mỗi tổ chức bằng cách sử dụng
HANA, so với đầu tư trung bình hàng năm là 2,41 triệu đô la trong năm năm International Data Corp, một công ty con của IDG, đã thực hiện khảo sát và đưa ra báo cáo thay mặt cho SAP
2.1.2 DOMO - AI dành cho bảng điều khiển doanh nghiệp
Domo là một công ty phần mềm quản lý doanh nghiệp đang phát triển nhanh chóng đã huy động được hơn 500 triệu đô la tài trợ, đã tạo ra một bảng điều khiển tập hợp thông tin để giúp các công ty đưa ra quyết định Bảng điều khiển dựa trên đám mây có thể mở rộng theo quy mô của công ty Do đó, nó có thể được sử dụng bởi các nhóm chỉ khoảng 50 hoặc bởi các doanh nghiệp lớn hơn nhiều Có hơn 400 trình kết nối phần mềm gốc cho phép Domo thu thập dữ liệu từ các ứng dụng của bên thứ ba, có thể được sử dụng để cung cấp thông tin chuyên sâu và cung cấp ngữ cảnh cho doanh nghiệp thông minh
Điều này mang lại cho các công ty sử dụng Domo một cách để lấy dữ liệu từ Salesforce, Square, Facebook, Shopify và nhiều ứng dụng khác mà họ sử dụng để hiểu rõ hơn về khách hàng, doanh số hoặc hàng tồn kho của sản phẩm Chẳng hạn, người dùng Domo là thương nhân có thể trích xuất dữ liệu từ phần mềm điểm bán hàng và thương mại điện tử Shopify của họ, được sử dụng để quản lý các cửa hàng trực tuyến Thông tin được trích xuất có thể được sử dụng để tạo báo cáo và phát hiện xu hướng trong thời gian thực, chẳng hạn như trong hiệu suất sản phẩm, có thể được chia sẻ cho bất kỳ thiết bị nào được sử dụng bởi công ty
Vào tháng 3, Domo đã công bố ông Roboto, một bộ các tính năng mới cho nền tảng dựa trên AI, học máy và phân tích dự đoán Kỳ vọng là để ông Roboto đưa ra các khuyến nghị và hiểu biết cho những người ra quyết định tại các công ty Khi các tính năng này được triển khai, dự kiến vào cuối mùa xuân năm 2017, nền tảng này được cho là sẽ đưa ra các cảnh báo và thông báo mới cho những thay đổi quan trọng, chẳng hạn như phát hiện sự bất thường hoặc các mẫu mới trong dữ liệu (tương tự như các phương pháp được sử dụng trong bảo mật mạng )
Việc phát hiện những thay đổi và mô hình này dự kiến sẽ thúc đẩy khía cạnh phân tích dự đoán của ông Roboto và giúp các công ty dự đoán lợi tức đầu tư để tiếp thị theo thời gian thực, dự báo khách hàng và dự báo bán hàng
Theo Domo, các công ty như MasterCard, Univision, eBay, Honest Co và SAB Miller sử dụng nền tảng của nó Phát thanh viên truyền hình Univision đưa ra một lời chứng thực về cách nó sử dụng Domo để cung cấp khả năng hiển thị nhiều hơn
Trang 10cho dữ liệu của chính họ, sau đó được sử dụng để thống nhất và tập trung các chiến dịch nhắm mục tiêu Univision cho biết họ sử dụng nền tảng Domo với các trình kết nối cho các ứng dụng như Google Analytics, Facebook và Adobe Analytics để nhận được nhiều giá trị hơn từ quảng cáo lập trình của nó Sau khi ra mắt Domo, chúng tôi đã có thể nhanh chóng tối ưu hóa và đạt được mức tăng trưởng 80% về năng suất trong quý đầu tiên, David cho biết David Katz, tổng giám đốc VP của Univision về doanh thu và hoạt động theo chương trình
2.1.3 Apptus - AI trong việc tăng cường bán hàng
Có rất nhiều cách để học máy để tăng cường các ứng dụng, bao gồm cả những cách từ Apptus , đưa ra các khuyến nghị về các hành động mà các công ty có thể thực hiện để tăng cường các kênh bán hàng của họ Apptus nói rằng họ chuyên về kết nối giữa ý định mua của khách hàng và việc thực hiện doanh thu của một công ty
Giải pháp Apptus eSales được thiết kế để, trong số các tính năng khác, tự động hóa việc bán hàng dựa trên sự hiểu biết dự đoán của người tiêu dùng Phần mềm kết hợp dữ liệu lớn và học máy để xác định sản phẩm nào có thể thu hút khách hàng tiềm năng khi họ tìm kiếm trực tuyến hoặc nhận đề xuất
Ví dụ: khi khách hàng ghé thăm một cửa hàng trực tuyến sử dụng Apptus
eSales và bắt đầu nhập cụm từ tìm kiếm để tra cứu sản phẩm, giải pháp học máy có thể dự đoán và tự động hiển thị các cụm từ tìm kiếm liên quan Nó cũng có thể hiển thị các sản phẩm liên quan đến các cụm từ tìm kiếm
Các công ty có quy mô khác nhau sử dụng Apptus, chẳng hạn như nhà bán sách
tự động Bokus.com ở Thụy Điển, theo lời chứng thực của nó có khoảng 30 nhân viên Bokus, người cần duy trì chi phí tối thiểu, nói rằng khai thác vào công nghệ
tự động để chuyển đổi khách hàng là một cách giúp đạt được mục tiêu đó Chẳng hạn, công ty thương mại điện tử báo cáo rằng doanh thu trung bình của khách hàng tăng 100% cho mỗi lần mở bản tin khuyến nghị được cá nhân hóa, kỹ thuật số Các nền tảng AI và máy học đang trở nên tốt hơn trong các nhiệm vụ dự đoán, chẳng hạn như xác định những gì khách hàng có thể muốn dựa trên thông tin mà
họ được cho ăn Trong một cuộc phỏng vấn nghiêm túc cho bài viết này, Nicholson
đã nói rằng học sâu, một tập hợp con của học máy, trong nhiều trường hợp đạt độ chính xác 96% trong việc diễn giải dữ liệu Đây là giới hạn trên của những gì con người có thể làm, ông chỉ ra