Tìm hiểu khái niệm Công nghệ AI viết tắt của Artifical Intelligence hoặc trí thông minh nhân tạo là công nghệ mô phỏ̉ng các quá trình suy nghĩ và học tập của con người cho máy móc, đặc
Trang 1TRƯỜNG ĐẠI HỌC ĐIỆN LỰC KHOA CÔNG NGHỆ THÔNG TIN
ĐỒ ÁN LẬP TRÌNH WEB NÂNG CAO
ĐỀ TÀI: Xây dựng chương trình Q&A của một cuộc hội
thoại Chatbot tiếng việt sử dụng BERT.
Trang 2TIEU LUAN MOI download : skknchat123@gmail.com
Trang 3PHIẾU CHẤM ĐIỂM Sinh viên thực hiện:
STT Họ và tên Chữ ký Nhiệm vụ
1 Nguyễn Văn Anh Mã SV: 19810310265
Trang 4LỜI MỞ ĐẦU
1 Lý do chọn đề tài
Từ lâu con người đã có suy nghĩ muốn tạo ra một cỗ máy có thể tự suy nghĩ và hành động Chính vì thế, trí tuệ nhân tạo (AI) trở thành một một lĩnh vực mới trong thời đại công nghệ thông tin ngày nay Các ngành nghề trong xã hội đang
có xu hướng xử dụng AI để khiến máy móc thông minh hơn Trong giải trí, trong y
tế, hay cả trong giáo dục, rất nhiều robot thông minh được tạo ra có thể thay thế con người dạy học, giúp đỡ người già, thực hiện các công đoạn trong công nghiệp,
Vì những ứng dụng hữu ích của nó, em xin trình bày đề tài” Xây dựng chương trình Q&A của một cuộc hội thoại Chatbot tiếng việt sử dụng BERT.”.Mong muốn
thông qua đề tài này, em sẽ có những cái nhìn cụ thể về AI, từ đó
mở rộng để nghiên cứu và phát triển thêm.
2 Mục tiêu và nhiệm vụ
-Mục tiêu:
+Tìm hiểu định nghĩa, lịch sử phát triển của trí tuệ nhân tạo
+Tìm hiểu cấu trúc, các thuật toán và cách hoạt động của AI
-Nhiệm vụ:
+Ứng dụng nghiên cứu để lập trình Q&A của một cuộc hội thoại chatbot tiếng việt sử dụng BERT
3 Đối tượng và phạm vi nghiêm cứu
- Đối tượng nghiên cứu: Lĩnh vực AI
-Phạm vi nghiên cứu: trong một cuộc hội thoại giữa người và máy
4 Phương pháp nghiên cứu -Nghiên cứu dựa trên:
+Tài liệu
+Tham khảo từ giáo viên hướng dẫn
+Thực hành viết mã trên máy tính bằng python
CHƯƠNG I: GIỚI THIỆU VỀ̀ AI
Trang 51.1 GIỚI THIỆU VỀ̀ AI
1.1.1 Tìm hiểu khái niệm
Công nghệ AI (viết tắt của Artifical Intelligence) hoặc trí thông minh nhân tạo là công nghệ mô phỏ̉ng các quá trình suy nghĩ và học tập của con
người cho máy móc, đặc biệt là các hệ thống máy tính Các quá trình này bao gồm việc học tập (thu thập thông tin và các quy tắc sử dụng thông tin), lập luận(sử dụng các quy tắc để đạt được kết luận gầ̀n đúng hoặc xác định), và tự sửa lỗi Các ứng dụng đặc biệt của AI bao gồm các hệ thống chuyên gia, nhận dạngtiếng nói và thị giác máy tính (nhận diện khuôn mặt, vật thể hoặc chữ viết)
Định nghĩa trí tuệ nhân tạo: (AI: Artificial Intelligence) có thể được địnhnghĩa như một ngành của khoa học máy tính liên quan đến việc tự động hóa cáchành vi thông minh AI là một bộ phận của khoa học máy tính và do đó nó phảiđược đặt trên những nguyên lý lý thuyết vững chắc, có khả năng ứng dụngđược của lĩnh vực này
Khái niệm về công nghệ AI xuất hiện đầ̀u tiên bởi John McCarthy, một nhà khoa học máy tính Mỹ, vào năm 1956 tại Hội nghị The Dartmouth Ngày nay, công nghệ AI là một thuật ngữ bao gồm tất cả mọi thứ từ quá trình tự độnghoá robot đến người máy thực tế
Công nghệ AI gầ̀n đây trở nên nổi tiếng, nhận được sự quan tâm của
nhiều người là nhờ Dữ liệu lớn (Big Data), mối quan tâm của các doanh nghiệp
về tầ̀m quan trọng của dữ liệu cùng với công nghệ phầ̀n cứng đã phát triển
mạnh mẽ hơn, cho phé́p xử lý công nghệ AI với tốc độ nhanh hơn bao giờ hết
Ở thời điểm hiện tại, Thuật ngữ này thường dùng để nói đến các MÁY TÍNH có mục đích không nhất định và ngành khoa học nghiên cứu về các lý thuyết
và ứng dụng của trí tuệ nhân tạo Tức là mỗi loại trí tuệ nhân tạo hiện nay đang dừng lại ở mức độ những máy tính hoặc siêu máy tính dùng để xử lý một loại công việc nào đó như điều khiển một ngôi nhà, nghiên cứu nhận diện hình ảnh, xử lý dữ liệu của bệnh nhân để đưa ra phác đồ điều trị, xử lý dữ liệu để tự học hỏ̉i, khả năng trả lờicác câu hỏ̉i về chẩn đoán bệnh, trả lời khách hàng về các sản phẩm của một công ty,
AI là một bộ phận của khoa học máy tính và do đó nó phải được đặt trênnhững nguyên lý lý thuyết vững chắc
Nói nôm na cho dễ hiểu: đó là trí tuệ của máy móc được tạo ra bởi con người Trí tuệ này có thể tư duy, suy nghĩ, học hỏ̉i, như trí tuệ con người
Xử lý dữ liệu ở mức rộng lớn hơn, quy mô hơn, hệ thống, khoa học và nhanh hơn so với con người
Trí tuệ nhân tạo mang lại rất nhiều giá trị cho cuộc sống loài người, nhưng cũng tiềm ẩn những nguy cơ Rất nhiều chuyên gia lo lắng rằng khi trí tuệ nhân tạo
Trang 6đạt tới 1 ngưỡng tiến hóa nào đó thì đó cũng là thời điểm loài người bị tận diệt.Rất nhiều các bộ phim đã khai thác đề tài này với nhiều góc nhìn, nhưng qua
đó đều muốn cảnh báo loài người về mối nguy đặc biệt này
1.1.2 Lịch sử phát triển
Thực ra nguồn gốc ra đời trí tuệ nhân tạo AI không hề sớm như đã nói,nhưng nó là thành quả tất yếu của sự phát triển khoa học và công nghệ, là giảipháp giải quyết những bài toán khó của sự phát triển loài người trong tương lai.Dưới đây chúng ta cùng điểm lại những cột mốc của lịch sử phát triển trí tuệnhân tạo AI
Ngày nay, việc tiếp tục nghiên cứu và cải tiến trí tuệ nhân tạo AI về cáccông nghệ nền tảng đã thể hiện rõ trong các kỹ năng tự động hóa và lý luận cóthể được tích hợp trong điện thoại, máy tính và máy móc… Trí tuệ nhân tạo AItheo cách nào đang trở thành một thực tế nền tảng của thế giới hiện nay
Nghiên cứu lịch sử trí tuệ nhân tạo AI sớm vào những năm thập niên 60
đã khám phá các vấn đề mà công nghệ này có thể giải quyết Vào những năm
1960, Bộ Quốc phò̀ng Hoa Kỳ đã quan tâm đến loại công việc này và bắt đầ̀uđào tạo máy tính để bắt chước lý luận cơ bản của con người Ví dụ, Cơ quan Dự
án Nghiên cứu Quốc phò̀ng Tiên tiến (DARPA) đã hoàn thành các dự án lậpbản đồ đường phố vào những năm 1970 Và DARPA đã sản xuất trợ lý cá nhânthông minh vào năm 2003…
Công việc ban đầ̀u này đã mở đường cho tự động hóa và lý luận chínhthức mà chúng ta thấy trong các máy tính ngày nay, bao gồm các hệ thống hỗtrợ quyết định và hệ thống tìm kiếm thông minh có thể được thiết kế để bổ sung
và tăng cường khả năng của con người
1943
Warren McCullough và Walter Pitts xuất bản cuốn “A Logical Calculus
of Ideas Immanent in Nervous Activity”, dịch ra là “Một tính toán logic của những ý tưởng tiềm ẩn trong hoạt động thầ̀n kinh” Bài viết đề xuất
mô hình toán học đầ̀u tiên để xây dựng một mạng lưới thầ̀n kinh
1949
Trong cuốn sách “The Organization of Behavior: A Neuropsychological
Theory”- Tổ chức hành vi: Một lý thuyết thần kinh học,Donald Hebb đề
xuất lý thuyết về các hệ thống con đường thầ̀n kinh được tạo ra từ các kếtnối giữa các tế bào thầ̀n kinh trở nên mạnh mẽ hơn
1950
Trang 7Alan Turing xuất bản “Computing Machinery and Intelligence” – Máy tính và trí thông minh, đề xuất Thử nghiệm Turing, một phương pháp để xác định xem một máy tính có thông minh hay không.
Alan Turing và Phé́p thử Turing (1950)
Đại học Harvard Marvin Minsky và Dean Edmonds xây dựng SNARC, máy tính mạng thầ̀n kinh đầ̀u tiên
Claude Shannon xuất bản bài báo “Lập trình máy tính để chơi cờ”
Isaac Asimov xuất bản “Ba định luật về robot”
Trang 9Hội nghị Dartmouth với sự dẫn đầ̀u bởi John McCarthy
Allen Newell và Herbert Simon trình diễn Nhà lý luận logic (LT),
chương trình lý luận đầ̀u tiên
1958
John McCarthy phát triển ngôn ngữ lập trình AI Lisp và xuất bản bài báo
“Programs with Common Sense” Bài viết đã đề xuất nhà tư vấn giả
thuyết, một hệ thống AI hoàn chỉ̉nh với khả năng học hỏ̉i kinh nghiệm hiệu quả như con người
1959
Allen Newell, Herbert Simon và JC Shaw giải quyết vấn đề chung (GPS),một chương trình được thiết kế để bắt chước giải quyết vấn đề của con người
Herbert Gelernter phát triển chương trình Định lý hình học
Arthur Samuel đồng xu với thuật ngữ học máy khi cò̀n ở IBM
John McCarthy và Marvin Minsky đã tìm thấy Dự án Trí tuệ nhân tạo MIT
1963
John McCarthy bắt đầ̀u Phò̀ng thí nghiệm AI tại Stanford
Trang 10Báo cáo của Ủy ban Tư vấn xử lý ngôn ngữ tự động (ALPAC) của chính phủ Hoa Kỳ nêu chi tiết về sự thiếu tiến bộ trong nghiên cứu dịch máy, một sáng kiến lớn của chiến tranh lạnh với lời hứa dịch tự động tiếng Nga Báo cáo ALPAC dẫn đến việc hủy bỏ̉ tất cả các dự án MT do chính phủ tài trợ
1969
Các hệ thống chuyên gia thành công đầ̀u tiên được phát triển trong
DENDRAL, một chương trình XX và MYCIN, được thiết kế để chẩn đoán nhiễm trùng máu, được tạo ra tại Stanford
sự bùng nổ đầ̀u tư vào các hệ thống chuyên gia sẽ tồn tại trong phầ̀n lớn thập kỷ, kết thúc hiệu quả “Mùa đông AI” đầ̀u tiên
1982
Bộ Thương mại Quốc tế và Công nghiệp Nhật Bản khởi động dự án Hệthống máy tính thế hệ thứ năm đầ̀y tham vọng Mục tiêu của FGCS là
Trang 11phát triển hiệu năng giống như siêu máy tính và một nền tảng để phát triển trí tuệ nhân tạo AI.
1983
Đáp lại FGCS của Nhật Bản, chính phủ Hoa Kỳ khởi động Sáng kiến điện toán chiến lược để cung cấp nghiên cứu được tài trợ bởi DARPA trong điện toán tiên tiến và trí tuệ nhân tạo
1985
Các công ty đang chi hơn một tỷ đô la một năm cho các hệ thống chuyên gia và toàn bộ ngành công nghiệp được gọi là thị trường máy Lisp mọc lên để hỗ trợ họ Các công ty như Symbolics và Lisp Machines Inc xây dựng các máy tính chuyên dụng để chạy trên ngôn ngữ lập trình AI Lisp
Trang 12Lực lượng Hoa Kỳ triển khai DART, một công cụ lập kế hoạch và lập kế hoạch hậu cầ̀n tự động, trong Chiến tranh vùng Vịnh
2005
STANLEY, một chiếc xe tự lái, chiến thắng DARPA Grand Challenge
Quân đội Hoa Kỳ bắt đầ̀u đầ̀u tư vào các robot tự hành như “Big Dog” của Boston Dynamic và “PackBot” của iRobot
2008
Google tạo ra những bước đột phá trong nhận dạng giọng nói và giới
thiệu tính năng này trong ứng dụng iPhone
2011
Watson của IBM tuyên bố cạnh tranh về Jeopardy!.
2012
Trang 13Andrew Ng, người sáng lập dự án Google Brain Deep Learning, cung cấpmột mạng lưới thầ̀n kinh bằng cách sử dụng thuật toán 10 triệu video YouTube dưới dạng tập huấn luyện Mạng lưới thầ̀n kinh đã học cách nhận ra một con mèo mà không được cho biết con mèo là gì
1.1.3 Ứng dụng của AI
1 AI trong chăm sóc sức khỏe
– Ứng dụng nổi bật của trí tuệ nhân tạo AI là cải thiện sức khỏ̉e của con người
và giảm chi phí Các bệnh viện đang áp dụng máy để chẩn đoán tốt hơn vànhanh hơn con người Một trong những biết công nghệ tốt nhất chăm sóc sứckhỏ̉e là IBM Watson Nó có thể hiểu ngôn ngữ tự nhiên và có khả năng trả lờicác câu hỏ̉i Hệ thống khai thác dữ liệu bệnh nhân và các nguồn dữ liệu có sẵnkhác để tạo thành một giả thuyết, sau đó đưa ra một lược đồ chấm điểm tin cậy.– Các ứng dụng AI khác bao gồm chatbot , chương trình máy tính được sử dụngtrực tuyến để trả lời các câu hỏ̉i và hỗ trợ khách hàng, giúp sắp xếp các cuộchẹn theo dõi hoặc hỗ trợ bệnh nhân thông qua quy trình thanh toán và trợ lý sứckhỏ̉e ảo cung cấp phản hồi y tế cơ bản
2 AI trong kinh doanh
– Tự động hóa quá trình robot đang được áp dụng cho các công việc có tính chất lặp đi lặp lại
– Các thuật toán được tích hợp vào các nền tảng phân tích và CRM để khám phá thông tin về cách phục vụ khách hàng tốt hơn
– Chatbots đã được kết hợp vào các trang web để cung cấp dịch vụ ngay lập tứccho khách hàng
3 AI trong giáo dục
Trang 14AI có thể tự động hóa việc chấm điểm, giúp các giáo viên có thêm thờigian AI có thể đánh giá năng lực và quản lý sinh viên Gia sư AI có thể cungcấp hỗ trợ cho sinh viên, đảm bảo họ hoàn thành đúng theo giáo trình từ trước.Thậm AI có thể thay thế một số giáo viên.
6 AI trong sản xuất
Đây là một lĩnh vực đã đi đầ̀u trong việc kết hợp robot vào quy trình làmviệc Robot công nghiệp được sử dụng để thực hiện các nhiệm vụ đơn lẻ và giảiphóng sức lao động của con người
1.1.4 Các lĩnh vực nghiên cứu của AI
Trí tuệ con người (Human Intelligence): Cho đến nay có hai khái niệm về trí
tuệ con người được chấp nhận và sử dụng nhiều nhất, đó là:
Khái niệm trí tuệ theo quan điểm của Turing
“Trí tuệ là những gì có thể đánh giá được thông qua các trắc nghiệm thông minh”
Khái niệm trí tuệ đưa ra trong tụ điển bách khoa toàn
thư: “Trí tuệ là khả năng:
Phản ứng một cách thích hợp những tình huống mới thông qua hiệu chỉ̉nh hành vi một cách thích đáng
Hiểu rõ những mối liên hệ qua lại của các sự kiện của thế giới bên ngoài nhằm đưa ra những hành động phù hợp đạt tới một mục đích nào đó
Những nghiên cứu các chuyên gia tâm lý học nhận thức chỉ̉ ra rằng quá trình hoạt động trí tuệ của con người bao gồm 4 thao tác cơ bản:
Trang 152- Khả năng mô phỏ̉ng hành vi của con người.
3- Khả năng trừu tượng hoá, tổng quát hoá và suy diễn
4- Khả năng tự giải thích hành vi
5- Khả năng thích nghi tình huống mới kể cả thu nạp tri thức và dữ liệu
6- Khả năng xử lý các biểu diễn hình thức như các ký hiệu tượng trưng
7- Khả năng sử dụng tri thức heuristic
8- Khả năng xử lý các thông tin không đầ̀y đủ, không chính xác
1.2 NHỮNG VẤN ĐỀ̀ CHƯA ĐƯỢC GIẢI QUYẾT CỦA TRÍ TUỆ NHÂN TẠO
Những thành tựu nghiên cứu và ứng dụng các kỹ thuật Trí tuệ nhân tạo đãkhẳng định tính thực tiễn của các dự án xây dựng máy tính có khả năng suy
nghĩ Tuy vậy trong một số phạm vi, máy tính còn thua xa so với hoạt động
của hệ thần kinh con người:
Sự khác nhau trong hoạt động giữa máy tính và bộ não con người, điều nàythể hiện ưu thế của máy tính so với bộ não người vì khả năng tính toán rất lớn(nhất là trong các chương trình xử lý dữ liệu lớn)
Trang 16Xử lý song song: mặc dù công nghệ điện tử hiện đại cho phé́p xây dựng các
bộ đa xử lý, song máy tính không thể hoạt động song song như bộ não conngười được
Khả năng diễn giải: con người có thể xem xé́t cùng một vấn đề theo những
phương pháp khác nhau, từ đó diễn giải theo cách dễ hiểu nhất Ngược lại, sựlinh hoạt này không thể mô phỏ̉ng được trong các hệ thống Trí tuệ nhân tạo
Lôgic rời rạc và tính liên tục: một thách đố lớn với các hệ thống Trí tuệ
nhân tạo là khả năng kết hợp các phương pháp xử lý thông tin trong môi trườngliên tục với các thao tác xử lý thông tin rời rạc
Khả năng học: mặc dù hiện nay máy tính có nhiều tính năng cao nhưng
cũng không thể mô phỏ̉ng được hoàn toàn khả năng học giống bộ não conngười
Khả năng tự tổ chức: cho tới nay, người ta chưa thể tạo lập được các hệ
thống Trí tuệ nhân tạo có khả năng tự tổ chức, tự điều khiển hoạt động của nó
để thích nghi với môi trường
1.3 NHỮNG ƯU ĐIỂM VÀ̀ RỦI RO
1.3.1 Ưu điểm
Công nghệ Ai được nghiên cứu và phát triển sâu rộng Đặc biệt ở những nước phát triển, điều này càng được thực hiện nhiều hơn Trí tuệ nhân tạo có thể xử lý được khối lượng lớn công việc Với những dữ liệu lớn hơn, rắc rối hơn cũng như công nghệ Ai có thể đưa ra dự đoán chính xác hơn con người Điều này chính là một ưu điểm lớn của công nghệ Ai hiện nay
Thông thường khi xử lý một lượng dữ liệu lớn, con người chúng ta khó
có thể chính xác hoàn toàn Tuy nhiên điều này có thể thực hiện được bởi công nghệ trí tuệ nhân tạo Ngay cả những nhà khoa học cũng cảm thấy khó khăn khigiải quyết số lượng dữ liệu lớn AI sử dụng học máy để có thể lấy những dữ liệu
đó và nhanh chóng biến nó thành thông tin có thể thực hiện được Đây cũng chính là lời giải đáp cho ưu điểm của công nghệ AI là gì?
1.3.2 Rủi ro
Trang 17Rủi ro tự động hóa và thất nghiệp
Trong những thành công gầ̀n đây trong lĩnh vực máy học (Machine
Learning) và robot, dường như chỉ̉ cò̀n là vấn đề thời gian ngay cả những
công việc phức tạp đò̀i hỏ̉i trí thông minh cao cũng có thể được tiếp quản toàndiện bởi máy móc
Những người sẽ được hưởng lợi nhiều nhất từ công nghệ tiến bộ là ngườidân và quốc gia hiểu tận dụng các cơ hội công nghệ mới và các ảnh hưởng của
dữ liệu lớn trên mạng Trong khi ngành công nghiệp giải trí có cơ hội quan
trọng để phát triển giáo dục tốt hơn thông qua cá nhân hóa dạy học bằng AI và ứng dụng hóa tài liệu học tập, nó đồng thời cũng làm tăng nguy cơ tỷ lệ những người trẻ tuổi sẽ gặp khó khăn trong việc hoàn thành giáo dục của họ do nghiệnbệnh lý đối với các trò̀ chơi video và/hoặc internet
Tiến bộ công nghệ làm tăng năng suất xã hội, lầ̀n lượt nâng mức sống trung bình Nếu công việc được thực hiện bởi máy móc nhiều hơn, thời gian rảnh rỗi của con người dành cho giải trí và tự phát triển cho con người tang lên (một ưu điểm của sử dụng AI) Tuy nhiên, nhược điểm của công nghệ AI là tăng tự động hóa và gia tăng năng suất sẽ dẫn tới sự bất bình đẳng xã hội ngày càng tăng cũng như sự gia tăng về mức sống trung bình không có sự trùng hợp với sự gia tăng chất lượng trung bình của cuộc sống Các chuyên gia như kinh tếhọc MIT giáo sư Erik Brynjolfsson thậm chí lo lắng rằng công nghệ tiến bộ đe dọa làm cho cuộc sống của đa số của những người tồi tệ hơn
Rủi ro tình báo và siêu trí tuệ nói chung
Trí thông minh chung là khả năng đạt được mục tiêu chung trong các môi trường khác nhau Trí thông minh này có thể gây ra rủi ro (thảm khốc) nếu các mục tiêu của các máy móc không phù hợp với con người Nếu một trí thôngminh chung đạt đến một mức độ siêu phàm, nó trở thành một siêu trí tuệ; đó là, một thuật toán vượt trội so với trí thông minh của con người trong mọi cách, kể
cả sáng tạo khoa học, phổ biến, cảm giác, và năng lực xã hội Lưu ý rằng định nghĩa này để ngỏ̉ câu hỏ̉i về việc có hay không một siêu trí tuệ sẽ có ý thức
Trong trường hợp tốt nhất, một siêu trí tuệ có thể giải quyết vô số vấn đềcho nhân loại, giúp chúng ta vượt qua đạt được những thành tựu khoa học, đạođức, sinh thái và kinh tế trước những thách thức của tương lai Tuy nhiên, nếu các mục tiêu của một siêu trí tuệ không tương thích với sở thích của con người
và các sinh vật khác, AI sẽ mang tới một mối đe dọa tồn tại chưa từng có, có khả năng gây ra hậu quả nhiều hơn so với bất kỳ sự kiện nào trước đó trong vũtrụ