ĐỒ án lập TRÌNH WEB NÂNG CAO đề tài xây dựng chương trình qa của một cuộc hội thoại chatbot tiếng việt sử dụng BERT

Tìm hiểu khái niệm Công nghệ AI viết tắt của Artifical Intelligence hoặc trí thông minh nhân tạo là công nghệ mô phỏ̉ng các quá trình suy nghĩ và học tập của con người cho máy móc, đặc

Trang 1

TRƯỜNG ĐẠI HỌC ĐIỆN LỰC KHOA CÔNG NGHỆ THÔNG TIN

ĐỒ ÁN LẬP TRÌNH WEB NÂNG CAO

ĐỀ TÀI: Xây dựng chương trình Q&A của một cuộc hội

thoại Chatbot tiếng việt sử dụng BERT.

Trang 2

TIEU LUAN MOI download : skknchat123@gmail.com

Trang 3

PHIẾU CHẤM ĐIỂM Sinh viên thực hiện:

STT Họ và tên Chữ ký Nhiệm vụ

1 Nguyễn Văn Anh Mã SV: 19810310265

Trang 4

LỜI MỞ ĐẦU

1 Lý do chọn đề tài

Từ lâu con người đã có suy nghĩ muốn tạo ra một cỗ máy có thể tự suy nghĩ và hành động Chính vì thế, trí tuệ nhân tạo (AI) trở thành một một lĩnh vực mới trong thời đại công nghệ thông tin ngày nay Các ngành nghề trong xã hội đang

có xu hướng xử dụng AI để khiến máy móc thông minh hơn Trong giải trí, trong y

tế, hay cả trong giáo dục, rất nhiều robot thông minh được tạo ra có thể thay thế con người dạy học, giúp đỡ người già, thực hiện các công đoạn trong công nghiệp,

Vì những ứng dụng hữu ích của nó, em xin trình bày đề tài” Xây dựng chương trình Q&A của một cuộc hội thoại Chatbot tiếng việt sử dụng BERT.”.Mong muốn

thông qua đề tài này, em sẽ có những cái nhìn cụ thể về AI, từ đó

mở rộng để nghiên cứu và phát triển thêm.

2 Mục tiêu và nhiệm vụ

-Mục tiêu:

+Tìm hiểu định nghĩa, lịch sử phát triển của trí tuệ nhân tạo

+Tìm hiểu cấu trúc, các thuật toán và cách hoạt động của AI

-Nhiệm vụ:

+Ứng dụng nghiên cứu để lập trình Q&A của một cuộc hội thoại chatbot tiếng việt sử dụng BERT

3 Đối tượng và phạm vi nghiêm cứu

- Đối tượng nghiên cứu: Lĩnh vực AI

-Phạm vi nghiên cứu: trong một cuộc hội thoại giữa người và máy

4 Phương pháp nghiên cứu -Nghiên cứu dựa trên:

+Tài liệu

+Tham khảo từ giáo viên hướng dẫn

+Thực hành viết mã trên máy tính bằng python

CHƯƠNG I: GIỚI THIỆU VỀ̀ AI

Trang 5

1.1 GIỚI THIỆU VỀ̀ AI

1.1.1 Tìm hiểu khái niệm

Công nghệ AI (viết tắt của Artifical Intelligence) hoặc trí thông minh nhân tạo là công nghệ mô phỏ̉ng các quá trình suy nghĩ và học tập của con

người cho máy móc, đặc biệt là các hệ thống máy tính Các quá trình này bao gồm việc học tập (thu thập thông tin và các quy tắc sử dụng thông tin), lập luận(sử dụng các quy tắc để đạt được kết luận gầ̀n đúng hoặc xác định), và tự sửa lỗi Các ứng dụng đặc biệt của AI bao gồm các hệ thống chuyên gia, nhận dạngtiếng nói và thị giác máy tính (nhận diện khuôn mặt, vật thể hoặc chữ viết)

Định nghĩa trí tuệ nhân tạo: (AI: Artificial Intelligence) có thể được địnhnghĩa như một ngành của khoa học máy tính liên quan đến việc tự động hóa cáchành vi thông minh AI là một bộ phận của khoa học máy tính và do đó nó phảiđược đặt trên những nguyên lý lý thuyết vững chắc, có khả năng ứng dụngđược của lĩnh vực này

Khái niệm về công nghệ AI xuất hiện đầ̀u tiên bởi John McCarthy, một nhà khoa học máy tính Mỹ, vào năm 1956 tại Hội nghị The Dartmouth Ngày nay, công nghệ AI là một thuật ngữ bao gồm tất cả mọi thứ từ quá trình tự độnghoá robot đến người máy thực tế

Công nghệ AI gầ̀n đây trở nên nổi tiếng, nhận được sự quan tâm của

nhiều người là nhờ Dữ liệu lớn (Big Data), mối quan tâm của các doanh nghiệp

về tầ̀m quan trọng của dữ liệu cùng với công nghệ phầ̀n cứng đã phát triển

mạnh mẽ hơn, cho phé́p xử lý công nghệ AI với tốc độ nhanh hơn bao giờ hết

Ở thời điểm hiện tại, Thuật ngữ này thường dùng để nói đến các MÁY TÍNH có mục đích không nhất định và ngành khoa học nghiên cứu về các lý thuyết

và ứng dụng của trí tuệ nhân tạo Tức là mỗi loại trí tuệ nhân tạo hiện nay đang dừng lại ở mức độ những máy tính hoặc siêu máy tính dùng để xử lý một loại công việc nào đó như điều khiển một ngôi nhà, nghiên cứu nhận diện hình ảnh, xử lý dữ liệu của bệnh nhân để đưa ra phác đồ điều trị, xử lý dữ liệu để tự học hỏ̉i, khả năng trả lờicác câu hỏ̉i về chẩn đoán bệnh, trả lời khách hàng về các sản phẩm của một công ty,

AI là một bộ phận của khoa học máy tính và do đó nó phải được đặt trênnhững nguyên lý lý thuyết vững chắc

Nói nôm na cho dễ hiểu: đó là trí tuệ của máy móc được tạo ra bởi con người Trí tuệ này có thể tư duy, suy nghĩ, học hỏ̉i, như trí tuệ con người

Xử lý dữ liệu ở mức rộng lớn hơn, quy mô hơn, hệ thống, khoa học và nhanh hơn so với con người

Trí tuệ nhân tạo mang lại rất nhiều giá trị cho cuộc sống loài người, nhưng cũng tiềm ẩn những nguy cơ Rất nhiều chuyên gia lo lắng rằng khi trí tuệ nhân tạo

Trang 6

đạt tới 1 ngưỡng tiến hóa nào đó thì đó cũng là thời điểm loài người bị tận diệt.Rất nhiều các bộ phim đã khai thác đề tài này với nhiều góc nhìn, nhưng qua

đó đều muốn cảnh báo loài người về mối nguy đặc biệt này

1.1.2 Lịch sử phát triển

Thực ra nguồn gốc ra đời trí tuệ nhân tạo AI không hề sớm như đã nói,nhưng nó là thành quả tất yếu của sự phát triển khoa học và công nghệ, là giảipháp giải quyết những bài toán khó của sự phát triển loài người trong tương lai.Dưới đây chúng ta cùng điểm lại những cột mốc của lịch sử phát triển trí tuệnhân tạo AI

Ngày nay, việc tiếp tục nghiên cứu và cải tiến trí tuệ nhân tạo AI về cáccông nghệ nền tảng đã thể hiện rõ trong các kỹ năng tự động hóa và lý luận cóthể được tích hợp trong điện thoại, máy tính và máy móc… Trí tuệ nhân tạo AItheo cách nào đang trở thành một thực tế nền tảng của thế giới hiện nay

Nghiên cứu lịch sử trí tuệ nhân tạo AI sớm vào những năm thập niên 60

đã khám phá các vấn đề mà công nghệ này có thể giải quyết Vào những năm

1960, Bộ Quốc phò̀ng Hoa Kỳ đã quan tâm đến loại công việc này và bắt đầ̀uđào tạo máy tính để bắt chước lý luận cơ bản của con người Ví dụ, Cơ quan Dự

án Nghiên cứu Quốc phò̀ng Tiên tiến (DARPA) đã hoàn thành các dự án lậpbản đồ đường phố vào những năm 1970 Và DARPA đã sản xuất trợ lý cá nhânthông minh vào năm 2003…

Công việc ban đầ̀u này đã mở đường cho tự động hóa và lý luận chínhthức mà chúng ta thấy trong các máy tính ngày nay, bao gồm các hệ thống hỗtrợ quyết định và hệ thống tìm kiếm thông minh có thể được thiết kế để bổ sung

và tăng cường khả năng của con người

1943

Warren McCullough và Walter Pitts xuất bản cuốn “A Logical Calculus

of Ideas Immanent in Nervous Activity”, dịch ra là “Một tính toán logic của những ý tưởng tiềm ẩn trong hoạt động thầ̀n kinh” Bài viết đề xuất

mô hình toán học đầ̀u tiên để xây dựng một mạng lưới thầ̀n kinh

1949

Trong cuốn sách “The Organization of Behavior: A Neuropsychological

Theory”- Tổ chức hành vi: Một lý thuyết thần kinh học,Donald Hebb đề

xuất lý thuyết về các hệ thống con đường thầ̀n kinh được tạo ra từ các kếtnối giữa các tế bào thầ̀n kinh trở nên mạnh mẽ hơn

1950

Trang 7

Alan Turing xuất bản “Computing Machinery and Intelligence” – Máy tính và trí thông minh, đề xuất Thử nghiệm Turing, một phương pháp để xác định xem một máy tính có thông minh hay không.

Alan Turing và Phé́p thử Turing (1950)

Đại học Harvard Marvin Minsky và Dean Edmonds xây dựng SNARC, máy tính mạng thầ̀n kinh đầ̀u tiên

Claude Shannon xuất bản bài báo “Lập trình máy tính để chơi cờ”

Isaac Asimov xuất bản “Ba định luật về robot”

Trang 9

Hội nghị Dartmouth với sự dẫn đầ̀u bởi John McCarthy

Allen Newell và Herbert Simon trình diễn Nhà lý luận logic (LT),

chương trình lý luận đầ̀u tiên

1958

John McCarthy phát triển ngôn ngữ lập trình AI Lisp và xuất bản bài báo

“Programs with Common Sense” Bài viết đã đề xuất nhà tư vấn giả

thuyết, một hệ thống AI hoàn chỉ̉nh với khả năng học hỏ̉i kinh nghiệm hiệu quả như con người

1959

Allen Newell, Herbert Simon và JC Shaw giải quyết vấn đề chung (GPS),một chương trình được thiết kế để bắt chước giải quyết vấn đề của con người

Herbert Gelernter phát triển chương trình Định lý hình học

Arthur Samuel đồng xu với thuật ngữ học máy khi cò̀n ở IBM

John McCarthy và Marvin Minsky đã tìm thấy Dự án Trí tuệ nhân tạo MIT

1963

John McCarthy bắt đầ̀u Phò̀ng thí nghiệm AI tại Stanford

Trang 10

Báo cáo của Ủy ban Tư vấn xử lý ngôn ngữ tự động (ALPAC) của chính phủ Hoa Kỳ nêu chi tiết về sự thiếu tiến bộ trong nghiên cứu dịch máy, một sáng kiến lớn của chiến tranh lạnh với lời hứa dịch tự động tiếng Nga Báo cáo ALPAC dẫn đến việc hủy bỏ̉ tất cả các dự án MT do chính phủ tài trợ

1969

Các hệ thống chuyên gia thành công đầ̀u tiên được phát triển trong

DENDRAL, một chương trình XX và MYCIN, được thiết kế để chẩn đoán nhiễm trùng máu, được tạo ra tại Stanford

sự bùng nổ đầ̀u tư vào các hệ thống chuyên gia sẽ tồn tại trong phầ̀n lớn thập kỷ, kết thúc hiệu quả “Mùa đông AI” đầ̀u tiên

1982

Bộ Thương mại Quốc tế và Công nghiệp Nhật Bản khởi động dự án Hệthống máy tính thế hệ thứ năm đầ̀y tham vọng Mục tiêu của FGCS là

Trang 11

phát triển hiệu năng giống như siêu máy tính và một nền tảng để phát triển trí tuệ nhân tạo AI.

1983

Đáp lại FGCS của Nhật Bản, chính phủ Hoa Kỳ khởi động Sáng kiến điện toán chiến lược để cung cấp nghiên cứu được tài trợ bởi DARPA trong điện toán tiên tiến và trí tuệ nhân tạo

1985

Các công ty đang chi hơn một tỷ đô la một năm cho các hệ thống chuyên gia và toàn bộ ngành công nghiệp được gọi là thị trường máy Lisp mọc lên để hỗ trợ họ Các công ty như Symbolics và Lisp Machines Inc xây dựng các máy tính chuyên dụng để chạy trên ngôn ngữ lập trình AI Lisp

Trang 12

Lực lượng Hoa Kỳ triển khai DART, một công cụ lập kế hoạch và lập kế hoạch hậu cầ̀n tự động, trong Chiến tranh vùng Vịnh

2005

STANLEY, một chiếc xe tự lái, chiến thắng DARPA Grand Challenge

Quân đội Hoa Kỳ bắt đầ̀u đầ̀u tư vào các robot tự hành như “Big Dog” của Boston Dynamic và “PackBot” của iRobot

2008

Google tạo ra những bước đột phá trong nhận dạng giọng nói và giới

thiệu tính năng này trong ứng dụng iPhone

2011

Watson của IBM tuyên bố cạnh tranh về Jeopardy!.

2012

Trang 13

Andrew Ng, người sáng lập dự án Google Brain Deep Learning, cung cấpmột mạng lưới thầ̀n kinh bằng cách sử dụng thuật toán 10 triệu video YouTube dưới dạng tập huấn luyện Mạng lưới thầ̀n kinh đã học cách nhận ra một con mèo mà không được cho biết con mèo là gì

1.1.3 Ứng dụng của AI

1 AI trong chăm sóc sức khỏe

– Ứng dụng nổi bật của trí tuệ nhân tạo AI là cải thiện sức khỏ̉e của con người

và giảm chi phí Các bệnh viện đang áp dụng máy để chẩn đoán tốt hơn vànhanh hơn con người Một trong những biết công nghệ tốt nhất chăm sóc sứckhỏ̉e là IBM Watson Nó có thể hiểu ngôn ngữ tự nhiên và có khả năng trả lờicác câu hỏ̉i Hệ thống khai thác dữ liệu bệnh nhân và các nguồn dữ liệu có sẵnkhác để tạo thành một giả thuyết, sau đó đưa ra một lược đồ chấm điểm tin cậy.– Các ứng dụng AI khác bao gồm chatbot , chương trình máy tính được sử dụngtrực tuyến để trả lời các câu hỏ̉i và hỗ trợ khách hàng, giúp sắp xếp các cuộchẹn theo dõi hoặc hỗ trợ bệnh nhân thông qua quy trình thanh toán và trợ lý sứckhỏ̉e ảo cung cấp phản hồi y tế cơ bản

2 AI trong kinh doanh

– Tự động hóa quá trình robot đang được áp dụng cho các công việc có tính chất lặp đi lặp lại

– Các thuật toán được tích hợp vào các nền tảng phân tích và CRM để khám phá thông tin về cách phục vụ khách hàng tốt hơn

– Chatbots đã được kết hợp vào các trang web để cung cấp dịch vụ ngay lập tứccho khách hàng

3 AI trong giáo dục

Trang 14

AI có thể tự động hóa việc chấm điểm, giúp các giáo viên có thêm thờigian AI có thể đánh giá năng lực và quản lý sinh viên Gia sư AI có thể cungcấp hỗ trợ cho sinh viên, đảm bảo họ hoàn thành đúng theo giáo trình từ trước.Thậm AI có thể thay thế một số giáo viên.

6 AI trong sản xuất

Đây là một lĩnh vực đã đi đầ̀u trong việc kết hợp robot vào quy trình làmviệc Robot công nghiệp được sử dụng để thực hiện các nhiệm vụ đơn lẻ và giảiphóng sức lao động của con người

1.1.4 Các lĩnh vực nghiên cứu của AI

Trí tuệ con người (Human Intelligence): Cho đến nay có hai khái niệm về trí

tuệ con người được chấp nhận và sử dụng nhiều nhất, đó là:

Khái niệm trí tuệ theo quan điểm của Turing

“Trí tuệ là những gì có thể đánh giá được thông qua các trắc nghiệm thông minh”

Khái niệm trí tuệ đưa ra trong tụ điển bách khoa toàn

thư: “Trí tuệ là khả năng:

Phản ứng một cách thích hợp những tình huống mới thông qua hiệu chỉ̉nh hành vi một cách thích đáng

Hiểu rõ những mối liên hệ qua lại của các sự kiện của thế giới bên ngoài nhằm đưa ra những hành động phù hợp đạt tới một mục đích nào đó

Những nghiên cứu các chuyên gia tâm lý học nhận thức chỉ̉ ra rằng quá trình hoạt động trí tuệ của con người bao gồm 4 thao tác cơ bản:

Trang 15

2- Khả năng mô phỏ̉ng hành vi của con người.

3- Khả năng trừu tượng hoá, tổng quát hoá và suy diễn

4- Khả năng tự giải thích hành vi

5- Khả năng thích nghi tình huống mới kể cả thu nạp tri thức và dữ liệu

6- Khả năng xử lý các biểu diễn hình thức như các ký hiệu tượng trưng

7- Khả năng sử dụng tri thức heuristic

8- Khả năng xử lý các thông tin không đầ̀y đủ, không chính xác

1.2 NHỮNG VẤN ĐỀ̀ CHƯA ĐƯỢC GIẢI QUYẾT CỦA TRÍ TUỆ NHÂN TẠO

Những thành tựu nghiên cứu và ứng dụng các kỹ thuật Trí tuệ nhân tạo đãkhẳng định tính thực tiễn của các dự án xây dựng máy tính có khả năng suy

nghĩ Tuy vậy trong một số phạm vi, máy tính còn thua xa so với hoạt động

của hệ thần kinh con người:

Sự khác nhau trong hoạt động giữa máy tính và bộ não con người, điều nàythể hiện ưu thế của máy tính so với bộ não người vì khả năng tính toán rất lớn(nhất là trong các chương trình xử lý dữ liệu lớn)

Trang 16

Xử lý song song: mặc dù công nghệ điện tử hiện đại cho phé́p xây dựng các

bộ đa xử lý, song máy tính không thể hoạt động song song như bộ não conngười được

Khả năng diễn giải: con người có thể xem xé́t cùng một vấn đề theo những

phương pháp khác nhau, từ đó diễn giải theo cách dễ hiểu nhất Ngược lại, sựlinh hoạt này không thể mô phỏ̉ng được trong các hệ thống Trí tuệ nhân tạo

Lôgic rời rạc và tính liên tục: một thách đố lớn với các hệ thống Trí tuệ

nhân tạo là khả năng kết hợp các phương pháp xử lý thông tin trong môi trườngliên tục với các thao tác xử lý thông tin rời rạc

Khả năng học: mặc dù hiện nay máy tính có nhiều tính năng cao nhưng

cũng không thể mô phỏ̉ng được hoàn toàn khả năng học giống bộ não conngười

Khả năng tự tổ chức: cho tới nay, người ta chưa thể tạo lập được các hệ

thống Trí tuệ nhân tạo có khả năng tự tổ chức, tự điều khiển hoạt động của nó

để thích nghi với môi trường

1.3 NHỮNG ƯU ĐIỂM VÀ̀ RỦI RO

1.3.1 Ưu điểm

Công nghệ Ai được nghiên cứu và phát triển sâu rộng Đặc biệt ở những nước phát triển, điều này càng được thực hiện nhiều hơn Trí tuệ nhân tạo có thể xử lý được khối lượng lớn công việc Với những dữ liệu lớn hơn, rắc rối hơn cũng như công nghệ Ai có thể đưa ra dự đoán chính xác hơn con người Điều này chính là một ưu điểm lớn của công nghệ Ai hiện nay

Thông thường khi xử lý một lượng dữ liệu lớn, con người chúng ta khó

có thể chính xác hoàn toàn Tuy nhiên điều này có thể thực hiện được bởi công nghệ trí tuệ nhân tạo Ngay cả những nhà khoa học cũng cảm thấy khó khăn khigiải quyết số lượng dữ liệu lớn AI sử dụng học máy để có thể lấy những dữ liệu

đó và nhanh chóng biến nó thành thông tin có thể thực hiện được Đây cũng chính là lời giải đáp cho ưu điểm của công nghệ AI là gì?

1.3.2 Rủi ro

Trang 17

Rủi ro tự động hóa và thất nghiệp

Trong những thành công gầ̀n đây trong lĩnh vực máy học (Machine

Learning) và robot, dường như chỉ̉ cò̀n là vấn đề thời gian ngay cả những

công việc phức tạp đò̀i hỏ̉i trí thông minh cao cũng có thể được tiếp quản toàndiện bởi máy móc

Những người sẽ được hưởng lợi nhiều nhất từ công nghệ tiến bộ là ngườidân và quốc gia hiểu tận dụng các cơ hội công nghệ mới và các ảnh hưởng của

dữ liệu lớn trên mạng Trong khi ngành công nghiệp giải trí có cơ hội quan

trọng để phát triển giáo dục tốt hơn thông qua cá nhân hóa dạy học bằng AI và ứng dụng hóa tài liệu học tập, nó đồng thời cũng làm tăng nguy cơ tỷ lệ những người trẻ tuổi sẽ gặp khó khăn trong việc hoàn thành giáo dục của họ do nghiệnbệnh lý đối với các trò̀ chơi video và/hoặc internet

Tiến bộ công nghệ làm tăng năng suất xã hội, lầ̀n lượt nâng mức sống trung bình Nếu công việc được thực hiện bởi máy móc nhiều hơn, thời gian rảnh rỗi của con người dành cho giải trí và tự phát triển cho con người tang lên (một ưu điểm của sử dụng AI) Tuy nhiên, nhược điểm của công nghệ AI là tăng tự động hóa và gia tăng năng suất sẽ dẫn tới sự bất bình đẳng xã hội ngày càng tăng cũng như sự gia tăng về mức sống trung bình không có sự trùng hợp với sự gia tăng chất lượng trung bình của cuộc sống Các chuyên gia như kinh tếhọc MIT giáo sư Erik Brynjolfsson thậm chí lo lắng rằng công nghệ tiến bộ đe dọa làm cho cuộc sống của đa số của những người tồi tệ hơn

Rủi ro tình báo và siêu trí tuệ nói chung

Trí thông minh chung là khả năng đạt được mục tiêu chung trong các môi trường khác nhau Trí thông minh này có thể gây ra rủi ro (thảm khốc) nếu các mục tiêu của các máy móc không phù hợp với con người Nếu một trí thôngminh chung đạt đến một mức độ siêu phàm, nó trở thành một siêu trí tuệ; đó là, một thuật toán vượt trội so với trí thông minh của con người trong mọi cách, kể

cả sáng tạo khoa học, phổ biến, cảm giác, và năng lực xã hội Lưu ý rằng định nghĩa này để ngỏ̉ câu hỏ̉i về việc có hay không một siêu trí tuệ sẽ có ý thức

Trong trường hợp tốt nhất, một siêu trí tuệ có thể giải quyết vô số vấn đềcho nhân loại, giúp chúng ta vượt qua đạt được những thành tựu khoa học, đạođức, sinh thái và kinh tế trước những thách thức của tương lai Tuy nhiên, nếu các mục tiêu của một siêu trí tuệ không tương thích với sở thích của con người

và các sinh vật khác, AI sẽ mang tới một mối đe dọa tồn tại chưa từng có, có khả năng gây ra hậu quả nhiều hơn so với bất kỳ sự kiện nào trước đó trong vũtrụ

Định dạng
Số trang	25
Dung lượng	1,14 MB