GIỚI THIỆU TRÍ TUỆ NHÂN TẠO CÁC LOẠI HÌNH AI?. GIỚI THIỆU TRÍ TUỆ NHÂN TẠOLỢI ÍCH VÀ NGUY CƠ TỪ AI... GIỚI THIỆU TRÍ TUỆ NHÂN TẠOLỢI ÍCH VÀ NGUY CƠ TỪ AI... GIỚI THIỆU TRÍ TUỆ NHÂN TẠOLỢ
Trang 2GIỚI THIỆU TRÍ TUỆ NHÂN TẠO
TRÍ TUỆ NHÂN TẠO LÀ GÌ ?
Trí tuệ nhân tạo hay trí thông
minh nhân tạo ( A rtificial
i ntelligence – viết tắt là AI ) là
một ngành thuộc lĩnh vực khoa
học máy tính Là trí tuệ do con
người lập trình tạo nên với mục
tiêu giúp máy tính có thể tự động
hóa các hành vi thông minh như
con người.
Trang 3GIỚI THIỆU TRÍ TUỆ NHÂN TẠO
CÁC LOẠI HÌNH AI?
của đối thủ, từ đó, đưa ra được giải pháp tối ưu nhất.
định trong tương lai Công nghệ AI này thường kết hợp với cảm biến môi trường xung quanh nhằm mục đích dự đoán những trường hợp có thể xảy ra và đưa ra quyết định tốt nhất cho thiết bị
gì học được để thực hiện một việc cụ thể Hiện nay, công nghệ AI này vẫn chưa trở thành một phương án khả thi
Tự nhận thức Công nghệ AI này có khả năng tự nhận thức về bản thân, có ý thức và hành xử như con người Thậm chí, chúng còn có thể bộc lộ cảm xúc cũng như hiểu được những cảm xúc của con người
Trang 4GIỚI THIỆU TRÍ TUỆ NHÂN TẠO
LỢI ÍCH VÀ NGUY CƠ TỪ AI
Trang 5GIỚI THIỆU TRÍ TUỆ NHÂN TẠO
LỢI ÍCH VÀ NGUY CƠ TỪ AI
Trang 6GIỚI THIỆU TRÍ TUỆ NHÂN TẠO
LỢI ÍCH VÀ NGUY CƠ TỪ AI
Trang 7GIỚI THIỆU TRÍ TUỆ NHÂN TẠO
LỢI ÍCH VÀ NGUY CƠ TỪ AI
Trang 8GIỚI THIỆU ĐỀ TÀI
NHẬN DẠNG CHỮ IN BẰNG MÔ HÌNH K-MEANS
Bước 1 Chuẩn bị dữ liệu (Dataset Preparation) (bao nhiêu dữ liệu)
Trước hết, chúng ta cần phải loại bỏ những ký tự đặc biệt trong văn bản ban đầu như dấu mở đóng ngoặc, Vì vậy chúng
ta cần tách từ để có thể đảm bảo ý nghĩa của từ được toàn vẹn
Kết quả thu được của một văn bản đã được xử lý có dạng như sau:
“UK set to cut back on embassies
Nine overseas embassies and high commissions will close in an effort to save money, UK Foreign Secretary Jack Straw has announced
The Bahamas, East Timor, Madagascar and Swaziland are among the areas affected by the biggest shake-up for the
diplomatic service for years Other diplomatic posts are being turned over to local staff Mr Straw said the move would save
£6m a year to free up cash for priorities such as fighting terrorism
Honorary consuls will be appointed in some of the areas affected by the embassy closures Nine consulates or consulates general will also
be closed, mostly in Europe and America.
They include Dallas in the US, Bordeaux in France and Oporto in Portugal, with local staff replacing UK representation in another 11
Trang 9GIỚI THIỆU ĐỀ TÀI
NHẬN DẠNG CHỮ IN BẰNG MÔ HÌNH K-MEANS
Bước 2 Xử lý thuộc tính của dữ liệu (Feature Engineering)
Dữ liệu là các file văn bản dạng txt
Đầu tiên là xử lý văn bản, sau đó phân tách các từ và đếm
Sử dụng lớp Dictionary trong C#
wordFrequencyDictionary = new Dictionary<string, int>();
foreach(TrainItem item in trainingDataSet)
{
string[] words = item.Text.Split(' ');
foreach(string word in words)
{
string wordLowerCaps = word.ToLower();
if (wordFrequencyDictionary.ContainsKey(wordLowerCaps))
{
wordFrequencyDictionary[wordLowerCaps] += 1;
}
else
{
wordFrequencyDictionary[wordLowerCaps] = 1;
}
}
}
wordFrequencyDictionary = (from entry in wordFrequencyDictionary orderby entry.Value descending select entry).ToDictionary(pair => pair.Key, pair => pair.Value);
lblWords.Text = "Words: " + wordFrequencyDictionary.Count;
Trang 10GIỚI THIỆU ĐỀ TÀI
NHẬN DẠNG CHỮ IN BẰNG MÔ HÌNH K-MEANS
Bước 3.Xây dựng mô hình (Build Model)(Tên mô hình)
Mô hình K- means clustering
Sau đây là một phần code minh họa K-Means viết băng C# trên Visual Studio:
namespace KMeansProject
{
public delegate void OnUpdateProgress(object sender, KMeansEventArgs eventArgs);
public class KMeans
{
private IDistance _distance;
private int _k;
private List<Centroid> centroidList;
public event OnUpdateProgress UpdateProgress;
protected virtual void OnUpdateProgress(KMeansEventArgs eventArgs)
{
if (UpdateProgress != null)
UpdateProgress(this, eventArgs);
Thread.Sleep(1500);
}
public KMeans(int k, IDistance distance)
{
_k = k;
_distance = distance;
}
public int Classify(double[] input) {
int closestIndex = -1;
double minDistance = Double.MaxValue;
for (int k = 0; k < centroidList.Count; k++) {
double distance = _distance.Run(centroidList[k].Array, input);
if (distance < minDistance) {
closestIndex = k;
minDistance = distance;
} } return centroidList.ToArray();
} } }
Trang 11GIỚI THIỆU ĐỀ TÀI
DEMO CHƯƠNG TRÌNH
Bước 1: vào Loading Traning để
load file dataset lên, click vào
Process Text sau đó chọn số
cụm muốn phân loại thành, ở
đây data set có 3 loại thì chọn
3, có 5 loại văn bản thì chọn 5.
Trang 12GIỚI THIỆU ĐỀ TÀI
DEMO CHƯƠNG TRÌNH
Bước 2:Tiến hành
chọn floder dataset
Trang 13GIỚI THIỆU ĐỀ TÀI
DEMO CHƯƠNG TRÌNH
Bước 3 :Tùy chọn số
file muốn phân loại ,
chọn Preview để xem
trước toàn bộ từ
trong file
Trang 14GIỚI THIỆU ĐỀ TÀI
DEMO CHƯƠNG TRÌNH
Bước 4:Click Word to
Vector để đếm từ:
Trang 15GIỚI THIỆU ĐỀ TÀI
DEMO CHƯƠNG TRÌNH
Bước 5: Hiển thị từ
với tần suất của từng
từ trên form Word
Stat:
Trang 16
GIỚI THIỆU ĐỀ TÀI
DEMO CHƯƠNG TRÌNH
Bước 6:Xóa những từ có
độ lặp lại thấp không
giúp ích cho việc phân
loại của K-Means để việc
Train nhanh và hiệu quả
hơn sau đó Apply và
Train:
Trang 17GIỚI THIỆU ĐỀ TÀI
DEMO CHƯƠNG TRÌNH
Bước 6:Cuối cùng hiển
thị kết quả văn bản đã
được phân loại bằng nút
“ Hiển thị Kết Qủa”
Trang 18TÀI LIỆU THAM KHẢO
[1] Giáo trình Nhập môn trí tuệ nhân tạo – PGS.TS Từ Minh Phương
[2] https://code-ai.mk/shape-recognition/#comment-829
[3] https://machinelearningcoban.com/2017/01/01/kmeans/
[4] https://nguyenvanhieu.vn/thuat-toan-phan-cum-k-means/
[5] http://bis.net.vn/forums/t/374.aspx
[6] https://vi.wikipedia.org/wiki/Tr%C3%AD_tu%E1%BB%87_nh%C3%A2n_t%E1%BA%A1o
[7] https://techblog.vn/phan-loai-van-ban-tu-dong-bang-machine-learning-nhu-the-nao
Trang 20TRƯỜNG ĐẠI HỌC THÀNH ĐÔ
KHOA CÔNG NGHỆ THÔNG TIN
Báo cáo bài tập
Môn: Trí tuệ nhân tạo
Đề tài: NHẬN DẠNG CHỮ IN BẰNG MÔ
HÌNH K-MEANS
SV: Trần Minh Quang 1702313 Vương Thị Quỳnh 1701006 Nguyễn xuân Quang 1700962
Nhóm Lớp D101K9