Deep Learning nói riêng hay Machine Learning nói chung đã và đang là chủ đề nóng hổi trong thế giới Trí tuệ nhân tạo. Là một công nghệ được gửi gắm vô cùng nhiều sự kỳ vọng, Deep Learning mang trên mình trọng trách thay đổi những tác vụ, phương pháp truyền thống trong các lĩnh vực khoa học, kinh tế, xã hội, hướng đến kỷ nguyên tự động hóa, hiện đại hóa. Trong lĩnh vực sản xuất, kỹ thuật số và ứng dụng các kỹ thuật chuyển đổi mô hình hóa đã được ứng dụng từ rất lâu. Dần dần khi việc đo lường và lưu trữ thông tin trở nên số hóa, máy tính đã tham gia vào mô hình này. Cho đến khi mô hình thống kế truyền thống không đủ để đáp ứng sự bùng nổ của dữ liệu thì đây là thời điểm Deep Learning được ứng dụng vì nó có khả năng xử lý các mẫu dữ liệu phi tuyến tính cao và cho phép khám phá cực khó phát hiện ra bởi các phương pháp thủ công. Deep Learning mang lại nhiều cơ hội phát triển dành cho các công ty, doanh nghiệp, tổ chức, cơ hội việc làm dành các cá nhân đang hoạt động trong lĩnh vực Trí tuệ nhân tạo, phân tích dữ liệu, dữ liệu lớn, … Do đó Deep Learning dành được sự quan tâm đặc biệt từ phía các bạn học sinh, sinh viên mong muốn được học tập và làm việc về công nghệ. Vì vậy trong tiểu luận này, nhóm tác giả sẽ trình bày những điều khái quát nhất về công nghệ Deep Learning, đưa ra lời giải thích cho những câu hỏi thường gặp trong lĩnh vực theo cách ai cũng có thể hiểu
Trang 11
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ - ĐẠI HỌC QUỐC GIA HÀ NỘI
KHOA ĐIỆN TỬ VIỄN THÔNG
TIỂU LUẬN MÔN HỌC TỔNG QUAN VỀ DEEP LEARNING
Giảng viên: Nguyễn Nam Hoàng Nhóm 9:
Vũ Đức Lộc Chu Trung Lương Hoàng Thị Ngọc Ánh
Hà Thanh Tùng Dương Bá Hưng Cung Văn Thắng Bùi Đình Đăng
Trang 22
MỤC LỤC
MỞ ĐẦU 3
Giới thiệu 3
Lý do chọn đề tài 3
Đối tượng, mục tiêu và nhiệm vụ nghiên cứu 4
CHƯƠNG 1: CÁC KHÁI NIỆM 5
1.1 Artificial intelligence (AI) 5
1.2 Machine learning (ML) 5
1.3 Artificial neural networks (ANNs) 5
1.4 Deep learning (DL) 5
CHƯƠNG 2: NGUỒN GỐC 6
2.1 Perceptron 6
2.2 Thuật toán Perceptron 6
CHƯƠNG 3: CÁCH DEEP LEARNING HOẠT ĐỘNG 8
3.1 Ví dụ trực quan về một mô hình Perceptron 8
3.2 Cấu trúc một mạng Neural nhân tạo (Artificial Neural Network) 9
3.3 Cách Deep Learning hoạt độnỉ 12
CHƯƠNG 4: ĐÀO TẠO MỘT MÔ HÌNH DEEP LEARNING 13
4.1 Cách 1 mô hình DL có thể tự học 13
4.1.1 Lan truyền dữ liệu 13
4.1.2 Lan truyền tiến (Forward propagation) 13
4.1.3 Lan truyền lùi (Backward propagation) 13
4.2 Các yếu tố cần có 14
CHƯƠNG 5: SỰ VƯỢT TRỘI CỦA DEEP LEARNING 15
5.1 Mối tương quan giữa lượng thông tin và hiệu quả mang lại 15
5.2 Ứng dụng trong Thị giác máy tính (Computer vision) 16
5.2.1 Đối với các thuật toán cũ 17
5.2.2 Khi áp dụng Deep Learning 18
KẾT LUẬN 19
TÀI LIỆU THAM KHẢO 20
Trang 33
MỞ ĐẦU Giới thiệu
Deep Learning nói riêng hay Machine Learning nói chung đã và đang là chủ đề
nóng hổi trong thế giới Trí tuệ nhân tạo Là một công nghệ được gửi gắm vô cùng nhiều sự
kỳ vọng, Deep Learning mang trên mình trọng trách thay đổi những tác vụ, phương pháp truyền thống trong các lĩnh vực khoa học, kinh tế, xã hội, hướng đến kỷ nguyên tự động hóa, hiện đại hóa
Trong lĩnh vực sản xuất, kỹ thuật số và ứng dụng các kỹ thuật chuyển đổi mô hình hóa đã được ứng dụng từ rất lâu Dần dần khi việc đo lường và lưu trữ thông tin trở nên số hóa, máy tính đã tham gia vào mô hình này Cho đến khi mô hình thống kế truyền thống không đủ để đáp ứng sự bùng nổ của dữ liệu thì đây là thời điểm Deep Learning được ứng dụng vì nó có khả năng xử lý các mẫu dữ liệu phi tuyến tính cao và cho phép khám phá cực khó phát hiện ra bởi các phương pháp thủ công
Deep Learning mang lại nhiều cơ hội phát triển dành cho các công ty, doanh nghiệp,
tổ chức, cơ hội việc làm dành các cá nhân đang hoạt động trong lĩnh vực Trí tuệ nhân tạo, phân tích dữ liệu, dữ liệu lớn, … Do đó Deep Learning dành được sự quan tâm đặc biệt từ phía các bạn học sinh, sinh viên mong muốn được học tập và làm việc về công nghệ Vì vậy trong tiểu luận này, nhóm tác giả sẽ trình bày những điều khái quát nhất về công nghệ Deep Learning, đưa ra lời giải thích cho những câu hỏi thường gặp trong lĩnh vực theo cách ai cũng
có thể hiểu
Lý do chọn đề tài
Vào cuối những năm cuối thế kỷ 18 đầu thế kỷ 19 có sự bùng nổ mạnh về cách mạng công nghiệp Cách mạng công nghiệp lần thứ nhất (thời đại 1.0) “Cơ giới Hóa” lao động chân tay được thay thế bằng công nghiệp và chế tạo máy móc quy mô lớn Cách mạng công nghiệp lần thứ hai (thời đại 2.0) “Điện khí hóa” thời kỳ này máy phát điện ra đời và điện năng tham gia vào hầu hết các hoạt động kinh doanh, sản xuất và sinh hoạt của con người Cách mạng công nghiệp lần thứ ba (thời đại 3.0) tiến bộ về hạ tầng điện tử, máy tính và công nghệ kỹ thuật số trên nền tảng là sự phát triển của chất bán dẫn, siêu máy tính, máy tính cá nhân và Internet Trải qua 3 cuộc cách mạng công nghiệp, thời gian chúng ta sống hiện nay là thế kỷ
21, cuộc cách mạng lần thứ 4 (thời đại 4.0) kỷ nguyên của “Trí Tuệ nhân tạo”
Cuộc cách mạng công nghiệp lần thứ tư có thể được mô tả như là sự ra đời của một loạt các công nghệ mới, kết hợp tất cả các kiến thức trong lĩnh vực vật lý, kỹ thuật số, sinh học, và ảnh hưởng đến tất cả các lĩnh vực, nền kinh tế, các ngành kinh tế và ngành công nghiệp Nhận thấy sự thành công và tương lai vẫn đang còn tiếp tục phát triển vượt trội, chúng em muốn và tập trung nghiên cứu về “Deep learning” – công nghệ đứng sau sự phát
triển của trí tuệ nhân tạo
Trang 44
Đối tượng, mục tiêu và nhiệm vụ nghiên cứu
Đối tượng nghiên cứu nhóm chúng em hướng đến là về kỹ thuật Deep Learning hay còn gọi là học sâu Nghiên cứu làm như thế nào để máy móc có thể học tập và làm việc được thông minh như con người, trong tương lai máy móc có thể phát triển đến mức như thế nào Mục tiêu nghiên cứu hướng đến của nhóm chúng em là về sự tiên tiến của Deep Learning ở khi đã có một nền móng cực kỳ vững chắc Do đó nhiệm vụ nghiên cứu của nhóm đầu tiên phải tìm hiểu tổng quan về deep learning, khái niệm, nguồn gốc, cách thức hoạt động, chuyên sâu về đào tạo mô hình,… Tiếp theo đó là về sự thay đổi của quá khứ cho đến hiện tại, đã phát triển như thế nào, thành quả ra làm sao Để rồi cuối cùng rút ra được câu trả lời cho câu hỏi: “Tại sao Deep Learning lại tiên tiến hơn các thuật toán cũ?”.
Trang 55
CHƯƠNG 1: CÁC KHÁI NIỆM
1.1 Artificial intelligence (AI)
Artificial intelligence (Trí tuệ nhân tạo) là những gì làm cho máy tính trở nên thông
minh và giải quyết những công việc mà bình thường phải cần đến con người Cụ thể hơn, trong AI có lĩnh vực thị giác máy tính giúp máy tính có thể nhìn, nhận biết màu sắc, chiều
dài, chiều rộng, lĩnh vực nhận dạng âm thanh giúp máy tính có thể giao tiếp ngôn ngữ, chat, trò chuyện với nhau, nghe, hiểu, nhận dạng tiếng nói,
1.2 Machine learning (ML)
Machine learning (Máy học) Là một phần quan trọng (nhưng không phải tất cả) của
AI ML hướng đến câu chuyên làm thế nào để qua thời gian, máy tính có thể học và trở nên
thông minh như loài người Mục tiêu của ML là dự đoán các kết quả dựa trên các dữ liệu đầu
vào
1.3 Artificial neural networks (ANNs)
Artificial neural networks (Mạng thần kinh nhân tạo) là một trong những nhóm
thuật toán học máy phổ biến nhất (nhưng không phải duy nhất, còn rất nhiều các thuật toán khác để lựa chọn) được xây dựng dựa trên cấu trúc mạng thần kinh của con người Nó bao gồm các nhóm việc, neural nhân tạo có thể nối hút với nhau và xử lý các thông tin bằng biện pháp truyền theo các kết nối rồi tính toán giá trị mới tại các nút
1.4 Deep learning (DL)
Deep learning (Học sâu) là phương pháp học máy hiện đại và tiên tiến nhất hiện nay
DL được xây dựng dựa trên ANNs nhiều lớp với những kiến trúc mạng được thiết kế đặc thù
cho từng lớp bài toán Cụ thể hơn, có thể hiểu DL chính là ANNs nhưng có 3 thay đổi quan
trọng: Thay đổi về kiến trúc mạng, thay đổi về thuật toán học và thay đổi về hàm kích hoạt trong mạng
https://vas3k.com/blog/machine_learning/
Hình 1.1 Mối tương quan giữa các khái niệm
Trang 66
CHƯƠNG 2: NGUỒN GỐC 2.1 Perceptron
Deep Learning được lấy cảm hứng từ thuật toán Perceptron
Perceptron là một thuật toán máy học giúp cung cấp kết quả phân loại cho máy tính
Nó bắt đầu từ những năm 1950 và đại diện cho một ví dụ cơ bản về cách thuật toán học máy làm việc để phát triển dữ liệu
Các chuyên gia gọi Perceptron là thuật toán phân loại có giám sát bởi vì máy tính
được hỗ trợ bởi việc phân loại con người của các điểm dữ liệu Perceptron cũng liên quan
đến sự phát triển của “mạng thần kinh nhân tạo”, nơi các cấu trúc tính toán được dựa trên thiết kế của bộ não con người
2.2 Thuật toán Perceptron
Trong bài tiểu luận này, nhóm tác giả sẽ giới thiệu thuật toán đầu tiên trong
Classification có tên là Perceptron Learning Algorithm (PLA) hoặc đôi khi chúng được
viết gọn thành Perceptron
PLA là một thuật toán giúp chúng ta thực hiện công việc phân loại hai lớp Ban đầu thuật toán được Frank Rosenblatt đề xuất dựa trên ý tưởng của Neural thần kinh, nó nhanh
chóng tạo nên tiếng vang lớn trong lĩnh vực AI
Ý tưởng cơ bản của thuật toán này là:
“Cứ làm đi đâu sửa đấy, cuối cùng sẽ thành công!”
Ta có thể hiểu ý nghĩa của câu nói này đó chính là ý tưởng cơ bản của PLA, chúng được xuất phát từ một nghiệm dự đoán nào đó, qua mỗi vòng lặp, nghiệm sẽ được cập nhật tới một vị trí tốt hơn Việc cập nhật này dựa trên việc giảm giá trị của một hàm mấy mát nào
đó
Hình 2.1 Mô hình Perception
Trang 77
Hình 2.1 biểu diễn một mô hình Perceptron là mô hình dạng Neural đơn giản nhất, ta
có thể nhìn thấy với một vài Input được đưa vào và chỉ cho ra đúng một Output Khi kết quả chưa đúng với mong muốn, chúng lại quay trở lại thay đổi các trọng số w để đưa ra kết quả theo đúng mong đợi nhất có thể Cách thức hoạt động của thuật toán sẽ được giới thiệu chi tiết ở nội dung sau
Đây chính là nền móng để xây dựng một mô hình Deep Learning
Trang 88
CHƯƠNG 3: CÁCH DEEP LEARNING HOẠT ĐỘNG
3.1 Ví dụ trực quan về một mô hình Perceptron
Để hiểu cách DL hoạt động, trước hết ta cần hiểu cách nền tảng dựng lên
nó-mô hình Perceptron hoạt động
Một perceptron sẽ nhận một hoặc nhiều đầu x vào dạng nhị phân và cho ra một kết
quả o dạng nhị phân duy nhất Các đầu vào được điều phối tầm ảnh hưởng bởi các tham số trọng lượng tương ứng w (weight) của nó, còn kết quả đầu ra được quyết định dựa vào một ngưỡng quyết định b nào đó
Để dễ hình dung, ta lấy ví dụ việc đi nhậu hay không phụ thuộc vào 4 yếu tố sau:
1 Trời có nắng hay không?
2 Có hẹn trước hay không?
3 Vợ có vui hay không?
4 Bạn nhậu có ít khi gặp được hay không?
Thì ta coi 4 yếu tố đầu vào là 𝑥𝑥1, 𝑥𝑥2, 𝑥𝑥3, 𝑥𝑥4,đầu ra là o, và nếu o = 0 thì ta không đi nhậu còn o = 1 thì ta đi nhậu Giả sử mức độ quan trọng của 4 yếu tố trên lần lượt là 𝑤𝑤1=0.05, 𝑤𝑤2 = 0.5, 𝑤𝑤3 = 0.2, 𝑤𝑤4 = 0.25 và chọn ngưỡng b = -0.5 thì ta có thể thấy rằng việc trời nắng có ảnh hưởng chỉ 5% tới quyết định đi nhậu và việc có hẹn từ trước ảnh hưởng tới
50 % quyết định đi nhậu của ta
Nếu gắn 𝑥𝑥0 = 1 và 𝑤𝑤0 = 𝑏𝑏, ta còn có thể viết gọn lại thành:
https://dominhhai.github.io/vi/2018/04/nn-intro/#1-perceptrons
Hình 3.3
Trang 99
3.2 Cấu trúc một mạng Neural nhân tạo (Artificial Neural Network)
Một mạng neural nhân tạo (ANNs) có thể được gọi là một mô hình perceptron đa tầng (Multilayer perceptron) vì nó có nhiều lớp Perceptron
Cấu trúc chung của một ANNs gồm 3 thành phần:
+ Input Layer (lớp dữ liệu đầu vào): Nhận dữ liệu đầu vào của thuật toán
+ Hidden Layer (lớp ẩn)
+ Output Layer (lớp dữ liệu đầu ra): Xuất ra kết quả
Lớp ẩn (Hidden layer) gồm các nút nhận dữ liệu input từ các Neural ở lớp trước đó
và chuyển đổi các input này cho các lớp xử lý tiếp theo
https://www.simplilearn.com/tutorials/deep-learning-tutorial/perceptron
Hình 3.4 Mô tả một ANNs
Khi ANNs có nhiều hơn một lớp ẩn, ta gọi đó là một mô hình Deep Learning (Từ
“Deep” trong Deep Learning ám chỉ có nhiều hơn một lớp ẩn)
researchgate.net
Hình 3.5 Cấu trục của một mô hình Deep Learning
Trang 1010
Trong đó các yếu tố xử lý – Processing Elements (PE) của ANNs gọi là Neural, mỗi
Neural nhận các đầu vào xử lý chúng và cho ra 1 kết quả duy nhất
https://iq.opengenus.org/activation-functions-ml/
Hình 3.6 Mô tả quá trình xử lý thông tin của 1 ANN
Một mạng Neural gồm có 1 hoặc n đầu vào 𝑥𝑥1,𝑥𝑥2, … 𝑥𝑥𝑛𝑛 (Input) và 1 đầu ra y (Output) 𝑤𝑤1, 𝑤𝑤2, … 𝑤𝑤𝑛𝑛 được gọi là các trọng số (Weights) của Neural, các trọng số này sẽ thay đổi trong quá trình học b là ngưỡng (Bias), có thể hiểu đơn giản là b là 1 giá trị ngưỡng
mà mình chọn trước và chọn đúng thì neural mới học chính xác Nhiệm vụ của neural là thu nhập đầu vào cùng với trọng số để tính tổng trọng số của tất cả các input được đưa vào mỗi neural rồi cộng với bias (Mô tả trong hình 3.7)
Hình 3.7
Sau đó nó sẽ đưa giá trị vừa tính được tới hàm kích hoạt (Activation Functions) để
kiểm tra kết quả Việc lựa chọn hàm kích hoạt có tác động lớn đến kết quả của mạng neural Thông thường, hàm kích hoạt được chọn là hàm nấc (Step Function), nhiệm vụ của hàm
kích hoạt sẽ được giới thiệu sau
Trang 1212
3.3 Cách Deep Learning hoạt động
Deep Learning hoạt động dựa trên ANNs thông qua sự kết hợp của dữ liệu đầu vào, trong số và độ lệch Các yếu tố này hoạt động cùng nhau để nhận biết, phân loại và mô ta chính xác các đối tượng trong dữ liệu nhập vào
Deep Learning là ANNs nhiều lớp ẩn, mỗi lớp được xây dựng dựa trên lớp trước đó
để tinh chỉnh và tối ưu hóa dự đoán hoặc phân loại Quá trình tính toán thông qua mạng này được gọi là quá trình chuyển tiếp
researchgate.net
Hình 3.11 Mô hình Deep Learning
Các lớp đầu vào và đầu ra của DL là những lớp có thể nhìn thấy của quá trình Lớp
đầu vào là nơi ta nhập vào dữ liệu để xử lý còn lớp đầu sẽ ra đưa ra dự đoán hoặc kết quả cuối cùng của quá trình
Ban đầu các trọng số được đặt ngẫu nhiên, sau đó dữ liệu tại các Neural sẽ được tính toán theo cách đã được giới thiệu ở mục 3.2
Mỗi neural có một hàm kích hoạt Hàm kích hoạt có nhiệm vụ xem Neural đó có
được kích hoạt hay không, nếu Neural được kích hoạt thì nó sẽ truyền dữ liệu cho lớp tiếp theo
Một khi một bộ dữ liệu đầu vào vượt qua tất cả các lớp thì nó sẽ trả lại dữ liệu đầu
ra qua lớp đầu ra
Giải thích tổng quát đơn giản là vậy, tuy nhiên trong thực tế, các thuật toán của Deep Learning vô cùng phức tạp và có nhiều loại khác nhau để giải quyết các vấn đề hoặc tập dữ liệu cụ thể
Trang 1313
CHƯƠNG 4: ĐÀO TẠO MỘT MÔ HÌNH DEEP LEARNING
4.1 Cách 1 mô hình DL có thể tự học
4.1.1 Lan truyền dữ liệu
Trong toàn bộ các nốt mạng Neural đều có thể kết hợp đôi một với nhau theo một chiều duy nhất từ tầng vào đến tầng ra Có nghĩa là, mỗi nốt ở một tầng sẽ nhận đầu vào là tất
cả các nốt ở tầng trước đó Nghĩa là ta cho mỗi nốt ở input 1 dữ liệu, sau đó lớp ẩn thứ nhất
sẽ nhận tất cả các input, lớp ẩn tiếp theo cũng sẽ nhận tất cả các đầu vào của lớp trước đó để dẫn đến kết quả sát với thực tế cần tìm nhất
4.1.2 Lan truyền tiến (Forward propagation)
researchgate.net
Hình 4.1 Đường đi của dữ liệu trong lan truyền tiến 4.1.3 Lan truyền lùi (Backward propagation)
Trong quá trình lan truyền tiến chắc chắn Network sẽ phát sinh kết quả sai, kết quả
sai này sẽ được so sánh với kết quả được kỳ vọng để tính toán độ sai của dự đoán Sau đó dữ liệu này sẽ được truyền ngược về từ Layer Out đến Layer In
Lan truyền lùi dựa theo khái niệm của lan truyền tiến Khi kết quả ra nhưng chưa
đúng như mong đợi, máy sẽ lùi các bước, học và điều chỉnh input nhận vào để dẫn đến kết quả mong đợi
Trang 1414
Mục tiêu của lan truyền lùi: Điều chỉnh từng trọng số trong mạng theo tỷ lệ với mức
độ đóng góp của lỗi chung Nếu chúng ta lặp đi lặp lại giảm từng lỗi và cập nhật các trọng số, cuối cùng chúng ta sẽ có một loạt các trọng số tạo ra một mạng có thể dự đoán tốt
Về cơ bản phương pháp này được dựa theo quy tắc chuỗi đạo hàm của hàm hợp và phép tính ngược đạo hàm để thu được đạo hàm theo tất cả các tham số cùng lúc chỉ với 2 lần duyệt mạng
Quá trình này được lặp đi lặp lại, mỗi lần lặp các trọng số sẽ được điều chỉnh đến khi mạng Neural cho ra được kết quả gần nhất mà chúng ta kỳ vọng Khi ra được kết quả kỳ vọng, ta nói mô hình Deep Learning đã được “dạy” hay “đào tạo” thành công
Bộ dữ liệu lớn: Khi đào tạo mạng Deep Learning, chúng ta cần tìm dữ liệu lịch sử
của các yếu tố Và vì một lượng lớn các kết hợp nên chúng ta cần một danh sách dữ liệu đầu vào vô cùng lớn để nghiên cứu, so sánh và cho ra dữ liệu đầu ra từ bộ dữ liệu đó
Sức mạnh điện toán: Ngoài ra, nó cũng đòi hỏi lượng tính toán rất lớn, có thể mất
vài tuần nếu chỉ được thực hiện trên một nút CPU hoặc GPU Đây có thể là rào cản chính trong việc áp dụng DL vào thực tế
Trang 1515
CHƯƠNG 5: SỰ VƯỢT TRỘI CỦA DEEP LEARNING
Trong phần nội dung này ta sẽ gộp chung những thuật toán Machine Learning trước
khi Deep Learning ra đời và hiện nay đã được thay thế bởi Deep Learning là thuật toán Machine Learning truyền thống
5.1 Mối tương quan giữa lượng thông tin và hiệu quả mang lại
Các thuật toán Machine Learning truyền thống được cho là không có cải thiện gì đáng
kể khi lượng thông tin đầu vào tăng quá một ngưỡng nhất định
Chìa khóa cho sự vượt trội của Deep Learning đó chính là khả năng xử lý và tận dụng lợi thế từ lượng thông tin "khổng lồ"
Kỷ nguyên của Dữ Liệu Lớn (Big Data's Era) đã và đang mang lại những lợi thế vô cùng rõ ràng cho Deep Learning khi so với sánh với những thuật toán Machine Learning truyền thống
Deep Learning thì khác, nó sẽ cố gắng để tự học đưa ra những đặc trưng từ khối thông tin đầu vào, lượng thông tin càng lớn, Deep Learning sẽ càng mang lại hiệu quả cao hơn
Trang 1616
https://towardsdatascience.com/why-deep-learning-is-needed-over-traditional-machine-learning
Hình 5.2 So sánh giữa thuật toán Machine Learning truyền thống và Deep Learning
Tóm lại, có một điều không thể phủ nhận là Deep Learning vượt xa các kỹ thuật khác nếu như dữ liệu đầu vào đủ lớn, tất nhiên phải nhấn mạnh rằng phải đủ lớn Mặc dù với lượng
dữ liệu nhỏ, các phương pháp Machine Learning truyền thống sẽ được việc hơn, tuy nhiên như đã nói, chúng ta đang sống trong kỷ nguyên của Dữ liệu lớn, Deep Learning đã và đang
có thể phát huy tối đa khả năng của mình, đặc biệt trong việc xử lý các vấn đề phức tạp như phân loại ảnh, xử lý ngôn ngữ con người, và nhận diện giọng nói
5.2 Ứng dụng trong Thị giác máy tính (Computer vision)
https://www.phase1vision.com/blog/the-2021-computer-vision-trends-you-need-to-know
Hình 5.3 Minh họa cho Thị giác máy (Computer Vision)
Trang 1717
Thị giác máy tính là một hình thức công nghệ dùng để mô tả khả năng của bộ máy
có thể thu nhận và phân tích các dữ liệu trực quan và sau đó sẽ tiến hành đưa ra các quyết định về nó Nói cho dễ hiểu đây là một công nghệ thuộc lĩnh vực trí tuệ nhân tạo và khoa học máy tính, thiết lập cho máy có tầm nhìn và xử lý nhận dạng như con người
Thị giác máy tính còn đề cập đến toàn bộ quá trình mô phỏng tầm nhìn của con người trong một bộ máy phi sinh học Điều này bao gồm việc chụp ảnh ban đầu, phát hiện và nhận dạng đối tượng, nhận biết bối cảnh tạm thời giữa các cảnh và phát triển sự hiểu biết ở mức độ cao về những gì đang xảy ra trong khoảng thời gian thích hợp
5.2.1 Đối với các thuật toán cũ
Các hệ thống thị giác máy tính truyền thống là sự kết hợp của các thuật toán phối hợp với nhau trong nỗ lực giải quyết các nhiệm vụ của thị giác máy Đối với các thuật toán truyền thống, có một công đoạn không thể bỏ qua đó là: rút trích đặc trưng (feature extraction)
Mục tiêu chính là trích xuất các đặc điểm từ hình ảnh, bao gồm các tác vụ phụ như phát hiện cạnh, phát hiện góc và phân đoạn dựa trên màu Độ chính xác của các thuật toán được sử dụng để trích xuất các đặc điểm phụ thuộc vào thiết kế và tính linh hoạt của từng thuật toán
Vấn đề chính với cách tiếp cận này là hệ thống cần phải được cho biết những đặc điểm cần tìm trong hình ảnh Về cơ bản, do thuật toán hoạt động như đã được xác định bởi nhà thiết kế thuật toán, các đặc trưng được trích xuất được thiết kế bởi con người Trong các triển khai như vậy, mặc dù các vấn đề gây ra hiệu suất kém của thuật toán có thể được xử lý thông qua tinh chỉnh, tuy nhiên, những thay đổi như thế này cần phải được thực hiện thủ công
và được mã hóa cứng hoặc cố định cho một ứng dụng cụ thể
Chính vì trong công đoạn rút trích đặc trưng xuất hiện rất nhiều vấn đề phải được
xử lý một cách thủ công bởi các chuyên gia, nên khi khối lượng thông tin đầu vào tăng lên sẽ chỉ tăng thêm việc của con người Hệ quả là khiến cho khối lượng công việc cần xử lý thủ công trở nên cồng kềnh và mất thời gian để xử lý hơn, không những thế, hiệu năng của thuật toán cũng sẽ không đem lại sự cải thiện đáng kể
https://www.educative.io/edpresso/what-is-feature-extraction
Hình 5.4 Minh họa cho công đoạn “rút trích đặc trưng”
Trang 1818
5.2.2 Khi áp dụng Deep Learning
Đối với Deep Learning, mọi thứ đơn giản hơn nhiều
Các hệ thống Deep Learning đã đạt được tiến bộ rất đáng kể trong kỹ thuật thị giác máy tính Lý do cho sự thành công này dựa trên khả năng xử lý và tận dụng lợi thế từ những khối thông tin vô cùng lớn
Sự khác biệt lớn nhất giữa các thuật toán cũ và Deep learning là chúng không còn cần phải trải qua công đoạn rút trích đặc trưng thủ công và được lập trình để tìm kiếm các đặc trưng cụ thể ấy của ảnh Thay vào đó, các mạng lưới thần kinh bên trong hệ thống Deep Learning sẽ được đào tạo để tự tìm ra các đặc trưng ấy Ví dụ: nếu ô tô trong hình ảnh bị phân loại sai thành xe máy thì thay vì tinh chỉnh các tham số một cách thủ công hay viết lại thuật toán, ta sẽ chỉ cần tiếp tục đào tạo cho đến khi hệ thống làm cho đúng và đây là một công việc gần như tự động hoàn toàn
Ngoài ra, vì Deep Learning sẽ “tự học” và tự xác định các đặc trưng của ảnh một cách gần như hoàn toàn tự động, do đó dữ liệu thông tin đầu vào càng nhiều thì các đặc trưng sẽ được phát hiện càng nhiều, kết quả là các tác vụ mà Deep Learning phục vụ sẽ càng trở nên chính xác
Một mô hình Deep Learning đã qua huấn luyện đã được khẳng định hoạt động tốt hơn nhiều so với các thuật toán truyền thống trong cùng các tác vụ phức tạp
Deep Learning giúp loại bỏ hoàn toàn nhu cầu về chuyên môn trong một lĩnh vực tương đối phức tạp (rút trích đặc trưng) cũng như các công đoạn thủ công khó nhằn, mặc dù vẫn sẽ có thứ chúng ta cần phải đánh đổi đó là: thời gian để huấn luyện tương đối dài và sức mạnh điện toán yêu cầu phải lớn, tuy nhiên so với hiệu quả vượt trội mà Deep Learning mang lại thì nó không phải là vấn đề nghiêm trọng
(Sách) Deep Learning vs Traditional Computer Vision
Hình 5.5 Sự khác biệt khi sử dụng Deep Learning
Trang 1919
KẾT LUẬN
Deep Learning đang ngày càng phổ biến thời gian gần đây Nó đóng góp rất nhiều vào việc làm cho cuộc sống hàng ngày của chúng ta thuận tiện hơn, và xu hướng này sẽ còn phát triển rất mạnh trong tương lai
Qua nội dung trên, nhóm tác giả đã trình bày kiến thức căn bản về Công nghệ Deep Learning: khái niệm, nguồn gốc, cách nó hoạt động và lý do tại sao nó lại vượt trội hơn các thuật toán trước đây Ngoài ra, nhóm tác giả đã có những ví dụ trực quan, dễ hiểu, dễ hình dung, phần nào đó giúp cho độc giả dễ theo dõi hơn khi đi vào phần nội dung phức tạp
Do hạn chế về mặt kiến thức cũng như kinh nghiệm, bài tiểu luận khó tránh khỏi những thiếu sót Chúng em hy vọng có thể nhận được những ý kiến đóng góp quý báu từ phía thầy để bài tiểu luận có thể hoàn thiện hơn nữa Chúng em xin chân thành cảm ơn!
Trang 2020
TÀI LIỆU THAM KHẢO
[1] Education, I C (2020, August 17) What are Neural Networks? | IBM 2020 Retrieved from IBM
Cloud Learn Hub: https://www.ibm.com/cloud/learn/neural-networks
[2] Hải, Đ M (2018, April 23) Hai's Blog Retrieved from [NN] Mạng nơ-ron nhân tạo - Neural
Networks: https://dominhhai.github.io/vi/2018/04/nn-intro/#1-perceptrons
[3] Hietala, J (2021, October 14) Traditional Machine Learning Methods vs Deep Learning in Retail
Retrieved from Cognira:
and-traditional-machine-learning%2F&h=AT16S08IDToFvkp1c-
https://l.messenger.com/l.php?u=https%3A%2F%2Fcognira.com%2Fretailers-deep-learning-
aAxImXUqG74fSLEhL3bNI5LL5lyHE2Bg0-koqq5pW3vh88kDie963j1Tf62o277jQmq8uyZa9yEwXKILeqPl_8Gn9Mjyntc7t2VQXJ9Q_s gpTbA9sP8
[4] Hoang, V (n.d.) Sự khác biệt giữa Thị giác máy tính và Xử lý hình ảnh (Computer vision vs
Image processing) Retrieved from NTC thegioimaychu.vn Blog:
xu-ly-hinh-anh-computer-vision-vs-image-processing-p2933/
https://www.thegioimaychu.vn/blog/ai-deep-learning/su-khac-biet-giua-thi-giac-may-tinh-va-[5] Hồng, Ô X (2015, October 29) Feature engineering là gì Retrieved from Ông Xuân Hồng -
Chia sẻ kiến thức và thông tin về Machine learning:
https://ongxuanhong.wordpress.com/2015/10/29/feature-engineering-la-gi/
[6] HTI (2020, July 14) Thị giác máy tính và những ứng dụng không ngờ trong xu thế công nghệ
hiện nay Retrieved from htigroup.vn:
https://htigroup.vn/thi-giac-may-tinh-va-nhung-ung-dung-khong-ngo-trong-xu-the-cong-nghe-hien-nay/
[7] Machine Learning cơ bản (machinelearningcoban.com) (2017, January 21) Retrieved from
Machinelearningcoban: https://machinelearningcoban.com/2017/01/21/perceptron/
[8] Nguyen, L (2017, December 7) Lời giải thích đơn giản về Deep Learning mà gần như ai cũng có
thể hiểu Retrieved from Spiderum:
https://spiderum.com/bai-dang/Loi-giai-thich-don-gian-ve-Deep-Learning-ma-gan-nhu-ai-cung-co-the-hieu-8a9
[9] Niall O’ Mahony, S C (n.d.) Deep Learning vs Traditional Computer Vision
[10] Nttuan8 (2019, March 9) Bài 3: Neural network | Deep Learning cơ bản Retrieved from Deep
Learning cơ bản: https://nttuan8.com/bai-3-neural-network/
Trang 2121
[11] Sforum (2021, September 7) Computer Vision – Nó là gì và tại sao nó quan trọng? Retrieved
from Sforum.vn: quan-trong
https://cellphones.com.vn/sforum/computer-vision-no-la-gi-va-tai-sao-no-[12] Spiderum, N t (25/06/2020) Người Trong Muôn Nghề: Ngành IT có gì? Nhà xuất bản Nhà Xuất
Bản Thế Giới
[13] Yisus777 (2018, April 7) Explain neural networks Like I'm Five Retrieved from DEV
Community: https://dev.to/yisus777/explain-x-like-im-five-3c9c
[14] 3Blue1Brown | “But what is a neural network? | Chapter 1, Deep learning” YouTube, được tải
lên bởi 3Blue1Brown, ngày 05 tháng 10 năm 2017,
www.youtube.com/watch?v=aircAruvnKk&t=717s
[15] Simplilearn | Neural Network In 5 Minutes | What Is A Neural Network? | “How Neural
Networks Work | Simplilearn” YouTube, được tải lên bởi Simplilearn, ngày 05 tháng 10 năm 2019, www.youtube.com/watch?v=bfmFfD2RIcg
Trang 24SỰ VƯỢT TRỘI CỦA DEEP LEARNING