1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Phân tích quan điểm các bài đánh giá sản phẩm trên Shopify bằng cách sử dụng phương pháp tiếp cận TF-IDF & Chi^2

37 18 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phân tích quan điểm các bài đánh giá sản phẩm trên Shopify bằng cách sử dụng phương pháp tiếp cận TF-IDF & Chi^2
Tác giả Phạm Đức Long, Trịnh Đặng Phương Nam, Trần Ngọc Đức
Người hướng dẫn Ngô Hoàng Huy
Trường học Trường Đại Học Điện Lực
Chuyên ngành Công Nghệ Thông Tin
Thể loại Báo cáo chuyên đề học phần
Năm xuất bản 2022
Thành phố Hà Nội
Định dạng
Số trang 37
Dung lượng 780,15 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Khái niệm về học máy: Học máy Machine learning là một lĩnh vực con của Trí tuệ nhântạoArtificial Intelligence sử dụng các thuật toán cho phép máy tính có thể học từ dữ liệu để thực hiện

Trang 1

TRƯỜNG ĐẠI HỌC ĐIỆN LỰC

KHOA CÔNG NGHỆ THÔNG TIN

BÁO CÁO CHUYÊN ĐỀ HỌC PHẦN

Giảng viên hướng dẫn : NGÔ HO䄃

Chuyên ngành : TRÍ TUỆ NHÂN TẠO & THỊ

GIÁC MÁY TÍNH

Hà Nội, tháng 3 năm 2022

Trang 3

MỤC LỤC

LỜI CẢM ƠN 4

LỜI MỞ ĐẦU 5

CHƯƠNG 1 7

TỔNG QUAN VỀ HỌC MÁY, HỌC SÂU V䄃 1.1 Khái niệm về học máy: 7

1.2 Học giám sát và học không giám sát: 7

1.2.1 Học có giám sát (Supervised Learning)-SL 7

1.2.2 Học không giám sát (Unsupervised Learning) - UL: 9

1.3 Ứng dụng của học máy: 11

1.4 Mạng nơ-ron tích chập 12

1.4.1 Giới thiệu chung về mạng CNN………

1.4.2 Sự phát triển của mạng CNN………

1.4.3 Đặc trưng chung của các mạng CNN………

1.5 Các mạng CNN tiêu biểu ………

1.5.1 LeNet-5 ………

1.5.2 AlexNet………

1.5.3 VGG-16………

1.5.4 GoogleNet - Inception-V1………

1.5.5 GoogleNet - Inception-V3………

1.5.6 ResNet-50………

1.5.7 DenseNet………

1.6 Tổng kết………

CHƯƠNG 2 THỬ NGHIỆM V䄃 2.1 Bài toán 18

2.1.1 Phát biểu bài toán: 18

2.1.2 Chuẩn bị dữ liệu: 18

2.1.3 Xử lý dữ liệu: 19

2.1.4 Code và chạy dữ liệu 19

KẾT LUẬN 25 T䄃

Trang 4

LỜI CẢM ƠN

Lời đầu tiên, em xin chân thành gửi lời cảm ơn tới các thầy cô giáo trongTrường Đại học Điện Lực nói chung và các thầy cô giáo trong Khoa Công nghệthông tin nói riêng đã tận tình giảng dạy, truyền đạt cho chúng em những kiến thứccũng như kinh nghiệm quý báu trong suốt quá trình học

Đặc biệt, em gửi lời cảm ơn đến Giáo viên hướng dẫn Ngô Hoàng Huy, thầy

đã tận tình theo sát giúp đỡ, trực tiếp chỉ bảo, hướng dẫn trong suốt quá trìnhnghiên cứu và học tập của chúng em Trong thời gian học tập với thầy, chúng emkhông những tiếp thu thêm nhiều kiến thức bổ ích mà còn học tập được tinh thầnlàm việc, thái độ nghiên cứu khoa học nghiêm túc, hiệu quả Đây là những điều rấtcần thiết cho chúng em trong quá trình học tập và công tác sau này Chúng emmuốn gửi lời cảm ơn đặc biệt nhất, sâu sắc nhất, thân thương nhất đến thầy và chúcthầy luôn dồi dào sức khỏe, tiếp tục giảng dạy hết tâm huyết của mình cho nhữnglứa học trò sau này để đất nước ta ngày càng có nhiều nhân tài, những người giỏitrong các doanh nghiệp, xây dựng đất nước phát triển hơn nữa

Em xin chân thành cảm ơn!

Trang 5

LỜI MỞ ĐẦU

1 Tính cấp thiết của đề tài

Công nghệ ngày càng phổ biến và không ai có thể phủ nhận được tầm quantrọng và những hiệu quả mà nó đem lại cho cuộc sống chúng ta Bất kỳ trong lĩnhvực nào, sự góp mặt của trí tuệ nhân tạo sẽ giúp con người làm việc và hoàn thànhtốt công việc hơn Và gần đây, một thuật ngữ “machine learning” rất được nhiềungười quan tâm.Thay vì phải code phần mềm với cách thức thủ công theo một bộhướng dẫn cụ thể nhằm hoàn thành một nhiệm vụ đề ra thì máy sẽ tự “học hỏi”bằng cách sử dụng một lượng lớn dữ liệu cùng những thuật toán cho phép nó thựchiện các tác vụ

Đây là một lĩnh vực khoa học tuy không mới, nhưng cho thấy lĩnh vực trí tuệnhân tạo đang ngày càng phát triển và có thể tiến xa hơn trong tương lai Đồngthời, thời điểm này nó được xem là một lĩnh vực “nóng” và dành rất nhiều mốiquan tâm để phát triển nó một cách mạnh mẽ, bùng nổ hơn

Hiện nay, việc quan tâm machine learning càng ngày càng tăng lên là vì nhờ

có machine learning giúp gia tăng dung lượng lưu trữ các loại dữ liệu sẵn, việc xử

lý tính toán có chi phí thấp và hiệu quả hơn rất nhiều

Những điều trên được hiểu là nó có thể thực hiện tự động, nhanh chóng để tạo

ra những mô hình cho phép phân tích các dữ liệu có quy mô lớn hơn và phức tạphơn đồng thời đưa ra những kết quả một cách nhanh và chính xác hơn

Cùng với sự phát triển của mạng internet các loại hình thương mại trực tuyếnphát triển rất nhanh, tiêu biểu như hệ thống Amazon, Yelp và Tripadvisor Đặcđiểm chung của các hệ thống thương mại là cho phép khách hàng thể hiện ý kiếnđánh giá về các sản phẩm, dịch vụ Những ý kiến đánh giá này là phần quan trọngcủa mỗi hệ thống bởi nó cung cấp thông tin tới khách hàng khác và giúp họ có sựhiểu biết nhất định về sản phẩm hay dịch vụ của hệ thống để đưa ra quyết định cónên sử dụng dịch vụ này hay không

Trang 6

2 Mục tiêu nghiên cứu

Báo cáo xây dựng được mô hình TF-IDF & Chi^2 nhằm phân tích quan điểmcác bài đánh giá sản phẩm trên nền web thương mại điện tử Shopify

3 Đối tượng và phạm vi nghiên cứu

- Đối tượng nghiên cứu: Phạm vi nghiên cứu: Đồ án chỉ nghiên cứu trong phạmquy nhu cầu thực tế

4 Phương pháp nghiên cứu

- Sử dụng thuật toán TF-IDF để lọc các kết quả và thuật toán Chi^2 để xác địnhmức độ chuẩn xác của bộ dữ liệu

5 Kết cấu báo cáo:

Báo cáo gồm 2 chương:

+ Chương 1: Tổng quan về học máy và mô hình TF-IDF & Chi^2

+ Chương 2: Thử nghiệm và đánh giá kết quả

Trang 7

CHƯƠNG 1

TỔNG QUAN VỀ HỌC MÁY V䄃

1.1 Khái niệm về học máy:

Học máy (Machine learning) là một lĩnh vực con của Trí tuệ nhântạo(Artificial Intelligence) sử dụng các thuật toán cho phép máy tính có thể học từ

dữ liệu để thực hiện các công việc thay vì được lập trình một cách rõ ràng, cungcấp cho hệ thống khả năng tự động học hỏi và cải thiện hiệu suất, độ chính xác dựatrên những kinh nghiệm từ dữ liệu đầu vào Học máy tập trung vào việc phát triểncác phần mềm, chương trình máy tính có thể truy cập vào dữ liệu và tận dụngnguồn dữ liệu đó để tự học

Học máy vẫn đòi hỏi sự đánh giá của con người trong việc tìm hiểu dữ liệu cơ

sở và lựa chọn các kĩ thuật phù hợp để phân tích dữ liệu Đồng thời, trước khi sửdụng, dữ liệu phải sạch, không có sai lệch và không có dữ liệu giả

Các mô hình học máy yêu cầu lượng dữ liệu đủ lớn để "huấn luyện" và đánhgiá mô hình Trước đây, các thuật toán học máy thiếu quyền truy cập vào mộtlượng lớn dữ liệu cần thiết để mô hình hóa các mối quan hệ giữa các dữ liệu Sựtăng trưởng trong dữ liệu lớn (big data) đã cung cấp các thuật toán học máy với đủ

dữ liệu để cải thiện độ chính xác của mô hình và dự đoán

Học máy có 2 loại Học có giám sát (Supervised Learning) và Học không có giám sát(Unsupervised Learning)

1.2 Học giám sát và học không giám sát:

1.2.1 Học có giám sát (Supervised Learning)-SL

Là phương pháp sử dụng những dữ liệu đã được gán nhãn từ trước để suyluận ra quan hệ giữa đầu vào và đầu ra Các dữ liệu này được gọi là dữ liệu huấnluyện và chúng là cặp các đầu vào-đầu ra

Học có giám sát sẽ xem xét các tập huấn luyện này để từ đó có thể đưa ra dựđoán đầu ra cho 1 đầu vào mới chưa gặp bao giờ Mỗi bộ dữ liệu có cấu trúc theocặp {x, y} với x được xem là dữ liệu thô (raw data) và y là nhãn của dữ liệu đó.Nhiệm vụ của SL là dự đoán đầu ra mong muốn dựa vào giá trị đầu vào Dễ nhận

ra, học có GIÁM SÁT tức là máy học dựa vào sự trợ giúp của con người, hay nói

Trang 8

cách khác con người dạy cho máy học và giá trị đầu ra mong muốn được địnhtrước bởi con người Tập dữ liệu huấn luyện hoàn toàn được gán nhãn dựa vào conngười Tập càng nhỏ thì máy tính học càng ít SL cũng được áp dụng cho 2 nhómbài toán chính là bài toán dự đoán (regression) và bài toán phân lớp (classification),

dự đoán giá nhà, phân loại email dựa trên tập dữ liệu mẫu - tập huấn luyện

(training data).

Học có giám sát là một hướng tiếp cận của Máy học để làm cho máy tính cókhả năng "học" Trong hướng tiếp cận này, người ta "huấn luyện" máy tính dựatrên những quan sát có dán nhãn Ta có thể hình dung những quan sát này như lànhững câu hỏi, và nhãn của chúng là những câu trả lời

Ý tưởng của học có giám sát là: bằng việc ghi nhớ và tổng quát hóa một sốquy tắc từ một tập câu hỏi có đáp án trước, máy tính sẽ có thể trả lời được nhữngcâu hỏi dù chưa từng gặp phải, nhưng có mối liên quan

Ví dụ ta dạy máy tính "1 + 1 = 2" và hy vọng nó sẽ học được phép tính cộng x+ 1 và trả lời được là "2 + 1 = 3" Học có giám sát mô phỏng việc con người họcbằng cách đưa ra dự đoán của mình cho một câu hỏi, sau đó đối chiếu với đáp án

Trang 9

Sau đó con người rút ra phương pháp để trả lời đúng không chỉ câu hỏi đó, mà chonhững câu hỏi có dạng tương tự.

Trong học có giám sát, các quan sát bắt buộc phải được dán nhãn trước Đâychính là một trong những nhược điểm của phương pháp này, bởi vì không phải lúcnào việc dán nhãn chính xác cho quan sát cũng dễ dàng Ví dụ như trong dịchthuật, từ một câu của ngôn ngữ gốc có thể dịch thành rất nhiều phiên bản khácnhau trong ngôn ngữ cần dịch sang Tuy nhiên, việc quan sát được dán nhãn cũnglại chính là ưu điểm của học có giám sát bởi vì một khi đã thu thập được một bộ dữliệu lớn được dán nhãn chuẩn xác, thì việc huấn luyện trở nên dễ dàng hơn rấtnhiều so với khi dữ liệu không được dán nhãn

1.2.2 Học không giám sát (Unsupervised Learning) - UL:

Unsupervised Learning là một nhóm thuật toán hay phương pháp kỹ thuật chophép máy tự học hỏi và tìm ra một mô hình hay cấu trúc nào đó ẩn trong một bộ dữliệu không được gắn nhãn trước Điều này đồng nghĩa với việc chúng ta chỉ có bộ

dữ liệu đầu vào và hoàn toàn không biết comeout là gì

Ứng dụng phổ biến nhất của học không giám sát là gom cụm (cluster)

Trong thuật toán này, chúng ta không biết được dữ liệu đầu ra hay nhãn mà

chỉ có dữ liệu đầu vào Thuật toán Học không giám sát dựa vào cấu trúc của dữliệu để thực hiện một công việc nào đó, ví dụ như phân nhóm hoặc giảm số chiềucủa dữ liệu để thuận tiện trong việc lưu trữ và tính toán

Trang 10

Một cách toán học, Học không giám sát là khi chúng ta chỉ có dữ liệu vào X

mà không biết nhãn Y tương ứng.

Trang 11

Sự khác nhau giữa học có giám sát và học không giám sát:

Học có giám sát: Là cách huấn luyện một mô hình trong đó dữ liệu học có đầuvào và đầu ra tương ứng đầu vào đó Mô hình được huấn luyện bằng cách giảmthiểu sai số lỗi (loss) của các dự đoán tại các vòng lặp huấn luyện Sau quá trìnhhuấn luyện mô hình sẽ có khả năng đưa ra dự đoán về đầu ra với một đầu vào mớigặp (không có trong dữ liệu học) Nếu không gian đầu ra được biểu diễn dứới dạngrời rạc, ta gọi đó là bài toán phân loại (classification) Nếu không gian đầu ra đượcbiểu diễn dưới dạng liên tục, ta gọi đó là bài toán hồi quy (regression)

Học không giám sát: Là cách huấn luyện một mô hình trong đó dữ liệu họcchỉ bao gồm đầu vào mà không có đầu ra Mô hình sẽ được huấn luyện cách để tìmcấu trúc hoặc mối quan hệ giữa các đầu vào Một trong những phương pháp họckhông giám sát quan trọng nhất là phân cụm (clustering): Tạo các cụm khác nhauvới mỗi cụm biểu diễn một đặc trưng nào đó của dữ liệu và phân các đầu vào mớivào các cụm theo các đặc trưng của đầu vào đó Các phương pháp học không giámsát khác có thể kể đến như: phát hiện điểm bất thường (anomaly detection),Singular-value decomposition, …

Giả sử bạn cần nhận ra xe nào là xe hơi và xe nào là xe máy

Trong học có giám sát trường hợp học tập, tập dữ liệu đầu vào (đào tạo) củabạn cần được dán nhãn, nghĩa là, đối với mỗi yếu tố đầu vào trong tập dữ liệu đầuvào (đào tạo) của bạn, bạn nên chỉ định nếu nó đại diện cho ô tô hoặc xe máy Trong học không giám sát trường hợp học tập, bạn không gắn nhãn đầu vào

Mô hình không giám sát sẽ phân cụm đầu vào thành các cụm dựa trên, ví dụ: trên

Trang 12

các tính năng/tính chất tương tự Vì vậy, trong trường hợp này, không có nhãn như

+ Các kết quả tìm kiếm trên web

+ Quảng cáo theo thời gian thực trên các trang web và các thiết bị di động.+ Điểm số tín dụng và lời mời chào tiếp theo tốt nhất

+ Dự đoán những hư hỏng của thiết bị

+ Những mô hình định giá mới

+ Phân nhóm hay chia nhóm là khi máy phân tích, tìm hiểu và khám phá các

nhóm vốn có bên trong bộ dữ liệu, từ đó giúp bạn phân nhóm các khách hàng củamình theo hành vi mua hàng hay phân loại các bài viết, hình ảnh có cùng nội dungchẳng hạn

+ Kết hợp: được vận dụng khi máy khám phá các quy tắc mô tả dữ liệu, ví dụ

như người mua món hàng này sẽ có xu hướng mua một món hàng tương ứng nào

đó có liên quan

+ Marketing và sales: Dựa trên hành vi mua hàng trước đây, các trang web sử

dụng Machine Learning phân tích lịch sử mua hàng, từ đó giới thiệu những vậtdụng mà bạn có thể sẽ quan tâm và yêu thích Khả năng tiếp nhận dữ liệu, phântích và sử dụng những dữ liệu đó để cá nhân hóa trải nghiệm mua sắm (hoặc thựchiện chiến dịch Marketing) chính là tương tai của ngành bán lẻ

+ Ứng dụng trong các mạng xã hội

Trang 13

Học máy đang được sử dụng trong một loạt các ứng dụng ngày nay Mộttrong những ví dụ nổi tiếng nhất là Facebook News Feed Nguồn cấp tin tức sửdụng học máy để cá nhân hóa từng nguồn cấp dữ liệu thành viên Nếu một thànhviên thường xuyên dừng lại để đọc hoặc thích một bài đăng của một người bạn cụthể, News Feed sẽ bắt đầu hiển thị nhiều hơn về hoạt động của người bạn đó trước

đó trong nguồn cấp dữ liệu Đằng sau hệ thống ấy, phần mềm sử dụng phân tíchthống kê và phân tích dự đoán để xác định các mẫu trong dữ liệu người dùng và sửdụng các mẫu đó để điền vào News Feed Nếu thành viên không còn dừng lại đểđọc, thích hoặc bình luận trên các bài đăng của bạn bè, dữ liệu mới đó sẽ được baogồm trong tập dữ liệu và News Feed sẽ điều chỉnh tương ứng Không chỉ riêngfacebook, ta có thể bắt gặp những tính năng tương tự đó qua các mạng xã hội khácnhư google, instagram,

+ Nhận diện hình ảnh

Nhận dạng hình ảnh là một trong những ví dụ về máy học và trí tuệ nhân tạophổ biến nhất Về cơ bản, nó là một cách tiếp cận để xác định và phát hiện các đặctrưng của một đối tượng trong hình ảnh kỹ thuật số Hơn nữa, kỹ thuật này có thểđược sử dụng để phân tích sâu hơn, chẳng hạn như nhận dạng mẫu, nhận diện hìnhkhuôn, nhận dạng khuôn mặt, nhận dạng ký tự quang học và nhiều hơn nữa, + Xử lý ngôn ngữ tự nhiên (NLP):

Nếu bạn nghĩ Google Translate tự bản thân nó đã thực sự là một cuốn từ điểnhoàn hảo thì bạn nên suy nghĩ lại Nó thực ra được tạo nên từ một bộ các thuật toánHọc máy dựa trên việc cập nhật theo thời gian các đầu vào từ phía người dùng, như

từ mới và cú pháp mới Siri, Alexa, Cortana, và gần đây nhất là Google Assistant,

tất cả đều dựa trên việc Xử lý ngôn ngữ tự nhiên để Nhận dạng giọng nói, Tổng

hợp giọng nói (dựa trên một phần), cho phép chúng hiểu hay phát âm ra những từchưa từng gặp phải trước đó

1.4 Mạng nơ-ron tích chập

1.4.1 Giới thiệu chung về mạng CNN:

Trong mạng neural, mô hình mạng neural tích chập (CNN) là 1 trong những mô hình để nhận dạng và phân loại hình ảnh Trong đó, xác định đối

Trang 14

tượng và nhận dạng khuôn mặt là 1 trong số những lĩnh vực mà CNN được

sử dụng rộng rãi

CNN phân loại hình ảnh bằng cách lấy 1 hình ảnh đầu vào, xử lý và phân loại nó theo các hạng mục nhất định (Ví dụ: Chó, Mèo, Hổ, ) Máy tính coihình ảnh đầu vào là 1 mảng pixel và nó phụ thuộc vào độ phân giải của hình ảnh Dựa trên độ phân giải hình ảnh, máy tính sẽ thấy H x W x D (H: Chiều cao, W: Chiều rộng, D: Độ dày) Ví dụ: Hình ảnh là mảng ma trận RGB 6x6x3 (3 ở đây là giá trị RGB)

Về kỹ thuật, mô hình CNN để training và kiểm tra, mỗi hình ảnh đầu vào

sẽ chuyển nó qua 1 loạt các lớp tích chập với các bộ lọc (Kernals), tổng hợp lại các lớp được kết nối đầy đủ (Full Connected) và áp dụng hàm Softmax đểphân loại đối tượng có giá trị xác suất giữa 0 và 1 Hình dưới đây là toàn bộ luồng CNN để xử lý hình ảnh đầu vào và phân loại các đối tượng dựa trên giá trị

Trang 16

sự phát triển của dữ liệu và khả năng tính toán nên mạng CNN vẫn chưa có

cơ hội bùng nổ Các mô hình machine learning truyền thống như SVM, kNNvẫn được sử dụng phổ biến

 2009: Bộ dữ liệu ImageNet được giới thiệu vào năm 2009 là một trong những bộ dữ liệu tạo ra sự thay đổi trong cộng đồng computer vision Đây là

bộ dữ liệu lớn nhất so với các bộ dữ liệu từng có từ trước đến thời điểm đó Với kích thước lên tới 1 triệu ảnh và phân bố đều trên 1000 nhãn Các mô hình được huấn luyện trên ImageNet có thể chuyển giao tới rất nhiều những domain dữ liệu khác nhau Kể từ thời điểm 2010, ImageNet trở thành tiêu chuẩn đo đạc sự phát triển của các thuật toán học có giám sát trong thị giác máy tính

 2012: Mạng AlexNet sử dụng tích chập CNN lần đầu tiên vượt qua các phương pháp tạo đặc trưng thủ công truyền thống như HOG, SHIFT và đạt

Downloaded by Free Games Android (vuchinhhp1@gmail.com)

Trang 17

độ chính xác cách biệt trong cuộc thi ImageNet Dấu mốc đó đã khởi đầu cho xu hướng ứng dụng CNN trong computer vision thay thế cho những thuật toán học máy truyền thống trước kia.

 Liên tiếp vào những năm sau đó, ngày càng xuất hiện nhiều các kiến trúc CNN mới Chúng được hình thành, phát triển và cải tiến về độ sâu, cách thiết kế block, cách kết nối giữa các block Lần lượt từ VGG Net,

GoogleNet, ResNet, DenseNet,… mà chúng ta sẽ tìm hiểu qua bài viết này được ra đời dựa trên sự kế thừa những ý tưởng cũ và phát triển những ý tưởng mới mẻ Qúa trình phát triển của các kiến trúc mạng song hành cùng với sự phát triển phần cứng máy tính như các GPU có tốc độ nhanh hơn Kỹ thuật huấn luyện phân tán và song song trên nhiều GPU cho phép một modelhuấn luyện chỉ trong vòng một vài tiếng so với việc huấn luyện kéo dài qua nhiều ngày và tốn kém như trước đây Các framework hỗ trợ deep learning cũng xuất hiện nhiều hơn, được cải tiến và trở thành công cụ đáp ứng mọi nhu cầu cần thiết cho quá trình huấn luyện deep learning Phổ biến nhất có

thể kể tới ba frameworks pytorch (facebook), tensorflow (google), mxnet

(intel) được phát triển và hậu thuẫn từ những công ty công nghệ hàng đầu

thế giới Kể từ sau ImageNet, các bộ dữ liệu ảnh đã khẳng định vai trò thúc đẩy sự phát triển của ngành AI Các thuật toán được so sánh với nhau dựa

trên kết quả dẫn đầu (leader board) từ những bộ dữ liệu chuẩn hoá Nhờ sự

mở rộng của những nền tảng huấn luyện free như google colab, kaggle mà mọi người đều có thể tiếp cận được với AI Chiến lược phát triển toàn cầu về

AI ở các tập đoàn, quốc gia trên thế giới dẫn tới sự hình thành những viện nghiên cứu về AI qui tụ được nhiều nhà khoa học xuất sắc và có những nghiên cứu đột phá

1.4.3 Đặc trưng chung của các mạng CNN

Sử dụng tích chập: Các mạng CNN đều trích suất đặc trưng dựa trên nguyên

lý tích chập Bởi vậy tên gọi chung cho chúng là Convolutional Neural Network (Mạng nơ ron tích chập)

Kiến trúc phân tầng: Kiến trúc phân tầng giúp mạng CNN học được đặc trưng ở những cấp độ khác nhau, từ cấp độ low-level (bậc thấp) tới high-level (bậc cao) Theo đó, mức độ chi tiết của hình ảnh cũng tăng tiến dần từ các đặc trưng chung như các đường chéo, ngang, dọc rìa, cạnh tới những cácđặc trưng chi tiết hơn giúp phân biệt vật thể như bánh xe, cánh cửa, mui xe

Downloaded by Free Games Android (vuchinhhp1@gmail.com)

Trang 18

(nếu vật thể là xe), tất cả các chi tiết đó được tổng hợp lại và ở layer tích chập cuối cùng ta thu được hình ảnh của một chiếc xe

Được huấn luyện trên những bộ dữ liệu lớn: Sẽ không có một sự khác biệt đáng kể giữa mô hình học sâu nhiều tầng và các phương pháp học máy truyền thống nếu chỉ huấn luyện trên một bộ dữ liệu rất nhỏ Vì dữ liệu nhỏ chỉ cần một không gian biểu diễn nhỏ từ phương pháp truyền thống là đủ để phân biệt các nhãn với nhau Nhưng trên các bộ dữ liệu lớn, kiến trúc học sâu nhiều tầng đã cho thấy ưu thế vượt trội về độ chính xác và khả năng biểudiễn Điều này cũng dễ hiểu bởi kích thước mạng nơ ron có thể lên tới hàng chục triệu tham số và lớn hơn rất nhiều so với số lượng tham số của các phương pháp học máy truyền thống dẫn tới khả năng biểu diễn tốt hơn.Kích thước layers giảm dần: Hình 3 là kiến trúc của mạng AlexNet, một trong những kiến trúc CNN ta có thể thấy kích thước layers giảm dần theo

độ sâu Thông thường mức độ giảm lý tưởng là cấp số 2 Các nghiên cứu đã chỉ ra rằng việc kích thước layers giảm dần giúp giảm thiểu số lượng tham

số của mô hình đáng kể và giúp tạo ra những mạng có kích thước nhẹ hơn vàtốc độ dự báo nhanh hơn Trong khi độ chính xác của mô hình giảm không đáng kể

Độ sâu tầng layers tăng dần: Độ sâu của các layers tăng dần nhờ tăng số bộ lọc, thường là theo cấp số nhân Độ sâu tăng sẽ giúp cho mạng CNN học được đa dạng các đặc trưng hơn Ở những layer đầu tiên là những đặc trưng chung, chúng khá giống nhau về hình dạng, phương hướng, nên không cần quá nhiều bộ lọc để tạo ra chúng với số lượng lớn Càng ở những layers sau đòi hỏi độ chi tiết cao hơn thì yêu cầu số lượng bộ lọc nhiều hơn để giúp phân biệt được nhiều chi tiết đặc trưng hơn

Sử dụng các fully connected layers để phân loại: Tích chập từ mạng CNN sẽtạo ra những đặc trưng 2 chiều Để sử dụng những đặc trưng này vào quá trình phân loại của mạng CNN thì chúng ta phải chuyển chúng thành đặc trưng 1 chiều bằng phương pháp flatten và lan truyền thuận qua các fully connected layers Đằng sau mỗi một layer là một hàm kích hoạt phi tuyến nhằm gia tăng khả năng biểu diễn giúp cho kết quả phân loại tốt hơn

Downloaded by Free Games Android (vuchinhhp1@gmail.com)

Ngày đăng: 10/01/2023, 23:18

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w