1. Trang chủ
  2. » Thể loại khác

Nghiên cứu và xây dựng ứng dụng phân tích dữ liệu kinh doanh thiết bị điện tử (tt)

25 239 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 25
Dung lượng 1,48 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Nghiên cứu và xây dựng ứng dụng phân tích dữ liệu kinh doanh thiết bị điện tửNghiên cứu và xây dựng ứng dụng phân tích dữ liệu kinh doanh thiết bị điện tửNghiên cứu và xây dựng ứng dụng phân tích dữ liệu kinh doanh thiết bị điện tửNghiên cứu và xây dựng ứng dụng phân tích dữ liệu kinh doanh thiết bị điện tửNghiên cứu và xây dựng ứng dụng phân tích dữ liệu kinh doanh thiết bị điện tửNghiên cứu và xây dựng ứng dụng phân tích dữ liệu kinh doanh thiết bị điện tửNghiên cứu và xây dựng ứng dụng phân tích dữ liệu kinh doanh thiết bị điện tửNghiên cứu và xây dựng ứng dụng phân tích dữ liệu kinh doanh thiết bị điện tửNghiên cứu và xây dựng ứng dụng phân tích dữ liệu kinh doanh thiết bị điện tửNghiên cứu và xây dựng ứng dụng phân tích dữ liệu kinh doanh thiết bị điện tử

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

NINH HOÀI ANH

NGHIÊN CỨU VÀ XÂY DỰNG ỨNG DỤNG

PHÂN TÍCH DỮ LIỆU KINH DOANH THIẾT BỊ ĐIỆN TỬ

Ngành: Công nghệ thông tin

Chuyên ngành: Kỹ thuật phần mềm

Mã số: 60480103

TÓM TẮT LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN

Hà Nội - 2017

Trang 2

2

MỤC LỤC

MỞ ĐẦU 3

CHƯƠNG 1 ĐẶT VẤN ĐỀ 5

1.1 Bài toán phân tích dữ liệu 5

1.2 Lựa chọn miền ứng dụng 5

1.3 Phương pháp và công cụ 5

1.3.1 Lựa chọn phương pháp 5

1.3.2 Lựa chọn công cụ 6

CHƯƠNG 2 MÔ HÌNH HỒI QUY TUYẾN TÍNH VÀ CÔNG CỤ HỖ TRỢ WEKA 7

2.1 Mô hình hồi quy tuyến tính 7

2.1.1 Lý thuyết về mô hình hồi quy 7

2.1.2 Mô hình hồi quy tuyến tính 8

2.1.3 Phương pháp bình phương tối thiểu để ước lượng các tham số của mô hình hồi quy tuyến tính 9

2.1.4 Ứng dụng mô hình hồi quy tuyến tính vào phân tích dữ liệu 9

2.2 Công cụ hỗ trợ xây dựng mô hình hồi quy tuyến tính WEKA 12

2.2.1 Giới thiệu về WEKA 12

2.2.2 Các chức năng chính của WEKA 13

2.2.3 Xây dựng mô hình hồi quy tuyến tính với WEKA 13

CHƯƠNG 3 THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ 16

3.1 Phát biểu bài toán thực tế 16

3.2 Tiến hành xây dựng mô hình 16

3.2.1 Thu thập dữ liệu 16

3.2.2 Tiền xử lý dữ liệu 17

3.2.3 Lựa chọn thuộc tính 19

3.2.4 Xây dựng và đánh giá mô hình 20

3.3 Tính toán thử nghiệm độ chính xác dự báo 22

CHƯƠNG 4 KẾT LUẬN 24

TÀI LIỆU THAM KHẢO 25

Trang 3

3

MỞ ĐẦU

Ngày nay, dữ liệu được sinh ra từng phút, từng giây, có ở khắp mọi nơi và chúng có thể chỉ cho ta thấy nhiều điều Tuy nhiên, làm thế nào để dữ liệu trở nên có ý nghĩa lại trở thành một vấn đề không nhỏ đối với những cá nhân, tổ chức sở hữu những khối dữ liệu này

Phân tích dữ liệu là khoa học khám phá dữ liệu thô nhằm rút ra kết luận từ những dữ liệu ấy Phân tích dữ liệu được sử dụng trong nhiều ngành công nghiệp để hỗ trợ các công ty, tổ chức để đưa ra quyết định kinh doanh tốt hơn hoặc trong các ngành khoa học để xác nhận hay bác bỏ các mô hình, lý thuyết hiện có Quá trình phân tích dữ liệu bao gồm các bước kiểm tra, làm sạch, chuyển đổi và mô hình hóa dữ liệu với mục đích tìm thông tin hữu ích, cho thấy kết luận hoặc hỗ trợ ra quyết định dựa trên bộ dữ liệu hiện có

Vấn đề nghiên cứu và ứng dụng phân tích dữ liệu vào các lĩnh vực rất phổ biến và phát triển trên thế giới Tuy nhiên, tại Việt Nam, vấn đề này còn chưa được ứng dụng rộng rãi, nhất là trong lĩnh vực kinh doanh thương mại Trên cơ

sở các nghiên cứu đã có, luận văn tập trung vào các mục tiêu và các vấn đề cần giải quyết sau:

Mục tiêu và phạm vi nghiên cứu:

Luận văn tập trung nghiên cứu về mô hình hồi quy tuyến tính, phương pháp

sử dụng mô hình hồi quy tuyến tính trong phân tích dữ liệu, tìm hiểu công cụ

hỗ trợ phân tích dữ liệu Weka

Mục tiêu chính của luận văn là dựa trên công cụ Weka xây dựng được mô hình hồi quy tuyến tính dự đoán giá của mặt hàng máy tính xách tay trên thị trường Việt Nam thông qua việc phân tích dữ liệu bán hàng của Công ty cổ phần thương mại Nguyễn Kim Từ đó, hỗ trợ các doanh nghiệp, nhà phân phối máy tính xách tay đưa giá bán cạnh tranh nhất trên thị trường Bên cạnh đó, cũng giúp người tiêu dùng ước lượng chi phí để mua một chiếc máy tính xách tay phù hợp với nhu cầu của bản thân

Phương pháp nghiên cứu:

Trong phạm vi luận văn này, tôi đã sử dụng 03 phương pháp nghiên cứu khoa học để tiếp cận và làm rõ những vấn đề của đề tài mà mình đã lựa chọn

Đó là các phương pháp nghiên cứu sau:

- Phương pháp phân tích và tổng hợp lý thuyết: Nghiên cứu các tài liệu

khác nhau về mô hình hồi quy tuyến tính, phân tích dữ liệu và công cụ Weka; phân tích để tìm hiểu sâu sắc đối với mỗi vấn đề và tổng hợp để có cái nhìn tổng quan và đầy đủ về các vấn đề cần tìm hiểu

- Phương pháp thực nghiệm khoa học: Chủ động tiến hành thu thập, xử lý

dữ liệu bán máy tính xách tay; sử dụng công cụ Weka xây dựng mô hình hồi quy tuyến tính để dự báo giá

Trang 4

4

- Phương pháp phân tích, tổng kết kinh nghiệm: Nghiên cứu, phân tích và

đánh giá các mô hình đã xây dựng để từng bước xây dựng mô hình phù hợp nhất với độ tin cậy, chính xác cao hơn

Bố cục của luận văn:

Luận văn được trình bày với bố cục gồm 04 chương với những nội dung chính như sau:

Chương 1 - Đặt vấn đề: Phát biểu bài toán, lựa chọn miền ứng dụng và giới

thiệu các phương pháp và công cụ để giải quyết bài toán

Chương 2 - Mô hình hồi quy tuyến tính và công cụ hỗ trợ Weka: Trình bày

cơ sở lý thuyết của mô hình hồi quy, đi vào cụ thể với mô hình hồi quy tuyến tính Đồng thời, giới thiệu về công cụ Weka, xây dựng mô hình hồi quy tuyến tính với sự hỗ trợ của Weka

Chương 3 - Thực nghiệm và đánh giá kết quả: Sử dụng công cụ Weka để

xây dựng mô hình hồi quy tuyến tính dự báo giá bán máy tính xách tay của Công ty cổ phần thương mại Nguyễn Kim Tiến hành phân tích, xây dựng mô hình và đánh giá kết quả thu được

Chương 4 - Kết luận: Trình bày kết quả đạt được của luận văn và định

hướng phát triển trong tương lai

Trang 5

5

Chương 1

ĐẶT VẤN ĐỀ

1.1 Bài toán phân tích dữ liệu

Dữ liệu được tạo ra từng giây, từng phút trong đời sống xã hội hiện đại Chúng có thể là dữ liệu web, dữ liệu từ các cảm biến, các tệp lưu nhật ký, dữ liệu cá nhân, dữ liệu từ các thiết bị thông minh,… Từ khối dữ liệu này mà chúng ta có thể tìm kiếm, khai thác và trích xuất ra những thông tin hữu ích Làm thế nào để có được những thông tin ấy là vấn đề được đặt ra Phân tích dữ liệu là một trong những chìa khóa giúp chúng ta giải quyết vấn đề nêu trên Vậy phân tích dữ liệu là gì?

Phân tích dữ liệu là một trong những ứng dụng thực tiễn của kỹ thuật khai phá dữ liệu Phân tích dữ liệu là một quá trình trích xuất thông tin hữu ích từ tập dữ liệu được cung cấp Các bước cơ bản của quá trình phân tích dữ liệu bao gồm: Kiểm định, làm sạch, chuyển đổi, mô hình hóa và phân tích dữ liệu nhằm mục đích tìm kiếm thông tin, cho thấy kết luận, hỗ trợ đưa ra quyết định Trước khi có máy tính, nhiều phương pháp phân tích cho tập dữ liệu nhỏ đã phát triển và tập trung phân tích từng biến riêng lẻ Ngày nay, khi khả năng tính toán của máy tính đã phát triển vượt bậc, phân tích dữ liệu đã phân tích đồng thời quan hệ của nhiều biến

1.2 Lựa chọn miền ứng dụng

Trong khuôn khổ luận văn này, tác giả tập trung nghiên cứu, ứng dụng phân tích dữ liệu vào lĩnh vực kinh doanh Dữ liệu bán hàng của các công ty điện máy là khối dữ liệu đồ sộ với đa dạng các loại mặt hàng của nhiều nhà cung cấp được bày bán với mức giá có thể thay đổi theo thời gian và từng chương trình khuyến mãi khác nhau Khối dữ liệu này được thể hiện đầy đủ và đáng tin cậy trên website của các công ty điện máy và có thể được thu thập một cách chính xác thông qua các công cụ sẵn có Tác giả lấy dữ liệu bán hàng của Công

ty cổ phần thương mại Nguyễn Kim là điển hình Phân tích dữ liệu bán hàng của Công ty cổ phần thương mại Nguyễn Kim để hỗ trợ các công ty điện máy

dự đoán và đưa ra giá bán cạnh tranh nhất cho mặt hàng máy tính xách tay trên thị trường Việt Nam

1.3 Phương pháp và công cụ

1.3.1 Lựa chọn phương pháp

Phân tích dữ liệu khẳng định là lựa chọn không thể bỏ qua để hỗ trợ đưa ra quyết định kinh doanh sáng suốt Một mô hình dữ liệu được xây dựng dựa trên tập dữ liệu lịch sử Những thuật toán học máy được sử dụng để xây dựng mô hình dữ liệu ẩn giấu trong tập dữ liệu này Sau khi mô hình dữ liệu được xác nhận, nó được coi là tổng quát hóa kiến thức và có thể dự đoán tương lai Bằng cách này, các doanh nghiệp có thể dự đoán các nguy cơ tiềm ẩn trong tương lai

để hoạch định chiến lược kinh doanh phù hợp

Trang 6

6 Thống kê cung cấp các phương pháp, kỹ thuật xây dựng mô hình toán học

để phân tích dữ liệu Hai phương pháp thống kê chính được sử dụng trong phân tích dữ liệu là: Thống kê mô tả (Descriptive statistics) và thống kê suy diễn (Inferential statistics) Dữ liệu thống kê thường được thu thập để trả lời các câu hỏi được định trước Thống kê mô tả tóm tắt dữ liệu từ một mẫu thí nghiệm còn thống kê suy diễn rút ra kết luận từ dữ liệu Ngày nay, với sự phát triển không ngừng về khả năng tính toán của máy tính, thống kê được sử dụng nhiều trong học máy (Machine learning) nhằm xây dựng các mô hình toán cho các thuật toán học máy Thống kê suy diễn được sử dụng nhiều trong phân tích

dữ liệu khẳng định

Trong khuôn khổ luận văn này, tác giả tập trung nghiên cứu mô hình hồi quy tuyến tính trong thống kê với mục đích xây dựng mô hình học máy cho bài toán phân tích dữ liệu để dự đoán tương lai

1.3.2 Lựa chọn công cụ

Hiện tại, các công cụ hỗ trợ phân tích dữ liệu đã xuất hiện nhiều như R, SPSS, Weka,… Tuy nhiên, tác giả lựa chọn và nghiên cứu phần mềm Weka Đây là phần mềm được phát triển bằng Java nhằm phát triển các kỹ thuật học máy và áp dụng chúng vào các bài toán khai phá dữ liệu trong thực tế

Trang 7

7

Chương 2

MÔ HÌNH HỒI QUY TUYẾN TÍNH

VÀ CÔNG CỤ HỖ TRỢ WEKA 2.1 Mô hình hồi quy tuyến tính

2.1.1 Lý thuyết về mô hình hồi quy

Phân tích hồi quy nghiên cứu sự phụ thuộc của biến phụ thuộc vào một hay nhiều biến độc lập để ước lượng hay dự đoán giá trị trung bình của biến phụ thuộc trên cơ sở các giá trị biết trước của biến độc lập Phân tích hồi quy được

mô hình hóa thông qua dưới dạng:

Trong đó: X là biến độc lập, Y là biến phụ thuộc, ε là sai số ngẫu nhiên và f(X) = E(Y|X) là hàm hồi quy tổng thể PRF cho biết giá trị trung bình của biến

Y sẽ thay đổi như thế nào khi biến X nhận các giá trị khác nhau

Mô hình (2.1) được gọi là mô hình hồi quy Để khảo sát mô hình hồi quy người ta tiến hành quan sát các bộ số (Xi, Yi) Ở lần quan sát thứ i, biến X nhận giá trị Xi, biến Y nhận giá trị Yi và sai số ngẫu nhiên là εi Khi đó, mô hình (2.1) trở thành: Yi = f(Xi) + εi = E(Y|Xi) + εi (2.2)

εi là độ chênh lệch giữa giá trị quan sát Yi của biến phụ thuộc Y với giá trị trung bình của Y khi biến độc lập X nhận giá trị Xi ε tồn tại bởi nhiều yếu tố tác động Một yếu tố quan trọng là do ngoài các biến độc lập X đã được đưa vào mô hình có thể còn có các biến khác chưa được xem xét tới cũng ảnh hưởng đến giá trị của biến phụ thuộc Y nên ε đại diện cho phần ảnh hưởng ấy

Từ (2.2) ta có: εi = Yi - f(Xi) => εi  0  Yi - f(Xi)  0

Nếu εi có giá trị càng nhỏ thì biến phụ thuộc Y càng quan hệ mật thiết hay càng phụ thuộc vào biến độc lập X Vì vậy, ε đóng vai trò quan trọng trong việc đánh giá chất lượng của mô hình hồi quy Việc xây dựng mô hình hồi quy tốt thực chất là xác định hàm hồi quy tổng thể f(X) sao cho sai số ngẫu nhiên ε của mô hình nhận giá trị nhỏ nhất Khi đó, ta có thể ước lượng hay dự đoán giá trị của biến phụ thuộc Y trên cơ sở các giá trị biết trước của biến độc lập X với một độ tin cậy nhất định

Trong nhiều trường hợp, ta không có điều kiện để xét toàn bộ tổng thể của một vấn đề Khi đó, ta có thể ước lượng giá trị trung bình của biến phụ thuộc

từ tập số liệu mẫu Thống kê học cung cấp phương pháp điều tra chọn mẫu cho phép lấy tập số liệu tổng thể một số mẫu số liệu để nghiên cứu, phân tích và đưa ra kết quả cho tổng thể với độ tin cậy cho trước Việc xây dựng hàm hồi quy tổng thể được thực hiện thông qua việc xác định hàm hồi quy mẫu SRF, dùng nó để ước lượng và kiểm định các giả thiết từ đó xây dựng hàm hồi quy tổng thể Hàm hồi quy mẫu được xây dựng dựa trên tập số liệu mẫu

Mô hình hồi quy được chia làm 02 loại:

Trang 8

8

- Mô hình hồi quy đơn với hàm hồi quy tổng thể chỉ có 1 biến độc lập

- Mô hình hồi quy bội với hàm hồi quy tổng thể có từ 2 biến độc lập trở lên

2.1.2 Mô hình hồi quy tuyến tính

Mô hình hồi quy tuyến tính là mô hình hồi quy mà trong đó hàm hồi quy tổng thể có dạng tuyến tính

f(Xi) = E(Y|Xi) = β0 + β1X1i + β2X2i + … + βnXni (2.3) Trong đó:

- Xi là giá trị của các biến độc lập X ở quan sát thứ i

- E(Y|Xi) là giá trị trung bình của biến phụ thuộc Y khi biến độc lập X nhận các giá trị Xi ở quan sát thứ i

- β0, β1, β2, …, βn là các tham số hồi quy Tham số hồi quy β0 còn được gọi

là hệ số tự do, nó cho biết giá trị trung bình của biến phụ thuộc Y là bao nhiêu khi biến độc lập X nhận giá trị “0” Tham số hồi quy βj còn được gọi là các hệ

số góc, nó cho biết giá trị trung bình của biến phụ thuộc Y sẽ thay đổi như thế nào khi giá trị của biến độc lập thứ j Xji tăng một đơn vị với điều kiện các biến độc lập khác không thay đổi giá trị

Thật vậy: Giả sử Xji1 = Xji + 1

Ta có E(Y|Xi)1 = E(Y|Xi) + βj => βj = E(Y|Xi)1 - E(Y|Xi)

Nếu βj > 0 thì E(Y|Xi)1 > E(Y|Xi) tức là giá trị trung bình của Y tăng Ngược lại, nếu βj < 0 thì E(Y|Xi)1 < E(Y|Xi) tức là giá trị trung bình của Y giảm Như đã trình bày ở phần trước:

- Nếu f(Xi) = E(Y|Xi) = β0 + β1Xi thì mô hình được gọi là mô hình hồi quy tuyến tính đơn

- Nếu f(Xi) = E(Y|Xi) = β0 + β1X1i + β2X2i + … + βnXni với n >= 2 thì mô hình được gọi là mô hình hồi quy tuyến tính bội

Đối với mô hình hồi quy tuyến tính, hàm hồi quy mẫu có dạng:

𝑌̂𝑖 = 𝛽̂0 + 𝛽̂1X1i + 𝛽̂2X2i + … + 𝛽̂𝑛Xni (2.3) Trong đó: 𝛽̂𝑖 là ước lượng điểm của βi, 𝑌̂𝑖 là ước lượng điểm của Yi

Khi đó, sai số ei = Yi - 𝑌̂𝑖 Minh họa bằng hình 2.1

Hình 2.1 Sai số ei giữa Yi và 𝑌̂𝑖

Trang 9

9 Như vậy, việc xây dựng mô hình hồi quy tuyến tính trở thành việc xác định các 𝛽̂𝑖 sao cho sai số ei nhỏ nhất tức là 𝑌̂𝑖 càng gần với giá trị Yi càng tốt

2.1.3 Phương pháp bình phương tối thiểu để ước lượng các tham số của mô hình hồi quy tuyến tính

Phương pháp bình phương tối thiểu OLS được đưa ra bởi nhà toán học Carl Friedrich Gauss là phương pháp được sử dụng phổ biến nhất trong thống kê để xác định các 𝛽̂𝑖 sao cho tổng bình phương các sai số ei giữa giá trị quan sát Yi với giá trị 𝑌̂𝑖 tính theo hàm hồi quy mẫu là nhỏ nhất Nội dung phương pháp cụ thể như sau:

Xét trường hợp, hàm hồi quy tổng thể có dạng:

f(Xi) = E(Y|Xi) = β0 + β1Xi

và có một mẫu gồm n cặp quan sát (Xi, Yi) với i = 1, 2, …, n

f(𝛽̂0, 𝛽̂1) = ∑𝑛𝑖=1(Yi − 𝛽̂ 0 − 𝛽̂ 1 Xi)2 => min

Vì f(𝛽̂0, 𝛽̂1) là đa thức bậc 2 của 2 biến 𝛽̂0, 𝛽̂1 nên điều kiện để nó đạt cực tiểu là:

∑ 𝑛 (Xi − 𝑋̅) 2 𝑖=1

= ∑ Yi

𝑛 𝑖=1 Xi – n 𝑋̅ 𝑌̅

∑ 𝑛 Xi 2 𝑖=1 – 𝑛 (𝑋̅) 2

2.1.4 Ứng dụng mô hình hồi quy tuyến tính vào phân tích dữ liệu

Trên thực tế, khi phân tích dữ liệu, chúng ta phải xác định mối quan hệ giữa một biến phụ thuộc vào nhiều biến độc Vì vậy, chúng ta cần xem xét các mô hình hồi quy tuyến tính nhiều hơn 1 biến độc lập

Khi đó, hàm hồi quy tổng thể với k biến độc lập có dạng:

f(Xi) = E(Y|Xi) = β0 + β1X1i + β2X2i + … + βkXki

Trang 10

10 Với n quan sát ta có:

𝑒1

𝑒2

𝑒 𝑛 ] và 𝑋 = [

𝑖=1

… ∑ 𝑋𝑘𝑖𝑛

𝑖=1

∑ 𝑋 1𝑖 𝑛

𝑖=1

∑ 𝑋 1𝑖2𝑛

𝑖=1

∑ 𝑋 1𝑖 𝑋 2𝑖 𝑛

𝑖=1

… ∑ 𝑋 1𝑖 𝑋 𝑘𝑖 𝑛

𝑖=1

∑ 𝑋2𝑖𝑛

𝑖=1 …

∑ 𝑋 𝑘𝑖 𝑛

𝑖=1

∑ 𝑋2𝑖𝑋1𝑖𝑛

𝑖=1 …

∑ 𝑋 𝑘𝑖 𝑋 1𝑖 𝑛

𝑖=1

∑ 𝑋2𝑖2𝑛

𝑖=1 …

∑ 𝑋 𝑘𝑖 𝑋 2𝑖 𝑛

𝑖=1 …

∑ 𝑋 𝑘𝑖2𝑛

Kết quả: Các hệ số hồi quy được ước lượng theo công thức (2.10)

Trang 11

Hệ số xác định đã điều chỉnh 𝑟̅̅̅ để xác định có nên thêm 1 biến độc lập vào 2

mới vào mô hình hay không Thường thì giá trị của 𝑟̅̅̅ có sự khác biệt rất ít so 2

với Chúng ta có thể quyết định thêm một biến độc lập mới vào mô hình nếu

Ví dụ: Ta có số liệu quan sát của một mẫu được nêu trong Bảng 2.1

- Y là số lượng hàng bán được của một loại hàng (tấn/tháng)

- X1 là thu nhập của người tiêu dùng (triệu đồng/năm)

- X2 là giá bán của loại hàng này (ngàn đồng/kg)

14.99 0.76

−0.59 ]

Vậy hàm hồi quy cần tìm là: 𝑌̂ = 14.99 + 0.76𝑋1− 0.59𝑋2

Trang 12

12 RSS = 2.2886 ESS = 56.1686 TSS = 58.5

r2 = 0.960147 r = 0.979871 𝑟̅̅̅ = 0.955165 2

Vậy, với hàm hồi quy tìm được, sự biến động của số lượng hàng bán ra được giải thích theo thu nhập của người dùng và giá bán của sản phẩm với tỷ lệ 96% Đồng thời, số lượng hàng bán ra có tương quan chặt chẽ với thu nhập của người dùng và giá bán của sản phẩm

2.2 Công cụ hỗ trợ xây dựng mô hình hồi quy tuyến tính WEKA 2.2.1 Giới thiệu về WEKA

WEKA (Waikato Environment for Knowledge Analysis) là một phần mềm

khai phá dữ liệu mã nguồn mở được phát triển bởi Đại học Waikato ở New Zealand WEKA cũng là tên một loài chim chỉ có trên một hòn đảo của New Zealand WEKA được xây dựng bằng ngôn ngữ Java với mục tiêu xây dựng một công cụ hiện đại phát triển các kỹ thuật học máy và ứng dụng vào các bài toán khai phá dữ liệu trong thực tế

http://www.cs.waikato.ac.nz/~ml/weka/index.html Weka cung cấp đầy đủ các phiên bản cho hệ điều hành Windows, Mac OS X, Linux Lưu ý, máy tính cần phải phiên bản Java cần thiết để để chạy một phiên bản Weka cụ thể Với bản Weka 3.8 hiện tại, máy tính cần cài đặt phiên bản Java 1.7 trở lên

WEKA được xây dựng với hơn 600 lớp, tổ chức thành 10 packages, mỗi package thực hiện một nhiệm vụ trong quá trình khai phá dữ liệu Giao diện đồ họa người sử dụng GUI của WEKA được phát triển theo hướng trực quan và

dễ sử dụng

a Giao diện chính

b Giao diện chức năng “Explorer”

Hình 2.3 Một số hình ảnh về giao diện đồ họa người sử dụng của WEKA

Ngày đăng: 19/01/2018, 10:23

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w