1. Trang chủ
  2. » Luận Văn - Báo Cáo

Báo cáo cuối kì môn học bán hàng quản trị bán hàng phân tích kế hoạch bán hàng nến thơm

42 27 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Báo cáo cuối kỳ môn học bán hàng quản trị bán hàng phân tích kế hoạch bán hàng nến thơm
Tác giả Võ Minh Thư, Đặng Thị Phương Thảo, Nguyễn Việt Hoài, Trà Thị Anh Thư, Lưu Hoài Tín
Người hướng dẫn Ths. Phạm Ngọc Bảo Duy
Trường học Trường Đại Học Văn Lang
Chuyên ngành Quản trị Kinh Doanh
Thể loại Báo cáo cuối kỳ
Năm xuất bản 2022
Thành phố Thành phố Hồ Chí Minh
Định dạng
Số trang 42
Dung lượng 1,46 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

  • CHƯƠNG 1: TỔNG QUAN NGHIÊN CỨU (0)
    • 1.1. Lý do chọn đề tài (6)
    • 1.2 Mục tiêu nghiên cứu (7)
    • 1.3 Câu hỏi nghiên cứu (8)
    • 1.4 Đối tượng nghiên cứu (9)
    • 1.5 Phạm vi nghiên cứu (9)
    • 1.6 Phương pháp nghiên cứu (9)
    • 1.7 Ý nghĩa của nghiên cứu (9)
      • 1.7.1 Ý nghĩa lý thuyết (9)
      • 1.7.2 Ý nghĩa thực tiễn (9)
    • 1.8 Bố cục nghiên cứu (10)
  • CHƯƠNG 2: CƠ SỞ LÝ THUYẾT (11)
    • 2. Các yếu tố ảnh hưởng đến giá vàng (11)
      • 2.1 Khái niệm về “tiền tệ” (11)
      • 2.2 Vai trò của vàng (12)
      • 2.3 Vì sao vàng có được vai trò tiền tệ? (12)
      • 2.4 Khái niệm “Lạm phát” (13)
      • 2.5 Khái niệm “Sự dao động của tiền tệ” (13)
      • 2.6 Khái niệm “Lãi suất” (13)
      • 2.7 Khái niệm “Cung và cầu” (14)
      • 2.8 Đơn vị đo lường và cách niêm yết giá vàng (15)
      • 2.9 Khái niệm “Azure Machine Learning” (16)
    • 3. Phương pháp dự báo giá vàng bằng máy học (Azure Machine Learning) (16)
      • 3.1 Mô hình ARIMA (17)
      • 3.2 Cây quyết định (Decision Tree) (19)
      • 3.3 Thuật toán Naive Bayes Classifiers (20)
  • CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU (21)
    • 3.1 Thiết kế nghiên cứu (21)
    • 3.2 Quy trình nghiên cứu (22)
    • 3.3 Giả thuyết nghiên cứu (22)
      • 3.3.1 Giá dầu thô (22)
      • 3.3.2 USD so với INR (23)
      • 3.3.3 Sensex (24)
      • 3.3.4 CPI (25)
    • 3.4 Nghiên cứu sơ bộ (26)
    • 3.5 Nghiên cứu định lượng (26)
      • 3.5.1 Làm sạch dữ liệu (27)
      • 3.5.2 Mô tả dữ liệu (27)
  • CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU (0)
    • 1.1 Dữ liệu ghi nhận nguồn investing (28)
    • 1.2 Thảo luận (31)
    • 1.3 Xây dựng mô hình Decision Tree (32)
    • 4.3 Triển khai Web service và thử nghiệm (37)
  • CHƯƠNG 5: KẾT LUẬN (41)
    • 5.1 Kết luận nghiên cứu (41)
    • 5.2 Hạn chế nghiên cứu (41)
    • 5.3 Hướng nghiên cứu trong tương lai (41)
  • TÀI LIỆU THAM KHẢO (42)

Nội dung

Vàng được xem là tài sản dùng để cất trữ giá trị và là cơ sở của hệ thống tiền tệ, chính vì lẽ đó mà vàng trở thành một công cụ tiết kiệm cá nhân và được các ngân hàng TrungƯơng của mỗi

Trang 1

TRƯỜNG ĐẠI HỌC VĂN LANG KHOA QUẢN TRỊ KINH DOANH

BÁO CÁO CUỐI KÌ MÔN HỌC: BÁN HÀNG & QUẢN TRỊ BÁN HÀNG

PHÂN TÍCH KẾ HOẠCH BÁN HÀNG NẾN THƠM

Giảng viên bộ môn: Ths Phạm Ngọc Bảo

Duy Nhóm sinh viên thực hiện:

Trang 2

Họ và tên MSSV Công việc Mức độ

hoàn thành Chữ ký

Võ Minh Thư 71802312

Tổng hợp Chương 2+4Chạy mô hình

Trang 3

Trên thực tế không có sự thành công nào mà không gắn liền với những sự hỗ trợ, giúp đỡ

dù ít hay nhiều, dù trực tiếp hay gián tiếp của người khác Trong suốt qúa trình thực hiện

đề tài nghiên cứu “Dự báo giá vàng” em đã nhận được rất nhiều sự quan tâm, giúp đỡ của

quý thầy cô, gia đình và bạn bè Với lòng biết ơn sâu sắc nhất, em xin gởi đến quý thầy

cô ở Khoa Quản Trị Kinh Doanh – Trường Đại Học Văn Lang với tri thức và tâm huyếtcủa mình để truyền đạt vốn kiến thức quý báu cho chúng em trong môn học này

Em xin chân thành cảm ơn thầy đã tận tâm hướng dẫn chúng em qua từng buổi học trên

lớp cũng như những buổi nói chuyện, thảo luận về đề tài Nếu không có những lời hướngdẫn, dạy bảo của thầy thì em nghĩ bài báo cáo này của nhóm em rất khó có thể hoàn thiệnđược Một lần nữa, em xin chân thành cảm ơn thầy Bài báo cáo được thực hiện trongkhoảng thời gian 3 tuần Bước đầu đi vào thực tế, tìm hiểu lĩnh vực phân tích kinh doanh,kiến thức của chúng em còn nhiều hạn chế và còn nhiều bỡ ngỡ Do vây, không tránhđược những thiếu sót là điều chắc chắn, em rất mong nhận được ý kiến đóng góp quý báucủa quý thầy và các bạn học cùng lớp để kiến thức của em trong lĩnh vực này được hoànthiện hơn

Một lần nữa nhóm tác giả xin chân thành cảm ơn!

CÔNG TRÌNH NGHIÊN CỨU ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC VĂN LANG

Nhóm cam kết đây là công trình nghiên cứu riêng do chính nhóm thực hiện và được sựhướng dẫn khoa học trực tiếp từ giảng viên bộ môn Các số liệu, kết quả được nêu bàibáo cao hoàn toàn trung thực, được trích dẫn, kế thừa và phát triển từ các tài liệu, côngtrình nghiên cứu, tạp chí, các trang web có nguồn gốc rõ ràng và đáng tin cậy

Những số liệu trong biểu đồ hỗ trợ việc phân tích, đánh giá được trình bày trong bài báocáo được nhóm xây dựng nên hoặc thu thập từ các nguồn khác nhau và có thêm chúthích rõ nguồn ở phần tài liệu tham khảo

Nhóm xin cam đoan nếu có bất kỳ sự đánh cắp ý tưởng nào sẽ hoàn toàn chịu mọi tráchnhiệm Khoa Quản Trị Kinh Doanh - Trường Đại học Văn Lang không có liên quan đếnnhững vi phạm tác quyền, bản quyền do nhóm gây ra trong quá trình thực hiện nghiêncứu này (nếu có)

LỜI CẢM ƠN 3

Trang 4

CÔNG TRÌNH NGHIÊN CỨU ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC VĂN

LANG 3

CHƯƠNG 1: TỔNG QUAN NGHIÊN CỨU 6

1.1 Lý do chọn đề tài 6

1.2 Mục tiêu nghiên cứu 7

1.3 Câu hỏi nghiên cứu 8

1.4 Đối tượng nghiên cứu 9

1.5 Phạm vi nghiên cứu 9

1.6 Phương pháp nghiên cứu 9

1.7 Ý nghĩa của nghiên cứu 9

1.7.1 Ý nghĩa lý thuyết 9

1.7.2 Ý nghĩa thực tiễn 9

1.8 Bố cục nghiên cứu 10

CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 11

2 Các yếu tố ảnh hưởng đến giá vàng 11

2.1 Khái niệm về “tiền tệ” 11

2.2 Vai trò của vàng 12

2.3 Vì sao vàng có được vai trò tiền tệ? 12

2.4 Khái niệm “Lạm phát” 13

2.5 Khái niệm “Sự dao động của tiền tệ” 13

2.6 Khái niệm “Lãi suất” 13

2.7 Khái niệm “Cung và cầu” 14

2.8 Đơn vị đo lường và cách niêm yết giá vàng 15

2.9 Khái niệm “Azure Machine Learning” 15

3 Phương pháp dự báo giá vàng bằng máy học (Azure Machine Learning) 16

3.1 Mô hình ARIMA 16

3.2 Cây quyết định (Decision Tree) 18

3.3 Thuật toán Naive Bayes Classifiers 19

CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU 21

3.1 Thiết kế nghiên cứu 21

3.2 Quy trình nghiên cứu 21

Trang 5

3.3 Giả thuyết nghiên cứu 22

3.3.1 Giá dầu thô 22

3.3.2 USD so với INR 23

3.3.3 Sensex 23

3.3.4 CPI 24

3.4 Nghiên cứu sơ bộ 26

3.5 Nghiên cứu định lượng 26

3.5.1 Làm sạch dữ liệu 26

3.5.2 Mô tả dữ liệu 26

CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU 28

1.1 Dữ liệu ghi nhận nguồn investing 28

1.2 Thảo luận 30

1.3 Xây dựng mô hình Decision Tree 31

4.3 Triển khai Web service và thử nghiệm 36

CHƯƠNG 5: KẾT LUẬN 40

5.1 Kết luận nghiên cứu 40

5.2 Hạn chế nghiên cứu 40

5.3 Hướng nghiên cứu trong tương lai 40

TÀI LIỆU THAM KHẢO 41

CHƯƠNG 1: TỔNG QUAN NGHIÊN CỨU

Trang 6

1.1 Lý do chọn đề tài

Vàng tiếp tục thu hút sự quan tâm không chỉ với tư cách là một kim loại được lựa chọnlàm đồ trang sức mà còn là một phương tiện lưu trữ giá trị và thường là một phần nên cótrong danh mục đầu tư đa dạng vì nó có xu hướng trở thành một công cụ phòng ngừalạm phát hiệu quả và là nơi trú ẩn an toàn khi các nền kinh tế đang trải qua giai đoạn khókhăn

Vàng được xem là tài sản dùng để cất trữ giá trị và là cơ sở của hệ thống tiền tệ, chính vì

lẽ đó mà vàng trở thành một công cụ tiết kiệm cá nhân và được các ngân hàng TrungƯơng của mỗi quốc gia đều dự trữ một lượng lớn để đảm bảo cho việc phát hành tiền tệ.Giá vàng trong nước luôn biến động và chịu ảnh hưởng từ sự điều chỉnh trên thị trườngthế giới Bên cạnh đó, cất giữ vàng khiến người dân an tâm hơn bởi tính bền vững theothời gian cả (từ thế kỷ này sang thế kỷ khác, từ chế độ này sang chế độ khác – vàng vẫnluôn là vàng) về giá trị (theo thực tế có xu hướng tăng theo thời gian) lẫn vật chất (kimloại, khó bị phá hủy); dễ dàng đổi thành tiền khi chi tiêu hoặc để làm chuẩn khi tiếnhành mua bán các tài sản lớn cụ thể là nhà cửa, đất đai, Và thực tế hiện nay, không ítcác nhà đầu tư đều dành ra một khoản trong danh mục đầu tư của mình để đầu tư vào thịtrường vàng với các lý do sau:

 Vàng là một công cụ đầu tư chống lạm phát hiệu quả: trường hợp chỉ số lạm phátquá cao, đồng tiền trong nước mất giá, các loại hình đầu tư khác không đủ tạo lòngtin ở nhà đầu tư thì vàng sẽ là công cụ giữ được giá trị tốt nhất

 Vàng có tính thanh khoản cao, có thể chuyển đổi thành tiền một cách nhanhchóng

 Trường hợp tình hình chính trị bất ổn, vàng là loại tài sản tích trữ tin cậy duy nhấtbởi giá trị đồng tiền có thể thay đổi theo diễn biến chính trị, trong khi vàng luôngiữ được giá trị của mình dưới bất kì hoàn cảnh nào

 Do việc dự trữ vàng ngày càng tăng của ngân hàng Trung ương các quốc gia trênthế giới: tại nhiều quốc gia trên thế giới, các ngân hàng trung ương đã và đang đưavàng vào danh mục dự trữ của mình thay thế một phần cho việc dự trữ đô la Mỹtruyền thống trước đây Do việc khai thác vàng ngày càng hạn chế bởi số lượngvàng trong các mỏ vàng ngày càng giảm khiến giá vàng luôn đi theo chiều hướngtăng dài hạn Tuy nhiên, do chi phi cơ hội để các nhà đầu tư khi nắm giữ vàngkhông phải là nhỏ

Do đó, các nhà đầu tư thường do dự khi đưa ra quyết định do sự biến động khó lường của

giá vàng Chính vì lẽ đó nhóm quyết định chọn đề tài “Dự báo giá vàng” dựa trên Azure

Machine Learning Studio nhằm hỗ trợ cho việc ra quyết định đầu tư vào loại kim loại quýnày

Trang 7

1.2 Mục tiêu nghiên cứu

Sự quan tâm của các nhà đầu tư phương Tây đối với vàng đã khiến tỷ giá của nó tăng từmức tối thiểu $1160 vào mùa hè năm 2018, lên mức đỉnh kỷ lục gần $2073 vào tháng 8năm nay Trong thời gian này, kim loại quý đã trở thành một trong những tài sản tàichính hấp dẫn nhất hành tinh Năm nay, nền kinh tế suy thoái do đại dịch và lợi suất tráiphiếu âm đã thúc đẩy tăng trưởng vốn ETF vàng kỷ lục 60 tỷ USD Con số này cao gấpđôi so với năm 2009, vào thời kỳ đỉnh điểm của cuộc khủng hoảng tài chính

Đại dịch đã thuyết phục các nhà đầu tư rằng vàng nên là một phần trong danh mục đầu

tư của họ Kim loại quý này đã trở thành hàng rào hàng đầu chống lại sự biến động trênthị trường chứng khoán và lãi suất âm Kết quả là vàng nghiễm nhiên biến thành mộttrong những tài sản hấp dẫn nhất vào năm 2020

Các nhà đầu tư lớn đã mua vàng như một tấm chắn bảo vệ khỏi tình trạng giảm phát cóthể xảy ra ở một số quốc gia, gây ra bởi tăng trưởng kinh tế chậm và lạm phát gia tăng ởcác quốc gia khác khi các chính phủ tiếp tục bơm thanh khoản vào nền kinh tế Ví dụ,ngân hàng Mỹ JPMorgan đã kiếm được khoảng 1 tỷ đô la trong năm nay từ hoạt độngkinh doanh kim loại quý (chủ yếu là vàng) Theo dự báo của công ty tư vấn Coalition,trong năm nay, doanh thu từ hoạt động kinh doanh kim loại quý của 50 ngân hàng đầu tưlớn nhất sẽ tăng gấp đôi và đạt mức đỉnh trong 9 năm là 2,5 tỷ USD

Ngay cả ông Warren Buffett cũng thay đổi quan điểm về vàng Trước đây, vị này xemkim loại quý là tài sản vô dụng Năm nay, công ty Berkshire Hathaway Inc của ông đãmua lại 20,9 triệu cổ phiếu của một trong những công ty khai thác vàng lớn nhất thế giới

- Barrick Gold Corp (Canada)

Tuy nhiên, nhu cầu tại các quốc gia tiêu thụ vàng chính là Ấn Độ và Trung Quốc, vẫnchưa đạt mức ngang bằng trong năm nay Mọi người đã bán số tiền tiết kiệm bằng vànghoặc cầm cố khi kim loại quý này tăng lên mức đỉnh kỷ lục trong các đồng nội tệ Giáthành cao của kim loại vàng quý và tình trạng hỗn loạn kinh tế do đại dịch gây ra đã làm

tê liệt nhu cầu của người tiêu dùng Do đó, trong nửa đầu năm, lượng mua trang sức đãgiảm 46% so với cùng kỳ năm ngoái Nguyên nhân là do thời gian cách ly và giảm thunhập của người dân

Các nhà đầu tư sẽ tiếp tục lấp đầy khoảng trống về nhu cầu Năm nay, các quỹ giao dịchhối đoái sẽ tích lũy 1205 tấn kim loại quý trong kho dự trữ của họ, cao gấp ba lần so vớinăm 2019 Con số này có thể đạt 1.362 tấn vào năm tới

Các ngân hàng trung ương đã mua kim loại quý hàng quý kể từ đầu năm 2011 Trongquý 3 năm nay, họ đã bán ròng, giảm 12,1 tấn dự trữ Tuy nhiên, CBR vẫn được muaròng hàng năm do nhu cầu trong ba quý đầu năm là 220,6 tấn Rất có thể, họ sẽ duy trìtình trạng này vào năm 2020, mặc dù lượng mua sẽ ít hơn trong hai năm trước đó Nga

Trang 8

đã ngừng việc mua và Trung Quốc đã không báo cáo tăng dự trữ kể từ tháng 9 năm2019.

Giá vàng đã tăng 17% trong nửa đầu năm 2020 và 10% nữa trong tháng 7, đạt mức đỉnh

kỷ lục $2073/ounce vào ngày 6 tháng 8 Kể từ đó, một ounce vàng đã giảm xuống còn

$1.844 trong bối cảnh tin tức về vắc-xin vi rút corona xuất hiện Tuy nhiên, sự hào hứng

về vắc-xin hãy còn quá sớm Đại dịch không rời khỏi chương trình nghị sự Tuy nhiên,lợi suất năm nay của kim loại quý này nằm trong khoảng 16-30% Lưu ý rằng nhiều dựbáo cho năm 2020 đã giả định sự tăng trưởng của báo giá kim loại quý lên $1600-

$1700/ounce trong trường hợp bất ổn địa chính trị và kinh tế gia tăng

Sự phục hồi kinh tế từ đại dịch COVID-19 đã tiếp tục, và kỳ vọng lạm phát ngày càngtăng trong tháng 4 và tháng 5 năm 2021 dẫn đến giá thấp hơn Nhìn chung, từ tháng 1đến tháng 3 năm 2021, chúng ta có thể thấy giá vàng đã giảm do số liệu việc làm của

Mỹ tăng lên Vàng đã giảm từ 4,7% xuống $1.774,80/ounce vào ngày 16 tháng 6, tứcmức đáy kể từ cuối tháng 4 Sự phục hồi đến sau khi tuyên bố từ Ủy ban Thị trường MởLiên bang nghe có vẻ lạc quan về sự phục hồi nền kinh tế Mỹ

Tháng 7 đã mang đến sự tăng trưởng ổn định do lợi suất của Mỹ giảm mạnh Giá vàng

đã không thay đổi nhiều trong tháng 8; tuy nhiên, đã có một sự sụt giảm đáng kể xuấthiện từ ngày 6-9 tháng 8, nguyên nhân là do dữ liệu việc làm của Mỹ tăng mạnh Sựphục hồi diễn ra khá nhanh Xu hướng giảm bắt đầu vào đầu mùa thu năm 2021, và giá

đã giảm xuống $1.726,11/ounce vào ngày 29 tháng 9 do sản lượng của Mỹ cao hơn Sau

đó, giá vàng đã tăng trong một tháng rưỡi và đạt $1.866,96 vào ngày 18 tháng 11 Mộtđộng lực chính của đà tăng này là các nhà đầu tư đổ xô vào vàng như một hàng ràochống lại lạm phát

Nhóm áp dụng phân tích từ phần mềm Azure Machine Learning để hiểu rõ hơn giá vàng.

Mục tiêu chính của bài nghiên cứu như sau:

o Đầu tiên, nhóm xác định, phân tích các yếu tố ảnh hưởng đến sử biến động của giávàng

o Thứ hai, nhóm sẽ xây dựng mô hình dự đoán thông qua việc sử dụng phần mềmAzure Machine Learning Studio

o Từ các mô hình được đề xuất, tiến hành đánh giá và chọn ra mô hình tối ưu, thíchhợp nhất để dự đoán và kiểm tra mẫu thử dựa trên mô hình được chọn

o Cuối cùng, từ những dự đoán của mô hình nhóm đưa ra những lợi ích mà vàngmang lại khi lạm phát tăng cao

1.3 Câu hỏi nghiên cứu

Để việc nghiên cứu đúng mục tiêu, nhóm phải trả lời được các câu hỏi được đặt ra nhưsau:

o Tình hình biến động giá vàng trong giai đoạn 2000 – 2020 chịu tác động của các

Trang 9

nhân tố nào?

o Vàng chịu ảnh hưởng bỡi những nhân tố nào?

o Mô hình nào là phù hợp nhất dự báo giá vàng?

1.4 Đối tượng nghiên cứu

Giá vàng trong nước có mối liên hệ mật thiết với giá vàng Thế giới do phần lớn vàngkinh doanh trên thị trường chủ yếu là từ nhập khẩu nên giá cả trong nước luôn chịu sựchi phối của biến động giá vàng thế giới Tuy nhiên, có một số thời điểm, giá vàng trongnước lại không theo giá thế giới Đối tượng nghiên cứu của để tài là dự đoán biến độngcủa giá vàng

1.5 Phạm vi nghiên cứu

Phạm vi về không gian: Sử dụng nguồn dữ liệu được tổng hợp từ nhiều nguồn khác nhaunhư: sách, báo, đài, tivi, tạp chí, mạng internet Dữ liệu giá dầu thô, lãi suất (tỷ lệ repo),giá tiền Ấn Độ tính bằng đô la, Sensex (BSE), tỷ lệ lạm phát và chỉ số đô la Mỹ sẽ theomối quan hệ trực tiếp hoặc gián tiếp với giá vàng được thu thập từ nền tảng Kaggle.com.Phạm vi về thời gian: trong khoảng thời gian tháng 11 năm 2022

1.6 Phương pháp nghiên cứu

Phương pháp thống kê – mô tả: thu thập các dữ liệu trong quá khứ từ năm 2000 đếntháng 08/2020 Từ đó, dùng phương pháp thống kê – mô tả nhằm xác định cácđặc điểm về xu hướng và xu thế biến động của giá vàng thế giới cũng như giá vàngtrong nước Phương pháp phân tích kinh tế lượng:

 Phương pháp dự báo chuỗi thời gian (cụ thể là mô hình ARIMA, và một số các

mô hình khác có liên quan: các mô hình này được cho là phương pháp chủ yếu,được sử dụng khá phổ biến trong việc dự báo các biến có độ nhạy cao như lãisuất, chứng khoán, giá dầu, )

 Phương pháp hồi quy: nhằm xác định các yếu tố thực sự tác động đến sự thay đổicủa giá vàng

Phương pháp nghiên cứu lý luận: Với việc khai thác, tìm hiểu những nghiên cứu liênquan đến giá vàng đã có, nhóm phân tích dựa vào phần mềm phân tích dữ liệu AzureMachine Learning Studio

1.7 Ý nghĩa của nghiên cứu

1.7.1 Ý nghĩa lý thuyết

Bài báo cáo này giúp chúng ta biết rằng giá dầu thô, lãi suất (tỷ lệ repo), giá tiền Ấn Độtính bằng đô la, Sensex (BSE), tỷ lệ lạm phát và chỉ số đô la Mỹ sẽ theo mối quan hệtrực tiếp hoặc gián tiếp với giá vàng

1.7.2 Ý nghĩa thực tiễn

Vàng không chỉ là vật trang sứ quý giá, một loại hàng hóa đặc biệt mà còn được xem làchuẩn mực giá trị cho các loại tiền tệ trên thế giới Mặc dù giá trị của vàng trường tồncùng thời gian nhưng với bản chất cố hữu là tính biến động nên giá vàng lại dễ dàng

Trang 10

biến động và chịu ảnh hưởng từ nhiều yếu tố tác động bên ngoài.

Việc hiểu biết đầy đủ về thị trường vàng cũng như nắm được các yếu tố ảnh hưởng đếnbiến động giá vàng, từ đó dự đoán được xu hướng giá vàng trong tương lai là vô cùngquan trọng, quyết định thành bại của nhà đầu tư trong thị trường đặc thù này Bên cạnh

đó, giúp các nhà đầu tư có thêm kiến thức để có những quyết định đầu tư đúng đắn trongthị trường tiềm năng nhưng cũng đầy rủi ro này

1.8 Bố cục nghiên cứu

Bài nghiên cứu này gồm 5 chương:

Chương 1: Tổng quan nghiên cứu

Chương 2: Cơ sở lý thuyết

Chương 3: Phương pháp nghiên cứu

Chương 4: Kết quả nghiên cứu

Chương 5: Kết luận và đề xuất

Trang 11

CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

Trong chương 2, nhóm đề cập tới lý thuyết mà bài nghiên cứu dựa trên, cơ sở lý thuyếtbao gồm những yếu tố tác động lên kết quả nghiên cứu cũng như công cụ để phân tíchnó

Dự báo đóng một vai trò quan trọng trong kinh tế lượng và cũng giúp xác định các chínhsách của chính phủ một cách tối ưu Quyết định kinh doanh phụ thuộc vào giá của cácmặt hàng đó có thể tạo ra lợi ích từ một dự đoán khả thi Chúng ta sẽ có một cái nhìnngắn gọn về các giá trị bình phương sai số trung bình của mô hình hồi quy, điều này sẽhướng dẫn chúng ta về khả năng dự đoán của mô hình dự đoán Dữ liệu trải rộng theothời gian và có sẵn từ ngày 1 tháng 10 năm 2000 đến ngày 1 tháng 8 năm 2020

Mô hình dự đoán được phát triển cho giá vàng ở Ấn Độ phụ thuộc vào 5 biến bằng cách

sử dụng các diễn giải thống kê từ các biến này Các biến độc lập được thực hiện là giádầu thô, USD so với INR, Sensex, CPI và Lãi suất Mô hình vượt qua các khía cạnhkhác nhau như bình phương R được điều chỉnh, thử nghiệm T và Durbin Watson với cácgiá trị ưa thích cao

Dữ liệu được lấy trong một khoảng thời gian dài và không có giá trị nào bị thiếu, thuậnlợi cho mô hình hồi quy Chúng ta có thể quan sát thấy mối quan hệ chặt chẽ giữa giávàng và USD với giá trị INR, CPI và Sensex Trong tương lai, nhiều biến hơn có thể làmột phần của mô hình này

2 Các yếu tố ảnh hưởng đến giá vàng

2.1 Khái niệm về “tiền tệ”

Tiền tệ là phương thức thanh toán chung của thị trường Pháp luật và các nhà nước quyđịnh tiền đóng vai trò như vật ngang giá chung, được sử dụng nhằm mục đích trao đổi,mua bán hàng hóa và dịch vụ

Hiểu đơn giản thì, tiền tệ là phương tiện thanh toán, lưu thông, thực hiện vai trò môi giớitrong quá trình trao đổi hàng hóa, giúp nền kinh tế vận hành Sự gia đời của tiền tệ gắnliền với sự xuất hiện của trao đổi hàng hóa, sản xuất kinh doanh Lịch sử phát triển củatiền trong 5.000 năm, với nhiều hình thái đa dạng

Các hình thái của tiền tệ hiện nay: Tiền giấy hoặc tiền kim loại do nhà nước phát hành

và được chấp nhận thanh toán Giá trị tiền tệ được đảm bảo bởi các tài sản có giá trịkhác như: Vàng, kim loại quý, ngoại tệ, trái phiếu…

Trang 12

Giá trị của tiền tệ không phải là giá trị tự thân, mà là những gì mà tiền tệ có thể trao đổiđược như: Loại và số lượng hàng hóa, dịch vụ mua/ trao đổi được bằng một đơn vị tiền

tệ Các chức năng của tiền tệ phải kể đến như:

 Thước đo giá trị

 Phương tiện trao đổi

 Phương tiện thanh toán

 Chức năng tiền tệ thế giới

2.2 Vai trò của vàng

Vàng (Gold) là một loại hàng hóa được giao dịch trong thị trường Vàng còn là một loạitài sản có tính thanh khoản cao, được chấp nhận như một loại tiền đặc biệt tại tất cả cácnước trên thế giới

Vàng là kim loại quý trong ngành trang sức, điêu khắc và trang trí kể từ khi được xuấthiện trong lịch sử Nó xuất hiện dưới dạng quặng vàng hoặc dạng hạt nằm trong đá,mạch và mỏ sa khoáng và là một trong những kim loại được đúc tiền và hình thành nên

cơ sở cho hệ thống bản vị vàng Bretton Woods trước khi nó sụp đổ vào năm 1971 Chođến nay, vàng vẫn là kim loại duy nhất được con người sử dụng lâu dài từ thời tiền sửđến nay, có 2 vai trò cụ thể:

Vàng đóng vai trò là nguyên liệu để sản xuất thành hàng hóa, được mua – bán và có giá trị sử dụng.

 Là kim loại dễ dát mỏng và dễ uốn nhất được biết: chỉ 1 gram vàng có thể dátmỏng thành 1 tấm 1m2, hoặc 1 ounce vàng có thể dát mỏng đến 300 feet vuông

 Có tính dẫn nhiệt, dẫn điện tốt và phản ánh tia hồng ngoại rất mạnh

 Không bị ảnh hưởng bởi không khí, hơi ẩm và thuốc thử ăn mòn mạnh nhất,ngoại trừ một số chất đặc biệt như thủy ngân, …

 Vàng tạo ra hợp chất với nhiều kim loại khác Các hợp chất này được tạo ra đểđảm bảo độ cứng và các đặc tính luyện kim khác, để kiểm soát điểm tan chảyhoặc để tạo ra màu sắc đẹp

 Vàng nguyên chất có màu vàng nhạt sáng đẹp

Do những lý do đó mà vàng rát được ưa chuộng và rất phù hợp được sử dụng để làmtrang sức và được sử dụng trong nhiều ngành hiện đại như nha khoa và điện tử

Vàng đóng vai trò là một loại tiền tệ đặc biệt với đầy đủ các chức năng của tiền: Thước

đo giá trị, phương tiện lưu thông, phương tiện thanh toán, phương tiện cất trữ và tiền tệ quốc tế.

2.3 Vì sao vàng có được vai trò tiền tệ?

Trong lịch sử kinh tế, tiền vàng đã từng đóng vai trò như tiền tệ là vật ngang giá chung

Trang 13

gian trong thời gian dài Vàng không phải là kim loại quý hiếm nhất trên thế giới, nhưngxuất hiện sớm trong lịch sử và được chấp nhận có vai trò như tiền tệ thanh toán, trao đổihàng hóa

Với sự phát triển của tiền tệ, vàng cũng không còn được sử dụng để trao đổi mua bán.Tuy nhiên, vàng vật chất vẫn có vai trò và ảnh hưởng lớn đến nền kinh tế

Vậy, vì sao vàng có được vai trò tiền tệ trong thời gian lịch sử dài? Dưới đây là một số

lý do giải thích cho điều này:

 Giá trị thẩm mỹ của đẹp, có sức hút lớn với nhiều người dùng làm đồ trang sức.Mặc dù vàng không phải là kim loại hiếm nhưng giá trị thẩm mỹ cao, được nhiềungười yêu thích, ưa chuộng nên chúng trở nên quý giá và có giá trị để trao đổi

 Giá trị cao nhờ đặc tính đồng nhất, độ tinh khiết cao, không ăn mòn và luôn ổnđịnh trong mọi điều kiện, khó bị làm giả… Chính là những yếu tố vàng có thểbảo toàn giá trị, trở thành thước đo giá trị hàng hóa khác

2.4 Khái niệm “Lạm phát”

Lạm phát có tác động đến giá trị của vàng, nhưng không nhiều như mọi người nghĩ Hầuhết các nhà đầu tư vàng mới vào nghề đều tin rằng nếu lạm phát tăng ở Mỹ thì giá vàngcũng sẽ tăng vì phải trả nhiều USD lạm phát hơn cho mỗi ounce Tuy nhiên, về dài hạn,không có sự tương quan chặt chẽ giữa lạm phát và giá vàng Điều này có thể nhìn thấy

từ biểu đồ dưới đây về động thái lạm phát ở Mỹ và giá vàng

hình

Sự thiếu tương quan chặt chẽ này có thể được giải thích bởi hai lý do:

 Vàng không phải là hàng hóa Nghĩa là, nó không được tiêu thụ bởi ngành côngnghiệp, như dầu mỏ hoặc kim loại đen, và do đó phản ứng với sức mua của tiền tệkhông giống với các hàng hóa khác

 Trong các thời kỳ phát triển kinh tế và thị trường chứng khoán, vàng phải “cạnhtranh” về khả năng sinh lời và thu hút sự chú ý của các chủ đầu tư Hơn nữa,trong những giai đoạn như vậy, lạm phát thường ở mức cao

2.5 Khái niệm “Sự dao động của tiền tệ”

Vàng, cùng với đồng đô la Mỹ, đang mất đi chức năng tiền tệ dự trữ, là một công cụ trú

ẩn an toàn trên thị trường Do đó, nếu tỷ giá hối đoái của một trong các loại tiền tệ (vídụ: đồng đô la) giảm giá so với các loại tiền tệ dự trữ khác, trong khi sức mua của việcmua vàng bằng các loại tiền tệ khác được bảo toàn, thì hệ quả hợp lý là vàng sẽ tăng giá

so với tiền tệ mất giá Biểu đồ cho thấy mối quan hệ nghịch đảo trong dài hạn giữa chỉ

số đồng đô la Mỹ (đường màu trắng) và động thái của giá vàng (đường màu vàng)

2.6 Khái niệm “Lãi suất”

Vàng nhạy cảm với lãi suất vì nó không tạo ra thu nhập hiện tại Do đó, nó rất nhạy cảmvới các lựa chọn thay thế trên thị trường chứng khoán mang lại thu nhập tiềm năng,

Trang 14

chẳng hạn như trái phiếu hoặc thậm chí cổ phiếu trả cổ tức Có một mối tương quannghịch đáng chú ý, mặc dù không hoàn hảo Khi lợi suất trái phiếu chính phủ Mỹ tăng,khả năng cao là xu hướng vàng sẽ đi ngang hoặc thậm chí là giảm xuống, trong khi lợisuất giảm có xu hướng dẫn đến chuyển động rất tích cực của giá vàng.

Ví dụ: để chống lại cuộc suy thoái vào đầu những năm 2000, Fed đã hạ lãi suất xuốngrất thấp, buộc các nhà đầu tư dài hạn phải rút khỏi trái phiếu lợi suất thấp và đa dạng hóadanh mục đầu tư của họ với vàng Điều này đã hỗ trợ tốt cho giá vàng vốn đang tăng lên.Vào ngày 26 tháng 1 năm 2022, Fed đã cung cấp gợi ý về việc tăng lãi suất, dẫn đến sựgiảm mạnh từ $1.847,61 xuống $1.791,03 vào ngày 26-28 tháng 1

2.7 Khái niệm “Cung và cầu”

Cung và cầu là những yếu tố khó nhất để đánh giá tác động đến giá của kim loại Cácchủ đầu tư vàng lớn, bao gồm các ngân hàng trung ương, IMF và các quỹ hàng đầu, gâytác động đáng kể đến thị trường Hành động của những nhân tố này có thể thay đổimạnh mẽ nhu cầu về vàng trang sức và các công cụ đầu tư

Dữ liệu dưới đây cho thấy rằng Trung Quốc và Ấn Độ (với tốc độ tăng trưởng kinh tếmạnh mẽ) đã trở thành hai nguồn thu mua vàng lớn trong hai thập kỷ qua để đầu tư vàtạo dự trữ, do đó, đã cung cấp thêm một động lực kích thích tăng giá

Dự trữ vàng của Ngân hàng trung ương Trung Quốc

Trang 15

Dự trữ vàng của Ngân hàng trung ương Ấn Độ

2.8 Đơn vị đo lường và cách niêm yết giá vàng

Tên thị trường thế giới, vàng thường được tính theo đơn vị là ounce hay troy ounce 1ounce tương đương 31.103476 gram Thường được niêm yết như sau:

 Đơn vị yết giá (thông thường): USD/ounce

 1 ounce = 1 troy ounce = 0.83 lượng

 1 lượng = 1.20556 ounce

Trong ngành kim hoàn ở Việt Nam, khối lượng của vàng được tính theo đơn vị là cây(lượng hay lạng) hoặc là chỉ Một cây vàng nặng 37,50 gram Một chỉ bằng 1/10 câyvàng Được niêm yết như sau:

 Đơn vị yết giá: VND/lượng

 Công thức quy đổi giá vàng từ đơn vị tính USD/Oz thành đơn vị tínhVND/lượng:

PVN = (PTG+ phí vận chuyển ) * 1.20556 * (1 + Thuế NK) * Tỷ giá + phígia công

 PVN: Giá vàng thành phẩm khi nhập khẩu về Việt Nam (VND/lượng)

 PTG: Giá vàng thế giới (USD/oz)

 Phí vận chuyển: Phí vận chuyển về đến Việt Nam (USD/oz)

 Tỷ giá: Tỷ giá quy đổi giữa USD và VND

 Thuế NK: Thuế nhập khẩu vàng do chính phủ Việt Nam quy định (%)

 Phí gia công: Phí gia công vàng nguyên liệu thành vàng thành phẩm(VND/lượng)

Đây là công thức đơn giản để quy đổi giá vàng tính theo USD/oz thành giá vàng tínhtheo đồng/lượng, điều nảy cho thấy: giá vàng trong nước dao động và chịu ảnh hưởngbởi giá vàng thế giới Tuy nhiên, công thức trên chỉ tính đến giá vàng thế giới có tácđộng đến giá vàng trong nước mà chưa tính đến cung cầu của thị trường vàng trongnước và một số yếu tố chi phối khác nên công thức trên chỉ có thể dùng để tính giá vàng

Trang 16

quy đổi – một cách tính để hỗ trợ cho việc tính toán giá vàng trong nước dựa theo giávàng thế giới.

2.9 Khái niệm “Azure Machine Learning”

Azure Machine Learning Studio là một dịch vụ tiên đoán dựa trên ứng dụng web quaInternet cung cấp một trải nghiệm tinh gọn cho các nhà khoa học dữ liệu từ tất cả cáccấp độ kỹ năng Có tính năng dễ sử dụng, kéo và thả giao diện để xây dựng các mô hìnhMachine Learning Đi kèm với một bộ thư viện đầy đủ tính năng bao gồm các thuật toánvới độ chính xác cao nhất và đã được thực nghiệm trong các dịch vụ toàn cầu củaMicrosoft như Bing Và được xây dựng để hỗ trợ cho R và Python có nghĩa là bạn có thể

tự do thay đổi và tùy chỉnh model của bạn Xây dựng và đào tạo model dễ dàng hoạtđộng như là một dịch vụ web có thể chạy trên một loạt các ngôn ngữ lập trình, hoặc chia

sẻ nó với cộng đồng bằng cách đặt nó vào trong Cortana Intelligence Gallery Azuremachine learning cung cấp các dịch vụ chính như:

o Automated machine learning: Tạo nhanh các model từ dữ liệu

o Azure Machine Learning designer: Giúp trực quan hóa giao diện khi khởi tạomodel

o Lưu trữ và xử lý dữ liệu: Tương tự như google colad- Azure marchine learningworkspace cho phép chúng ta có thể lưu trữ, tạo máy ảo, thuê máy để train cácmodel Máy mạnh hay yếu tùy thuộc vào số tiền bạn thuê

o Notebook & Pipelines: Nơi mà các Data Scientist, Software Engineers, có thể viếtcode, train, deploy và quản lý các tasks

Có rất nhiều loại model khác nhau, phục vụ từng mục đích khác nhau, nhưng thôngthường thì nó sẽ được chia thành 3 dạng dự đoán chính là: Regression (Hồi quy),Classification (Phân loại) , Clustering (phân cụm)

 Regression : Hệ thống AI trả về kết quả là các SỐ LIỆU (label) dựa trên cácfeature Ví dụ dự đoán giá nhà đất của thành phố: sẽ dựa vào các yếu tố như diệntích, số phòng ngủ, vị trí cách trung tâm, từ đó sẽ trả về kết quả giá nhà sẽ như thếnào Tổng quát hóa thì y = f(x) Hàm f(x) sẽ là model của chúng ta Và regression

là một dạng học có giám sát (supervised learning)

 Classification : Tương tự như regression, classification của là một dạng học cógiám sát nhưng kết quả trả về ở đây có dạng là 0 or 1 Ví dụ các bài toán quênthuộc như nhận diện đối tượng có khả năng vay hay không, nhận diện có đeo khẩutrang hay không

 Clustering: Đây là một dạng học không giám sát unsupervised learning Chúng trả

về kết quả dựa trên dữ liệu thành các nhóm với nhau dựa trên yếu tố tương đồng

Ví dụ: Phân nhóm các loại hoa dựa trên các yếu tố tương đồng

3 Phương pháp dự báo giá vàng bằng máy học (Azure Machine Learning)

Trang 17

3.1 Mô hình ARIMA

Năm 1976 George Box và Gwilym Jenkins là những người đầu tiên giới thiệu các môhình ARIMA (Autoregressive Integrated Moving Average s Tự hồi qui tích hợp Trungbình trượt) nhằm khai thác các thông tin sẵn có tích hợp trong bản thân một biến số đểtìm hiểu sự biến thiên của biến số đó

ARIMA model là viết tắt của cụm từ Autoregressive Intergrated Moving Average Môhình sẽ biểu diễn phương trình hồi qui tuyến tính đa biến (multiple linear regression) củacác biến đầu vào (còn gọi là biến phụ thuộc trong thống kê) là 2 thành phần chính:

 Auto regression: Kí hiệu là AR Đây là thành phần tự hồi qui bao gồm tợp hợp

các độ trễ của biến hiện tại Độ trễ bậc p chính là giá trị lùi về quá khứ p bướcthời gian của chuỗi Độ trễ dài hoặc ngắn trong quá trình AR phụ thuộc vào tham

số trễ p Cụ thể, quá trình AR(p) của chuỗi xt được biểu diễn như bên dưới:

 Moving average: Qúa trình trung bình trượt được hiểu là quá trình dịch chuyển

hoặc thay đổi giá trị trung bình của chuổi theo thời gian Do chuỗi của chúng tađược giả định là dừng nên quá trình thay đổi trung bình dường như là một chuỗinhiễu trắng Qúa trình moving average sẽ tìm mối liên hệ về mặt tuyến tính giữacác phần tử ngẫu nhiên ϵt (stochastic term) Chuỗi này phải là một chuỗi nhiễutrắng thỏa mãn các tính chất:

Vế (1) có nghĩa rằng kì vọng của chuỗi bằng 0 để đảm bảo chuỗi dừng không có sự thayđổi về trung bình theo thời gian Vế (2) là phương sai của chuỗi không đổi Do kì vọng

và phương sai không đổi nên chúng ta gọi phân phối của nhiễu trắng là phân phối xácđịnh (identical distribution) và được kí hiệu là ϵt∼WN(0,σ2) Nhiễu trắng là một thànhphần ngẫu nhiên thể hiện cho yếu tố không thể dự báo của model và không có tính quiluật Qúa trình trung bình trượt được biểu diễn theo nhiễu trắng như sau:

Trang 18

Qúa trình này có thể được biểu diễn theo dịch chuyển trễ - backshift operator B như sau:

Như vậy bạn đọc đã hình dung ra moving average là gì rồi chứ? Về mặt ý tưởng thì đóchính là quá trình hồi qui tuyến tính của giá trị hiện tại theo các giá trị hiện tại và quákhứ của sai số nhiễu trắng (white noise error term) đại diện cho các yếu tố shock ngẫunhiên, những sự thay đổi không lường trước và giải thích bởi mô hình

Intergrated: Là quá trình đồng tích hợp hoặc lấy sai phân Yêu cầu chung của các thuật

toán trong time series là chuỗi phải đảm bảo tính dừng Hầu hết các chuỗi đều tăng hoặcgiảm theo thời gian Do đó yếu tố tương quan giữa chúng chưa chắc là thực sự mà là dochúng cùng tương quan theo thời gian Khi biến đổi sang chuỗi dừng, các nhân tố ảnhhưởng thời gian được loại bỏ và chuỗi sẽ dễ dự báo hơn Để tạo thành chuỗi dừng, mộtphương pháp đơn giản nhất là chúng ta sẽ lấy sai phân Một số chuỗi tài chính còn quiđổi sang logarit hoặc lợi suất Bậc của sai phân để tạo thành chuỗi dừng còn gọi là bậccủa quá trình đồng tích hợp (order of intergration) Qúa trình sai phân bậc d của chuỗiđược thực hiện như sau:

Thông thường chuỗi sẽ dừng sau quá trình đồng tích hợp I(0) hoặc I(1) Rất ít chuỗichúng ta phải lấy tới sai phân bậc 2 Một số trường hợp chúng ta sẽ cần biến đổi logarithoặc căn bậc 2 để tạo thành chuỗi dừng Phương trình hồi qui ARIMA(p, d, q) có thểđược biểu diễn dưới dạng:

Trong đó Δxt là giá trị sai phân bậc d và ϵt là các chuỗi nhiễu trắng

Như vậy về tổng quát thì ARIMA là mô hình kết hợp của 2 quá trình tự hồi qui và trungbình trượt Dữ liệu trong quá khứ sẽ được sử dụng để dự báo dữ liệu trong tương lai.Trước khi huấn luyện mô hình, cần chuyển hóa chuỗi sang chuỗi dừng bằng cách lấy saiphân bậc 1 hoặc logarit Ngoài ra mô hình cũng cần tuân thủ điều kiện ngặt về sai sốkhông có hiện tượng tự tương quan và phần dư là nhiễu trắng Đó là lý thuyết của kinh

tế lượng Còn theo trường phái machine learning thì tôi chỉ cần quan tâm đến làm sao đểlựa chọn một mô hình có sai số dự báo là nhỏ nhất

Trang 19

3.2 Cây quyết định (Decision Tree)

Cây quyết định được sử dụng để chia liên tiếp một tập dữ liệu lớn thành các tập con nhỏbằng cách áp dụng một chuỗi các thuật toán Với mỗi phép chia liên tiếp, các tập con thuđược trong tập kết quả sẽ ngày càng giống nhau

Cây quyết định là cấu trúc biểu diễn dưới dạng cây Trong đó, mỗi nút trong (internalnode) biểu diễn một thuộc tính, nhánh (branch) biểu diễn giá trị có thể có của thuộc tính,mỗi lá (leaf node) biểu diễn các lớp quyết định và đỉnh trên cùng của cây gọi là gốc(root) Cây quyết định có thể được dùng để phân lớp bằng cách xuất phát từ gốc của cây

và di chuyển theo các nhánh cho đến khi gặp nút lá

Theo nguồn wikipedia trong lĩnh vực máy học, cây quyết định là một kiểu mô hình dựbáo (predictive model), nghĩa là một ánh xạ từ các quan sát về một sự vật/hiện tượng tớicác kết luận về giá trị mục tiêu của sự vật/hiện tượng Mỗi một nút trong (internal node)tương ứng với một biến; đường nối giữa nó với nút con của nó thể hiện một giá trị cụ thểcho biến đó Mỗi nút lá đại diện cho giá trị dự đoán của biến mục tiêu, cho trước các giátrị của các biến được biểu diễn bởi đường đi từ nút gốc tới nút lá đó Kỹ thuật học máydùng trong cây quyết định được gọi là học bằng cây quyết định, hay chỉ gọi với cái tênngắn gọn là cây quyết định

Học bằng cây quyết định cũng là một phương pháp thông dụng trong khai phá dữ liệu.Khi đó, cây quyết định mô tả một cấu trúc cây, trong đó, các lá đại diện cho các phân loạicòn cành đại diện cho các kết hợp của các thuộc tính dẫn tới phân loại đó Một cây quyếtđịnh có thể được học bằng cách chia tập hợp nguồn thành các tập con dựa theo một kiểmtra giá trị thuộc tính Quá trình này được lặp lại một cách đệ quy cho mỗi tập con dẫnxuất Quá trình đệ quy hoàn thành khi không thể tiếp tục thực hiện việc chia tách đượcnữa, hay khi một phân loại đơn có thể áp dụng cho từng phần tử của tập con dẫn xuất.Một bộ phân loại rừng ngẫu nhiên (random forest) sử dụng một số cây quyết định để cóthể cải thiện tỉ lệ phân loại

Cây quyết định cũng là một phương tiện có tính mô tả dành cho việc tính toán các xácsuất có điều kiện

Cây quyết định có thể được mô tả như là sự kết hợp của các kỹ thuật toán học và tínhtoán nhằm hỗ trợ việc mô tả, phân loại và tổng quát hóa một tập dữ liệu cho trước

Dữ liệu được cho dưới dạng các bản ghi có dạng:

(x, y) = (x1, x2, x3 , xk, y)

Biến phụ thuộc (dependant variable) y là biến mà chúng ta cần tìm hiểu, phân loại haytổng quát hóa x1, x2, x3 là các biến sẽ giúp ta thực hiện công việc đó

Trang 20

3.3 Thuật toán Naive Bayes Classifiers

Naive Bayes Classifiers (NBC) là một trong những thuật toán tiêu biểu cho bài toán phânlớp dựa trên lý thuyết xác suất áp dụng định lý Bayes Định lý Bayes cho phép chúng ta

có thể tính toán một xác suất chưa biết dựa vào các xác suất có điều kiện khác Với côngthức tổng quát tính xác suất của biến cố A với điều kiện biến cố Bk xảy ra trước (hayđược gọi là xác suất hậu nghiệm):

Với P(A) > 0 và {𝐵1,𝐵2 , …, 𝐵𝑛} là một hệ đầy đủ các biến cố thỏa mãn tổng xác suấtcủa hệ bằng 1 (∑ 𝑃(𝐵𝑘 𝑛 𝑘=1 ) = 1) và từng đôi một xung khắc (𝑃(𝐵𝑖 ∩ 𝐵𝑗) = 0) Khi đó

ta có:

Bộ phân lớp Naive bayes hoạt động như sau:

 Gọi D là tập dữ liệu huấn luyện, trong đó mỗi phần tử dữ liệu A chứa n giá trịthuộc tính B1, B2, ,Bn được biểu diễn bằng một vector n thành phần{x1,x2, ,xn}

 Giả sử có m lớp C1, C2, ,Cm Cho một phần tử dữ liệu A, bộ phân lớp sẽ gánnhãn cho A là lớp có xác suất hậu nghiệm lớn nhất Cụ thể, bộ phân lớp Bayes sẽ

dự đoán A thuộc vào lớp Ci nếu và chỉ nếu:

Giá trị này sẽ tính dựa trên định lý Bayes

 Để tìm xác suất lớn nhất, ta nhận thấy các giá trị P(A) là giống nhau với mọi lớpnên không cần tính Do đó ta chỉ cần tìm giá trị lớn nhất của P(A|Ci) * P(Ci) Chú

ý rằng P(Ci) được ước lượng bằng |Di |/|D|, trong đó Di là tập các phần tử dữ liệuthuộc lớp Ci Nếu xác suất tiền nghiệm P(Ci) cũng không xác định được thì ta coichúng bằng nhau P(C1) = P(C2) = = P(Cm), khi đó ta chỉ cần tìm giá trị P(A|Ci) lớn nhất

 Khi số lượng các thuộc tính mô tả dữ liệu là lớn thì chi phí tính toán P(A|Ci) làrất lớn, do đó có thể giảm độ phức tạp của thuật toán Naive Bayes nếu giả thiếtcác thuộc tính độc lập nhau Khi đó ta có thể tính:

NBC có thể hoạt động với các vector đặc trưng mà một phần là liên tục (sử dụngGaussian Naive Bayes), phần còn lại ở dạng rời rạc (sử dụng Multinomial hoặcBernoulli) Trong phần thực nghiệm, tác giả sử dụng MultinomialNB để xây dựng môhình Mỗi văn bản được biểu diễn bởi một vector có độ dài d chính là số từ trong từ điển.Giá trị của thành phần thứ i trong mỗi vector chính là số lần từ thứ i xuất hiện trong vănbản đó Khi đó, P(xi|Cj) tỉ lệ với tần suất từ thứ i (hay thuộc tính thứ i cho trường hợptổng quát) xuất hiện trong các văn bản của lớp Cj Giá trị này có thể được tính bằng cách

Trang 21

Trong đó:

 Nci là tổng số lần từ thứ i xuất hiện trong các văn bản của lớp Cj, nó được tínhbằng tổng của tất cả các thành phần thứ i của các vector thuộc tính ứng với lớp Cj

 Nc là tổng số từ (kể cả lặp) xuất hiện trong lớp Cj Nói cách khác, nó bằng tổng

độ dài của toàn bộ các văn bản thuộc vào lớp Cj

Cách tính này có một hạn chế là nếu có một từ mới chưa bao giờ xuất hiện trong lớp Cjthì biểu thức (1) sẽ bằng 0, điều này dẫn P(A|Ci) = 0 bất kể các giá trị còn lại có lớn thếnào Việc này sẽ dẫn đến kết quả không chính xác Để giải quyết việc này, một kỹ thuậtđược gọi là Laplace smoothing được áp dụng như trong biểu thức:

Với α là một số dương, thường bằng 1, để tránh trường hợp tử số bằng 0 Mẫu số đượccộng với dα để đảm bảo tổng xác suất ∑ 𝑃(𝑥𝑖 |𝐶𝑗) = 1 𝑑 𝑖=1 ( theo nguồn Wei Zhang,Feng Gao, 2011)

CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU

3.1 Thiết kế nghiên cứu

Trong quá trình thực hiện đề tài “Dự đoán giá vàng” để có cái nhìn chính xác và tổng

quát nhóm đã áp dụng các biện pháp nghiên cứu:

 Tham khảo tài liệu: Dựa trên cơ sở kiến thức đã được học tập qua bộ môn phântích kinh doanh doanh, nhóm đã chủ động tìm thêm các kiến thức từ sách, báo,đài, tivi, tạp chí, mạng internet,… để hiểu rõ vàng chịu ảnh hưởng bỡi các cácyếu tố nào

 Phương pháp phân tích so sánh: Dựa trên nguồn dữ liệu giá vàng trong giaiđoạn 2000 – 2020 nhóm tiến hành so sánh để có được diễn biến của giá vàngqua các năm

 Sử dụng mô hình ARIMA để dự báo giá vàng dựa trên dữ liệu quá khứ.ARIMA - Autoregressive integrated moving average (Tự hồi quy tích hợptrung bình trượt) áp dụng vào việc phân tích và dự báo chuỗi thời gian

Bên cạnh đó, nhòm còn sử dụng phần mềm Microsoft Excel xử lý nguồn dữ liệu thôđầu vào, Microsoft Azure để phân tích và dự đoán dữ liệu, Microsoft Power BI tạo biểu

Ngày đăng: 03/07/2023, 19:16

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w