CHƯƠNG 1: TỔNG QUAN TÌNH HÌNH NGHIÊN CỨUHiện nay đã có một số nghiên cứu và dự báo về lượng khách du lịch quốc tế đếnViệt Nam bằng nhiều phương pháp khác nhau.. Tác giả Mai Phương với lu
Trang 1CHƯƠNG 1: TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU
Hiện nay đã có một số nghiên cứu và dự báo về lượng khách du lịch quốc tế đếnViệt Nam bằng nhiều phương pháp khác nhau Nhóm nghiên cứu xin được trích dẫnmột số nghiên cứu tiêu biểu
Tác giả Mai Phương với luận văn nghiên cứu về Các phương pháp thống kê
nghiên cứu lượng khách du lịch đã chỉ ra được những phương pháp thống kê nghiên
cứu lượng khách du lịch tiêu biểu như sau: Phương pháp số tương đối và số tuyệt đối,Dãy số thời gian, Hồi quy tương quan Trong đó nổi bật là phương pháp dãy số thờigian, từ số liệu thực tế qua việc sử dụng dãy số thời gian, tác giả đã tiến hành tính toáncác chỉ tiêu, phân tích, tìm ra các quy luật, kết luận về số lượng khách du lịch ở hiện tại
và dự đoán cho tương lai
Trong bài nghiên cứu này, tác giả đã chỉ ra được một số phương pháp dự đoánthống kê ngắn hạn thường dùng trong du lịch đó là:
Dự đoán dựa vào lượng tăng (giảm) tuyệt đối trung bình:
Điều kiện áp dụng : Áp dụng trong trường hợp dãy số có các lượng tăng (giảm) tuyệt đối liên hoàn xấp bằng nhau
Dự đoán dựa vào hàm xu thế và biến động thời vụ:
Trang 2Mô hình dự đoán : =
Trong đó: : Mức độ dự đoán của thời gian thứ I thuộc năm j
i: Tháng, quý; i=1,j: Năm: j=1,
: Là mức độ dự đoán của năm j: Là chỉ số thời vụ của thời gian thứ iTrong ngành du lịch hiện nay, phương pháp này cũng được sử dụng tương đốiphổ biến vì nó phán ảnh khá chính xác sự biến động của tổng số lượng khách quốc tếđén Việt Nam qua các năm Tuy nhiên phương pháp này đòi hỏi phải có số liệu từngtháng, quý
Tác giả Phạm Quang Hưng có một bài viết Một số phương pháp dự báo du lịch
tập trung đề cập đến hai phương pháp dự báo đơn giản và được ứng dụng nhiều nhất đó
là phương pháp ngoại suy không đổi và phương pháp ngoại suy bình quân giản đơn,trong đó các chỉ số về nhu cầu lượng khách du lịch quốc tế dự kiến đón được làm đốitượng xác định cần dự báo
Phương pháp ngoại suy không đổi:
Điều kiện áp dụng: Thường được áp dụng trong bối cảnh tình hình tăng trưởng dulịch tương đối ổn định, bị ít tác động của yếu tố độc lập (tác động bên ngoài)
Công thức dự báo:
Phương trình a: Ft = At - 1
Phương trình b: Ft = At – 1 × (At – 1/At – 2)
Trang 3Trong đó: F = Giá trị cần dự báo; A = giá trị thực tế đạt được; t = Mốc thời gian cần dự báo.
Phương pháp ngoại suy bình quân giản đơn
Điều kiện áp dụng: Khi muốn dự báo chắc chắn với chỉ số tương đối an toàn vàbao hàm được cà yếu tố khập khiễng, sự thất thường của tăng trường, yếu tố khôngmong đợi
Các bước tiến hành:
Bước 1: Thu thập dữ liệu về những nhu cầu du lịch cần dự báo (Lượng khách dulịch quốc tế đón được) đã đạt được trong giai đoạn hiện hành và trong quá khứ
Bước 2: Tính bình quân tỷ lệ % tăng giảm qua các năm
Bước 3: Sử dụng tỷ lệ % thay đổi so với giai đoạn hiện hành làm cơ sở dự báocho chỉ số nhu cầu du lịch giai đoạn cùng kỳ năm tới
Công thức dự báo:
Phương trình: Ft = (At-1 + At-2 + At-3)/n
Trong đó: F = Giá trị cần dự báo; A = Giá trị thực tế đạt được; t= Mốc thời giancần dự báo; n = Khoảng chuỗi thời gian trong quá khứ
Từ tổng quan tình hình nghiên cứu liên quan đến đề tài nghiên cứu cho thấy rằng,công tác dự báo là vô cùng cần thiết và quan trọng Trên thực tế có rất nhiều phươngpháp phổ biến để thực hiện dự báo, tuy nhiên tùy thuộc vào thực tế tình hình thực tế,mục tiêu dự báo và khả năng về sử dụng nguồn số liệu mà mỗi cá nhân, tổ chức sẽquyết định lựa chọn những phương pháp riêng, phù hợp với khả năng và điều kiện chophép Qua quá trình tìm hiểu và tiếp cận nhiều nguồn số liệu, nhóm nghiên cứu sẽ tậptrung lựa chọn phương pháp san mũ Winters và ARIMA để làm phương pháp dự báocho lượng khách quốc tế đến Việt Nam trong khoảng thời gian tháng 11 năm 2019 đếntháng 12 năm 2020
Trang 4CHƯƠNG 2: KHẢO SÁT DỮ LIỆU
2.1 Những đặc tính cơ bản của chuỗi số liệu
Số liệu mà nhóm tác giả sử dụng là lượng khách du lịch quốc tế đến Việt Nam từtháng 1 năm 2012 đến tháng 10 năm 2019, gồm 94 quan sát Số liệu được nhóm tổnghợp từ nguồn CSDL Thống kê Du lịch của Tổng cục Du lịch Việt Nam, thuộc Bộ Vănhóa, Thể thao và Du lịch
Website http://thongke.tourism.vn/
Mở cửa sổ Series: Visitor vào View/ Descriptive Statistics & Tests/ Stats Table
Ta được bảng mô tả một số thống kê quan trọng như sau:
Trang 5Bảng 2.1: Biểu đồ thể hiện lượng du khách quốc tế đến Việt Nam từ tháng 1/2012
Trên cửa sổ Series: Visitor vào View/ Graph/ Seasonal Graph, ta có biểu đồ mô tảtính mùa vụ của số liệu:
Trang 6Bảng 2.2: Biểu đồ mô tả tính mùa vụ của chuỗi visitor
Đơn vị: lượt ngườiVISITOR by Season
Các vạch đỏ (vạch nằm ngang) trong hình là giá trị trung bình của từng mùa Từ
sơ đồ trên, ta thấy các vạch đỏ chênh lệch nhau không nhiều chứng tỏ yếu tố mùa vụcủa chuỗi giá trị sử dụng không rõ ràng
2.2 Kiểm định tính mùa vụ Kruscal Wallis
Tạo biến cma bằng lệnh: genr cma=(0.5*visitor(-6)+ visitor(-5)+ visitor(-4)+ visitor(-3)+visitor(-2)+visitor(-1)+visitor+visitor(1)+visitor(2)+visitor(3)+ visitor(4)+ visitor(5)+ 0.5*visitor(6))/12
Tạo biến sim bằng lệnh: genr sim=visitor/cma
Số liệu ở dạng tháng nên tạo biến tháng bằng lệnh: genr month=@month
Trang 7Kích đúp chuột vào biến sim -> View -> Descriptive Statistics & Tests -> EquilityTests by Classification -> Series/Group for classify: month -> Test equality of: Median-> OK.
Bảng 2.3: Kiểm định tính mùa vụ Kruscal Wallis
Cặp giả thiết: H0 : không có tính mùa vụ (các sim như nhau)
H1 : có tính mùa vụ (các sim khác nhau)p-value = 0.0000 < 0.05 -> bác bỏ H0 -> chuỗi có tính mùa vụ
Ta tiến hành tách yếu tố mùa vụ cho chuỗi gốc như sau:
Trên cửa sổ Series: Visitor chọn Proc/Seasonal Adjustment/Moving AverageMethods Vì cường độ mùa vụ tăng dần theo thời gian nên nhóm hiệu chỉnh yếu tố mùa
vụ của chuỗi theo mô hình nhân, trên cửa sổ Seasonal Adjustment, mục Adjustmentmethods chọn Ratio to moving average-Multiplicative Factor điềm sfm -> OK
Chuỗi đã tách yếu tố mùa vụ là visitorsa, chỉ số mùa vụ là sfm Ta có kết quả chỉ
số mùa vụ như sau:
11
Trang 8Bảng 2.4: Scaling Factors sau khi hiệu chỉnh yếu tố mùa vụ cho chuỗi
Date: 12/04/19 Time: 16:31 Sample: 2012M01 2019M10 Included observations: 94 Ratio to Moving Average Original Series: VISITOR Adjusted Series: VISITORSA Scaling Factors:
2.3 Kiểm định tính dừng của chuỗi và phân tích giản đồ tự tương quan ACF và giản
đồ tự tương quan riêng phần PACF
Ta có cặp giả thuyết: H0:Chuỗi sau hiệu chỉnh mùa vụ không dừng
H1:Chuỗi sau hiệu chỉnh mùa vụ dừngTrên cửa sổ Series: Visitorsa vào View/ Unit Root Test, tại phần Test for unit root
in chọn Level, ta có bảng kết quả sau:
12
Trang 9Bảng 2.5: Kiểm định tính dừng của chuỗi sau hiệu chỉnh mùa vụ bằng Unit Root
→ Không có cơ sở bác bỏ H0 → Chuỗi visitorsa không
dừng Ta thử lấy sai phân bậc 1 của chuỗi visitorsa
Trên cửa sổ Series: Visitorsa vào lại View/ Unit Root Tests, tại phần Test for unit root in chọn 1st difference, ta được:
Bảng 2.6: Kiểm định tính dừng của sai phân bậc 1 của chuỗi sau hiệu chỉnh mùa
vụ bằng Unit Root Test
Null Hypothesis: D(VISITORSA) has a unit root
Exogenous: Constant
Lag Length: 0 (Automatic - based on SIC, maxlag=11)
t-Statistic Prob.*
Nguồn: Eview 8
13
Trang 10Từ bảng kết quả, ta thấy:
P-value = 0.0001 < α = 0.05
→ Có thể bác bỏ H0 →Chuỗi Visitorsa dừng ở sai phân bậc 1
Để xác định giá trị p, q cho mô hình ARIMA, ta phải dựa vào giản đồ tự tương quan ACF và tự tương quan riêng phần PACF
Trên cửa sổ Series: Visitorsa vào View/ Correlogram
Trên cửa sổ Correlogram Specification, chọn Correlogram of 1st difference và độ trễ phần Lags to include là 36
Ta có giản đồ tự tương quan và tương quan riêng phần như sau:
14
Trang 11Bảng 2.7: Giản đồ tự tương quan và tự tương quan riêng phần của sai phân bậc 1
của chuỗi visitorsa
Nguồn: Eview 8
Ta thấy, không có độ trễ nào vượt khỏi đường biên Vậy, ta thử lấy sai phân bậc 2của chuỗi như sau: Trên cửa sổ Series: Visitorsa vào lại View/ Unit Root Tests, tại phầnTest for unit root in chọn 2nd difference, ta được:
15
Trang 12Bảng 2.8: Kiểm định tính dừng cho sai phân bậc 2 của chuỗi sau hiệu chỉnh mùa
vụ bằng Unit Root Test
Null Hypothesis: D(VISITORSA,2) has a unit root
Exogenous: Constant
Lag Length: 2 (Automatic - based on SIC, maxlag=11)
t-Statistic Prob.*
→ Có thể bác bỏ H0 →Chuỗi Visitorsa dừng ở sai phân bậc 2
Trên cửa sổ Series: Visitorsa vào View/ Correlogram
Trên cửa sổ Correlogram Specification, chọn Correlogram of 2nd difference
và độ trễ phần Lags to include là 36
Ta có giản đồ tự tương quan và tương quan riêng phần như sau:
16
Trang 13Bảng 2.9: Giản đồ tự tương quan và tự tương quan riêng phần của sai phân bậc 2
của chuỗi visitorsa
Nguồn: Eview 8
Từ giản đồ ACF và PACF trên, ta chọn độ trễ cho AR là 1,2,3,6 và MA là 1
17
Trang 14CHƯƠNG 3: LỰA CHỌN PHƯƠNG PHÁP DỰ BÁO
Nhóm tác giả quyết định lựa chọn phương pháp san mũ Winters (chuỗi có tính xuthế và mùa vụ), ARIMA (chuỗi dừng ở sai phân bậc 2, có tính mùa vụ) để dự báo chochuỗi
Bảng 3.1: Bảng kết quả san mũ Winters
Trang 15MAPE: genr mape = @mean(@abs(visitor-visitorwm)/visitor)
MAPE= 0.047684= 4.7%
MRSE: genr mrse = @sqrt (@mean(visitor-visitorwm)^2)
visitorf=(Mean+h*Trend)*Seasonals (với h bằng số kỳ sau giá trị san cuối cùng)
3.2 ARIMA
3.2.1 Các bước dự báo
Xác định p, q bằng giản đồ tự tương quan ACF và giản đồ tự tương quan PACF:Kích đúp chuột trái vào chuỗi sau hiệu chỉnh yếu tố mùa vụ visitorsa -> vào View-> Correlogram, hộp thoại Correlogram Specification xuất hiện Ở khung Correlogram
of, chọn 2nd difference, ở ô Lags to include để mặc định độ trễ là 36 Ta thu được kếtquả sau:
Ở giản đồ PACF, độ trễ có vạch vượt ngoài đường biên là 1, 2, 3, 6 -> p=1, 2, 3, 6
Ở giản đồ ACF, độ trễ có vạch vượt ngoài đường biên là 1 -> q=1
Ta ước lượng mô hình với AR(1, 2, 3, 6) và MA(1)
Chạy lệnh: ls d(visitorsa,2) c ar(1)ar(2)ar(3)ar(6)ma(1) được kết quả:
19
Trang 16Bảng 3.2: Bảng kết quả ước lượng để chọn các bậc p, q tối ưu
Chạy lệnh: ls d(visitorsa,2) c ma(1) được kết quả:
Bảng 3.3: Bảng kết quả hồi quy mô hình MA(1)
Trang 17Từ bảng kết quả ước lượng chọn Forecast -> OK Ta được kết quả dự báo cho chuỗi visitorsa trong mẫu như sau:
Bảng 3.4: Két quả dự báo cho chuỗi visitorsa bằng mô hình MA(1)
Root Mean Squared Error 347368.4 Mean Absolute Error 270856.5 Mean Abs Percent Error 26.89489 Theil Inequality Coefficient 0.157260 Bias Proportion 0.551339 Variance Proportion 0.376506 Covariance Proportion 0.072155
Nguồn: Eview 8
3.2.2 Kiểm định phân phối chuẩn
Cặp giả thuyết: H0: Biến có phân phối chuẩn
H1: Biến không có phân phối chuẩn
Từ cửa số ước lượng chọn View -> Residual Diagnostics -> Histogram NormalityTest Ta được kết quả:
21
Trang 18Bảng 3.5: Kiểm định phân phối chuẩn cho mô hình MA(1)
Probability = 0.000184 < 5% -> bác bỏ H0 -> biến không có phân phối chuẩn
3.2.3 Kiểm định tự tương quan
Cặp giả thuyết: H0: Mô hình không có tự tương quan
H1: Mô hình có tự tương quan
Từ cửa số ước lượng chọn View -> Residual Diagnostics -> Serial Correlation
LM Test
Lags to include: 2 -> OK
Prob Chi-Square(2) = 0.1161 > 5% -> không có cơ sở bác bỏ H0 -> Mô hình không có tự tương quan
3.2.4 Kiểm định phương sai sai số thay đổi
Cặp giả thuyết: H0: Mô hình không có phương sai sai số thay đổi
H1: Mô hình có phương sai sai số thay đổi
Từ cửa số ước lượng chọn View -> Residual Diagnostics -> Heteroskedasticity Test -> ARCH -> OK
22
Trang 19Prob Chi-Square(1) = 0.9122 > 5% -> bác bỏ H0 -> Mô hình có phương sai sai
Trang 20CHƯƠNG 4: KẾT QUẢ DỰ BÁO
Sau khi dự báo trong mẫu và chọn được mô hình san mũ Winters, nhóm tiến hành
dự báo ngoài mẫu cho chuỗi
Đổi range của mẫu: kích đúp chuột vào range: end date: 2020M12
Kích đúp chuột trái vào chuỗi visitor -> Proc -> Exponential Smoothing ->Simple Exponential Smoothing -> Smoothing Method: Holts-Winters – Multiplicative-> Smoothed series: visitorwm -> OK Ta được bảng kết quả như bảng 3.1
Các giá trị dự báo cho chuỗi visitor được tính trong Excel theo công thức:
visitorf=(Mean+h*Trend)*Seasonals
Trong đó h là số kỳ sau giá trị cuối cùng của chuỗi visitor (2019M10)
Cuối cùng nhóm thu được các giá trị dự báo cho chuỗi visitor từ tháng 11/2019 đến tháng 12/2020 như sau:
24
Trang 21Bảng 4.1: Bảng kết quả giá trị dự báo cho chuỗi visitor từ tháng 11/2019 đến
tháng 12/2020
Đơn vị: lượt người
h Month Mean Trend Seasonals visitorf
Trang 22KẾT LUẬN
Chuỗi số liệu về lượng du khách quốc tế đến Việt Nam trong khoảng thời gian từtháng 1/2012 đến tháng 10/2019 là chuỗi có tính mùa vụ, xu thế tăng, bản thân chuỗikhông dừng nhưng sai phân bậc 1 và 2 có dừng nên nhóm đã chọn phương pháp san
mũ Winters và phương pháp ARIMA để dự báo cho chuỗi
Khi so sánh hai mô hình này thì mô hình san mũ Winters cho sai số dự báo thấphơn nên đây là mô hình phù hợp hơn với chuỗi số liệu Cụ thể sai số MAPE của môhình Winter bằng 4,7% (<5%) nên đây là mô hình đáng tin cậy
Để dự báo cho tương lai trước hết nhóm đã range lại cho end date bằng tháng 12năm 2020 Quá trình san mũ được thực hiện trong EView và các giá trị dự báo visitorfđược tính toán trong Excel Cuối cùng nhóm thu được kết quả dự báo lượng du kháchquốc tế đến Việt Nam từ tháng 11/2019 đến tháng 12/2020 như bảng 4.1
Dựa vào kết quả dự báo, nhóm tác giả có thể thấy Việt Nam sẽ tiếp tục trở thànhmột địa điểm du lịch nổi bật, thu hút thêm ngày càng nhiều khách du lịch quốc tế.Ngành du lịch sẽ tiếp tục đóng góp một phần quan trọng trong nền kinh tế của đấtnước
26
Trang 23DANH MỤC TÀI LIỆU THAM KHẢO
1 Phạm Quang Hưng, 2015, “Một số phương pháp dự báo du lịch”, Tạp chí Du
lịch, số 3
2 Nguyễn Thị Thanh Huyền, ThS Nguyễn Văn Huân, Vũ Xuân Nam, 2010, Giáo
trình Phân tích và dự báo kinh tế”, Khoa Công Nghệ Thông Tin – Đại học Thái
Nguyên
3 Các phương pháp thống kê nghiên cứu lượng khách du lịch,
http://doc.edu.vn/tai-lieu/luan-van-cac-phuong-phap-thong-ke-nghien-cuu-luong-khach-du-lich-43401/#, xem ngày 03/12/2019
4 Website CSDLThống kê Du lịch của Tổng cục Du lịch Việt Nam:
http://thongke.tourism.vn/
27