GIỚI THIỆU ĐỀ TÀIMục đích của báo cáo là tìm hiểu và phân tích dữ liệu về chỉ số vận tải container thơngqua 2 phương thức: đường sắt và đường thuỷ của các nước Hà Lan, Đức, Ý, Tây Ban Nh
Trang 1ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
Tp Hồ Chí Minh, tháng 11/2020
TIEU LUAN MOI download : skknchat@gmail.com
Trang 2ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
Tp Hồ Chí Minh, tháng 11/2020
Trang 3LỜI CẢM ƠN
Trong quá trình nghiên cứu, tìm hiểu và hoàn thiện báo cáo với đề tài Goods Transport:Container Transport, nhóm đã nhận được nhiều sự động viên, giúp đỡ cũng như hỗ trợ về mặtkiến thức chuyên môn từ quý thầy cô, anh chị khóa trên cũng như các bạn cùng khóa
Nhóm xin gửi lời cảm ơn chân thành nhất đến quý thầy cô trong bộ môn Kỹ Thuật HệThống Công Nghiệp trực thuộc khoa Cơ Khí, đặc biệt là thầy Nguyễn Vạng Phúc Nguyên –người trực tiếp giảng dạy môn Kỹ thuật dự báo đã tạo điều kiện để nhóm có thể tìm hiểu vàhoàn thành báo cáo một cách trọn vẹn nhất
Bước đầu đi vào thực tế, tìm hiểu những khía cạnh thực tế trong các môn học chuyênngành, kiến thức của nhóm còn hạn chế và nhiều bỡ ngỡ Vì vậy, quá trình hoàn thành báocáo không thể tránh khỏi những sai sót nhất định, nhóm mong nhận được những ý kiến, đónggóp của quý thầy cô và các bạn cùng lớp để từng thành viên có thể hoàn thiện kiến thức củabản thân trong lĩnh vực này hơn và áp dụng tốt vào công việc sau này
Nhóm xin chân thành cảm ơn
Ngày 19 tháng 11 năm
2020Sinh viên thực hiện
Nguyễn Hoàng Yến NhiNguyễn Thành MinhNguyễn Anh Nhật MinhNgô Trần Thu ThảoNgô Minh Vũ
ii
Trang 4TIEU LUAN MOI download : skknchat@gmail.com
Trang 5MỤC LỤC
LỜI CẢM ƠN ii
MỤC LỤC iii
DANH SÁCH HÌNH ẢNH v
DANH SÁCH BẢNG BIỂU v
CHƯƠNG 1 GIỚI THIỆU ĐỀ TÀI vi
1.1 Mục đích vi
1.2 Nhiệm vụ vi
1.3 Bố cục vi
1.4 Phạm vi báo cáo vi
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT VÀ PHƯƠNG PHÁP LUẬN 1
2.1 Cơ sở lý thuyết 1
2.1.1 Kỹ thuật EDA 1
2.1.2 Phương pháp dự báo 1
2.2 Phương pháp luận 2
CHƯƠNG 3 GIỚI THIỆU VẤN ĐỀ 3
3.1 Vấn đề 3
3.2 Công cụ 3
3.3 Thu thập dữ liệu 3
3.3.1 Cách thức thu thập dữ liệu 3
3.3.2 Điều chỉnh dữ liệu 3
CHƯƠNG 4 KỸ THUẬT EDA VÀ THỐNG KÊ MÔ TẢ 5
4.1 Thống kê mô tả 5
4.1.1 Các thông số của thống kê mô tả 5
4.1.2 Nhận xét các thông số của thống kê mô tả 5
4.1.3 Dạng dữ liệu 7
4.2 Hệ số biến thiên 9
4.3 Phân tích khoảng tin cậy 9
4.4 Phân tích hệ số tương quan 10
4.4.1 Ma trận tương quan 10
4.4.2 Kiểm định hệ số tương quan 11
iii
TIEU LUAN MOI download : skknchat@gmail.com
Trang 6CHƯƠNG 5 TRẢ LỜI CÂU HỎI 12
5.1 Câu 2A 12
5.2 Câu 2B 12
5.3 Câu 3C 12
5.4 Câu 3D 13
5.5 Câu 3E 13
5.6 Câu 3F 15
TÀI LIỆU THAM KHẢO
PHỤ LỤC A DỮ LIỆU THU THẬP
PHỤ LỤC B KẾT QUẢ THỐNG KÊ MÔ TẢ SỬ DỤNG MINITAB
PHỤ LỤC C KẾT QUẢ THỰC HIỆN DỰ BÁO BẰNG MINITAB
Trang 7DANH SÁCH HÌNH ẢNH
Hình 2.1 Phương pháp luận thực hiện báo cáo 2
Hình 3.1 Chuỗi dữ liệu bị thiếu của Hà Lan 3
Hình 3.2 Kết quả dự báo bằng phương pháp Trung bình dịch chuyển với k = 3,4,5 4
Hình 4.1 Các thông số của thống kê mô tả 5
Hình 4.2 Summary Report for Netherlands 5
Hình 4.3 Biểu đồ chuỗi thời gian 7
Hình 4.4 ACF của dữ liệu nước Bỉ 7
Hình 4.5 Kết quả phân tích autocorrelation và biểu đồ time series của dữ liệu Lithuania 8
Hình 4.6 Kết quả phân tích sau khi thực hiện sai phân 8
Hình 4.7 Kết quả CV của các dữ liệu 9
Hình 4.8 Kết quả tính toán khoảng tin cậy sử dụng Minitab 10
Hình 5.1 Kết quả kiểm định đối với vận tải đường thủy 13
Hình 5.2 Kết quả kiểm định đối với vận tải đường sắt 13
Hình 5.3 Chỉ số vận tải container bằng đường thủy và đường sắt của Đức và Hà Lan qua các năm 13
Hình 5.4 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường biển 14
Hình 5.5 Interval Plot và Boxplot các chỉ số vận tải container bằng đường biển 14
Hình 5.6 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường sắt 14
Hình 5.7 Interval Plot và Boxplot các chỉ số vận tải container bằng đường sắt 14
Hình 5.8 Kết quả kiểm định Turkey 15
Hình 5.9 Kiểm tra sự tương quan của Residual đối với nước Đức 17
Hình 5.10 Kiểm tra sự tương quan của Residual đối với nước Đức 17
DANH SÁCH BẢNG BIỂU Bảng 2.1 Lựa chọn phương pháp dự báo 1
Bảng 4.1 Data pattern của các nước 8
Bảng 4.2 Ma trận hệ số tương quan của 5 nước vận tải container bằng đường sắt 10
Bảng 4.3 Ma trận hệ số tương quan của 5 nước vận tải container bằng đường biển 11
Bảng 5.1 Kết quả kiểm định phân bố Normal 12
Bảng 5.2 Phân tích các yếu tố của chuỗi thời gian 15
Bảng 5.3 So sánh sai số của các phương án lựa chọn 16
Bảng 5.4 Kết quả dự báo 16
v
TIEU LUAN MOI download : skknchat@gmail.com
Trang 8CHƯƠNG 1 GIỚI THIỆU ĐỀ TÀI
Mục đích của báo cáo là tìm hiểu và phân tích dữ liệu về chỉ số vận tải container thơngqua 2 phương thức: đường sắt và đường thuỷ của các nước Hà Lan, Đức, Ý, Tây Ban Nha, Bỉ,Hungary, Lithuania và Romania từ năm 1970 đến 2019 Thơng qua quá trình phân tích dữliệu, nhĩm cĩ cơ hội áp dụng các kiến thức từ mơn học Kỹ thuật dự báo để phân tích một vấn
đề cụ thể trong thực tế, đồng thời tìm hiểu về đặc tính của phương thức vận tải hàng hố bằngcontainer của các nước trên, gĩp phần hồn thiện kiến thức của nhĩm trong lĩnh vực Logisticsquốc tế
Nhiệm vụ chính liên quan đến thống kê và phân tích dữ liệu của báo cáo bao gồm:
− Chọn lọc, thu thập dữ liệu cho chỉ số Container transportation (chỉ số vận tải
container) của 5 nước cĩ giao thương nhiều nhất với Việt Nam
− Áp dụng Kỹ thuật EDA để phân tích và tìm ra các đặc trưng cơ bản của dữ liệu, bao gồm:các đặc trưng cơ bản của thống kê mơ tả (trung bình, trung vị, phương sai, độ lệch chuẩn, ), các tứphân vị, khoảng tin cậy cho trung bình và độ lệch chuẩn, mức biến
động, sự tương quan, từ đĩ rút ra được đặc tính của dữ liệu
− Từ đặc tính của dữ liệu, đưa ra mơ hình dự báo phù hợp cho chỉ số vận tải container của các nước
Bố cục bài báo cáo gồm 5 chương, cụ thể:
− Chương 1: Giới thiệu đề tài
− Chương 2: Cơ sở lý thuyết và Phương pháp luận
− Chương 3: Giới thiệu vấn đề
− Chương 4: Thống kê mơ tả
− Chương 5: Trả lời câu hỏi
− Chỉ tiến hành dự báo đối với dữ liệu cĩ data pattern là stationary, trend và seasonal
− Các phương pháp dự báo sử dụng bao gồm: Nạve, Simple averages, Movingaverages, Exponential smoothing, Growth curves, Linear exponential smoothing, Quadraticexponential smoothing, Holt’s method
Trang 9CHƯƠNG 2 CƠ SỞ LÝ THUYẾT VÀ PHƯƠNG PHÁP LUẬN
2.1 Cơ sở lý thuyết
2.1.1 Kỹ thuật EDA
Exploratory Data Analysis (EDA) là một phương pháp phân tích dữ liệu chủ yếu sửdụng các kỹ thuật về biểu đồ, hình vẽ Kỹ thuật này bao gồm việc thực hiện xem xét, nghiêncứu các dữ liệu, biểu đồ khác nhau cũng như thực hiện những phương pháp thống kê mô tả đểtìm ra kết quả cần thiết cho câu hỏi được đặt ra, đồng thời giúp chúng ta có cơ sở để chọn môhình trong các bước tiếp theo
Những kỹ thuật biểu đồ được sử dụng trong EDA thường khá đơn giản, bao gồm mộtvài kỹ thuật sau:
− Vẽ dữ liệu nguyên bản sử dụng data traces, histograms, block plots,
− Vẽ phân bố của dữ liệu nguyên bản sử dụng mean plots, standard deviation plots, box plots,
− Sắp xếp các biểu đồ giúp tối đa hoá khả năng tự nhiên về nhận biết mô hình của conngười
2.1.2 Phương pháp dự báo
Bảng 2.1 Lựa chọn phương pháp dự báo
Method Pattern of Time horizon Type of Model
Linear exponential smoothing T S TS
Quadratic exponential smoothing T S TS
Trong đó
Pattern of the data: ST, stationary; T, trending; S, seasonal.
Time horizon: S, short term; I, intermediate term; L, long term.
Type of model: TS, time series.
Trang 10TIEU LUAN MOI download : skknchat@gmail.com
Trang 12CHƯƠNG 3 GIỚI THIỆU VẤN ĐỀ
Trong hoạt phân tích dự báo, vấn đề quan trọng hàng đầu cần đặt ra là việc nắm bắt tối
đa thông tin về lĩnh vực dự báo Thông tin ở đây có thể hiểu một cách cụ thể gồm: các số liệuquá khứ của lĩnh vực dự báo, diễn biến tình hình hiện trạng cũng như động thái phát triển củalĩnh vực dự báo và đánh giá một cách đầy đủ nhất các nhân tố ảnh hưởng cả về định lượng lẫnđịnh tính
Bài báo cáo tập trung phân tích các chỉ số thống kê mô tả cho chuỗi dữ liệu bằng cách
sử dụng kỹ thuật EDA và phương pháp chuỗi thời gian Phân tích dữ liệu khai phá là kỹ thuật
để xác định các mối quan hệ và xu hướng, các quan sát có ảnh hưởng, từ đó giúp dễ dàng mô
tả và tóm tắt bộ dữ liệu nhằm giúp cho nhà phân tích có cái nhìn trực quan và tận dụng tốtnhất dữ liệu có được Phương pháp chuỗi thời gian sẽ dựa trên việc phân tích chuỗi quan sátcủa một biến duy nhất theo biến số độc lập là thời gian Trong đó bộ dữ liệu được chọn là chỉ
số vận tải hàng hóa bằng container của 5 nước mà Việt Nam xuất khẩu hàng hóa đến nhiềunhất, bao gồm hai loại hình vận tải container là đường sắt và đường thủy, đơn vị đo lường làTEU (Đơn vị tương đương 20 feet) Dữ liệu được lấy từ Bộ cơ sở dữ liệu OECD, truy cậpbằng đường dẫn sau: https://www.oecd-ilibrary.org/transport
− Kỹ thuật EDA bao gồm:
▪ Các thông số đo lường sự tập trung: Trung bình, Trung vị, Yếu vị.
lệch chuẩn.
▪ Biểu đồ Biểu đồ Histogram, Biểu đồ hệ số tương quan.
3.3.2 Điều chỉnh dữ liệu
Sau khi thu thập dữ liệu về chỉ số vận tải container của các nước để tính toán, có mộtvài nước không có dữ liệu ở một vài năm thời đoạn Do đó, nhóm tiến hành sử dụng phươngpháp trung bình dịch chuyển (MA) để làm đầy dữ liệu thô
Ví dụ: nước Hà Lan không có dữ liệu về vận tải container từ năm 1995 – 2003
Hình 3.1 Chuỗi dữ liệu bị thiếu của Hà Lan
Trang 13Ta sử dụng phương pháp trung bình dịch chuyển với k = 3, 4, 5 để dự báo dữ liệu chogiai đoạn 1995 – 2003 cho Hà Lan.
Hình 3.2 Kết quả dự báo bằng phương pháp Trung bình dịch chuyển với k = 3,4,5
Dựa vào các loại sai số MAD, MSE, MAPE khi lần lượt dự báo dữ liệu, sử dụng lầnlượt 3, 4 và 5 thời đoạn Ta thấy khi số thời đoạn dự báo càng tăng thì các giá trị sai số của dựbáo cũng tăng, do đó ta sử dụng phương pháp dự báo Trung bình dịch chuyển với 3 thời đoạn(k = 3) để dự báo dữ liệu cho các năm còn thiếu
Dữ liệu chỉ số xuất khẩu container của các nước được trình bày đầy đủ ở phần phụ lục A
4
TIEU LUAN MOI download : skknchat@gmail.com
Trang 14CHƯƠNG 4 KỸ THUẬT EDA VÀ THỐNG KÊ MÔ TẢ
4.1.1 Các thông số của thống kê mô tả
Sử dụng công cụ Descriptive Statistics (Stat → Basic Statistics → Display DescriptiveStatistics ) của phần mềm Minitab để tính toán các thông số của thống kê mô tả, thu được kếtquả như hình 4.1 dưới đây
Hình 4.1 Các thông số của thống kê mô tả
Ngoài ra, nhóm tiến hành khai thác biểu đồ Histogram và biểu đồ Boxplot của dữ liệubằng công cụ công cụ Graphical Summary (Stat → Basic Statistics → Graphical Summary)
để tính toán các thông số cơ bản của thống kê mô tả và vẽ các biểu đồ Histogram, Box Plotcho từng nước Hình 4.2 minh họa cho dữ liệu của nước Hà Lan, kết quả của tất cả các nướcđược trình bày ở phần phụ lục B
Summary Report for Netherlands
Anderson-Darling Normality Test A-Squared
P-Value Mean StDev Variance Skewness Kurtosis N Minimum 1st Quartile Median 3rd Quartile Maximum 95% Confidence Interval for Mean
0 400000 800000 1200000 1600000
95% Confidence Interval for Median
212994 232591 95% Confidence Interval for StDev
426042 635560
95% Confidence Intervals
Mean Median
200000 300000 400000 500000 600000 700000
Hình 4.2 Summary Report for Netherlands 4.1.2 Nhận xét các thông số của thống kê mô tả
Đức: Ta thấy chỉ số xuất khẩu container qua đường sắt của Đức có giá trị từ 365 243 TEU
đến 7 138 556 TEU Khoảng IQR trải từ 1 013 776 đến 5 209 543 TEU Trung vị (Median)
Trang 15TIEU LUAN MOI download : skknchat@gmail.com
Trang 16container qua đường sắt của Đức có xu hướng lệch phải, tức là đa phần dữ liệu có giá trị béhơn giá trị trung bình 2 857 355 TEU.
Hungary: Ta thấy chỉ số xuất khẩu container qua đường sắt của Hungary có giá trị từ
8687 TEU đến 736 798 TEU Khoảng IQR trải từ 132 127 đến 441 856 TEU Trung vị(Median) của dữ liệu bé hơn giá trị trung bình (Mean) (2 204 713 < 266 232), cho thấy chỉ sốvận tải container qua đường sắt của Hungary có xu hướng lệch phải, tức là đa phần dữ liệu cógiá trị bé hơn giá trị trung bình 266 232 TEU
Hà Lan: Ta thấy chỉ số xuất khẩu container qua đường sắt của Hà Lan có giá trị từ 88
000TEU đến 1 686 000 TEU Khoảng IQR trải từ 200 044 đến 930 458 TEU Trung vị(Median) của dữ liệu bé hơn giá trị trung bình (Mean) (216 784 < 517 214, cho thấy chỉ sốvận tải container qua đường sắt của Hà Lan có xu hướng lệch phải, tức là đa phần dữ liệu cógiá trị bé hơn giá trị trung bình 517 214 TEU
Lithuania: Ta thấy chỉ số xuất khẩu container qua đường sắt của Lithuania có giá trị từ 10
554 TEU đến 305 686 TEU Khoảng IQR trải từ 38 670 đến 187 983 TEU Trung vị (Median)của dữ liệu bé hơn giá trị trung bình (Mean) (103 125 <123 127), cho thấy chỉ số vận tảicontainer qua đường sắt của Lithuania có xu hướng lệch phải, tức là đa phần dữ liệu có giá trị
bé hơn giá trị trung bình 123 127TEU
Romania: Ta thấy chỉ số xuất khẩu container qua đường sắt của Romania có giá trị từ 54
995 TEU đến 2 468 750 TEU Khoảng IQR trải từ 108 364 đến 1 436 772 TEU Trung vị(Median) của dữ liệu bé hơn giá trị trung bình (Mean) (220 074 < 750 837), cho thấy chỉ sốvận tải container qua đường sắt của Romania có xu hướng lệch phải, tức là đa phần dữ liệu cógiá trị bé hơn giá trị trung bình 750 837 TEU
❖ Đối với các nhóm nước xuất khẩu container bằng đường biển:
Hà Lan: Ta thấy chỉ số xuất khẩu container qua đường sắt của Hà Lan có giá trị từ 88 000
TEU đến 1 686 000 TEU Khoảng IQR trải từ 200 044 đến 930 458 TEU Trung vị (Median)của dữ liệu bé hơn giá trị trung bình (Mean) (216 784 < 517 214, cho thấy chỉ số vận tảicontainer qua đường sắt của Hà Lan có xu hướng lệch phải, tức là đa phần dữ liệu có giá trị béhơn giá trị trung bình 517 214 TEU
Đức: Ta thấy chỉ số xuất khẩu container qua đường biển của Đức có giá trị từ 279 376
TEU đến 15 905 000 TEU Khoảng IQR phân bố từ 1 771 453 TEU đến 13 272 393 Trung vịcủa dữ liệu bé hơn giá trị trung bình, cho thấy chỉ số Transportation cho vận tải container quađường biển của Đức có xu hướng lệch phải, tức là đa phần dữ liệu có gia trị bé hơn giá trịtrung bình 6 803 993 TEU
Ý: Ta thấy chỉ số xuất khẩu container qua đường biển của Ý có giá trị từ 49 937 TEU đến
12 758 529 TEU Khoảng IQR phân bố từ 792 015 TEU đến 7 943 429 Trung vị của dữ liệu
bé hơn giá trị trung bình, cho thấy chỉ số Transportation cho vận tải container qua đường biểncủa Ý có xu hướng lệch phải, tức là đa phần dữ liệu có gia trị bé hơn giá trị trung bình 4 557
328 TEU
Tây Ban Nha: Ta thấy chỉ số xuất khẩu container qua đường biển của Tây Ban Nha có giá trị
từ 137,483 TEU đến 17,435,718 TEU Khoảng IQR phân bố từ 1 335 867 TEU đến 17 435
718 Trung vị của dữ liệu bé hơn giá trị trung bình, cho thấy chỉ số Transportation cho vận tải
Trang 17container qua đường biển của Bỉ có xu hướng lệch phải, tức là đa phần dữ liệu có gia trị bé
hơn giá trị trung bình 6 374 367 TEU
Bỉ: Ta thấy chỉ số xuất khẩu container qua đường biển của Bỉ có giá trị từ 316 354 TEU
đến 11 527 000 TEU Khoảng IQR phân bố từ 1 033 084 TEU đến 8 658 750 Trung vị của dữ
liệu bé hơn giá trị trung bình, cho thấy chỉ số Transportation cho vận tải container qua đường
biển của Bỉ có xu hướng lệch phải, tức là đa phần dữ liệu có gia trị bé hơn giá trị trung bình 4
533 168 TEU
4.1.3 Dạng dữ liệu
Xác định độ lệch của chuỗi dữ liệu: dựa vào dữ liệu thu được ở trên cùng biểu đồ
Histogram (phụ lục B), đối với cả 10 dữ liệu, độ lệch đều dương và giá trị trung bình lớn hơn
các giá trị trung vị nên phân bố của cả năm nước đều có xu hướng lệch phải
Xác định dạng của chuỗi dữ liệu: Đầu tiên, sử dụng công cụ vẽ Time Series Plot (Stat
→ Time Series → Time Series Plot) để xác định hình dạng có thể có của chuỗi dữ liệu Ví dụ
đối với dữ liệu xuất khẩu container của nước Bỉ trong hình 4.3
Hình 4.3 Biểu đồ chuỗi thời gian
Nhìn vào Time Series Plot, ta thấy chuỗi dữ liệu có khả năng có tính xu hướng Tuy
nhiên cần phải sử dụng công cụ Autocorrelation trong Minitab (Stat → Time Series →
AutoCorrelation) để vẽ biểu đồ ACF mới xác định được chính xác Ví dụ ACF của nước Bỉ
trong hình 4.4
Autocorrelation Function for Belgium
(with 5% significance limits for the autocorrelations)
1 2 3 4 5 6 7 8 9 10 11 12 13
Lag
Hình 4.4 ACF của dữ liệu nước Bỉ
Dựa vào biểu đồ trên, ta thấy hệ số tự tương quan tại các lag đầu tiên đều lớn đáng kể
so với 0 và sau đó giảm dần về 0 Do đó dữ liệu xuất khẩu container của nước Bỉ có tính xu
7
TIEU LUAN MOI download : skknchat@gmail.com
Trang 18hướng Thực hiện tương tự với dữ liệu các nước khác, ta thu được kết quả được tổng hợp
trong bảng 4.1
Bảng 4.1 Data pattern của các nước
Dữ liệu Độ lệch Data Pattern
Hà Lan Lệch phải TrendĐức Lệch phải Trend
Tây Ban Nha Lệch phải Trend
Đức Lệch phải TrendHungary Lệch phải Trend
Lithuania Lệch phải Non-stationaryRomania Lệch phải Non-stationary
Phân tích dạng dữ liệu của Lithuania:
Autocorrelation Function for Lithuania
(with 5% significance limits for the autocorrelations)
Index
Hình 4.5 Kết quả phân tích autocorrelation và biểu đồ time series của dữ liệu Lithuania
Phân tích autocorrelation cho thấy dữ liệu của Lithuania có tính
biểu đồ time series lại không biểu hiện tính xu hướng, do đó chỉ có thể
Lithuania mang tính không ổn định (non-stationary) Do đó tiến hành sai
bỏ tính không ổn định này
xu hướng, tuy nhiênkết luận dữ liệu củaphân dữ liệu để loại
Autocorrelation Function for C9
(with 5% significance limits for the autocorrelations)
Trang 19TIEU LUAN MOI download : skknchat@gmail.com
Trang 204.2 Hệ số biến thiên
Sử dụng công cụ Descriptive Statistics (Stat → Basic Statistics → Display DescriptiveStatistics ) của phần mềm Minitab để tính toán hệ số biến thiên, thu được kết quả như hình4.7
Hình 4.7 Kết quả CV của các dữ liệu
Đường biển: Nhìn chung, tất cả các chỉ số CV của các nước đều bé hơn 1, cho ta thấymức biến động của chỉ số TEU của các nước đều ở mức thấp Chỉ số TEU của Hà Lan có mứcbiến động thấp nhất trong nhóm 5 nước (73.12 %), cho thấy đặc tính dữ liệu về vận tảicontainer qua đường biển của Hà Lan ổn định và ít biến động hơn các nước còn lại và chỉ sốTEU của Tây Ban Nha có mức biến động lớn nhất (90.76%), cho thấy đặc tính dữ liệu về vậntải container qua đường biển của Tây Ban Nha không ổn định và biến động nhiều nhất so vớicác nước còn lại
Đường sắt: Chỉ số CV của 3 nước: Đức, Hungary, Lithuania, đều bé hơn 1, cho ta thấymức biến động của chỉ số TEU của các nước đều ở mức thấp Giá trị CV cho chỉ số TEU củaRomania và Hà Lan là 106.28% và 100.27%, cho thấy chỉ số này của Romania và Hà Lanbiến động mạnh Chỉ số TEU của Lithuania có mức biến động thấp nhất trong nhóm 5 nước(72.51 %), cho thấy đặc tính dữ liệu về vận tải container qua đường sắt của Lithuania ổn định
và ít biến động hơn các nước còn lại và chỉ số TEU của Romania có mức biến động lớn nhất(106.28%), cho thấy đặc tính dữ liệu về vận tải container qua đường sắt của Romania không
ổn định và biến động nhiều nhất so với các nước còn lại
Khoảng tin cậy là một phạm vi các giá trị có khả năng chứa một tham số tổng thểkhông xác định Mức độ tin cậy đề cập đến tỉ lệ phần trăm của xác suất hay độ chắc chắnkhoảng tin cậy sẽ chứa tham số tổng thể thực tế khi lấy ra một mẫu ngẫu nhiên nhiều lần.Khoảng tin cậy về giá trị trung bình hay giá trị độ lệch chuẩn đều có ý nghĩa như vậy với dữliệu vận tải container của các nước
Ví dụ với dữ liệu chỉ số xuất khẩu container theo đường sắt của Hà Lan:
Sử dụng Minitab để tính toán khoảng tin cậy (trích từ mục thống kê mô tả), ta được kết quảnhư sau
Trang 21Hình 4.8 Kết quả tính toán khoảng tin cậy sử dụng Minitab
Khoảng tin cậy 95% cho giá trị trung bình (Mean) của chỉ số Transportation cho vận
tải container qua đường sắt của Hà Lan: (370 251; 664 177) TEU cho biết khi lấy ngẫu nhiên
dữ liệu vận tải của các năm thì 95% giá trị trung bình của của chỉ số vận tải sẽ nằm trongkhoảng tin cậy
Khoảng tin cậy 95% cho giá trị độ lệch chuẩn của chỉ số Transportation cho vận tải
container qua đường sắt của Hà Lan: (426 674 ; 639 202) TEU cho biết khi lấy ngẫu nhiên dữ
liệu vận tải của các năm thì 95% giá trị độ lệch chuẩn của của chỉ số vận tải sẽ nằm trongkhoảng tin cậy
4.4.1 Ma trận tương quan
Bảng 4.2 Ma trận hệ số tương quan của 5 nước vận tải container bằng đường sắt
Nước Đức Hungary Lithuania Hà Lan Romania Đức 1 0.903 -0.430 0.939 -0.639
Mặt khác, 2 nước Lithuania và Romania có đặc tính dữ liệu tăng dần đều theo hàm xuhướng từ 1970, nhưng lại giảm đột ngột giai đoạn 1987, 1988 nên hệ số tương quan giữa 2nước này có giá trị cao, xấp xỉ 0.912
Nhưng hệ số tương quan của 2 nước Lithuania và Romania so với Đức, Hà Lan vàHungary cho ta thấy sự khác nhau về xu hướng tăng trưởng chỉ số vận tải Giữa 2 nhóm nước này
có ít sự tương quan trong vận tải container bằng đường sắt hơn Giá trị Coefficient có giá trị âmcho thấy trong khi chỉ số vận tải của Hungary, Đức và Hà Lan tăng đều thì chỉ số vận tải
10
TIEU LUAN MOI download : skknchat@gmail.com
Trang 22của 2 nước còn lại sau khi giảm đột ngột giai đoạn 1987, 1988 thì vẫn tiếp tục tăng trưởng lại,nhưng với giá trị thấp hơn rất nhiều so với trước khi giảm.
Bảng 4.3 Ma trận hệ số tương quan của 5 nước vận tải container bằng đường biển
có mối liên hệ vô cùng chặt chẽ Điều này phù hợp đặc tính xu hướng của dữ liệu vận tải của
5 nước này, (tăng dần theo thời gian, từ 1970 đến 2019, theo hàm xu hướng bậc 2), đã đượctrình bày ở phần trên
4.4.2 Kiểm định hệ số tương quan
Các giá trị p-value được xuất ra từ phần mềm thống kê Minitab, sử dụng độ tin cậy 95%
Kết quả kiểm định bằng minitab được trình bày ở phần phụ lục B
Đối với nhóm các nước đường sắt:
Đối với các nước ở nhóm 3 nước Hà Lan, Đức và Hungary, và giữa 2 nước Lithuania
và Romania giá trị p-value đều tiến về giá trị 0, điều này chứng tỏ các hệ số tương quan trìnhbày đều có ý nghĩa thống kê
Đối với hệ số tương quan giữa các nước thuộc 2 nhóm khác nhau như đã phân tích ởtrên (Hungary và Romania, Hà Lan và Lithuania), trị thống kê p-value có giá trị lần lượt 0.002
và 0.008 nhưng vẫn bé hơn 0.05, xem như các hệ số tương quan này vẫn có giá trị thống kê
Trị thống kê p-value cho hệ số tương quan giữa Hungary và Lithuania có giá trị 0.077
> 0.05, cho thấy mức ý nghĩa của hệ số tương quan này thấp hơn các hệ số tương quan còn lại
Đối với nhóm các nước đường biển:
Giá trị kiểm định p-value của từng hệ số tương quan được xuất ra từ phần mềm
Minitab đều tiến về giá trị 0 cho từng cặp dữ liệu, điều này chứng tỏ các hệ số tương quantrình bày ở bảng 4.3 đều có ý nghĩa thống kê
Trang 23CHƯƠNG 5. TRẢ LỜI CÂU HỎI
Mô tả các đối tượng nghiên cứu (các nước đã chọn) bằng các đặc điểm đặc trưng nhất thông qua phân tích EDA ở câu 1?
− Đa số các nước có chỉ số vận tải container theo xu hướng tăng dần qua các năm
− Chỉ số vận tải container qua cả đường sắt và đường biển của các nước có phân bố không
đồng đều, có xu hướng lệch phải, tức là đa phần dữ liệu có giá trị bé hơn giá trị trung bình, tuy nhiên không bị chênh lệch quá nhiều so với giá trị trung bình
− Đối với các nhóm nước xuất khẩu container bằng đường sắt: Giá trị xuất khẩu trungbình của nước Đức là lớn nhất (2,875,355 TEU), giá trị xuất khẩu trung bình của nước Lithuania
là bé nhất (123127 TEU)
− Đối với các nhóm nước xuất khẩu container bằng đường biển: Giá trị xuất khẩu trungbình của nước Đức là lớn nhất (6,803,993 TEU), giá trị xuất khẩu trung bình của nước Bỉ là thấpnhất (4,533,168 TEU)
− Nhìn chung các nước xuất khẩu theo đường biển với trọng lượng container (TEU) nhiều hơn đáng kể so với đường sắt
Bảng 5.1 Kết quả kiểm định phân bố Normal
Dữ liệu Giá trị kiểm định Nhận xét
Netherlands p < 0.05 Không tuân theo phân bố NormalGermany p < 0.05 Không tuân theo phân bố Normal
Đường biển Italy p < 0.05 Không tuân theo phân bố Normal
Spain p < 0.05 Không tuân theo phân bố NormalBelgium p < 0.05 Không tuân theo phân bố NormalGermany p < 0.05 Không tuân theo phân bố NormalHungary p < 0.05 Không tuân theo phân bố Normal
Đường sắt Lithuania p < 0.05 Không tuân theo phân bố Normal
Netherlands p < 0.05 Không tuân theo phân bố NormalRomania p < 0.05 Không tuân theo phân bố Normal
Ước lượng về CIs của chuỗi dữ liệu của các đối tượng nghiên cứu có đủ “tốt” để tin cậy không?
− Do dữ liệu không tuân theo phân bố Normal nên khoảng tin cậy không dùng được
− Do dữ liệu trong mẫu phải ngẫu nhiên, tuy nhiên đối với dữ liệu của một số nước không
đầy đủ nên phải dùng phương pháp dự báo để tính toán →
Dữ liệu mất đi tính ngẫu nhiên
và độc lập
12
TIEU LUAN MOI download : skknchat@gmail.com
Trang 245.4 Câu 3D
Chủ đề mà nhóm quan tâm (interest topics) của Đức có cùng giá trị với Hà Lan? (thí dụ: Goods transport value của Đức có bằng Goods transport value của Hà Lan hay không?)
Sử dụng kiểm định trung bình 2 tổng thể theo cặp (Paired t for the mean)
quả sau:
Hình 5.1 Kết quả kiểm định đối với vận tải đường thủy
Hình 5.2 Kết quả kiểm định đối với vận tải đường sắt
Kết luận: Chỉ số vận tải container cả bằng đường sắt và đường thủy của Đức đều lớn
Trang 25Đường biển
Hình 5.4 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường biển
Interval Plot of Netherlands, Germany,
95% CI for the Mean
Netherlands Germany Italy Spain Belgium
The pooled standard deviation is used to calculate the intervals.
Hình 5.5 Interval Plot và Boxplot các chỉ số vận tải container bằng đường biển
Vì p – value = 0.05 nên kết luận rằng không có sự khác biệt giữa chỉ số vận tải container bằng đường biển giữa 5 nước Netherlands, Germany, Italy, Spain, Belgium
Đường sắt
Hình 5.6 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường sắt
Interval Plot of Germany (Rai, Hungary,
95% CI for the Mean
3500000 3000000 2500000
2000000 1500000 1000000 500000
Germany (Rail) Hungary Lithuania Netherlands (Rail) Romania
The pooled standard deviation is used to calculate the intervals.
Hình 5.7 Interval Plot và Boxplot các chỉ số vận tải container bằng đường sắt
Vì p-value < 0.05 nên có sự khác biệt giữa giá trị trung bình của các nước Tiến hành kiểm định sâu ANOVA (Turkey Test)
14
Trang 26TIEU LUAN MOI download : skknchat@gmail.com
Trang 27Hình 5.8 Kết quả kiểm định Turkey
Dựa vào kết quả kiểm định Turkey cho thấy đối với các cặp Hungary – Đức, Lithuania– Đức, Hà Lan – Đức, Romania – Đức, Romania – Lithuania với p-value < 0.05 nên các cặpnước này có sự khác biệt có ý nghĩa thống kê về chỉ số xuất khẩu container Đối với các cặpnước còn lại có p-value > 0.05 nên sẽ không có sự khác biệt
5.6 Câu 3F
Có thể tiến hành dự báo cho năm tiếp theo dựa vào dữ liệu thu thập được từ các đối tượng nghiên cứu đã chọn? Nếu được, hãy tiến hành tính toán giá trị dự báo Nếu không, hãy đưa ra lập luận giải thích.
Dựa vào phân tích hình dạng chuỗi dữ liệu ở phần Thống kê mô tả, thu được bảng
sau Bảng 5.2 Phân tích các yếu tố của chuỗi thời gian
Dữ liệu Data Time Type of Phương pháp dự báo đề
pattern horizon model xuất
Hà Lan Trend Short time TS − Linear exponentialĐức Trend Short time TS
−smoothing
Đường
Ý Trend Short time TS Quadratic exponential
smoothingTây Ban Nha Trend Short time TS
Đường Đức Trend Short time TS
sắt Hungary Trend Short time TS
Trang 28TIEU LUAN MOI download : skknchat@gmail.com
Trang 29− Linear exponentialsmoothing
− Quadratic exponential
Hà Lan Trend Short time TS smoothing
− Exponential trendmodels
− Holt’s method
Lithuania Non Short time TS Không tiến hành dự báo
stationary với dữ liệu non stationary
Romania Non Short time TS Không tiến hành dự báo
stationary với dữ liệu non stationary
Bảng 5.3 So sánh sai số của các phương án lựa chọn
Linear exponential smoothing 181930 43836000000 60.7662Quadratic exponential smoothing 63596 8118874742 19Exponential trend models 73977.7 12695900000 16.76677Holt’s method 647730 15047700000 15.11001
Vì giá trị thực rất lớn nên sử dụng sai số MAPE để đánh giá lựa chọn phương pháp dự báo →
Sửdụng phương pháp Holt’s method
Tiến hành phân tích đánh giá các nước còn lại, ta được kết quả dự báo dưới bảng 5.4 sau Kếtquả dự báo dữ liệu của các nước bằng Minitab được trình bày ở phụ lục C
Bảng 5.4 Kết quả dự báo
Dữ liệu Phương pháp dự báo Giá trị dự báo
Hà Lan Holt’s method 16,067,404Đức Holt’s method 15,229,009Đường biển Ý Holt’s method 11,511,375
Tây Ban Nha Holt’s method 17,584,252
Bỉ Exponential trend models 19,002,833Đức Holt’s Method 7,323,485Đường sắt Hungary Holt’s Method 389,454
Hà Lan Holt’s Method 1,754,952Đánh giá sự phù hợp của phương pháp dự báo được thực hiện qua việc kiểm tra hệ số tương quan residual có ngẫu nhiên hay không
Dựa vào LBQ test để kiểm tra sự tương quan giữa time lags với data thu được kết quả sau
Ví dụ đối với nước Đức của vận tải đường sắt, ta có kết quả sau:
16
Trang 30TIEU LUAN MOI download : skknchat@gmail.com
Trang 31Autocorrelation Function for RESI1
(with 5% significance limits for the autocorrelations)
Lag
Hình 5.9 Kiểm tra sự tương quan của Residual đối với nước Đức
Do LBQ < 2 0.05(5) = 11.07 nên residual là ngẫu nhiên→ Dự báo bằng phương pháp Holt’s method là phù hợp đối với dữ liệu này.
Trường hợp khác, đối với nước Bỉ của vận tải đường biển, ta có kết quả sau:
Autocorrelation Function for RESI4
(with 5% significance limits for the autocorrelations)
Chuyển sang phương pháp Holt’s method để dự báo, cho ra kết quả phù hợp
Kết luận: Dự báo bằng phương pháp Holt’s Method là phù hợp để dự báo cho các nước Hà Lan, Đức, Ý, Tây Ban Nha đối với vận tải biển và nước Đức, Hà Lan của vận tải sắt
17
TIEU LUAN MOI download : skknchat@gmail.com
Trang 32TÀI LIỆU THAM KHẢO
[1] John E Hanke, Dean W Wichern, 2008 Business Forecasting, 9th edition Published
by Pearson Education Limited 2014
[2] Nguyễn Vạng Phúc Nguyên, 2020 Bài giảng môn Kỹ thuật dự báo Thành phố Hồ Chí
Minh, NXB Đại học Quốc gia Thành phố Hồ Chí Minh
Trang 33PHỤ LỤC A DỮ LIỆU THU THẬP
Bảng A1 Dữ liệu xuất khẩu container bằng đường sắt của các nước
Năm Hà Lan Đức Hungary Lithuania Romania
Trang 34Bảng A2 Dữ liệu xuất khẩu container bằng đường biển của các nước
Trang 37PHỤ LỤC B KẾT QUẢ THỐNG KÊ MÔ TẢ SỬ DỤNG MINITAB
B.1 Graphical Summary
Summary Report for Netherlands
Anderson-Darling Normality Test A-Squared
P-Value Mean StDev Variance Skewness Kurtosis N Minimum 1st Quartile Median 3rd Quartile Maximum 95% Confidence Interval for Mean
N 50 Minimum 365243 1st
Quartile 1013776 Median 2206628 3rd
Quartile 5209543 Maximum 7138556 95% Confidence Interval for Mean
Summary Report for Hungary
Anderson-Darling Normality Test A-Squared
P-Value Mean StDev Variance Skewness Kurtosis N Minimum 1st Quartile Median 3rd Quartile Maximum 95% Confidence Interval for Mean
N 50 Minimum 10554 1st
Quartile 38670 Median 103125 3rd
Quartile 187983 Maximum 305686 95% Confidence Interval for Mean
P-Value <0.005
Mean StDev
Variance Skewness Kurtosis N Minimum 1st Quartile Median 3rd Quartile
Trang 38669978 999458
Summary Report for Netherlands_1
Anderson-Darling Normality Test A- Squared 1.87 P-Value <0.005 Mean 6083168 StDev 4447781 Variance 1.97828E+1 3 Skewness 0.603633 Kurtosis -0.994679
N 50 Minimum 947347 1st
Quartile 2276567 Median 4613168 3rd
Quartile 10378883 Maximum 15574369 95% Confidence Interval for Mean
B1
TIEU LUAN MOI download : skknchat@gmail.com
Summary Report for Germany_1
Anderson-Darling Normality Test A-Squared
P-Value Mean StDev Variance Skewness Kurtosis N Minimum 1st Quartile Median
2835721 8171145 95% Confidence Interval for StDev
4775044 7123308
Trang 39Anderson-Darling Normality Test A-Squared 1.94 P-Value <0.005 Mean 4612325 StDev 3894391 Variance 1.51663E+13 Skewness 0.38082 Kurtosis -1.29749
N 49 Minimum 49937 1st Quartile 1316864 Median 3041562 3rd Quartile 7943429 Maximum 12758529 95% Confidence Interval for Mean
0
95% Confidence Interval for Median
1818370 6546095 95% Confidence Interval for StDev
P-Value <0.005
Mean 6374367 StDev 5658284 Variance 3.20162E+13 Skewness 0.55777 Kurtosis -1.25220
N 49 Minimum 1st Quartile Median 3rd Quartile Maximum 95% Confidence Interval for Mean
4718563 7068886
Summary Report for
Belgium
Anderson-Darling Normality Test A-Squared 2.82 P-Value <0.005 Mean 4533168 StDev 3832268 Variance 1.46863E+1 3 Skewness 0.48425 Kurtosis -1.41630
N 50 Minimum 316354 1st
Quartile 1033084 Median 2845211 3rd
Quartile 8658750 Maximum 11527000 95% Confidence Interval for Mean
B.2 Time Series Plot
Time Series Plot of Netherlands
1 5 10 15 20 25 30 35 40 45 50
Index
Trang 40Time Series Plot of Hungary
Time Series Plot of
Romania Time Series Plot of Netherlands_1
1600000 0 1400000 0 1200000 0
1000000 0
8000000 6000000 4000000 2000000 0
0 1200000 0 1000000 0 8000000