Trong thực tế, đối với mỗi quốc gia, trong đó có Việt Nam muốn phát triển và trở thành các nước công nghiệp thì một trong những vấn đề không thể thiếu là phải nghiên cứu, khảo sát, phân
Trang 1Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
Trang 2Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
LỜI CAM ĐOAN
Tôi xin cam đoan Luận văn " Nghiên cứu một số kỹ thuật ngoại suy và ứng dụng " đã được thực hiện theo đúng mục tiêu đề ra dưới sự hướng dẫn
của TS Nguyễn Văn Huân Kết quả đạt được trong luận văn là sản phẩm của
cá nhân tôi Trong toàn bộ luận văn, những điều được trình bày là của cá nhân
và được tổng hợp từ nhiều nguồn tài liệu Tất cả các tài liệu tham khảo đều có xuất xứ rõ ràng và được trích dẫn hợp pháp
Tôi xin chịu hoàn toàn trách nhiệm và chịu mọi hình thức kỷ luật theo quy định cho lời cam đoan của mình
Thái Nguyên, ngày tháng năm 2015
Người cam đoan
Nguyễn Thị Ngọc Tú
Trang 3Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
LỜI CẢM ƠN
Tôi xin bày tỏ lời cảm ơn chân thành tới tập thể các thầy cô giáo Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam, các thầy cô giáo trường Đại học Công nghệ thông tin và Truyền thông - Đại học Thái Nguyên đã tận tình giảng dạy cũng như tạo mọi điều kiện để tôi học tập
và nghiên cứu trong 2 năm học cao học
Tôi xin chân thành cảm ơn sâu sắc tới thầy giáo TS Nguyễn Văn Huân
đã cho tôi nhiều sự chỉ bảo quý báu, đã tận tình hướng dẫn và tạo điều kiện cho tôi hoàn thành tốt luận văn tốt nghiệp này
Quá trình thực hiện đề tài không tránh khỏi các thiếu sót, tôi rất mong tiếp tục nhận được sự đóng góp ý kiến của các thầy giáo, cô giáo, các bạn đồng nghiệp đối với đề tài nghiên cứu của tôi để đề tài được hoàn thiện hơn
Tôi xin chân thành cảm ơn!
Thái Nguyên, ngày tháng năm 201
Người cam đoan
Nguyễn Thị Ngọc Tú
Trang 4Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
MỤC LỤC
LỜI CAM ĐOAN I LỜI CẢM ƠN III DANH MỤC HÌNH VẼ IV DANH MỤC BẢNG BIỂU VIII MỤC LỤC IV
MỞ ĐẦU 1
Chương 1 GIỚI THIỆU CHUNG VỀ DỮ LIỆU CHUỖI THỜI GIAN 5
1.1 Khái niệm Dữ liệu 5
1.1.1 Dữ liệu định tính và dữ liệu định lượng 5
1.1.2 Dữ liệu sơ cấp và dữ liệu thứ cấp 5
1.2 Chuỗi thời gian và Dữ liệu chuỗi thời gian 7
1.2.1 Chuỗi thời gian 7
1.2.2 Dữ liệu chuỗi thời gian 12
1.3 Tổng quan về dự báo 16
1.3.1 Đặc điểm của dự báo 16
1.3.2 Các loại dự báo 17
1.3.3 Các phương pháp dự báo 21
Chương 2 MỘT SỐ KỸ THUẬT NGOẠI SUY 22
2.1 Khái niệm ngoại suy 22
2.1.1 Khái niệm ngoại suy 22
2.1.2 Khi nào nên sử dụng phương pháp ngoại suy để dự báo 22
2.1.3 Ưu nhược điểm của phương pháp ngoại suy 23
2.1.4 Tính chính xác của dự báo 23
2.1.5 Ứng dụng của kỹ thuật ngoại suy vào bài toán dự báo 25
2.2 Ngoại suy dựa dựa vào mô hình hồi quy tuyến tính 26
2.2.1 Bài toán hồi quy 26
2.2.2 Các phương pháp đưa về dạng tuyến tính 29
Trang 5Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
2.2.3 Hồi quy nhiều chiều (Hồi quy bội) 30
2.3 Ngoại suy bằng phương pháp trung bình động giản đơn (moving average forecast) 31
2.4 Ngoại suy bằng phương pháp san bằng mũ (Exponential Smoothing Methods) 33
2.5 Ngoại suy dựa vào mô hình san mũ Holt- Winters 36
2.5.1 San mũ Holt 36
2.5.2 San mũ Holt- Winters 37
2.6 Ngoại suy dựa vào mô hình ARIMA (AutoRegressive Integrated Moving Average) 39
2.6.1 Các công cụ áp dụng trong mô hình 40
2.6.2 Mô hình AR(p) (Auto Regression) 44
2.6.3 Mô hình MA(q) (Moving Average) 45
2.6.4 Sai phân I(d) 46
2.6.5 Mô hình ARIMA 47
2.6.6 Các bước phát triển mô hình ARIMA 48
2.7 Các bước tiến hành ngoại suy 49
Chương 3 ÁP DỤNG KỸ THUẬT NGOẠI SUY VÀO BÀI TOÁN DỰ BÁO 52 3.1 Mô hình ARIMA cho dự báo tài chính, chứng khoán 52
3.1.1 Dữ liệu tài chính 52
3.1.2 Mô hình ARIMA cho bài toán dự báo tài chính 52
3.1.3 Thiết kế mô hình ARIMA cho dữ liệu 53
3.2 Áp dụng 55
3.2.1 Môi trường thực nghiệm 55
3.2.2 Dữ liệu 55
3.2.3 Kiểm tra tính dừng của chuỗi chứng khoán VNM 57
3.2.4 Nhận dạng mô hình 57
3.2.5 Ước lượng và kiểm định với mô hình ARIMA 60
Trang 6Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
3.2.6 Thực hiện dự báo 62 KẾT LUẬN 64 TÀI LIỆU THAM KHẢO 65
Trang 7Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
DANH MỤC HÌNH VẼ
Hình 1.1 Xu hướng giảm theo thời gian 13
Hình 1.2 Thành phần mùa 14
Hình 1.3 Thành phần chu kỳ 15
Hình 3.1: chọn giadongcua làm mục tiêu dự báo 56
Hình 3.2: Xác định d = 0,1,2 ? 57
Hình 3.3: Biểu đồ của SAC và SPAC của chuỗi giadongcua 58
Hình 3.4: Biểu đồ của SPAC và SAC ứng với d=1 59
Hình 3.5: Ước lượng mô hình ARIMA(2,1,1) 60
Hình 3.6: Kết quả mô hình ARIMA(2,1,1) 60
Hình 3.7: Kiểm tra phần dư có nhiễu trắng 61
Hình 3.8: Dự báo 62
Trang 8Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
DANH MỤC BẢNG BIỂU
Bảng 3.1: Dữ liệu đầu vào 56 Bảng 3.2: Tiêu chuẩn đánh giá các mô hình ARIMA 62 Bảng 3.3: Đánh giá dự báo 63
Trang 9Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
MỞ ĐẦU
Sự phát triển mạnh mẽ của Công nghệ thông tin và Truyền thông đã kéo theo nhiều lĩnh vực khác phát triển như khoa học máy tính, đồ họa máy tính, khí tượng thủy văn, tự động hóa, thiết kế - xây dựng, kinh tế, tài chính, giáo dục và đào tạo, y tế,… Điều này đã góp phần vào sự nghiệp công nghiệp hóa – hiện đại hóa đất nước Trong thực tế, đối với mỗi quốc gia, trong đó có Việt Nam muốn phát triển và trở thành các nước công nghiệp thì một trong những vấn đề không thể thiếu là phải nghiên cứu, khảo sát, phân tích tình hình phát triển của đất nước trong lịch sử và hiện tại để làm cơ sở cho việc ngoại suy hay suy luận, xây dựng các kế hoạch phát triển trong tương lai với tất cả các lĩnh vực, ngành nghề,…
Vì ngoại suy hay suy luận là một khoa học và nghệ thuật tiên đoán những sự việc sẽ xảy ra trong tương lai, trên cơ sở phân tích khoa học về các
dữ liệu đã thu thập được Khi tiến hành ngoại suy cần căn cứ vào việc thu thập,
xử lý số liệu trong quá khứ và hiện tại để xác định xu hướng vận động của các hiện tượng trong tương lai nhờ vào một số mô hình toán học (Định lượng) Tuy nhiên, ngoại suy cũng có thể là một ngoại suy chủ quan hoặc trực giác về tương lai (Định tính) và để ngoại suy định tính được chính xác hơn, người ta cố loại trừ những tính chủ quan của đối tượng ngoại suy
Ngoại suy trước hết là một thuộc tính không thể thiếu của tư duy của con người, con người luôn luôn nghĩ đến ngày mai, hướng về tương lai Trong thời đại công nghệ thông tin và toàn cầu hóa, ngoại suy lại đóng vai trò quan trọng hơn khi nhu cầu về thông tin thị trường, tình hình phát triển tại thời điểm nào
đó trong tương lai càng cao Ngoại suy được sử dụng trong nhiều lĩnh vực khác nhau, mỗi lĩnh vực có một yêu cầu về ngoại suy riêng nên phương pháp ngoại suy được sử dụng cũng khác nhau
Trong ngoại suy, các đại lượng khảo sát thường không được cho dưới dạng hàm liên tục Trong khi đó, các phương pháp giải tích toán học thường
Trang 10Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
tính toán với các hàm cho bởi các công thức, do đó chúng ta không thể áp dụng trực tiếp các hàm cho dưới dạng rời rạc như thế này Cũng có khi ta biết rằng đại lượng y là một hàm của đại lượng x , tức là y = f x( ), nhưng ta không biết biểu thức hàm f x( )mà chỉ biết một số giá trị y i ứng với các giá trị củax tại các
điểm x i
Thông thường x0 < x1 < x2 < < x nvà các điểm này có thể phân bố cách đều hoặc không cách đều nhau Mặc dù ta chỉ biết giá trị của y tại các điểm mốc x i nhưng trong nhiều trường hợp ta cần tính toán với các giá trị y tại các vị trí khác của x Một vấn đề được đặt ra là cho một điểm x không
thuộc các điểm x thì làm thế nào ta có thể tính được giá trị i y tương ứng với
nó, sao cho chúng ta tận dụng tối đa các thông tin đã có Nếu giả định giá trị cần tìm gần đúng của y tại các điểm x nằm trong khoảng éêx x0, nùú
ë û thì chúng ta
áp dụng các bài toán nội suy
Nhưng trong thực tế, các bài toán không phải lúc nào các điểm x cũng nằm trong khoảng éêx x0, nùú
ë û, chẳng hạn như một số các bài toán về ngoại suy:
(1) Trong tương lai các tình huống sẽ tiếp tục diễn ra như đã xảy ra trong quá khứ; (2) Đối tượng ngoại suy quá bi quan hoặc ngược lại quá lạc quan về tình huống cần ngoại suy khi đó kết quả ngoại suy có thể bị ảnh hưởng sai lệch; (3) Đối tượng ngoại suy không biết nhiều lắm về tình huống ngoại suy Khi
đó chúng ta cần giả định rằng diễn biến trong tương lai cũng sẽ tương tự như
trong quá khứ Với các bài toán trên thì x chắc chắn sẽ nằm ngoài khoảng
0, n
x x
é ù
ê ú
ë û, và như vậy thì để tìm giá trị gần đúng của y , chúng ta không thể áp
dụng được phương pháp nội suy [1]
Nhằm tìm ra giá trị gần đúng của y , một trong những phương pháp được sử dụng phổ biến hiện này là áp dụng phương pháp ngoại suy
Trang 11Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
Ngoại suy (Extrapolation) là dựa trên những số liệu đã có về một đối
tượng được quan tâm để đưa ra suy đoán về hành vi của đối tượng đó trong tương lai Ngoại suy có 2 dạng chính là ngoại suy theo số liệu lát cắt và ngoại suy theo chuỗi số liệu lịch sử [12]
Ngoại suy theo số liệu lát cắt (Extrapolation for cross-sectional data) là
dựa trên hành vi của một số thành phần tại một thời điểm nào đó để ngoại suy
về hành vi của các thành phần khác cũng tại thời điểm đó
Ngoại suy theo chuỗi số liệu (Time-series extrapolation) là dựa trên
chuỗi số liệu lịch sử và sử dụng mô hình toán học để đưa ra kết quả ngoại suy đối với biến quan tâm Giả thiết cơ bản là hành vi của biến được ngoại suy sẽ tiếp tục trong tương lai như đã diễn ra trong quá khứ
Xuất phát từ vai trò của bài toán ngoại suy trong thực tế, đề tài luận văn
được lựa chọn “Nghiên cứu một số kỹ thuật ngoại suy và ứng dụng” Trên cơ
sở nghiên cứu một số kỹ thuật ngoại suy, ý nghĩa và tính chất ứng dụng của chúng và đề xuất việc áp dụng kỹ thuật ngoại suy vào bài toán trong tương lai cho một số bài toán cụ thể
Nội dung chính của luận văn được trình bày trong 3 chương:
Chương 1: Giới thiệu chung về dữ liệu chuỗi thời gian
Chương 2: Một số kỹ thuật ngoại suy
Chương 3: Áp dụng kỹ thuật ngoại suy vào bài toán dự báo
Luận văn này được hoàn thành dưới sự hướng dẫn tận tình của TS Nguyễn Văn Huân, tác giả xin bày tỏ lòng biết ơn chân thành của mình đối với thầy Tuy nhiên vì điều kiện thời gian và khả năng có hạn nên luận văn không thể tránh khỏi những thiếu sót Tác giả rất mong các thầy giáo và bạn đóng góp ý kiến để đề tài được hoàn thiện hơn
Trang 12Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
Chương 1 GIỚI THIỆU CHUNG VỀ DỮ LIỆU CHUỖI THỜI GIAN
1.1 Khái niệm Dữ liệu
1.1.1 Dữ liệu định tính và dữ liệu định lượng
b) Dữ liệu thứ cấp
Dữ liệu thứ cấp là dữ liệu do người khác thu thập, sử dụng cho các mục đích có thể là khác với mục đích nghiên cứu của chúng ta Dữ liệu thứ cấp có thể là dữ liệu chưa xử lý (còn gọi là dữ liệu thô) hoặc dữ liệu đã xử lý Như vậy, dữ liệu thứ cấp không phải do người nghiên cứu trực tiếp thu thập
Có nhiều nhà nghiên cứu, sinh viên đánh giá thấp nguồn dữ liệu thứ cấp có sẵn Vì vậy chúng ta bắt đầu xem xét sự hợp lý của nguồn dữ liệu thứ cấp đối với vấn đề nghiên cứu của chúng ta trước khi tiến hành thu thập dữ liệu của chính mình Các cuộc điều tra về dân số, nhà ở, điều tra doanh nghiệp, điều tra mức sống dân cư, điều tra kinh tế xã hội gia đình (đa mục tiêu) do chính phủ yêu cầu là những nguồn dữ liệu rất quan trọng cho các nghiên cứu kinh tế
xã hội
Trang 13Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
Ngoài ra một số nguồn dữ liệu dưới đây có thể là quan trọng cho các nghiên cứu của chúng ta bao gồm:
Các báo cáo của chính phủ, bộ ngành, số liệu của các cơ quan thống
kê về tình hình kinh tế xã hội, ngân sách quốc gia, xuất nhập khẩu, đầu tư nước ngoài, dữ liệu của các công ty về báo cáo kết quả tình hình hoạt động kinh doanh, nghiên cứu thị trường
Các báo cáo nghiên cứu của cơ quan, viện, trường đại học
Các bài viết đăng trên báo hoặc các tạp chí khoa học chuyên ngành
và tạp chí mang tính hàn lâm có liên quan
Tài liệu giáo trình hoặc các xuất bản khoa học liên quan đến vấn đề nghiên cứu
Cuối cùng nhưng không kém phần quan trọng là các bài báo cáo hay luận văn của các sinh viên khác (khóa trước) trong trường hoặc ở các trường khác
Dữ liệu thứ cấp có ưu điểm là giúp tiết kiệm tiền bạc, thời gian
Nhưng cần chú ý đến nhược điểm trong sử dụng là:
Số liệu thứ cấp này đã được thu thập cho các nghiên cứu với các mục đích khác và có thể hoàn toàn không hợp với vấn đề của chúng ta; khó phân loại dữ liệu; các biến số, đơn vị đo lường có thể khác nhau
Dữ liệu thứ cấp thường đã qua xử lý nên khó đánh giá được mức độ chính xác, mức độ tin cậy của nguồn dữ liệu
Vì vậy trách nhiệm của người nghiên cứu là phải đảm bảo tính chính xác của dữ liệu, phải kiểm tra xem các kết quả nghiên cứu của người khác là dựa vào dữ liệu thứ cấp hay sơ cấp Vì vậy điều quan trọng là phải kiểm tra
dữ liệu gốc
Trang 14Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
1.2 Chuỗi thời gian và Dữ liệu chuỗi thời gian
1.2.1 Chuỗi thời gian
1.2.1.1 Khái niệm chuỗi thời gian
Khái niệm chuỗi thời gian: Chuỗi các quan sát được thu thập trên
cùng một đối tượng tại các mốc thời gian cách đều nhau được gọi là chuỗi thời gian Các quan sát này có thể đo được một cách liên tục theo thời gian hoặc là có thể được lấy theo một tập rời rạc các thời điểm khác nhau
Một chuỗi thời gian là một dãy các giá trị quan sát
: , , , n
X = x x x được xếp thứ tự diễn biến thời gian với x là các giá trị 1
quan sát tại thời điểm đầu tiên, x2 là quan sát tại thời điểm thứ hai và x n là
quan sát tại thời điểm thứ n
Ví dụ: Các báo cáo tài chính mà ta thấy hằng ngày trên báo chí, tivi hay
Internet về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tăng cường hay chỉ số tiêu dùng đều là những thể hiện rất thực tế của chuỗi thời gian
Bước đầu tiên của việc phân tích chuỗi thời gian là chọn một mô hình toán học phù hợp với tập dữ liệu cho trước X := {x x1, 2, ,x n} nào đó Để có thể nói về bản chất của những quan sát chưa diễn ra, ta giả thiết mỗi quan sát
n
x là một giá trị thể hiện của biến ngẫu nhiên X t với t Î T Ở đây T được gọi là tập chỉ số Khi đó ta có thể coi tập dữ liệu X := {x x1, 2, ,x n}là thể hiện của quá trình ngẫu nhiên {X t t, Î T } Và vì vậy, ta có thể định nghĩa một quá trình ngẫu nhiên như sau:
Định nghĩa 1.1 (Quá trình ngẫu nhiên)
Một quá trình ngẫu nhiên là một họ các biến ngẫu nhiên {X t t, Î T }được định nghĩa trên một không gian xác suất (W, ,A P)
Trang 15Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
Chú ý:
Trong việc phân tích chuỗi thời gian, tập chỉ số T là một tập các thời điểm, ví dụ như là tập {1, 2, }hay tập (- ¥ + ¥, ) Tất nhiên cũng có những quá trình ngẫu nhiên có T không phải là một tập con của R nhưng trong giới hạn của luận văn này ta chỉ xét cho trường hợp T Î R Và thường thì ta xem
T là các tập các số nguyên, khi đó ta sẽ sử dụng ký hiệu tập chỉ số là Z thay
vì T ở trên Một điểm chú ý nữa là trong luận văn này chúng ta sẽ dùng thuật ngữ chuỗi thời gian để đồng thời chỉ dữ liệu cũng như quá trình có dữ liệu đó
là một thể hiện
Trong các dạng dữ liệu được phân tích thì dữ liệu chuỗi thời gian luôn thuộc tốp đầu về tính phổ biến
1.2.1.2 Quá trình ngẫu nhiên dừng
Định nghĩa 1.2 (Hàm tự hiệp phương sai)
Giả sử {X t t, Î Z}là một quá trình ngẫu nhiên có Var( )X t < ¥ với mỗi t Î Z Khi đó hàm tự hiệp phương sai của X t được định nghĩa theo công thức sau:
Trang 16Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
Chú ý: Cũng có tài liệu gọi “dừng” theo nghĩa trên là dừng yếu, dừng
theo nghĩa rộng hay dừng bậc hai Tuy nhiên trong giới hạn luận văn chỉ xem xét tính dừng theo định nghĩa ở trên
Khi chuỗi thời gian{X t t, Î Z}là dừng thì
Trang 17Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
=
= å là trung bình mẫu Khi đó thì hàm tương tự tương quan mẫu cũng định nghĩa thông qua hàm tự hiệp phương sai mẫu như sau:
( ) : ( ) / (0),
r h = c h c h < n
1.2.1.4 Tính chất của chuỗi thời gian
Các tính chất đặc trưng của chuỗi thời gian là: Tính dừng và tính mùa vụ
Dù một chuỗi thời gian có thể biểu hiện một hoặc nhiều tính chất nhưng khi trình bày, phân tích và dự báo giá trị của chuỗi thời gian thì mỗi tính chất được xử lý tách rời
a) Tính dừng
Một dãy số liệu theo thời gian có giá trị trung bình và phương sai không đổi theo thời gian thì dãy số được xem như có tính dừng hay còn gọi là ổn định Trong trường hợp ngược lại, ta nói dãy số liệu đó không có tính dừng
Trang 18Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
Xét dãy số Y t, về mặt toán học, một dãy số liệu có tính dừng phải thỏa mãn các điều kiện sau:
( )t ar( )t ovar( t, t k)
-Trung bình: E Y( )t = Const
Phương sai: Var( )Y t = Const
Đồng phương sai: Covar(Y Y t, t- k)= g k
Chuỗi Y được gọi là không dừng nếu vi phạm điều kiện trên t
Nếu chuỗi Y không dừng, ta có thể lấy sai phân bậc 1 Khi đó chuỗi sai t
phân bậc 1 ( Wt) sẽ có thể dừng Sai phân bậc 1: Wt = Y t - Y t-1
Nếu chuỗi sai phân bậc 1 (Wt ) không dừng, ta có thể lấy sai phân bậc
2 Khi đó chuỗi sai phân bậc 2 có thể dừng Sai phân bậc 2: V t = Wt - Wt-1
Chuỗi dừng có xu hướng trở về giá trị trung bình và những dao động quanh giá trị trung bình sẽ là như nhau Nói cách khác, một chuỗi thời gian không dừng sẽ có giá trị trung bình thay đổi theo thời gian, hoặc giá trị phương sai thay đổi theo thời gian hoặc cả hai
b) Tính mùa vụ
Nếu sai phân bậc 2 mà chưa dừng, có thể chuỗi Y t có yếu tố mùa vụ (Nếu có yếu tố mùa vụ, tức là chuỗi vẫn chưa dừng)
Nếu cứ sau m thời đoạn, SAC lại có giá trị cao Khi đó Y t có tính mùa
vụ với chu kỳ m thời đoạn Phương pháp đơn giản nhất để khử tính mùa vụ là lấy sai phân thứ m
Z = Y - Y
Trang 19-Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
1.2.2 Dữ liệu chuỗi thời gian
1.2.2.1 Khái niệm Dữ liệu chuỗi thời gian
Mặt lượng của hiện tượng thường xuyên biến động qua thời gian Trong thống kê để nghiên cứu sự biến động này ta thường dựa vào dữ liệu chuỗi thời gian
Dữ liệu chuỗi thời gian là dãy số các trị số của chỉ tiêu thống kê được sắp xếp theo thứ tự thời gian
Dữ liệu chuỗi thời gian còn được phân biệt theo tần suất xuất hiện: số liệu theo năm, số liệu theo quý, số liệu theo tháng…
Ví dụ:
- Số lượng hàng bán được trong 12 tháng của một công ty
- Các gía trị của chuỗi thời gian của đại lượng X được ký hiệu
1, 2, t, n
X X X X , với X t là gía trị quan sát của X ở thời điểm t
Dữ liệu chuỗi thời gian có hai thành phần:
- Thời gian: có thể là ngày, tuần, tháng, quí, năm, Độ dài giữa hai thời gian liền nhau được gọi là khoảng cách thời gian
- Chỉ tiêu về hiện tượng nghiên cứu: chỉ tiêu này có thể là số tuyệt đối,
số tương đối, số bình quân Trị số của chỉ tiêu còn gọi là mức độ của dãy số
* Phân loại dãy số thời gian:
Căn cứ vào tính chất thời gian của dữ liệu, có thể phân biệt thành 2 loại:
1 Dữ liệu thời kỳ: là dãy số biểu hiện mặt lượng của hiện tượng qua từng thời kỳ nhất định
2 Dữ liệu thời điểm: là loại dãy số biểu hiện mặt lượng của hiện tượng qua các thời điểm nhất định Dãy số này còn được phân biệt thành 2 loại:
- Dữ liệu thời điểm có khoảng cách thời gian đều nhau
1.2.2.2 Các thành phần của dữ liệu chuỗi thời gian
Các nhà thống kê thường chia chuỗi theo thời gian thành 4 thành phần:
- Thành phần xu hướng dài hạn (long –term trend component)
Trang 20Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- Thành phần mùa (seasional component)
- Thành phần chu kỳ (cyclical component)
- Thành phần bất thường (irregular component)
a) Thành phần xu hướng dài hạn
Xu hướng dài hạn thể hiện sự tăng trưởng hoặc giảm sút của một biến
số theo thời gian với khoảng thời gian đủ dài Một số biến số kinh tế có xu hướng tăng giảm dài hạn như
- Tốc độ tăng dân số của Việt Nam có xu hướng giảm
- Tỷ trọng nông nghiệp trong GDP của Việt Nam có xu hướng giảm
- Mức giá có xu hướng tăng
Thành phần xu hướng dài hạn dùng để chỉ xu hướng tăng hay giảm của đại lượng X trong thời gian dài Về mặt đồ thị thành phần này có thể biểu diễn bởi một đường thẳng hay một đường cong trơn
Hình 1.1 Xu hướng giảm theo thời gian
Được sử dụng khi:
- Tăng năng suất hay công nghệ mới làm thay đổi lối sống
- Dân số tăng làm tăng nhu cầu hàng hóa/dịch vụ
- Các biến bị ảnh hưởng bởi lạm phát như lương, chi phí sản xuất, sinh hoạt
- Mức độ chấp nhận của thị trường gia tăng
Phương pháp áp dụng: Phương pháp trung bình trượt, san mũ (Holt), hồi quy đơn, đường tăng trưởng, mô hình mũ
Trang 21Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
b) Thành phần mùa
Biến động thời vụ của biến số kinh tế là sự thay đổi lặp đi lặp lại từ năm này sang năm khác theo mùa vụ Biến động thời vụ xảy ra do khí hậu, ngày lễ, phong tục tập quán…Biến động thời vụ có tính ngắn hạn với chu kỳ lặp lại thường là 1 năm
Thành phần mùa dùng để chỉ xu hướng tăng hay giảm của đại lượng X tính theo mùa trong năm (có thể tính theo tháng trong năm)
- Thời tiết ảnh hưởng đến biến đang xem xét
- Niên lịch ảnh hưởng đến biến đang xem xét
Gồm có phương pháp phân tích, san mũ Winter, hồi quy bội…
c) Thành phần chu kỳ (cyclical component)
Các số liệu kinh tế thường có sự tăng giảm có quy luật theo chu kỳ kinh
tế Sau một thời kỳ suy thoái kinh tế sẽ là thời kỳ phục hồi và bùng nổ kinh tế,
Trang 22Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
kế tiếp tăng trưởng kinh tế sẽ chựng lại và khỏi đầu cho một cuộc suy thoái mới Tuỳ theo nền kinh tế mà chu kỳ kinh tế có thời hạn là 5 năm, 7 năm hay
10 năm
Thành phần chu kỳ chỉ thay đổi của đại lượng X theo chu kỳ Sự khác biệt của thành phần này so với thành phần mùa là chu kỳ của nó dài hơn một năm Để đánh gía thành phần chu kỳ các gía trị của chuỗi tuần tự theo thời gian sẽ được quan sát hằng năm
Ví dụ:
Lượng dòng chảy đến hồ chứa Trị An từ năm 1959 đến 1985
Hình 1.3 Thành phần chu kỳ
Được sử dụng khi:
- Chu kỳ kinh doanh ảnh hưởng đến biến đang xem xét
- Chuyển biến trong sở thích chung như thời trang, âm nhạc,
- Chuyển biến trong dân số như đói, thiên tai
- Chuyển dịch trong chu kỳ vòng đời sản phẩm
Phương pháp áp dụng: Phương pháp phân tích, chỉ số kinh tế, mô hình kinh tế lượng, hồi quy bội
d) Thành phần bất thường (irregular component)
Thành phần này dùng để chỉ những sự thay đổi bất thường của các gía trị trong chuỗi tuần tự theo thời gian Sự thay đổi này không thể dự đoán bằng các số liệu kinh nghiệm trong qúa khứ, về mặt bản chất này không có tính chu kỳ
Trang 23Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
1.3 Tổng quan về dự báo
Khái niệm dự báo đã tồn tại từ rất lâu trong đời sống xã hội tuy nhiên trong buổi đầu nó còn mang nặng tính thần bí, vô căn cứ chỉ sau này khi mà các môn khoa học tự nhiên phát triển thì dự báo mới thực sự được coi trọng
và những hoạt động dự báo diễn ra trên một cơ sơ khoa học vững chắc Dự báo vì thế ngày nay trở thành một trong những hoạt động không thể thiếu trong hoạt động của các công ty thương mại, các tổ chức xã hội Tuy vậy thì cho tới ngày nay hầu hết các cơ sở dữ liệu cũng như các hệ thống thông tin quản lý đều chưa đáp ứng được nhu cầu này Cho dù những cấu trúc dữ liệu đã đựợc tạo dựng một cách hết sức tinh vi, mạnh mẽ
Khi tiến hành dự báo, ta căn cứ vào việc thu thập, xử lý số liệu trong quá khứ và hiện tại để xác định xu hướng vận động của các hiện tượng trong tương lai nhờ vào một số mô hình toán học
Dự báo có thể là một dự đoán chủ quan hoặc trực giác về tương lai Nhưng để cho dự báo được chính xác hơn, người ta cố loại trừ những tính chủ quan của người dự báo
Ngày nay, dự báo là một nhu cầu không thể thiếu được của mọi hoạt động kinh tế - xác hội, khoa học - kỹ thuật, được tất cả các ngành khoa học quan tâm nghiên cứu
1.3.1 Đặc điểm của dự báo
- Dùng để dự báo các mức độ tương lai của hiện tượng, qua đó giúp các nhà quản trị doanh nghiệp chủ động trong việc đề ra các kế hoạch và các quyết định cần thiết phục vụ cho quá trình sản xuất kinh doanh, đầu tư, quảng
bá, quy mô sản xuất, kênh phân phối sản phẩm, nguồn cung cấp tài chính…
và chuẩn bị đầy đủ điều kiện cơ sở vật chất, kỹ thuật cho sự phát triển trong thời gian tới (kế hoạch cung cấp các yếu tố đầu vào như: lao động, nguyên vật liệu, tư liệu lao động… cũng như các yếu tố đầu ra dưới dạng sản phẩm vật chất và dịch vụ)
Trang 24Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- Trong các doanh nghiệp, nếu công tác dự báo được thực hiện một cách nghiêm túc còn tạo điều kiện nâng cao khả năng cạnh tranh trên thị trường
- Dự báo chính xác sẽ giảm bớt mức độ rủi ro cho doanh nghiệp nói riêng và toàn bộ nền kinh tế nói chung
- Dự báo chính xác là căn cứ để các nhà hoạch định hoạch định các chính sách phát triển kinh tế, văn hoá, xã hội trong toàn bộ nền kinh tế quốc dân
- Nhờ có dự báo, các chính sách kinh tế, các kế hoạch và chương trình phát triển kinh tế được xây dựng có cơ sở khoa học và mang lại hiệu quả kinh
tế cao
- Nhờ có dự báo thường xuyên và kịp thời, các nhà quản trị doanh nghiệp có khả năng kịp thời đưa ra những biện pháp điều chỉnh các hoạt động kinh tế của đơn vị mình nhằm thu được hiệu quả sản xuất kinh doanh cao nhất
1.3.2 Các loại dự báo
1.3.2.1 Căn cứ vào độ dài thời gian dự báo
Căn cứ vào độ dài thời gian dự báo có thể phân thành ba loại:
- Dự báo dài hạn: Là những dự báo có thời gian dự báo từ 5 năm trở lên Thường dùng để dự báo những mục tiêu, chiến lược về kinh tế chính trị, khoa học - kỹ thuật trong thời gian dài ở tầm vĩ mô
- Dự báo trung hạn: Là những dự báo có thời gian dự báo từ 3 đến 5 năm Thường phục vụ cho việc xây dựng những kế hoạch trung hạn về kinh
tế, văn hoá, xã hội… ở tầm vi mô và vĩ mô
- Dự báo ngắn hạn: Là những dự báo có thời gian dự báo dưới 3 năm, loại dự báo này thường dùng để dự báo hoặc lập các kế hoạch kinh tế, văn hoá, xã hội chủ yếu ở tầm vi mô và vĩ mô trong khoảng thời gian ngắn nhằm phục vụ cho công tác chỉ đạo kịp thời
Cách phân loại này chỉ mang tính tương đối tuỳ thuộc vào từng loại hiện tượng để quy định khoảng cách thời gian cho phù hợp với loại hiện
Trang 25Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
tượng đó Ví dụ trong dự báo kinh tế, dự báo dài hạn là những dự báo có tầm
dự báo trên 5 năm, nhưng trong dự báo thời tiết, khí tượng học chỉ là một tuần Thang thời gian đối với dự báo kinh tế dài hơn nhiều so với thang thời gian dự báo thời tiết Vì vậy, thang thời gian có thể đo bằng những đơn vị thích hợp (Ví dụ: quý, năm đối với dự báo kinh tế và ngày đối với dự báo dự báo thời tiết)
1.3.2.2 Dựa vào các phương pháp dự báo
Dự báo có thể chia thành ba nhóm:
- Dự báo bằng phương pháp chuyên gia: Loại dự báo này được tiến hành trên cơ sở tổng hợp, xử lý ý kiến của các chuyên gia thông thạo với hiện tượng được nghiên cứu, từ đó có phương pháp xử lý thích hợp để ra các dự đoán, các dự đoán này được cân nhắc và đánh giá chủ quan từ các chuyên gia Phương pháp này có ưu thế trong trường hợp dự đoán những hiện tượng hay quá trình bao quát rộng, phức tạp, chịu sự chi phối của khoa học - kỹ thuật, sự thay đổi của môi trường, thời tiết, chiến tranh trong khoảng thời gian dài Một cải tiến của phương pháp Delphi là phương pháp dự báo dựa trên cơ sở sử dụng một tập hợp những đánh giá của một nhóm chuyên gia Mỗi chuyên gia được hỏi ý kiến và rồi dự báo của họ được trình bày dưới dạng thống kê tóm tắt Việc trình bày những ý kiến này được thực hiện một cách gián tiếp (không
có sự tiếp xúc trực tiếp) để tránh những sự tương tác trong nhóm nhỏ qua đó tạo nên những sai lệch nhất định trong kết quả dự báo Sau đó, người ta yêu cầu các chuyên gia duyệt xét lại những dự báo của họ trên cơ sở tóm tắt tất cả các dự báo, có thể có những bổ sung thêm
- Dự báo theo phương trình hồi quy: Theo phương pháp này, mức độ cần dự báo phải được xây dựng trên cơ sở xây dựng mô hình hồi quy, mô hình này được xây dựng phù hợp với đặc điểm và xu thế phát triển của hiện tượng nghiên cứu Để xây dựng mô hình hồi quy, đòi hỏi phải có tài liệu về hiện tượng cần dự báo và các hiện tượng có liên quan Loại dự báo này thường được sử dụng để dự báo trung hạn và dài hạn ở tầm vĩ mô
Trang 26Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- Dự báo dựa vào dãy số thời gian: Là dựa trên cơ sở dãy số thời gian phản ánh sự biến động của hiện tượng ở những thời gian đã qua để xác định mức độ của hiện tượng trong tương lai
1.3.2.3 Căn cứ vào nội dung (đối tượng dự báo)
Có thể chia dự báo thành: Dự báo khoa học, dự báo kinh tế, dự báo xã hội, dự báo tự nhiên, thiên văn học…
- Dự báo khoa học: Là dự kiến, tiên đoán về những sự kiện, hiện tượng, trạng thái nào đó có thể hay nhất định sẽ xảy ra trong tương lai Theo nghĩa hẹp hơn, đó là sự nghiên cứu khoa học về những triển vọng của một hiện tượng nào đó, chủ yếu là những đánh giá số lượng và chỉ ra khoảng thời gian
mà trong đó hiện tượng có thể diễn ra những biến đổi
- Dự báo kinh tế: Là khoa học dự báo các hiện tượng kinh tế trong tương lai Dự báo kinh tế được coi là giai đoạn trước của công tác xây dựng chiến lược phát triển kinh tế - xã hội và dự án kế hoạch dài hạn; không đặt ra những nhiệm vụ cụ thể, nhưng chứa đựng những nội dung cần thiết làm căn
cứ để xây dựng những nhiệm vụ đó Dự báo kinh tế bao trùm sự phát triển kinh tế và xã hội của đất nước có tính đến sự phát triển của tình hình thế giới
và các quan hệ quốc tế Thường được thực hiện chủ yếu theo những hướng sau: dân số, nguồn lao động, việc sử dụng và tái sản xuất chúng, năng suất lao động; tái sản xuất xã hội trước hết là vốn sản xuất cố định: sự phát triển của cách mạng khoa học – kĩ thuật và công nghệ và khả năng ứng dụng vào kinh tế; mức sống của nhân dân, sự hình thành các nhu cầu phi sản xuất, động thái
và cơ cấu tiêu dùng, thu nhập của nhân dân; động thái kinh tế quốc dân và sự chuyển dịch cơ cấu (nhịp độ, tỉ lệ, hiệu quả); sự phát triển các khu vực và ngành kinh tế (khối lượng động thái, cơ cấu, trình độ kĩ thuật , bộ máy, các mối liên hệ liên ngành); phân vùng sản xuất, khai thác tài nguyên thiên nhiên
và phát triển các vùng kinh tế trong nước, các mối liên hệ liên vùng; dự báo
sự phát triển kinh tế của thế giới kinh tế Các kết quả dự báo kinh tế cho phép hiểu rõ đặc điểm của các điều kiện kinh tế - xã hội để đặt chiến lược phát triển
Trang 27Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
kinh tế đúng đắn, xây dựng các chương trình, kế hoạch phát triển một cách chủ động, đạt hiệu quả cao và vững chắc
- Dự báo xã hội: Dự báo xã hội là khoa học nghiên cứu những triển vọng cụ thể của một hiện tượng, một sự biến đổi, một quá trình xã hội, để đưa
ra dự báo hay dự đoán về tình hình diễn biến, phát triển của một xã hội
- Dự báo tự nhiên, thiên văn học, loại dự báo này thường bao gồm: + Dự báo thời tiết: Thông báo thời tiết dự kiến trong một thời gian nhất định trên một vùng nhất định Trong dự báo thời tiết có dự báo chung, dự báo khu vực, dự báo địa phương, v.v Về thời gian, có dự báo thời tiết ngắn (1-3 ngày) và dự báo thời tiết dài (tới một năm)
+ Dự báo thuỷ văn: Là loại dự báo nhằm tính để xác định trước sự phát triển các quá trình, hiện tượng thuỷ văn xảy ra ở các sông hồ, dựa trên các tài liệu liên quan tới khí tượng thuỷ văn Dự báo thuỷ văn dựa trên sự hiểu biết những quy luật phát triển của các quá trình, khí tượng thuỷ văn, dự báo sự xuất hiện của hiện tượng hay yếu tố cần quan tâm Căn cứ thời gian dự kiến,
dự báo thuỷ văn được chia thành dự báo thuỷ văn hạn ngắn (thời gian không quá 2 ngày), hạn vừa (từ 2 đến 10 ngày); dự báo thuỷ văn mùa (thời gian dự báo vài tháng); cấp báo thuỷ văn: thông tin khẩn cấp về hiện tượng thuỷ văn gây nguy hiểm Theo mục đích dự báo, có các loại: dự báo thuỷ văn phục vụ thi công, phục vụ vận tải, phục vụ phát điện, v.v Theo yếu tố dự báo, có: dự báo lưu lượng lớn nhất, nhỏ nhất, dự báo lũ, v.v
+ Dự báo địa lý: Là việc nghiên cứu về hướng phát triển của môi trường địa lí trong tương lai, nhằm đề ra trên cơ sở khoa học những giải pháp
sử dụng hợp lí và bảo vệ môi trường
+ Dự báo động đất: Là loại dự báo trước địa điểm và thời gian có khả năng xảy ra động đất Động đất không đột nhiên xảy ra mà là một quá trình tích luỹ lâu dài, có thể hiện ra trước bằng những biến đổi địa chất, những hiện tượng vật lí, những trạng thái sinh học bất thường ở động vật,.v.v Việc dự báo thực hiện trên cơ sở nghiên cứu bản đồ phân vùng động đất và những dấu
Trang 28Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
hiệu báo trước Cho đến nay, chưa thể dự báo chính xác về thời gian động đất
sẽ xảy ra
1.3.3 Các phương pháp dự báo
1.3.3.1 Phương pháp dự báo định tính (Subjective Forecasting Method)
Các phương pháp này dựa trên cơ sở nhận xét của những nhân tố nhân quả, dựa theo doanh số của từng sản phẩm hay dịch vụ riêng biệt và dựa trên những ý kiến về các khả năng có liên hệ của những nhân tố nhân quả này trong tương lai (Những phương pháp này có liên quan đến mức độ phức tạp khác nhau, từ những khảo sát ý kiến được tiến hành một cách khoa học để nhận biết về các sự kiện tương lai)
Ưu điểm: Dễ dàng thực hiện, không đòi hỏi kiến thức về các mô hình toán hoặc kinh tế lượng, thường được chấp nhận
Nhược điểm: Mang tính chủ quan rất cao, không chuẩn, mất nhiều năm
để trở thành người có khả năng phán đoán đúng Không có phương pháp hệ thống để đánh giá và cải thiện mức độ chính xác
1.3.3.2 Phương pháp dự báo định lượng (Quantitative Forecasting Method)
Mô hình dự báo định lượng dựa trên số liệu quá khứ, những số liệu này giả sử có liên quan đến tương lai và có thể tìm thấy được Tất cả các mô hình
dự báo theo định lượng có thể sử dụng thông qua chuỗi thời gian và các giá trị này được quan sát đo lường các giai đoạn theo từng chuỗi
Ưu điểm:
- Kết quả dự báo hoàn toàn khách quan
- Có phương pháp đo lường độ chính xác dự báo
- Tốn ít thời gian để tìm ra kết quả dự báo
Nhược điểm:
- Chỉ dự báo tốt trong thời gian ngắn và trung hạn
- Không có phương pháp nào có thể đưa đầy đủ những yếu tố bên ngoài
có tác động đến kết quả dự báo vào mô hình
Trang 29Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
Chương 2 MỘT SỐ KỸ THUẬT NGOẠI SUY
Ngoại suy là một phương pháp dự báo tương đối đơn giản, ít tốn kém,
do vậy được sử dụng khá phổ biến trong dự báo kinh tế - xã hội
2.1 Khái niệm ngoại suy
2.1.1 Khái niệm ngoại suy
Ngoại suy (Extrapolation) là dựa trên những số liệu đã có về một đối
tượng được quan tâm để đưa ra suy đoán hoặc dự báo về hành vi của đối tượng đó trong tương lai Ngoại suy có 2 dạng chính là ngoại suy theo số liệu lát cắt và ngoại suy theo chuỗi số liệu lịch sử
Ngoại suy theo số liệu lát cắt (Extrapolation for cross-sectional data) là
dựa trên hành vi của một số thành phần tại một thời điểm nào đó để ngoại suy
về hành vi của các thành phần khác cũng tại thời điểm đó
Ngoại suy theo chuỗi số liệu (Time-series extrapolation) là dựa trên
chuỗi số liệu lịch sử và sử dụng kỹ thuật kinh tế lượng để đưa ra dự báo đối với biến quan tâm Giả thiết cơ bản là hành vi của biến được dự báo sẽ tiếp tục trong tương lai như đã diễn ra trong quá khứ
2.1.2 Khi nào nên sử dụng phương pháp ngoại suy để dự báo
Thực tế là không phải lúc ta nào cũng sử dụng ngoại suy, mà chỉ nên sử dụng phương pháp ngoại suy khi gặp một trong các trường hợp sau
- Số lượng cần dự báo rất lớn Chẳng hạn như một công ty sản xuất nhiều sản phẩm khác nhau và cần phải dự báo về sản lượng tiêu thụ và tồn kho các sản phẩm cho từng tuần Khi đó số lượng các dự báo là rất lớn Trong trường hợp này, quy trình dự báo bằng ngoại suy được tự động hoá là phù hợp
vì nhanh chóng và đỡ tốn kém
- Tình huống cần dự báo tương đối ổn định Đó là vì ngoại suy dựa trên giả định là trong tương lai tình huống sẽ tiếp tục diễn ra như đã xảy ra trong quá khứ
Trang 30Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
- Khi các phương pháp khác có thể bị ảnh hưởng sai lệch của người dự báo Chẳng hạn dự báo chuyên gia thường bị ảnh hưởng sai lệch chủ quan của người dự báo, nếu người đó quá bi quan (hoặc ngược lại quá lạc quan) về tình huống cần dự báo Khi đó, dự báo bằng ngoại suy có lẽ là khách quan hơn
- Người dự báo không biết nhiều lắm về tình huống cần dự báo Khi đó thì cách làm tương đối đơn giản và hợp lý là giả định rằng diễn biến trong tương lai cũng sẽ tương tự như trong quá khứ, tức là sử dụng ngoại suy
2.1.3 Ưu nhược điểm của phương pháp ngoại suy
+ Ưu điểm
- Dễ dàng thực hiện vì các phương pháp này tương đối đơn giản, đặc biệt so với các phương pháp dự báo phức tạp khác như mô hình kinh tế lượng nhiều biến Do tính đơn giản nên dự báo bằng ngoại suy có thể được thực hiện nhanh chóng và ít tốn kém về chi phí
- Quy trình ngoại suy có thể dễ dàng tự động hoá được: ví dụ như trong trường hợp cần dự báo liên tục và đều đặn (hàng ngày hoặc hàng tuần) về tình hình sản xuất và tiêu thụ rất nhiều loại sản phẩm của một công ty
+ Nhược điểm
Tuy nhiên, ngoại suy có nhược điểm chính là nó chỉ lưu ý đến các hiện tượng xảy ra trong quá khứ mà bỏ qua các tác động mới xuất hiện trong hiện tại hoặc có thể xuất hiện trong tương lai Các tác động đó làm thay đổi sự vận động của hiện tượng cần dự báo so với nó đã xảy ra trong quá khứ, do đó dự báo có thể sẽ không chính xác Vì lý do này mà ngoại suy chỉ nên ứng dụng cho các dự báo ngắn hạn, khi các tác động mới chưa kịp xuất hiện, hoặc nếu
đã xuất hiện thì chưa kịp gây tác động lớn đến hiện tượng cần dự báo
Ngoài ra, sai số có thể xảy ra của ngoại suy là tương đối khó dự đoán
2.1.4 Tính chính xác của dự báo
Tính chính xác của dự báo đề cập đến độ chênh lệch của dự báo với số liệu thực tế Bởi vì dự báo được hình thành trước khi số liệu thực tế xảy ra, vì vậy tính chính xác của dự báo chỉ có thể đánh giá sau khi thời gian đã qua đi
Trang 31Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
Nếu dự báo càng gần với số liệu thực tế, ta nói dự báo có độ chính xác cao và lỗi trong dự báo càng thấp
Sai số dự báo: e t = A t - F t (2.1)Trong đó: e t : giá trị thực tại giai đoạn t
F t : giá trị dự báo tại giai đoạn t
n : số giai đoạn
Nếu một mô hình được đánh giá là tốt thì sai số dự báo phải tương đối nhỏ
Sai số tuyệt đối trung bình(mean absolute error)
Phần trăm sai số tuyệt đối phần trăm(mean absolute percentaga error)
Sai số trung bình bình phương (mean spuared error)
+ Sai số của dự báo:
+ Sai số dự báo là sự chênh lệch giữa mức độ thực tế và mức độ tính toán theo mô hình dự báo
+ Sai số dự báo phụ thuộc vào 03 yếu tố: độ biến thiên của tiêu thức trong thời kỳ trước, độ dài của thời gian của thời kỳ trước và độ dài của thời
2(A t F t)
Trang 32Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
2
i y
P : Số các tham số cần tìm trong mô hình xu thế
Công thức này được dùng để lựa chọn dạng hàm xu thế (so sánh các sai
số chuẩn tính được) sai số nào nhỏ nhất chứng tỏ rằng hàm tương ứng với sai
số sẽ xấp xỉ tốt nhất và được lựa chọn làm hàm xu thế để dự đoán Thông thường để việc dự đoán được tiến hành đơn giản ta vẫn chọn hàm xu thế làm hàm tuyến tính
Công thức tính sai số dự báo:
1 3( 2 1)1
( 1)
L
n S
2.1.5 Ứng dụng của kỹ thuật ngoại suy vào bài toán dự báo
Ngoại suy là một phương pháp dự báo trong đó các điều kiện đang diễn
ra được phổ biến trong tương lai tuân theo quy luật của của biến trình đã quan sát được của hiện tượng Phương pháp ngoại suy thường được sử dụng khi xây dựng những công thức tính toán dựa theo dữ liệu chuỗi thời gian Nếu ở một khoảng thời gian nào đó đặc điểm của mối phụ thuộc thể hiện rõ nét thì
Trang 33Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
mối phụ thuộc đó được tiếp tục chấp nhận nếu tính đến xu hướng diễn biến của quá trình (đường cong) Dự báo theo phương pháp ngoại suy đảm bảo tin cậy nếu thời hạn dự báo ngắn và trong khoảng thời gian đó không chờ đợi những lực kích động đáng kể từ bên ngoài
Đa phần các chuỗi thời gian là các chuỗi không liên tục, chúng là các quan sát rời rạc trong một khoảng thời gian nào đó, ký hiệu Y t là chuỗi thời gian với t = 1, 2, 3, , n Ta cần phải dự báo Y t trong các thời kỳ
1, n 2, n 3, , n i
n + + + + Ký hiệu các giá trị dự báo là Y n+i
Giả sử với t = 1, 2, 3, , n ta biểu diễn Y t bằng một hàm liên tục của ( )
2.2 Ngoại suy dựa dựa vào mô hình hồi quy tuyến tính
2.2.1 Bài toán hồi quy
Đặt vấn đề: Khi xét bài toán, ta đã giả thiết rằng mối quan hệ giữa đại
lượng x x x( 0, , ,1 x n)và y y( 0, y , , y1 n)là tồn tại mối quan hệ y = f x( ) Việc xác định đa thức P n n( )cần thỏa mãn điểu kiện P x n( )k º f x( )k "k Tuy
nhiên trong trường hợp khi x và y là các đại lượng ngẫu nhiên Chẳng hạn là các kết quả của các thí nghiệm hóa sinh, mối quan hệ giữa x vày (hay còn gọi
là mối quan hệ tương quan) là chưa đánh giá được thì việc xác định đa thức ( )
n
P n là không thực tế và khó thực hiện Do đó người ta mong muốn xác định
1 hàm gần dung đảm bảo lệch ít nhất so với các số liệu thực nghiệm; Các hàm như vậy được gọi là các hàm hồi quy
Trang 34Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
2.2.1.1 Phương pháp bình phương cực tiểu
Xét bộ số liệu X x x( 0, , ,1 x n)và Y y y( 0, , ,1 y n)trong đó X và Y là các đại lượng ngẫu nhiên
Ta cần xác định mối tương quan Y = F x( , a , a , , a0 1 m)để sao cho ( , a , a , , a0 1 m) k
F x » Y "k = 0,1, , m
Trong đó a a0, , ,1 a mlà các tham số cần xác định
Để xác định các tham số a a0, , ,1 a m, phải đưa ra điều kiện là trung bình phương độ lệch giữa giá trị thực nghiệm và giá trị hàm F tại các điểm x klà nhỏ nhất, tức là:
2.2.1.2 Hàm hồi quy tuyến tính
Đây là dạng đơn giản nhất trong các phương pháp hồi quy Ở đây, dữ liệu được mô hình hóa theo đường thẳng
Xét hai biến ngẫu nhiên X và Y, trong đó X là biến độc lập còn Y là biến phụ thuộc Trong thực tế, thông thường X có thể quan sát được, đo được còn biến Y khó có thể định lượng trực tiếp nên phải xác định nó qua biến X
Theo mô hình này, một biến ngẫu nhiên Y sẽ được tính bẳng một hàm
tuyến tính của một biến ngẫu nhiên X khác theo công thức:
Y = aX + b
Trang 35Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
Trong đó độ biến thiên của Y là không đổi, , a b gọi là các hệ số hồi quy
Các hệ số này có thể được tính ra bằng phương pháp bình phương tối thiểu
Cho n mẫu hay điểm dữ liệu dưới dạng (x y1, 1) (, x y2, 2), ,(x y n, n), các hệ số hồi quy ,a b được tính như sau:
Trang 36Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
2.2.1.3 Hàm hồi quy bậc hai
2 1
k n
Nếu nhƣ giả thuyết rắng sau mỗi đơn vị thời gian Y t tăng lên với một
số % không đổi, khi đó có thể dùng hàm dạng mũ sau: