LỜI NÓI ĐẦU Trong thực tế, có rất nhiều hiện tượng phụ thuộc vào thời gian như: Lượng tiêu thụ lương thực thực phẩm phụ thuộc vào độ tuổi, chu kỳ sống của sản phẩm, sự thay đổi về số lư
Trang 1TRƯỜNG ĐẠI HỌC CẦN THƠ KHOA KHOA H ỌC TỰ NHIÊN
(B Ộ MÔN TOÁN – KHOA KHTN)
SINH VIÊN TH ỰC HIỆN
LÊ KIM SANG NGÀNH: TOÁN TH ỐNG KÊ
Trang 2L ỜI CẢM ƠN
- -
Thời gian trôi qua thật nhanh để rồi bản thân em, một sinh viên năm cuối
sắp sửa phải nói lời tạm biệt với bạn bè, thầy cô, với trường Đại học Cần Thơ, nơi chúng em đã trải qua quá trình học tập và rèn luyện của thời sinh viên
Cám ơn quý thầy cô đã mang đến cho em rất nhiều kiến thức bổ ích trong suốt
thời gian qua Em đã học được ở thầy cô rất nhiều điều không chỉ là kiến thức mà còn ở tư cách, đạo đức, lối sống Và giờ đây, em cảm thấy trưởng thành hơn và
vững vàng hơn trong cuộc sống
Thông qua luận văn này, em xin chân thàn h cảm ơn quý thầy cô thuộc Bộ môn Toán, Khoa Khoa Học Tự Nhiên, Trường Đại Học Cần Thơ đã tạo mọi điều
kiện và giúp đỡ em trong thời gian làm luận văn
Em xin gởi lời cảm ơn chân thành và sâu sắc nhất đến cô Dương Thị Tuyền, người đã tận tình hướng dẫn và giúp đỡ em trong suốt quá trình thực hiện đề tài
Em xin chân thành cảm ơn những người thân trong gia đình đã động viên và
tạo mọi điều kiện để em có thể hoàn thành luận văn
Đồng thời, cũng xin cám ơn các bạn lớp Toán Ứng Dụng K32 đã động viên
và hỗ trợ cho em rất nhiều trong thời gian thực hiện đề tài
Mặc dù em đã có nhiều cố gắng nhưng trong suốt quá trình thực hiện, đề tài này vẫn không sao tránh khỏi những thiếu sót Rất mong sự đóng góp ý kiến của quý thầy cô và các bạn sinh viên
Cần Thơ, tháng 5 năm 2010
Lê Kim Sang
Trang 3M ỤC LỤC
PH ẦN MỞ ĐẦU 1
PH ẦN NỘI DUNG Chương 1 DÃY SỐ THỜI GIAN 2
1.1 Dãy số thời gian … 2
1.1.1 Định nghĩa 2
1.1.2 Phân lo ại 2
1.1.3 Các thành ph ần của dãy số thời gian 3
1.1.4 Phân tích chu ỗi thời gian bằng đồ thị 4
1.2 Một số chỉ tiêu cơ bản về dãy số thời gian … 8
1.2.1 M ức độ trung bình theo thời gian 8
1.2.2 Lượng tăng giảm tuyệt đối 8
1.2.3 T ốc độ phát triển 9
1.2.4 Ba lo ại tốc độ tăng giảm 10
1.2.5 Giá tr ị tuyệt đối của 1% tăng giảm 10
Chương 2 MỘT SỐ MÔ HÌNH DỰ BÁO BIẾN ĐỘNG CỦA DÃY S Ố THỜI GIAN ………12
2.1 Phân tích biến động các thành phần của dãy số thời gian … 12
2.1.1 Bi ến động thời vụ 12
2.1.2 Bi ến động xu hướng 14
2.1.3 Bi ến động chu kỳ 17
2.1.4 Bi ến động ngẫu nhiên 17
2.1.5 San b ằng chuỗi thời gian 19
2.2 Một số mô hình dự báo biến động của dãy số thời gian … 21
Trang 42.2.1 D ự báo dựa vào tăng giảm tuyệt đối trung bình 21
2.2.2 D ự báo dựa vào tốc độ phát triển trung bình 21
2.2.3 Phương pháp làm phẳng số mũ đơn giản 22
2.2.4 Mô hình san b ằng mũ Holt – Winters 24
2.2.5 D ự báo bằng hàm xu hướng 27
2.2.6 D ự đoán dựa trên mô hình nhân 30
2.2.7 D ự đoán dựa trên mô hình cộng 31
2.2.8 S ự lựa chọn mô hình dự đoán 33
Chương 3 CÁC BÀI TOÁN ỨNG DỤNG 36
3.1 Bài toán 1… 36
3.1.1 Phương pháp dự báo 36
3.1.2 So sánh k ết quả giữa các mô hình dự báo và kết luận 39
3.2 Bài toán 2… 39
3.2.1 Phương pháp dự báo 39
3.2.2 Kết quả dự báo 41
PH ẦN KẾT LUẬN 42
TÀI LIỆU THAM KHẢO 43
DANH MỤC CÁC HÌNH 44
Trang 5LỜI NÓI ĐẦU
Trong thực tế, có rất nhiều hiện tượng phụ thuộc vào thời gian như: Lượng tiêu thụ lương thực thực phẩm phụ thuộc vào độ tuổi, chu kỳ sống của sản
phẩm, sự thay đổi về số lượng độc giả của một tờ báo qua các năm hoặc sự thay đổi về số lượng học sinh phổ thông của một quốc gia qua các thời kì Và các
hiện tượng kinh tế xã hội luôn biến động qua thời gian Với lý luận như vậy, ta
có thể xem thời gian như là một biến độc lập tác động đến đối tượng nghiên
cứu Để nghiên cứu sự biến động này, người ta dùng phương pháp dãy số thời gian nghĩa là chúng ta quan sát hiện tượng biến đổi qua thời gian rồi tìm qui
luật và dùng qui luật đó để suy luận Do đó, ta có thể xem nghiên cứu dãy số
thời gian là một phương án lựa chọn để dự báo
Vấn đề đặt ra ở đây là: Chúng ta sẽ phân tích dãy số thời gian như thế nào?
Từ đó, chúng ta sẽ có những mô hình dự báo nào để dự báo cho sự biến động
của hiện tượng trong một tương lai nhất định?
Đề tài “Dự Báo Bằng Mô Hình Dãy Số Thời Gian” đã giúp em giải quyết
những vấn đề trên với nội dung tóm tắt kèm theo như sau:
Chương 1: Dãy số thời gian Trình bày những kiến thức cơ bả n về dãy số thời
gian
Chương 2: Một số mô hình dự báo biến động của dãy số thời gian Trình bày
phân tích biến động từng thành phần của dãy số thời gian và cách lựa chọn mô hình dự báo thích hợp
Chương 3: Các bài toán ứ ng dụng Trình bày việc áp dụng một số phương
pháp dự báo để dự báo tổng sản lượng lúa, dự báo GDP Việt Nam từ năm 2010 đến năm 2012
Trang 6C hương 1 DÃY S Ố THỜI GIAN 1.1 DÃY S Ố THỜI GIAN
• Thời gian ( ti) : ngày, tuần, tháng, quý, năm… ( i = 1 n, )
• yi :Giá trị của chỉ tiêu ứng với thời gian ti ( i = 1 n, )
Ví d ụ 1: Giá trị xuất khẩu mặt hàng X của một quốc gia trong các năm như sau:
Ví d ụ 3: Tổng trị giá tài sản của một công ty vào các thời điểm kiểm kê cuối
năm (31/12/1995) như sau:
Trang 7
1.1.3 Các thành ph ần của dãy số thời gian
Các nhà thống kê thường chia dãy số thời gian làm 4 thành phần:
- Lượng tiêu thụ chất đốt sẽ tăng vào mùa đông và sẽ giảm vào mùa hè
- Lượng tiêu thụ đồ dùng học tập sẽ tăng vào mùa khai trường
- Doanh số bán của các cửa hàng quần áo, vải thường có xu hướng tăng cao vào tháng 12 do nhu cầu mua sắm tăng vào dịp lễ giáng sinh, Tết
Trang 8Ví d ụ 6: Những biến cố về chính trị, khí hậu, an ninh,…sẽ ảnh hưởng đến giá
chứng khoán
Các yếu tố trên có thể được kết hợp với nhau theo mô hình nhân, nghĩa là
nếu gọi Yi là giá trị của hiện tượng ở thời gian i, ta có:
Yi = Ti.Si.Ci.Ii
T
(1) Trong đó:
- Trục y: giá trị của biến số nghiên cứu
: Yếu tố ngẫu nhiên ở thời gian i
Trang 92009 2008
2007 2006
2005 2004
2003 2002
- Trục x: giá trị của một chuỗi thời gian
- Trục y: giá trị một chuỗi thời gian khác, hai chuỗi thời gian này được
khảo sát ở các thời gian tương ứng
Ví d ụ 7 : Khi xét mối quan hệ giữa chi tiêu và thu nhập của người dân ở một địa
phương, ta có đồ thị sau:
thu nhap
300 200
100 0
Mô tả giá trị của chuỗi thời gian bằng một thanh giá trị, có thể so sánh các
thời kỳ khác nhau của chuỗi thời gian (nhất là thời kỳ không liên tục)
Trang 10Hình 5: Bi ểu đồ sau đây mô tả tỷ lệ thất nghiệp của các tỉnh Đồng Bằng
Sông C ửu Long trong giai đoạn 1996-2008
d Bi ểu đồ ba giá trị đồng thời:
Mô tả biến động của mặt hàng X (cổ phiếu) trong một ngày bằng một thanh thẳng đứng với:
• Đỉnh là giá cao nhất trong ngày
• Đáy là giá thấp nhất trong ngày
• Dấu gạch ngang là giá lúc đóng cửa
Hình 6: Lo ại cổ phiếu theo giá trong ngày 18/01/2010
Trang 11
e Bi ểu đồ tròn:
Mô tả cơ cấu giá trị của một chỉ tiêu bằng số phần trăm của các bộ phận
cấu thành
Ví d ụ 8: Có số lượng về học sinh phổ thông phân theo cấp học 3 năm 2005,
2006, 2007 của địa phương X như sau:
b) Hình 8 : năm 2006
Trang 1227%
19%
Tiểu học THCS THPT
c) Hình 9 : năm 2007
Quan sát các biểu đồ trên ta có nhận xét: tỷ lệ học sinh Tiểu học tăng từ 50% (năm 2005) đến 54%(năm 2007), các tỷ lệ học sinh THCS và THPT đều
có xu hướng giảm trong giai đoạn nghiên cứu
1.2 M ỘT SỐ CHỈ TIÊU CƠ BẢN VỀ DÃY SỐ THỜI GIAN
1.2.1 M ức độ trung bình theo thời gian
a M ức độ trung bình của dãy số thời kỳ:
x x x x
n
x n
n
i i
n
= + + + =∑=
1 2 1
(2)
b M ức độ trung bình của dãy số thời điểm:
Nếu khoảng cách giữa các thời điểm bằng nhau:
121
1.2.2 Lượng tăng giảm tuyệt đối
Là chỉ tiêu biểu hiện sự thay đổi về giá trị tuyệt đối của hiện tượng giữa hai thời kỳ hoặc thời điểm nghiên cứu
Trang 13a S ố tuyệt đối từng kỳ (liên hoàn): Biểu hiện lượng tăng (giảm) tuyệt đối giữa
hai thời kỳ kế tiếp nhau
c S ố tuyệt đối trung bình:
Biểu hiện một cách chung nhất lượng tăng (giảm) tuyệt đối, tính trung
bình cho cả thời kỳ nghiên cứu
Là chỉ tiêu biểu hiện sự biến động của hiện tượng xét về mặt tỷ lệ.Tùy theo
mục đích nghiên cứu, ta có các loại tốc độ phát triển sau đây:
a T ốc độ phát triển từng kỳ (liên hoàn): Biểu hiện sự biến động về mặt tỷ lệ
của hiện tượng giữa hai kỳ liền nhau
1
i i i
x t
x−
= ( i = 2, 3, , n ) (10)
b T ốc độ phát triển định gốc: Biểu hiện sự biến động về mặt tỷ lệ của hiện
tượng giữa kỳ nghiên cứu với kỳ được chọn làm gốc
' i i
x t x
= ( i = 2, 3, , n ) (11)
Trang 14x x a
i
x x a
' = ∆'
1 hay a'i = −1t'i (18)
c T ốc độ tăng giảm trung bình:
a = − 1 t (19)
1.2.5 Giá tr ị tuyệt đối của 1% tăng giảm
Là xét xem 1% tăng (giảm) của chỉ tiêu ứng với một lượng giá trị tuyệt đối
tăng (giảm) là bao nhiêu
ga
i i
= ∆ (20)
Trang 15Từ công thức (16) ta có:
1
*100
i i i
i i
Trang 16C hương 2
CỦA DÃY SỐ THỜI GIAN
2.1 PHÂN TÍCH BI ẾN ĐỘNG CÁC THÀNH PHẦN CỦA DÃY SỐ THỜI GIAN
Giả sử ta có dãy số thời gian dựa trên mô hình nhân: Y = T.S.C.I Phần này ta sẽ đề cập đến việc xem xét biến động từng yếu tố thành phần của dãy số
2.1.1 Bi ến động thời vụ
Ở phần trên, số trung bình di động làm hạn chế, loại bỏ các biến động ngẫu nhiên Tính chất này được ứng dụng trong việc tính toán các chỉ số thời vụ nhằm
thể hiện biến động thời vụ của dãy số thời gian Các bước thực hiện:
• B1: Tính số trung bình di động 4 giai đoạn (số liệu hàng quý) hoặc 12 giai đoạn (số liệu theo tháng) Dãy số trung bình di động được tính
sẽ chỉ bao hàm yếu tố xu hướng và chu kỳ vì yếu tố thời vụ và ngẫu nhiên đã bị loại bỏ:
: Số trung bình di động ứng với giá trị quan sát ở thời điểm t
• B3 : Điều chỉnh các chỉ số thời vụ quý (hoặc tháng) sao cho trung bình của chúng bằng 100
Ví d ụ 9: Để xem xét tính chất thời vụ trong hoạt động, doanh số bán hàng quý
của một siêu thị từ năm 2004-2008 được thu thập với cách tính về doanh số trung bình di động và chỉ số thời vụ được thể hiện trong bảng sau:
Trang 17Năm Quý Doanh số
(Tỷ đồng) Trung bình 4 giai đoạn Trung bình 2 giai đoạn (x*) SI = x/x* (%)
- Tính chỉ số thời vụ điều chỉnh (S) cho từng quý:
Trang 18- Tổng chỉ số thời vụ trung bình (∑chisotvTB) = 401.43
Để thể hiện xu hướng của dãy số thời gian có tính chất thời vụ, trước hết ta
phải loại bỏ yếu tố thời vụ ra khỏi dãy số
Để loại bỏ biến động thời vụ, ta chia các giá trị thực tế của dãy số cho các
Doanh số (Tỷ đồng) (3)
Chỉ số thời
vụ (%) (4)
Doanh số đã loại bỏ
yếu tố thời vụ (5)= (3)/(4)
Trang 19- Từ dãy số đã loại bỏ yếu tố thời vụ, ta chọn và xác định các tham số của hàm
số thích hợp để thể hiện một cách tốt nhất xu hướng biến động của hiện tượng
Ở ví dụ trên, ta có thể dùng hàm xu thế dạng tuyến tính Dùng SPSS, ta tính được : ^y = 51.424 + 19.909*t
- Với phương trình này, ta có thể nói rằng, bên cạnh những dao động có tính
thời vụ, trung bình mỗi quý doanh số tăng 19.909 tỷ đồng
tgian
30 20
10 0
# kỹ thuật hồi quy khong tham số metric
> ds <- read.csv("ds.csv", header=T,dec=",",sep=";")
> ds <- ts(ds[,1],start=1,freq=3)
> plot(stl(log(ds),s.window="periodic"))
Trang 21Biến động chu kỳ (C)
Trang 22• yt
• SI: Chỉ số thời vụ
: Giá trị thực tế của hiện tượng
• C: Chỉ số chu kỳ
• T: Giá trị của hàm xu hướng
Cụ thể, ở quý I/2005 ứng với t = 5, ta có:
150.97*1.2396*1.05 = 99.75%
Vậy, trong quý I/2005 thì yếu tố ngẫu nhiên chiếm 99.75 %
Các yếu tố T, S, C, I trong ví dụ 9 được thể hiện trong bảng sau:
số thực
tế
Xu hướng
T
Chỉ số
thời vụ (%)
Chỉ số biến động ngẫu nhiên (I)
Trang 23Từ đó, ta có thể kết luận:
Doanh số của siêu thị có xu hướng tăng rõ rệt trong thời kỳ 2004-2008, như đã nói trung bình mỗi quý tăng 19.909 tỷ đồng
Doanh số của siêu thị các năm tăng cao vào quý IV và quý I, kế đó giảm
thấp vào quý II và quý III
Trong thời kỳ 2004-2008, doanh số tăng cao nhất vào quý II/2006 và
giảm thấp nhất vào quý I /2006
2.1.5 San b ằng chuỗi thời gian
a Phương pháp bình quân di động giản đơn:
1 (Y t Y t Y t Y t k )
Năm
(dự báo về phía trước một giai đoạn) (29)
Ví d ụ 10: Để xem xét về xu hướng biến động của sản lượng một nhà máy sản
xuất thép trong thời kỳ 1988-1997, ta tính số bình quân di động giản đơn 3 giai đoạn và 6 giai đoạn như sau:
SL thực tế (tr.tấn) y
bình quân di động 3 giai đoạn
Trang 24Khoảng trượt L: phụ thuộc vào mục đích của nhà nghiên cứu
i) Nếu L lẻ: CMAt
L
y y
t t
L t
2 ) 1 ( 2
) 1 ( −
+
−
− + + + +
yt : Quan sát của giai đoạn trung tâm
ii) Nếu L chẵn: ta phải tính CMA qua 2 giai đoạn:
MAt1
L
y y
t t
L t
2 1
2
+ +
t t
L
2 2
2
+ + +
Bình quân di động 5 giai đoạn
01/1982 1339 02/1982 1274
Trang 252.2.1 D ự báo dựa vào tăng giảm tuyệt đối trung bình
Người ta dùng phương pháp này khi hiện tượng biến động với một lượng tuyệt đối tương đối đều, hay các lượng tăng giảm tuyệt đối từng kỳ xấp xỉ bằng nhau
Công thức dự đoán: y n L
∧ + = yn + L (34) ∆
: Giá trị thực tế ở thời điểm n
∆ : Lượng tăng giảm tuyệt đối trung bình
• L : Tầm xa dự đoán
Ví d ụ 13: Xét lại ví dụ 1, Hãy dự đoán giá trị xuất khẩu năm 2008 và năm 2009
dựa vào lượng tăng giảm tuyệt đối trung bình?
Ta có:
1 6
9 0 1
Giá trị xuất khẩu năm 2008 của quốc gia trên là 3.08 tỷ đồng
Giá trị xuất khẩu năm 2009 của quốc gia trên là 3.26 tỷ đồng
2.2.2 D ự báo dựa vào tốc độ phát triển trung bình
Trang 26Áp dụng phương pháp này khi hiện tượng biến động với một nhịp độ tương đối ổn định hay tốc độ phát triển từng kỳ xấp xỉ nhau
Công thức dự đoán: y n L
∧ + = y L
Ví d ụ 14: Xét lại ví dụ 1, hãy dự đoán giá trị xuất khẩu năm 2008, 2009 dựa
vào tốc độ phát triển trung bình ?
Ta có: 1 5
1 2 0
9 2
• B1: làm phẳng dãy số bằng công thức:
= 3.3644 (tỷ đồng)
2.2.3 Phương pháp làm phẳng số mũ đơn giản
Dùng để dự đoán dãy số thời gian không có xu hướng hoặc tính thời vụ rõ
- Theo kinh nghiệm của các nhà dự báo thì α thích hợp cho vận dụng phương pháp làm phẳng số mũ có thể được chọn bằng:
Trang 27Với n: Độ dài chuỗi thời gian
Nếu dãy số có ít biến ngẫu nhiên, ta chọn α nhỏ
Nếu cùng một tài liệu phải chọn giữa nhiều α , thì ta chọn α có sai số nhỏ
nhất:
MSE =
2 2
Trang 282.2.4 Mô hình san b ằng mũ Holt – Winters
Áp dụng đối vớ i sự biến động của hiện tượng qua thời gian có xu thế là tuyến tính và ít có biến động thời vụ
- Giả sử chúng ta có dãy số thời gian y1, y2, y3,…, yn với biến động có tính xu
thế
Bước 1: Chọn các hệ số α β, (0<α β, <1)
Nếu chọn hằng số san bằng nhỏ tức là chúng ta coi các mức độ hiện thời của dãy
số ít ảnh hưởng đến mức độ dự báo Ngược lại nếu chọn hằng số san bằng lớn tức
là chúng ta muốn dãy số san bằng số mũ phản ứng mạnh với những thay đổi hiện
tại
Bước 2: Tiến hành san bằng mũ cho giá trị ước lượng và xu thế của dãy số:
Coi giá trị của dãy số thời gian là tổng của 2 thành phần: Thành phần trung bình
có trọng số của các giá trị thực tế (ký hiệu là St – giá trị ước lượng của hiện tượng ở thời điểm t) và thành phần xu thế (ký hiệu là Tt
1 t t t
y+ = +S T
) Ta có mô hình san
bằng số mũ:
(41) Trong đó: