Theo các kết quả nghiên cứu về tiềm năng và khả năng khai thác các nguồn năng lượng sơ cấp thủy năng, than, dầu, khí, địa nhiệt,… thì trong tương lai nguồn năng lượng sơ cấp sẽ không đủ
Trang 1KHOA CÔNG NGHỆ ĐIỆN
KHÓA LUẬN TỐT NGHIỆP
CÁC PHƯƠNG PHÁP DỰ BÁO PHỤ TẢI
ĐIỆN NĂNG
Lê Minh Hải - 16060201 Nguyễn XuânTrình - 16051031 Nguyễn ĐìnhTú - 16060401
Trang 2TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA CÔNG NGHỆ ĐIỆN
PHIẾU GIAO NHIỆM VỤ KHÓA LUẬN TỐT NGHIỆP
1 Họ và tên sinh viên/ nhóm sinh viên được giao đề tài
CÁC PHƯƠNG PHÁP DỰ BÁO PHỤ TẢI ĐIỆN NĂNG
3 Nhiệm vụ (Nội dung và số liệu ban đầu)
Trình bày tóm tắt nội dung thực hiện, số liệu ban đầu của khóa luận (nếu có)
4 Kết quả dự kiến
Trình bày tóm tắt kết quả dự kiến đạt được
Giảng viên hướng dẫn Tp HCM, ngày tháng năm 20…
Sinh viên
Trưởng bộ môn
Trang 3NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN
MỤC LỤC PHIẾU GIAO NHIỆM VỤ KHÓA LUẬN TỐT NGHIỆP ii
NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN iii
MỤC LỤC iii
DANH SÁCH CÁC HÌNH VẼ vi
DANH SÁCH CÁC BẢNG viii
LỜI CẢM ƠN x
LỜI MỞ ĐẦU xi
CHƯƠNG 1: TỔNG QUAN VỀ PHỤ TẢI ĐIỆN CƠ SỞ LÝ THUYẾT CỦA DỰ BÁO GIỚI THIỆU CÁC PHƯƠNG PHÁP DỰ BÁO PHỤ TẢI ĐIỆN NĂNG 1
1.1 Giới thiệu chung về hệ thống điện Việt Nam 1
1.2 Tổng quan về phụ tải điện 2
1.3 Khái niệm về dự báo phụ tải 3
1.3.1 Các khái niệm cơ bản 3
1.3.2 Cơ sở lý thuyết của dự báo 4
1.3.3 Tầm quan trọng của dự báo phụ tải điện 6
1.4 Các phương pháp dự báo 9
1.4.1 Dự báo trong đời sống 9
1.4.2 Xác định các thông số để dự báo 10
1.5 Giới thiệu về phần mềm R 11
1.5.1 Phần mềm R 11
Trang 41.5.3 Khía cạnh thống kê của R 12
1.5.4 Ưu và nhược điểm của R 12
CHƯƠNG 2: DỰ BÁO PHỤ TẢI BẰNG PHƯƠNG PHÁP SAN BẰNG HÀM MŨ 13
2.1 Cơ sở lý thuyết 13
2.1.1 Phân loại các phương pháp san bằng hàm mũ 13
2.1.2 Phương pháp san bằng hàm mũ đơn giản (N, N) 14
2.1.3 Phương pháp san bằng hàm mũ xu hướng tuyến tính Holt (Holt’s linear trend method) (A, N) 21
2.1.4 Phương pháp san bằng hàm mũ xu hướng suy giảm (Damped trend methods) (A d , N) 27
2.1.5 Phương pháp san bằng hàm mũ mô hình cộng Holt – Winters (A, A) 34
2.1.6 Phương pháp san bằng hàm mũ mô hình nhân Holt – Winters (A, M) 42
2.1.7 Phương pháp san bằng hàm mũ với hệ số suy giảm mô hình nhân Holt – Winters (A d , A) 50
2.2 Ứng dụng vào dự báo phụ tải cho thành phố Hồ Chí Minh 58
2.2.1 Phương pháp san bằng hàm mũ đơn giản 58
2.2.2 Phương pháp san bằng hàm mũ xu hướng tuyến tính Holt (A, N) 61
2.2.3 Phương pháp san bằng hàm mũ xu hướng suy giảm (A d , N) 63
2.2.4 Phương pháp san bằng hàm mũ mô hình cộng Holt-Winters (A, A) 66
2.2.5 Phương pháp san bằng hàm mũ mô hình nhân Holt – Winters (A, M) 70
2.2.6 Phương pháp san bằng hàm mũ hệ số suy giảm mô hình nhân Holt – Winters (A d , M) 72
2.3 Kết luận 76
CHƯƠNG 3: DỰ BÁO PHỤ TẢI BẰNG PHƯƠNG PHÁP ARIMA 78
Trang 53.1.2 Mô hình trung bình trượt (Moving average models) 79
3.1.3 Mô hình ARIMA không theo mùa (Non-seasonal ARIMA models) 80
3.1.4 Mô hình ARIMA theo mùa (Seasonal ARIMA models) 87
3.1.5 Mô hình Arima trong R (ARIMA modelling in R) 93
3.2 Ứng dụng vào dự báo phụ tải thành phố Hồ Chí Minh 98
3.2.1 Dự báo một ngày cho phụ tải thành phố Hồ Chí Minh 98
3.2.2 Dự báo một tuần cho phụ tải thành phố Hồ Chí Minh 103
3.3 Kết luận 108
TÀI LIỆU THAM KHẢO 109
Trang 6DANH SÁCH CÁC HÌNH VẼ
Hình 2.1: Biểu đồ của phương pháp (N, N) với số liệu Training 19
Hình 2.2: Biểu đồ kết quả dự báo giữa phương pháp (N, N) với số liệu Testing 20
Hình 2.3: Biểu đồ của phương pháp (A, N) với số liệu Training 25
Hình 2.4: Biểu đồ kết quả dự báo của phương pháp (A, N) với số liệu Testing 26
Hình 2.5: Biểu đồ của phương pháp (Ad, N) với số liệu Training 32
Hình 2.6: Biểu đồ kết quả dự báo của phương pháp (A, N) với số liệu Testing 33
Hình 2.7: Biểu đồ của phương pháp (A, A) với số liệu Training 40
Hình 2.9: Biểu đồ của phương pháp (A, A) với số liệu Training 48
Hình 2.10: Biểu đồ kết quả dự báo của phương pháp (A, A) với số liệu Testing 49
Hình 2.11: Biểu đồ của phương pháp (A, M) với số liệu Training 56
Hình 2.12: Biểu đồ kết quả dự báo giữa phương pháp (Ad, N) với số liệu Testing 57
Hình 2.13: Biểu đồ của phương pháp (N, N) với số liệu Training 60
Hình 2.14: Biểu đồ kết quả dự báo của phương pháp (N, N) số liệu Testing 60
Hình 2.15: Biểu đồ của phương pháp (A, N) với số liệu Training 62
Hình 2.16: Biểu đồ kết quả dự báo của phương pháp (A, N) với số liệu Testing 63
Hình 2.17: Biểu đồ của phương pháp (Ad, N) với số liệu Training 65
Hình 2.18: Biểu đồ kết quả dự báo của phương pháp (Ad, N) với số liệu Testing 66
Hình 2.19: Biểu đồ của phương pháp (A, A) với số liệu Training 68
Hình 2.20: Biểu đồ kết quả dự báo của phương pháp (A, A) với số liệu Testing 69
Hình 2.21: Biểu đồ của phương pháp (A, M) với số liệu Training 71
Hình 2.22: Biểu đồ kết quả dự báo của phương pháp (A, M) với số liệu Testing 72
Hình 2.23: Biểu đồ của phương pháp (Ad, M) với số liệu Training 75
Trang 7Hình 3.1: Hai ví dụ về dữ liệu từ các mô hình tự phát với các tham số khác nhau Trái: AR (1) với 𝒚𝒕 = 𝟏𝟖 − 𝟎 𝟖𝒚𝒕 − 𝟏 + 𝜺𝒕 Phải AR(2) với 𝒚𝒕 = 𝟖 + 𝟏 𝟑𝒚𝒕 −
𝟏 − 𝟎 𝟕𝒚𝒕 − 𝟐 + 𝜺𝒕 79
Hình 3.2: Hai ví dụ về dữ liệu từ các mô hình trung bình trượt với các tham số khác nhau Trái: MA (1) với 𝒚𝒕 = 𝟐𝟎 + 𝜺𝒕 − 𝟎 𝟖𝜺𝒕 − 𝟏 Phải: MA (2) với 𝒚𝒕 =
𝜺𝒕 − 𝜺𝒕 − 𝟏 + 𝟎 𝟖𝜺𝒕 − 𝟐 80 Hình 3.3: Thay đổi tỷ lệ phần trăm hàng quý trong tiêu dùng của Hoa Kỳ 82 Hình 3.4: Dự báo thay đổi tỷ lệ phần trăm hàng quý trong chi tiêu tiêu dùng của Hoa Kỳ 83 Hình 3.5: ACF thay đổi tỷ lệ phần trăm hàng quý trong tiêu dùng của Mỹ 84 Hình 3.6: PACF về thay đổi tỷ lệ phần trăm hàng quý trong tiêu dùng của Hoa
Kỳ 85 Hình 3.7: Doanh số bán thuốc Corticosteroid ở Úc 88 Hình 3.8: Doanh số bán thuốc corticosteroid phân biệt theo mùa ở Úc 89 Hình 3.9: Dư lượng từ ARIMA (3,0,1) (0,1,2)12 mô hình áp dụng cho dữ liệu bán hàng tập lệnh hàng tháng H02 91 Hình 3.10: Dự báo từ ARIMA (3,0,1) (0,1,2)12 mô hình áp dụng cho dữ liệu bán hàng hàng tháng H02 93 Hình 3.11: Chỉ số đơn đặt hàng thiết bị điện được điều chỉnh theo mùa trong khu vực Euro 94 Hình 3.12: Sơ đồ thời gian và các sơ đồ ACF và PACF cho dữ liệu thiết bị điện được điều chỉnh theo mùa khác nhau 95 Hình 3.13: Các biểu đồ phần dư mô hình ARIMA (3,1,1) 96 Hình 3.14: Dự báo về chỉ số đơn hàng điện được điều chỉnh theo mùa 97 Hình 3.15: Biểu đồ giữa hàm auto.arima và phương pháp Grid Search với số liệu Testing 103 Hình 3.16: Biểu đồ giữa hàm auto.arima và phương pháp Grid Search với số liệu
Trang 8DANH SÁCH CÁC BẢNG
Bảng 2.1: Phân loại hai chiều của phương pháp san bằng hàm mũ 13
Bảng 2.2: Các phương pháp san bằng hàm mũ được dùng chủ yếu 13
Bảng 2.3: Công thức tính toán đệ quy và dự báo điểm 14
Bảng 2.4: Cơ dở dữ liệu dùng để dự báo 14
Bảng 2.5: Xác định dự báo bằng công thức lý thuyết 17
Bảng 2.6: So sánh hệ số α tối ưu bằng công thức lý thuyết với phần mềm R 20
Bảng 2.7: So sánh kết quả dự báo giữa Excel với phần mềm R 21
Bảng 2.8: Xác định dự báo bằng công thức lý thuyết 24
Bảng 2.9: So sánh hệ số α tối ưu bằng công thức lý thuyết với phần mềm R 26
Bảng 2.10: So sánh kết quả dự báo giữa Excel với phần mềm R 27
Bảng 2.11: Xác định dự báo bằng công thức lý thuyết 30
Bảng 2.12: So sánh hệ số α tối ưu bằng công thức lý thuyết với phần mềm R 33
Bảng 2.13: So sánh kết quả dự báo giữa Excel với phần mềm R 33
Bảng 2.14: Cơ dở dữ liệu dùng để dự báo 34
Bảng 2.15: Xác định dự báo bằng công thức lý thuyết 38
Bảng 2.16: So sánh hệ số α, β * , γ tối ưu bằng công thức lý thuyết với phần mềm R 41
Bảng 2.17: So sánh kết quả dự báo giữa Excel với phần mềm R 42
Bảng 2.18: Xác định dự báo bằng công thức lý thuyết 46
Bảng 2.19: So sánh hệ số α, β * , γ tối ưu bằng công thức lý thuyết với phần mềm R 49
Bảng 2.20: So sánh kết quả dự báo giữa Excel với phần mềm R 50
Bảng 2.21: Xác định dự báo bằng công thức lý thuyết 54 Bảng 2.22: So sánh hệ số α, β*, γ, 𝝓 tối ưu bằng công thức lý thuyết với phần
Trang 9Bảng 3.1: Các trường hợp đặc biệt của mô hình ARIMA 81 Bảng 3.2: Giá trị AICc cho các mô hình ARIMA khác nhau 90 Bảng 3.3: Giá trị RMSE cho các mô hình ARIMA khác nhau được áp dụng cho
dữ liệu bán hàng hàng tháng H02 91 Bảng 3.4: So sánh các sai số dự báo giữa hàm auto.arima và phương pháp Grid Search 102 Bảng 3.5: So sánh các sai số giữa hàm auto.arima và phương phương Grid Search 102 Bảng 3.6: So sánh các sai số dự báo của hàm auto.arima và phương pháp Grid Search 107 Bảng 3.7: So sánh các sai số dự báo của hàm auto.arima và phương pháp Grid Search 107
Trang 10LỜI CẢM ƠN
Chúng tôi xin bày tỏ lời cảm ơn sâu sắc tới các tác giả của các công trình nghiên cứu, các tác giả của các tài liệu nghiên cứu mà chúng tôi đã trích dẫn và tham khảo để hoàn thành luận văn này Đặc biệt chúng tôi vô cùng cảm ơn TS.Trần Thanh Ngọc, người đã tận tình hướng dẫn tôi trong quá trình thực hiện luận văn.Và chúng tôi xin chân thành cảm ơn tất cả các thầy cô đã giảng dạy và giúp đỡ chúng tôi trong quá trình học tập vừa qua
Trang 11LỜI MỞ ĐẦU
1 Lý do chọn đề tài
Hiện nay Việt Nam đang ở trong thời kỳ công nghiệp hóa, hiện đại hóa đất nước, cùng với sự phát triển kinh tế thì nhu cầu sử dụng năng lượng cho các ngành đã gia tăng một cách nhanh chóng trong những năm gần đây Trong đó điện năng cung cấp cho các ngành kinh tế và dân dụng đã không ngừng tăng
Theo các kết quả nghiên cứu về tiềm năng và khả năng khai thác các nguồn năng lượng sơ cấp (thủy năng, than, dầu, khí, địa nhiệt,…) thì trong tương lai nguồn năng lượng sơ cấp sẽ không đủ cung cấp cho nhu cầu năng lượng, nên định hướng chiến lược phát triển nguồn điện Việt Nam đã phải tính đến việc nhập khẩu điện từ các nước làng giềng như Lào, Trung Quốc,… và nghiên cứu triển khai cả dự án nhà máy điện nguyên tử, các nhà máy điện năng lượng mới, khai thác và vận hành tối ưu hệ thống nhằm đảm bảo cung cấp điện ổn định và an toàn cho nhu cầu phát triển kinh tế
xã hội của đất nước
Việc cung cấp và phân phối điện năng cho các phụ tải điện vận hành ổn định là một thách thức lớn Nếu cung cấp đủ nguồn điện và phân phối một cách hợp lý sẽ giúp công cuộc phát triển kinh tế cũng như công nghiệp hóa, hiện đại hóa đất nước được đẩy nhanh và bền vững
Trước những yêu cầu trên, việc tập trung nghiên cứu, tìm ra giải pháp để dự báo một cách tương đối sát thực nhu cầu điện năng và đồ thị phụ tải điện nhằm đáp ứng việc huy động nguồn và phân phối điện năng của đơn vị quản lý cũng như nhu cầu sử dụng điện của phụ tải điện là điều hết sức cần thiết
2 Mục đích nghiên cứu của luận văn
Nghiên cứu phương pháp san bằng hàm mũ và phương pháp Arima, áp dụng tính toán và đưa ra dự báo đồ thị phụ tải điện Dựa vào đồ thị phụ tải điện đã dự báo, đơn vị quản lý và phân phối điện năng sẽ có phương án huy động nguồn điện và phân phối điện năng một cách hợp lý, có hiệu quả kinh tế cao Từ đó giúp hệ thống điện Việt Nam vận hành một cách chủ động, linh hoạt, kinh tế mà vẫn đảm bảo độ tin cậy cung cấp điện
Trang 123 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu:
Nghiên cứu phụ tải điện nói chung và cụ thể là phụ tải điện thành phố Hồ Chí Minh
Phạm vi nghiên cứu:
Dựa vào chuỗi dữ liệu trong quá khứ của phụ tải điện thành phố Hồ Chí Minh,
sử dụng phương pháp san bằng hàm mũ và phương pháp Arima để dự báo đồ thị phụ tải điện ngày bất kỳ của thành phố Hồ Chí Minh
4 Ý nghĩa khoa học và thực tiễn của đề tài
Nghiên cứu các phương pháp dự báo đồ thị phụ tải, từ đó đưa ra phương pháp
dự báo phù hợp và chính xác nhất ứng với phụ tải điện nghiên cứu
Trên cơ sở nghiên cứu, phân tích và đánh giá kết quả dự báo đồ thị phụ tải điện của thành phố Hồ Chí Minh đưa ra công tác quy hoạch phát triển điện lực thích hợp
Từ đó giúp cho việc quy hoạch thành phố Hồ Chí Minh đạt hiệu quả cao
Từ kết quả dự báo đồ thị phụ tải điện năng thành phố Hồ Chí Minh nói riêng, có thể áp dụng phương pháp này với phạm vi phụ tải điện lớn hơn trong tương lai giúp ngành điện đưa ra các đề xuất chương trình nghiên cứu phát triển Hệ thống điện một cách hợp lý nhằm giảm chi phí vốn đầu tư xây dựng nguồn, lưới mà vẫn đảm bảo cung cấp điện đầy đủ cho yêu cầu phát triển kinh tế xã hội của đất nước
5 Tên đề tài:
“Các phương pháp dự báo phụ tải điện năng”
6 Nội dung của luận văn:
Chương 1: Tổng quan về phụ tải điện, cơ sở lý thuyết của dự báo, các phương pháp dự báo phụ tải điện năng
Chương 2: Dự báo phụ tải bằng phương pháp san bằng hàm mũ
Chương 3: Dự báo phụ tải bằng phương pháp Arima
Trang 13NỘI DUNG KHÓA LUẬN CHƯƠNG 1: TỔNG QUAN VỀ PHỤ TẢI ĐIỆN
CƠ SỞ LÝ THUYẾT CỦA DỰ BÁO GIỚI THIỆU CÁC PHƯƠNG PHÁP DỰ BÁO PHỤ TẢI ĐIỆN NĂNG
1.1 Giới thiệu chung về hệ thống điện Việt Nam
Hệ thống điện (HTĐ) bao gồm các nhà máy điện, trạm biến áp, các đường dây truyền tải và phân phối điện được nối với nhau thành hệ thống làm nhiệm vụ sản xuất, truyền tải và phân phối điện năng
HTĐ phát triển không ngừng trong không gian và thời gian, để đáp ứng nhu cầu ngày càng tăng của phụ tải Tùy theo mục đích nghiên cứu, HTĐ được phân chia thành các phần hệ thống tương đối độc lập nhau
Về mặt quản lý, vận hành HTĐ được phân thành:
- Các nhà máy điện do các nhà máy điện quản lý
- Lưới điện siêu cao áp (≥ 220kV) và trạm khu vực do các công ty truyền tải điện quản lý
- Lưới điện truyền tải 110kV và phân phối do các công ty điện lực quản lý
Về mặt quy hoạch, lưới điện được phân thành hai cấp:
- Lưới hệ thống bao gồm:
- Các nguồn điện và lưới hệ thống (500, 220, 110kV)
- Các trạm khu vực (500, 220,110kV) được quy hoạch trong tổng sơ đồ
- Lưới phân phối (U ≤ 35kV) được quy hoạch riêng
Về mặt điều độ chia thành 2 cấp:
- Điều độ trung ương
- Điều độ địa phương
- Điều độ các nhà máy thủy điện
- Điều độ các miền
- Điều độ các điện lực
Về mặt nghiên cứu, tính toán, HTĐ được phân chia ra thành:
Trang 14- Lưới truyền tải (35kV, 110kV, 220kV)
- Lưới phân phối trung áp (6, 10, 22, 35kV)
- Lưới phân phối hạ áp (0.4kV)
Trong đó lưới 35kV có thể dùng cho cả lưới phân phối và lưới truyền tải Do phụ tải ngày càng phát triển về không gian và thời gian với tốc độ ngày càng cao, vì vậy cần phải xây dựng các nhà máy có công suất lớn Vì lý do kinh tế và môi trường, các nhà máy điện thường được xây dựng ở những nơi gần nguồn nhiên liệu, hoặc việc chuyên chở nhiên liệu thuận lợi, ít tốn kém, trong khi đó các trung tâm phụ tải lại ở xa
do vậy phải dùng lưới truyền tải để truyền tải điện năng đến các phụ tải Vì lý do kinh
tế cũng như an toàn, người ta không thể cung cấp trực tiếp cho các phụ tải bằng lưới truyền tải, do vậy phải dùng lưới điện phân phối
Lưới điện phân phối thực hiện nhiệm vụ phân phối điện cho một địa phương (một thành phố, quận, huyện) có bán kính cung cấp điện nhỏ, dưới 50km Trong đó, phụ tải điện là một thành phần không thể thiếu trong lưới điện phân phối, và nó ảnh hưởng không nhỏ đến hệ thống điện nói chung và hệ thống điện Việt Nam (HTĐVN) nói riêng Phụ tải của lưới phân phối đa dạng và phức tạp, các phụ tải sinh hoạt và dịch
vụ, tiểu thủ công nghiệp đa phần cùng trong một hộ phụ tải
1.2 Tổng quan về phụ tải điện
Các đặc trưng của phụ tải điện nói chung
Phụ tải của HTĐ là tổng nhu cầu sử dụng điện của toàn bộ HTĐ, là một hàm số phụ thuộc vào thời gian t, phụ thuộc vào tăng trưởng thực tế của phụ tải trong quá khứ, phụ thuộc vào các tác động khách quan (thời tiết, khí hậu).v.v , thông qua những đặc tính thống kê Hình thái của phụ tải điện mang cả hai tính chất ngẫu nhiên và quy luật
Đặc tính ngẫu nhiên của phụ tải xuất phát từ hai yếu tố:
- Tính ngẫu nhiên của chính các phụ tải
- Tính ngẫu nhiên trong hoạt động của con người trong một khoảng thời gian (ngày, tuần, tháng, năm,…)
Tuy nhiên tính ngẫu nhiên trong hoạt động sinh hoạt, sản xuất của con người lại
có tính chu kỳ, đặc điểm này tạo nên tính chu kỳ trong biến đổi của phụ tải, cho phép
dự báo phụ tải với một mức độ chính xác tương đối cao
Trang 15Phụ tải HTĐVN về cơ bản vẫn mang những đặc trưng cơ bản của phụ tải điện nói chung về tính ngẫu nhiên và quy luật
Với đặc thù là một quốc gia đang phát triển, cơ cấu và sự phát triển của các thành phần kinh tế giữa các vùng miền không đồng đều Đặc điểm địa lý trải dài qua nhiều vĩ độ do đó có sự khác biệt lớn về khí hậu Điều này đã ảnh hưởng không nhỏ đến hình dạng đồ thị phụ tải HTĐ nước ta
1.3 Khái niệm về dự báo phụ tải
1.3.1 Các khái niệm cơ bản
Thuật ngữ “dự báo” bắt nguồn từ hai chữ Hy Lạp “PRO-GROSIS” có ý nghĩa là biết trước, nói lên một thuộc tính không thể thiếu được của bộ não con người, đó là sự phản ảnh vượt trước hình thành trong quá trình phát triển của nhân loại qua nhiều thế
kỷ Cho đến nay nhu cầu dự báo đã trở nên hết sức cần thiết ở mọi lĩnh vực
Như vậy, dự báo là sự tiên đoán có khoa học mang tính xác suất và phương án trong khoảng thời gian hữu hạn về tương lai của đối tượng nghiên cứu
Xét cụ thể các tính chất của dự báo:
- Tính tiên đoán: tiên đoán trước sự vận động của đối tượng nghiên cứu trong tương lai, đó là ý thức chủ quan của con người dựa trên một số cơ sở nhất định
- Tính xác suất: vì dự báo dựa trên việc xử lý chuỗi thông tin bao hàm cả hai yếu tố ngẫu nhiên và xu thế phát triển nên kết quả khi tiên liệu so với thực
tế vận động chắc chắn có sự chênh lệch mang tính xác suất
- Tính phương án: dự báo được thể hiện bằng nhiều dạng kết quả có thể xảy
ra trong tương lai (dạng định tính, định lượng, khoảng, điểm,…)
- Tính chất thời gian hữu hạn: sự chênh lệch giữa thời điểm dự báo và thời điểm hiện tại được gọi là khoảng cách dự báo (tầm xa của dự báo), khoảng cách này không thể tùy tiện mà nó phụ thuộc vào mức độ dừng của đối tượng trong quá trình phát triển Vì vây, dự báo được tiến hành với khoảng cách dự báo thích hợp tương ứng với một khoảng thời gian hữu hạn
Trang 161.3.2 Cơ sở lý thuyết của dự báo
Dự báo nhu cầu phụ tải điện hệ thống điện quốc gia là dự báo nhu cầu cho toàn
bộ phụ tải điện được cung cấp điện từ hệ thống điện truyền tải, trừ các phụ tải điện có nguồn cung cấp điện riêng không nhận điện từ hệ thống điện quốc gia
Dự báo nhu cầu phụ tải điện hệ thống điện quốc gia bao gồm dự báo nhu cầu phụ tải điện năm, tháng, tuần, ngày và giờ tới
Để tiến hành dự báo nhu cầu điện năng hay đồ thị phụ tải điện cho tương lai, điều cần thiết phải hiểu được tại sao tiêu thụ năng lượng nói chung hay tiêu thụ điện nói riêng của một quốc gia hay một ngành riêng biệt nào đó lại biến đổi theo thời gian
và quá trình biến đổi này diễn ra như thế nào?
Hay nói cách khác để nâng cao chất lượng của các dự báo nhu cầu năng lượng nói chung hay dự báo nhu cầu điện năng và đồ thị phụ tải điện nói riêng, ta cần phải nắm bắt được cơ chế biến động của nó
Trước hết, cần phân tích sự biến đổi theo thời gian của nhu cầu tiêu thụ năng lượng, đánh giá sự biến đổi, quy luật và cơ chế của quá trình biến đổi đó Việc phân tích có thể thực hiện theo từng lĩnh vực, ngành tiêu thụ năng lượng hoặc ở tầm vĩ mô
có xét đến những cơ chế chính sách lớn điều tiết sự tăng trưởng của nhu cầu năng lượng như chính sách giá cả, cơ chế khuyến khích đầu tư, chính sách tiết kiệm và quản
lý nhu cầu năng lượng (DSM), liên hệ giữa tiêu thụ năng lượng với tăng trưởng dân số
và hoạt động kinh tế, ảnh hưởng của những thành tựu mới của khoa học và công nghệ lên quá trình sản xuất và tiêu thụ năng lượng
Để đánh giá nhu cầu năng lượng cho tương lai phải phân tích các dữ liệu của quá khứ, lý giải những biến động trong tiêu thụ năng lượng của quá khứ ở từng ngành cũng như ở tầm vĩ mô của toàn quốc, thậm chí có xét đến khả năng trao đổi năng lượng với các nước láng giếng và trong khu vực Trên cơ sở nghiên cứu phân tích dữ liệu của quá khứ, xác định quy luật biến thiên của từng dạng năng lượng trong mối tương quan với chỉ tiêu phát triển kinh tế và xã hội, với các dạng năng lượng khác Những quy luật nghiệm thấy trong quá khứ có thể sẽ thay đổi trong tương lai tùy thuộc vào sự thay đổi của cơ cấu kinh tế, thành phần dân cư và các tác động của những thành tựu mới về khoa học công nghệ tác động lên quá trình phát triển, sản xuất và tiêu thụ
Trang 17Vì vậy, để dự báo nhu cầu năng lượng cho một giai đoạn nào đó trong tương lai, ngoài những thông tin, những quy luật đã rút được từ phân tích quá khứ, cần phải có những thông tin về định hướng phát triển kinh tế xã hội trong tương lai, những chuyển dịch trong cơ cấu kinh tế, trong thành phần dân cư, những chính sách lớn liên quan đến ngành năng lượng như cơ chế đầu tư, mở rộng sự tham gia của nhiều thành phần kinh
tế trong và ngoài nước vào hoạt động năng lượng, mức tăng dân số và mức sống kinh
tế văn hóa, chính sách đảm bảo năng lượng cho những vùng nghèo khó, kém phát triển…
Trang 181.3.3 Tầm quan trọng của dự báo phụ tải điện
Dự báo phụ tải là quá trình dự báo nhu cầu dùng điện trong tương lai thông qua một vùng hoặc một mạng truyền tải trong một khoảng thời gian Có nhiều nghiên cứu cho thấy rằng nếu tăng 1% sai số trong dự báo thì dẫn tới tăng hàng chục triệu USD chi phí hoạt động mỗi năm Do đó, để đạt được hoạt động an toàn, tin cậy và kinh tế cũng như dự báo đúng lúc, chính xác HTĐ đã trở thành vấn đề có ý nghĩa hết sức to lớn
Đối với ngành năng lượng nói chung và ngành điện nói riêng tồn tại các dạng
dự báo khác nhau như:
- Dự báo sự thay đổi công suất tác dụng theo chu kỳ thời gian nhất định như theo giờ, theo từng phút hay theo từng giây tùy mức độ vận hành hay lên kế hoạch vận hành
- Dự báo công suất cực đại/ cực tiểu có thể xảy ra trong một chu kỳ thời gian (như năm, mùa, quý, tháng, tuần, ngày…)
- Dự báo điện năng sẽ tiêu thụ trong khoảng thời gian nhất định tương tự như với dự báo công suất cực đại Ngoài ra, người ta sử dụng một đơn vị dự báo khác có liên quan trực tiếp đến dự báo điện năng và dự báo công suất cực đại là dự báo hệ số phụ tải – số giờ sử dụng công suất cực đại của hệ thống điện
Nếu công tác dự báo nói chung mà dựa trên lập luận khoa học thì sẽ trở thành
cơ sở để xây dựng các kế hoạch phát triển nền kinh tế quốc dân Đặc biệt đối với ngành năng lượng, tác dụng của dự báo càng có ý nghĩa quan trọng, vì điện năng liên quan chặt chẽ với tất cả các ngành kinh tế quốc dân, cũng như đến mọi sinh hoạt bình thường của người dân
Do đó, nếu dự báo không chính xác sai lệch quá nhiều về khả năng cung cấp, về nhu cầu điện năng thì sẽ dẫn đến hậu quả là huy động nguồn quá lớn, làm tăng vốn đầu
tư, có thể gây tổn thất năng lượng tăng lên Ngược lại, nếu chúng ta dự báo phụ tải quá thấp so với nhu cầu thì sẽ không có đủ điện năng cung cấp cho các hộ tiêu thụ và tất nhiên sẽ dẫn đến việc cắt bỏ một số phụ tải một cách không có kế hoạch gây thiệt hại cho nền kinh tế quốc dân
Trang 19Đối với hệ thống điện lớn tương tự như hệ thống điện toàn quốc của Việt Nam,
dự báo như cầu tiêu thụ điện, công suất cực đại hay đồ thị phụ tải theo thời gian cũng
có thể xác định từ các dự báo của các hệ thống điện nhỏ tham gia trong hệ thống điện lớn Nếu thực hiện được như vậy, quy mô của bài toán sẽ tăng lên theo cấp số nhân nhưng ngược lại kết quả dự báo sẽ có độ chính xác cao hơn Trong trường hợp này người ta sẽ đưa thêm một khái niệm mới là hệ số đồng thời để so sánh độ lệch pha giữa các HTĐ con với nhau và qua đó hiệu ứng liên kề HTĐ sẽ được thể hiện rõ qua việc so sánh tổng công suất cực đại của các HTĐ con bao giờ cũng lớn hơn giá trị công suất cực đại của hệ thống điện hợp nhất
Dựa trên thời gian dự báo, dự báo phụ tải có thể được chia thành: dự báo ngắn hạn (1 – 2 năm), dự báo trung hạn (3 – 10 năm), dự báo dài hạn (15 – 20 năm) Với mỗi loại dự báo thì có các tiêu chuẩn khác nhau để xem xét
Dự báo ngắn hạn (ngày, giờ, tuần, tháng, mùa, năm): chủ yếu phục vụ việc điều hành sản xuất, truyền tải và phân phối điện năng Phục vụ cho nhu cầu trực tiếp của sản xuất và đời sống, lập kế hoạch sản xuất và kinh doanh Các yếu tố quan trọng nhất cho dự báo ngắn hạn bao gồm: ngày trong tuần, nhiệt độ, ảnh hưởng của mùa và độ
ẩm, hướng gió, tốc độ gió… Điều quan trọng trong dự báo phụ tải ngắn hạn là phụ tải cao điểm (phụ tải cao nhất trong ngày Pmax) và phụ tải thấp điểm (phụ tải thấp nhất trong ngày Pmin) Đó là hai điểm đặc biệt trong đồ thị phụ tải Phụ tải cao điểm quyết định việc huy động các nguồn nhiệt điện tuabin khí, diezel dự phòng nhằm đảm bảo đủ nguồn phủ đỉnh và dự phòng nóng, tăng độ an toàn cung cấp điện Phụ tải thấp điểm quyết định việc phối hợp và điều chỉnh các nguồn tuabin khí, nhiệt điện và thủy điện nhằm đảm bảo vận hành kinh tế, tránh cho các nhà máy vận hành trong công suất không cho phép về kỹ thuật Khi dự báo phụ tải không tránh khỏi sai số, dự báo cao hơn thực tế sẽ làm chi phí tăng lên do việc huy động không cần thiết các nguồn dự phòng đắt tiền Ngược lại, khi phụ tải dự báo thấp hơn thực tế sẽ dẫn đến việc giảm độ tin cậy cung cấp điện (đó là một trong những chỉ tiêu của việc thiết kế cung cấp điện) nên có thể dẫn đến phải cắt bỏ một số hộ tiêu thụ điện Vậy muốn dự báo với sai số nhỏ cần phải dựa trên phụ tải điện quá khứ và các yếu tố liên quan đến phụ tải
Dự báo trung hạn (3 – 10 năm): thường phục vụ cho việc phân bổ vốn đầu tư, lập cân bằng giữa cung và cầu năng lượng, lập kế hoạch xây dựng và theo dõi tiến độ
Trang 20xây dựng các công trình, kế hoạch đại tu sửa chữa nâng cấp thiết bị, chuẩn bị xây dựng các quy hoạch dài hạn…
Dự báo dài hạn (15 – 20 năm): nhằm định hướng cho sự phát triển của ngành để hoạch định những chiến lược chính sách lớn, đảm bảo phát triển bền vững cho toàn bộ
hệ thống năng lượng, đảm bảo an toàn về cung cấp năng lượng, sử dụng hiệu quả các nguồn năng lượng sơ cấp, giảm thiểu tác động của các công trình năng lượng lên môi trường sinh thái Trong dự báo dài hạn thì các yếu tố ảnh hưởng bao gồm các ảnh hưởng kinh tế, chính trị và mức độ phát triển công nghiệp, tổng thu nhập GDP Dự báo phụ tải dài hạn mà thấp hơn thực tế sẽ dẫn đến việc thiếu điện, phân bố điện năng giữa các vùng không đồng đều nên không đảm bảo độ tin cậy cung cấp điện Mặt khác, trong quá trình công nghiệp hóa (CNH), hiện đại hóa (HĐH) đất nước, muốn đạt được hiệu quả cao thì điện năng phải đi trước một bước Nếu dự báo mà cao hơn thực tế sẽ gây lãng phí nguồn tài nguyên quốc gia, vốn đầu tư của nhà nước vào xây dựng các nguồn điện
Đối với các HTĐ quy mô lớn (hàng chục GW), đôi khi người ta còn sử dụng khái niệm dự báo cực ngắn hạn/dự báo trực thông (hot – line) trong các hệ thống điều khiển SCADA phức tạp Tham khảo các tài liệu khoa học trên thế giới cho thấy, tốc độ thay đổi phụ tải của các HTĐ cực lớn về mặt giá trị tuyệt đối có thể hàng nghìn MW trong một giờ thậm chí vài phút đòi hỏi người vận hành hệ thống phải có kế hoạch vận hành hết sức linh hoạt và tin cậy mới đảm bảo độ an toàn, tin cậy và dừng cho hệ thống điện được
Dự báo trung hạn và dài hạn là hết sức cần thiết và có vai trò hết sức quan trọng trong công tác nghiên cứu các xu thế có thể xảy ra ở cấp vĩ mô của nền kinh tế nhằm đạt được tính tối ưu trong quá trình phát triển
Thời gian dự báo càng xa, sai lệch sẽ càng lớn, tác động của các yếu tố bất định càng nhiều Nguồn gốc của những yếu tố bất định có thể rất khác nhau: từ biến động của khí hậu, thời tiết (với dự báo ngắn hạn) đến tình hình kinh tế, tài chính (với dự báo trung hạn) và biến động chính trị xã hội (với dự báo dài hạn) Vì vậy khi dự báo nhất
là những dự báo trung hạn và dài hạn, thông thường người ta xác định một dải thông
số (thấp, trung bình (cơ sở), cao) của số liệu dự báo thay vì một trị số dự báo cố định
Trang 21Hiện nay và trong tương lai khi HTĐVN liên kết với HTĐ các nước ASEAN
và Trung Quốc, các yêu cầu về độ tin cậy cung cấp điện, vận hành an toàn và kinh tế ngày càng cao nhằm phục vụ ngày càng tốt nhu cầu tiêu thụ điện năng trong sản xuất
và sinh hoạt, góp phần trong sự tăng trưởng kinh tế của đất nước, đảm bảo các tiêu chuẩn và luật trong liên kết HTĐ các nước trong khu vực
Vì vậy, luận văn nghiên cứu và áp dụng mô hình toán học cho dự báo phụ tải điện là rất cần thiết trong vận hành tối ưu HTĐ
1.4 Các phương pháp dự báo
1.4.1 Dự báo trong đời sống
Dự báo là cần thiết trong nhiều tình huống: quyết định có xây dựng nhà máy phát điện khác trong năm năm tới đòi hỏi phải dự báo nhu cầu trong tương lai; nhân viên lên lịch trong một trung tâm cuộc gọi vào tuần tới yêu cầu dự báo về khối lượng cuộc gọi; dự trữ một hàng tồn kho đòi hỏi dự báo về yêu cầu chứng khoán Dự báo có thể được yêu cầu trước vài năm (đối với trường hợp đầu tư vốn), hoặc chỉ vài phút trước (đối với định tuyến viễn thông) Bất kể hoàn cảnh hay thời gian liên quan nào,
dự báo là một trợ giúp quan trọng để lập kế hoạch hiệu quả và hiệu quả
Một số điều dễ dự báo hơn những thứ khác Thời điểm mặt trời mọc vào sáng mai có thể được dự báo chính xác Mặt khác, số lượng xổ số ngày mai không thể dự báo với bất kỳ độ chính xác nào Khả năng dự đoán của một sự kiện hoặc số lượng phụ thuộc vào một số yếu tố bao gồm:
1 Làm thế nào chúng ta hiểu các yếu tố đóng góp cho nó
2 Có bao nhiêu dữ liệu có sẵn
3 Liệu các dự báo có thể ảnh hưởng đến điều chúng ta đang cố gắng dự báo hay không
Ví dụ, dự báo nhu cầu điện có thể rất chính xác vì cả ba điều kiện thường được thỏa mãn Ta có một ý tưởng tốt về các yếu tố góp phần: nhu cầu điện được điều khiển chủ yếu bởi nhiệt độ, với các tác động nhỏ hơn đối với sự thay đổi lịch như ngày lễ và điều kiện kinh tế Với điều kiện có đủ lịch sử dữ liệu về nhu cầu điện và điều kiện thời tiết, và Ta có kỹ năng để phát triển một mô hình tốt liên kết nhu cầu điện và các biến
số chính, các dự báo có thể chính xác đáng kể
Trang 22Thông thường trong dự báo, một bước quan trọng là biết khi nào có thể dự báo chính xác và khi nào dự báo sẽ không tốt hơn việc tung đồng xu Dự báo tốt nắm bắt các mô hình và mối quan hệ thực sự tồn tại trong dữ liệu lịch sử, nhưng không sao chép các sự kiện trong quá khứ sẽ không xảy ra nữa
Nhiều người sai lầm cho rằng dự báo là không thể trong một môi trường thay đổi Mọi môi trường đều thay đổi, và một mô hình dự báo tốt sẽ nắm bắt cách mà mọi thứ đang thay đổi Dự báo hiếm khi cho rằng môi trường là không thay đổi Điều thường được giả định là cách mà môi trường đang thay đổi sẽ tiếp tục trong tương lai
Đó là, một môi trường rất biến động sẽ tiếp tục biến động cao; một doanh nghiệp có doanh số biến động sẽ tiếp tục có doanh số biến động; và một nền kinh tế đã trải qua
sự bùng nổ và bán thân sẽ tiếp tục trải qua sự bùng nổ và bán thân Một mô hình dự báo nhằm mục đích nắm bắt cách mọi thứ di chuyển, không chỉ là nơi mọi thứ đang diễn ra Như Abraham Lincoln đã nói: “Trước tiên, nếu chúng ta có thể biết mình đang
ở đâu và chúng ta đang có xu hướng, chúng ta có thể đánh giá tốt hơn những việc cần làm và cách thực hiện điều đó”
1.4.2 Xác định các thông số để dự báo
Trong giai đoạn đầu của một dự án dự báo, các quyết định cần phải được đưa ra
về những gì cần được dự báo Ví dụ: nếu dự báo là bắt buộc đối với các mặt hàng trong môi trường sản xuất, cần phải hỏi liệu dự báo có cần thiết cho:
1.Mỗi dòng sản phẩm, hoặc cho các nhóm sản phẩm?
2 Mỗi cửa hàng bán hàng, hoặc cho các cửa hàng được nhóm theo khu vực, hoặc chỉ cho tổng doanh số?
3 Dữ liệu hàng tuần, dữ liệu hàng tháng hay dữ liệu hàng năm?
Điều cần thiết để xem xét phạm vi dự báo Dự báo sẽ được yêu cầu trước một tháng, trong 6 tháng, hoặc trong mười năm? Các loại mô hình khác nhau sẽ là cần thiết, tùy thuộc vào phạm vi dự báo nào là quan trọng nhất
Tần số dự báo như thế nào thường được đòi hỏi? Dự báo cần được sản xuất thường xuyên được thực hiện tốt hơn bằng cách sử dụng một hệ thống tự động so với các phương pháp đòi hỏi công việc thủ công cẩn thận
Trang 23Thật đáng để dành thời gian nói chuyện với những người sẽ sử dụng các dự báo
để đảm bảo rằng bạn hiểu nhu cầu của họ và cách sử dụng các dự báo đó, trước khi bắt tay vào làm việc rộng rãi trong việc đưa ra các dự báo
1.5 Giới thiệu về phần mềm R
1.5.1 Phần mềm R
R là một công cụ rất mạnh cho học máy, thống kê và phân tích dữ liệu Nó là một ngôn ngữ lập trình Ngôn ngữ R là một platform – independent do đó chúng ta có thể sử dụng nó cho bất kỳ hệ điều hành nào Việc cài đặt R cũng miễn phì vì thế chúng
ta có thể sử dụng mà không cần phải mua bản quyền
Ngôn ngữ R là mã nguồn mở nên ai trong chúng ta cũng có thể phân tích source code để hiểu được chính xác cách R vận hành Bất kỳ ai cũng có thể thêm tính năng và fix bug mà không cần chờ nhà phát hành ra bản vá Đồng thời, R có thể tích hợp được với ngôn ngữ khác (C,C++) Nó cũng cho phép chúng ta tương tác với nhiều nguồn dữ liệu và các gói thống kê (SAS, SPSS) R có một cộng đồng phát triển mạnh mẽ Giờ đây chúng ta sẽ cùng tìm hiểu về R, để cảm nhận được “How powerfull is R” và lý do bạn cần học ngôn ngữ này
1.5.2 Điểm mạnh của ngôn ngữ R
a R mạnh mẽ cho việc phân tích dữ liệu
Bạn có thể chạy code mà không cần đến bất cứ compiler nào – R là ngôn ngữ thông dịch ( interpreted language ) Do đó code có thể chạy mà không cần biên dịch R thông dịch code và làm cho việc viết code đơn giản hơn, dễ phát triển hơn
Bất một phép tính nào cũng có thể thực hiện trên vectors – R là một vector – language, do đó chúng ta có thể dùng bất kỳ function nào trên một vector mà không
cần phải dùng vòng lặp Ví dụ: bạn có một mảng và phải tăng mỗi phần tử lên +1 Nếu
không sử dụng vector, bạn sẽ cần lặp qua tất cả phần tử và cần n phép +1 cho n phần
tử Nếu bạn lưu mảng đó vào vector thì chỉ cần 1 phép +1 là xong
Đây là Statistical – Language – R được dùng trong sinh học, di truyền học và thống kê dữ liệu R là ngôn ngữ turing – complete có nghĩa nó có thể hoàn thành bất
kỳ thuật toán nào
Trang 24Lý do quan trọng nhất – R là một open – source, nên nó cực kỳ “kinh tế” Đồng thời R rất phù hợp cho việc mô phỏng dữ liệu qua bảng biểu Nhờ một cộng đồng phát triển và hơn 15000+ packages trong mọi lĩnh vực nghiên cứu Hiện tại, khó có một công cụ nào có thể theo kịp R
Trong việc nghiên cứu dữ liệu, việc khan hiếm nhân tài là một vấn đề rất lớn Các công ty có thể dùng ngôn ngữ R để làm nền tảng và training nhân viên sử dụng
nó
1.5.3 Khía cạnh thống kê của R
Có rất nhiều điều mà dân thống kê sẽ quan tâm tới ngôn ngữ R:
Nó là một open – source và hiển nhiên miễn phí hoàn toàn
R có một kho package phong phú và rất mạnh mẽ, cùng một cộng đồng người dùng vô cùng lớn mạnh
1.5.4 Ưu và nhược điểm của R
a Ưu điểm
R có những package thống kê toàn diện nhất với công nghệ mới nhất, những ý tưởng mới thường xuất hiện đầu tiên trên R
R là open – source nên bất kỳ ai cũng có thể sử dụng và cải tiến nó
Vì là open – source nên R có thế được dùng mọi lúc mọi nơi cho bất cứ việc gì,
kể cả bán các sản phẩm từ R theo điều kiện của giấy phép
R có thể chạy trên bất kỳ hệ điều hành nào
Bất kỳ ai cũng được hỗ trợ để đưa ra ý tưởng phát triển, fix bug, phát triển package mới
b Nhược điểm
Một vài package của R có thể không hoàn hảo và còn lỗi
Không có ai để “complain” cho việc code không chạy
R có thể chiếm dụng hết “available memory”
Trang 25CHƯƠNG 2: DỰ BÁO PHỤ TẢI BẰNG PHƯƠNG
PHÁP SAN BẰNG HÀM MŨ
2.1 Cơ sở lý thuyết
2.1.1 Phân loại các phương pháp san bằng hàm mũ
Phương pháp san bằng hàm mũ không có giới hạn và chúng ta có thể trình bày
nó với rất nhiều phương pháp Bằng cách xách định hệ số chứa đựng của nó cấu thành theo trend (xu hướng) hay seasonal (mùa vụ), trình bày bởi chín phương pháp san bằng hàm mũ Mỗi phương pháp được cấu thành bởi cặp chữ cái, được định nghĩa theo từng loại của các thành phần “trend” và “seasonal” Điển hình như (A, M) là phương pháp giữa additive trend (xu hướng mô hình cộng) và multiplicative seasonality (mùa vụ mô hình nhân); (Ad, N) là phương pháp giữa damped trend (xu hướng giảm) và no seasonality (không có mùa vụ),…
Bảng 2.1: Phân loại hai chiều của phương pháp san bằng hàm mũ
Ad (Additive damped) (Ad, N) (Ad, A) (Ad, M)
Bảng 2.2: Các phương pháp san bằng hàm mũ được dùng chủ yếu
(N, N) Simple exponential smoothing
(A, N) Holt’s linear method
(Ad, N) Additive damped trend method
(A, A) Additive Holt-Winters’ method
(A, M) Multiplicative Holt-Winters’ method
(Ad, M) Holt-Winters’ damped method
Kiểu phân loại này lần đầu tiên được đề xuất bởi Pegels (1969), người cũng bao hàm phương pháp multiplicative trend Sau đó, nó đã được mở rộng bởi Gardner
Trang 26(1985) để bao gồm các phương pháp với additive damped trend và bởi Taylor (2003) bao gồm các phương pháp với multiplicative trend method Chúng ta không xem xét các phương pháp xu hướng mô hình nhân vì chúng có xu hướng tạo ra các dự báo kém
Bảng 2.2 đưa ra các công thức đệ quy để áp dụng chín phương pháp san bằng hàm mũ trong bảng 2.1 Mỗi ô bao gồm các phương trình dự báo để tạo h dự báo bước trước và các phương trình làm mịn để áp dụng phương pháp
Bảng 2.3: Công thức tính toán đệ quy và dự báo điểm
2.1.2 Phương pháp san bằng hàm mũ đơn giản (N, N)
Giới thiệu về dữ liệu sử dụng:
Sử dụng dữ liệu về số lượng hành khách hàng không của Australia, theo năm từ
năm 1970 đến năm 2016, được lấy từ cơ sở dữ liệu thư viện fpp2 của R qua dòng lệnh:
data <- window (ausair)
Bảng 2.4: Cơ dở dữ liệu dùng để dự báo
Trang 27α: Hệ số san bằng số mũ để ước lượng cấp độ (0 < α < 1)
ℓ𝑡: Giá trị ước lượng theo cấp độ
𝑦𝑡: Giá trị hiện tại thời điểm t
𝑦̂𝑡+ℎ|𝑡: Giá trị dự báo cho h giai đoạn tiếp theo h: Số lượng giai đoạn dự báo trong tương lai Phương pháp này phù hợp để dự báo dữ liệu không có xu hướng rõ ràng hoặc
mô hình theo mùa
b Xác định các hệ số tối ưu α
Ta sẽ ước tính các hệ số của mô hình hồi quy bằng cách giảm thiểu tổng bình phương sai số (SSE hay “Sum of Squared Errors”) Tương tự, các tham số chưa biết và các giá trị ban đầu cho bất kỳ phương pháp săn bằng hàm mũ nào có thể được ước tính bằng cách giảm thiểu SSE Sai số được chỉ định là 𝑒𝑡 = 𝑦𝑡 − 𝑦̂𝑡|𝑡−1cho t = 1,…,T Sau
đó chúng ta tìm các thông số chưa biết và giá trị ban đầu với SSE nhỏ nhất:
Sử dụng dữ liệu Australian air passenger
data <- window (ausair)
Trang 28Testing: 6 số liệu cuối của data
Training: các dữ liệu còn lại của data
- Hệ số α tối ưu được xác định bằng công thức lý thuyết:
Sử dụng R tìm các hệ số α tương ứng với SSE có giá trị nhỏ nhất:
y_hat = l = SSE = array()
y = head (data, length (data) - n)
test = tail (data, n)
Trang 29Ta thu về được giá trị:
Sử dụng hệ số α tối ưu dự báo bằng công thức (dùng Excel)
Bảng 2.5: Xác định dự báo bằng công thức lý thuyết
Trang 30library (fpp2)
data <- window (ausair)
n = 6
train= head(data, length (data) - n)
test= tail(data, n)
model<- ses (train, initial =“simple”)
summary(model)
autoplot(train,series ="Train") +
autolayer ( fitted (model), series ="Model") +
xlab("Year") + ylab(" Visitors")
aust<- forecast(model, h = 6)
accuracy(test, aust$mean )
autoplot(test, series ="Test") +
autolayer(aust$mean, series ="Forecast") +
xlab("Year") + ylab("Visitors")
Kết quả:
Tham số hàm dự báo :
Đánh giá hàm dự báo trong quá trình huấn luyện (So sánh giá trị giữa train và giá trị tạo ra của hàm dự báo) bằng các tham số dưới đây và đồ thị:
Trang 31Hình 2.1: Biểu đồ của phương pháp (N, N) với số liệu Training
Giá trị dự báo:
Đánh giá kết quả dự báo:
Trang 32Hình 2.2: Biểu đồ kết quả dự báo giữa phương pháp (N, N) với số liệu Testing
d Kết luận
Bảng 2.6: So sánh hệ số α tối ưu bằng công thức lý thuyết với phần mềm R
Từ bảng so sánh cho thấy kết quả các hệ số tối ưu giữa công thức với phần mềm
R là hoàn toàn giống nhau
Trang 33Bảng 2.7: So sánh kết quả dự báo giữa Excel với phần mềm R
Giới thiệu về dữ liệu sử dụng:
Sử dụng dữ liệu từ bảng 2.4 dể làm cơ sở dự báo
a Phương trình dự báo
𝑦̂(𝑡 + ℎ|𝑡) = ℓ𝑡+ ℎ𝑏𝑡
ℓ𝑡 = 𝛼𝑦𝑡 + (1 − 𝛼)(ℓ𝑡−1+ 𝑏𝑡−1)
𝑏𝑡 = 𝛽∗(ℓ𝑡− ℓ𝑡−1) + (1 − 𝛽∗)𝑏𝑡−1α: Hệ số san bằng số mũ để ước lượng cấp độ (0 < α < 1)
β *: Hệ số sang bằng số mũ để ước lượng xu thế (0 < β* < 1)
ℓ𝑡: Giá trị ước lượng theo cấp độ
𝑏𝑡: Giá trị ước lượng theo xu thế
𝑦𝑡: Giá trị hiện tại thời điểm t
𝑦̂𝑡+ℎ|𝑡: Giá trị dự báo cho h giai đoạn tiếp theo h: Số lượng giai đoạn dự báo trong tương lai Phương pháp này đã mở rộng san bằng hàm mũ đơn giản để cho phép dự báo
dữ liệu với xu hướng
b Xác định các hệ số tối ưu α, β *
Ta sẽ ước tính các hệ số của mô hình hồi quy bằng cách giảm thiểu tổng bình phương sai số (SSE hay “Sum of Squared Errors”) Tương tự, các tham số chưa biết và các giá trị ban đầu cho bất kỳ phương pháp san bằng hàm mũ nào có thể được ước tính bằng cách giảm thiểu SSE Sai số được chỉ định là 𝑒𝑡 = 𝑦𝑡 − 𝑦̂𝑡|𝑡−1cho t = 1,…,T Sau
đó chúng ta tìm các thông số chưa biết và giá trị ban đầu với SSE nhỏ nhất:
Trang 34Sử dụng dữ liệu Australian air passenger
data <- window (ausair)
Tách dữ liệu thành số liệu huấn luyện (training) và số liệu kiểm tra (testing) Testing: 6 số liệu cuối của data
Training: các dữ liệu còn lại của data
- Hệ số α tối ưu được xác định bằng công thức lý thuyết:
Sử dụng R tìm các hệ số α tương ứng với SSE có giá trị nhỏ nhất:
Code:
library(fpp2)
data <- window(ausair)
y = head (data, length (data) - n)
test = tail (data, n)
Trang 35Ta thu về được giá trị:
Sử dụng hệ số α tối ưu dự báo bằng công thức (dùng Excel)
Trang 36Bảng 2.8: Xác định dự báo bằng công thức lý thuyết
train= head(data, length (data) - n)
test= tail(data, n)
model<- holt (train, initial =“simple”)
summary(model)
autoplot(train,series ="Train") +
autolayer ( fitted (model), series ="Model") +
xlab("Year") + ylab(" Visitors")
aust<- forecast(model, h = 6)
Trang 37autoplot(test, series ="Test") +
autolayer(aust$mean, series ="Forecast") +
xlab("Year") + ylab("Visitors")
Trang 38Giá trị dự báo:
Đánh giá kết quả dự báo:
Hình 2.4: Biểu đồ kết quả dự báo của phương pháp (A, N) với số liệu Testing
d Kết luận
Bảng 2.9: So sánh hệ số α tối ưu bằng công thức lý thuyết với phần mềm R
Trang 39Từ bảng so sánh cho thấy kết quả các hệ số tối ưu giữa công thức với phần mềm
R là hoàn toàn tương đồng với nhau
Bảng 2.10: So sánh kết quả dự báo giữa Excel với phần mềm R
α: Hệ số san bằng số mũ để ước lượng cấp độ (0 < α < 1)
β *: Hệ số sang bằng số mũ để ước lượng xu thế (0 < β* < 1) 𝜙: Hệ số suy giảm (0 < 𝜙 < 1)
ℓ𝑡: Giá trị ước lượng theo cấp độ
𝑏𝑡: Giá trị ước lượng theo xu thế
𝑦𝑡: Giá trị hiện tại thời điểm t
𝑦̂𝑡+ℎ|𝑡: Giá trị dự báo cho h giai đoạn tiếp theo h: Số lượng giai đoạn dự báo trong tương lai
b Xác định các hệ số tối ưu α, β *
Ta sẽ ước tính các hệ số của mô hình hồi quy bằng cách giảm thiểu tổng bình phương phần dư (SSE hay “Sum of Squared Errors”) Tương tự, các tham số chưa biết
Trang 40tính bằng cách giảm thiểu SSE Sai số được chỉ định là 𝑒𝑡 = 𝑦𝑡− 𝑦̂𝑡|𝑡−1cho t = 1,…,T Sau đó chúng ta tìm các thông số chưa biết và giá trị ban đầu với SSE nhỏ nhất:
Sử dụng dữ liệu Australian air passenger
data <- window (ausair)
Tách dữ liệu thành số liệu huấn luyện (training) và số liệu kiểm tra (testing) Testing: 6 số liệu cuối của data
Training: các dữ liệu còn lại của data
- Hệ số α tối ưu được xác định bằng công thức lý thuyết:
Sử dụng R tìm các hệ số α tương ứng với SSE có giá trị nhỏ nhất:
Code:
library(fpp2)
data <- window(ausair)
y = head (data, length (data) - n)
test = tail (data, n)
n = 6
q = 1
y_hat = l = b = SSE = array()
al =be = phi = seq(0.0001,1,0.0001)