Với tính chất biến đổi phức tạp của phụ tải, các phương pháp dự báo theo mạng neural, dự báo theo fuzzy logic, và gần đây là các nghiên cứu dự báo phụ tải theo phương pháp Support vector
Trang 1-
TRẦN THỊ THANH LOAN
DỰ BÁO PHỤ TẢI THEO BAYES
Chuyên ngành: THIẾT BỊ, MẠNG VÀ NHÀ MÁY ĐIỆN
Mã số ngành: 2.06.07
LUẬN VĂN THẠC SĨ
TP HỒ CHÍ MINH, tháng 09 năm 2005
Trang 2CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
Trang 3Lời cảm ơn
Xin chân thành cảm ơn Quý Thầy Cô trường Đại Học Bách Khoa Thành Phố
Hồ Chí Minh, đặc biệt là Cô TS Phan Thị Thanh Bình, người đã tận tình
dìu dắt, hướng dẫn tôi thực hiện luận án cao học này
Cám ơn Gia đình, tất cả bạn bè thân thuộc, các anh chị đồng nghiệp luôn bên cạnh, hỗ trợ, tạo điều kiện và dộng viên giúp đỡ tôi rất nhiều từ khi tham gia khoá học cho đến khi hoàn thành luận án này
TP Hồ Chí Minh, ngày 29/09/2005
Trần Thị Thanh Loan
Trang 4NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ và tên học viên: TRẦN THỊ THANH LOAN Phái: Nữ
Ngày sinh: 26 – 01 – 1979 Nơi sinh : Tp HỒ CHÍ MINH Chuyên ngành: THIẾT BỊ, MẠNG VÀ HỆ THỐNG ĐIỆN
I TÊN ĐỀ TÀI: DỰ BÁO PHỤ TẢI THEO BAYES
II NHIỆM VỤ VÀ NỘI DUNG:
- Giới thiệu tổng quan về lý thuyết Bayes
- Giới thiệu về mô hình dự báo theo phương pháp Chuyên gia
- Phân tích và xử lý dữ liệu theo mô hình Hidden Markov
- Xây dựng mô hình dự báo theo Bayes kết hợp các mô hình dự báo thành phần
III NGÀY GIAO NHIỆM VỤ:
IV NGÀY HOÀN THÀNH NHIỆM VỤ:
V HỌ VÀ TÊN CB HƯỚNG DẪN: TS PHAN THỊ THANH BÌNH
Trang 5Dự báo phụ tải là một mắc xích quan trọng trong vận hành hệ thống năng lượng Dự báo phụ tải giúp Nhà cung cấp điện lượng đưa ra những quyết định quan trọng trong quá trình điều hành bộ máy sản xuất Ví dụ với thông tin về phụ tải tiêu thụ dự báo được trong thời đoạn kế tiếp, Nhà sản xuất sẽ quyết định sẽ là Nhà trung gian mua bán điện hay đầu tư sản xuất điện trực tiếp; Nhà sản xuất có thể lên kế hoạch cắt giảm phụ tải để cân đối giữa cung và cầu, tránh các tình huống quá tải nghiêm trọng dẫn đến tình trạng rã lưới; hoặc có các biện pháp thu hút khách hàng
sử dụng điện như phát triển cơ sở hạ tầng cho ngành điện, xây dựng các đường dây phân phối, xây dựng các trạm phân phối và đầu tư nguồn điện … Do đó kết quả dự báo chính xác luôn luôn là điều mong muốn của người quản lý, vận hành hệ thống
Đề tài xin giới thiệu các ứng dụng của lý thuyết Bayes vào dự báo phụ tải với mục đích kết hợp các mô hình dự báo phụ tải, các nhận định của các Chuyên gia để đưa ra kết quả dự báo chính xác hơn Mô hình dự báo sẽ ứng dụng lý thuyết Bayes trên các dữ liệu được xử lý theo phương pháp Hidden Markov để tính toán và đưa ra kết quả dự báo
Chương trình dự báo phụ tải trong Luận án được viết bằng phần mềm Matlab 6.5
ABSTRACT
Load forecasting is essential to the power system operation Accurate load forecasting helps power utility company makes important decisions in power system management and operation Based on the load forecasting information, the utility company comes to decision to buy power from another utility company or invest in producing electricity power According to short time load forecasting, the utility company will plan to cut down load to balance supply and demand, to avoid the extreme overload that causes power system collapse The utility company must have the accurate long time load forecasting to develop the electrical infrastructure such as building transmission lines, transmission and distribution transformers, power sources … With these reasons, the accuracy load forecasting is one of the most important factors in managing and operating power system
This thesis presents an application of Bayes theory in load forecasting in combination different load forecasting modules or individual expert inferences in order to compute an acuracy result The proposed method uses Bayes theory with data processed by Hidden Markov model
The proposed load forecasting method in this thesis is written in Matlab 6.5 software
Trang 6MỤC LỤC
GIỚI THIỆU ĐỀ TÀI 1 CHƯƠNG 1: LÝ THUYẾT BAYES VÀ MỘT SỐ ỨNG DỤNG THEO BAYES 1-1 1.1 Công thức Bayes cơ bản 1-2 1.2 Suy Luận Theo Bayes 1-3 1.2.1 Chuỗi dữ liệu theo suy luận Bayes 1-4 1.2.2 Vector dự báo kỳ vọng – Forecasting vector of interest 1-4 1.2.3 Phân phối tiên nghiệm 1-5 1.2.4 Phân phối tiên nghiệm dự báo – Prior Predictive 1-5 1.2.5 Kết hợp mô hình 1-5 1.3 Bayes chọn lựa mô hình theo phân phối hậu nghiệm 1-6 1.3.1 Dự báo với hàm Logarith Sai Số - Logarithmic Loss 1-7 1.3.2 Đặc điểm của chọn lựa mô hình dự báo theo Bayes 1-7 1.4 Bayes kết hợp các mô hình dự báo 1-8 1.5 Kết luận 1-8 CHƯƠNG 2: GIỚI THIỆU VỀ MÔ HÌNH CHUYÊN GIA 2-1 2.1 Ý kiến Chuyên gia 2-2 2.2 Lịch sử phát triển của mô hình ý kiến Chuyên gia 2-3 2.3 Sử dụng ý kiến Chuyên gia làm dữ liệu 2-4 2.4 Một số phương pháp kết hợp suy luận của Chuyên gia 2-5 2.4.1 Phương pháp Bayes 2-5 2.4.2 Phương pháp tỷ lệ vật lý (Physical scaling model) 2-6 2.4.3 Phương pháp cổ điển 2-7 2.5 Kết luận 2-8 CHƯƠNG 3: MÔ HÌNH MARKOV VỚI CHUỖI THỜI GIAN 3-1 3.1 Mô hình Markov 3-2 3.2 Dây chuyền Markov với chuỗi dữ liệu theo thời gian 3-3 3.3 Mô hình Hidden Markov 3-5 3.4 Dạng tổng quát của mô hình HMM 3-9
Trang 73.5 Các bài toán cơ bản của mô hình HMM 3-10 3.5.1 Xác định mô hình HMM thích hợp nhất 3-10 3.5.2 Tìm chuỗi chuyển tiếp ‘state’ phản ánh tốt nhất dữ liệu quan sát – Bài toán tìm S 3-14 3.5.3 Huấn luyện mô hình 3-17 3.6 Kết luận 3-21 CHƯƠNG 4: DỰ BÁO THEO BAYES VỚI XỬ LÝ DỮ LIỆU THEO MÔ HÌNH HMM 4-1 4.1 Mô hình dự báo sử dụng phương pháp chọn lựa mô hình Bayes - BCM 4-2 4.1.1 Tìm chuyển tiếp ‘state’ theo các dữ liệu quan sát trong quá khứ 4-3 4.1.2 Chọn lựa mô hình dự báo theo Bayes 4-3 4.2 Mô hình dự báo theo Bayes theo phương pháp kết hợp các mô hình dự báo thành phần - BMM 4-5 4.3 Xây dựng mô hình HMM-Hidden Markov Model - với các mô hình dự báo thành phần 4-6 4.3.1 Thiết lập mô hình HMM 4-6 4.3.2 Huấn luyện mô hình HMM 4-7 4.4 Đánh giá mô hình dự báo theo sai số 4-10 4.5 Kết luận 4-11 CHƯƠNG 5: ÁP DỤNG MÔ HÌNH DỰ BÁO 5-1 5.1 Ví dụ 1 5-2 5.1.1 Dữ liệu quan sát 5-2 5.1.2 Các mô hình dự báo thành phần sử dụng trong mô hình dự báo 5-2 5.2 Ví dụ 2 5-9 5.3 Nhận xét kết quả dự báo 5-10 CHƯƠNG 6: KẾT LUẬN VÀ ĐỀ XUẤT HƯỚNG PHÁT TRIỂN 6-1 PHỤ LỤC 1 PL1-1 PHỤ LỤC 2 PL2-1 TÀI LIỆU THAM KHẢO TLTK-1
Trang 8GIỚI THIỆU ĐỀ TÀI
Trong lĩnh vực dự báo phụ tải, rất nhiều phương pháp dự báo được đề xuất từ các phương pháp dự báo cổ điển, sử dụng các hàm hồi quy để mô hình hóa chuỗi thời gian đến các phương pháp dự báo phức tạp sử dụng các thuật toán thông minh như neuron, fuzzy … Với tính chất biến đổi phức tạp của phụ tải, các phương pháp dự báo theo mạng neural, dự báo theo fuzzy logic, và gần đây là các nghiên cứu dự báo phụ tải theo phương pháp Support vector machine - sử dụng hàm kernel để mapping các dữ liệu vào những vùng phân định trước và từ đó tính giá trị dự báo - thường được đề xuất Ngoài ra, phương pháp dự báo theo Chuyên gia cũng được sử dụng căn cứ trên những hiểu biết, kinh nghiệm và kiến thức của các Chuyên gia Mỗi phương pháp
dự báo dự báo đều cho kết quả tích cực ứng với từng trường hợp cụ thể Tuy nhiên, cho đến nay vẫn chưa có phương pháp hay giải thuật dự báo phụ tải nào hữu hiệu với mọi tình huống Vì vậy, chúng ta quan tâm đến việc kết hợp các phương pháp dự báo phụ tải khác nhau với mong muốn đưa ra kết quả dự báo chính xác hơn, phù hợp với những biến động của phụ tải
Một trong các phương pháp để khắc phục những hạn chế của các mô hình dự báo riêng lẽ trên là sử dụng phương pháp kết hợp các mô hình dự báo, hay còn gọi là kết hợp các Chuyên gia ME – Mixture of Experts [23], [28], [34], [37] Theo [34], có 3 hướng giải thuật chính để giải quyết bài toán ME trên
là chọn lựa từng mô hình riêng lẽ GE - Gated Experts; kết hợp các mô hình
dự báo theo mô hình Hidden Markov HME - Hidden Markov Experts và phương pháp kết hợp các mô hình dự báo theo các dữ liệu liên quan IOHMM – Input/Output Hidden Markov Model Trong phương pháp GE mỗi mô hình
dự báo riêng lẽ hay Chuyên gia được mô hình hóa vào một không gian con riêng biệt, mô hình hay Chuyên gia được chọn để dự báo là mô hình phù hợp nhất với chuỗi dữ liệu quan sát Thuật toán chọn lựa mô hình dự báo được gọi là ‘gating’ Mô hình HME giới thiệu một phương pháp kết hợp các mô hình hoặc các Chuyên gia dựa trên những giá trị tính toán từ phương pháp HMM - Hidden Markov Model Giá trị dự báo sẽ là giá trị kết hợp các mô
hình theo xác suất tiên nghiệm P(Mi) (Mi là mô hình dự báo hay chuyên gia) phụ thuộc vào các trạng thái tính được theo phương pháp HMM Mô hình IOHMM kết hợp các mô hình theo kết quả tính toán từ phương pháp HMM với các thông số của mô hình HMM biến đổi theo thời gian và những tình huống bên ngoài, ví dụ như đối với dự báo phụ tải có thể bổ sung các tình huống như thời tiết, chu kỳ … cùng với các mô hình dự báo thành phần
Trang 9Luận án này đề xuất phương pháp dự báo ứng dụng theo lý thuyết Bayes và phương pháp HME kết hợp các mô hình dự báo thành phần hay các Chuyên gia Mỗi mô hình dự báo thành phần hay Chuyên gia được xem như là một
‘state’ trong mô hình HMM Mô hình HMM sẽ tính toán các giá trị xác suất chuyển tiếp giữa các ‘state’ theo dữ liệu quan sát Giá trị dự báo là giá trị dự báo của mô hình con được chọn theo thuật toán phân lớp theo Bayes – Bayes classification – phương pháp BCM hoặc sẽ là giá trị kết hợp các phương pháp
dự báo thành phần hay chuyên gia theo xác suất tiên nghiệm P(Mi) được tính theo công thức Bayes – phương pháp BMM
Bố cục của luận án bao gồm 6 chương Chương 1 trình bày sơ lược về lý thuyết Bayes và một số đại lượng xác suất ứng dụng trong suy luận theo Bayes Chương 2 sẽ giới thiệu về phương pháp Chuyên gia và một số phương pháp kết hợp các Chuyên gia trong dự báo Trong chương 3 chúng ta tìm hiểu về mô hình Markov và Hidden Markov trong phân tích chuỗi thời gian Việc xây dựng mô hình dự báo theo lý thuyết Bayes và mô hình HMM được trình bày trong chương 4 Trong chương 5, chúng ta áp dụng mô hình
dự báo được đề xuất trong dự báo ngắn hạn theo ngày trong tài liệu [44] và kết hợp các mô hình dự báo trong dự báo dài hạn tại thành phố Hồ Chí Minh [42], [43] Chương 6 sẽ rút ra những kết luận trong quá trình xây dựng mô hình dự báo và đề xuất hướng phát triển cho đề tài
Trang 10CHƯƠNG 1
LÝ THUYẾT BAYES VÀ MỘT SỐ ỨNG DỤNG THEO BAYES
Trang 11Trong lĩnh vực dự báo, lý thuyết Bayes được ứng dụng rất đa dạng như mô
hình dự báo tuyến tính động DLM – dynamic linear model - [6], [40] hay mô
hình tự hồi quy AR – autoregressive [39], hay mô hình dự báo kết hợp nhiều
phương pháp dự báo – Chuyên gia bằng phương pháp tính mật độ phân phối
dự báo theo Bayes hoặc ứng dụng lý thuyết Bayes để tính toán chọn lựa mô
hình dự báo thích hợp theo những tiêu chuẩn định trước [5], [11], [19],
[32]…
Trong phần này, chúng ta tìm hiểu công thức Bayes cơ bản và những đại
lượng xác suất thường được sử dụng trong quá trình suy luận, dự báo theo
Bayes Tiếp theo, chúng ta sẽ tham khảo một số phương pháp dự báo kết hợp
các mô hình theo Bayes
1.1 Công thức Bayes cơ bản:
Trong phần này chúng ta tìm hiểu các ý nghĩa các đại lượng cơ bản trong
công thức Bayes và công thức Bayes dạng đơn giản
Giả sử chúng ta có các dữ liệu thống kê ε trong không gian mẫu S các sự kiện
có thể xảy ra; (B1, B2, …, Br) là không gian từng phần của S Cho {p(A);
A⊆S} là phân phối xác suất của các sự kiện trong không gian S Cho các sự
kiện A và B với p(A) > 0; p(B|A) = p(A∩B) / p(A) là xác suất xuất hiện sự
kiện B với điều kiện đã xuất hiện sự kiện A Theo công thức Bayes:
p(Bi|A) =
) (
) ( ).
(
A p
B p B A
Trong một chiến dịch kiểm tra sản phẩm điện tử của một công ty, tỷ lệ sản
phẩm bị hư khi vừa xuất xưởng là θ = 0.01, trong số đó có 99% là do mối hàn
của các linh kiện điện tử không đạt chất lượng, được phân loại là sai sót Z
Như vậy người kiểm tra chất lượng sản phẩm trước khi xuất xưởng sẽ kết
luận sản phẩm bị hư hỏng là các sản phẩm có sai sót Z Chọn ngẫu nhiên một
số thiết bị điện tử A: có sai sót Z và B: thiết bị hư hỏng Như vậy chúng ta có
p(B) = θ = 0.01 và p(A|B) = 0.99
Theo lý thuyết Bayes với r = 2, B1 = B, B2 = BC chúng ta có :
Trang 12p (thiết bị hư hỏng | sai sót Z) = p(B|A) =
=
) ( ).
( ) ( ).
(
) ( ).
(
C
C p B B A p B p B A p
B p B A p
+
=
) ( 99 0 01 0 99 0
01 0 99 0
C B A p
× +
×
×
=
) ( 100 1
1
C B A p
+
Giá trị xác suất trên tùy thuộc vào p(A|BC), nếu p(A|BC) = 1/10 thì p(B|A) = 1/11, giá trị tương đối bé, không phù hợp với giả thiết dựa chỉ vào sai sót Z
để kết luận hư hỏng thiết bị Mặc khác:
p (thiết bị hư hỏng | không có sai sót Z) = p(B|AC) =
=
) ( ).
( ) ( ).
(
) ( ).
(
C C C C
C
B p B A p B p B A p
B p B A p
+
= 0 01 0 01 0 99 {1 ( ) }
01 0 01 0
C B A p
−
× +
×
×
=
) ( 9900 9901
1
C B A p
+
Do đó nếu như thiết bị không có sai sót Z, thì vẫn có khả năng bị hư hỏng do các lý do khác Như vậy nhờ vào công thức Bayes mà chúng ta có thể nhận thấy các khả năng không chắc chắn khi đưa ra các quyết định tưởng như hòan toàn chính xác Điều này giúp chúng ta thận trọng trong việc ra quyết định
và dự đoán trước các tình huống có thể xảy ra trong thực tế
1.2 Suy Luận Theo Bayes
Phương pháp Bayes trong suy luận và dự báo đều xuất phát từ 2 nguyên lý cơ bản:
• Mô hình kết hợp: sử dụng phân phối kết hợp các dữ liệu tương lai và dữ liệu đã có để dự báo
Trang 13• Điều kiện liên quan: sử dụng phân phối có điều kiện của đối tượng dự báo
dựa trên những dữ liệu đã biết và xác định hàm sai số - loss function
1.2.1 Biểu diễn chuỗi dữ liệu theo suy luận Bayes:
Cho chuỗi dữ liệu Yt = {ys}s=1t theo thời gian, có thể thể hiện giá trị dự báo
dưới dạng xác suất như sau:
Với θA là vector kA x 1 các dữ liệu chưa biết, θA ∈ ΘA ⊆ Rk Vector θA chứa
các biến liên quan đến cấu trúc của mô hình
Sử dụng ký hiệu p(⋅) thể hiện hàm mật độ xác suất đặc trưng pdf ( probability
density function) và P(⋅) là phân phối tích lũy cdf (cumulative distribution
function) Hàm mật độ phân phối xác suất của Yt đối với mô hình dự báo và
θA được xác định như sau:
Ví dụ với mô hình vector tự hồi quy VAR – vector autoregressive:
Mô hình VAR dự báo chuỗi thời gian được thể hiện dưới suy luận Bayes như
1.2.2 Vector dự báo kỳ vọng – forecasting vector of interest
Chúng ta định nghĩa vector dự báo kỳ vọng ω ∈Ω ⊆ Rqcó mật độ phân phối
đối với dữ liệu theo thời gian và thông số của mô hình như sau:
Trang 14Trong bài toán dự báo, chúng ta định nghĩa vector {yT+1, , yT+F } ∈ ω với
F > 0 và với trường hợp đặc biệt ω’ = (yT+1, , yT+F )’, do đó có thể biễu diễn :
p (ω | YT , θA) α p (ω | YT+F , θA) (1.5)
1.2.3 Phân phối tiên nghiệm
Phân phối tiên nghiệm là một đại lượng đặc trưng cho những hiểu biết về đối tượng dựa trên những thông tin đã biết, được định nghĩa như sau:
1.2.4 Phân phối tiên nghiệm dự báo – Prior Predictive distribution
Chúng ta định nghĩa phân phối tiên nghiệm dự báo như sau:
p (YT| A) = ∫ΘAp (θA| A) p (YT| θA) dθA (1.7) Mật độ tiên nghiệm dự báo của đối tượng tổng hợp các hiện tượng có thể xảy
ra của chuỗi dữ liệu tương ứng với mô hình dự báo Hàm mật độ tiên nghiệm
dự báo tổng hợp các tính chất của mô hình và được sử dụng trong suy luận Bayes vì đơn giản hơn so với việc suy luận trên những đại lượng xác suất thông thường
1.2.5 Kết hợp mô hình
Trong lĩnh vực dự báo và ra quyết định, có trường hợp không sử dụng chỉ một mô hình A mà sử dụng tổ hợp các mô hình A1, A2, … AJ Mỗi mô hình bao gồm một mật độ phân phối có điều kiện của đối tượng dự báo, vector kỳ vọng ω, mật độ tiên nghiệm Với một số lượng xác định các mô hình, phát triển các đại lượng xác suất cho các mô hình Quá trình phát triển này bao gồm kết hợp các xác suất tiên nghiệm của từng mô hình p(Ai) vào mô hình, xây dựng hệ thống suy luận và định vị các bài toán quyết định có điều kiện
Trang 15{ p(Aj) , p(θA j |Aj), p(YT|θA j,Aj ), p (ω |YT, θA j, Aj )} (j = 1, , J) (1.8) Như vậy có thể thể hiện những đại lượng xác suất cho mô hình tổng quát như
Biểu thức (1.10) là xác suất hậu nghiệm của mô hình Aj Trong biểu thức
(1.11) thành phần thứ hai là giá trị xác suất tiên nghiệm của Aj , giá trị đầu
tiên là là likelihood:
p (YoT|Aj) = ∫ΘAj p(YoT|θAj,Aj) p(θAj|Aj)dθAj (1.12) Chúng ta tính tỷ số của phân phối hậu nghiệm của mô hình Ai với mô hình
Ak:
) (
) (
) (
) ( ) (
) (
k
o T i
o T k
i o
T k
o T i
A Y p
A Y p A p
A p Y A P
Y A p
Tỷ số trên là tỷ số hậu nghiệm của mô hình Aj với mô hình Ak Giá trị này tỷ
lệ với tỷ số tiên nghiệm p(Ai)/p(Ak) và tỷ số của hàm likelihood p(YoT/Ai)/
p(YoT/Ak) còn được gọi là hệ số Bayes Hệ số Bayes là độc lập với nhau đối
với các mô hình Aj trong mô hình tổng quát J mô hình thành phần {A1, …,
AJ}
1.3 Bayes Chọn Lựa Mô Hình Theo Phân Phối Hậu Nghiệm:
Để chọn một mô hình thích hợp nhất trong r mô hình, với các giá trị xác suất
p1(y), p2(y), …, pr(y) thể hiện mức độ xuất hiện của các dữ liệu quan sát y =
(y1, y2, …, yn)T đối với từng mô hình Trước khi sử dụng dữ liệu quan sát,
chúng ta có các giá trị xác suất φ1, …, φr, tổng cộng bằng 1 Giá trị xác suất
φj thể hiện xác suất mô hình thứ j là mô hình được chọn lựa Nếu không có
các thông tin để phân biệt giữa các mô hình, giá trị xác suất chọn lựa mô hình
Trang 16là φj = r , với ý nghĩa cơ hội chọn lựa các mô hình là như nhau Giá trị φj có
thể được xem như là phân phối xác suất hậu nghiệm – posterior probability
Giá trị xác suất hậu nghiệm của mô hình thứ j được tính như sau:
φ*
j =
) (
) (
1
y p
y p g g r g
j j
Giá trị xác suất tiên nghiệm của từng mô hình thể hiện mức độ tin tưởng vào
mô hình đó của người nghiên cứu, đây cũng là giá trị xác suất chủ quan, phụ
thuộc vào người nghiên cứu Tuy nhiên khó đánh giá mức độ chính xác của
các giá trị này vì các hiểu biết về các mô hình có thể không chính xác
1.3.1 Dự Báo Với Hàm Logarith Sai Số - Logarithmic Loss:
Cho chuỗi dữ liệu y1, y2, … với yi ∈ Y Mục tiêu là tìm giá trị dự báo yi với
chuỗi dữ liệu đã biết y1, y2, …, yi-1, sử dụng giá trị xác suất dự báo pi
Chất lượng của phương pháp dự báo được thể hiện bằng hàm log Loss:
Loss (y1, …, yn, S) := ∑
=
n
i 1
Loss (yi, S(y1, …, yi-1)) (1.16)
Nếu chúng ta có Y1, Y2, …, Yn ~ P và giá trị dự báo Yi sẽ là xác suất có điều
i
y P
y P y
P
y P
) ( log )
(
) (
1.3.2 Đặc điểm của chọn lựa mô hình dự báo theo Bayes:
- Tính toán dựa trên các công thức xác suất có điều kiện
- Là mô hình hồi quy
Trang 17- Cho kết quả hội tụ vào mô hình có sai lệch ít nhất
1.4 Bayes Kết Hợp Các Mô Hình Dự Báo
Với mô hình dự báo M = {Pθ|θ∈Θ} và chuỗi dữ liệu n thành phần yn = y1, y2,
…, yn, mô hình dự báo tối ưu nhất trong M là mô hình thỏa mãn hàm
likelihood cực đại ⎯θ(yn) Đây là mô hình kết hợp các mô hình dự báo với
mục tiêu cực đại hàm likelihood
Theo công thức Bayes:
• Tìm các giá trị tiên nghiệm W cho M
• Tính các phân phối Bayes cận biên:
PBayes(y1, …, yn) := ∫θ∈ΘPθ(y1, …, yn)w(θ)dθ (1.19)
• Dự báo phân phối dự báo Bayes:
PBayes(yi+1|y1, …, yi) = ( )
) , , (
, ,
1
1 1
i Bayes
i Bayes
y y P
y y
θθ
θ
θ
d w y P
w y P i
i
) ( ) (
) ( ).
(
là phân phối hậu nghiệm Bayes
1.5 Kết luận
Lý thuyết Bayes được áp dụng trong nhiều lĩnh vực và có nhiều biến thể phù
hợp với các ứng dụng khác nhau Trong lĩnh vực dự báo, chúng ta sử dụng
các đại lượng xác suất nền tảng của lý thuyết Bayes để xây dựng các mô hình
dự báo theo Bayes Sử dụng lý thuyết Bayes trong dự báo có thể chia thành 2
phương hướng chung Thứ nhất là sử dụng Bayes để xác định các thông số
của mô hình dự báo, một trong những điển hình của phương pháp này là xây
dựng mô hình tuyến tính động DLM – dynamic linear model, mô hình vector
tự hồi quy VAR – vector autoregressive … với các thông số hồi quy được
xác định theo Bayes Phương pháp thứ hai là sử dụng lý thuyết Bayes để kết
hợp các mô hình dự báo với các đại lượng đặc trưng như phân phối tiên
nghiệm, phân phối hậu nghiệm hoặc các hệ số được tính theo Bayes – hệ số
Bayes Kết hợp các mô hình theo Bayes có thể sử dụng các tiêu chuẩn chọn
Trang 18lựa theo Bayes như hệ số chọn lựa Bayes hay theo hàm logarith sai số hoặc
sử dụng giá trị tiên nghiệm để kết hợp kết quả dự báo theo Bayes
Trong đề tài này, chúng ta sử dụng phương pháp dự báo kết hợp các mô hình
dự báo hay các mô hình Chuyên gia theo tiêu chuẩn chọn lựa và phối hợp các
mô hình hay Chuyên gia theo lý thuyết Bayes
Trang 19CHƯƠNG 2 GIỚI THIỆU VỀ MÔ HÌNH CHUYÊN GIA
Trang 20Trong phần này chúng ta tìm hiểu sơ lược về các ý kiến, nhận định Chuyên gia trong lĩnh vực dự báo
Ý kiến Chuyên gia đóng vai trò quan trọng đối với việc phân tích tình huống trong điều kiện không thể thu thập đầy đủ dữ liệu liên quan Các Chuyên gia
có kiến thức, kinh nghiệm quý báu trong trong việc phân tích các bài toán và
đề xuất phương pháp giải quyết bài toán trong lĩnh vực chuyên môn của họ Mặc dù các kiến thức này không có cơ sở suy luận chắc chắn, không đánh giá được và khó có thể tổng hợp nhưng các nhận định của Chuyên gia đã đóng góp rất nhiều trong các lĩnh vực như chính trị, khoa học kỹ thuật
Về mặt lý thuyết chúng ta có thể thành lập được những bước suy luận mang tính Chuyên gia, với việc tuân thủ các nguyên lý như trung tính (neutrality), công bằng (fairness), trách nhiệm (accountability) và kinh nghiệm (empirical)
2.1 Ý Kiến Chuyên Gia
Ý kiến Chuyên gia là sự đánh giá, dựa trên kiến thức và kinh nghiệm, là những ý kiến trả lời của Chuyên gia cho các tình huống xảy ra Các tình huống này có thể liên quan đến xác suất, tần suất, những ước tính không chắc chắn, số lượng vật lý, …
Chuyên gia là nhân vật chủ chốt có các năng lực sau :
- Có những kiến thức quan trọng trong các lĩnh vực liên quan;
- Có những kiến thức nền tảng trong lĩnh vực liên quan;
- Được nhìn nhận như người có năng lực trong các lĩnh vực liên quan và
- Sử dụng thành thạo các đánh giá mang tính xác suất
Ý kiến Chuyên gia có thể được xem như là đại diện cho kiến thức của Chuyên gia đáp ứng cho các yêu cầu kỹ thuật Do đó, ý kiến Chuyên gia có thể thay đổi khi các Chuyên gia cập nhật thêm thông tin mới hay tích lũy thêm nhiều kinh nghiệm mới
Ý kiến Chuyên gia được sử dụng trong nhiều lĩnh vực kỹ thuật như lĩnh vực y học, kinh tế, kỹ thuật, đánh giá rủi ro, môi trường, …
Một số ví dụ có sử dụng ý kiến Chuyên gia như một bác sĩ phải chẩn đoán
Trang 21nhà quản lý của công ty đầu tư phải quyết định đầu tư cổ phiếu vào lĩnh vực nào vào thời điểm nào dựa trên những phân tích, đề xuất của các Chuyên gia hay đối với những thay đổi bất thường hay những biến động của nền kinh tế, Nhà quản lý năng lượng sẽ tham khảo các ý kiến của các Chuyên gia về giá trị phụ tải để có kế hoạch ứng phó kịp thời, bảo đảm cung cấp điện năng đầy
đủ theo yêu cầu của khách hàng …
Ý kiến Chuyên gia được sử dụng theo 2 cách:
- Để mô hình hoá một bài toán đặt ra Các Chuyên gia quyết định sử dụng dữ liệu nào và các biến nào liên quan để đưa vào phân tích, sử dụng phương pháp phân tích nào và giả thiết nào thích hợp Các nhà thống kê sẽ sử dụng đánh giá Chuyên gia theo phương pháp này
- Để đưa ra số lượng ước tính Lấy ví dụ, các Chuyên gia có thể ước tính tần suất rủi ro hoặc tai nạn, chỉ ra yếu tố ảnh hưởng quyết định để kết hợp các dữ liệu hoặc đặc tính hoá các sự kiện không chắc chắn
2.2 Lịch Sử Phát Triển Của Mô Hình Ý Kiến Chuyên gia:
Trong phần này chúng ta quan tâm câu hỏi “Mô hình Chuyên gia bắt đầu như thế nào?”
Ý kiến sử dụng các nhận xét của các Chuyên gia trong lĩnh vực ra quyết định không phải hoàn toàn là mới Tuy nhiên việc sử dụng ý kiến Chuyên gia theo
mô hình có cấu trúc rõ ràng là một nhận định mới
Sau chiến tranh Thế giới thứ hai, lĩnh vực Nghiên cứu và Phát triển (Research and Development) phát triển rất nhanh Chính phủ các nước trên thế giới đã đầu tư rất nhiều để nhận được những lời khuyên trong nhiều lĩnh vực: chiến lược và sách lược, xã hội, quan hệ quốc tế, công nghệ mới, …
Nền tảng xuất phát của việc sử dụng ý kiến Chuyên gia được công ty RAND Corporation Công ty này đã phát triển hai phương pháp suy luận Chuyên gia quan trọng được sử dụng rộng rãi là phương pháp Delphi và phương pháp phân tích bối cảnh
Tính chất của suy luận Chuyên gia, những ưu điểm và nhược điểm của suy luận Chuyên gia:
Ý kiến Chuyên gia được suy luận và phân tích khi:
1 Các dữ liệu thu thập ít và khó phân tích Đôi khi dữ liệu thu thập được lại không thể hiện được bản chất cần quan tâm
Trang 222 Việc thu thập dữ liệu quá tốn kém
3 Dữ liệu bị ảnh hưởng bởi quá nhiều yếu tố, kết quả thu được khó hội tụ và không chắc chắn
4 Mô hình để phân tích dữ liệu không có tác dụng;
5 Cần phải thực hiện chương trình nền tảng để tìm ra được kiến thức nào sẽ được sử dụng cho bài toán đặt ra và tài liệu liên quan đến thông tin như dữ liệu và kiến thức nền tảng
Ưu điểm và nhược điểm của suy luận Chuyên gia
Ưu điểm:
• Đây là phương pháp ít tốn kém
• Phương pháp cho kết quả nhanh
• Dựa vào hiểu biết và kinh nghiệm của con người
Khuyết điểm:
• Một hay nhiều thành viên có thể làm làm ảnh hưởng đến nhóm quyết định
• Chuyên gia đôi khi cũng phạm sai lầm
Nhận định của Chuyên gia có thể được thể hiện thành 2 dạng:
- Dạng số lượng: có thể được thể hiện như là giá trị xác suất, tần suất, những giá trị ước tính không chắc chắn, những yếu tố trọng tâm và các giá trị có tính vật lý (như thời gian, chiều dài, cân nặng,…)
- Dạng chất lượng: Một mô tả văn bản của các giả thuyết của Chuyên gia trong việc dẫn đến việc ước tính, nguyên nhân để chọn lựa hay suy luận ra các dữ liệu chắc chắn để phục vụ cho phân tích các số lượng vật lý quan tâm
2.3 Sử Dụng Ý Kiến Của Chuyên Gia Làm Dữ Liệu:
Khi ý kiến của Chuyên gia thuộc dạng số lượng, nó có thể được xem như là
dữ liệu Nhận định của Chuyên gia mang một số tính chất chung đối với dữ liệu kinh nghiệm đến những nhận định kinh nghiệm
Trang 23Nhận định của Chuyên gia bị ảnh hưởng bởi phương pháp suy luận của Chuyên gia đó Phương pháp suy luận có ưu điểm là sử dụng kiến thức con người và thêm vào các giải thuật như trợ giúp của bộ nhớ, suy luận liền lạc,
và các thông tin Chuyên gia quan tâm Chọn lựa sai phương pháp suy luận
có thể dẫn đến kết quả sai
Nhận định của Chuyên gia đôi khi không chắc chắn Nhiều Chuyên gia đã quen với việc đưa ra những ước tính không chắc chắn cho những dạng dữ liệu đơn giản
Sự khác biệt cơ bản giữa nhận định của Chuyên gia và dữ liệu kinh nghiệm là nhận định của Chuyên gia là một dạng ý kiến cá nhân của từng Chuyên gia
Khi ý kiến của Chuyên gia được sử dụng như là dữ liệu thì có các đặc tính sau:
1 Ý kiến Chuyên gia có thể được ứng dụng rộng rãi trong nhiều lĩnh vực
2 Những kết quả ước tính của Chuyên gia có thể không độc lập với nhau
3 Thông thường nếu Chuyên gia sử dụng cùng phương pháp đánh giá trong nhiều lần đối với cùng một vấn đề, kết quả thu được không hoàn toàn giống nhau
4 Hầu hết giá trị xác suất chủ quan không giống với tần suất của dữ liệu quan sát
Các tính chất trên là do trên thực tế nhận định của Chuyên gia không có cơ
sở, cấu trúc chắc chắn; do đó phương pháp có cấu trúc rõ ràng có nhiều ưu điểm
2.4 Một Số Phương Pháp Kết Hợp Các Ý Kiến, Suy Luận Của Chuyên gia
2.4.1 Phương Pháp Bayes
Phương pháp Bayes yêu cầu người sử dụng cung cấp giá trị phân bố xác suất tiên nghiệm và xử lý những đánh giá của Chuyên gia bằng cách cập nhập các phân phối này theo lý thuyết Bayes Nhiều phương pháp Bayes đã được đề xuất trong quá khứ, tuy nhiên lại ít được quan tâm và ứng dụng Sau đây chúng ta giới thiệu mô hình của Apostolakis và Mosleh được sử dụng tương đối:
Giả sử có e Chuyên gia đưa ra các giá trị ước tính là x1, x2, …, xe cho đối tượng X chưa biết Người chịu trách nhiệm ra quyết định khởi đầu với mật
Trang 24độ xuất hiện tiên nghiệm trên X và cập nhập giá trị này với các thông tin do Chuyên gia cung cấp
Công thức Bayes:
p(X ⎢x1, …, xe) = const x p (x1, …, xe ⎢x) p(x)
Nếu các Chuyên gia là độc lập với nhau, công thức trên đơn giản thành nhân các giá trị xác suất có điều kiện Apostolakis và Mosleh đưa ra 2 mô hình, một trong hai mô hình như sau:
(σi-2) và µe+1 = 0
2.4.2 Phương Pháp Tỷ Lệ Vật Lý (Physical scaling models)
Phương pháp này được thiết kế cho việc ước tính các ảnh hưởng quan trọng của các tác nhân vật lý Dữ liệu đầu vào là các số liệu chất lượng được thể hiện theo từng cặp so sánh Việc xắp xếp dữ liệu theo từng cặp như trên là để đánh giá được dữ liệu nào trong 2 dữ liệu ảnh hưởng đến mô hình nhiều hơn Đầu ra là các giá trị xác suất Quá trình chuyển từ dữ liệu số sang dữ liệu xác suất cần phải áp dụng nhiều giả thuyết quan trọng
Với e Chuyên gia, các Chuyên gia phải so sánh từng cặp đối tượng A(1), …, A(t) Các đối tượng này được giả thiết là có thực thông qua các giá trị được cho là thực Mỗi Chuyên gia có một giá trị nội V(i,e) tương ứng với từng A(i)
Một Chuyên gia đánh giá một đối tượng A(i) có khả năng xảy ra hơn đối
Trang 25V(i,e) > V(j,e)
Xác suất của các Chuyên gia như sau:
) ( ) (
) ( )
, (
j V i V
i V j
i r
+
= với ∑ V(i) =1
Giả sử là các Chuyên gia có quan điểm độc lập với nhau Để giải bài toán này chúng ta sử dụng tỷ lệ các nhận định kinh nghiệm của các Chuyên gia để cực đại hàm tương tự (maximum likelihood) của V(i) Có thể thể hiện hàm likelihood theo phương trình sau:
V(j)}
{V(i)
) (
αVới α(i) là số lần đối tượng A(i) được “ưa thích” hơn đối tượng A(j)
Đặc trưng của biến hạt giống:
- Đo lường các nhận định của các Chuyên gia
- Bảo đảm cho việc kết hợp các ý kiến của Chuyên gia theo hướng tối
ưu, cho kết quả chính xác nhất
- Đánh giá việc kết hợp các ý kiến của các Chuyên gia
Phương pháp cổ điển có các tính chất sau:
- Trọng số của phương pháp cổ điển tỷ lệ với thống kê likelihood và các thông tin
Trang 26- Phân chia vùng ảnh hưởng quan trọng hơn thông tin, dữ liệu có nhiệm
vụ phân biệt các vùng ảnh hưởng trong đó Chuyên gia nào cho kết quả tốt nhất
- Mỗi Chuyên gia sử dụng các giả thiết xác suất và được đo lường bằng các biến hạt giống Nếu giá trị likelihood thấp hơn điểm cut off, Chuyên gia đó có trọng số bằng không Giá trị của điểm cut off được tính toán để tối ưu hoá sự kết hợp của các ý kiến của các Chuyên gia
2.5 Kết luận
Như vậy chúng ta đã trình bày sơ lược về những ý kiến, nhận định của Chuyên gia và những ảnh hưởng cũng như ưu điểm và nhược điểm của phương pháp Chuyên gia Chúng ta thấy rằng đưa ra kết luận với những dữ liệu không chắc chắn rất phức tạp Điều này dựa vào ý kiến chủ quan của các Chuyên gia Trên thực tế không phải ai cũng có thể là Chuyên gia Thậm chí với một số người có thể có kiến thức Chuyên gia nhưng cũng có thể đưa ra kết quả sai lệch vì không quen xử lý các dạng dữ liệu không quen thuộc Do
đó việc huấn luyện các Chuyên gia rất quan trọng
Việc huấn luyện Chuyên gia phụ thuộc rất nhiều vào phương pháp, cách thức huấn luyện, khối lượng và mức độ phức tạp của việc huấn luyện Số lượng Chuyên gia có thể thay đổi từ 1 đến 20 người trong một mô hình tổng hợp; thời gian đưa ra kết quả có thể từ 1 ngày đến 1 năm
Trang 27CHƯƠNG 3
MÔ HÌNH MARKOV
ĐỐI VỚI CHUỖI THỜI GIAN
Trang 28Mô hình Markov được ứng dụng nhiều trong lĩnh vực nhận dạng giọng nói,
trong lĩnh vực sinh học như nhận dạng gene hoặc phân loại protein; xử lý tín
hiệu, xử lý hình ảnh và các ứng dụng khác liên quan đến chuỗi chuyển tiếp
hoặc kết hợp các thành phần, dữ kiện Trong lĩnh vực điện, mô hình Markov
được sử dụng như là một công cụ dự báo giá điện năng với các dữ liệu liên
quan [28] Ngoài ra mô hình Hidden Markov còn được sử dụng phân tích
chuỗi dữ liệu theo thời gian chứa đựng nhiều biến động không tuân theo quy
luật [23], [24], [33]
Trong phần này chúng ta tìm hiểu tổng quát về mô hình Markov và mô hình
Hidden Markov với những thành phần cơ bản
3.1 Mô Hình Markov
Một trong những thông số đặc trưng của mô hình Markov là các ‘state’ Tuỳ
thuộc vào việc xây dựng mô hình Markov với các đối tượng khác nhau thì sẽ
có các ‘state’ khác nhau Ví dụ, khảo sát sự biến đổi của chuỗi dữ liệu theo
thời gian, các ‘state’ sẽ là mức độ phát triển của dữ liệu theo thời gian [33],
với mô hình kết hợp các Chuyên gia, ‘state’ là các mô hình Chuyên gia hay
các mô hình thành phần cần kết hợp [23], [34], hoặc các ‘state’ cũng có thể là
các dữ kiện đầu vào liên quan đến mô hình cụ thể như là tốc độ tăng trưởng,
suy thoái, … trong mô hình dự báo kinh tế [16]
Trong mô hình Markov đơn giản, mỗi quan sát trong chuỗi dữ liệu phụ thuộc
vào phần tử đứng liền phía trước Giả sử một hệ thống bao gồm M ‘state’
-trạng thái - riêng biệt S = {1, 2, 3, 4,… M } Quan sát ở thời điểm t, hệ thống
chuyển từ ‘state’ này sang ‘state’ khác với xác suất p Chúng ta có chỉ số
‘state’ - trạng thái tại thời điểm t là st
Xét trường hợp đơn giản, dự đoán quá trình chuyển đến ‘state’ kế tiếp tương
ứng với quan sát tại thời điểm đó chỉ phụ thuộc vào ‘state’ hiện tại, điều này
có nghĩa là xác suất chuyển ‘state’ p không phụ thuộc vào toàn bộ chuỗi dữ
liệu quan sát trong quá khứ Mô hình này được gọi là mô hình Markov bậc 1:
MM: P(Xt+1 = sk ⎢X1, …, Xt) = P (Xt+1 = sk ⎢Xt) (3.1)
Ví dụ như sử dụng số liệu phụ tải tiêu thụ trong năm nay để dự đoán phụ tải
tiêu thụ trong năm tới mà không quan tâm đến các dữ liệu của các năm trước
nữa Mô hình Markov thể hiện trong công thức sau:
MM: P (X2005 = sk ⎢X2004)
Trang 29Đối với từng mô hình Markov, các ‘state’ trong mô hình được xác định theo
kinh nghiệm hoặc theo những dữ liệu quan sát trong quá khứ, theo ví dụ trên
như chúng ta có thể có các giả thiết về những thay đổi của phụ tải tiêu thụ
theo từng năm như sau:
Sthay đổi phụ tải tiêu thụ = { + 20%, + 10%, +0%, -10%, -20% };
Với X là dữ liệu dự báo theo thời gian, trong ví dụ trên X là giá trị phụ tải dự
báo theo từng năm
Vì xác suất chuyển từ ‘state’ sang ‘state’ khác không phụ thuộc vào thời gian,
chúng ta có ma trận A thể hiện các xác suất chuyển ‘state’ với các thành
3.2 Dây Chuyền Markov Với Chuỗi Dữ Liệu Theo Thời Gian:
Quan sát ví dụ về sự thay đổi dữ liệu điện năng tiêu thụ theo thời gian, chúng
ta mô hình hoá được 5 ‘state’ đặc trưng cho sự phát triển của chuỗi dữ liệu
theo thời gian thể hiện trong hình 3.1
Trong hình 3.1, các nút 1, 2, 3, 4, 5 thể hiện tốc độ phát triển khác nhau của
điện năng tiêu thụ: { +20%, +10%, +0%, -10%, -20% }
Ví dụ như đánh giá giả thiết quá trình thay đổi của điện năng tiêu thụ trong 6
năm kế tiếp : giảm 10%, không thay đổi, tăng 10%, không thay đổi, không
thay đổi, tăng 20%
Đầu tiên, chúng ta có thể mã hoá các chuyển tiếp đến các ‘state’ mô tả phía
trên là một vector gồm 6 thành phần, mỗi thành phần là một ‘state’ mà dữ
liệu sẽ chuyển tiếp đến: X = { 4, 3, 2, 3, 3, 1 } Giá trị xác suất đánh giá quá
trình chuyển tiếp trên – dây chuyền Markov - được tính như sau:
P ( X ⎢A, π ) = P (4, 3, 2, 3, 3, 1 ⎢A, π )
Trang 30= P(4) P(3 ⎢4) P(2⎢3) P(3⎢2) P(3⎢3) P(1⎢3) = π4 x a43 x a32 x a23 x a33 x a31
Với A là giá trị xác suất chuyển ‘state’, π là giá trị xác suất chọn ‘state’ đầu tiên của dây chuyền Markov
Trong giá trị A trong hình ví dụ 3.1:
Trang 310.400 0.100
0.100
0.200 0.100
0.100
0.100
0.100 0.200
0.200 0.200
0.400 0.400
0.200 0.200
0.200 0.200 0.200
0.100 0.100
Hình 3.1: Mô hình chuyển tiếp của chuỗi dữ liệu theo quy luật dây chuyền Markov Mỗi nút thể hiện một ‘state’ Các giá trị trên các nhánh là xác suất chuyển từ ‘state’ này sang ‘state’ khác
Một cách tổng quát, xác suất đánh giá quá trình của một vector bao gồm T bước chuyển ‘state’ X = {X1, … , XT } được tính như sau:
P ( X ⎢A, π ) = P(X1) P(X2⎢X1) P(X3⎢X1, X2)…P(XT⎢X1,…, XT-1) = P(X1) P(X2⎢X1) P(X3⎢X2)…P(XT⎢XT-1)
t
t X X
3.3 Mô Hình Hidden Markov
Mô hình Markov mô tả trong phần trước có những hạn chế trong nhiều ứng dụng như các giá trị chuyển ‘state’ là các giá trị áp đặt sẵn, không thay đổi trong khi dữ liệu, đối tượng quan sát luôn biến đổi theo thời gian Để khắc phục tình trạng này, chúng ta sử dụng mô hình Hidden Markov (Hidden
Trang 32Markov Model - HMM) Trong mô hình HMM, chúng ta không thể biết được quá trình chuyển ‘state’ theo chuỗi dữ liệu
Thay vì thể hiện quá trình thay đổi của chuỗi dữ liệu theo các trạng thái đầu
ra định sẵn, ví dụ như điện năng tiêu thụ sẽ có xu hướng tăng 20%, tăng
10%, không tăng, giảm 10%, giảm 20% trong các mốc thời gian kế tiếp, mỗi
‘state’ của HMM tương ứng với một hàm xác suất Tại thời điểm t, một dữ liệu quan sát ot sẽ có giá trị xác suất bj(ot) xuất hiện dữ liệu ot trong ‘state’ j :
bj(ot) = P(ot ⎢Xt = j ) (3.5) Hình 3.2 thể hiện một ví dụ HMM về một mô hình dự báo điện năng theo
nhiều chiến lược do nhiều Chuyên gia vạch ra Các ‘state’ của mô hình này
là các chiến lược của các Chuyên gia Vector ( +20%, +10%, +0%, 10%,
-20% ) thể hiện sự thay đổi dự kiến của chuỗi, được gọi là mẫu – symbol Giả
sử mỗi Chuyên gia có đánh giá về sự thay đổi điện năng với từng mức độ khác nhau; điện năng kỳ tiếp theo sẽ rơi vào một trong năm ‘symbol’ trên, và
mô hình chỉ cho kết quả theo một ‘state’ thích hợp tại mỗi thời điểm – ‘state’ được chọn
Như vậy đánh giá xác suất như thế nào nếu giả thiết dự báo thay đổi điện
năng trong 2 kỳ quan sát kế tiếp là { -10%, +10% } và sử dụng chiến lược 2
– ‘state’ 2, là chiến lược khởi đầu?
Để tính giá trị xác suất của quá trình biến đổi điện năng nêu trên, chúng ta quan sát ví dụ trên theo quan điểm Markov, mỗi ‘state’ của mô hình đều được kết nối với nhau bằng giá trị xác suất aij Quan sát bảng 3.2 thể hiện các nhận định của các Chuyên gia về các quá trình phát triển của chuỗi điện năng với 5 symbol trên, các nhận định này thể hiện dưới dạng xác suất và chỉ được các Chuyên gia quản lý
Trang 331 2 3 4 5
+20% 10% 15% 5% 40% 20% +10% 40% 30% 5% 30% 20% +0% 20% 30% 20% 20% 20% -10% 15% 15% 40% 5% 20% -20% 15% 10% 30% 5% 20%
Bảng 3.2: Thể hiện nhận xét của Chuyên gia về các sự biến đổi của điện năng
Không như mô hình dây chuyền Markov, mô hình HMM sẽ lấy một chiến lược – ‘state’ làm state khởi đầu – state sẽ bao gồm các đánh giá của Chuyên gia về các thay đổi có thể xảy ra của dữ liệu quan sát Như vậy chúng ta nhận thấy được mức độ linh động của mô hình HMM so với mô hình Markov thông thường - chỉ sử dụng một chiến lược trong suốt quá trình thay đổi chuỗi dữ liệu
Symbol
Chiến lược
Trang 341 2 3
Hình 3.3 : “mắt cáo” chuyển ‘state’ theo mô hình HMM, mỗi ‘state’ thái ứng với một chiến lược khác nhau
Đánh giá sự thay đổi dữ liệu theo mô hình HMM:
1 Chọn các giá trị khởi đầu: ‘state’ đầu tiên trong chuỗi chuyển tiếp
‘state’: X1= i tương ứng với giá trị xác suất chọn ‘state’ khởi đầu
Π Trong ví dụ trên, nếu như chọn chiến lược 2 là chiến lược khởi đầu: X1 = 2 Với nhận định điện năng sẽ tăng 10% ở thời đoạn đầu tiên, thì giá trị xác suất đánh giá nhận định trên của chiến lược 2 là 30% theo bảng vẽ 3.2
2 Tính xác suất của quá trình biến đổi đối tượng theo ‘symbol’ tương ứng với từng ‘state’ Ví dụ, tại thời điểm hiện tại, dữ liệu quan sát đang ở ‘state’ i, xác suất thể hiện biến đổi của đối tượng ở thời đoạn kế tiếp với ‘state’ j là bij(ot)
Theo ví dụ cụ thể trên, giả sử xác suất điện năng bước kế tiếp sẽ
tăng 20% là 15% nếu như chúng ta đang ở chiến lược 2
3 Chuyển tiếp sang ‘state’ kế tiếp Xt+1, tuân theo xác suất chuyển trạng thái aij
Trang 354 Tăng thời gian lên t = t +1, nếu t < T trở lại bước 2, nếu t > T, kết thúc – với T là chiều dài chuỗi quan sát để tính mô hình HMM
Như vậy để trả lời cho câu hỏi đánh giá xác suất của chuyển tiếp điện năng {-10%, +10%} ở hai kỳ quan sát kế tiếp nếu đang sử dụng chiến lược 2 làm chiến lược khởi đầu như sau:
P(X={-10%, +10%}| HMM) = 0.15 + 0.1x0.4 + 0.2x0.3 + 0.3x0.5 + 0.2x0.2 P(X={-10%, +10%}| HMM) = 0.365
3.4 Dạng Tổng Quát Của Mô Hình HMM
Một mô hình HMM bao gồm 5 thông số (S, K, Π, A, B)
• S = { 1, …., T } là chuỗi các ‘state’ đối với đối tượng quan sát ‘State’ tại thời điểm t là st , T là chiều dài của chuỗi quan sát Ví dụ như mô hình HMM dự báo điện năng ở trên sẽ sử dụng lần lượt chiến lược 1, chiến lược 4, chiến lược 3 trong 3 kỳ dự báo tiếp theo: S = {1, 4, 3}
• K = { k1, …, kM } là giá trị đầu ra K thể hiện các khả năng có thể xảy
ra của chuỗi quan sát, chuỗi quan sát sẽ có thể biến đổi theo M phương thức thay đổi thể hiện trong K Trong ví dụ trên M là số symbol thể
hiện các thay đổi có thể xảy ra của chuỗi điện năng {+20%, +10%,
• Xác suất của dữ liệu quan sát đối với từng ‘state’ trong mô hình
B = bj(ot) Giá trị xác suất dữ liệu ot sẽ thuộc ‘state’ j tại thời điểm t là:
bj(ot) = P(ot ⎢st = j ) (3.8) Sau khi thành lập mô hình HMM, có thể tính toán xác suất một chu trình biến đổi của dữ liệu quan sát (ví dụ như tính khả năng điện năng trong thời kỳ kế tiếp: tăng 20%, tăng 10%, tăng 10%) Ngoài ra, chúng ta cũng có thể huấn luyện các thông số của mô hình (A, B, Π) theo chuỗi dữ liệu quan sát để thu được mô hình chính xác hơn
Trang 363.5 Các Bài Toán Cơ Bản Của Mô Hình HMM
Chúng ta có 3 bài toán là 3 vấn đề cơ bản mô hình HMM
1 Cho một mô hình µ = ( A, B, Π ), và chuỗi quan sát O = (o 1 , o 2 , …, o T ),
làm thế nào để đánh giá được mức độ phù hợp của chuỗi quan sát đối
với mô hình µ ? Cụ thể là xác định giá trị P( O⎢µ )
2 Cho mô hình µ và chuỗi quan sát O, tìm chuỗi ‘state’ ẩn S(1, …, N )
phản ánh phù hợp nhất chuỗi quan sát
3 Cho chuỗi quan sát O và mô hình dự báo µ, làm thế nào để hiệu chỉnh
các thông số của mô hình µ = (A, B, Π ) để tìm được mô hình µ tin cậy
nhất đối với chuỗi quan sát – nghĩa là tìm mô hình có giá trị xác suất
P(O|µ ) lớn nhất?
Bài toán đầu tiên được dùng để xác định trong các mô hình HMM đã được
huấn luyện, mô hình nào thích hợp nhất đối với chuỗi quan sát Bài toán thứ
hai được sử dụng để tìm các chuyển tiếp ‘state’ ẩn Bài toán thứ 3 liên quan
đến quá trình huấn luyện mô hình
3.5.1 Xác Định Mô Hình HMM Thích Hợp Nhất
Cho chuỗi dữ liệu quan sát O = (o1, o2, …, oT) và mô hình HMM µ = (A, B,
∏), chúng ta tìm giá trị xác suất P(O | µ)
Giả sử chuỗi quan sát độc lập với nhau theo thời gian, xác suất của một chuỗi
chuyển tiếp ‘state’ theo thời gian S = { s1, …, sT) của dữ liệu quan sát được
P(S ⎢µ) = πs1 as1s2 as2s3 … asT-1sT (3.11) Xác suất kết hợp của O và S:
P(O,S ⎢µ) = P(O ⎢S, µ) P(S ⎢µ) (3.12)
Trang 371 sT s
Trong trường hợp dữ liệu quan sát quá dài, các bước tính toán sẽ tăng với tỷ
lệ hàm mũ, cần phải tính toán (2T-1).NT+1 phép tính nhân và NT - 1 bước
phép tính cộng
Để giải quyết vấn đề này, chúng ta sẽ sử dụng các thuật toán forward và
backward
a Thuật toán forward:
Biến forward αi(t) được định nghĩa như sau:
αi(t) chứa tổng các giá trị xác suất sẽ chuyển đến ‘state’ i tại thời điểm t với
chuỗi quan sát o1, o2, …, ot-1 Giá trị αi(t) được tính toán bằng lấy tổng các
xác suất của các chuyển tiếp ‘state’ i
Trang 39N(N-b Thuật toán backward:
Biến backward βi(t) được định nghĩa như sau:
Trang 40Thời gian
t+1 t
t-1
Trạng thái
sn
s3 s2 s1
γi(t) = P( st = i ⎢O,µ ) (3.22)
=
) (
) , (
µ
µ
O P
O i s
P t =