1. Trang chủ
  2. » Luận Văn - Báo Cáo

Dự báo phụ tải theo bayes

109 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 109
Dung lượng 1,06 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Với tính chất biến đổi phức tạp của phụ tải, các phương pháp dự báo theo mạng neural, dự báo theo fuzzy logic, và gần đây là các nghiên cứu dự báo phụ tải theo phương pháp Support vector

Trang 1

-

TRẦN THỊ THANH LOAN

DỰ BÁO PHỤ TẢI THEO BAYES

Chuyên ngành: THIẾT BỊ, MẠNG VÀ NHÀ MÁY ĐIỆN

Mã số ngành: 2.06.07

LUẬN VĂN THẠC SĨ

TP HỒ CHÍ MINH, tháng 09 năm 2005

Trang 2

CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH

Trang 3

Lời cảm ơn

Xin chân thành cảm ơn Quý Thầy Cô trường Đại Học Bách Khoa Thành Phố

Hồ Chí Minh, đặc biệt là Cô TS Phan Thị Thanh Bình, người đã tận tình

dìu dắt, hướng dẫn tôi thực hiện luận án cao học này

Cám ơn Gia đình, tất cả bạn bè thân thuộc, các anh chị đồng nghiệp luôn bên cạnh, hỗ trợ, tạo điều kiện và dộng viên giúp đỡ tôi rất nhiều từ khi tham gia khoá học cho đến khi hoàn thành luận án này

TP Hồ Chí Minh, ngày 29/09/2005

Trần Thị Thanh Loan

Trang 4

NHIỆM VỤ LUẬN VĂN THẠC SĨ

Họ và tên học viên: TRẦN THỊ THANH LOAN Phái: Nữ

Ngày sinh: 26 – 01 – 1979 Nơi sinh : Tp HỒ CHÍ MINH Chuyên ngành: THIẾT BỊ, MẠNG VÀ HỆ THỐNG ĐIỆN

I TÊN ĐỀ TÀI: DỰ BÁO PHỤ TẢI THEO BAYES

II NHIỆM VỤ VÀ NỘI DUNG:

- Giới thiệu tổng quan về lý thuyết Bayes

- Giới thiệu về mô hình dự báo theo phương pháp Chuyên gia

- Phân tích và xử lý dữ liệu theo mô hình Hidden Markov

- Xây dựng mô hình dự báo theo Bayes kết hợp các mô hình dự báo thành phần

III NGÀY GIAO NHIỆM VỤ:

IV NGÀY HOÀN THÀNH NHIỆM VỤ:

V HỌ VÀ TÊN CB HƯỚNG DẪN: TS PHAN THỊ THANH BÌNH

Trang 5

Dự báo phụ tải là một mắc xích quan trọng trong vận hành hệ thống năng lượng Dự báo phụ tải giúp Nhà cung cấp điện lượng đưa ra những quyết định quan trọng trong quá trình điều hành bộ máy sản xuất Ví dụ với thông tin về phụ tải tiêu thụ dự báo được trong thời đoạn kế tiếp, Nhà sản xuất sẽ quyết định sẽ là Nhà trung gian mua bán điện hay đầu tư sản xuất điện trực tiếp; Nhà sản xuất có thể lên kế hoạch cắt giảm phụ tải để cân đối giữa cung và cầu, tránh các tình huống quá tải nghiêm trọng dẫn đến tình trạng rã lưới; hoặc có các biện pháp thu hút khách hàng

sử dụng điện như phát triển cơ sở hạ tầng cho ngành điện, xây dựng các đường dây phân phối, xây dựng các trạm phân phối và đầu tư nguồn điện … Do đó kết quả dự báo chính xác luôn luôn là điều mong muốn của người quản lý, vận hành hệ thống

Đề tài xin giới thiệu các ứng dụng của lý thuyết Bayes vào dự báo phụ tải với mục đích kết hợp các mô hình dự báo phụ tải, các nhận định của các Chuyên gia để đưa ra kết quả dự báo chính xác hơn Mô hình dự báo sẽ ứng dụng lý thuyết Bayes trên các dữ liệu được xử lý theo phương pháp Hidden Markov để tính toán và đưa ra kết quả dự báo

Chương trình dự báo phụ tải trong Luận án được viết bằng phần mềm Matlab 6.5

ABSTRACT

Load forecasting is essential to the power system operation Accurate load forecasting helps power utility company makes important decisions in power system management and operation Based on the load forecasting information, the utility company comes to decision to buy power from another utility company or invest in producing electricity power According to short time load forecasting, the utility company will plan to cut down load to balance supply and demand, to avoid the extreme overload that causes power system collapse The utility company must have the accurate long time load forecasting to develop the electrical infrastructure such as building transmission lines, transmission and distribution transformers, power sources … With these reasons, the accuracy load forecasting is one of the most important factors in managing and operating power system

This thesis presents an application of Bayes theory in load forecasting in combination different load forecasting modules or individual expert inferences in order to compute an acuracy result The proposed method uses Bayes theory with data processed by Hidden Markov model

The proposed load forecasting method in this thesis is written in Matlab 6.5 software

Trang 6

MỤC LỤC

GIỚI THIỆU ĐỀ TÀI 1 CHƯƠNG 1: LÝ THUYẾT BAYES VÀ MỘT SỐ ỨNG DỤNG THEO BAYES 1-1 1.1 Công thức Bayes cơ bản 1-2 1.2 Suy Luận Theo Bayes 1-3 1.2.1 Chuỗi dữ liệu theo suy luận Bayes 1-4 1.2.2 Vector dự báo kỳ vọng – Forecasting vector of interest 1-4 1.2.3 Phân phối tiên nghiệm 1-5 1.2.4 Phân phối tiên nghiệm dự báo – Prior Predictive 1-5 1.2.5 Kết hợp mô hình 1-5 1.3 Bayes chọn lựa mô hình theo phân phối hậu nghiệm 1-6 1.3.1 Dự báo với hàm Logarith Sai Số - Logarithmic Loss 1-7 1.3.2 Đặc điểm của chọn lựa mô hình dự báo theo Bayes 1-7 1.4 Bayes kết hợp các mô hình dự báo 1-8 1.5 Kết luận 1-8 CHƯƠNG 2: GIỚI THIỆU VỀ MÔ HÌNH CHUYÊN GIA 2-1 2.1 Ý kiến Chuyên gia 2-2 2.2 Lịch sử phát triển của mô hình ý kiến Chuyên gia 2-3 2.3 Sử dụng ý kiến Chuyên gia làm dữ liệu 2-4 2.4 Một số phương pháp kết hợp suy luận của Chuyên gia 2-5 2.4.1 Phương pháp Bayes 2-5 2.4.2 Phương pháp tỷ lệ vật lý (Physical scaling model) 2-6 2.4.3 Phương pháp cổ điển 2-7 2.5 Kết luận 2-8 CHƯƠNG 3: MÔ HÌNH MARKOV VỚI CHUỖI THỜI GIAN 3-1 3.1 Mô hình Markov 3-2 3.2 Dây chuyền Markov với chuỗi dữ liệu theo thời gian 3-3 3.3 Mô hình Hidden Markov 3-5 3.4 Dạng tổng quát của mô hình HMM 3-9

Trang 7

3.5 Các bài toán cơ bản của mô hình HMM 3-10 3.5.1 Xác định mô hình HMM thích hợp nhất 3-10 3.5.2 Tìm chuỗi chuyển tiếp ‘state’ phản ánh tốt nhất dữ liệu quan sát – Bài toán tìm S 3-14 3.5.3 Huấn luyện mô hình 3-17 3.6 Kết luận 3-21 CHƯƠNG 4: DỰ BÁO THEO BAYES VỚI XỬ LÝ DỮ LIỆU THEO MÔ HÌNH HMM 4-1 4.1 Mô hình dự báo sử dụng phương pháp chọn lựa mô hình Bayes - BCM 4-2 4.1.1 Tìm chuyển tiếp ‘state’ theo các dữ liệu quan sát trong quá khứ 4-3 4.1.2 Chọn lựa mô hình dự báo theo Bayes 4-3 4.2 Mô hình dự báo theo Bayes theo phương pháp kết hợp các mô hình dự báo thành phần - BMM 4-5 4.3 Xây dựng mô hình HMM-Hidden Markov Model - với các mô hình dự báo thành phần 4-6 4.3.1 Thiết lập mô hình HMM 4-6 4.3.2 Huấn luyện mô hình HMM 4-7 4.4 Đánh giá mô hình dự báo theo sai số 4-10 4.5 Kết luận 4-11 CHƯƠNG 5: ÁP DỤNG MÔ HÌNH DỰ BÁO 5-1 5.1 Ví dụ 1 5-2 5.1.1 Dữ liệu quan sát 5-2 5.1.2 Các mô hình dự báo thành phần sử dụng trong mô hình dự báo 5-2 5.2 Ví dụ 2 5-9 5.3 Nhận xét kết quả dự báo 5-10 CHƯƠNG 6: KẾT LUẬN VÀ ĐỀ XUẤT HƯỚNG PHÁT TRIỂN 6-1 PHỤ LỤC 1 PL1-1 PHỤ LỤC 2 PL2-1 TÀI LIỆU THAM KHẢO TLTK-1

Trang 8

GIỚI THIỆU ĐỀ TÀI

Trong lĩnh vực dự báo phụ tải, rất nhiều phương pháp dự báo được đề xuất từ các phương pháp dự báo cổ điển, sử dụng các hàm hồi quy để mô hình hóa chuỗi thời gian đến các phương pháp dự báo phức tạp sử dụng các thuật toán thông minh như neuron, fuzzy … Với tính chất biến đổi phức tạp của phụ tải, các phương pháp dự báo theo mạng neural, dự báo theo fuzzy logic, và gần đây là các nghiên cứu dự báo phụ tải theo phương pháp Support vector machine - sử dụng hàm kernel để mapping các dữ liệu vào những vùng phân định trước và từ đó tính giá trị dự báo - thường được đề xuất Ngoài ra, phương pháp dự báo theo Chuyên gia cũng được sử dụng căn cứ trên những hiểu biết, kinh nghiệm và kiến thức của các Chuyên gia Mỗi phương pháp

dự báo dự báo đều cho kết quả tích cực ứng với từng trường hợp cụ thể Tuy nhiên, cho đến nay vẫn chưa có phương pháp hay giải thuật dự báo phụ tải nào hữu hiệu với mọi tình huống Vì vậy, chúng ta quan tâm đến việc kết hợp các phương pháp dự báo phụ tải khác nhau với mong muốn đưa ra kết quả dự báo chính xác hơn, phù hợp với những biến động của phụ tải

Một trong các phương pháp để khắc phục những hạn chế của các mô hình dự báo riêng lẽ trên là sử dụng phương pháp kết hợp các mô hình dự báo, hay còn gọi là kết hợp các Chuyên gia ME – Mixture of Experts [23], [28], [34], [37] Theo [34], có 3 hướng giải thuật chính để giải quyết bài toán ME trên

là chọn lựa từng mô hình riêng lẽ GE - Gated Experts; kết hợp các mô hình

dự báo theo mô hình Hidden Markov HME - Hidden Markov Experts và phương pháp kết hợp các mô hình dự báo theo các dữ liệu liên quan IOHMM – Input/Output Hidden Markov Model Trong phương pháp GE mỗi mô hình

dự báo riêng lẽ hay Chuyên gia được mô hình hóa vào một không gian con riêng biệt, mô hình hay Chuyên gia được chọn để dự báo là mô hình phù hợp nhất với chuỗi dữ liệu quan sát Thuật toán chọn lựa mô hình dự báo được gọi là ‘gating’ Mô hình HME giới thiệu một phương pháp kết hợp các mô hình hoặc các Chuyên gia dựa trên những giá trị tính toán từ phương pháp HMM - Hidden Markov Model Giá trị dự báo sẽ là giá trị kết hợp các mô

hình theo xác suất tiên nghiệm P(Mi) (Mi là mô hình dự báo hay chuyên gia) phụ thuộc vào các trạng thái tính được theo phương pháp HMM Mô hình IOHMM kết hợp các mô hình theo kết quả tính toán từ phương pháp HMM với các thông số của mô hình HMM biến đổi theo thời gian và những tình huống bên ngoài, ví dụ như đối với dự báo phụ tải có thể bổ sung các tình huống như thời tiết, chu kỳ … cùng với các mô hình dự báo thành phần

Trang 9

Luận án này đề xuất phương pháp dự báo ứng dụng theo lý thuyết Bayes và phương pháp HME kết hợp các mô hình dự báo thành phần hay các Chuyên gia Mỗi mô hình dự báo thành phần hay Chuyên gia được xem như là một

‘state’ trong mô hình HMM Mô hình HMM sẽ tính toán các giá trị xác suất chuyển tiếp giữa các ‘state’ theo dữ liệu quan sát Giá trị dự báo là giá trị dự báo của mô hình con được chọn theo thuật toán phân lớp theo Bayes – Bayes classification – phương pháp BCM hoặc sẽ là giá trị kết hợp các phương pháp

dự báo thành phần hay chuyên gia theo xác suất tiên nghiệm P(Mi) được tính theo công thức Bayes – phương pháp BMM

Bố cục của luận án bao gồm 6 chương Chương 1 trình bày sơ lược về lý thuyết Bayes và một số đại lượng xác suất ứng dụng trong suy luận theo Bayes Chương 2 sẽ giới thiệu về phương pháp Chuyên gia và một số phương pháp kết hợp các Chuyên gia trong dự báo Trong chương 3 chúng ta tìm hiểu về mô hình Markov và Hidden Markov trong phân tích chuỗi thời gian Việc xây dựng mô hình dự báo theo lý thuyết Bayes và mô hình HMM được trình bày trong chương 4 Trong chương 5, chúng ta áp dụng mô hình

dự báo được đề xuất trong dự báo ngắn hạn theo ngày trong tài liệu [44] và kết hợp các mô hình dự báo trong dự báo dài hạn tại thành phố Hồ Chí Minh [42], [43] Chương 6 sẽ rút ra những kết luận trong quá trình xây dựng mô hình dự báo và đề xuất hướng phát triển cho đề tài

Trang 10

CHƯƠNG 1

LÝ THUYẾT BAYES VÀ MỘT SỐ ỨNG DỤNG THEO BAYES

Trang 11

Trong lĩnh vực dự báo, lý thuyết Bayes được ứng dụng rất đa dạng như mô

hình dự báo tuyến tính động DLM – dynamic linear model - [6], [40] hay mô

hình tự hồi quy AR – autoregressive [39], hay mô hình dự báo kết hợp nhiều

phương pháp dự báo – Chuyên gia bằng phương pháp tính mật độ phân phối

dự báo theo Bayes hoặc ứng dụng lý thuyết Bayes để tính toán chọn lựa mô

hình dự báo thích hợp theo những tiêu chuẩn định trước [5], [11], [19],

[32]…

Trong phần này, chúng ta tìm hiểu công thức Bayes cơ bản và những đại

lượng xác suất thường được sử dụng trong quá trình suy luận, dự báo theo

Bayes Tiếp theo, chúng ta sẽ tham khảo một số phương pháp dự báo kết hợp

các mô hình theo Bayes

1.1 Công thức Bayes cơ bản:

Trong phần này chúng ta tìm hiểu các ý nghĩa các đại lượng cơ bản trong

công thức Bayes và công thức Bayes dạng đơn giản

Giả sử chúng ta có các dữ liệu thống kê ε trong không gian mẫu S các sự kiện

có thể xảy ra; (B1, B2, …, Br) là không gian từng phần của S Cho {p(A);

A⊆S} là phân phối xác suất của các sự kiện trong không gian S Cho các sự

kiện A và B với p(A) > 0; p(B|A) = p(A∩B) / p(A) là xác suất xuất hiện sự

kiện B với điều kiện đã xuất hiện sự kiện A Theo công thức Bayes:

p(Bi|A) =

) (

) ( ).

(

A p

B p B A

Trong một chiến dịch kiểm tra sản phẩm điện tử của một công ty, tỷ lệ sản

phẩm bị hư khi vừa xuất xưởng là θ = 0.01, trong số đó có 99% là do mối hàn

của các linh kiện điện tử không đạt chất lượng, được phân loại là sai sót Z

Như vậy người kiểm tra chất lượng sản phẩm trước khi xuất xưởng sẽ kết

luận sản phẩm bị hư hỏng là các sản phẩm có sai sót Z Chọn ngẫu nhiên một

số thiết bị điện tử A: có sai sót Z và B: thiết bị hư hỏng Như vậy chúng ta có

p(B) = θ = 0.01 và p(A|B) = 0.99

Theo lý thuyết Bayes với r = 2, B1 = B, B2 = BC chúng ta có :

Trang 12

p (thiết bị hư hỏng | sai sót Z) = p(B|A) =

=

) ( ).

( ) ( ).

(

) ( ).

(

C

C p B B A p B p B A p

B p B A p

+

=

) ( 99 0 01 0 99 0

01 0 99 0

C B A p

× +

×

×

=

) ( 100 1

1

C B A p

+

Giá trị xác suất trên tùy thuộc vào p(A|BC), nếu p(A|BC) = 1/10 thì p(B|A) = 1/11, giá trị tương đối bé, không phù hợp với giả thiết dựa chỉ vào sai sót Z

để kết luận hư hỏng thiết bị Mặc khác:

p (thiết bị hư hỏng | không có sai sót Z) = p(B|AC) =

=

) ( ).

( ) ( ).

(

) ( ).

(

C C C C

C

B p B A p B p B A p

B p B A p

+

= 0 01 0 01 0 99 {1 ( ) }

01 0 01 0

C B A p

× +

×

×

=

) ( 9900 9901

1

C B A p

+

Do đó nếu như thiết bị không có sai sót Z, thì vẫn có khả năng bị hư hỏng do các lý do khác Như vậy nhờ vào công thức Bayes mà chúng ta có thể nhận thấy các khả năng không chắc chắn khi đưa ra các quyết định tưởng như hòan toàn chính xác Điều này giúp chúng ta thận trọng trong việc ra quyết định

và dự đoán trước các tình huống có thể xảy ra trong thực tế

1.2 Suy Luận Theo Bayes

Phương pháp Bayes trong suy luận và dự báo đều xuất phát từ 2 nguyên lý cơ bản:

• Mô hình kết hợp: sử dụng phân phối kết hợp các dữ liệu tương lai và dữ liệu đã có để dự báo

Trang 13

• Điều kiện liên quan: sử dụng phân phối có điều kiện của đối tượng dự báo

dựa trên những dữ liệu đã biết và xác định hàm sai số - loss function

1.2.1 Biểu diễn chuỗi dữ liệu theo suy luận Bayes:

Cho chuỗi dữ liệu Yt = {ys}s=1t theo thời gian, có thể thể hiện giá trị dự báo

dưới dạng xác suất như sau:

Với θA là vector kA x 1 các dữ liệu chưa biết, θA ∈ ΘA ⊆ Rk Vector θA chứa

các biến liên quan đến cấu trúc của mô hình

Sử dụng ký hiệu p(⋅) thể hiện hàm mật độ xác suất đặc trưng pdf ( probability

density function) và P(⋅) là phân phối tích lũy cdf (cumulative distribution

function) Hàm mật độ phân phối xác suất của Yt đối với mô hình dự báo và

θA được xác định như sau:

Ví dụ với mô hình vector tự hồi quy VAR – vector autoregressive:

Mô hình VAR dự báo chuỗi thời gian được thể hiện dưới suy luận Bayes như

1.2.2 Vector dự báo kỳ vọng – forecasting vector of interest

Chúng ta định nghĩa vector dự báo kỳ vọng ω ∈Ω ⊆ Rqcó mật độ phân phối

đối với dữ liệu theo thời gian và thông số của mô hình như sau:

Trang 14

Trong bài toán dự báo, chúng ta định nghĩa vector {yT+1, , yT+F } ∈ ω với

F > 0 và với trường hợp đặc biệt ω’ = (yT+1, , yT+F )’, do đó có thể biễu diễn :

p (ω | YT , θA) α p (ω | YT+F , θA) (1.5)

1.2.3 Phân phối tiên nghiệm

Phân phối tiên nghiệm là một đại lượng đặc trưng cho những hiểu biết về đối tượng dựa trên những thông tin đã biết, được định nghĩa như sau:

1.2.4 Phân phối tiên nghiệm dự báo – Prior Predictive distribution

Chúng ta định nghĩa phân phối tiên nghiệm dự báo như sau:

p (YT| A) = ∫ΘAp (θA| A) p (YT| θA) dθA (1.7) Mật độ tiên nghiệm dự báo của đối tượng tổng hợp các hiện tượng có thể xảy

ra của chuỗi dữ liệu tương ứng với mô hình dự báo Hàm mật độ tiên nghiệm

dự báo tổng hợp các tính chất của mô hình và được sử dụng trong suy luận Bayes vì đơn giản hơn so với việc suy luận trên những đại lượng xác suất thông thường

1.2.5 Kết hợp mô hình

Trong lĩnh vực dự báo và ra quyết định, có trường hợp không sử dụng chỉ một mô hình A mà sử dụng tổ hợp các mô hình A1, A2, … AJ Mỗi mô hình bao gồm một mật độ phân phối có điều kiện của đối tượng dự báo, vector kỳ vọng ω, mật độ tiên nghiệm Với một số lượng xác định các mô hình, phát triển các đại lượng xác suất cho các mô hình Quá trình phát triển này bao gồm kết hợp các xác suất tiên nghiệm của từng mô hình p(Ai) vào mô hình, xây dựng hệ thống suy luận và định vị các bài toán quyết định có điều kiện

Trang 15

{ p(Aj) , p(θA j |Aj), p(YT|θA j,Aj ), p (ω |YT, θA j, Aj )} (j = 1, , J) (1.8) Như vậy có thể thể hiện những đại lượng xác suất cho mô hình tổng quát như

Biểu thức (1.10) là xác suất hậu nghiệm của mô hình Aj Trong biểu thức

(1.11) thành phần thứ hai là giá trị xác suất tiên nghiệm của Aj , giá trị đầu

tiên là là likelihood:

p (YoT|Aj) = ∫ΘAj p(YoT|θAj,Aj) p(θAj|Aj)dθAj (1.12) Chúng ta tính tỷ số của phân phối hậu nghiệm của mô hình Ai với mô hình

Ak:

) (

) (

) (

) ( ) (

) (

k

o T i

o T k

i o

T k

o T i

A Y p

A Y p A p

A p Y A P

Y A p

Tỷ số trên là tỷ số hậu nghiệm của mô hình Aj với mô hình Ak Giá trị này tỷ

lệ với tỷ số tiên nghiệm p(Ai)/p(Ak) và tỷ số của hàm likelihood p(YoT/Ai)/

p(YoT/Ak) còn được gọi là hệ số Bayes Hệ số Bayes là độc lập với nhau đối

với các mô hình Aj trong mô hình tổng quát J mô hình thành phần {A1, …,

AJ}

1.3 Bayes Chọn Lựa Mô Hình Theo Phân Phối Hậu Nghiệm:

Để chọn một mô hình thích hợp nhất trong r mô hình, với các giá trị xác suất

p1(y), p2(y), …, pr(y) thể hiện mức độ xuất hiện của các dữ liệu quan sát y =

(y1, y2, …, yn)T đối với từng mô hình Trước khi sử dụng dữ liệu quan sát,

chúng ta có các giá trị xác suất φ1, …, φr, tổng cộng bằng 1 Giá trị xác suất

φj thể hiện xác suất mô hình thứ j là mô hình được chọn lựa Nếu không có

các thông tin để phân biệt giữa các mô hình, giá trị xác suất chọn lựa mô hình

Trang 16

là φj = r , với ý nghĩa cơ hội chọn lựa các mô hình là như nhau Giá trị φj có

thể được xem như là phân phối xác suất hậu nghiệm – posterior probability

Giá trị xác suất hậu nghiệm của mô hình thứ j được tính như sau:

φ*

j =

) (

) (

1

y p

y p g g r g

j j

Giá trị xác suất tiên nghiệm của từng mô hình thể hiện mức độ tin tưởng vào

mô hình đó của người nghiên cứu, đây cũng là giá trị xác suất chủ quan, phụ

thuộc vào người nghiên cứu Tuy nhiên khó đánh giá mức độ chính xác của

các giá trị này vì các hiểu biết về các mô hình có thể không chính xác

1.3.1 Dự Báo Với Hàm Logarith Sai Số - Logarithmic Loss:

Cho chuỗi dữ liệu y1, y2, … với yi ∈ Y Mục tiêu là tìm giá trị dự báo yi với

chuỗi dữ liệu đã biết y1, y2, …, yi-1, sử dụng giá trị xác suất dự báo pi

Chất lượng của phương pháp dự báo được thể hiện bằng hàm log Loss:

Loss (y1, …, yn, S) := ∑

=

n

i 1

Loss (yi, S(y1, …, yi-1)) (1.16)

Nếu chúng ta có Y1, Y2, …, Yn ~ P và giá trị dự báo Yi sẽ là xác suất có điều

i

y P

y P y

P

y P

) ( log )

(

) (

1.3.2 Đặc điểm của chọn lựa mô hình dự báo theo Bayes:

- Tính toán dựa trên các công thức xác suất có điều kiện

- Là mô hình hồi quy

Trang 17

- Cho kết quả hội tụ vào mô hình có sai lệch ít nhất

1.4 Bayes Kết Hợp Các Mô Hình Dự Báo

Với mô hình dự báo M = {Pθ|θ∈Θ} và chuỗi dữ liệu n thành phần yn = y1, y2,

…, yn, mô hình dự báo tối ưu nhất trong M là mô hình thỏa mãn hàm

likelihood cực đại ⎯θ(yn) Đây là mô hình kết hợp các mô hình dự báo với

mục tiêu cực đại hàm likelihood

Theo công thức Bayes:

• Tìm các giá trị tiên nghiệm W cho M

• Tính các phân phối Bayes cận biên:

PBayes(y1, …, yn) := ∫θ∈ΘPθ(y1, …, yn)w(θ)dθ (1.19)

• Dự báo phân phối dự báo Bayes:

PBayes(yi+1|y1, …, yi) = ( )

) , , (

, ,

1

1 1

i Bayes

i Bayes

y y P

y y

θθ

θ

θ

d w y P

w y P i

i

) ( ) (

) ( ).

(

là phân phối hậu nghiệm Bayes

1.5 Kết luận

Lý thuyết Bayes được áp dụng trong nhiều lĩnh vực và có nhiều biến thể phù

hợp với các ứng dụng khác nhau Trong lĩnh vực dự báo, chúng ta sử dụng

các đại lượng xác suất nền tảng của lý thuyết Bayes để xây dựng các mô hình

dự báo theo Bayes Sử dụng lý thuyết Bayes trong dự báo có thể chia thành 2

phương hướng chung Thứ nhất là sử dụng Bayes để xác định các thông số

của mô hình dự báo, một trong những điển hình của phương pháp này là xây

dựng mô hình tuyến tính động DLM – dynamic linear model, mô hình vector

tự hồi quy VAR – vector autoregressive … với các thông số hồi quy được

xác định theo Bayes Phương pháp thứ hai là sử dụng lý thuyết Bayes để kết

hợp các mô hình dự báo với các đại lượng đặc trưng như phân phối tiên

nghiệm, phân phối hậu nghiệm hoặc các hệ số được tính theo Bayes – hệ số

Bayes Kết hợp các mô hình theo Bayes có thể sử dụng các tiêu chuẩn chọn

Trang 18

lựa theo Bayes như hệ số chọn lựa Bayes hay theo hàm logarith sai số hoặc

sử dụng giá trị tiên nghiệm để kết hợp kết quả dự báo theo Bayes

Trong đề tài này, chúng ta sử dụng phương pháp dự báo kết hợp các mô hình

dự báo hay các mô hình Chuyên gia theo tiêu chuẩn chọn lựa và phối hợp các

mô hình hay Chuyên gia theo lý thuyết Bayes

Trang 19

CHƯƠNG 2 GIỚI THIỆU VỀ MÔ HÌNH CHUYÊN GIA

Trang 20

Trong phần này chúng ta tìm hiểu sơ lược về các ý kiến, nhận định Chuyên gia trong lĩnh vực dự báo

Ý kiến Chuyên gia đóng vai trò quan trọng đối với việc phân tích tình huống trong điều kiện không thể thu thập đầy đủ dữ liệu liên quan Các Chuyên gia

có kiến thức, kinh nghiệm quý báu trong trong việc phân tích các bài toán và

đề xuất phương pháp giải quyết bài toán trong lĩnh vực chuyên môn của họ Mặc dù các kiến thức này không có cơ sở suy luận chắc chắn, không đánh giá được và khó có thể tổng hợp nhưng các nhận định của Chuyên gia đã đóng góp rất nhiều trong các lĩnh vực như chính trị, khoa học kỹ thuật

Về mặt lý thuyết chúng ta có thể thành lập được những bước suy luận mang tính Chuyên gia, với việc tuân thủ các nguyên lý như trung tính (neutrality), công bằng (fairness), trách nhiệm (accountability) và kinh nghiệm (empirical)

2.1 Ý Kiến Chuyên Gia

Ý kiến Chuyên gia là sự đánh giá, dựa trên kiến thức và kinh nghiệm, là những ý kiến trả lời của Chuyên gia cho các tình huống xảy ra Các tình huống này có thể liên quan đến xác suất, tần suất, những ước tính không chắc chắn, số lượng vật lý, …

Chuyên gia là nhân vật chủ chốt có các năng lực sau :

- Có những kiến thức quan trọng trong các lĩnh vực liên quan;

- Có những kiến thức nền tảng trong lĩnh vực liên quan;

- Được nhìn nhận như người có năng lực trong các lĩnh vực liên quan và

- Sử dụng thành thạo các đánh giá mang tính xác suất

Ý kiến Chuyên gia có thể được xem như là đại diện cho kiến thức của Chuyên gia đáp ứng cho các yêu cầu kỹ thuật Do đó, ý kiến Chuyên gia có thể thay đổi khi các Chuyên gia cập nhật thêm thông tin mới hay tích lũy thêm nhiều kinh nghiệm mới

Ý kiến Chuyên gia được sử dụng trong nhiều lĩnh vực kỹ thuật như lĩnh vực y học, kinh tế, kỹ thuật, đánh giá rủi ro, môi trường, …

Một số ví dụ có sử dụng ý kiến Chuyên gia như một bác sĩ phải chẩn đoán

Trang 21

nhà quản lý của công ty đầu tư phải quyết định đầu tư cổ phiếu vào lĩnh vực nào vào thời điểm nào dựa trên những phân tích, đề xuất của các Chuyên gia hay đối với những thay đổi bất thường hay những biến động của nền kinh tế, Nhà quản lý năng lượng sẽ tham khảo các ý kiến của các Chuyên gia về giá trị phụ tải để có kế hoạch ứng phó kịp thời, bảo đảm cung cấp điện năng đầy

đủ theo yêu cầu của khách hàng …

Ý kiến Chuyên gia được sử dụng theo 2 cách:

- Để mô hình hoá một bài toán đặt ra Các Chuyên gia quyết định sử dụng dữ liệu nào và các biến nào liên quan để đưa vào phân tích, sử dụng phương pháp phân tích nào và giả thiết nào thích hợp Các nhà thống kê sẽ sử dụng đánh giá Chuyên gia theo phương pháp này

- Để đưa ra số lượng ước tính Lấy ví dụ, các Chuyên gia có thể ước tính tần suất rủi ro hoặc tai nạn, chỉ ra yếu tố ảnh hưởng quyết định để kết hợp các dữ liệu hoặc đặc tính hoá các sự kiện không chắc chắn

2.2 Lịch Sử Phát Triển Của Mô Hình Ý Kiến Chuyên gia:

Trong phần này chúng ta quan tâm câu hỏi “Mô hình Chuyên gia bắt đầu như thế nào?”

Ý kiến sử dụng các nhận xét của các Chuyên gia trong lĩnh vực ra quyết định không phải hoàn toàn là mới Tuy nhiên việc sử dụng ý kiến Chuyên gia theo

mô hình có cấu trúc rõ ràng là một nhận định mới

Sau chiến tranh Thế giới thứ hai, lĩnh vực Nghiên cứu và Phát triển (Research and Development) phát triển rất nhanh Chính phủ các nước trên thế giới đã đầu tư rất nhiều để nhận được những lời khuyên trong nhiều lĩnh vực: chiến lược và sách lược, xã hội, quan hệ quốc tế, công nghệ mới, …

Nền tảng xuất phát của việc sử dụng ý kiến Chuyên gia được công ty RAND Corporation Công ty này đã phát triển hai phương pháp suy luận Chuyên gia quan trọng được sử dụng rộng rãi là phương pháp Delphi và phương pháp phân tích bối cảnh

Tính chất của suy luận Chuyên gia, những ưu điểm và nhược điểm của suy luận Chuyên gia:

Ý kiến Chuyên gia được suy luận và phân tích khi:

1 Các dữ liệu thu thập ít và khó phân tích Đôi khi dữ liệu thu thập được lại không thể hiện được bản chất cần quan tâm

Trang 22

2 Việc thu thập dữ liệu quá tốn kém

3 Dữ liệu bị ảnh hưởng bởi quá nhiều yếu tố, kết quả thu được khó hội tụ và không chắc chắn

4 Mô hình để phân tích dữ liệu không có tác dụng;

5 Cần phải thực hiện chương trình nền tảng để tìm ra được kiến thức nào sẽ được sử dụng cho bài toán đặt ra và tài liệu liên quan đến thông tin như dữ liệu và kiến thức nền tảng

Ưu điểm và nhược điểm của suy luận Chuyên gia

Ưu điểm:

• Đây là phương pháp ít tốn kém

• Phương pháp cho kết quả nhanh

• Dựa vào hiểu biết và kinh nghiệm của con người

Khuyết điểm:

• Một hay nhiều thành viên có thể làm làm ảnh hưởng đến nhóm quyết định

• Chuyên gia đôi khi cũng phạm sai lầm

Nhận định của Chuyên gia có thể được thể hiện thành 2 dạng:

- Dạng số lượng: có thể được thể hiện như là giá trị xác suất, tần suất, những giá trị ước tính không chắc chắn, những yếu tố trọng tâm và các giá trị có tính vật lý (như thời gian, chiều dài, cân nặng,…)

- Dạng chất lượng: Một mô tả văn bản của các giả thuyết của Chuyên gia trong việc dẫn đến việc ước tính, nguyên nhân để chọn lựa hay suy luận ra các dữ liệu chắc chắn để phục vụ cho phân tích các số lượng vật lý quan tâm

2.3 Sử Dụng Ý Kiến Của Chuyên Gia Làm Dữ Liệu:

Khi ý kiến của Chuyên gia thuộc dạng số lượng, nó có thể được xem như là

dữ liệu Nhận định của Chuyên gia mang một số tính chất chung đối với dữ liệu kinh nghiệm đến những nhận định kinh nghiệm

Trang 23

Nhận định của Chuyên gia bị ảnh hưởng bởi phương pháp suy luận của Chuyên gia đó Phương pháp suy luận có ưu điểm là sử dụng kiến thức con người và thêm vào các giải thuật như trợ giúp của bộ nhớ, suy luận liền lạc,

và các thông tin Chuyên gia quan tâm Chọn lựa sai phương pháp suy luận

có thể dẫn đến kết quả sai

Nhận định của Chuyên gia đôi khi không chắc chắn Nhiều Chuyên gia đã quen với việc đưa ra những ước tính không chắc chắn cho những dạng dữ liệu đơn giản

Sự khác biệt cơ bản giữa nhận định của Chuyên gia và dữ liệu kinh nghiệm là nhận định của Chuyên gia là một dạng ý kiến cá nhân của từng Chuyên gia

Khi ý kiến của Chuyên gia được sử dụng như là dữ liệu thì có các đặc tính sau:

1 Ý kiến Chuyên gia có thể được ứng dụng rộng rãi trong nhiều lĩnh vực

2 Những kết quả ước tính của Chuyên gia có thể không độc lập với nhau

3 Thông thường nếu Chuyên gia sử dụng cùng phương pháp đánh giá trong nhiều lần đối với cùng một vấn đề, kết quả thu được không hoàn toàn giống nhau

4 Hầu hết giá trị xác suất chủ quan không giống với tần suất của dữ liệu quan sát

Các tính chất trên là do trên thực tế nhận định của Chuyên gia không có cơ

sở, cấu trúc chắc chắn; do đó phương pháp có cấu trúc rõ ràng có nhiều ưu điểm

2.4 Một Số Phương Pháp Kết Hợp Các Ý Kiến, Suy Luận Của Chuyên gia

2.4.1 Phương Pháp Bayes

Phương pháp Bayes yêu cầu người sử dụng cung cấp giá trị phân bố xác suất tiên nghiệm và xử lý những đánh giá của Chuyên gia bằng cách cập nhập các phân phối này theo lý thuyết Bayes Nhiều phương pháp Bayes đã được đề xuất trong quá khứ, tuy nhiên lại ít được quan tâm và ứng dụng Sau đây chúng ta giới thiệu mô hình của Apostolakis và Mosleh được sử dụng tương đối:

Giả sử có e Chuyên gia đưa ra các giá trị ước tính là x1, x2, …, xe cho đối tượng X chưa biết Người chịu trách nhiệm ra quyết định khởi đầu với mật

Trang 24

độ xuất hiện tiên nghiệm trên X và cập nhập giá trị này với các thông tin do Chuyên gia cung cấp

Công thức Bayes:

p(X ⎢x1, …, xe) = const x p (x1, …, xe ⎢x) p(x)

Nếu các Chuyên gia là độc lập với nhau, công thức trên đơn giản thành nhân các giá trị xác suất có điều kiện Apostolakis và Mosleh đưa ra 2 mô hình, một trong hai mô hình như sau:

(σi-2) và µe+1 = 0

2.4.2 Phương Pháp Tỷ Lệ Vật Lý (Physical scaling models)

Phương pháp này được thiết kế cho việc ước tính các ảnh hưởng quan trọng của các tác nhân vật lý Dữ liệu đầu vào là các số liệu chất lượng được thể hiện theo từng cặp so sánh Việc xắp xếp dữ liệu theo từng cặp như trên là để đánh giá được dữ liệu nào trong 2 dữ liệu ảnh hưởng đến mô hình nhiều hơn Đầu ra là các giá trị xác suất Quá trình chuyển từ dữ liệu số sang dữ liệu xác suất cần phải áp dụng nhiều giả thuyết quan trọng

Với e Chuyên gia, các Chuyên gia phải so sánh từng cặp đối tượng A(1), …, A(t) Các đối tượng này được giả thiết là có thực thông qua các giá trị được cho là thực Mỗi Chuyên gia có một giá trị nội V(i,e) tương ứng với từng A(i)

Một Chuyên gia đánh giá một đối tượng A(i) có khả năng xảy ra hơn đối

Trang 25

V(i,e) > V(j,e)

Xác suất của các Chuyên gia như sau:

) ( ) (

) ( )

, (

j V i V

i V j

i r

+

= với ∑ V(i) =1

Giả sử là các Chuyên gia có quan điểm độc lập với nhau Để giải bài toán này chúng ta sử dụng tỷ lệ các nhận định kinh nghiệm của các Chuyên gia để cực đại hàm tương tự (maximum likelihood) của V(i) Có thể thể hiện hàm likelihood theo phương trình sau:

V(j)}

{V(i)

) (

αVới α(i) là số lần đối tượng A(i) được “ưa thích” hơn đối tượng A(j)

Đặc trưng của biến hạt giống:

- Đo lường các nhận định của các Chuyên gia

- Bảo đảm cho việc kết hợp các ý kiến của Chuyên gia theo hướng tối

ưu, cho kết quả chính xác nhất

- Đánh giá việc kết hợp các ý kiến của các Chuyên gia

Phương pháp cổ điển có các tính chất sau:

- Trọng số của phương pháp cổ điển tỷ lệ với thống kê likelihood và các thông tin

Trang 26

- Phân chia vùng ảnh hưởng quan trọng hơn thông tin, dữ liệu có nhiệm

vụ phân biệt các vùng ảnh hưởng trong đó Chuyên gia nào cho kết quả tốt nhất

- Mỗi Chuyên gia sử dụng các giả thiết xác suất và được đo lường bằng các biến hạt giống Nếu giá trị likelihood thấp hơn điểm cut off, Chuyên gia đó có trọng số bằng không Giá trị của điểm cut off được tính toán để tối ưu hoá sự kết hợp của các ý kiến của các Chuyên gia

2.5 Kết luận

Như vậy chúng ta đã trình bày sơ lược về những ý kiến, nhận định của Chuyên gia và những ảnh hưởng cũng như ưu điểm và nhược điểm của phương pháp Chuyên gia Chúng ta thấy rằng đưa ra kết luận với những dữ liệu không chắc chắn rất phức tạp Điều này dựa vào ý kiến chủ quan của các Chuyên gia Trên thực tế không phải ai cũng có thể là Chuyên gia Thậm chí với một số người có thể có kiến thức Chuyên gia nhưng cũng có thể đưa ra kết quả sai lệch vì không quen xử lý các dạng dữ liệu không quen thuộc Do

đó việc huấn luyện các Chuyên gia rất quan trọng

Việc huấn luyện Chuyên gia phụ thuộc rất nhiều vào phương pháp, cách thức huấn luyện, khối lượng và mức độ phức tạp của việc huấn luyện Số lượng Chuyên gia có thể thay đổi từ 1 đến 20 người trong một mô hình tổng hợp; thời gian đưa ra kết quả có thể từ 1 ngày đến 1 năm

Trang 27

CHƯƠNG 3

MÔ HÌNH MARKOV

ĐỐI VỚI CHUỖI THỜI GIAN

Trang 28

Mô hình Markov được ứng dụng nhiều trong lĩnh vực nhận dạng giọng nói,

trong lĩnh vực sinh học như nhận dạng gene hoặc phân loại protein; xử lý tín

hiệu, xử lý hình ảnh và các ứng dụng khác liên quan đến chuỗi chuyển tiếp

hoặc kết hợp các thành phần, dữ kiện Trong lĩnh vực điện, mô hình Markov

được sử dụng như là một công cụ dự báo giá điện năng với các dữ liệu liên

quan [28] Ngoài ra mô hình Hidden Markov còn được sử dụng phân tích

chuỗi dữ liệu theo thời gian chứa đựng nhiều biến động không tuân theo quy

luật [23], [24], [33]

Trong phần này chúng ta tìm hiểu tổng quát về mô hình Markov và mô hình

Hidden Markov với những thành phần cơ bản

3.1 Mô Hình Markov

Một trong những thông số đặc trưng của mô hình Markov là các ‘state’ Tuỳ

thuộc vào việc xây dựng mô hình Markov với các đối tượng khác nhau thì sẽ

có các ‘state’ khác nhau Ví dụ, khảo sát sự biến đổi của chuỗi dữ liệu theo

thời gian, các ‘state’ sẽ là mức độ phát triển của dữ liệu theo thời gian [33],

với mô hình kết hợp các Chuyên gia, ‘state’ là các mô hình Chuyên gia hay

các mô hình thành phần cần kết hợp [23], [34], hoặc các ‘state’ cũng có thể là

các dữ kiện đầu vào liên quan đến mô hình cụ thể như là tốc độ tăng trưởng,

suy thoái, … trong mô hình dự báo kinh tế [16]

Trong mô hình Markov đơn giản, mỗi quan sát trong chuỗi dữ liệu phụ thuộc

vào phần tử đứng liền phía trước Giả sử một hệ thống bao gồm M ‘state’

-trạng thái - riêng biệt S = {1, 2, 3, 4,… M } Quan sát ở thời điểm t, hệ thống

chuyển từ ‘state’ này sang ‘state’ khác với xác suất p Chúng ta có chỉ số

‘state’ - trạng thái tại thời điểm t là st

Xét trường hợp đơn giản, dự đoán quá trình chuyển đến ‘state’ kế tiếp tương

ứng với quan sát tại thời điểm đó chỉ phụ thuộc vào ‘state’ hiện tại, điều này

có nghĩa là xác suất chuyển ‘state’ p không phụ thuộc vào toàn bộ chuỗi dữ

liệu quan sát trong quá khứ Mô hình này được gọi là mô hình Markov bậc 1:

MM: P(Xt+1 = sk ⎢X1, …, Xt) = P (Xt+1 = sk ⎢Xt) (3.1)

Ví dụ như sử dụng số liệu phụ tải tiêu thụ trong năm nay để dự đoán phụ tải

tiêu thụ trong năm tới mà không quan tâm đến các dữ liệu của các năm trước

nữa Mô hình Markov thể hiện trong công thức sau:

MM: P (X2005 = sk ⎢X2004)

Trang 29

Đối với từng mô hình Markov, các ‘state’ trong mô hình được xác định theo

kinh nghiệm hoặc theo những dữ liệu quan sát trong quá khứ, theo ví dụ trên

như chúng ta có thể có các giả thiết về những thay đổi của phụ tải tiêu thụ

theo từng năm như sau:

Sthay đổi phụ tải tiêu thụ = { + 20%, + 10%, +0%, -10%, -20% };

Với X là dữ liệu dự báo theo thời gian, trong ví dụ trên X là giá trị phụ tải dự

báo theo từng năm

Vì xác suất chuyển từ ‘state’ sang ‘state’ khác không phụ thuộc vào thời gian,

chúng ta có ma trận A thể hiện các xác suất chuyển ‘state’ với các thành

3.2 Dây Chuyền Markov Với Chuỗi Dữ Liệu Theo Thời Gian:

Quan sát ví dụ về sự thay đổi dữ liệu điện năng tiêu thụ theo thời gian, chúng

ta mô hình hoá được 5 ‘state’ đặc trưng cho sự phát triển của chuỗi dữ liệu

theo thời gian thể hiện trong hình 3.1

Trong hình 3.1, các nút 1, 2, 3, 4, 5 thể hiện tốc độ phát triển khác nhau của

điện năng tiêu thụ: { +20%, +10%, +0%, -10%, -20% }

Ví dụ như đánh giá giả thiết quá trình thay đổi của điện năng tiêu thụ trong 6

năm kế tiếp : giảm 10%, không thay đổi, tăng 10%, không thay đổi, không

thay đổi, tăng 20%

Đầu tiên, chúng ta có thể mã hoá các chuyển tiếp đến các ‘state’ mô tả phía

trên là một vector gồm 6 thành phần, mỗi thành phần là một ‘state’ mà dữ

liệu sẽ chuyển tiếp đến: X = { 4, 3, 2, 3, 3, 1 } Giá trị xác suất đánh giá quá

trình chuyển tiếp trên – dây chuyền Markov - được tính như sau:

P ( X ⎢A, π ) = P (4, 3, 2, 3, 3, 1 ⎢A, π )

Trang 30

= P(4) P(3 ⎢4) P(2⎢3) P(3⎢2) P(3⎢3) P(1⎢3) = π4 x a43 x a32 x a23 x a33 x a31

Với A là giá trị xác suất chuyển ‘state’, π là giá trị xác suất chọn ‘state’ đầu tiên của dây chuyền Markov

Trong giá trị A trong hình ví dụ 3.1:

Trang 31

0.400 0.100

0.100

0.200 0.100

0.100

0.100

0.100 0.200

0.200 0.200

0.400 0.400

0.200 0.200

0.200 0.200 0.200

0.100 0.100

Hình 3.1: Mô hình chuyển tiếp của chuỗi dữ liệu theo quy luật dây chuyền Markov Mỗi nút thể hiện một ‘state’ Các giá trị trên các nhánh là xác suất chuyển từ ‘state’ này sang ‘state’ khác

Một cách tổng quát, xác suất đánh giá quá trình của một vector bao gồm T bước chuyển ‘state’ X = {X1, … , XT } được tính như sau:

P ( X ⎢A, π ) = P(X1) P(X2⎢X1) P(X3⎢X1, X2)…P(XT⎢X1,…, XT-1) = P(X1) P(X2⎢X1) P(X3⎢X2)…P(XT⎢XT-1)

t

t X X

3.3 Mô Hình Hidden Markov

Mô hình Markov mô tả trong phần trước có những hạn chế trong nhiều ứng dụng như các giá trị chuyển ‘state’ là các giá trị áp đặt sẵn, không thay đổi trong khi dữ liệu, đối tượng quan sát luôn biến đổi theo thời gian Để khắc phục tình trạng này, chúng ta sử dụng mô hình Hidden Markov (Hidden

Trang 32

Markov Model - HMM) Trong mô hình HMM, chúng ta không thể biết được quá trình chuyển ‘state’ theo chuỗi dữ liệu

Thay vì thể hiện quá trình thay đổi của chuỗi dữ liệu theo các trạng thái đầu

ra định sẵn, ví dụ như điện năng tiêu thụ sẽ có xu hướng tăng 20%, tăng

10%, không tăng, giảm 10%, giảm 20% trong các mốc thời gian kế tiếp, mỗi

‘state’ của HMM tương ứng với một hàm xác suất Tại thời điểm t, một dữ liệu quan sát ot sẽ có giá trị xác suất bj(ot) xuất hiện dữ liệu ot trong ‘state’ j :

bj(ot) = P(ot ⎢Xt = j ) (3.5) Hình 3.2 thể hiện một ví dụ HMM về một mô hình dự báo điện năng theo

nhiều chiến lược do nhiều Chuyên gia vạch ra Các ‘state’ của mô hình này

là các chiến lược của các Chuyên gia Vector ( +20%, +10%, +0%, 10%,

-20% ) thể hiện sự thay đổi dự kiến của chuỗi, được gọi là mẫu – symbol Giả

sử mỗi Chuyên gia có đánh giá về sự thay đổi điện năng với từng mức độ khác nhau; điện năng kỳ tiếp theo sẽ rơi vào một trong năm ‘symbol’ trên, và

mô hình chỉ cho kết quả theo một ‘state’ thích hợp tại mỗi thời điểm – ‘state’ được chọn

Như vậy đánh giá xác suất như thế nào nếu giả thiết dự báo thay đổi điện

năng trong 2 kỳ quan sát kế tiếp là { -10%, +10% } và sử dụng chiến lược 2

– ‘state’ 2, là chiến lược khởi đầu?

Để tính giá trị xác suất của quá trình biến đổi điện năng nêu trên, chúng ta quan sát ví dụ trên theo quan điểm Markov, mỗi ‘state’ của mô hình đều được kết nối với nhau bằng giá trị xác suất aij Quan sát bảng 3.2 thể hiện các nhận định của các Chuyên gia về các quá trình phát triển của chuỗi điện năng với 5 symbol trên, các nhận định này thể hiện dưới dạng xác suất và chỉ được các Chuyên gia quản lý

Trang 33

1 2 3 4 5

+20% 10% 15% 5% 40% 20% +10% 40% 30% 5% 30% 20% +0% 20% 30% 20% 20% 20% -10% 15% 15% 40% 5% 20% -20% 15% 10% 30% 5% 20%

Bảng 3.2: Thể hiện nhận xét của Chuyên gia về các sự biến đổi của điện năng

Không như mô hình dây chuyền Markov, mô hình HMM sẽ lấy một chiến lược – ‘state’ làm state khởi đầu – state sẽ bao gồm các đánh giá của Chuyên gia về các thay đổi có thể xảy ra của dữ liệu quan sát Như vậy chúng ta nhận thấy được mức độ linh động của mô hình HMM so với mô hình Markov thông thường - chỉ sử dụng một chiến lược trong suốt quá trình thay đổi chuỗi dữ liệu

Symbol

Chiến lược

Trang 34

1 2 3

Hình 3.3 : “mắt cáo” chuyển ‘state’ theo mô hình HMM, mỗi ‘state’ thái ứng với một chiến lược khác nhau

Đánh giá sự thay đổi dữ liệu theo mô hình HMM:

1 Chọn các giá trị khởi đầu: ‘state’ đầu tiên trong chuỗi chuyển tiếp

‘state’: X1= i tương ứng với giá trị xác suất chọn ‘state’ khởi đầu

Π Trong ví dụ trên, nếu như chọn chiến lược 2 là chiến lược khởi đầu: X1 = 2 Với nhận định điện năng sẽ tăng 10% ở thời đoạn đầu tiên, thì giá trị xác suất đánh giá nhận định trên của chiến lược 2 là 30% theo bảng vẽ 3.2

2 Tính xác suất của quá trình biến đổi đối tượng theo ‘symbol’ tương ứng với từng ‘state’ Ví dụ, tại thời điểm hiện tại, dữ liệu quan sát đang ở ‘state’ i, xác suất thể hiện biến đổi của đối tượng ở thời đoạn kế tiếp với ‘state’ j là bij(ot)

Theo ví dụ cụ thể trên, giả sử xác suất điện năng bước kế tiếp sẽ

tăng 20% là 15% nếu như chúng ta đang ở chiến lược 2

3 Chuyển tiếp sang ‘state’ kế tiếp Xt+1, tuân theo xác suất chuyển trạng thái aij

Trang 35

4 Tăng thời gian lên t = t +1, nếu t < T trở lại bước 2, nếu t > T, kết thúc – với T là chiều dài chuỗi quan sát để tính mô hình HMM

Như vậy để trả lời cho câu hỏi đánh giá xác suất của chuyển tiếp điện năng {-10%, +10%} ở hai kỳ quan sát kế tiếp nếu đang sử dụng chiến lược 2 làm chiến lược khởi đầu như sau:

P(X={-10%, +10%}| HMM) = 0.15 + 0.1x0.4 + 0.2x0.3 + 0.3x0.5 + 0.2x0.2 P(X={-10%, +10%}| HMM) = 0.365

3.4 Dạng Tổng Quát Của Mô Hình HMM

Một mô hình HMM bao gồm 5 thông số (S, K, Π, A, B)

• S = { 1, …., T } là chuỗi các ‘state’ đối với đối tượng quan sát ‘State’ tại thời điểm t là st , T là chiều dài của chuỗi quan sát Ví dụ như mô hình HMM dự báo điện năng ở trên sẽ sử dụng lần lượt chiến lược 1, chiến lược 4, chiến lược 3 trong 3 kỳ dự báo tiếp theo: S = {1, 4, 3}

• K = { k1, …, kM } là giá trị đầu ra K thể hiện các khả năng có thể xảy

ra của chuỗi quan sát, chuỗi quan sát sẽ có thể biến đổi theo M phương thức thay đổi thể hiện trong K Trong ví dụ trên M là số symbol thể

hiện các thay đổi có thể xảy ra của chuỗi điện năng {+20%, +10%,

• Xác suất của dữ liệu quan sát đối với từng ‘state’ trong mô hình

B = bj(ot) Giá trị xác suất dữ liệu ot sẽ thuộc ‘state’ j tại thời điểm t là:

bj(ot) = P(ot ⎢st = j ) (3.8) Sau khi thành lập mô hình HMM, có thể tính toán xác suất một chu trình biến đổi của dữ liệu quan sát (ví dụ như tính khả năng điện năng trong thời kỳ kế tiếp: tăng 20%, tăng 10%, tăng 10%) Ngoài ra, chúng ta cũng có thể huấn luyện các thông số của mô hình (A, B, Π) theo chuỗi dữ liệu quan sát để thu được mô hình chính xác hơn

Trang 36

3.5 Các Bài Toán Cơ Bản Của Mô Hình HMM

Chúng ta có 3 bài toán là 3 vấn đề cơ bản mô hình HMM

1 Cho một mô hình µ = ( A, B, Π ), và chuỗi quan sát O = (o 1 , o 2 , …, o T ),

làm thế nào để đánh giá được mức độ phù hợp của chuỗi quan sát đối

với mô hình µ ? Cụ thể là xác định giá trị P( O⎢µ )

2 Cho mô hình µ và chuỗi quan sát O, tìm chuỗi ‘state’ ẩn S(1, …, N )

phản ánh phù hợp nhất chuỗi quan sát

3 Cho chuỗi quan sát O và mô hình dự báo µ, làm thế nào để hiệu chỉnh

các thông số của mô hình µ = (A, B, Π ) để tìm được mô hình µ tin cậy

nhất đối với chuỗi quan sát – nghĩa là tìm mô hình có giá trị xác suất

P(O ) lớn nhất?

Bài toán đầu tiên được dùng để xác định trong các mô hình HMM đã được

huấn luyện, mô hình nào thích hợp nhất đối với chuỗi quan sát Bài toán thứ

hai được sử dụng để tìm các chuyển tiếp ‘state’ ẩn Bài toán thứ 3 liên quan

đến quá trình huấn luyện mô hình

3.5.1 Xác Định Mô Hình HMM Thích Hợp Nhất

Cho chuỗi dữ liệu quan sát O = (o1, o2, …, oT) và mô hình HMM µ = (A, B,

∏), chúng ta tìm giá trị xác suất P(O | µ)

Giả sử chuỗi quan sát độc lập với nhau theo thời gian, xác suất của một chuỗi

chuyển tiếp ‘state’ theo thời gian S = { s1, …, sT) của dữ liệu quan sát được

P(S ⎢µ) = πs1 as1s2 as2s3 … asT-1sT (3.11) Xác suất kết hợp của O và S:

P(O,S ⎢µ) = P(O ⎢S, µ) P(S ⎢µ) (3.12)

Trang 37

1 sT s

Trong trường hợp dữ liệu quan sát quá dài, các bước tính toán sẽ tăng với tỷ

lệ hàm mũ, cần phải tính toán (2T-1).NT+1 phép tính nhân và NT - 1 bước

phép tính cộng

Để giải quyết vấn đề này, chúng ta sẽ sử dụng các thuật toán forward và

backward

a Thuật toán forward:

Biến forward αi(t) được định nghĩa như sau:

αi(t) chứa tổng các giá trị xác suất sẽ chuyển đến ‘state’ i tại thời điểm t với

chuỗi quan sát o1, o2, …, ot-1 Giá trị αi(t) được tính toán bằng lấy tổng các

xác suất của các chuyển tiếp ‘state’ i

Trang 39

N(N-b Thuật toán backward:

Biến backward βi(t) được định nghĩa như sau:

Trang 40

Thời gian

t+1 t

t-1

Trạng thái

sn

s3 s2 s1

γi(t) = P( st = i ⎢O,µ ) (3.22)

=

) (

) , (

µ

µ

O P

O i s

P t =

Ngày đăng: 16/04/2021, 14:38

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm