Dự báo chuỗi thời gian mờ theo tiếp cận đại số gia tử

Từ đó đưa ra mô hình dự báo theo tiếp cận đại số gia tử trên cơ sở nghiên cứu cải tiến phép ngữ nghĩa hóa Semantization, phép giải nghĩa Desemantization trong mô hình tính toán của ĐSGT

Trang 1

LỜI CAM ĐOAN

Tôi xin cam đoan: Luận văn này là công trình nghiên cứu thực sự của

cá nhân, được thực hiện dưới sự hướng dẫn khoa học của TS Vũ Như Lân

Các số liệu, những kết luận nghiên cứu được trình bày trong luận văn này trung thực và chưa từng được công bố dưới bất cứ hình thức nào

Tôi xin chịu trách nhiệm về nghiên cứu của mình

Học viên

Trần Tuấn Anh

Trang 2

LỜI CẢM ƠN

Đầu tiên tôi xin gửi lời cảm ơn sâu sắc nhất tới TS Vũ Như Lân, người

đã hướng dẫn khoa học, đã tận tình chỉ bảo, giúp đỡ tôi thực hiện luận văn Tôi xin cảm ơn các thầy cô trường Đại học Công nghệ thông tin và truyền thông - Đại học Thái Nguyên đã giảng dạy và truyền kiến thức cho tôi Tôi xin chân thành cảm ơn bạn bè và đồng nghiệp đã tạo mọi điều kiện giúp đỡ tôi hoàn thành nhiệm vụ học tập

Cuối cùng, tôi xin cảm ơn những người thân và các bạn bè chia sẻ, giúp

đỡ tôi hoàn thành luận văn này

Mặc dù đã hết sức cố gắng hoàn thành luận văn với tất cả sự nỗ lực của bản thân, nhưng luận văn vẫn còn những thiếu sót Kính mong nhận được những ý kiến đóng góp của quý Thầy, Cô và bạn bè, đồng nghiệp

Tôi xin chân thành cảm ơn!

Trang 3

MỤC LỤC

LỜI CAM ĐOAN i

LỜI CẢM ƠN ii

DANH MỤC CÁC KÍ HIỆU, CHỮ VIẾT TẮT vi

DANH LỤC BẢNG vii

DANH LỤC HÌNH VẼ viii

MỞ ĐẦU 1

CHƯƠNG 1: TÓM LƯỢC VỀ LOGIC MỜ, CHUỖI THỜI GIAN MỜ VÀ ĐẠI SỐ GIA TỬ 4

1.1 Những vấn đề cơ sở của lý thuyết tập mờ 4

1.1.1 Định nghĩa tập mờ 4

1.1.2 Các phép toán trên tập mờ 5

1.2 Chuỗi thời gian mờ 10

1.2.1 Định nghĩa chuỗi thời gian mờ 10

1.2.2 Một số định nghĩa liên quan đến chuỗi thời gian mờ 11

1.3 Đại số gia tử 13

1.3.1 Định nghĩa đại số gia tử 13

1.3.2 Các định lý 16

1.4 Kết luận chương 1 18

CHƯƠNG 2: MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ TRÊN QUAN ĐIỂM BIẾN NGÔN NGỮ 20

2.1 Mô hình dự báo chuỗi thời gian mờ của Song và Chissom 20

Trang 4

2.1.1 Bước 1 Xác định tập nền 21

2.1.2 Bước 2 Chia miền xác định của tập nền thành những khoảng bằng nhau 22

2.1.3 Bước 3 Xây dựng các tập mờ trên tập nền 22

2.1.4 Bước 4 Mờ hóa chuỗi dữ liệu 23

2.1.5 Bước 5 Xác định các quan hệ mờ 23

2.1.6 Bước 6 Dự báo bằng phương trình Ai=Ai 1* R, ở đây ký hiệu * là toán tử max-min 27

2.1.7 Bước 7 Giải mờ các kết quả dự báo 27

2.2 Mô hình dự báo chuỗi thời gian mờ cải tiến của Chen 28

2.2.1 Bước 1 Chia miền xác định của tập nền thành những khoảng bằng nhau 29

2.2.2 Bước 2 Xây dựng các tập mờ trên tập nền 30

2.2.3 Bước 3 Mờ hóa chuỗi dữ liệu 31

2.2.4 Bước 4 Xác định các quan hệ mờ 32

2.2.5 Bước 5 Tạo lập nhóm quan hệ mờ 32

2.2.6 Bước 6 Giải mờ đầu ra dự báo 33

2.3 Mô hình dự báo dựa trên ĐSGT và ứng dụng 37

2.3 1 Mô hình tính toán của lý thuyết đại số gia tử 38

2.3.2 Mô hình dự báo chuỗi thời gian mờ dựa trên ĐSGT 41

2.3.3 So sánh các kết quả của các mô hình dự báo chuỗi thời gian mờ 53 2.4 Kết luận chương 2 55

Trang 5

CHƯƠNG 3: CÀI ĐẶT THỬ NGHIỆM 57

3.1 Bài toán thử nghiệm 57

3.1.1 Đặt bài toán 57

3.1.2 Kết quả chạy thử nghiệm 58

3.2 Kết luận chương 3 59

KẾT LUẬN VÀ KIẾN NGHỊ 60

TÀI LIỆU THAM KHẢO 62

PHỤ LỤC 1

Trang 6

DANH MỤC CÁC KÍ HIỆU, CHỮ VIẾT TẮT

ĐSGT: Đại số gia tử

Trang 7

DANH LỤC BẢNG

Bảng 1.1 : Các cặp T - chuẩn và T - đối chuẩn 8

Bảng 1.2 Một số phép kéo theo mờ thông dụng 9

Bảng 2.1 Số sinh viên nhập học tại trường đại học Alabama từ 1971 đến 1992 20

Bảng 2.2 Chuyển đổi các giá trị lịch sử thành giá trị ngôn ngữ 24

Bảng 2.3 Xác định các quan hệ thành viên 26

Bảng 2.4 Mờ hóa chuỗi dữ liệu 31

Bảng 2.5 Quan hệ logic mờ của dữ liệu tuyển sinh 32

Bảng 2.6 Các nhóm quan hệ logic mờ 33

Bảng 2.7 Bảng so sánh các phương án dự báo 36

Bảng 2.9 Giá trị đầu và giá trị cuối của các khoảng giải nghĩa được chọn 49

Bảng 2.10 Tổng hợp thông tin cơ sở cho mô hình dự báo theo tiếp cận ĐSGT 50

Bảng 2.11 So sánh các phương pháp dự báo với 7 khoảng chia 54

Trang 8

DANH LỤC HÌNH VẼ

Hình 1.1 Hàm liên thuộc của tập mờ “x gần 1” 4

Hình 1.2 Một số dạng hàm liên thuộc của tập mờ 5

Hình 1.3 Giao của hai tập mờ 7

Hình 1.4 Phép hợp của hai tập mờ 8

Hình 2.1: Số sinh viên nhập học thực tế và số sinh viên nhập học dự báo 28

Hình 2.2 Dữ liệu tuyển sinh thực tế và dữ liệu tuyển sinh dự báo 37

Hình 3.1 Dữ liệu tuyển sinh của Đại học Alabama từ năm 1971 đến 1992 58

Hình 3.2 Kết quả chạy bài toán thử nghiệm 59

Trang 9

MỞ ĐẦU

Trong những năm gần đây, có rất nhiều tác giả trên thế giới quan tâm nghiên cứu mô hình dự báo chuỗi thời gian mờ do Song & Chissom [1, 2, 3] đưa ra trên tạp chí “Fuzzy Sets and Systems” năm 1993 và được Chen [5] cải tiến vào năm 1996 Nhiều nghiên cứu ứng dụng dự báo có giá trị thực tế đã được thực hiện trên cơ sở phương pháp luận dự báo theo mô hình chuỗi thời gian mờ nêu trên Tuy nhiên, độ chính xác của dự báo trên quan điểm xem xét chuỗi thời gian theo tiếp cận mờ của Song & Chissom còn chưa cao do phụ thuộc vào nhiều yếu tố Vì vậy cho đến nay, mô hình dự báo chuỗi thời gian

mờ luôn được nhiều chuyên gia trên thế giới và Việt Nam cải tiến để có được kết quả tốt hơn [9]

Đại số gia tử (ĐSGT) là một tiếp cận mới được các tác giả N.C.Ho và

W Wechler xây dựng vào những năm 1990, 1992 [5, 6] khi đưa ra một mô hình tính toán hoàn toàn khác biệt so với tiếp cận mờ Những ứng dụng của tiếp cận ĐSGT cho một số bài toán cụ thể trong lĩnh vực công nghệ thông tin

và điều khiển đã mang lại một số kết quả quan trọng khẳng định tính ưu việt của tiếp cận này so với tiếp cận mờ truyền thống [8]

Đề tài luận văn là sự tiếp tục những thử nghiệm mới và lần đầu tiên thử nghiệm cho những nghiên cứu ứng dụng ĐSGT cho lĩnh vực dự báo chuỗi

thời gian Đây là lĩnh vực ứng dụng hoàn toàn mới đối với ĐSGT, vì vậy

phương pháp luận của ĐSGT cần có sự nghiên cứu cải tiến khác với trước đây sao cho có khả năng ứng dụng được

Để có thể đánh giá được tính ưu việt của ĐSGT so với phương pháp luận dựa trên tiếp cận mờ, nhiều tác giả đã tiến hành thử nghiệm trên chuỗi dữ liệu đã được sử dụng nhiều ở Việt Nam

Trong luận văn này, trước tiên tôi Tập trung nghiên cứu mô hình

dự báo chuỗi thời gian mờ của Song & Chissom và Chen tìm ra những điểm

Trang 10

mạnh và điểm yếu của những mô hình này Từ đó đưa ra mô hình dự báo theo tiếp cận đại số gia tử trên cơ sở nghiên cứu cải tiến phép ngữ nghĩa hóa (Semantization), phép giải nghĩa (Desemantization ) trong mô hình tính toán của ĐSGT sao cho phù hợp với ứng dụng trong lĩnh vực dự báo chuỗi thời gian mờ Trên cơ sở đó, tôi xây dựng chương trình ứng dụng dự báo chuỗi thời gian mờ dựa trên mô hình tính toán của ĐSGT trong việc dự báo kết quả tuyển sinh của trường cao đẳng Công nghiệp Thực phẩm Việt Trì - tỉnh Phú Thọ

1 Đối tượng và phạm vi nghiên cứu

1.1 Đối tượng

Tập trung nghiên cứu mô hình dự báo chuỗi thời gian mờ của Song & Chissom và Chen tìm ra những điểm mạnh và điểm yếu của những mô hình này Từ đó đưa ra mô hình dự báo theo tiếp cận đại số gia tử trên cơ sở nghiên cứu cải tiến phép ngữ nghĩa hóa (Semantization), phép giải nghĩa (Desemantization ) trong mô hình tính toán của ĐSGT sao cho phù hợp với ứng dụng trong lĩnh vực dự báo chuỗi thời gian mờ

1.2 Phạm vi nghiên cứu

- Nghiên cứu mô hình dự báo chuỗi thời gian mờ của Song & Chissom

- Nghiên cứu mô hình dự báo cải tiến của Chen

- Nghiên cứu tiếp cận ĐSGT: Lý thuyết và mô hình tính toán ứng dụng

- Nghiên cứu cải tiến phép ngữ nghĩa hóa và phép giải nghĩa

- Nghiên cứu đề xuất mô hình dự báo chuỗi thời gian mờ theo tiếp cận đại số gia tử với các phép ngữ nghĩa hóa và giải nghĩa đã cải tiến

- Ứng dụng mô hình dự báo mới theo tiếp cận ĐSGT cho chuỗi dữ liệu

đã và đang được sử dụng nhiều ở Việt Nam hiện nay; qua đó so sánh MSE của các mô hình dự báo trên với nhau để có thể thấy rõ hiệu quả của tiếp cận ĐSGT trong bài toán dự báo chuỗi thời gian mờ

Trang 11

2 Hướng nghiên cứu của đề tài

- Nghiên cứu lôgic mờ: phép mờ hóa, suy luận và giải mờ

- Nghiên cứu chuỗi thời gian trên quan điểm biến ngôn ngữ

- Nghiên cứu cách mô tả chuỗi thời gian theo các giá trị ngôn ngữ

- Nghiên cứu nhóm quan hệ ngữ nghĩa theo tiếp cận ĐSGT

- Nghiên cứu mở rộng phép ngữ nghĩa hóa và phép giải nghĩa của tiếp cân ĐSGT

- Nghiên cứu xây dựng chương trình tính toán trên MATLAB cho bài toán thử nghiệm dự báo chuỗi thời gian mờ theo tiếp cận ĐSGT của trường Đại học Alabama

- Nghiên cứu xây dựng chương trình tính toán trên MATLAB để dự báo chuỗi thời gian mờ theo tiếp cận ĐSGT trong bài toán tuyển sinh tại trường Cao đẳng Công nghiệp Thực phẩm Việt Trì - tỉnh Phú Thọ

Trang 12

CHƯƠNG 1: TÓM LƯỢC VỀ LOGIC MỜ, CHUỖI THỜI GIAN

MỜ VÀ ĐẠI SỐ GIA TỬ 1.1 Những vấn đề cơ sở của lý thuyết tập mờ

Ví dụ 1: Hàm liên tục của tập mờ A “tập các số thực gần 1” được

định nghĩa như sau: A(x) =  x a (  1 ) 2

e

Hình 1.1 Hàm liên thuộc của tập mờ “x gần 1”

Ví dụ 2: Một số dạng hàm liên thuộc liên tục khác

Triangle(x, a, b, c) = max(min( , 1 , ), 0 )

b c

x c a b

a x



Trang 13

Trapezoid(x, a, b, c ,d) = max(min( , 1 , ), 0 )

c d

x d a b

a x

Định nghĩa 1.1: (Hàm phủ định): Hàm n: [0,1] không tăng thỏa mãn

các điều kiện n(0) = 1, n(1) = 0 được gọi là hàm phủ định (negation function)

Định nghĩa 1.2: (Phần bù của một tập mờ): Cho n là hàm phủ định,

phần bù A c của tập mờ A là một tập mờ với hàm thuộc được xác định bởi:

Ac(x) = n(A(x)), với mỗi x

Trang 14

 Phép giao hai tập mờ

Định nghĩa 1.3 ( T - chuẩn): Hàm T: [0,1] 2  [0,1] là phép bội (T -

chuẩn) khi và chỉ khi thoả mãn các điều kiện sau:

1 T(1, x) = x, với mọi 0  x  1

2 T có tính giao hoán : T(x,y) = T(y,x), với mọi 0  x, y 1

3 T không giảm: T(x,y)=T(u,v), với mọi x  u, y v

4 T có tính kết hợp: T(x,T(y,z)) = T(T(x,y),z), với mọi 0  x,y, z 1

Định nghĩa 1.4 (Phép giao hai tập mờ): Cho hai tập mờ A, B trên cùng

không gian nền  với hàm thuộc A(x), B(x) tương ứng Cho T là một Chuẩn Phép giao của hai tập mờ A,B là một tập mờ (ký hiệu (AT B)) trên 

T-với hàm thuộc cho bởi biểu thức:

(AT B)(x) = T(A(x), B(x)), với mỗi x 

Ví dụ:

- Với T(x,y)=min(x,y)ta có: (AT B)(x) = min(A(x),B(x))

- Với T(x,y) = x,y ta có (AT B)(x) = A(x).B(x) (tích đại số)

Ta có thể biểu diễn phép giao của hai tập mờ qua hai hàm T(x,y)=min(x,y) và T(x,y) = x.y theo các đồ thị hình 1.3 sau đây:

- Hình a: Hàm thuộc của hai tập mờ A và B

- Hình b: Giao của hai tập mờ theo T(x,y)=min(x,y)

- Hình c: Giao của hai tập mờ theo T(x,y)=x.y

Trang 15

Hình 1.3 Giao của hai tập mờ

Định nghĩa 1.5 (T - đối chuẩn): Hàm S:[0,1]2 được gọi là phép tuyển ( T-đối chuẩn) nếu thoả mãn các điều kiện sau:

1 S(0,x) = x, với mọi 0  x  1

2 S có tính giao hoán : S(x,y)= S(y,x) với mọi 0  x , y  1

3 S không giảm: S(x,y)= S(u,v), với mọi x  u, y  v

4 S có tính kết hợp: S(x,S(y,z)) = S(S(x,y),z) với mọi 0  x, y, z1

Định nghĩa 1.6 (phép hợp hai tập mờ): Cho hai tập mờ A, B trên cùng

không gian nền  với hàm thuộc A(x), B(x) tương ứng Cho S là một T - đối chuẩn Phép hợp của hai tập mờ A, B là một tập mờ ( kí hiệu ASB)) trên 

với hàm thuộc cho bởi biểu thức:

(ASB)(x)=S(A(x),B(x)), với mỗi x

Ví dụ:

- Với S(x,y) = max(x,y): (AS B)(x)= max(A(x), B(x))

- Với S(x,y) = x + y – x.y: (AS B)(x)= A(x) + B(x) – A(x) B(x)

Trang 16

- Ta có thể biểu diễn phép hợp của hai tập mờ qua hai hàm

S(x,y)=max(x,y) và S(x,y)=x+y – x.y theo các đồ thị hình 2.4 sau đây:

- Hình a: Hàm thuộc của hai tập mờ A, B

- Hình b: Hợp của hai tập mờ theo S(x,y) = max(x,y)

- Hình c: Hợp của hai tập mờ theo S(x,y) = x + y – x.y

Hình 1.4 Phép hợp của hai tập mờ

Cho T là T - chuẩn, S là T - đối chuẩn và n là phép phủ định mạnh Khi

đó bộ ba(T, S,n) là bộ ba De Morgan nếu:

n(S(x,y)) = T(n,(x),n(y)) Với phép phủ định n(n-1) = 1- x, chúng ta có một số cặp T-chuẩn và T-

đối chuẩn thoả mãn luật DeMorgan trong sau:

Bảng 1.1 : Các cặp T - chuẩn và T - đối chuẩn

Trang 17

3 Max(x + y -1, 0) Min(x + y,1)

1 (

)

y x y

) 2 ( )

y x y

x y x H

lS(x,y) = S(T(x,y),n(x))

Bảng 1.2 dưới đây sẽ liệt kê một số phép kéo theo mờ hay được sử dụng nhất

Bảng 1.2 Một số phép kéo theo mờ thông dụng

1 Early Zadeh xy = max(1-x,min(x,y))

Trang 18

6 Godel

xy =  if x y

other y

1

7 Gaines

xy =

y x other if

8 Kleene – Dienes xy = max(1 –x,y)

9 Kleene – Dienes –Lukasiwicz xy = 1- x + y

1.2 Chuỗi thời gian mờ

1.2.1 Định nghĩa chuỗi thời gian mờ

Giả sử U là không gian nền không gian nền này xác định một tập hợp các đối tượng cần nghiên cứu Nếu A là một tập con rõ của U thì ta có thể xác

định chính xác một hàm đặc trưng:

0 nếu x nằm ngoài A

A (x) =

1 nếu x nằm trong A Nhưng với một tập mờ B trong không gian nền U thì phần tử x không

xác định chính xác được Khi đó ta có định nghĩa:

Trang 19

A : U [0.1]

A được gọi là hàm thuộc (Membership function) Còn với bất kỳ một phần

tử u nào của A thì hàm A (u) được gọi là độ thuộc của u vào tập mờ A Giả sử Y (t) là chuỗi thời gian (t = 0, 1, 2,…)

U là tập nền chứa các khoảng giá trị của chuỗi thời gian từ nhỏ nhất

A .

u

) (u

A u

) (u

2 2

1.2.2 Một số định nghĩa liên quan đến chuỗi thời gian mờ

Định nghĩa 1: Chuỗi thời gian mờ

Y (t) (t = …0, 1, 2, …) là một tập con của R 1 Y(t) là tập nền trên đó xác định các tập mờ f i (t) F(t) là tập chứa các tập f i (t) (i = 1, 2,…) khi đó ta gọi F(t) là chuỗi thời gian mờ xác định trên tập nền Y(t)

Định nghĩa 2: Quan hệ mờ

Tại các thời điểm t và t-1 có tồn tại một mối quan hệ mờ giữa F(t) và F(t-1) sao cho F(t) = F(t-1) * R(t-1, t) trong đó * là kí hiệu của một toán tử xác định trên tập mờ R(t-1, t) là mối quan hệ mờ Ta cũng có thể kí hiệu mối quan hệ mờ giữa F(t) và F(t-1) bằng F(t-1)  F(t)

Trang 20

Nếu đặt F(t-1) = A i và F(t) = A j thì ta kí hiệu mối quan hệ logic mờ

giữa chúng như sau: A i  A j

Định nghĩa 3: Nhóm quan hệ mờ

Các mối quan hệ logic có thể gộp lại thành một nhóm nếu trong ký hiệu trên, cùng một vế trái sẽ có nhiều mối quan hệ tại vế phải ví dụ nếu ta có các mối quan hệ:

A i A k

A i A m

Thì ta có thể gộp chúng thành nhóm các mối quan hệ logic mờ sau:

A i A k , A m

Định nghĩa 4: Chuỗi thời gian mờ dừng

Giả sử F(t) suy ra từ F(t-1) và F(t) = F(t-1) * R(t-1, t) cho mọi t Nếu R(t-1, t) không phụ thuộc vào t thì F(t) được gọi là chuỗi thời gian mờ dừng,

còn ngược lại ta có chuỗi thời gian mờ không dừng

Định nghĩa 5:

Giả sử F(t) suy đồng thời từ F(t-1), F(t-2),…, F(t-m) m>0 và là chuỗi

thời gian mờ dừng Khi đó ta có phương trình quan hệ mờ sau:

Trang 21

1 Giải nghĩa các mệnh đề mờ điều kiện

F(U,[0, 1]) Nghĩa là ta mượn cấu trúc tính toán rất phong phú của tập để mô

phỏng phương pháp lập luận của con người thường vẫn được thực hiện trên nền ngôn ngữ tự nhiên

Vậy một vấn đề đặt ra là liệu bản thân ngôn ngữ có cấu trúc tính toán không? Nếu có thì các phương pháp lập luận xây dựng trên đó đem lại những lợi ích gì? Thông qua lý thuyết về đại số gia tử ta có thể thấy rằng tập các giá trị của một biến ngôn ngữ (biến mà giá trị của nó được lấy trong miền ngôn ngữ) là một cấu trúc đại số đủ mạnh để tính toán

Lý thuyết đại số gia tử đã cố gắng nhúng tập ngôn ngữ vào một cấu trúc đại số thích hợp và tìm cách xem chúng như là một đại số để tiên đề hóa sao cho cấu trúc thu được mô phỏng tốt ngữ nghĩa ngôn ngữ

1.3.1 Định nghĩa đại số gia tử

Xét một tập giá trị ngôn ngữ là miền của biến ngôn ngữ (linguistic

domain) của biến chân lý TRUTH gồm các từ sau:

T = dom(TRUTH) = {true, false, very true, very false, more true, more false, approximately true, approximately false, little true, little false, less true,

Trang 22

less false, very more true, very more false, very possible true, very possible

false, very more true, very more false, …}

Khi đó miền ngôn ngữ T = dom(TRUTH) có thể biểu thị như là một cấu trúc đại số AT = (T, G, H, ≤), trong đó:

ƒ T: Là tập cơ sở của AT

ƒ G: Là tập các từ nguyên thủy (tập các phần tử sinh: true, false)

ƒ H: Là tập các toán tử một ngôi, gọi là các gia tử (các trạng từ nhấn)

ƒ ≤: Là biểu thị quan hệ thứ tự trên các từ (các khái niệm mờ), nó được “cảm

sinh” từ ngữ nghĩa tự nhiên Ví dụ: dựa trên ngữ nghĩa, các quan hệ thứ tự sau

là đúng: false≤ true, more true ≤ very true, very false ≤ more false, possible true ≤ true, false ≤ possible false, …

Ta luôn giả thiết rằng các gia tử trong H là các toán tử thứ tự, nghĩa là (h  H, h: T  T), (x  T) {hx ≤ x hoặc hx ≥ x}

Hai gia tử h, k H được gọi là ngược nhau nếu (x  T) {hx ≤ x khi và chỉ khi kx ≥ x} và chúng được gọi là tương thích nhau nếu (x  T) {hx ≤ x khi và chỉ khi kx ≤ x}

Ta ký hiệu h ≥ k nếu h, k tương thích nhau và (x  T) {hx ≤ kx ≤ x hoặc hx ≥ kx ≥ x}

Ngoài ra, tập H còn có thể được phân hoạch thành hai tập H+ và H- với các gia tử trong tập H+ hay H- là tương thích nhau, mỗi phần tử trong H+ cũng ngược với bất kỳ phần tử nào trong H- và ngược lại

Giả sử trong tập H+ có phần tử V (ngầm định là very – rất) và trong tập H- có phần tử L (ngầm định là less – ít) là phần tử lớn nhất thì phần tử sinh g

 G là dương nếu g ≤ Vg và là âm nếu g ≥ Vg (hoặc g  G là âm nếu g ≥ Lg

Trang 23

và là âm nếu g ≤ Lg)

Một gia tử h dương (hoặc âm) đối với một gia tử k nếu (x  T) {hkx ≤

kx ≤ x hoặc hkx ≥ kx ≥ x} (hoặc (x  T) { kx ≤ hkx ≤ x hoặc kx ≥ hkx ≥ x})

T được sinh ra từ G bởi các gia tử trong H Như vậy mỗi phần tử của T

Định nghĩa đại số gia tử:

Một cấu trúc đại số AT = (T, G, H, ≤) với H được phân hoạch thành H+

và H- các gia tử ngược nhau được gọi là một đại số gia tử nếu nó thỏa mãn

Trang 24

gia tử h

Định nghĩa trên mới chỉ dựa vào các tính chất ngữ nghĩa và di truyền ngữ nghĩa của ngôn ngữ nhưng đã tạo ra cấu trúc đủ mạnh làm cơ sở logic cho lập luận xấp xỉ

Xét đại số gia tử AT có đúng 3 phần tử sinh: dương, âm và một phần tử trung hòa w nằm giữa hai phần tử sinh kia và có tính chất hw = w, với mọi

hH Một phần tử y được gọi là phần tử đối nghịch của phần tử x nếu có tồn tại một biểu diễn của x có dạng x = h n …h 1 g, w ≠ g  G, sao cho y = h n …h 1 g’, với w ≠ g’G và g’ ≠ g (nói cách khác: hai phần tử của đại số gia tử được gọi

là đối nghịch nhau nếu chúng có dạng biểu diễn với cùng một dãy các gia tử nhưng phần tử sinh của chúng khác nhau, một cái là dương và một cái là âm)

Đặc biệt phần đối nghịch của w được định nghĩa chính là w Phần tử đối nghịch của x được ký hiệu là –x với chỉ số nếu cần thiết Nhìn chung một phần

tử có thể có nhiều phần tử đối nghịch

Nếu mỗi phần tử của T chỉ có duy nhất một phần tử đối nghịch thì AT

được gọi là đại số gia tử đối xứng Khi đó ta có đặc trưng sau đây

1.3.2 Các định lý

 Định lý 1: Một đại số gia tử AT là đối xứng nếu với mọi x, x là điểm

dừng khi và chỉ khi –x cũng là điểm dừng

Định lý trên chứng tỏ rằng đại số gia tử đối xứng, dù chỉ dựa trên các tính chất tự nhiên của khái niệm ngôn ngữ cũng có những tính chất rất quan trọng và đủ phong phú để xây dựng và phát triển một cơ sở logic cho lập luận xấp xỉ Rõ ràng nó sẽ là một logic không kinh điển (non-classical logic)

Ngoài ra có thể thấy rằng tập G là đại số gia tử đối xứng con của AT và nó

thỏa mãn các tính chất của đại số cho logic 3-trị Với những lý do đó có thể

Trang 25

xem mỗi một đại số gia tử đối xứng là một cơ sở đại số cho một logic các giá

trị ngôn ngữ Định lý tiếp theo nói về mối quan hệ với miền [0, 1]

 Định lý 2: Nếu tập các toán tử (gia tử) H+ và H- có quan hệ thứ tự sắp

xếp tuyến tính thì có tồn tại một đẳng cấu  từ đại số gia tử đối xứng AT = (T,

G, H, -, , , , ≤) vào cấu trúc logic đa trị tựa trên đoạn [0, 1] sao cho:

(1) Bảo toàn quan hệ thứ tự

(2) (u  v) = max{(u), (u  v)} = min{(u), (v)}

(3) (u  v) = max{1-(u), (v)} và (-u) = 1-(u)

Cần lưu ý rằng cấu trúc logic đa trị tựa trên đoạn [0, 1] là cơ sở để xây

dựng và phát triển logic mờ và lập luận mờ Vì vậy sự “tương đồng” dựa trên định lý trên chứng tỏ thêm giá trị của cách tiếp cận đại số này

 Định lý 3: Có tồn tại một hệ tiên đề hoá sao cho mỗi miền ngôn ngữ AT

của biến ngôn ngữ trở thành dàn đầy đủ (complete lattice) có một phần tử 0, một phần tử đơn vị 1 và một phần tử trung hoà Như vậy phép tuyển  và hội

 logic có thể định nghĩa được trong cấu trúc này Hơn nữa, nếu AT là một

đại số gia tử đối xứng thì trong cấu trúc đó ta có thể định nghĩa phép phủ định –, phép kéo theo  và ta có:

Trang 26

(7)xy = –x–y

(8)x(yz) = y(xz)

(9)xy ≥ x’y’ khi và chỉ khi x≤x’ và/hoặc y≥y’

(10) 1x = x, x1 = 1, 0x = 1 và x0 = –x

(11) xy ≥ w khi và chỉ khi hoặc x≤w hoặc y≥w

(12) xy ≤ w khi và chỉ khi hoặc y≤w hoặc x≥w

(13) xy = 1 khi và chỉ khi hoặc x=0 hoặc y=1

Các kết quả mở rộng đối với các toán tử sup, inf, gọi là đại số gia tử mở rộng đối xứng, đồng thời mịn hoá đại số gia tử, đưa thêm các toán tử hoặc, và liên kết các gia tử tạo thành các gia tử mới Nhưng vấn đề tiếp tục này được quan tâm ở đây là trong các ví dụ trên thường đề cập đến biến chân lý, có miền giá trị được sắp xếp thứ tự khá rõ, trong khi với các khái niệm ngôn ngữ

mà con người tiếp xúc hàng ngày thì không được như vậy Hoặc bản thân một

số gia tử như có thể, ít nhiều, xấp xỉ cũng không sánh được với nhau, trong khi suy luận rất cần sự sắp xếp đó

1.4 Kết luận chương 1

Chương này chủ yếu giới thiệu các khái niệm cơ bản về tập mờ, chuỗi thời gian mờ và đại số gia tử Tiếp cận ĐSGT là tiếp cận khác biệt so với tiếp cận mờ và đã có một số ứng dụng thể hiện rõ tính đột phá trong một số lĩnh vực công nghệ của tiếp cận này so với tiếp cận mờ truyền thống Có thể kể đến một số lĩnh vực ứng dụng có hiệu quả như điều khiển và công nghệ thông tin Bên cạnh đó, ĐSGT cũng cần được nghiên cứu cho một lĩnh vực ứng dụng mới, đó là bài toán dự báo chuỗi thời gian mờ

Trang 27

Dự báo chuỗi thời gian mờ là một hướng nghiên cứu hoàn toàn mới Trên thực tế, những dữ liệu thu được theo thời gian thường chịu ảnh hưởng của các yếu tố khách quan và chủ quan Chính vì vậy xem xét chuỗi thời gian trên tiếp cận ĐSGT là rất cần thiết

Trang 28

CHƯƠNG 2: MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ TRÊN

QUAN ĐIỂM BIẾN NGÔN NGỮ 2.1 Mô hình dự báo chuỗi thời gian mờ của Song và Chissom

Bài toán đặt ra là: xây dựng chương trình để áp dụng mô hình dự báo dựa trên ĐSGT trong bài toán thử nghiệm dự báo kết quả số sinh viên nhập học tại trường Đại học Alabama đã được đưa trong bảng sau

Bảng 2.1 Số sinh viên nhập học tại trường đại học Alabama từ 1971 đến

Trang 29

1981 16388 1992 18876

Trong phần này, tôi trình bày khái niệm và phương pháp dự báo của

chuỗi thời gian mờ được Song et al và Chissom đưa ra để xây dựng thuật

toán dự báo cho chuỗi thời gian Từ đó trình bày ứng dụng dự báo dữ liệu tuyển sinh từ năm 1971 đến 1990 [1,2,3] của trường đại học Alabama

Giả sử U là không gian nền: U = u1,u2, ,un  Tập A là mờ trên không gian nền U nếu A được xác định bởi hàm:

A : U  [0.1]

A được gọi là hàm thuộc (Membership function) Còn với bất kỳ một phần tử

u nào của A thì hàm A (u) được gọi là độ thuộc của u vào tập mờ A.[3]

Tập mờ A trên không gian nền U được viết như sau:

2.1.1 Bước 1 Xác định tập nền

Đầu tiên phải tìm số sinh viên nhập học thấp nhất và cao nhất theo dữ

liệu lịch sử Từ đó xác định không gian U với các giá trị [D min - D 1 , D max +

D 2 ] mà D 1 và D 2 là hai số dương thích hợp Với dữ liệu tuyển sinh của các

trường đại học từ năm 1971 đến năm 1992 với D min = 13055 và D max = 19328

Để đơn giản, ta chọn D1 = 55 và D2 = 672 Như vậy, không gian là khoảng thời gian U = [13000, 20000]

n

n A A

A

u

u u

u

2 2 1

Trang 30

2.1.2 Bước 2 Chia miền xác định của tập nền thành những khoảng bằng nhau

Phân vùng không gian U chia thành 7 khoảng bằng nhau u 1 , u 2 , u 3 , u 4 ,

u 5 , u 6 và u 7 trong đó u l =[13000, 14000], u 2 = [14000, 15000], u 3 = [15000, 16000], u 4 = [16000, 17000], u 5 = [17000, 18000], u 6 =[18000, 19000] và u 7

= [19000, 20000]

2.1.3 Bước 3 Xây dựng các tập mờ trên tập nền

Đầu tiên, xác định một số giá trị ngôn ngữ Trong bài toán dự báo số sinh viên nhập học tại trường Đại học Alabama, Song và Chinsom và sử

dụng các giá trị ngôn ngữA 1 = (not many), A 2 = (not too many), A 3 = (many), A 4 =(many many), A 5 = (very many), A 6 = (too many), and A 7

= (too many many) Không hạn chế về số lượng của các tập mờ xác định Tiếp theo, xác định các tập mờ trên U Tất cả các tập mờ sẽ được dán nhãn bởi các giá trị ngôn ngữ có thể Trong [2], u 1 , u 2 và u 7 được chọn làm các

yếu tố của mỗi tập mờ Xác định các thành viên của u l , u 2 , , và u 7 đối với

mỗi A i (i = 1, , 7), để đưa ra đánh giá với mỗi u k (k = 1 , 7) thuộc A i Nếu

u k thuộc hoàn toàn về A i thì các thành viên sẽ bằng 1; nếu tất cả u k không

thuộc về A i , các thành viên sẽ là 0; ngược lại chọn một trong số các giá trị thuộc khoảng (0, 1) là mức độ mà u k thuộc về A i Như vậy, tất cả các tập mờ

A i (i = 1, , 7) được thể hiện như sau:

Trang 31

A 6 = {u 1 /0, u 2 /0, u 3 /0, u 4 /0, u 5 /0.5, u 6 /1, u 7 /0.5},

A 7 = {u 1 /0, u 2 /0, u 3 /0, u 4 /0, u 5 /0, u 6 /0.5, u 7 /1},

trong đó u i (i = 1, , 7) là các phần tử và các số dưới đây '/' là thành viên của u để A j (j= 1, , 7) Để đơn giản, ta sử dụng A 1 , A 2 , , A 7 là vectơ hàng tương ứng (2.1)

2.1.4 Bước 4 Mờ hóa chuỗi dữ liệu

Mờ hóa chuỗi dữ liệu tức là tìm ra một tập mờ tương đương với tập

số sinh viên nhập học mỗi năm

Các phương pháp thường được sử dụng là để xác định tập cắt cho

từng A i (i = 1, , 7) Nếu vào năm t, số sinh viên nhâp học nằm trong tập cắt của A k , sau đó số sinh viên nhâp học trong năm là A k Vấn đề với phương

pháp này là có khả năng số sinh viên nhâp học tại năm t có thể nằm trong

nhiều hơn một tập cắt Để tránh điều này, có thể dùng một phương án khác

Thay vì xác định bộ cắt, ta xác định mức độ của mỗi năm học thuộc từng A i (i= 1 7) Quá trình này cũng giống như xác định các phần tử từ u i đến A j

trong Bước 3 Các tập mờ tương đương với khả năng tuyển sinh mỗi năm

được thể hiện trong Bảng 2.1 và mỗi tập mờ có 7 phần tử

2.1.5 Bước 5 Xác định các quan hệ mờ

Xây dựng mô hình dự báo từ Bảng 2.1 về sự tăng trưởng của số sinh viên nhập học trong trường đại học Giả sử đánh giá định tính tuyển sinh của

một năm nào đó là A k Ví dụ, năm 1982, dữ liệu tuyển sinh của năm 1982 là

A 3, hoặc many, tiếp tục định tính hóa tương tự cho các năm khác Như vậy, có thể chuyển đổi các dữ liệu lịch sử định lượng vào định tính, tức là giá trị ngôn ngữ với giá trị hàm thuộc nào đó

Trang 32

Bảng 2.2: Chuyển đổi các giá trị lịch sử thành giá trị ngôn ngữ

Trang 33

Trên cơ sở số sinh viên nhập học trong hai năm liên tiếp, phát triển

các mối quan hệ logic như "Nếu số sinh viên nhập học năm i là A k, thì của

năm i + 1 là A j ", tiếp tục như vậy cho đến hết Sử dụng các kí hiệu của Song

và Chissom, ta có thể có được tất cả các mối quan hệ mờ logic từ Bảng 2.1 như sau (Lưu ý: các mối quan hệ nhiều lần được tính chỉ một lần):

A 1 A 1 , A 1A 2 , A 2 A 3 , A 3 A 3 , A 3 A 4 ,

A 4A 4 , A 4A3, A 4 A 6 , A 6A 6 và A 6A 7 (2.2)

Theo định nghĩa chuỗi thời gian mờ bất biến Ta xác định phép toán

' ' của hai vectơ Giả sử C và B là các vectơ hàng của m chiều và D = (d ij ) =

C T  B Khi đó các phần tử của ma trận D ở hàng i và cột j được xác định như sau: d ij = min (C i , B j ) (i, j = 1, , m) trong đó C i và B j là phần tử thứ i và j của C và B tương ứng

trong đó R là một ma trận 7 7 và  là các phép toán tổ hợp

Trang 34

Sử dụng công thức ( 2.3 ), kết quả tính toán :

Bảng 2.3: Xác định các quan hệ thành viên

Sử dụng R, xác định mô hình dự báo:

A i = A i-1 R (2.4) trong đó A i-1 là số sinh viên nhập học của năm i - 1 và A i là số sinh viên dự

báo nhập học của năm i trong tập mờ và ' ' là phép toán 'max-min '

Trang 35

2.1.6 Bước 6 Dự báo bằng phương trình Ai=Ai 1* R, ở đây ký hiệu * là toán tử max-min

Giả sử biết số sinh viên nhập học của năm t có trong bảng 2.1, dự báo

số sinh viên nhập học của năm t + 1, đặt A i-1 trong (2.4) được ghi tại năm t và

áp dụng công thức (2.4) Khi đó, A i sẽ là dự báo số sinh viên nhập học của

năm t + 1 Từ năm 1972 đến 1991, các kết quả đầu ra dự báo được trình bày

trong bảng 2.2

2.1.7 Bước 7 Giải mờ các kết quả dự báo

Trong nghiên cứu này, người ta đã phát hiện ra rằng các phương pháp trọng tâm không thể dự báo số lượng đạt kết quả theo yêu cầu Do đó, ta sẽ sử dụng một số phương pháp kết hợp Có thể đề xuất một số nguyên tắc để giải thích kết quả dự báo Các nguyên tắc này là:

(1) Nếu đầu ra chỉ có một giá trị , Thì chọn điểm giữa của khoảng thời gian tương ứng với mức đó là giá trị dự báo

(2) Nếu đầu ra có hai hoặc nhiều hơn một giá trị, Thì tổng hợp các trung điểm của các khoảng thời gian liên kết tương ứng là giá trị dự báo

Theo nguyên tắc trên, ta thu được các giá trị dự báo cho số sinhviên nhập học từ năm 1972 đến năm 1991 Các kết quả được liệt kê trong Bảng 2.2

và thể hiện trong hình 2.1 trong đó đường nối liên tục là thực tế tuyển sinh và đường nét đứt là kết quả dự báo Lưu ý rằng không sử dụng các ghi danh dữ liệu của năm 1991 để phát triển các mô hình dự báo Các sai số dự báo dao động từ 0,1% đến 8,7% và các sai số trung bình bình phương là 3.18% Đối với năm 1991, các sai số dự báo là 1,7% Đối với mô hình dự báo trung hạn, sai số trung bình bình phương là 3,18% khá thỏa đáng

Trang 36

Hình 2.1: Số sinh viên nhập học thực tế và số sinh viên nhập học dự báo

2.2 Mô hình dự báo chuỗi thời gian mờ cải tiến của Chen

Luật dự báo chuỗi thời gian mờ:

Giả sử dữ liệu của chuỗi thời gian F(t-1) được mờ hoá bằng A j, khi đó,

đầu ra dự báo của F(t) được xác định theo những nguyên tắc sau đây:

1 Nếu tồn tại quan hệ một-một, kí hiệu là A jA k, và mức độ thuộc cao

nhất của A k tại khoảng u k , thì đầu ra dự báo của F(t) là trung điểm của u k

2 Nếu A j là trống, có nghĩa là A j và A j có mức độ thuộc cao nhất tại

khoảng u j , thì đầu ra dự báo là trung điểm của u j

3 Nếu tồn tại quan hệ một - nhiều, kí hiệu là A jA 1 , A 2 , , A n, và mức

độ thuộc cao nhất của A 1 , A 2 , , A n tại các khoảng u 1 , u 2 , , u n tương ứng, thì

đầu ra dự báo được tính bằng trung bình các trung điểm m 1 , m 2 , , m n của u 1,

u 2 , , u n Phương trình dự báo có dạng: (m 1 +m 2 + +m n )/n

Số sinh viên nhập học thực tế

Số sinh viên nhập học dự báo

NĂM

Trang 37

Phương pháp của Song và Chissom [4] sử dụng mô hình sau đây để dự báo kết quả tuyển sinh đại học:

A i = A i-1 R (2.4) trong đó A i-1 là số sinh viên nhập học của năm i - 1 và A i là số sinh viên dự

báo nhập học của năm i trong tập mờ và ' ' là phép toán "max-min"; và R là

quan hệ mờ cho thấy mối quan hệ mờ giữa các chuỗi thời gian mờ Tuy nhiên, các dự báo trong phương pháp này đòi hỏi một số lượng tính toán lớn để lấy

được quan hệ R mờ của (2.4), và các phép toán max-min (2.4) sẽ mất rất

nhiều thời gian tính toán khi quan hệ R mờ (2.4) là rất lớn Như vậy, ta phải phát triển một phương pháp mới để dự báo kết quả tuyển sinh của các trường đại học một cách hiệu quả hơn

Trong phần này, chúng tôi trình bày một phương pháp mới của Chen để

dự báo tuyển sinh đại học dựa trên chuỗi thời gian mờ Các dữ liệu lịch sử khi tuyển sinh của trường Đại học Alabama được trình bày trong [5] để minh họa cho quá trình dự báo Phương pháp này hiệu quả hơn so với phương pháp trình bày trong [4] do các thành phần tính toán max- min đơn giản hơn

Thuật toán của Chen bao gồm một số bước sau:

2.2.1 Bước 1 Chia miền xác định của tập nền thành những khoảng bằng nhau

Phân vùng không gian U thành nhiều khoảng thời gian khác nhau Song và nhiều tác giả chia thành 7 khoảng bằng nhau u 1 , u 2 , u 3 , u 4 , u 5 , u 6 và u 7 trong đó u l =[13000, 14000], u 2 = [14000, 15000], u 3 = [15000, 16000], u 4

=4[16000, 17000], u 5 = [17000, 18000], u 6 =[18000, 19000] và u 7 = [19000, 20000]

Trang 38

2.2.2 Bước 2 Xây dựng các tập mờ trên tập nền

Phân vùng không gian U thành nhiều khoảng thời gian khác nhau Song và nhiều tác giả chia thành 7 khoảng bằng nhau u 1 , u 2 , u 3 , u 4 , u 5 , u 6 và u 7 trong đó u l =[13000, 14000], u 2 = [14000, 15000], u 3 = [15000, 16000], u 4 = [16000, 17000], u 5 = [17000, 18000], u 6 =[18000, 19000] và u 7 = [19000, 20000]

Đặt A 1 , A 2 , , A k là các tập mờ và là các giá trị ngôn ngữ biến "tuyển

sinh" Xác định các tập mờ A 1 , A 2 , , A k trên không gian nền U như sau:

là A k Khi đó, quan hệ logic mờ được tính dựa trên dữ liệu lịch sử mờ khi

tuyển sinh Trong nghiên cứu của Chen [5] sử dụng các ngôn ngữ giá trị

A 1 =(not many), A 2 =(not too many), A 3 = (many), A 4 = (many many),

A 5 = [very many), A 6 = (too many), và A 7 =(too many many)

A 1 = 1/u 1 + 0.5/u 2 + 0/u 3 + 0/u 4 + 0/u 5 + 0/u 6 + 0/u 7 ,

A 2 = 0.5/u l +1/u 2 + 0.5/u 3 + 0/u 4 + 0/u 5 + 0/u 6 + 0/u 7 ,

A 3 = 0/u l + 0.5/u 2 + 1/u 3 + 0.5/u 4 + 0/u 5 + 0/u 6 + 0/u 7 ,

A 4 = 0/u 1 + 0/u 2 + 0.5/u 3 + 1/u 4 + 0.5/u 5 + 0/u 6 + 0/u 7 , (2.7)

A 5 = 0/u 1 + 0/u 2 + 0/u 3 + 0.5/u 4 + 1/u 5 + 0.5/u 6 + 0/u 7 ,

Định dạng
Số trang	77
Dung lượng	852,86 KB