Từ đó đưa ra mô hình dự báo theo tiếp cận đại số gia tử trên cơ sở nghiên cứu cải tiến phép ngữ nghĩa hóa Semantization, phép giải nghĩa Desemantization trong mô hình tính toán của ĐSGT
Trang 1LỜI CAM ĐOAN
Tôi xin cam đoan: Luận văn này là công trình nghiên cứu thực sự của
cá nhân, được thực hiện dưới sự hướng dẫn khoa học của TS Vũ Như Lân
Các số liệu, những kết luận nghiên cứu được trình bày trong luận văn này trung thực và chưa từng được công bố dưới bất cứ hình thức nào
Tôi xin chịu trách nhiệm về nghiên cứu của mình
Học viên
Trần Tuấn Anh
Trang 2LỜI CẢM ƠN
Đầu tiên tôi xin gửi lời cảm ơn sâu sắc nhất tới TS Vũ Như Lân, người
đã hướng dẫn khoa học, đã tận tình chỉ bảo, giúp đỡ tôi thực hiện luận văn Tôi xin cảm ơn các thầy cô trường Đại học Công nghệ thông tin và truyền thông - Đại học Thái Nguyên đã giảng dạy và truyền kiến thức cho tôi Tôi xin chân thành cảm ơn bạn bè và đồng nghiệp đã tạo mọi điều kiện giúp đỡ tôi hoàn thành nhiệm vụ học tập
Cuối cùng, tôi xin cảm ơn những người thân và các bạn bè chia sẻ, giúp
đỡ tôi hoàn thành luận văn này
Mặc dù đã hết sức cố gắng hoàn thành luận văn với tất cả sự nỗ lực của bản thân, nhưng luận văn vẫn còn những thiếu sót Kính mong nhận được những ý kiến đóng góp của quý Thầy, Cô và bạn bè, đồng nghiệp
Tôi xin chân thành cảm ơn!
Trang 3
MỤC LỤC
LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
DANH MỤC CÁC KÍ HIỆU, CHỮ VIẾT TẮT vi
DANH LỤC BẢNG vii
DANH LỤC HÌNH VẼ viii
MỞ ĐẦU 1
CHƯƠNG 1: TÓM LƯỢC VỀ LOGIC MỜ, CHUỖI THỜI GIAN MỜ VÀ ĐẠI SỐ GIA TỬ 4
1.1 Những vấn đề cơ sở của lý thuyết tập mờ 4
1.1.1 Định nghĩa tập mờ 4
1.1.2 Các phép toán trên tập mờ 5
1.2 Chuỗi thời gian mờ 10
1.2.1 Định nghĩa chuỗi thời gian mờ 10
1.2.2 Một số định nghĩa liên quan đến chuỗi thời gian mờ 11
1.3 Đại số gia tử 13
1.3.1 Định nghĩa đại số gia tử 13
1.3.2 Các định lý 16
1.4 Kết luận chương 1 18
CHƯƠNG 2: MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ TRÊN QUAN ĐIỂM BIẾN NGÔN NGỮ 20
2.1 Mô hình dự báo chuỗi thời gian mờ của Song và Chissom 20
Trang 42.1.1 Bước 1 Xác định tập nền 21
2.1.2 Bước 2 Chia miền xác định của tập nền thành những khoảng bằng nhau 22
2.1.3 Bước 3 Xây dựng các tập mờ trên tập nền 22
2.1.4 Bước 4 Mờ hóa chuỗi dữ liệu 23
2.1.5 Bước 5 Xác định các quan hệ mờ 23
2.1.6 Bước 6 Dự báo bằng phương trình Ai=Ai 1* R, ở đây ký hiệu * là toán tử max-min 27
2.1.7 Bước 7 Giải mờ các kết quả dự báo 27
2.2 Mô hình dự báo chuỗi thời gian mờ cải tiến của Chen 28
2.2.1 Bước 1 Chia miền xác định của tập nền thành những khoảng bằng nhau 29
2.2.2 Bước 2 Xây dựng các tập mờ trên tập nền 30
2.2.3 Bước 3 Mờ hóa chuỗi dữ liệu 31
2.2.4 Bước 4 Xác định các quan hệ mờ 32
2.2.5 Bước 5 Tạo lập nhóm quan hệ mờ 32
2.2.6 Bước 6 Giải mờ đầu ra dự báo 33
2.3 Mô hình dự báo dựa trên ĐSGT và ứng dụng 37
2.3 1 Mô hình tính toán của lý thuyết đại số gia tử 38
2.3.2 Mô hình dự báo chuỗi thời gian mờ dựa trên ĐSGT 41
2.3.3 So sánh các kết quả của các mô hình dự báo chuỗi thời gian mờ 53 2.4 Kết luận chương 2 55
Trang 5CHƯƠNG 3: CÀI ĐẶT THỬ NGHIỆM 57
3.1 Bài toán thử nghiệm 57
3.1.1 Đặt bài toán 57
3.1.2 Kết quả chạy thử nghiệm 58
3.2 Kết luận chương 3 59
KẾT LUẬN VÀ KIẾN NGHỊ 60
TÀI LIỆU THAM KHẢO 62
PHỤ LỤC 1
Trang 6DANH MỤC CÁC KÍ HIỆU, CHỮ VIẾT TẮT
ĐSGT: Đại số gia tử
Trang 7DANH LỤC BẢNG
Bảng 1.1 : Các cặp T - chuẩn và T - đối chuẩn 8
Bảng 1.2 Một số phép kéo theo mờ thông dụng 9
Bảng 2.1 Số sinh viên nhập học tại trường đại học Alabama từ 1971 đến 1992 20
Bảng 2.2 Chuyển đổi các giá trị lịch sử thành giá trị ngôn ngữ 24
Bảng 2.3 Xác định các quan hệ thành viên 26
Bảng 2.4 Mờ hóa chuỗi dữ liệu 31
Bảng 2.5 Quan hệ logic mờ của dữ liệu tuyển sinh 32
Bảng 2.6 Các nhóm quan hệ logic mờ 33
Bảng 2.7 Bảng so sánh các phương án dự báo 36
Bảng 2.8 Số sinh viên nhập học tại trường đại học Alabama từ 1971 đến 1992 41
Bảng 2.9 Giá trị đầu và giá trị cuối của các khoảng giải nghĩa được chọn 49
Bảng 2.10 Tổng hợp thông tin cơ sở cho mô hình dự báo theo tiếp cận ĐSGT 50
Bảng 2.11 So sánh các phương pháp dự báo với 7 khoảng chia 54
Bảng 3.1 Số sinh viên nhập học tại trường đại học Alabama từ 1971 đến 1992 57
Trang 8DANH LỤC HÌNH VẼ
Hình 1.1 Hàm liên thuộc của tập mờ “x gần 1” 4
Hình 1.2 Một số dạng hàm liên thuộc của tập mờ 5
Hình 1.3 Giao của hai tập mờ 7
Hình 1.4 Phép hợp của hai tập mờ 8
Hình 2.1: Số sinh viên nhập học thực tế và số sinh viên nhập học dự báo 28
Hình 2.2 Dữ liệu tuyển sinh thực tế và dữ liệu tuyển sinh dự báo 37
Hình 3.1 Dữ liệu tuyển sinh của Đại học Alabama từ năm 1971 đến 1992 58
Hình 3.2 Kết quả chạy bài toán thử nghiệm 59
Trang 9MỞ ĐẦU
Trong những năm gần đây, có rất nhiều tác giả trên thế giới quan tâm nghiên cứu mô hình dự báo chuỗi thời gian mờ do Song & Chissom [1, 2, 3] đưa ra trên tạp chí “Fuzzy Sets and Systems” năm 1993 và được Chen [5] cải tiến vào năm 1996 Nhiều nghiên cứu ứng dụng dự báo có giá trị thực tế đã được thực hiện trên cơ sở phương pháp luận dự báo theo mô hình chuỗi thời gian mờ nêu trên Tuy nhiên, độ chính xác của dự báo trên quan điểm xem xét chuỗi thời gian theo tiếp cận mờ của Song & Chissom còn chưa cao do phụ thuộc vào nhiều yếu tố Vì vậy cho đến nay, mô hình dự báo chuỗi thời gian
mờ luôn được nhiều chuyên gia trên thế giới và Việt Nam cải tiến để có được kết quả tốt hơn [9]
Đại số gia tử (ĐSGT) là một tiếp cận mới được các tác giả N.C.Ho và
W Wechler xây dựng vào những năm 1990, 1992 [5, 6] khi đưa ra một mô hình tính toán hoàn toàn khác biệt so với tiếp cận mờ Những ứng dụng của tiếp cận ĐSGT cho một số bài toán cụ thể trong lĩnh vực công nghệ thông tin
và điều khiển đã mang lại một số kết quả quan trọng khẳng định tính ưu việt của tiếp cận này so với tiếp cận mờ truyền thống [8]
Đề tài luận văn là sự tiếp tục những thử nghiệm mới và lần đầu tiên thử nghiệm cho những nghiên cứu ứng dụng ĐSGT cho lĩnh vực dự báo chuỗi
thời gian Đây là lĩnh vực ứng dụng hoàn toàn mới đối với ĐSGT, vì vậy
phương pháp luận của ĐSGT cần có sự nghiên cứu cải tiến khác với trước đây sao cho có khả năng ứng dụng được
Để có thể đánh giá được tính ưu việt của ĐSGT so với phương pháp luận dựa trên tiếp cận mờ, nhiều tác giả đã tiến hành thử nghiệm trên chuỗi dữ liệu đã được sử dụng nhiều ở Việt Nam
Trong luận văn này, trước tiên tôi Tập trung nghiên cứu mô hình
dự báo chuỗi thời gian mờ của Song & Chissom và Chen tìm ra những điểm
Trang 10mạnh và điểm yếu của những mô hình này Từ đó đưa ra mô hình dự báo theo tiếp cận đại số gia tử trên cơ sở nghiên cứu cải tiến phép ngữ nghĩa hóa (Semantization), phép giải nghĩa (Desemantization ) trong mô hình tính toán của ĐSGT sao cho phù hợp với ứng dụng trong lĩnh vực dự báo chuỗi thời gian mờ Trên cơ sở đó, tôi xây dựng chương trình ứng dụng dự báo chuỗi thời gian mờ dựa trên mô hình tính toán của ĐSGT trong việc dự báo kết quả tuyển sinh của trường cao đẳng Công nghiệp Thực phẩm Việt Trì - tỉnh Phú Thọ
1 Đối tượng và phạm vi nghiên cứu
1.1 Đối tượng
Tập trung nghiên cứu mô hình dự báo chuỗi thời gian mờ của Song & Chissom và Chen tìm ra những điểm mạnh và điểm yếu của những mô hình này Từ đó đưa ra mô hình dự báo theo tiếp cận đại số gia tử trên cơ sở nghiên cứu cải tiến phép ngữ nghĩa hóa (Semantization), phép giải nghĩa (Desemantization ) trong mô hình tính toán của ĐSGT sao cho phù hợp với ứng dụng trong lĩnh vực dự báo chuỗi thời gian mờ
1.2 Phạm vi nghiên cứu
- Nghiên cứu mô hình dự báo chuỗi thời gian mờ của Song & Chissom
- Nghiên cứu mô hình dự báo cải tiến của Chen
- Nghiên cứu tiếp cận ĐSGT: Lý thuyết và mô hình tính toán ứng dụng
- Nghiên cứu cải tiến phép ngữ nghĩa hóa và phép giải nghĩa
- Nghiên cứu đề xuất mô hình dự báo chuỗi thời gian mờ theo tiếp cận đại số gia tử với các phép ngữ nghĩa hóa và giải nghĩa đã cải tiến
- Ứng dụng mô hình dự báo mới theo tiếp cận ĐSGT cho chuỗi dữ liệu
đã và đang được sử dụng nhiều ở Việt Nam hiện nay; qua đó so sánh MSE của các mô hình dự báo trên với nhau để có thể thấy rõ hiệu quả của tiếp cận ĐSGT trong bài toán dự báo chuỗi thời gian mờ
Trang 112 Hướng nghiên cứu của đề tài
- Nghiên cứu lôgic mờ: phép mờ hóa, suy luận và giải mờ
- Nghiên cứu chuỗi thời gian trên quan điểm biến ngôn ngữ
- Nghiên cứu cách mô tả chuỗi thời gian theo các giá trị ngôn ngữ
- Nghiên cứu nhóm quan hệ ngữ nghĩa theo tiếp cận ĐSGT
- Nghiên cứu mở rộng phép ngữ nghĩa hóa và phép giải nghĩa của tiếp cân ĐSGT
- Nghiên cứu xây dựng chương trình tính toán trên MATLAB cho bài toán thử nghiệm dự báo chuỗi thời gian mờ theo tiếp cận ĐSGT của trường Đại học Alabama
- Nghiên cứu xây dựng chương trình tính toán trên MATLAB để dự báo chuỗi thời gian mờ theo tiếp cận ĐSGT trong bài toán tuyển sinh tại trường Cao đẳng Công nghiệp Thực phẩm Việt Trì - tỉnh Phú Thọ
Trang 12CHƯƠNG 1: TÓM LƯỢC VỀ LOGIC MỜ, CHUỖI THỜI GIAN
MỜ VÀ ĐẠI SỐ GIA TỬ 1.1 Những vấn đề cơ sở của lý thuyết tập mờ
Ví dụ 1: Hàm liên tục của tập mờ A “tập các số thực gần 1” được
định nghĩa như sau: A(x) = x a ( 1 ) 2
e
Hình 1.1 Hàm liên thuộc của tập mờ “x gần 1”
Ví dụ 2: Một số dạng hàm liên thuộc liên tục khác
Triangle(x, a, b, c) = max(min( , 1 , ), 0 )
b c
x c a b
a x
Trang 13Trapezoid(x, a, b, c ,d) = max(min( , 1 , ), 0 )
c d
x d a b
a x
Định nghĩa 1.1: (Hàm phủ định): Hàm n: [0,1] không tăng thỏa mãn
các điều kiện n(0) = 1, n(1) = 0 được gọi là hàm phủ định (negation function)
Định nghĩa 1.2: (Phần bù của một tập mờ): Cho n là hàm phủ định,
phần bù A c của tập mờ A là một tập mờ với hàm thuộc được xác định bởi:
Ac(x) = n(A(x)), với mỗi x
Trang 14 Phép giao hai tập mờ
Định nghĩa 1.3 ( T - chuẩn): Hàm T: [0,1] 2 [0,1] là phép bội (T -
chuẩn) khi và chỉ khi thoả mãn các điều kiện sau:
1 T(1, x) = x, với mọi 0 x 1
2 T có tính giao hoán : T(x,y) = T(y,x), với mọi 0 x, y 1
3 T không giảm: T(x,y)=T(u,v), với mọi x u, y v
4 T có tính kết hợp: T(x,T(y,z)) = T(T(x,y),z), với mọi 0 x,y, z 1
Định nghĩa 1.4 (Phép giao hai tập mờ): Cho hai tập mờ A, B trên cùng
không gian nền với hàm thuộc A(x), B(x) tương ứng Cho T là một Chuẩn Phép giao của hai tập mờ A,B là một tập mờ (ký hiệu (AT B)) trên
T-với hàm thuộc cho bởi biểu thức:
(AT B)(x) = T(A(x), B(x)), với mỗi x
Ví dụ:
- Với T(x,y)=min(x,y)ta có: (AT B)(x) = min(A(x),B(x))
- Với T(x,y) = x,y ta có (AT B)(x) = A(x).B(x) (tích đại số)
Ta có thể biểu diễn phép giao của hai tập mờ qua hai hàm T(x,y)=min(x,y) và T(x,y) = x.y theo các đồ thị hình 1.3 sau đây:
- Hình a: Hàm thuộc của hai tập mờ A và B
- Hình b: Giao của hai tập mờ theo T(x,y)=min(x,y)
- Hình c: Giao của hai tập mờ theo T(x,y)=x.y
Trang 15Hình 1.3 Giao của hai tập mờ
Định nghĩa 1.5 (T - đối chuẩn): Hàm S:[0,1]2 được gọi là phép tuyển ( T-đối chuẩn) nếu thoả mãn các điều kiện sau:
1 S(0,x) = x, với mọi 0 x 1
2 S có tính giao hoán : S(x,y)= S(y,x) với mọi 0 x , y 1
3 S không giảm: S(x,y)= S(u,v), với mọi x u, y v
4 S có tính kết hợp: S(x,S(y,z)) = S(S(x,y),z) với mọi 0 x, y, z1
Định nghĩa 1.6 (phép hợp hai tập mờ): Cho hai tập mờ A, B trên cùng
không gian nền với hàm thuộc A(x), B(x) tương ứng Cho S là một T - đối chuẩn Phép hợp của hai tập mờ A, B là một tập mờ ( kí hiệu ASB)) trên
với hàm thuộc cho bởi biểu thức:
(ASB)(x)=S(A(x),B(x)), với mỗi x
Ví dụ:
- Với S(x,y) = max(x,y): (AS B)(x)= max(A(x), B(x))
- Với S(x,y) = x + y – x.y: (AS B)(x)= A(x) + B(x) – A(x) B(x)
Trang 16- Ta có thể biểu diễn phép hợp của hai tập mờ qua hai hàm
S(x,y)=max(x,y) và S(x,y)=x+y – x.y theo các đồ thị hình 2.4 sau đây:
- Hình a: Hàm thuộc của hai tập mờ A, B
- Hình b: Hợp của hai tập mờ theo S(x,y) = max(x,y)
- Hình c: Hợp của hai tập mờ theo S(x,y) = x + y – x.y
Hình 1.4 Phép hợp của hai tập mờ
Cho T là T - chuẩn, S là T - đối chuẩn và n là phép phủ định mạnh Khi
đó bộ ba(T, S,n) là bộ ba De Morgan nếu:
n(S(x,y)) = T(n,(x),n(y)) Với phép phủ định n(n-1) = 1- x, chúng ta có một số cặp T-chuẩn và T-
đối chuẩn thoả mãn luật DeMorgan trong sau:
Bảng 1.1 : Các cặp T - chuẩn và T - đối chuẩn
Trang 173 Max(x + y -1, 0) Min(x + y,1)
1 (
)
y x y
) 2 ( )
y x y
x y x H
lS(x,y) = S(T(x,y),n(x))
Bảng 1.2 dưới đây sẽ liệt kê một số phép kéo theo mờ hay được sử dụng nhất
Bảng 1.2 Một số phép kéo theo mờ thông dụng
1 Early Zadeh xy = max(1-x,min(x,y))
Trang 186 Godel
xy = if x y
other y
1
7 Gaines
xy =
y x other if
8 Kleene – Dienes xy = max(1 –x,y)
9 Kleene – Dienes –Lukasiwicz xy = 1- x + y
1.2 Chuỗi thời gian mờ
1.2.1 Định nghĩa chuỗi thời gian mờ
Giả sử U là không gian nền không gian nền này xác định một tập hợp các đối tượng cần nghiên cứu Nếu A là một tập con rõ của U thì ta có thể xác
định chính xác một hàm đặc trưng:
0 nếu x nằm ngoài A
A (x) =
1 nếu x nằm trong A Nhưng với một tập mờ B trong không gian nền U thì phần tử x không
xác định chính xác được Khi đó ta có định nghĩa:
Trang 19A : U [0.1]
A được gọi là hàm thuộc (Membership function) Còn với bất kỳ một phần
tử u nào của A thì hàm A (u) được gọi là độ thuộc của u vào tập mờ A Giả sử Y (t) là chuỗi thời gian (t = 0, 1, 2,…)
U là tập nền chứa các khoảng giá trị của chuỗi thời gian từ nhỏ nhất
A .
u
) (u
A u
) (u
2 2
1.2.2 Một số định nghĩa liên quan đến chuỗi thời gian mờ
Định nghĩa 1: Chuỗi thời gian mờ
Y (t) (t = …0, 1, 2, …) là một tập con của R 1 Y(t) là tập nền trên đó xác định các tập mờ f i (t) F(t) là tập chứa các tập f i (t) (i = 1, 2,…) khi đó ta gọi F(t) là chuỗi thời gian mờ xác định trên tập nền Y(t)
Định nghĩa 2: Quan hệ mờ
Tại các thời điểm t và t-1 có tồn tại một mối quan hệ mờ giữa F(t) và F(t-1) sao cho F(t) = F(t-1) * R(t-1, t) trong đó * là kí hiệu của một toán tử xác định trên tập mờ R(t-1, t) là mối quan hệ mờ Ta cũng có thể kí hiệu mối quan hệ mờ giữa F(t) và F(t-1) bằng F(t-1) F(t)
Trang 20Nếu đặt F(t-1) = A i và F(t) = A j thì ta kí hiệu mối quan hệ logic mờ
giữa chúng như sau: A i A j
Định nghĩa 3: Nhóm quan hệ mờ
Các mối quan hệ logic có thể gộp lại thành một nhóm nếu trong ký hiệu trên, cùng một vế trái sẽ có nhiều mối quan hệ tại vế phải ví dụ nếu ta có các mối quan hệ:
A i A k
A i A m
Thì ta có thể gộp chúng thành nhóm các mối quan hệ logic mờ sau:
A i A k , A m
Định nghĩa 4: Chuỗi thời gian mờ dừng
Giả sử F(t) suy ra từ F(t-1) và F(t) = F(t-1) * R(t-1, t) cho mọi t Nếu R(t-1, t) không phụ thuộc vào t thì F(t) được gọi là chuỗi thời gian mờ dừng,
còn ngược lại ta có chuỗi thời gian mờ không dừng
Định nghĩa 5:
Giả sử F(t) suy đồng thời từ F(t-1), F(t-2),…, F(t-m) m>0 và là chuỗi
thời gian mờ dừng Khi đó ta có phương trình quan hệ mờ sau:
Trang 211 Giải nghĩa các mệnh đề mờ điều kiện
F(U,[0, 1]) Nghĩa là ta mượn cấu trúc tính toán rất phong phú của tập để mô
phỏng phương pháp lập luận của con người thường vẫn được thực hiện trên nền ngôn ngữ tự nhiên
Vậy một vấn đề đặt ra là liệu bản thân ngôn ngữ có cấu trúc tính toán không? Nếu có thì các phương pháp lập luận xây dựng trên đó đem lại những lợi ích gì? Thông qua lý thuyết về đại số gia tử ta có thể thấy rằng tập các giá trị của một biến ngôn ngữ (biến mà giá trị của nó được lấy trong miền ngôn ngữ) là một cấu trúc đại số đủ mạnh để tính toán
Lý thuyết đại số gia tử đã cố gắng nhúng tập ngôn ngữ vào một cấu trúc đại số thích hợp và tìm cách xem chúng như là một đại số để tiên đề hóa sao cho cấu trúc thu được mô phỏng tốt ngữ nghĩa ngôn ngữ
1.3.1 Định nghĩa đại số gia tử
Xét một tập giá trị ngôn ngữ là miền của biến ngôn ngữ (linguistic
domain) của biến chân lý TRUTH gồm các từ sau:
T = dom(TRUTH) = {true, false, very true, very false, more true, more false, approximately true, approximately false, little true, little false, less true,
Trang 22less false, very more true, very more false, very possible true, very possible
false, very more true, very more false, …}
Khi đó miền ngôn ngữ T = dom(TRUTH) có thể biểu thị như là một cấu trúc đại số AT = (T, G, H, ≤), trong đó:
ƒ T: Là tập cơ sở của AT
ƒ G: Là tập các từ nguyên thủy (tập các phần tử sinh: true, false)
ƒ H: Là tập các toán tử một ngôi, gọi là các gia tử (các trạng từ nhấn)
ƒ ≤: Là biểu thị quan hệ thứ tự trên các từ (các khái niệm mờ), nó được “cảm
sinh” từ ngữ nghĩa tự nhiên Ví dụ: dựa trên ngữ nghĩa, các quan hệ thứ tự sau
là đúng: false≤ true, more true ≤ very true, very false ≤ more false, possible true ≤ true, false ≤ possible false, …
Ta luôn giả thiết rằng các gia tử trong H là các toán tử thứ tự, nghĩa là (h H, h: T T), (x T) {hx ≤ x hoặc hx ≥ x}
Hai gia tử h, k H được gọi là ngược nhau nếu (x T) {hx ≤ x khi và chỉ khi kx ≥ x} và chúng được gọi là tương thích nhau nếu (x T) {hx ≤ x khi và chỉ khi kx ≤ x}
Ta ký hiệu h ≥ k nếu h, k tương thích nhau và (x T) {hx ≤ kx ≤ x hoặc hx ≥ kx ≥ x}
Ngoài ra, tập H còn có thể được phân hoạch thành hai tập H+ và H- với các gia tử trong tập H+ hay H- là tương thích nhau, mỗi phần tử trong H+ cũng ngược với bất kỳ phần tử nào trong H- và ngược lại
Giả sử trong tập H+ có phần tử V (ngầm định là very – rất) và trong tập H- có phần tử L (ngầm định là less – ít) là phần tử lớn nhất thì phần tử sinh g
G là dương nếu g ≤ Vg và là âm nếu g ≥ Vg (hoặc g G là âm nếu g ≥ Lg
Trang 23và là âm nếu g ≤ Lg)
Một gia tử h dương (hoặc âm) đối với một gia tử k nếu (x T) {hkx ≤
kx ≤ x hoặc hkx ≥ kx ≥ x} (hoặc (x T) { kx ≤ hkx ≤ x hoặc kx ≥ hkx ≥ x})
T được sinh ra từ G bởi các gia tử trong H Như vậy mỗi phần tử của T
Định nghĩa đại số gia tử:
Một cấu trúc đại số AT = (T, G, H, ≤) với H được phân hoạch thành H+
và H- các gia tử ngược nhau được gọi là một đại số gia tử nếu nó thỏa mãn
Trang 24gia tử h
Định nghĩa trên mới chỉ dựa vào các tính chất ngữ nghĩa và di truyền ngữ nghĩa của ngôn ngữ nhưng đã tạo ra cấu trúc đủ mạnh làm cơ sở logic cho lập luận xấp xỉ
Xét đại số gia tử AT có đúng 3 phần tử sinh: dương, âm và một phần tử trung hòa w nằm giữa hai phần tử sinh kia và có tính chất hw = w, với mọi
hH Một phần tử y được gọi là phần tử đối nghịch của phần tử x nếu có tồn tại một biểu diễn của x có dạng x = h n …h 1 g, w ≠ g G, sao cho y = h n …h 1 g’, với w ≠ g’G và g’ ≠ g (nói cách khác: hai phần tử của đại số gia tử được gọi
là đối nghịch nhau nếu chúng có dạng biểu diễn với cùng một dãy các gia tử nhưng phần tử sinh của chúng khác nhau, một cái là dương và một cái là âm)
Đặc biệt phần đối nghịch của w được định nghĩa chính là w Phần tử đối nghịch của x được ký hiệu là –x với chỉ số nếu cần thiết Nhìn chung một phần
tử có thể có nhiều phần tử đối nghịch
Nếu mỗi phần tử của T chỉ có duy nhất một phần tử đối nghịch thì AT
được gọi là đại số gia tử đối xứng Khi đó ta có đặc trưng sau đây
1.3.2 Các định lý
Định lý 1: Một đại số gia tử AT là đối xứng nếu với mọi x, x là điểm
dừng khi và chỉ khi –x cũng là điểm dừng
Định lý trên chứng tỏ rằng đại số gia tử đối xứng, dù chỉ dựa trên các tính chất tự nhiên của khái niệm ngôn ngữ cũng có những tính chất rất quan trọng và đủ phong phú để xây dựng và phát triển một cơ sở logic cho lập luận xấp xỉ Rõ ràng nó sẽ là một logic không kinh điển (non-classical logic)
Ngoài ra có thể thấy rằng tập G là đại số gia tử đối xứng con của AT và nó
thỏa mãn các tính chất của đại số cho logic 3-trị Với những lý do đó có thể
Trang 25xem mỗi một đại số gia tử đối xứng là một cơ sở đại số cho một logic các giá
trị ngôn ngữ Định lý tiếp theo nói về mối quan hệ với miền [0, 1]
Định lý 2: Nếu tập các toán tử (gia tử) H+ và H- có quan hệ thứ tự sắp
xếp tuyến tính thì có tồn tại một đẳng cấu từ đại số gia tử đối xứng AT = (T,
G, H, -, , , , ≤) vào cấu trúc logic đa trị tựa trên đoạn [0, 1] sao cho:
(1) Bảo toàn quan hệ thứ tự
(2) (u v) = max{(u), (u v)} = min{(u), (v)}
(3) (u v) = max{1-(u), (v)} và (-u) = 1-(u)
Cần lưu ý rằng cấu trúc logic đa trị tựa trên đoạn [0, 1] là cơ sở để xây
dựng và phát triển logic mờ và lập luận mờ Vì vậy sự “tương đồng” dựa trên định lý trên chứng tỏ thêm giá trị của cách tiếp cận đại số này
Định lý 3: Có tồn tại một hệ tiên đề hoá sao cho mỗi miền ngôn ngữ AT
của biến ngôn ngữ trở thành dàn đầy đủ (complete lattice) có một phần tử 0, một phần tử đơn vị 1 và một phần tử trung hoà Như vậy phép tuyển và hội
logic có thể định nghĩa được trong cấu trúc này Hơn nữa, nếu AT là một
đại số gia tử đối xứng thì trong cấu trúc đó ta có thể định nghĩa phép phủ định –, phép kéo theo và ta có:
Trang 26(7)xy = –x–y
(8)x(yz) = y(xz)
(9)xy ≥ x’y’ khi và chỉ khi x≤x’ và/hoặc y≥y’
(10) 1x = x, x1 = 1, 0x = 1 và x0 = –x
(11) xy ≥ w khi và chỉ khi hoặc x≤w hoặc y≥w
(12) xy ≤ w khi và chỉ khi hoặc y≤w hoặc x≥w
(13) xy = 1 khi và chỉ khi hoặc x=0 hoặc y=1
Các kết quả mở rộng đối với các toán tử sup, inf, gọi là đại số gia tử mở rộng đối xứng, đồng thời mịn hoá đại số gia tử, đưa thêm các toán tử hoặc, và liên kết các gia tử tạo thành các gia tử mới Nhưng vấn đề tiếp tục này được quan tâm ở đây là trong các ví dụ trên thường đề cập đến biến chân lý, có miền giá trị được sắp xếp thứ tự khá rõ, trong khi với các khái niệm ngôn ngữ
mà con người tiếp xúc hàng ngày thì không được như vậy Hoặc bản thân một
số gia tử như có thể, ít nhiều, xấp xỉ cũng không sánh được với nhau, trong khi suy luận rất cần sự sắp xếp đó
1.4 Kết luận chương 1
Chương này chủ yếu giới thiệu các khái niệm cơ bản về tập mờ, chuỗi thời gian mờ và đại số gia tử Tiếp cận ĐSGT là tiếp cận khác biệt so với tiếp cận mờ và đã có một số ứng dụng thể hiện rõ tính đột phá trong một số lĩnh vực công nghệ của tiếp cận này so với tiếp cận mờ truyền thống Có thể kể đến một số lĩnh vực ứng dụng có hiệu quả như điều khiển và công nghệ thông tin Bên cạnh đó, ĐSGT cũng cần được nghiên cứu cho một lĩnh vực ứng dụng mới, đó là bài toán dự báo chuỗi thời gian mờ
Trang 27Dự báo chuỗi thời gian mờ là một hướng nghiên cứu hoàn toàn mới Trên thực tế, những dữ liệu thu được theo thời gian thường chịu ảnh hưởng của các yếu tố khách quan và chủ quan Chính vì vậy xem xét chuỗi thời gian trên tiếp cận ĐSGT là rất cần thiết
Trang 28CHƯƠNG 2: MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ TRÊN
QUAN ĐIỂM BIẾN NGÔN NGỮ 2.1 Mô hình dự báo chuỗi thời gian mờ của Song và Chissom
Bài toán đặt ra là: xây dựng chương trình để áp dụng mô hình dự báo dựa trên ĐSGT trong bài toán thử nghiệm dự báo kết quả số sinh viên nhập học tại trường Đại học Alabama đã được đưa trong bảng sau
Bảng 2.1 Số sinh viên nhập học tại trường đại học Alabama từ 1971 đến
Trang 291981 16388 1992 18876
Trong phần này, tôi trình bày khái niệm và phương pháp dự báo của
chuỗi thời gian mờ được Song et al và Chissom đưa ra để xây dựng thuật
toán dự báo cho chuỗi thời gian Từ đó trình bày ứng dụng dự báo dữ liệu tuyển sinh từ năm 1971 đến 1990 [1,2,3] của trường đại học Alabama
Giả sử U là không gian nền: U = u1,u2, ,un Tập A là mờ trên không gian nền U nếu A được xác định bởi hàm:
A : U [0.1]
A được gọi là hàm thuộc (Membership function) Còn với bất kỳ một phần tử
u nào của A thì hàm A (u) được gọi là độ thuộc của u vào tập mờ A.[3]
Tập mờ A trên không gian nền U được viết như sau:
2.1.1 Bước 1 Xác định tập nền
Đầu tiên phải tìm số sinh viên nhập học thấp nhất và cao nhất theo dữ
liệu lịch sử Từ đó xác định không gian U với các giá trị [D min - D 1 , D max +
D 2 ] mà D 1 và D 2 là hai số dương thích hợp Với dữ liệu tuyển sinh của các
trường đại học từ năm 1971 đến năm 1992 với D min = 13055 và D max = 19328
Để đơn giản, ta chọn D1 = 55 và D2 = 672 Như vậy, không gian là khoảng thời gian U = [13000, 20000]
n
n A A
A
u
u u
u u
u
2 2 1
Trang 302.1.2 Bước 2 Chia miền xác định của tập nền thành những khoảng bằng nhau
Phân vùng không gian U chia thành 7 khoảng bằng nhau u 1 , u 2 , u 3 , u 4 ,
u 5 , u 6 và u 7 trong đó u l =[13000, 14000], u 2 = [14000, 15000], u 3 = [15000, 16000], u 4 = [16000, 17000], u 5 = [17000, 18000], u 6 =[18000, 19000] và u 7
= [19000, 20000]
2.1.3 Bước 3 Xây dựng các tập mờ trên tập nền
Đầu tiên, xác định một số giá trị ngôn ngữ Trong bài toán dự báo số sinh viên nhập học tại trường Đại học Alabama, Song và Chinsom và sử
dụng các giá trị ngôn ngữA 1 = (not many), A 2 = (not too many), A 3 = (many), A 4 =(many many), A 5 = (very many), A 6 = (too many), and A 7
= (too many many) Không hạn chế về số lượng của các tập mờ xác định Tiếp theo, xác định các tập mờ trên U Tất cả các tập mờ sẽ được dán nhãn bởi các giá trị ngôn ngữ có thể Trong [2], u 1 , u 2 và u 7 được chọn làm các
yếu tố của mỗi tập mờ Xác định các thành viên của u l , u 2 , , và u 7 đối với
mỗi A i (i = 1, , 7), để đưa ra đánh giá với mỗi u k (k = 1 , 7) thuộc A i Nếu
u k thuộc hoàn toàn về A i thì các thành viên sẽ bằng 1; nếu tất cả u k không
thuộc về A i , các thành viên sẽ là 0; ngược lại chọn một trong số các giá trị thuộc khoảng (0, 1) là mức độ mà u k thuộc về A i Như vậy, tất cả các tập mờ
A i (i = 1, , 7) được thể hiện như sau:
Trang 31A 6 = {u 1 /0, u 2 /0, u 3 /0, u 4 /0, u 5 /0.5, u 6 /1, u 7 /0.5},
A 7 = {u 1 /0, u 2 /0, u 3 /0, u 4 /0, u 5 /0, u 6 /0.5, u 7 /1},
trong đó u i (i = 1, , 7) là các phần tử và các số dưới đây '/' là thành viên của u để A j (j= 1, , 7) Để đơn giản, ta sử dụng A 1 , A 2 , , A 7 là vectơ hàng tương ứng (2.1)
2.1.4 Bước 4 Mờ hóa chuỗi dữ liệu
Mờ hóa chuỗi dữ liệu tức là tìm ra một tập mờ tương đương với tập
số sinh viên nhập học mỗi năm
Các phương pháp thường được sử dụng là để xác định tập cắt cho
từng A i (i = 1, , 7) Nếu vào năm t, số sinh viên nhâp học nằm trong tập cắt của A k , sau đó số sinh viên nhâp học trong năm là A k Vấn đề với phương
pháp này là có khả năng số sinh viên nhâp học tại năm t có thể nằm trong
nhiều hơn một tập cắt Để tránh điều này, có thể dùng một phương án khác
Thay vì xác định bộ cắt, ta xác định mức độ của mỗi năm học thuộc từng A i (i= 1 7) Quá trình này cũng giống như xác định các phần tử từ u i đến A j
trong Bước 3 Các tập mờ tương đương với khả năng tuyển sinh mỗi năm
được thể hiện trong Bảng 2.1 và mỗi tập mờ có 7 phần tử
2.1.5 Bước 5 Xác định các quan hệ mờ
Xây dựng mô hình dự báo từ Bảng 2.1 về sự tăng trưởng của số sinh viên nhập học trong trường đại học Giả sử đánh giá định tính tuyển sinh của
một năm nào đó là A k Ví dụ, năm 1982, dữ liệu tuyển sinh của năm 1982 là
A 3, hoặc many, tiếp tục định tính hóa tương tự cho các năm khác Như vậy, có thể chuyển đổi các dữ liệu lịch sử định lượng vào định tính, tức là giá trị ngôn ngữ với giá trị hàm thuộc nào đó
Trang 32Bảng 2.2: Chuyển đổi các giá trị lịch sử thành giá trị ngôn ngữ
Trang 33Trên cơ sở số sinh viên nhập học trong hai năm liên tiếp, phát triển
các mối quan hệ logic như "Nếu số sinh viên nhập học năm i là A k, thì của
năm i + 1 là A j ", tiếp tục như vậy cho đến hết Sử dụng các kí hiệu của Song
và Chissom, ta có thể có được tất cả các mối quan hệ mờ logic từ Bảng 2.1 như sau (Lưu ý: các mối quan hệ nhiều lần được tính chỉ một lần):
A 1 A 1 , A 1A 2 , A 2 A 3 , A 3 A 3 , A 3 A 4 ,
A 4A 4 , A 4A3, A 4 A 6 , A 6A 6 và A 6A 7 (2.2)
Theo định nghĩa chuỗi thời gian mờ bất biến Ta xác định phép toán
' ' của hai vectơ Giả sử C và B là các vectơ hàng của m chiều và D = (d ij ) =
C T B Khi đó các phần tử của ma trận D ở hàng i và cột j được xác định như sau: d ij = min (C i , B j ) (i, j = 1, , m) trong đó C i và B j là phần tử thứ i và j của C và B tương ứng
trong đó R là một ma trận 7 7 và là các phép toán tổ hợp
Trang 34Sử dụng công thức ( 2.3 ), kết quả tính toán :
Bảng 2.3: Xác định các quan hệ thành viên
Sử dụng R, xác định mô hình dự báo:
A i = A i-1 R (2.4) trong đó A i-1 là số sinh viên nhập học của năm i - 1 và A i là số sinh viên dự
báo nhập học của năm i trong tập mờ và ' ' là phép toán 'max-min '
Trang 352.1.6 Bước 6 Dự báo bằng phương trình Ai=Ai 1* R, ở đây ký hiệu * là toán tử max-min
Giả sử biết số sinh viên nhập học của năm t có trong bảng 2.1, dự báo
số sinh viên nhập học của năm t + 1, đặt A i-1 trong (2.4) được ghi tại năm t và
áp dụng công thức (2.4) Khi đó, A i sẽ là dự báo số sinh viên nhập học của
năm t + 1 Từ năm 1972 đến 1991, các kết quả đầu ra dự báo được trình bày
trong bảng 2.2
2.1.7 Bước 7 Giải mờ các kết quả dự báo
Trong nghiên cứu này, người ta đã phát hiện ra rằng các phương pháp trọng tâm không thể dự báo số lượng đạt kết quả theo yêu cầu Do đó, ta sẽ sử dụng một số phương pháp kết hợp Có thể đề xuất một số nguyên tắc để giải thích kết quả dự báo Các nguyên tắc này là:
(1) Nếu đầu ra chỉ có một giá trị , Thì chọn điểm giữa của khoảng thời gian tương ứng với mức đó là giá trị dự báo
(2) Nếu đầu ra có hai hoặc nhiều hơn một giá trị, Thì tổng hợp các trung điểm của các khoảng thời gian liên kết tương ứng là giá trị dự báo
Theo nguyên tắc trên, ta thu được các giá trị dự báo cho số sinhviên nhập học từ năm 1972 đến năm 1991 Các kết quả được liệt kê trong Bảng 2.2
và thể hiện trong hình 2.1 trong đó đường nối liên tục là thực tế tuyển sinh và đường nét đứt là kết quả dự báo Lưu ý rằng không sử dụng các ghi danh dữ liệu của năm 1991 để phát triển các mô hình dự báo Các sai số dự báo dao động từ 0,1% đến 8,7% và các sai số trung bình bình phương là 3.18% Đối với năm 1991, các sai số dự báo là 1,7% Đối với mô hình dự báo trung hạn, sai số trung bình bình phương là 3,18% khá thỏa đáng
Trang 36Hình 2.1: Số sinh viên nhập học thực tế và số sinh viên nhập học dự báo
2.2 Mô hình dự báo chuỗi thời gian mờ cải tiến của Chen
Luật dự báo chuỗi thời gian mờ:
Giả sử dữ liệu của chuỗi thời gian F(t-1) được mờ hoá bằng A j, khi đó,
đầu ra dự báo của F(t) được xác định theo những nguyên tắc sau đây:
1 Nếu tồn tại quan hệ một-một, kí hiệu là A jA k, và mức độ thuộc cao
nhất của A k tại khoảng u k , thì đầu ra dự báo của F(t) là trung điểm của u k
2 Nếu A j là trống, có nghĩa là A j và A j có mức độ thuộc cao nhất tại
khoảng u j , thì đầu ra dự báo là trung điểm của u j
3 Nếu tồn tại quan hệ một - nhiều, kí hiệu là A jA 1 , A 2 , , A n, và mức
độ thuộc cao nhất của A 1 , A 2 , , A n tại các khoảng u 1 , u 2 , , u n tương ứng, thì
đầu ra dự báo được tính bằng trung bình các trung điểm m 1 , m 2 , , m n của u 1,
u 2 , , u n Phương trình dự báo có dạng: (m 1 +m 2 + +m n )/n
Số sinh viên nhập học thực tế
Số sinh viên nhập học dự báo
NĂM
Trang 37Phương pháp của Song và Chissom [4] sử dụng mô hình sau đây để dự báo kết quả tuyển sinh đại học:
A i = A i-1 R (2.4) trong đó A i-1 là số sinh viên nhập học của năm i - 1 và A i là số sinh viên dự
báo nhập học của năm i trong tập mờ và ' ' là phép toán "max-min"; và R là
quan hệ mờ cho thấy mối quan hệ mờ giữa các chuỗi thời gian mờ Tuy nhiên, các dự báo trong phương pháp này đòi hỏi một số lượng tính toán lớn để lấy
được quan hệ R mờ của (2.4), và các phép toán max-min (2.4) sẽ mất rất
nhiều thời gian tính toán khi quan hệ R mờ (2.4) là rất lớn Như vậy, ta phải phát triển một phương pháp mới để dự báo kết quả tuyển sinh của các trường đại học một cách hiệu quả hơn
Trong phần này, chúng tôi trình bày một phương pháp mới của Chen để
dự báo tuyển sinh đại học dựa trên chuỗi thời gian mờ Các dữ liệu lịch sử khi tuyển sinh của trường Đại học Alabama được trình bày trong [5] để minh họa cho quá trình dự báo Phương pháp này hiệu quả hơn so với phương pháp trình bày trong [4] do các thành phần tính toán max- min đơn giản hơn
Thuật toán của Chen bao gồm một số bước sau:
2.2.1 Bước 1 Chia miền xác định của tập nền thành những khoảng bằng nhau
Phân vùng không gian U thành nhiều khoảng thời gian khác nhau Song và nhiều tác giả chia thành 7 khoảng bằng nhau u 1 , u 2 , u 3 , u 4 , u 5 , u 6 và u 7 trong đó u l =[13000, 14000], u 2 = [14000, 15000], u 3 = [15000, 16000], u 4
=4[16000, 17000], u 5 = [17000, 18000], u 6 =[18000, 19000] và u 7 = [19000, 20000]
Trang 382.2.2 Bước 2 Xây dựng các tập mờ trên tập nền
Phân vùng không gian U thành nhiều khoảng thời gian khác nhau Song và nhiều tác giả chia thành 7 khoảng bằng nhau u 1 , u 2 , u 3 , u 4 , u 5 , u 6 và u 7 trong đó u l =[13000, 14000], u 2 = [14000, 15000], u 3 = [15000, 16000], u 4 = [16000, 17000], u 5 = [17000, 18000], u 6 =[18000, 19000] và u 7 = [19000, 20000]
Đặt A 1 , A 2 , , A k là các tập mờ và là các giá trị ngôn ngữ biến "tuyển
sinh" Xác định các tập mờ A 1 , A 2 , , A k trên không gian nền U như sau:
là A k Khi đó, quan hệ logic mờ được tính dựa trên dữ liệu lịch sử mờ khi
tuyển sinh Trong nghiên cứu của Chen [5] sử dụng các ngôn ngữ giá trị
A 1 =(not many), A 2 =(not too many), A 3 = (many), A 4 = (many many),
A 5 = [very many), A 6 = (too many), và A 7 =(too many many)
A 1 = 1/u 1 + 0.5/u 2 + 0/u 3 + 0/u 4 + 0/u 5 + 0/u 6 + 0/u 7 ,
A 2 = 0.5/u l +1/u 2 + 0.5/u 3 + 0/u 4 + 0/u 5 + 0/u 6 + 0/u 7 ,
A 3 = 0/u l + 0.5/u 2 + 1/u 3 + 0.5/u 4 + 0/u 5 + 0/u 6 + 0/u 7 ,
A 4 = 0/u 1 + 0/u 2 + 0.5/u 3 + 1/u 4 + 0.5/u 5 + 0/u 6 + 0/u 7 , (2.7)
A 5 = 0/u 1 + 0/u 2 + 0/u 3 + 0.5/u 4 + 1/u 5 + 0.5/u 6 + 0/u 7 ,