NGUYỄN NGỌC SƠN TIẾP CẬN PHÂN CỤM CHUỖI THỜI GIAN MỜ TRONG DỰ BÁO TUYỂN SINH CỦA TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP VIỆT TRÌ LUẬN VĂN THẠC SĨ MÁY TÍNH HÀ NỘI, 2018... TRƯỜNG ĐẠI HỌC SƯ PHẠM H
Trang 1NGUYỄN NGỌC SƠN
TIẾP CẬN PHÂN CỤM CHUỖI THỜI GIAN MỜ TRONG DỰ BÁO TUYỂN SINH CỦA TRƯỜNG
ĐẠI HỌC CÔNG NGHIỆP VIỆT TRÌ
LUẬN VĂN THẠC SĨ MÁY TÍNH
HÀ NỘI, 2018
Trang 2TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
NGUYỄN NGỌC SƠN
TIẾP CẬN PHÂN CỤM CHUỖI THỜI GIAN MỜ TRONG DỰ BÁO TUYỂN SINH CỦA TRƯỜNG
ĐẠI HỌC CÔNG NGHIỆP VIỆT TRÌ
Chuyên ngành: Khoa học máy tính
Mã số: 8 48 01 01
LUẬN VĂN THẠC SĨ MÁY TÍNH
Người hướng dẫn khoa học: PGS TS Lê Bá Dũng
HÀ NỘI, 2018
Trang 3LỜI CẢM ƠN
Lời đầu tiên em xin được cảm ơn Trường Đại học Sư phạm Hà Nội 2 cùng các Thầy giáo, Cô giáo đã dành sự quan tâm và tạo điều kiện thuận lợi cho tập thể lớp Khoa học máy tính K20 chúng em trong suốt khóa học
Em xin được bày tỏ lòng biết ơn chân thành với thầy giáo PGS TS
Lê Bá Dũng đã tận tình giúp em hoàn thành luận văn Em cũng chân thành
cảm ơn các Thầy giáo Viện Công nghệ thông tin; các Thầy, Cô giáo Trường Đại học Sư phạm Hà Nội 2 đã tham gia giảng dạy, giúp đỡ em trong suốt quá trình học tập tại trường
Tôi xin được gửi lời cảm ơn tới các bạn bè đồng nghiệp nơi tôi công tác
đã tạo điều kiện về thời gian giúp tôi tham gia khóa học, các bạn đồng khóa
và người thân đã cho tôi động lực để hoàn thành luận văn kết thúc khóa học
Do điều kiện thời gian và khả năng hạn chế nên luận văn khó tránh khỏi những thiếu sót, Kính mong các Thầy giáo, Cô giáo và các bạn đồng khóa, đồng nghiệp đóng góp ý kiến để đề tài được hoàn thiện hơn
Trang 4LỜI CAM ĐOAN
Tôi xin cam đoan rằng số liệu và kết quả nghiên cứu trong luận văn này
là trung thực và không trùng lặp với các đề tài khác Tôi cũng xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện luận văn này đã được cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ nguồn gốc
Hà Nội, ngày 02 tháng 12 năm 2018
Tác giả luận văn
Nguyễn Ngọc Sơn
Trang 5LỜI CẢM ƠN i
LỜI CAM ĐOAN ii
MỤC LỤC iii
DANH MỤC HÌNH ẢNH v
DANH MỤC BẢNG BIỂU vi
MỞ ĐẦU 1
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VỀ TẬP MỜ 4
1.1 Khái quát về tập mờ 4
1.1.1 Định nghĩa tập mờ 4
1.1.2 Một số những khái niệm cơ bản 6
1.1.3 Biểu diễn tập mờ 7
1.2 Phép toán trên tập mờ và hệ luật mờ 8
1.2.1 Phần bù của một tập mờ 8
1.2.2 Phép hợp của các tập mờ 9
1.2.3 Phép giao của các tập mờ 10
1.2.4 Tích Descartes của các tập mờ 10
1.2.5 Tính chất của các phép toán trên tập mờ 11
1.2.6 Số mờ 12
1.2.6.1 Khái niệm số mờ 13
1.2.6.2 Dạng số mờ thường dùng 14
1.2.6.3 Biến ngôn ngữ và giá trị ngôn ngữ 15
1.2.7 Hệ luật mờ 16
1.3 Lập luận xấp xỉ trong hệ mờ 16
1.3.1 Logic mờ 16
1.3.2 Quan hệ mờ 17
1.3.2.1 Khái niệm về quan hệ rõ 17
1.3.2.2 Các quan hệ mờ 17
1.3.2.3 Các phép toán quan hệ mờ 18
Trang 61.4 Giải mờ 20
1.4.1 Phương pháp điểm cực đại 20
1.4.2 Phương pháp điểm trọng tâm 22
CHƯƠNG 2: MỘT SỐ THUẬT TOÁN VÀ PHƯƠNG PHÁP TRONG MÔ HÌNH CHUỖI THỜI GIAN MỜ 24
2.1 Chuỗi thời gian mờ 24
2.1.1 Khái niệm chuỗi thời gian 24
2.1.2 Định nghĩa chuỗi thời gian mờ 24
2.1.3 Một số định nghĩa liên quan đến chuỗi thời gian mờ 25
2.2 Một số thuật toán dự báo 26
2.2.1 Thuật toán của Song & Chissom 26
2.2.2 Thuật toán của Chen 27
2.2.3 Mô hình dự báo dựa trên chuỗi thời gian mờ của Jens Rúni Poulsen 29
2.3 Một số phương pháp chia khoảng 32
2.3.1 Phương pháp độ dài dựa trên sự phân bố giá trị 32
2.3.2 Phương pháp độ dài dựa trên giá trị trung bình 33
2.4 Thuật toán phân cụm (K-means) 33
CHƯƠNG 3:ỨNG DỤNG PHÂN CỤM CHUỖI THỜI GIAN MỜ TRONG DỰ BÁO TUYỂN SINH CỦA TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP VIỆT TRÌ 40
3.1 Ứng dụng phương pháp chuỗi thời gian mờ cho dự báo 40
3.2 Tiếp cận phân cụm chuỗi thời gian mờ trong dự báo tuyển sinh 41
3.3 Đánh giá phương pháp 48
KẾT LUẬN 55
TÀI LIỆU THAM KHẢO 56
Trang 7Hình Trang
Hình 1.1 Hàm thuộc A (x) có mức chuyển đổi tuyến tính 5
Hình 1.3 Tập mờ A với miền xác định và miền tin cậy 6
Hình 3.3 Các giá trị dự báo theo mô hình bình quân biến động 52 Hình 3.4 Các giá trị dự báo theo mô hình xu hướng 52 Hình 3.5 Kiểm thử mô hình dự báo trên tập n=100 số liệu giả định 54
Trang 8Bảng Trang
Bảng 3.1 Số liệu tuyển sinh từ năm 2006 - 2017 43
Bảng 3.4 Các giá trị cận trái và cận phải của các cụm 46 Bảng 3.5 Các giá trị tính được từ các cụm 46 Bảng 3.6 Số liệu về các giá trị dự báo qua các năm 47 Bảng 3.7 Phân tích kết quả dự báo qua các tiêu chuẩn 50
Bảng 3.10 Bảng so sánh các thước đo sai số của các mô hình 53
Trang 9MỞ ĐẦU
1 Lý do chọn đề tài
Mô hình chuỗi thời gian được sử dụng như một công cụ hữu hiệu để phân tích và dự báo trong các lĩnh vực kinh tế, xã hội cũng như trong nghiên cứu khoa học [2], [3], [6], [8], [9], [10], [11], [12], [13], [14] Chính do tính hữu dụng của mô hình phân tích chuỗi thời gian, nhiều tác giả đã đề xuất các công cụ để phân tích, dự báo dựa trên mô hình hóa dự báo này Các lớp bài toán dự báo trong các lĩnh vực như tín dụng ngân hàng, thị trường chứng khoán, dự báo mô phỏng các hệ thống điều khiển… có thể giải quyết theo các phương pháp truyền thống [4], [5] như thống kê, quy hoạch tuyến tính,… Phương pháp nghiên cứu chuỗi thời gian mờ được đề xuất có nhiều ưu thế trong việc tuyến tính hóa phân tích dữ liệu, đánh giá và dự báo tương đối chính xác trong một số lĩnh vực [3], [6], [8], [9], [10], [11], [12], [13], [14] Với gợi ý của thầy hướng dẫn đề tài cho luận văn tốt nghiệp, tôi lựa chọn
đề tài: “Tiếp cận phân cụm chuỗi thời gian mờ trong dự báo tuyển sinh của
Trường Đại học Công nghiệp Việt Trì” để tìm hiểu và dự báo nhu cầu học
tập ở bậc đại học tại Trường Đại học Công nghiệp Việt Trì của học sinh THPT sau khi tốt nghiệp
2 Mục đích nghiên cứu
Tìm hiểu tổng quan về Mô hình chuỗi thời gian
Tiếp cận phương pháp phân tích chuỗi thời gian mờ với thuật toán phân cụm K-means
Ứng dụng trong việc tuyến tính hóa phân tích dữ liệu, đánh giá và dự báo tuyển sinh của Trường Đại học Công nghiệp Việt Trì
Trang 103 Nhiệm vụ nghiên cứu
Tìm hiểu tổng quan hệ mờ
Tìm hiểu sâu về các phương pháp khai phá dữ liệu
Tiếp cận mô hình chuỗi thời gian mờ, thuật toán và phương pháp
Nghiên cứu thuật toán phân cụm mờ và ứng dụng
So sánh các phương pháp về ứng dụng chuỗi thời gian mờ
Định hướng nghiên cứu trong tương lai
4 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu
- Tìm hiểu về tập mờ, hệ luật mờ, phân cụm mờ
- Tập trung tìm hiểu, tiếp cận chuỗi thời gian mờ về lý thuyết, cấu trúc,
phương pháp học và hạn chế của nó
- Nắm bắt một số phương pháp tổng hợp và tối ưu để giảm sự không phù hợp giữa dự báo và thực tế, sau đó áp dụng phương pháp để đánh giá để đạt được kết quả tối ưu
Phạm vi nghiên cứu
- Tìm hiểu về mô hình chuỗi thời gian mờ và thuật toán phân cụm mờ để
dự báo số liệu tuyển sinh của Trường Đại học Công nghiệp Việt Trì
- Tìm hiểu, so sánh các phương pháp đánh giá và dự báo
Trang 116 Phương pháp nghiên cứu
Nghiên cứu lý thuyết, thu thập tài liệu, đọc, phân tích, suy luận, tổng hợp
và đề xuất hướng nghiên cứu
Phân tích bài toán và xây dựng mô hình ứng dụng cho một bài toán cụ thể trong thực tiễn
Thu thập số liệu thực tế để thử nghiệm trên mô hình dự báo
7 Bố cục luận văn
Nội dung của luận văn được trình bày trong 3 chương và phần kết luận:
Chương 1: Cơ sở lý thuyết về tập mờ Trình bày những khái niệm, định nghĩa cơ bản về tập mờ cùng các phép toán xác định trên tập mờ, phương pháp lập luận xấp xỉ trong hệ mờ và một số phương pháp giải mờ [1], [2]
Chương 2: Một số thuật toán và phương pháp trong mô hình chuỗi thời gian mờ Trình bày những khái niệm, định nghĩa [1], [2] về tập dữ liệu theo thời gian, mờ hóa dữ liệu chuỗi thời gian cùng một số phương pháp dự báo theo chuỗi thời gian mờ
Chương 3: Ứng dụng phân cụm chuỗi thời gian mờ trong dự báo tuyển sinh của Trường Đại học Công nghiệp Việt Trì Trình bày trình tự các bước cho dự báo chuỗi thời gian mờ [14] dựa trên chuỗi dữ liệu lịch sử thu thập được và áp dụng để kiểm thử giá trị dự báo số lượng tuyển sinh hàng năm
Trang 12CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VỀ TẬP MỜ
1.1 Khái quát về tập mờ
1.1.1 Định nghĩa tập mờ
Trên tập nền X, xác định một tập mờ A là tập các phần tử của có dạng (x, A (x) trong đó x∊ X và A là ánh xạ:
A
: X [0,1]
Ánh xạ A là hàm thuộc hay còn được gọi là hàm liên thuộc (hoặc
hàm thành viên - membership function) của tập mờ A
Trang 13Hình 1.1 Hàm thuộc A (x) có mức chuyển đổi tuyến tính
Hàm thuộc gần đúng của một tập nền (Hình 1.1.) với m 1 = m 2 và m 3 =
Ví dụ 2: X đươc xác định là tập các giá trị trong thang điểm 10 đánh giá
kết quả học tập của học sinh, X = {1, 2, …, 10} Khi đó khái niệm mờ về
năng lực học tập loại giỏi có thể được hiển thị bằng tập mờ B:
Trang 140.19
0.18
9.07
7.06
5.05
3.04
1
B
Với trường hợp các giá trị tập mờ rời rạc ta có thể biểu diễn ở dạng
bảng Như đối với tập mờ B, ta có bảng 1.1:
1.1.2 Một số những khái niệm cơ bản
Miền xác định: Biên giới của tập mờ A, ký hiệu là supp(A), là một tập
rõ gồm các phần tử x thuộc X có mức độ phụ thuộc vào tập mờ A lớn hơn 0
Trang 15Độ cao tập mờ: Độ cao của tập mờ A, ký hiệu: h(A), là mức độ phụ
thuộc cao nhất của phần tử x thuộc X vào tập mờ A
)()
X x
Tập mờ chính tắc: là tập mờ có ít nhất một phần tử x có độ phụ thuộc bằng 1, tức là h(A) = 1
Tập mờ không chính tắc: một tập mờ A với h(A) < 1 được gọi là tập mờ không chính tắc
1.1.3 Biểu diễn tập mờ
Tập mờ A được xác định trên tập nền X là tập các phần tử x∊ X với mức
độ phụ thuộc của mỗi phần tử x vào tập mờ A tương ứng
Có ba phương pháp biểu diễn các tập mờ: phương pháp ký hiệu, phương pháp tích phân, và phương pháp đồ thị:
- Phương pháp ký hiệu: Các phần tử và các thành viên tương ứng được
liệt kê bằng ký hiệu
1
)(
Các biểu thức trên chỉ mang tính hình thức, các phép cộng +, phép tổng
∑ và phép lấy tích phân đều không có nghĩa theo quy ước như trong số học, toán giải tích
Trang 16Tuy nhiên, với cách biểu diễn như vậy sẽ thuận tiện khi định nghĩa và thao tác với các phép tính trên các tập mờ
- Phương pháp đồ thị:
Hình 1.4 Biểu diễn chiều cao của tập mờ
1.2 Phép toán trên tập mờ và hệ luật mờ
Trang 17Một cách tổng quát để tìm hàm thuộc A (x) của tập mờ A từ hàm thuộc A (x) của tập mờ A, ta dùng hàm bù c như sau:
Theo phép hợp, ta có hàm thuộc C (x) được xác định từ các hàm thành
viên A (x), B (x) như sau:
Trang 181.2.3 Phép giao của các tập mờ
Cho hai tập mờ A, B xác định trên tập nền X, giao của tập A và tập B là một tập mờ, ký hiệu: I =A ∩ B
Theo phép giao, ta có hàm thuộc I (x) được xác định từ các hàm thành
viên A (x), B (x) như sau:
n
i i
Trang 19A 1 ×A 2 ×…× A n =
), ,,(
)(
)(
2 1
1
1
2
n A A
x x
x x
n n
0.11
5
0
6.0)2,2(
6.0)2,1(
5.0)1,3(
6.0)1,2(
0.1)1,1(
5
A
Một ứng dụng của tích Descartes là kết nhập (aggregation) các thông tin
mờ về các thuộc tính khác nhau của một đối tượng
Ví dụ trong các hệ luật của các hệ hỗ trợ ra quyết định hay hệ chuyên gia thường có các luật dạng sau đây:
Nếu x 1 là A 1 và x 2 là A 2 và… và x n là A n thì y là B
Trong đó, các x i là các biến ngôn ngữ (các giá trị là ngôn ngữ, được xem như nhãn của các tập mờ) và A i là các tập mờ xác định trên tập nền X i chứa các biến x i Hầu hết các phương pháp giải liên quan đến các luật “nếu -
thì” như trên đều đòi hỏi việc tích hợp các dữ liệu trong phần tiền tố “nếu” nhờ vào toán tử kết nhập, một trong những toán tử như vậy là lấy tích
Descartes A 1 × A 2 ×…×A n
1.2.5 Tính chất của các phép toán trên tập mờ
Đối với các tập mờ A, B, C xác định trên tập nền X sẽ có một số tính
chất sau:
Giao hoán:
A B= B A
Trang 211.2.6.1 Khái niệm số mờ
Số mờ (hay khoảng mờ) dùng để diễn tả khái niệm một số (hay một khoảng) xấp xỉ hay gần bằng một số thực (hay một khoảng số thực) cho trước
Số mờ (hay khoảng mờ) là một tập mờ xác định trên tập số thực
Gọi A là một số mờ, khi đó A là một tập mờ trên tập tập số thực R:
A ∊ (R) Hàm thuộc của số mờ A: A : R → [0,1] thường có dạng hình thang, hình tam giác, hình chuông hay hình thẳng đứng:
Hình 1.8 Các dạng hàm thuộc của số mờ
Phân loại hàm thuộc diễn tả các khái niệm số lớn hay số nhỏ:
Hình 1.9 Phân loại hàm thuộc của số mờ
Trang 22d b x b
b x a
a x c a
c a x
if if if if if
d
x d b c
c a x
01
0
)(
b x a
if
if
b x
x c
a b
a x
x
A
,,,
0
)(
(1.13)
Trang 23Hình 1.11 Số mờ hình tam giác
1.2.6.3 Biến ngôn ngữ và giá trị ngôn ngữ
Số mờ giữ vai trò quan trọng trong việc xây dựng biến mờ định lượng, biến có trạng thái được xác định bởi các số mờ Khi các số mờ biểu diễn các khái niệm ngôn ngữ như khá nhỏ, nhỏ, trung bình, lớn, khá lớn,… trong ngữ
cảnh cụ thể, biến mờ được gọi là biến ngôn ngữ
Biến ngôn ngữ được xác định theo một biến cơ sở trên một tập cơ sở là
số thực trên một khoảng cụ thể Biến cơ sở có thể là: điểm, tỷ giá, lãi suất, nhiệt độ,…Trong một biến ngôn ngữ, các trị ngôn ngữ biểu diễn các giá trị xấp xỉ của biến cơ sở, các giá trị ngôn ngữ này là các số mờ
Ví dụ 4: Biến ngôn ngữ “nhiệt độ” của một lò gia nhiệt xác định theo
biến cơ sở là nhiệt độ Nhiệt độ lò là từ 100oC đến 1000oC hay tập cơ sở
X=[10,100] Dải nhiệt độ từ 100oC đến 1000oC được chia thành các dải như: rất thấp (RT), thấp (T), trung bình (TB), cao (C), rất cao (RC) Tập trị ngôn
ngữ T={RT, T, TB, C, RC} Tập mờ cho các giá trị ngôn ngữ tương ứng như
Hình 1.12:
Trang 24Hình 1.12 Những tập mờ thuộc biến ngôn ngữ
1.2.7 Hệ luật mờ
Hệ luật mờ gồm nhiều mệnh đề dạng:
IF < tập các điều kiện được thoả mãn> THEN <tập các hệ quả >
Giả sử hệ luật mờ gồm M luật R j (j=1,M ) dạng
R j : IF x 1 is A 1 and x 2 is A 2 and… x n is A n j THEN y is B j
Trong đó xi (i = 1,n ) là các biến đầu vào của hệ mờ, y là biến đầu ra
của hệ mờ (các biến ngôn ngữ), j
i
A là các tập mờ trong các tập đầu vào X và
B j là các tập mờ trong các tập đầu ra Y (các giá trị của biến ngôn ngữ) đặc
trưng bởi các hàm thuộc i
Trang 25tính đúng đắn lẫn sự mơ hồ của ngôn ngữ tự nhiên trong các lập luận tương tự như theo cảm tính
1.3.2 Quan hệ mờ
1.3.2.1 Khái niệm về quan hệ rõ
Định nghĩa 1: Cho X ≠ , Y ≠ , R X × Y là một quan hệ, khi đó quan hệ nhị nguyên được xác định:
),(,
)(
),)(
,(,0
1),
(
xR Ry
y x if
xRy R
y x y x if y
x
Khi X= Y thì R ⊂ X × Y là quan hệ trên X
Quan hệ R trên X được gọi là:
- Phản xạ nếu: R(x,x) = 1 với x X
- Đối xứng nếu: R(x,y) = R(y,x) với x, y X
- Bắc cầu nếu: (xRy)˄(yRz) ⟹ (xRz) với x,y,z X
Định nghĩa 2: R là quan hệ tương đương nếu R là quan hệ nhị nguyên
trên X có tính chất phản xạ, đối xứng và bắc cầu
1.3.2.2 Các quan hệ mờ
Các quan hệ mờ là cơ sở dùng để suy diễn (tính toán bằng suy luận xấp
xỉ mờ) Đây là một trong những yếu tố quan trọng trong các ứng dụng của hệ
mờ đem lại hiệu quả ứng dụng trong thực tế, mô phỏng được phần nào suy nghĩ của con người Vì vậy, các phương pháp giải mờ được quan tâm nghiên cứu và phát triển, một trong số đó là logic mờ Tuy nhiên logic mờ mở rộng
từ logic đa trị nên nảy sinh rất nhiều các quan hệ mờ, nhiều cách định nghĩa
các toán tử T-chuẩn, T-đối chuẩn, cũng như các phương pháp mờ hoá và khử
Trang 26mờ khác nhau Sự đa dạng này đòi hỏi khi tiếp cận và xây dựng ứng dụng cần phải tìm hiểu để lựa chọn được phương pháp thích hợp cho ứng dụng đó
Định nghĩa 3: Cho U ≠ ; V ≠ là hai không gian nền; R là một tập
mờ trên U ×V gọi là một quan hệ mờ (hai ngôi)
0 ≤ R (x,y) = R (x,y) ≤ 1
Tổng quát: R⊂U 1 ×U 2 ×…… ×U n là quan hệ n ngôi
0≤ R(u 1, u 2,…… u n) = R (u 1, u 2,…… u n ) ≤ 1 (1.15)
1.3.2.3 Các phép toán quan hệ mờ
Y×Z, phép hợp thành SoR là quan hệ mờ trên X×Z
Có R(x,y) với (x,y)∊ X×Y, S(y,z) với (y,z) Y×Z
Định nghĩa phép hợp thành:
Phép hợp thành max – min xác định bởi:
(SoR)(x,z) = Sup (min(R(x,y),S(y,z))) (x,z) X×Z
Phép hợp thành max - prod xác định bởi:
(SoR)(x,z) = Sup (min(R(x,y) × S(y,z)))
Phép hợp thành max - T ( với T là T - chuẩn) xác định bởi:
(SoTR)(x,z) = Sup (T(R(x,y), S(y,z)))
Trang 271.3.3 Suy luận xấp xỉ và suy diễn mờ
Suy luận xấp xỉ hay còn gọi là suy diễn mờ là quá trình suy ra những kết luận dưới dạng các mệnh đề trong điều kiện các quy tắc, các luật, các dữ liệu đầu vào cho trước cũng không hoàn toàn xác định chính xác
Như trong toán học giải tích, ta sử dụng hình thức lập luận:
“Nếu một hàm số f là khả vi thì nó liên tục”
Sự kiện: Hàm f khả vi Kết luận: Hàm f là liên tục
Dạng suy luận này dựa vào luật logic cổ điển Modus Ponens Theo hình thức này chúng ta sẽ diễn đạt cách suy luận trên dưới dạng sao cho nó có thể suy rộng cho logic mờ
Gọi Ω là không gian tất cả các hàm số, ví dụ Ω ={g:RR}
Xét bài toán suy luận trong hệ mờ
Trên hệ mờ gồm n biến vào x 1 , … x n và một biến ra y
Cho U n , i= 1 n là các không gian nền của các biến vào x 1 , … x n ,V là không gian nền của biến ra y
Hệ được xác định bởi m luật:
R1: Nếu x 1 là A 11 và x2 là A 12 và ….xn là A 1n thì y là B 1
R2: Nếu x 1 là A 21 và x 2 là A 22 và…x n là A 2n thì y là B 2
_
Rm: Nếu x 1 là A m1 và x 2 là A m2 và ……x n là A mn thì y là B m
Trang 28Thông tin đầu vào:
x 1 là A 01 và x 2 là A 02 và….x 0n là A 0n
Tính: y là B0
Trong đó biến mờ Aji , i= n 1 , j = 1,m xác định trên không gian nền U, biến mờ B j , (j= n1 ) xác định trên không gian nền V
Để giải bài toán, ta thực hiện qua 4 bước:
1 Xác định các tập mờ cho các biến vào
2 Xác định độ liên thuộc của các biến tại các tập mờ tương ứng
3 Xác định các quan hệ mờ R (A.B) (u,v)
Theo những cách xác đinh phần tử đại diện khác nhau mà ta sẽ có các phương pháp giải mờ khác nhau Ta thường dùng hai phương pháp chính là: Phương pháp điểm cực đại và Phương pháp điểm trọng tâm
1.4.1 Phương pháp điểm cực đại
Tìm trong tập mờ có hàm thuộc R (y), một phần tử với độ phụ thuộc lớn nhất, tức là:
= arg max y R (y) (1.19)
Trang 29Việc tìm theo công thức (1.19) có thể đưa đến vô số nghiệm nên ta cần đưa thêm những yêu cầu cho phép chọn trong số các nghiệm đó một giá trị cụ thể chấp nhận được (Hình 1.13)
Việc giải mờ theo phương pháp cực đại gồm hai bước:
Xác định miền chứa giá trị rõ : là giá trị mà tại đó hàm thuộc đạt giá trị cực đại, tức là miền:
G = { y Y | R (y) = H } (1.20)
Trong đó: H là độ thỏa mãn đầu vào
Xác định giá trị có thể chấp nhận được từ G
Trong Hình 1.13 thì G là khoảng [ y 1 , y 2 ] của tập nền R Trường hợp
có vô số nghiệm, để tìm ta có hai cách:
o Cách 1: Xác định điểm trung bình:
2
2 1 0
y y
(1.21) Nếu các hàm thuộc có dạng hình tam giác hoặc hình thang thì điểm xác định theo phương pháp này sẽ không quá bị nhạy cảm so với sự thay đổi của giá trị rõ đầu vào, rất thích hợp với các bài toán có nhiễu biên độ nhỏ tại đầu vào
o Cách 2: Xác định điểm cận trái hoặc cận phải
G y
y y
y y
sup( )
Nếu các hàm thuộc có dạng hình tam giác hoặc hình thang thì điểm
sẽ phụ thuộc tuyến tính vào giá trị rõ đầu vào
Trang 30Hình 1.13 Giải mờ bằng phương pháp điểm cực đại
1.4.2 Phương pháp điểm trọng tâm
Phương pháp điểm trọng tâm xuất phát từ ý tưởng mọi giá trị của S đều
đóng góp với một trọng số tương ứng vào việc xác định giá trị khử mờ của
tập mờ R, trọng số của mỗi giá trị là độ thuộc của phần tử vào tập mờ R
Phương pháp này cho kết quả là hoành độ của điểm trọng tâm, miền được bao phủ bởi trục hoành và đường R (y) - Hình 1.14a
Theo nghĩa thông thường của giá trị trọng tâm, công thức tính giá trị khử mờ có dạng:
S R S R
dy y
dy y y y
)(
)(
và chính xác Tuy nhiên phương pháp này lại không để ý được tới độ thỏa mãn của mệnh đề và thời gian tính toán lớn Một trong những nhược điểm cơ bản của phương pháp này là giá trị xác định được lại có độ thuộc nhỏ nhất
- Hình 1.14b
Trang 31Hình 1.14 Giải mờ bằng phương pháp điểm trọng tâm
Tổng kết: Nội dung của Chương 1 đã nhắc lại những khái niệm, định nghĩa cơ bản về tập mờ cùng các phép toán xác định trên tập mờ, phương pháp lập luận xấp xỉ trong hệ mờ và một số phương pháp giải mờ [1], [2]
Trong luận văn có sử dụng nền tảng lý thuyết của Chương 1 để xây dựng các tập dữ liệu mờ và thực hiện các phép toán của tập mờ trên đó để xác định lại các giá trị đã được mờ hóa Việc mờ hóa dữ liệu thực tế không nhằm tìm ra những giá trị ngữ nghĩa tương ứng mà tận dụng các phép toán và lập luận của hệ mờ trên khoảng giá trị [0,1] của số mờ có trọng số rất thấp với mục đích giảm thiểu sai số tính toán trước khi giải mờ, quy đổi trở lại giá trị thực của dữ liệu chuỗi thời gian và giá trị dự báo
Trang 32CHƯƠNG 2: MỘT SỐ THUẬT TOÁN VÀ PHƯƠNG PHÁP TRONG
MÔ HÌNH CHUỖI THỜI GIAN MỜ
2.1 Chuỗi thời gian mờ
2.1.1 Khái niệm chuỗi thời gian
Chuỗi thời gian là một tập các giá trị X = {x 1 , x 2 ,……… x n} được xếp
trình tự diễn biến theo thời gian, với x 1 là giá trị quan sát tại thời điểm đầu
tiên, x 2 là giá trị quan sát tại thời điểm thứ hai và xn là giá trị quan sát tại thời
điểm thứ n
Ví dụ: Các báo cáo tài chính, tỷ giá tiền tệ, chỉ số tăng trưởng hay chỉ
số tiêu dùng đều là những con số với giá trị thể hiện rất thực tế theo chuỗi thời gian
Việc phân tích chuỗi giá trị theo thời gian là chọn một mô hình toán
học phù hợp với tập dữ liệu quá khứ X:={x 1 , x 2 ,……… x n} để có thể dự báo về kết quả của những quan sát chưa diễn ra
2.1.2 Định nghĩa chuỗi thời gian mờ
Không gian nền U xác định một tập hợp các đối tượng cần nghiên cứu Nếu A là một tập con rõ của U thì hàm đặc trưng A (x) được xác định:
A x if
A x if x
, 1
0 ) (