Chuỗi thời gian mờ là công cụ hữu hiệu để có thể dự đoán các dữ liệu thu thập được bằng ngôn ngữ tự nhiên, không những thế nó còn cho thấy những ưu điểm vượt trội khi sử dụng cho những d
Trang 1LỜI CẢM ƠN
Chúng tôi xin gửi lời cảm ơn tới nhóm seminar Đại số gia tử tại Viện Công nghệ thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã có những góp ý quý báu, cung cấp nhiều kiến thức để chúng tôi hoàn thiện hiểu biết của mình trong quá trình nghiên cứu
Chúng tôi cũng xin gửi lời cảm ơn chân thành tới tập thể Bộ môn Kỹ thuật máy tính - Mạng, Khoa Toán - Lý - Tin, Trường Đại học Tây Bắc đã đóng góp nhiều ý kiến thiết thực, tạo điều kiện để chúng tôi hoàn thành đề tài này
NHÓM TÁC GIẢ
Trang 2MỤC LỤC
PHẦN MỞ ĐẦU 1
1 Lý do chọn đề tài 1
2 Mục đích, nhiệm vụ nghiên cứu 1
3 Đối tượng nghiên cứu 1
4 Phạm vi nghiên cứu 2
5 Phương pháp nghiên cứu 2
6 Cấu trúc đề tài 2
CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN DỰ BÁO VÀ DỮ LIỆU CHUỖI THỜI GIAN 3
1.1 Khái quát về dự báo 3
1.1.1 Khái niệm về dự báo 3
1.1.2 Tính chất của dự báo 3
1.1.3 Các phương pháp dự báo 4
1.1.4 Chức năng và vai trò của dự báo 4
1.2 Chuỗi thời gian 5
1.2.1 Khái niệm chuỗi thời gian 5
1.2.2 Phân tích chuỗi thời gian và dự báo 7
1.2.3 Mô hình ARMA 8
Chương 2: CÁC PHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIAN MỜ 12
2.1 Lý thuyết tập mờ 12
2.1.1 Tập mờ 12
2.1.2 Biến ngôn ngữ 12
2.1.3 Số mờ 13
2.1.3 Các phép toán trên tập mờ 16
2.1.5 Giải mờ 20
2.2 Suy diễn mờ 23
2.2.1 Kiến trúc cơ bản của hệ suy diễn mờ 23
2.2.2 Các bước suy diễn mờ 25
2.2.3 Một số phương pháp suy diễn trong hệ mờ 25
2.3 Chuỗi thời gian mờ 26
Trang 32.3.1 Một số khái niệm về chuỗi thời gian mờ 26
2.3.2 Mô hình dự báo Song và Chissom 27
2.3.3 Mô hình dự báo Chen 28
2.3.4 Luật dự báo chuỗi thời gian mờ 28
Chương 3: CẢI TIẾN PHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIAN MỜ VÀ ỨNG DỤNG DỰ BÁO SINH VIÊN NHẬP HỌC TẠI TRƯỜNG ĐẠI HỌC TÂY BẮC 30
3.1 Một số khái niệm về đại số gia tử và ứng dụng tron bài toán dự báo 30
3.2 Ứng dụng phương pháp dự báo chuỗi thời gian mờ sử dụng đại số gia tử vào bài toán dự báo số lượng sinh viên nhập học tại Trường Đại học Tây Bắc 34
3.3 Tối ưu tham số mô hình dự báo chuỗi thời gian sử dụng đại số gia tử 39
KẾT LUẬN VÀ KIẾN NGHỊ 41
TÀI LIỆU THAM KHẢO 42
Trang 4DANH MỤC HÌNH ẢNH
Hình 1.1: Biến động tỷ giá USD/VND trên thị trường 7
Hình 1.2: Biểu đồ giá vàng qua các tháng 7
Hình 2.1: Số mờ Singleton 14
Hình 2.2: Số mờ tam giác 14
Hình 2.3: Bài toán độ tuổi theo số mờ tam giác 15
Hình 2.4: Số mờ hình thang 15
Hình 2.5: Bài toán nhiệt độ theo số mờ hình thang 16
Hình 2.6: Số mờ hình Gaussian 16
Hình 2.7: Hàm thuộc về của tập mờ A 17
Hình 2.8: Hàm thuộc về của tập mờ ¬ A(x) 17
Hình 2.9: Tuyển của hai tập mờ theo S(x,y) = max(x,y) 17
Hình 2.10: Tuyển của hai tập mờ theo S(x,y) = min (1,x+y) 18
Hình 2.11: Tuyển của hai tập mờ theo S(x,y) = x+y+x.y 18
Hình 2.12: Hàm thuộc về của hai tập mờ A,B 18
Hình 2.13: Hội của hai tập mờ theo T(x,y) = min(x,y) 19
Hình 2.14: Hội của hai tập mờ theo T(x,y) = x.y 19
Hình 2.15: Giải mờ bằng phương pháp 21
Hình 2.16: Giải mờ bằng phương pháp trung bình 21
Hình 2.17: Giải mờ theo phương pháp trung bình tâm 22
Hình 2.18: Hàm thuộc hợp thành dạng đối xứng 22
Hình 2.19: Cấu trúc cơ bản của hệ suy diễn mờ 24
Hình 3.1: Biểu đồ so sánh kết quả dự báo 38
Hình 3.2: Biểu đồ so sánh kết quả dự báo sau khi tối ưu 40
Trang 5PHẦN MỞ ĐẦU
1 Lý do chọn đề tài
Bài toán dự báo chuỗi thời gian đã và đang được nhiều tác giả trong nước cũng như ngoài nước quan tâm nghiên cứu [5,6,7,8,9,10,11,14,15] Việc dự báo được dữ liệu trong tương lai luôn là tham vọng của con người nhằm đoán biết trước kết quả từ
đó có những giải pháp đi trước để hoạch định tốt hơn trong công việc
Chuỗi thời gian mờ được Q Song và B.S Chissom lần đầu tiên đề cập tới trong nghiên cứu của mình năm 1993 [1,2] Chuỗi thời gian mờ là công cụ hữu hiệu để có thể dự đoán các dữ liệu thu thập được bằng ngôn ngữ tự nhiên, không những thế nó còn cho thấy những ưu điểm vượt trội khi sử dụng cho những dữ liệu có sự biến động lớn như giá cổ phiếu trên thị trường chứng khoán [7,8] Kể từ khi được giới thiệu cho tới nay, nhiều công trình nghiên cứu đã được đề xuất nhằm nâng cao tính chính xác của kết quả dự báo và giảm bớt độ phức tạp tính toán của bài toán [7,8,9,10,11]
Đại số gia tử (ĐSGT) được N Cat Ho và W Wechler giới thiệu năm 1990 [12] nhằm đưa ra một mô hình toán học phù hợp với dữ liệu không chắc chắn, theo đó các giá trị ngữ nghĩa của ngôn ngữ nằm trong một trật tự nhất định và chính thứ tự đó tạo nên giá trị ngữ nghĩa của từ ngôn ngữ Đại số gia tử đã được ứng dụng trong các bài toán điều khiển, hồi quy, trích rút tri thức, tính toán trên từ… và cho nhiều kết quả tốt [16,17,18,19,20]
Trong nghiên cứu này chúng tôi sẽ tìm kiếm giải pháp cải tiến mô hình dự báo chuỗi thời gian mờ, cụ thể là việc áp dụng lý thuyết đại số gia tử vào mô hình này Các kết quả dự báo khi thực nghiệm áp dụng dự báo số lượng sinh viên nhập học tại Trường Đại học Tây Bắc cũng sẽ được đưa ra thảo luận nhằm cho thấy tính hiệu quả của mô hình đề xuất
2 Mục đích, nhiệm vụ nghiên cứu
- Nghiên cứu về bài toán dự báo và dữ liệu chuỗi thời gian
- Nghiên cứu về lý thuyết tập mờ và khả năng ứng dụng
- Nghiên cứu các phương pháp dự báo chuỗi thời gian mờ
- Thử nghiệm dự báo với dữ liệu sinh viên nhập học tại Trường Đại học Tây Bắc
3 Đối tượng nghiên cứu
- Bài toán dự báo chuỗi thời gian mờ
Trang 64 Phạm vi nghiên cứu
- Nghiên cứu ứng dụng bài toán dự báo chuỗi thời gian mờ vào dự báo dữ liệu sinh viên nhập học tại Trường Đại học Tây Bắc
5 Phương pháp nghiên cứu
- Phương pháp phân tích, tổng hợp tài liệu
- Phương pháp thực nghiệm
6 Cấu trúc đề tài
Đề tài gồm ba phần:
- Phần 1: Phần mở đầu
- Phần 2: Phần nội dung của đề tài gồm 3 chương:
Chương 1: Tổng quan về bài toán dự báo và dữ liệu chuỗi thời gian Chương 2: Các phương pháp dự báo chuỗi thời gian mờ
Chương 3: Cải tiến phương pháp dự báo chuỗi thời gian mờ và ứng dụng dự báo sinh viên nhập học tại Trường Đại học Tây Bắc
- Phần 3: Kết luận và kiến nghị
Trang 7CHƯƠNG 1:
TỔNG QUAN VỀ BÀI TOÁN DỰ BÁO VÀ DỮ LIỆU CHUỖI THỜI GIAN 1.1 Khái quát về dự báo
1.1.1 Khái niệm về dự báo
Dự báo là sự tiên đoán có căn cứ khoa học, mang tính chất xác suất về mức độ, nội dung, các mối quan hệ, trạng thái, xu hướng phát triển của đối tượng nghiên cứu hoặc về cách thức và thời hạn đạt được các mục tiêu nhất định đã đề ra trong tương lai
Dự báo là kết quả của sự kết hợp giữa những phân tích định tính và những phân tích định lượng các quá trình cần dự báo Chỉ có dự báo khoa học mới đảm bảo độ tin cậy cao và là cơ sở vững chắc cho việc thông qua các quyết định quản lý khoa học Ngày nay vai trò của dự báo trong mọi lĩnh vực đời sống, xã hội ngày càng quan trọng và được nâng lên đáng kể
1.1.2 Tính chất của dự báo
- Dự báo mang tính xác suất: Mỗi đối tượng dự báo đều vận động theo một quy luật, một quỹ đạo nhất định nào đó Đồng thời trong quá trình phát triển nó luôn chịu tác động từ môi trường hay các yếu tố bên ngoài mà chính các yếu tố tác động này cũng không phải là đứng im mà luôn vận động và phát triển không ngừng Chính vì vậy dù trình độ dự báo có hoàn thiện đến đâu cũng không thể chắc chắn rằng kết quả của dự báo là hoàn toàn chính xác, luôn tồn tại những trường hợp không lường trước được trong tương lai
- Dự báo là đáng tin cậy: Mặc dù dự báo mang tính xác suất nhưng nó đáng tin cậy Vì nó dựa trên những cơ sở lý luận và phương pháp luận khoa học Ngày nay, phương pháp và công cụ xử lý thông tin ngày càng hiện đại giúp cho việc tính toán, phân tích đơn giản, chính xác và độ tin cậy của dự báo không ngừng được nâng cao
- Dự báo mang tính đa phương án: Dự báo được thực hiện trên những giả thiết -
dự báo có điều kiện Tập hợp các giả thiết để dự báo được gọi là phông dự báo Mỗi
dự báo có thể được tiến hành trên các phông dự báo khác nhau do những nguyên nhân chủ quan và khách quan khác nhau Tính đa phương án một mặt là thuộc tính khách quan của dự báo nhưng mặt khác lại là phù hợp với yêu cầu của công tác quản lý, nó làm cho việc ra quyết định cũng như chỉ đạo thực hiện quyết định quản lý trở nên linh hoạt hơn, dễ thích nghi với sự biến đổi vô cùng phức tạp của tình hình thực tế
Trang 81.1.3 Các phương pháp dự báo
Theo học giả Gordon, trong hai thập kỷ gần đây, có tám phương án dự báo được
áp dụng rộng rãi trên thế giới như sau:
1 Tiên đoán (Genius forecasitng)
2 Ngoại suy xu hướng (Trend extrapolation)
3 Phương pháp chuyên gia (Consensus methods)
4 Phương pháp mô phỏng (Stimulation)
5 Phương pháp kịch bản (Scenarion)
6 Phương pháp cây quyết định (Decision trees)
7 Phương pháp ma trận tác động qua lại (Cross-impact matrix method)
8 Phương pháp dự báo tổng hợp (Combining methods)
Tuy nhiên theo các phân loại của Việt Nam các phương pháp dự báo thường được chia thành hai nhóm chính là: Phương pháp định tính và phương pháp định lượng
1.1.3.1 Phương pháp định tính
Phương pháp này dựa trên cơ sở nhận xét của những yếu tố liên quan, dựa trên những ý kiến về các khả năng có liên hệ của những yếu tố liên quan này trong tương lai Từ việc khảo sát ý kiến được tiến hành một cách khoa học để nhận biết các sự kiện tương lai hay từ ý kiến phản hồi của một nhóm đối tượng hưởng lợi (chịu tác động) nào đó mà phương pháp định tinh có liên quan đến mức độ phức tạp khác nhau
1.1.3.2 Phương pháp định lượng
Mô hình dự báo định lượng dựa trên số liệu quá khứ, những số liệu này được giả
sử có liên quan đến tương lai và có thể tìm thấy được Tất cả các mô hình dự báo theo định lượng có thể sử dụng thông qua chuỗi thời gian và các giá trị này được quan sát
đo lường các giai đoạn theo từng chuỗi
Hiện nay, để nâng cao mức độ chính xác của dự báo người ta thường kết hợp cả hai phương pháp định tính và định lượng Bên cạnh đó, vấn đề cần dự báo đôi khi không thể thực hiện được thông qua một phương pháp dự báo đơn lẻ mà đòi hỏi kết hợp nhiều hơn một phương pháp nhằm mô tả đúng bản chất sự việc cần dự báo
1.1.4 Chức năng và vai trò của dự báo
1.1.4.1 Chức năng của dự báo
Theo quan điểm của triết học, dự báo là một hình thức nhận thức thế giới, nhận thức xã hội Nó có hai chức năng cơ bản:
Trang 9- Chức năng tham mưu: trên cơ sở đánh giá thực trạng, phân tích xu hướng vận động và phát triển trong quá khứ, hiện tại và tương lai, dự báo sẽ cung cấp thông tin cần thiết, khách quan làm căn cứ cho việc ra quyết định quản lý và xây dựng chiến lược, kế hoạch hóa các chương trình, dự án,…người quản lý và hoạch định chiến lược, người lập kế hoạch có nhiệm vụ lựa chọn trong số các phương án có thể có, tìm ra các phương án có tính khả thi cao nhất, có hiệu quả nhất Để thực hiện tốt chức năng này
dự báo phải thật sự đảm bảo được tính khách quan, khoa học và tính độc lập tương đối với các cơ quan quản lý và hoạch định chính sách
- Chức năng khuyến nghị hay điều chỉnh: Với chức năng này dự báo tiên đoán các hậu quả có thể nảy sinh trong quá trình thực hiện các chính sách kinh tế -xã hội nhằm giúp các cơ quan chức năng kịp thời điều chỉnh mục tiêu cũng như các cơ chế tác động quản lý để đạt được hiệu quả kinh tế - xã hội cao nhất
1.1.4.2 Vai trò của dự báo
Trong nền kinh tế thị trường, công tác dự báo là vô cùng quan trọng bởi lẽ nó cung cấp các thông tin cần thiết nhằm phát hiện và bố trí sử dụng các nguồn lực trong tương lai một cách có căn cứ thực tế Với những thông tin mà dự báo đưa ra cho phép các nhà hoạch định chính sách có những quyết định về đầu tư, các quyết định về sản xuất, về tiết kiệm và tiêu dùng, các chính sách tài chính, chính sách kinh tế vĩ mô Dự báo không chỉ tạo cơ sở khoa học cho việc hoạch định chính sách, cho việc xây dựng chiến lược phát triển, cho các quy hoạch tổng thể mà còn cho phép xem xét khả năng thực hiện kế hoạch và hiệu chỉnh kế hoạch
Sử dụng mô hình dự báo trong hoạt động quản lý là rất quan trọng, nó tạo điều kiện không những cung cấp thông tin tương lai mà còn có khả năng làm chủ công tác quản lý Nhờ có mô hình dự báo mà có thể tăng cường khả năng quản lý một cách khoa học Giúp nhận thức sâu sắc hơn các quy luật khách quan, tránh được tính chủ quan
1.2 Chuỗi thời gian
1.2.1 Khái niệm chuỗi thời gian
Một chuỗi thời gian là một dãy các giá trị quan sát X:={x1, x2,……… xn} được
xếp thứ tự diễn biến thời gian với x1 là các giá trị quan sát tại thời điểm đầu tiên, x2 là
quan sát tại thời điểm thứ 2 và x n là quan sát tại thời điểm thứ n
Ví dụ:
Trang 10Thống kê số lượng sinh viên hệ đại học chính quy nhập học tại Trường Đại học
Tây Bắc qua các năm, ở đây ta có x1= 672 là giá trị quan sát tại thời điểm thứ nhất
tức là năm 2004, x2= 1007 là giá trị quan sát tại thời điểm thứ 2 tức là năm 2005 và
x10= 680 là giá trị quan sát tại thời điểm thứ 14 tức là năm 2017
Bảng 1: Thống kê số lượng sinh viên hệ Đại học chính quy nhập học
tại Trường Đại học Tây Bắc
Các báo cáo tài chính mà ta thấy hằng ngày trên các phương tiên truyền thông như: báo, tivi, internet… về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tiêu dùng…
Đó là những thể hiện rất thực tế của chuỗi thời gian
Trong các thí dụ trên, thứ tự thời gian quan sát thực sự đóng vai trò quan trọng,
vì thế hầu hết các kỹ thuật thống kê cổ điển ít có tác dụng và do đó cần phải đề xuất những kỹ thuật tính toán mới để bộc lộ được các nét đặc thù của chuỗi thời gian
Trang 11Hình 1.1: Biến động tỷ giá USD/VND trên thị trường
Hình 1.2: Biểu đồ giá vàng qua các tháng
1.2.2 Phân tích chuỗi thời gian và dự báo
Bước đầu tiên của việc phân tích chuỗi thời gian là chọn một mô hình toán học
phù hợp với tập dữ liệu cho trước X={x1, x2,……… xn} nào đó Để có thể nói về bản
chất của những quan sát chưa diễn ra, ta giả thiết mỗi quan sát x t là một giá trị thể
hiện của biến ngẫu nhiên X t với t ∈ T Ở đây T được gọi là tập chỉ số Khi đó ta có thể coi tập dữ liệu X={x1, x2,……… xn} là thể hiện của quá trình ngẫu nhiên{X t , t ∈ T}
Và vì vậy, ta có thể định nghĩa một quá trình ngẫu nhiên như sau:
Định nghĩa 1.1 (Quá trình ngẫu nhiên)
Một quá trình ngẫu nhiên là một họ các biến ngẫu nhiên {X t , t∈T} được định nghĩa trên một không gian xác suất(Ω, A, P)
Chú ý:
Trang 12Trong việc phân tích chuỗi thời gian, tập chỉ số T là một tập các thời điểm, ví dụ
như là tập {1,2 } hay tập (-∞,+∞) Tất nhiên cũng có những quá trình ngẫu nhiên có T
không phải là một tập con của R nhưng ở đây ta chỉ xét cho trường hợp T∈R Và thường thì ta xem T là các tập các số nguyên, khi đó ta sẽ sử dụng ký hiệu tập chỉ số là
Z thay vì T ở trên Một điểm chú ý nữa là trong luận văn này chúng ta sẽ dùng thuật
ngữ chuỗi thời gian để đồng thời chỉ dữ liệu cũng như quá trình có dữ liệu đó là một thể hiện
Việc phân tích chuỗi thời gian là đi tới xây dựng một mô hình có khả năng: Cung cấp một đặc tả ngắn gọn của dữ liệu đang quan sát; có thể dùng để suy ra các đặc điểm của hệ thống; có thể được dùng để suy diễn để tìm ra cơ chế hoạt động của hệ thống;
có thể dùng để dự báo giá trị trong tương lai
- Định nghĩa 1.3 (Quá trình tự hồi quy)
Người ta gọi quá trình ngẫu nhiên {X t , t ∈ Z} là một quá trình tự hồi quy cấp p, viết là X t ~ AR(p), là một quá trình dừng {X t , t ∈ Z} thỏa mãn:
X t = a1X t-1 + a2X t-2 + …+ a p X t-p + εt , a p ≠ 0 Với {ε} là một ồn trắng
Ta có thể viết biểu thức của quá trình tự hồi quy ở trên bởi công thức
Trang 13X t - a1X t-1 – a2X t-2 – … – a p X t-p = εt , a p ≠ 0 Hay ở dạng toán tử:
a(z):= 1 – a1z – a2 – z2 – … – a p z p
ở đây a(z) được gọi là đa thức hồi quy
Chú ý:
Nếu đa thức a(z) ở trên có nghiệm nằm ngoài đĩa tròn đơn vị (|z| > 1) thì
X t được gọi là quá trình nhân quả tự hồi qui cấp p và nói chung ta chỉ xét các quá trình
Lần lượt cho h = 1,2,… p ta được:
Hệ phương trình gọi là hệ phương trình Jule–Walker, song tuyến đối với a và ρ
1.2.3.2 Quá trình trung bình trượt
- Định nghĩa 1.4 (Quá trình trung bình trượt)
Một quá trình trung bình trượt cấp q, ký hiệu X t ~ MA(q), là một quá trình {X t,
t∈Z} thỏa mãn biểu thức
X t = ε1 +b1 εt-1 +…+b q εt-q , b1 b2,…, b q ϵ R, b q≠0 Với {εt} là một ồn trắng
Ta cũng có thể viết biểu thức trung bình trượt ở trên dưói dạng toán tử là tương
tự như đối với quá trình tự hồi quy như sau:
X t = b(B) εt
Trong đó hàm b(.) định nghĩa bởi
b(z) = 1+ b1z+…+b q z q
Ở đây b(z) được gọi là đa thức trung bình trượt
Các đặc trưng của quá trình trung bình trượt:
Trước hết, ta dễ dàng thấy rằng:
1 1 1 1 , , , , , , , ,1 2 1 2 , 0, 0
Trang 14EXt = 0
và
E(X tεt)=
1.2.3.3 Quá trình tự hồi quy trung bình trượt
- Định nghĩa 1.5 (quá trình tự hồi quy trung bình trượt)
Một quá trình {X t , t∈Z} được gọi là quá trình tự hồi quy trung bình trượt cấp p, q
kí hiệu X t ~ ARMĂp,q) là một quá trình {X t , t ∈ Z) thỏa mãn:
X t = a1X t−1+ +a p X t −p+εt +b1εt−1+ +b qεt −q ,a1,a2, ,a p ,b1,b2, ,b q ∈R,a p ≠ 0,b q≠ 0
Trong đó t là ồn trắng, ặ) và b(.) lần lượt là đa thức tự hồi quy và đa thức trung bình trượt có bậc tương ứng là p và q:
ăz)=1–a1z–…–a p z p b(z)=1+b1z+…+b q z q
Khi đó ta có thể viết quá trình ARMA ở dạng toán tử như sau:
ăB)X t =b(B)εt
- Định nghĩa 1.6 (Quá trình nhân khả nghịch)
Trang 15Một quá trình ARMA(p,q) được gọi là một quá trình nhân quả và khả nghịch nếu
có một quá trình ARMA(p,q) có a(z) và b(z) thỏa mãn hai điều kiện:
i) a(z) và b(z) không có nghiệm chung
ii) a(z) và b(z) không có nghiệm có modun không vượt quá 1
Nhưng kỹ thuật mô hình ARMA cung cấp là một cơ sở rất quan trọng và mang lại nhiều gợi ý cho các công trình nghiên cứu về chuỗi thời gian sau Box-Jenkins
Trang 16Chương 2:
CÁC PHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIAN MỜ
2.1 Lý thuyết tập mờ
2.1.1 Tập mờ
Tập mờ là một tập hợp mà mỗi phần tử cơ bản của nó được gán thêm một giá trị
thực µ A (x)∈[0,1] để chỉ độ thuộc của nó vào tập đã cho Độ phụ thuộc càng lớn thì
phần tử thuộc về tập càng lớn Khi độ phụ thuộc bằng 0 thì phần tử đó sẽ không thuộc
về tập đã cho Ngược lại nếu mức độ phụ thuộc bằng 1 phần tử cơ bản sẽ thuộc về tập hợp với xác suất 100%
Định nghĩa 2.1: Cho là U một tập vũ trụ với các phần tử kí hiệu bởi x, U = {x}
Một tập mờ A trên U là tập được đặc trưng bởi một hàm µ A (x) mà nó liên kết mỗi phần
tử x ∈U với một số thực trong đoạn [0,1] Giá trị của hàm µ A (x) biểu diễn mức độ thuộc của x trong A
Kí hiệu A= {(x,µ A (x))|x ∈U}
Trong đó µ A (x) là một ánh xạ từ U vào [0,1] và được gọi là hàm thuộc của tập mờ
A và µ A (x) có giá trị bất kỳ trong đoạn [0,1] là điều khác biệt cơ bản giữa tập rõ và tập
mờ Giá trị của µ A (x) càng gần tới 1 thì mức độ thuộc của x trong A càng cao
Tập mờ là sự mở rộng của tập kinh điển Thật vậy, khi A là một tập kinh điển, hàm thuộc của nó µ A (x) chỉ nhận 2 giá trị 0 hoặc 1 tương ứng với x có nằm trong A hay
không
Thực tế các khái niệm mờ trong các bài toán ứng dụng rất đa dạng và khó để xác định được các hàm thuộc của chúng một cách chính xác, thông thường dựa trên ngữ cảnh mà khái niệm mờ đó đang được sử dụng Một lớp rộng các khái niệm mờ có thể
mô hình qua các tập mờ mà L.A.Zadeh [1] đã đưa ra gọi là biến ngôn ngữ
2.1.2 Biến ngôn ngữ
Theo Zadeh [1], biến ngôn ngữ là các biến mà giá trị của chúng không phải là số
mà là các từ hoặc các câu trong ngôn ngữ tự nhiên hoặc nhân tạo Các giá trị của biến ngôn ngữ được sử dụng “khi có sự thiếu hụt tính chính xác bề ngoài của những vấn đề phức tạp cố hữu” Về hình thức biến ngôn ngữ được định nghĩa như sau:
Định nghĩa 2.2: Biến ngôn ngữ là một bộ năm (X, T(X), U, R, M) trong đó X là
tên biến, T(X) là tập các giá trị ngôn ngữ của biến X, U là không gian tham chiếu hay
Trang 17còn gọi là miền cơ sở của biến X, R là một quy tắc cú pháp sinh các giá trị ngôn ngữ trong T(X), M là quy tắc gán ngữ nghĩa biểu thị bằng tập mờ trên U cho các từ ngôn ngữ trong T(X)
Từ những nghiên cứu về biến ngôn ngữ, tác giả đưa ra những đặc trưng cơ bản của biến ngôn ngữ:
- Tính phổ quát: các biến ngôn ngữ khác nhau về các giá trị nguyên thủy nhưng ý
nghĩa về mặt cấu trúc miền giá trị của chúng vẫn được giữ Nói cách khác, cấu trúc miền giá trị của hai biến ngôn ngữ cho trước tồn tại một “đẳng cấu” sai khác nhau bởi giá trị sinh nguyên thủy
- Tính độc lập ngữ cảnh của gia tử và liên từ như AND, OR, : ngữ nghĩa của
các gia tử và liên từ như AND, OR, hoàn toàn độc lập với với ngữ cảnh, khác với giá trị nguyên thủy của các biến ngôn ngữ lại phụ thuộc vào ngữ cảnh Do đó khi tìm kiếm
mô hình cho các gia tử và liên từ như AND, OR, chúng ta không phải quan tâm đến giá trị nguyên thủy của biến ngôn ngữ đang xét
Các đặc trưng này cho phép chúng ta sử dụng cùng một tập gia tử và xây dựng một cấu trúc toán học duy nhất cho miền giá trị của các biến ngôn ngữ khác nhau
2.1.3 Số mờ
2.1.3.1 Mờ hóa
Định nghĩa 2.3: Mờ hóa được định nghĩa như là sự ánh xạ (sự làm tương ứng) từ
tập các giá trị thực x* ∈U ⊂ R thành tập các giá trị mờ A ở trong U Nguyên tắc chung
việc thực hiện mờ hóa là:
- Từ tập giá trị thực x đầu vào sẽ tạo ra tập mờ A với hàm thuộc có giá trị đủ rộng tại các điểm rõ x *
- Nếu có nhiễu ở đầu vào thì việc mờ hóa sẽ góp phần khử nhiễu
- Việc mờ hóa phải tạo điều kiện đơn giản cho tính toán sau này
Thông thường dùng ba phương pháp mờ hóa sau đây:
- Mờ hóa đơn trị (Singleton fuzzifier) Mờ hóa đơn trị là từ các điểm giá trị thực x* ∈U lấy các giá trị đơn của tập mờ A, nghĩa là hàm thuộc có dạng:
- Mờ hóa Gauss (Gaussian fuzzifier) Mờ hóa Gauss là từ các điểm giá trị thực x* ∈U lấy các giá trị trong tập mờ A với hàm thuộc Gauss
Trang 18- Mờ hóa hình tam giác (Triangular fuzzifier) Mờ hóa hình tam giác là từ các điểm giá trị thực x* ∈U lấy các giá trị trong tập mờ A với hàm thuộc dạng hình tam
giác (hoặc hình thang)
Ta thấy mờ hóa đơn trị cho phép tính toán về sau rất đơn giản nhưng không khử được nhiễu đầu vào, mờ hóa Gaus hoặc mờ hóa hình tam giác không những cho phép tính toán về sau tương đối đơn giản mà còn đồng thời có thể khử nhiễu đầu vào
2.1.3.2 Các loại số mờ
Tập mờ trên tập số thực Rl là một số thực mờ nếu:
- Mờ chuẩn hóa tức có điểm x’ sao cho µ M (x’) = 1
- Ứng với mỗi α ∈ Rl tập mức {x: µ M (x) ≥ α} là đoạn đóng trên Rl
Trang 19Hình 2.3: Bài toán độ tuổi theo số mờ tam giác
Áp dụng công thức tính số mờ tam giác Ta có thể tính độ thuộc của người đàn ông 30 tuổi như sau:
Trang 20Nhiệt độ môi trường được chia theo các mức như hình dưới Xác định độ thuộc của 16oC vào các lớp lạnh, trung bình, nóng
Hình 2.5: Bài toán nhiệt độ theo số mờ hình thang
Áp dụng công thức tính số mờ hình thang ta tính được như sau:
- Số mờ hình Gaussian (Bell):
Hình 2.6: Số mờ hình Gaussian
2.1.3 Các phép toán trên tập mờ
2.1.3.1 Phép bù
Định nghĩa 2.4: Cho tập không gian nền (tập vũ trụ) U có hàm thuộc µ A (x) Phần
bù (ký hiệu¬ A) của tập mờ A là một tập mờ với hàm thuộc về được xác định bởi :
µ¬A (x) = 1- µ A (x) , với mỗi x ∈ U
Trang 21Đồ thị của hàm thuộc về có dạng sau:
Hình 2.7: Hàm thuộc về của tập mờ A
Hình 2.8: Hàm thuộc về của tập mờ ¬ A(x) 2.1.3.2 Phép tuyển
Định nghĩa 2.5: Cho S là phép tuyển của hai tập mờ A, B (ký hiệu A∪B) có các
hàm liên thuộc µ A (x), µ B (x) là một tập mờ trên U với hàm thuộc về µ A∪B (x) được xác
Trang 22- Với S(x,y) = min(1, x+y) ta có:
Hình 2.10: Tuyển của hai tập mờ theo S(x,y) = min (1,x+y)
- Với S(x,y) = x + y + x.y ta có:
Hình 2.11: Tuyển của hai tập mờ theo S(x,y) = x+y+x.y 2.1.3.3 Phép hội
Định nghĩa 2.6: Cho A và B là hai tập mờ trên một tập vũ trụ U , có các hàm liên
thuộc µ A (x), µ B (x) Gọi T là phép hội của hai tập mờ A và B (ký hiệu A∩B) là một tập
mờ có hàm thuộc µA∩B(x) xác định như sau:
µ A∩B (x) = = T(µ A (x), µ B (x)) ∀x ∈ U
Đồ thị của hàm thuộc về có dạng như sau:
Hình 2.12: Hàm thuộc về của hai tập mờ A,B
µA∪B(x) = min(1, µA(x) + µB(x))
µA∪B(x) = µA(x) + µB(x) - µA(x).µB(x)
Trang 23- Với T(x,y) = min(µ A (x), µ B (x)) ta có:
Hình 2.13: Hội của hai tập mờ theo T(x,y) = min(x,y)
- Với T(x,y) = x.y ta có:
Hình 2.14: Hội của hai tập mờ theo T(x,y) = x.y 2.1.3.4 Phép kéo theo
Phép kéo theo được xét như một mối quan hệ Phép kéo theo của hàm số I(x,y)
xác định trên [0,1]2 được định nghĩa như sau:
Định nghĩa 2.7:
Phép kéo theo của một hàm số I: [0,1]2 ! [0,1] thỏa các điều kiện sau:
- Nếu x ≤ z thì I(x,y)≥ I(z,y) ∀y ∈ [0,1]
- Nếu y ≤ u thì I(x,y) ≤ I(z,y) ∀x ∈ [0,1]