Danh sách ký hiệu và chữ viết tắtKý hiệu hoặc chữ viết tắt Ý nghĩa app1 Phép xấp xỉ một số mờ bởi một từ app2 Phép xấp xỉ một số thực bởi một số nguyên C, C2 Tổ hợp lồi của hai từ Cn Tổ
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan những kết quả trình bày trong luận án này là mới,trung thực và chưa từng được công bố trong bất kỳ công trình của ai khác Nhữngkết quả viết chung với các tác giả khác đã được sự đồng ý khi đưa vào luận án
Nghiên cứu sinh
Phạm Hồng Phong
Trang 4đã tận tâm hỗ trợ học trò về mọi mặt trong suốt 6 năm làm nghiên cứu sinh, từnhững ngày bắt đầu có tới những thủ tục bảo vệ cuối cùng.
Học trò chân thành cảm ơn GS TSKH Phạm Thế Long, PGS TS Đặng VănChuyết, PGS TS Lê Bá Long, PGS TS Nguyễn Hà Nam, TS Nguyễn Thị MinhHuyền, TS Đỗ Thanh Hà, TS Vũ Như Lân, PGS TS Trần Đình Khang, PGS TS.Ngô Thành Long, PGS TS Nguyễn Hữu Điển, TS Nguyễn Hải Vinh và rất nhiềuThầy Cô khác về những đóng góp quý báu trong quá trình nghiên cứu cũng nhưhoàn thiện luận án
Nghiên cứu sinh xin chân thành gửi lời cảm ơn đến Ban Giám hiệu, PhòngSau đại học, lãnh đạo Khoa Toán - Cơ - Tin học, các Thầy Cô Bộ môn Tin họcTrường Đại học Khoa học Tự nhiên - Đại học Quốc gia Hà Nội đã tạo điều kiệnthuận lợi nhất để nghiên cứu sinh hoàn thành chương trình học tập và luận án.Tôi xin cảm ơn Ban Giám hiệu, Khoa Công nghệ Thông tin, Bộ môn Toán họcTrường Đại học Xây dựng nơi tôi công tác và các bạn bè, đồng nghiệp đã luôntạo điều kiện, động viên, khuyến khích và hỗ trợ tối đa để tôi có thể hoàn thànhchương trình học tập cũng như luận án này
Tôi xin cảm ơn riêng PGS TS Lê Hoàng Sơn, người bạn thân thiết, đã đồnghành cùng tôi trên con đường nghiên cứu tại những thời điểm khó khăn nhất.Cuối cùng, xin cảm ơn Gia đình đã luôn đồng hành, thường xuyên động viêntôi trong công việc, học tập và nghiên cứu
Trang 5Hà Nội, tháng 05 năm 2018
Nghiên cứu sinh
Phạm Hồng Phong
Trang 6MỤC LỤC
Trang
Chương 1 Tổng quan về lý thuyết mờ và tính toán với từ 7
1.1 Sơ lược về lý thuyết mờ và mờ trực cảm 7
1.1.1 Tập mờ, số mờ và biến ngôn ngữ 7
1.1.2 Tập mờ trực cảm và giá trị mờ trực cảm 10
1.2 Toán tử gộp thông tin cho bằng từ 13
1.2.1 Gộp dựa trên thứ tự giữa các từ 13
1.2.2 Gộp dựa trên Nguyên lý Suy rộng 15
1.2.3 Gộp dựa trên chỉ số của các từ 16
1.2.4 Gộp dựa trên biểu diễn theo cặp ngôn ngữ 18
1.2.5 Gộp các từ với chỉ số liên tục 19
1.2.6 Gộp thông tin cho bằng từ có yếu tố trực cảm 20
1.2.7 Ra quyết định với thông tin cho bằng từ 25
1.3 Phân lớp dựa trên độ tương tự mờ 32
1.3.1 Phân lớp dữ liệu 32
1.3.2 Độ tương tự mờ 33
1.3.3 Độ tương tự mờ trực cảm 35
1.4 Kết luận chương 36
Trang 7Chương 2 Từ trực cảm và gộp các từ trực cảm 37
2.1 Tập từ trực cảm và một số phép toán cơ bản 38
2.2 Toán tử gộp các từ trực cảm 42
2.2.1 Giá trị lớn nhất và giá trị nhỏ nhất của các từ trực cảm 42
2.2.2 Trung vị của các từ trực cảm 44
2.2.3 Tổ hợp lồi của các từ trực cảm 46
2.2.4 Toán tử OWA cho các từ trực cảm 48
2.2.5 Các toán tử gộp cho các từ trực cảm mở rộng 50
2.2.6 Ứng dụng các toán tử gộp cho từ trực cảm vào bài toán ra quyết định 53
2.3 So sánh từ trực cảm với giá trị ngôn ngữ trực cảm và số ngôn ngữ trực cảm 59
2.3.1 So sánh trên phương diện lý thuyết 59
2.3.2 So sánh trên phương diện thực hành 68
2.4 Kết luận chương 71
Chương 3 Một số độ tương tự và ứng dụng vào bài toán phân lớp thông tin 73 3.1 Độ tương tự từ, độ tương tự véc-tơ từ và ứng dụng 74
3.1.1 Độ tương tự từ 75
3.1.2 Độ tương tự véc-tơ từ 76
3.1.3 Ứng dụng cho bài toán phân lớp với thông tin cho bằng từ 81 3.2 Độ tương tự giá trị mờ trực cảm, độ tương tự véc-tơ mờ trực cảm và ứng dụng 85
3.2.1 Độ tương tự giá trị mờ trực cảm 86
3.2.2 Độ tương tự véc-tơ mờ trực cảm 87
3.2.3 Ứng dụng cho bài toán phân lớp 88
3.3 Thực nghiệm 93
3.3.1 Thực nghiệm với bộ dữ liệu Car Evaluation 95
3.3.2 Thực nghiệm với bộ dữ liệu Mushroom 98
3.3.3 Thực nghiệm với bộ dữ liệu Iris 99
3.4 Kết luận chương 102
Danh mục công trình khoa học của tác giả liên quan đến luận án 111
Trang 8Danh sách hình vẽ
1.1 Biến ngôn ngữ “Heịght” 11
1.2 Tập từ mở rộng 20
1.3 Các bước của bài toán ra quyết định tập thể 26
1.4 CW trong bài toán ra quyết đinh tập thể 26
2.1 So sánh thời gian thực thi (giây) các Quy trình 1.1 và 2.1 Trục hoành thể hiện số phương án (đồng thời là số chuyên gia), trục tung thể hiện thời gian tính toán (tính bằng giây) 70
2.2 So sánh thời gian thực thi (giây) các Quy trình 1.2 và 2.2 Trục hoành thể hiện số phương án (cũng là số tiêu chí, số chuyên gia), trục tung thể hiện thời gian tính toán (tính bằng giây) 71
3.1 So sánh thuật toán LCA với các thuật toán NFS, RBFNN và ANFIS trên bộ dữ liệu Car Evaluation Trục tung thể hiện giá trị của các chỉ số recall, fp-rate, precision và f-measure (lấy trung bình trên các lớp) với đơn vị là phần trăm (%) 97
3.2 So sánh thuật toán LCA với các thuật toán NFS, RBFNN và ANFIS trên bộ dữ liệu Mushroom Trục tung thể hiện giá trị của các chỉ số recall, fp-rate, precision và f-measure (lấy trung bình trên các lớp) với đơn vị là phần trăm (%) 99
3.3 So sánh các thuật toán LCA và IFVSM với các thuật toán NFS, RBFNN và ANFIS trên bộ dữ liệu Iris Trục tung thể hiện giá trị của các chỉ số recall, fp-rate, precision và f-measure (lấy trung bình trên các lớp) với đơn vị là phần trăm (%) 101
Trang 9Danh sách bảng
1.1 Ma trận quyết định R1 30
1.2 Ma trận quyết định R2 31
1.3 Ma trận quyết định R3 31
1.4 αki nằm ở hàng i, cột k là đánh giá tổng hợp của chuyên gia dk về phương án xi (i =1, 2, 3, 4; k =1, 2, 3) 31
2.1 Ma trận quyết định ˜P1 55
2.2 Ma trận quyết định ˜P2 55
2.3 Ma trận ˜P 55
2.4 Ma trận quyết định ˜R1 57
2.5 Ma trận quyết định ˜R2 57
2.6 Ma trận quyết định ˜R3 58
2.7 Đánh giá tổng hợp ˜αki về phương án xi cho bởi chuyên gia dk (i = 1, 2, 3, 4; k =1, 2, 3) 58
2.8 So sánh thời gian thực thi (giây) các Quy trình 1.1 và 2.1 69
2.9 So sánh thời gian thực thi (giây) các Quy trình 1.2 và 2.2 70
3.1 Bộ dữ liệu Car Evaluation 74
3.2 Ví dụ cho thuật toán LCA 84
3.3 Ví dụ cho thuật toán IFVSM 91
3.4 Gán nhãn cho dữ liệu Car Evaluation 96
3.5 So sánh thuật toán LCA với các thuật toán NFS, RBFNN và ANFIS trên bộ dữ liệu Car Evaluation 97
3.6 So sánh chi tiết thuật toán LCA với các thuật toán NFS, RBFNN và ANFIS trên bộ dữ liệu Car Evaluation (%) 104
3.7 Bộ dữ liệu Mushroom 105
Trang 103.8 So sánh thuật toán LCA với các thuật toán NFS, RBFNN và ANFIStrên bộ dữ liệu Mushroom 1053.9 So sánh chi tiết thuật toán LCA với các thuật toán NFS, RBFNN vàANFIS trên bộ dữ liệu Mushroom (%) 1063.10 So sánh các thuật toán LCA và IFVSM với các thuật toán NFS,RBFNN và ANFIS trên bộ dữ liệu Iris 1063.11 So sánh chi tiết các thuật toán LCA và IFVSM với các thuật toánNFS, RBFNN và ANFIS trên bộ dữ liệu Iris (%) 107
Trang 11Danh sách ký hiệu và chữ viết tắt
Ký hiệu hoặc chữ viết tắt Ý nghĩa
app1 Phép xấp xỉ một số mờ bởi một từ
app2 Phép xấp xỉ một số thực bởi một số nguyên
C, C2 Tổ hợp lồi của hai từ
Cn Tổ hợp lồi của n từ
C, C 2 Tổ hợp lồi của hai ILL
C n Tổ hợp lồi của n ILL
h Điểm (của giá trị mờ trực cảm,
từ trực cảm hoặc số ngôn ngữ trực cảm, tùy trường hợp)
ILL−AA Trung bình số học cho các ILL
ILL−HA Toán tử gộp lai cho cho các ILL
ILL−MED Trung vị của các ILL
ILL−OWA1 Toán tử OWA cho các ILL trong S
Trang 12ILL−OWA 2 Toán tử OWA cho các ILL trong ¯ S
ILL−WAA Trung bình số học có trọng số cho các ILL
ILL−WMED Trung vị có trọng số của các ILL
ILN−HA Toán tử gộp lai cho các ILN
ILN−OWA Toán tử OWA cho các ILN
ILN−WAA Trung bình số học có trọng số cho các ILN
ILV Giá trị ngôn ngữ trực cảm
ILV−AA Trung bình số học cho các ILV
ILV−WAA Trung bình số học có trọng số cho các ILV
LA Toán tử trung bình cho các từ mở rộng
LCA Thuật toán phân lớp dựa trên độ tương tự véc-tơ từ LOWA 1 Toán tử OWA cho các từ
LOWA 2 Toán tử OWA cho các từ mở rộng
LWA Trung bình có trọng số cho các từ mở rộng
Trang 13S Tập hợp tất cả các véc-tơ từ có độ dài n
S Tập hợp các ILL với chỉ số rời rạc
¯
S Tập hợp các ILL với chỉ số liên tục
TAM Trung bình cho cặp ngôn ngữ
TOWA Toán tử OWA cho cặp ngôn ngữ
TWA Trung bình có trọng số cho cặp ngôn ngữ
Trang 14Mở đầu
1 Sơ lược về tính toán với từ
Thông thường, khi đánh giá một đối tượng nào đó, người ta hay quan tâm đếncác chỉ tiêu định lượng Chẳng hạn, khi đánh giá một dự án, ta có thể xét đến một
số chỉ tiêu như tổng vốn đầu tư, thời gian hoàn vốn Để đánh giá học sinh, giáoviên thường sử dụng điểm số môn học, đó cũng là những chỉ tiêu định lượng.Bên cạnh các chỉ tiêu định lượng, ta cũng cần quan tâm đến các chỉ tiêu địnhtính Ví dụ như đối với dự án công nghệ thông tin, một số chỉ tiêu định tính làtính may rủi, tính khả thi và tính tương thích Ngoài việc đánh giá học sinh theođiểm trung bình môn học, người ta còn đánh giá theo những tiêu chí định tínhnhư ý thức đạo đức, các kỹ năng mềm
Trong nhiều tình huống, việc quy đổi một chỉ tiêu định tính sang định lượng
là không hợp lý Đơn cử, khi muốn đánh giá đạo đức của học sinh, không thể yêucầu giáo viên cho điểm trên thang điểm 10 Khi ấy, một cách tiếp cận khoa học,khách quan, tương đối dễ thực hiện là để các cố vấn, chuyên gia phát biểu bằngcác từ như vẫn dùng trong ngôn ngữ thông thường Ví dụ, độ may rủi của một
dự án có thể được chuyên gia đánh giá bằng từ trong tập dưới đây:
S =hầu_như_không, rất_thấp, thấp, trung_bình, cao, khá_cao, rất_cao (1)
Tính toán trên tập S như ở (1) được gọi là Tính toán với từ (Computing with
word, CW) CW, lần đầu được Zadeh [69] đưa ra vào năm 1973, là quá trình tính
toán với các đối tượng là các từ và mệnh đề trong ngôn ngữ tự nhiên như là
“nhỏ”, “to”, “đắt”, “hoàn toàn có thể”, hay phức tạp hơn như “ngày mai nhiềumây và không lạnh lắm” Mục đích chính của CW là thu hẹp sự khác nhau giữacách lập luận của con người và phương pháp tính toán truyền thống
Trang 15Trên thế giới, có nhiều hướng để thực hiện CW Người ta hay dùng tập từ
để đánh giá là S = s0, s1, , sg , trong đó số phần tử của S thường là số lẻ,mỗi si (i = 0, , g) ký hiệu cho một giá trị bằng từ của biến ngôn ngữ (linguistic
variable) [70] Sau đây là một số tiếp cận cơ bản:
1 Dựa trên thứ tự giữa các từ: Yager [61] coi các từ liên quan đến một biến ngôn ngữ là thông tin có thứ tự (ordinal information) Thành thử, các kỹ
thuật tính toán cho thông tin có thứ tự có thể áp dụng để tính toán với từ.Các phép toán đơn giản nhất theo tiếp cận này là max, min, neg (phủ định)
và med (trung vị) Dựa trên các phép toán cơ bản, người ta xây dựng cáctoán tử gộp
2 Dựa trên Nguyên lý Suy rộng: Biến ngôn ngữ cho tương ứng mỗi từ với một
hàm thuộc Do đó, CW có thể được đưa về tính toán trên hàm thuộc Cụ thểhơn, CW được thực hiện như sau [20]:
Sn −→ F (F˜ R) app−→1 S (2)Trong đó, ˜Flà suy rộng (theo Nguyên lý Suy rộng của Zadeh [70]) từ mộttoán tử F nào đó.F (R)là tập các số mờ, app1là phép xấp xỉ một số mờ bởimột từ
3 Dựa trên chỉ số của các từ: CW dựa trên chỉ số của các từ được mô tả như
sau [20]:
Sn −→ [c 0, g]−→ {app2 0, 1, , g} −→S (3)Trong đó, c là toán tử gộp chỉ số của các từ app2 là một phép xấp xỉ, trả vềmột số thuộc tập{0, 1, , g}, số này ứng với một từ trong S
4 Dựa trên cặp ngôn ngữ: Các tiếp cận trước đều có nhược điểm là làm mất
thông tin, dẫn đến kết quả cuối cùng kém chính xác Để khắc phục điềunày, Herrera và Martínez [20] đề xuất một cách mới để biểu diễn từ, đó là
biểu diễn theo cặp ngôn ngữ (linguistic 2-tuples) Theo đó thì thông tin ngôn
ngữ được biểu diễn bằng một cặp có dạng(si, e), trong đó si ∈ Slà một từ
và số e là hệ số sai khác (symbolic translation), được dùng để đo sự khác biệt
giữa thông tin ngôn ngữ và từ si
Trang 165 Dựa trên các từ mở rộng: Năm 2004, Xu [54] mở rộng tập từ rời rạc với chỉ
số đối xứng S = ns−g
2, , s0, , sg
2
o(tập từ gốc) thành tập từ với chỉ sốliên tục ¯S = sα
α ∈
−g2,g2 (tập từ mở rộng).Với mỗi sα ∈ S, nếu s¯ α ∈ Sthì ta nói sα là từ gốc (original linguistic term), ngược lại, s α là từ ảo (virtual
linguistic term) Với cải tiến này, thông tin sẽ được bảo toàn trong quá trình
gộp Xu cho rằng, “nói chung, người ra quyết định (decision maker) sử dụng
các từ gốc để đánh giá các phương án và từ ảo chỉ xuất hiện trong quá trìnhtính toán”
Cho tới nay, CW đã và đang được tiếp tục nghiên cứu và ứng dụng trong
nhiều lĩnh vực như ra quyết định (decision making), tìm kiếm thông tin, xếp hạng
trong giáo dục,
Ở trong nước, từ năm 1999 đến nay, đã có một số nghiên cứu về toán tử gộpthông tin cho bằng từ Tiêu biểu là các công trình về nghiệm tập thể mờ và ứngdụng của tác giả Bùi Công Cường và các cộng sự [12, 13]
2 Mục đích của luận án
1 Nghiên cứu một hướng mới của tính toán với từ
Theo các nghiên cứu truyền thống, CW chỉ dừng lại ở biểu diễn và tính toán trên
các từ đơn lẻ Các tiếp cận ấy là cần thiết để xây dựng cơ sở lý thuyết ban đầucho CW, tuy nhiên, không đủ để giải quyết các bài toán ra quyết định ngày càngphức tạp đang được đặt ra Lý do dẫn đến hạn chế của các phương pháp truyềnthống khởi nguồn từ yêu cầu ngày càng cao và phức tạp của các bài toán ra quyếtđịnh với thông tin cho bằng từ, cụ thể:
• Cùng với sự bùng nổ thông tin, chúng ta đang phải đối mặt với những bàitoán ra quyết định có kích cỡ lớn, có thông tin đầu vào đa dạng, không rõràng
• Chuyên gia, hiểu rộng ra là những người cung cấp đánh giá, có hiểu biết
về bài toán và cách cho ý kiến rất khác nhau Trong thực tế, họ cho nhữngđánh giá theo những cách không giống nhau, không đơn thuần là một từ
Trang 17• Ngoài ra, với sự gia tăng của kích cỡ bài toán ra quyết định, thông tin chobằng từ rất cần mô hình biểu diễn và xử lý thích hợp giúp giảm thiểu chiphí tính toán.
Ta thấy, các hạn chế chính của CW theo các tiếp cận cũ nảy sinh ở chỗ: Một
từ đơn lẻ không đủ biểu diễn ý kiến của chuyên gia Một trong các cách để khắc
phục điều này là kết hợp CW với các khái niệm mở rộng của tập mờ: tập mờ
loại hai (type-2 fuzzy set) [1, 32, 38, 39], tập mờ trực cảm (intuitionistic fuzzy set) [10, 26, 36, 37, 46, 47, 71], tập mờ lưỡng lự (hesitant fuzzy set) [41, 48–50],
Luận án nghiên cứu CW có kết hợp với tập mờ trực cảm Khi kết hợp CW vớitập mờ trực cảm, ta có thông tin bằng từ có yếu tố trực cảm; nghĩa là ngoài thànhphần ngôn ngữ, còn có thành phần thuộc và thành phần không thuộc Một sốkhái niệm đã được đưa ra để mô hình hóa và giải quyết bài toán ra quyết định
với thông tin dạng này là giá trị ngôn ngữ trực cảm (intuitionistic linguistic value, ILV) [71] và số ngôn ngữ trực cảm (intuitionistic linguistic number, ILN) [46] Như
ta thấy, có nhiều cách biểu diễn thông tin cho bằng từ Do vậy, cần khảo sát cáccách biểu diễn thông tin cho bằng từ có yếu tố trực cảm về ngữ nghĩa cũng như
ảnh hưởng của chúng đến quá trình tính toán Nghiên cứu sinh đề xuất từ trực
cảm (intuitionistic linguistic label, ILL), ILL cũng là một cách biểu diễn thông tin
bằng từ có yếu tố trực cảm Khái niệm ILL góp phần bổ sung cơ sở lý thuyết chotính toán với từ có yếu tố trực cảm Trong khi triển khai nghiên cứu về ILL chúngtôi chú ý tới:
• Chứng tỏ khả năng biểu diễn và xử lý thông tin của ILL Các nghiên cứuliên quan đến luận án chỉ ra rằng: Trong các bài toán ra quyết định, ta hoàntoàn có thể thay thế ILV và ILN bởi ILL
• Về tính thực tiễn, để chỉ ra việc đề xuất ILL là thực sự có ý nghĩa, cần chỉ ra
ưu điểm của ILL so với với ILV và ILN khi giải bài toán ra quyết định.Các vấn đề nói trên sẽ được trình bày trong Chương 2 của luận án
2 Đề xuất, nghiên cứu lý thuyết và ứng dụng độ đo tương tự cho từ
Một vấn đề quan trọng nữa được nghiên cứu sinh quan tâm là xây dựng độ tương
tự từ (linguistic similarity measure) và ứng dụng Về lý thuyết, độ tương tự từ một
Trang 18mặt là phần phát triển tiếp theo của độ tương tự mờ (fuzzy similarity measure)
và độ tương tự mờ trực cảm (intuitionistic fuzzy similarity measure), mặt khác làm
giầu thêm kiến thức đã có về CW Về khả năng ứng dụng, độ tương tự từ cungcấp công cụ mới để giải bài toán phân lớp thông tin cho bằng từ và tổng quát hơn
là thông tin có thứ tự
Độ tương tự (similarity measure) là khái niệm quan trọng để mô tả mức độ
giống nhau giữa các đối tượng, có nhiều ứng dụng trong các bài toán liên quanđến nhận dạng mẫu như phân cụm, phân lớp dữ liệu và tìm kiếm thông tin.Trong thực tế, khi làm việc với những đối tượng không rõ ràng, mơ hồ, ta cần độtương tự mờ thay vì sử dụng các độ đo truyền thống (rõ) Độ tương tự mờ và độtương tự mờ trực cảm đã xuất hiện từ lâu, tuy nhiên, rất gần đây mới được tiên
đề hóa thành các khái niệm và nghiên cứu kỹ lưỡng về mặt lý thuyết trong cáccông trình của Baccour [3, 4] vào các năm 2014 và 2016 Các khái niệm được đưa
ra trong [3, 4] cho ta cơ sở Toán học về độ tương tự mờ và mờ trực cảm
Như đã nói, độ tương tự mờ, độ tương tự mờ trực cảm có thể ứng dụng trongbài toán phân lớp thông tin mờ Trong nhiều trường hợp, thông tin là định tính(cho bằng từ) Yêu cầu phân lớp thông tin cho bằng từ gợi ý đề xuất độ tương
tự từ Thực nghiệm chỉ ra, độ tương tự từ cho kết quả tốt trong bài toán phânlớp thông tin cho bằng từ Mặt khác, vì thông tin cho bằng từ là trường hợp đặcbiệt của thông tin có thứ tự nên khái niệm mới cũng có thể sử dụng để phân lớpthông tin có thứ tự
Những nghiên cứu về độ đo tương tự từ và một số mở rộng sẽ được trình bày
ở Chương 3 của luận án
Tất cả kết quả liên quan đến luận án đã được trình bày tại:
• Bộ môn Tin học, Khoa Toán - Cơ - Tin học, Trường Đại học Khoa học Tựnhiên, Đại học Quốc gia Hà Nội;
• Xê-mi-na Hệ mờ nơ-ron và ứng dụng, Viện Toán Ứng dụng và Tin học, Đạihọc Bách khoa Hà Nội
Các công bố liên quan đến nội dung luận án gồm 9 công trình khoa học Trong
đó có 2 bài báo trên tạp chí quốc tế (SCIE), 4 bài báo trên tạp chí trong nước (2 bàitrên Tạp chí Tin học và Điều khiển học, 2 bài trên Chuyên san Công nghệ thông
Trang 19tin và Truyền thông thuộc Tạp chí Khoa học, ĐHQGHN) và 3 báo cáo tại hội thảoquốc tế (2 kỷ yếu của IEEE, 1 kỷ yếu của Springer).
3 Cấu trúc của luận án
Luận án được viết thành ba chương
1 Chương 1 trình bày tổng quan về lý thuyết mờ và tính toán với từ, là cơ sở
lý thuyết phục vụ cho các chương sau Nội dung của chương đề cập đến bamảng lý thuyết:
• Lý thuyết mờ và mờ trực cảm;
• Toán tử gộp thông tin cho bằng từ;
• Phân lớp dựa trên độ tương tự mờ
2 Chương 2, là đóng góp thứ nhất của luận án, đề xuất khái niệm ILL và ứngdụng trong bài toán ra quyết định tập thể Chương này bao gồm các nộidung:
• Đề xuất ILL mà một số phép toán cơ bản làm nền tảng để xây dựngcác toán tử gộp;
• Định nghĩa các toán tử gộp cho ILL;
• So sánh ILL với ILV và ILN
3 Chương 3, liên quan đến các đóng góp còn lại của luận án, được chia thànhcác phần:
• Đề xuất độ tương tự từ, độ tương tự véc-tơ từ và Thuật toán LCA;
• Đề xuất độ tương tự giá trị mờ trực cảm, độ tương tự véc-tơ mờ trựccảm và Thuật toán IFVSM;
• Thực nghiệm: Đánh giá các thuật toán LCA, IFVSM
Trang 20Chương 1
Tổng quan về lý thuyết mờ và tính toán với từ
Chương này điểm lại các kiến thức liên quan trực tiếp đến hai chương còn lại,gồm bốn phần:
1 Sơ lược về lý thuyết mờ và mờ trực cảm;
2 Toán tử gộp thông tin cho bằng từ;
3 Phân lớp dựa trên độ tương tự mờ;
4 Kết luận chương
1.1 Sơ lược về lý thuyết mờ và mờ trực cảm
1.1.1 Tập mờ, số mờ và biến ngôn ngữ
1.1.1.1 Tập mờ
Năm 1965, Zadeh đưa ra khái niệm tập mờ (fuzzy set) [68] bằng cách mở rộng
hàm đặc trưng (nhận một trong hai giá trị 0 và 1, cho biết một phần tử thuộc haykhông thuộc một tập hợp) thành hàm thuộc (nhận giá trị thuộc đoạn [0, 1], xácđịnh độ thuộc của một phần tử vào một tập hợp) Cụ thể, ta có định nghĩa sau
Định nghĩa 1.1. [68] Cho tập X 6= ∅ Tập mờ A trên X được định nghĩa bởi hàm
µA : X → [0, 1] Họ tất cả các tập mờ trên X được ký hiệu là F (X)
Trong Định nghĩa 1.1, tập X được gọi là không gian nền (universe of discourse).
Hàm µAlà hàm thuộc (membership function) Với mỗi x ∈ X, số thực µA(x) ∈ [0, 1]
là độ thuộc (membership degree) của phần tử x vào tập mờ A.
Trang 21Trên cơ sở mở rộng các tính chất của hàm đặc trưng trên tập hợp theo nghĩathông thường, Zadeh [68] định nghĩa các quan hệ và phép toán cơ bản cho tập
Số mờ (fuzzy number) là một trường hợp riêng quan trọng của tập mờ Số mờ là
tập mờ trên tập các số thựcR, thỏa mãn thêm một số điều kiện nhằm phát triển
những khái niệm của Số học và Giải tích Định lý 1.1 sau đây cho biết dạng tổngquát của số mờ
Định lý 1.1 [33] Xét A∈ F (R) A là một số mờ khi và chỉ khi tồn tại đoạn[a, b] 6= ∅
Trang 221 l : (−∞, a) → [0, 1]là hàm đơn điệu tăng, liên tục phải trên (−∞, a), và tồn tại
ω1 ≤ a sao cho l(x) = 0 với mọi x ∈ (−∞, ω1);
2 r : (b,+∞) → [0, 1]là hàm đơn điệu giảm, liên tục trái trên (b,+∞), và tồn tại
ω2 ≥b sao cho r(x) = 0 với mọi x∈ (ω2,+∞).
Hai dạng số mờ hay được sử dụng nhất là số mờ tam giác (triangular-shape
fuzzy number) và số mờ hình thang (trapezoidal-shape fuzzy number).
Định nghĩa 1.3. 1 Số mờ tam giác A = (a1, a2, a3) (với a1 < a2 < a3) là số mờ
Để thực hiện các phép toán số học cho các số mờ, người ta thường sử dụng
hai tiếp cận: Số học đoạn (interval arithmetic) và Nguyên lý suy rộng của Zadeh
(Zadeh’s Extension Principle) [70].
Định nghĩa 1.4. [70] Xét các tập khác rỗng Xi (i = 1, , n) và Y Ký hiệu X làtích Đề-các X = ∏n
Trang 23Tập mờ B∈ F (Y)được xác định thông qua các tập mờ Ai ∈ F (Xi)(i =1, , n)
và hàm F như sau:
µB(y) = sup
{ x∈X|y=F(x)}
mini=1, ,n
µAi(xi)
,∀y∈ Y
1.1.1.3 Biến ngôn ngữ
Theo Zadeh [70], biến ngôn ngữ (linguistic variable) là biến mà giá trị của nó không phải số mà là từ (word) hay câu (sentence) trong ngôn ngữ tự nhiên Nói chung, từ
hay câu đều không rõ ràng bằng số, tuy nhiên lại gần với cách mà con người hiểu
và giải thích thế giới thực Sau đây là khái niệm biến ngôn ngữ do Zadeh đưa ravào năm 1975
Định nghĩa 1.5. [70] Biến ngôn ngữ là một bộ năm có dạng (L, T(L), X, G, M),trong đó:
1 L là tên của biến ngôn ngữ;
2 T(L)là tập các giá trị bằng từ của biến ngôn ngữ;
3 X là không gian nền, gồm tất cả các giá trị bằng số của biến ngôn ngữ;
4 G là quy tắc cho phép sinh các từ trong T(L); và
5 M : T(L) → F (X) là một luật ngữ nghĩa, cho tương ứng mỗi từ s trong
T(L)vào một tập mờ trên X
Ví dụ 1.1 Trong Hình 1.1 (Trang 11), biến ngôn ngữ L = “Heịght” có tập các giá trị bằng từ là T(L) = {Very_Low, Low, Medium, High, Very_High} X là tập hợp các giá trị bằng số của “Height” Nhờ luật ngữ nghĩa M, mỗi từ trong T(L) được ánh xạ vào một tập mờ trên X.
1.1.2 Tập mờ trực cảm và giá trị mờ trực cảm
Năm 1986, Atanassov [2] khái quát tập mờ của Zadeh thành tập mờ trực cảm
(intuitionistic fuzzy set, IFS) Mỗi tập mờ trực cảm được đặc trưng bởi hàm thuộc
và hàm không thuộc (non-membership function).
Trang 24Hình 1.1: Biến ngôn ngữ “Heịght”
Định nghĩa 1.6. [2] Cho X 6= ∅, mỗi tập mờ trực cảm A trên X được định nghĩa bởi hàm thuộc µA : X → [0, 1] và hàm không thuộc νA : X → [0, 1] sao cho
0≤ µA(x) +νA(x) ≤ 1 với mọi x ∈ X Họ tất cả những tập mờ trực cảm trên Xđược ký hiệu làI F (X)
Với mỗi x ∈ X, các đại lượng µA(x), νA(x)và πA(x) = 1−µA(x) −νA(x)
lần lượt được gọi là độ thuộc (membership degree), độ không thuộc (nonmembership
degree) và độ lưỡng lự (indeterminancy degree) của x vào tập A.
Rõ ràng rằng, tập mờ là trường hợp đặc biệt của tập mờ trực cảm khi cho độlưỡng lự của mỗi phần tử x vào tập hợp đó bằng không
Sau đây là một số khái niệm cơ bản trên tập mờ trực cảm
Định nghĩa 1.7. [2] Cho hai tập mờ trực cảm A, B ∈ I F (X)
1 A được gọi là tập con của B, ký hiệu là A ⊂ B, nếu:
µA(x) ≤ µB(x), νA(x) ≥ νB(x),∀x ∈ X;
2 A và B được gọi là bằng nhau, ký hiệu là A = B, nếu A ⊂ Bvà B ⊂ A;
Trang 253 Phần bù của A là tập mờ trực cảm ¯A ∈ I F (X)sao cho:
µA¯ (x) = 1−µA(x), νA¯ (x) = 1−νA(x),∀x∈ X;
4 Giao của A và B là tập mờ trực cảm A∩B ∈ I F (X)mà:
µA∩B(x) = min(µA(x), µB(x)), νA∩B(x) = max(νA(x), νB(x)),∀x∈ X;
5 Hợp của A và B là tập mờ trực cảm A∪B ∈ I F (X)thỏa mãn:
µA∪B(x) = max(µA(x), µB(x)), νA∪B(x) = min(νA(x), νB(x)),∀x∈ X
Theo định nghĩa tập mờ trực cảm thì quan hệ giữa phần tử x ∈ Xvới tập mờtrực cảm A được đặc trưng bởi cặp (µA(x), νA(x)) Đây là cặp số không âm có
tổng không vượt quá 1 Mỗi cặp như vậy được Xu [58] gọi là một giá trị mờ trực
cảm (intuitionistic fuzzy value, IFv).
Định nghĩa 1.8. [58] Cặp số α = (µ α , ν α)được gọi là một giá trị mờ trực cảm (IFv) nếu µ α , ν α ∈ [0, 1]và:
Xét α1 = (µ α1, ν α1)và α2 = (µ α2, ν α2)là hai IFv α1 và α2 được gọi là bằng nhau, ký hiệu α1 =α2, nếu µ α1 =µ α2 và ν α1 =ν α2 Tập hợp tất cả các IFv được ký hiệu là θ.
Để so sánh hai giá trị IFv, người ta dùng điểm (score) và độ chắc chắn (confident
degree) như trong Định nghĩa 1.9.
Định nghĩa 1.9. 1 Điểm của α ∈ θ, ký hiệu là h(α), được định nghĩa nhưsau [9]:
Khi đó, hàm h : θ → [−1, 1]được gọi là hàm điểm (score function).
2 Độ chắc chắn của α ∈ θ, ký hiệu là H(α), được định nghĩa như sau [24]:
Khi đó, hàm H : θ → [0, 1]được gọi là hàm chắc chắn (confident function).
Trang 26Từ định nghĩa, ta thấy hàm điểm đạt giá trị lớn nhất bằng 1 tại α+ = (1, 0)vàđạt giá trị nhỏ nhất bằng−1 tại α− = (0, 1).
Có thể thấy rằng, không thể sắp thứ tự toàn phần cho các IFv nếu chỉ dựavào hàm điểm vì mỗi giá trị của hàm điểm không xác định duy nhất một IFv
Chẳng hạn, hai IFv khác nhau α1 = (0.6, 0.2) và α2 = (0.7, 0.3) có cùng điểm
h(α1) = h(α2) = 0.4 Để khắc phục điều này, Xu và Yager [57] (2006) đề xuất mộtphương pháp sắp xếp các IFv dựa trên cả điểm và độ chắc chắn
Định nghĩa 1.10. [57] Xét α1, α2 ∈ θ Khi đó, α1 được gọi là lớn hơn hoặc bằng α2,
ký hiệu α1 ≥ α2, nếu:
1 h(α1) > h(α2); hoặc
2 h(α1) = h(α2)và H(α1) ≥ H(α2)
Dễ thấy, quan hệ≥ở Định nghĩa 1.10 là một quan hệ thứ tự toàn phần
1.2 Toán tử gộp thông tin cho bằng từ
Trong Định nghĩa 1.5, mỗi từ được gán với một tập mờ nhờ luật ngữ nghĩa M,nói cách khác, mỗi từ là một hàm thuộc Ngoài biểu diễn bằng hàm thuộc, còn
có nhiều cách biểu diễn thông tin cho bằng từ Gộp thông tin cho bằng từ phụthuộc nhiều vào cách biểu diễn thông tin cho bằng từ Trong mục này, chúng tôitrình bày tổng quan về biểu diễn và gộp thông tin cho bằng từ
1.2.1 Gộp dựa trên thứ tự giữa các từ
Ta ký hiệu tập từ liên quan đến biến ngôn ngữ L là S Trên S có sẵn một quan
hệ thứ tự thông thường Các từ được đánh chỉ số sao cho thứ tự giữa các chỉ sốchính là thứ tự theo ý nghĩa thông thường giữa các từ Nếu chọn tập chỉ số là
{0, 1, , g} thì tập từ S có dạng S = s0, s1, , sg
Ví dụ 1.2 Trong Ví dụ 1.1 (Trang 10), tập từ liên quan đến biến ngôn ngữ “Height” là
S = {very_low, low, medium, high, very_high} Theo nghĩa thông thường, ta có quan
hệ thứ tự giữa các từ:
very_low <low < medium <high <very_high.
Trang 27Vì vậy, nếu lấy tập chỉ số là{0, 1, 2, 3, 4}thì các từ được đánh số như dưới đây:
s0 = very_low, s1 = low, s2 =medium, s3 =high, s4 = very_high.
Yager [61, 63] định nghĩa các phép toán cơ bản trên S Giả sử (a1, , an) làmột bộ các từ, nghĩa là ai ∈ S (i = 1, , n) Ký hiệu bj là phần tử lớn thứ j củacác ai, ta có b1 ≥b2 ≥ · · · ≥bn
1 Phép phủ định: neg(si) = sg−i, với mọi si ∈ S;
2 Phép toán max: max(a1, , an) = b1;
3 Phép toán min: min(a1, , an) = bn;
từ trên S Một số toán tử gộp tiêu biểu là trung vị có trọng số cho các từ
(linguis-tic weighted median, LWM) [66], toán tử OWA dựa trên thứ tự cho các từ (ordinal OWA operator, OOWA) [63], phép tuyển và phép hội có trọng số cho các từ (lin- guistic weighted disjunction và linguistic weighted conjunction, LWD và LWC) [19],
toán tử gộp lai dựa trên thứ tự cho các từ (ordinal hybrid aggregation operator,
OHA) [53], Toán tử OOWA đã được ứng dụng trong bài toán ra quyết địnhtập thể [65], gộp dữ liệu về nghiên cứu thị trường [64], Các toán tử LWD vàLWC được sử dụng để phát triển hệ thống tìm kiếm thông tin với các câu truyvấn được mô tả bằng từ [23],
Nhận xét 1.1 Các toán tử gộp dựa trên thứ tự không phụ thuộc vào tập chỉ số của các
từ Nếu chọn chỉ số của các từ sao cho chiều tăng của chỉ số là chiều tăng của các từ theo nghĩa thông thường, thì dù chọn tập chỉ số thế nào, kết quả của phép gộp vẫn không đổi.
Để làm rõ điều này, ta xét toán tử OOWA ở Định nghĩa 1.11 Toán tử OOWA được định nghĩa thông qua các phép toán max và min Với mọi cách đánh chỉ số, phép toán max luôn trả về từ có chỉ số cao hơn, trong khi phép toán min cho kết quả là từ có chỉ số nhỏ hơn Do đó, OOWA độc lập với cách đánh chỉ số các từ.
Trang 28Định nghĩa 1.11. [63] Xét w = (w1, , wn) là véc-tơ trọng số thỏa mãn wi ∈ Svới mọi i = 1, , n; nếu i > j thì wi ≥ wj và max
i=1, ,n(wi) = sg Khi ấy, toán tửOOWA có véc-tơ trọng số w là ánh xạ OOWA : Sn → Sđược định nghĩa bởi:
OOWA(a1, , an) = max
j=1, ,n min wj, bj Trong đó, bjlà phần tử lớn thứ j của các ai
Ví dụ 1.3 Xét S= {s0, s1, , s6}và w = (s0, s2, s3, s4, s6), ta có
OOWA(s0, s5, s4, s1, s2) =max(min(s0, s5), min(s2, s4),
min(s3, s2), min(s4, s1), min(s6, s0))
=max(s0, s2, s2, s1, s0)
=s2
1.2.2 Gộp dựa trên Nguyên lý Suy rộng
Hướng nghiên cứu này xuất hiện trong các công bố của Bonissone và Decker [6],Bordogna và Passi [5], Chang và Chen [8], Lee [35], Đây là tiếp cận sử dụngNguyên lý Suy rộng, gồm khai khâu:
• Mỗi từ được đồng nhất với một số mờ Các số mờ được gộp nhờ hàm ˜Fvới
Quá trình gộp nói trên được Herrera và Martínez [20] mô tả như sau:
Sn −→ F (F˜ R)app−→1(·) S (1.4)Toán tử gộp thông tin cho bằng từ dựa trên Nguyên lý Suy rộng đã được
ứng dụng rộng rãi trong nhiều bài toán: quản lý công nghệ sinh học (biotechnology
management) [8], phát triển phần mềm (software development) [35], hệ thống xếp
hạng giáo dục (educational grading system) [34],
Trang 291.2.3 Gộp dựa trên chỉ số của các từ
Quá trình gộp có sử dụng toán tử gộp dựa trên chỉ số của các từ được mô tả nhưdưới đây [20]:
Sn −→ [c 0, g]app−→ {2(·) 0, 1, , g} −→S (1.5)Trong đó:
• c là toán tử gộp chỉ số của các từ, cho tương ứng n chỉ số với một số thựcthuộc đoạn[0, g];
• app2(·) là một phép xấp xỉ, cho tương ứng mỗi số thực thuộc đoạn [0, g]
với số nguyên thuộc tập {0, 1, , g}, số nguyên này ứng với một từ trongS
Dựa trên toán tử OWA [62] và tổ hợp lồi của các từ [15], năm 1993, Herrera và
Herrera-Viedma [18] đưa ra toán tử OWA cho các từ (linguistic ordered weighted
averaging operator, LOWA1) Từ Định nghĩa 1.13 trở đi, véc-tơ trọng số được hiểu
là véc-tơ với các thành phần không âm, có tổng các thành phần bằng 1
Định nghĩa 1.12. Véc-tơ w = (w1, , wn) ∈ Rn được gọi là véc-tơ trọng số nếu
Trang 302 Với n = 2:
C2{wk, bk; k =1, 2} = w1⊗sj ⊕w2⊗si = sk.Trong đó, sj = b1, si =b2 và k = i+round[w1(j−i)]với round là hàm làmtròn thông thường
Có nhiều cách xác định trọng số cho toán tử LOWA1, tổng quan về vấn đề nàyđược nêu trong bài báo của Xu [55] vào năm 2005 Herrera và Herrera-Viedma[19] chứng minh toán tử LOWA1 thỏa mãn các tính chất: đơn điệu tăng, giaohoán và bị chặn bởi các toán tử max và min Toán tử LOWA1 chủ yếu được ứngdụng trong các bài toán ra quyết định với thông tin cho bằng từ [16]
Ví dụ 1.4 Xét S = {s0, s1, s2, s3, s4} Ta sẽ gộp các từ a1 = s2, a2 = s4, a3 = s1 và
a4 =s3 bằng toán tử LOWA1 với véc-tơ trọng số là w= (0.3, 0.4, 0.1, 0.2).
Sắp xếp các ai theo thứ tự giảm dần ta được b1 =s4, b2 =s3, b3 =s2 và b4 = s1 Ta có:
Trang 311.2.4 Gộp dựa trên biểu diễn theo cặp ngôn ngữ
Ta thấy các nhóm toán tử gộp dựa trên Nguyên lý Suy rộng và dựa trên chỉ sốđều có nhược điểm là làm mất thông tin, dẫn đến kết quả cuối cùng kém chính
xác Để khắc phục điều này, Herrera và Martínez [20] đề xuất biểu diễn theo cặp
ngôn ngữ (linguistic 2-tuples) Theo đó thì thông tin cho bằng từ được biểu diễn
bằng một cặp có dạng(si, e), với si ∈ Slà một từ và số e là hệ số sai khác (symbolic
translation), e được dùng để đo sự khác giữa thông tin ngôn ngữ và từ si
Định nghĩa 1.14. [20] Xét S là một tập từ, β ∈ [0, g] là kết quả gộp chỉ số của
các từ theo Sơ đồ 1.5 (Trang 16) Cặp ngôn ngữ (si, e), biểu diễn thông tin tương
đương với β, được xác định nhờ hàm∆ như sau:
∆ : [0, g] → S× [−0.5, 0.5), β 7→ (si, e).Trong đó, i = round(β)và e = β−i Số e được gọi là hệ số sai khác giữa β và từ
si
Ví dụ 1.5 Xét β= 4.45 Ta có i =round(β) = 4 và β−i =4.45−4=0.45 Do đó, cặp ngôn ngữ tương ứng là∆(β) = (s4, 0.45).
Rõ ràng,∆ có hàm ngược ∆−1 cho phép xác định thông tin tương đương bằng
số cho mỗi cặp ngôn ngữ(si, e):
∆−1 : S× [−0.5, 0.5) → [0, g],∆−1(si, e) = i+e. (1.10)
Ví dụ 1.6. ∆−1(s3, 0.3) = 3+0.3 = 3.3.
Herrera và Martínez [20] định nghĩa quan hệ thứ tự và các toán tử gộp trêncặp ngôn ngữ:
1 Quan hệ thứ tự: Xét hai cặp ngôn ngữ(si, e1)và sj, e2.(si, e1)được gọi là
nhỏ hơn sj, e2, ký hiệu (si, e1) < sj, e2, nếu
(a) si <sj; hoặc
(b) si =sj và e1 < e2
2 Phép phủ định: Phủ định của cặp ngôn ngữ (si, e)được định nghĩa như sau:
neg(si, e) = ∆g−∆−1(si, e) (1.11)
Trang 323 Toán tử trung bình: Toán tử trung bình cho cặp ngôn ngữ (2-tuple averaging
operator) được ký hiệu là TAM và được định nghĩa như sau:
4 Toán tử trung bình có trọng số: Toán tử trung bình có trọng số cho cặp ngôn
ngữ (2-tuple weighted averaging operator) được ký hiệu là TWA và được định
Trong đó,(ri, ei)là những cặp ngôn ngữ (i = 1, , n), w = (w1, , wn)làvéc-tơ trọng số Ta thấy, toán tử TAM là toán tử TWA khi w =1n, ,n1
5 Toán tử OWA: Toán tử OWA cho cặp ngôn ngữ (2-tuple OWA) được ký hiệu
là TOWA và được định nghĩa như sau:
TOWA((r1, e1), ,(rn, en)) = ∆ ∑n
j=1
wjβ∗j
!,
Trong đó, w = (w1, , wn) là véc-tơ trọng số β∗j là phần tử lớn thứ j của
chỉ số liên tục bằng cách cho chỉ số của từ nhận các giá trị thực bắt đầu từ chỉ sốnhỏ nhất đến chỉ số lớn nhất của các phần tử trong tập từ rời rạc
Ví dụ 1.7 Ở Hình 1.2, tập từ gốc S= {s−3, , s0, , s3}được mở rộng thành tập từ
mở rộng ¯S = {sα|α ∈ [−3, 3]} Ta thấy s−0.3 ∈ S là từ ảo.¯
Trang 33Hình 1.2: Tập từ mở rộngVới cải tiến này, thông tin sẽ được bảo toàn trong quá trình gộp Xu cho rằng,
“nói chung, người ra quyết định sử dụng các từ gốc để đánh giá các phương án, và từ
ảo chỉ xuất hiện trong quá trình tính toán” Sau đây là một số toán tử gộp cho các từ
Định nghĩa 1.16. [56] Toán tử trung bình có trọng số cho các từ mở rộng là ánh xạ
LWA : ¯Sn → S, được định nghĩa như sau:¯
1.2.6 Gộp thông tin cho bằng từ có yếu tố trực cảm
Thông tin cho bằng từ có yếu tố trực cảm, là sự kết hợp giữa CW truyền thốngvới khái niệm tập mờ trực cảm [2], bao gồm các yếu tố từ và trực cảm Như vậy,
Trang 34thông tin từ trực cảm bao gồm thành phần từ ngôn ngữ, độ thuộc và độ khôngthuộc Ta quan tâm đến hai khái niệm được đề xuất trong những năm gần đây:
giá trị ngôn ngữ trực cảm (intuitionistic fuzzy linguistic value, ILV) và số ngôn ngữ
trực cảm (intuitionistic linguistic number, ILN).
cố hữu Trong những tình huống như thế, đánh giá các phương án bằngmột tham số (độ thuộc) là không hợp lý Vì vậy, nên sử dụng giá trị mờ trựccảm (Định nghĩa 1.8, Trang 12);
• Trong nhiều tình huống, các chuyên gia không thể đưa ra đánh giá củamình bằng giá trị số Do đó, một cách tiếp cận thực tế hơn là sử dụng đánhgiá bằng từ
Trong bài toán với các đặc điểm nói trên, Zhang đề xuất sử dụng ILV Mỗi ILV
là hai cặp ngôn ngữ (xem Định nghĩa 1.14, Trang 18) lần lượt đặc trưng cho độthuộc và độ không thuộc Cụ thể ta có khái niệm sau
Định nghĩa 1.18. [71] Mỗi ILV là một cặp có dạngΓ= (si, e), sj, δ Trong đó,
(si, e), sj, δ là các cặp ngôn ngữ thỏa mãn(si, e) ≤ neg sj, δ, với neg là phép
phủ định của cặp ngôn ngữ (Công thức 1.11, Trang 18) Ký hiệuΠ là tập hợp tất
Trang 352 Độ chắc chắn: H(Γ) = ∆−1(si, e) +∆−1 sj, δ.
Trong đó,∆−1 là hàm chuyển cặp ngôn ngữ thành số (Công thức 1.10, Trang 18).Các ILV được so sánh dựa vào điểm và độ chắc chắn như trong Định nghĩa1.20
Định nghĩa 1.20. [71] Với Γ và Γ0 ∈ Π là hai ILV Ta nói Γ nhỏ hơn Γ0 và ký hiệu
Γ< Γ0 nếu:
1 h(Γ) < h(Γ0); hoặc
2 h(Γ) = h(Γ0)và H(Γ) < H(Γ0)
Zhang [71] đề xuất toán tử trung bình số học và toán tử trung bình số học có
trọng số cho các ILVđể giải quyết bài toán ra quyết định tập thể với các đánh giá
là ILV
Định nghĩa 1.21. [71] Ta xét Γ(1), ,Γ(n) là một bộ các ILV, giả sử Γ(i) =
r(i)1 , ei,r(i)2 , δi, với mọi i = 1, , n Toán tử trung bình số học cho các ILV là
ánh xạ ILV−AA :Πn → Π được xác định bởi:
r(i)1 , ei,r(i)2 , δi, i = 1, , n Toán tử trung bình số học có trọng số cho các ILV
là ánh xạ ILV−WAA : Πn → Π được cho như sau:
Trang 361.2.6.2 Số ngôn ngữ trực cảm
Một khái niệm khác cũng được sử dụng để biểu diễn thông tin bằng từ có yếu tốtrực cảm là ILN, được Wang và Li [46] đưa ra vào năm 2010 Ở định nghĩa dướiđây, ¯S ={sθ|θ ∈ [0, g]} là tập từ mở rộng của S =s0, s1, , sg
Định nghĩa 1.23. [46] Mỗi ILN có dạng α = Dsθ(α), µ(α), ν(α)E Trong đó,
sθ(α) ∈ S¯ là một từ có chỉ số là θ(α) ∈ [0, g] µ(α) ∈ [0, 1] và ν(α) ∈ [0, 1] lầnlượt là độ thuộc và độ không thuộc vào từ sθ(α)của đối tượng cần đánh giá µ(α)
và ν(α) thỏa mãn điều kiện µ(α) +ν(α) ≤ 1 Tập hợp tất cả các ILN được kýhiệu làΩ
Định nghĩa 1.24 cung cấp các phép toán cơ bản, làm cơ sở để định nghĩa cáctoán tử gộp cho các ILN
Định nghĩa 1.24. [46] Với các ILN α, β∈ Ω, ta có các định nghĩa sau:
1 Phép cộng: Với điều kiện θ(α) +θ(β) ≤ g, ta định nghĩa:
Định nghĩa 1.25. [47] Xét α ∈ Ω là một ILN Điểm và độ chắc chắn của α lần lượt
được ký hiệu là h(α) và H(α), được định nghĩa trong các Công thức (1.13) và(1.14)
Trang 37Các Định nghĩa 1.27, 1.28 và 1.29 nêu các toán tử gộp cho các ILN.
Định nghĩa 1.27. [47] Toán tử trung bình số học có trọng số cho các ILN là ánh xạ
ILN−WAA : Ωn → Ω được định nghĩa như sau:
ILN−WAAw(α1, , αn) = w1α1⊕ · · · ⊕wnαn (1.15)Trong đó, w = (w1, , wn)là một véc-tơ trọng số
Định nghĩa 1.28. [47] Toán tử OWA cho các ILN là ánh xạ ILN−OWA :Ωn → Ωđược định nghĩa như sau:
ILN−OWAw(α1, , αn) = w1β1⊕ · · · ⊕wnβn. (1.16)Trong đó, w = (w1, , wn) và một véc-tơ trọng số và βj là phần tử lớn thứ j của
Trong [47], các tác giả cũng chứng minh công thức tường minh cho các toán tửILN−WAA, ILN−OWA và ILN−HA Chẳng hạn, với (α1, , αn) là các ILN
Trang 38ν(¯α) =
n
∑i=1
wiθ(αi)ν(αi)
n
∑i=1
wiθ(αi)
Dựa vào các toán tử ILN−HA và ILN−WAA, Wang [47] phát triển một tiếpcận cho bài toán ra quyết định tập thể, trong đó các đánh giá là ILN
1.2.7 Ra quyết định với thông tin cho bằng từ
Ra quyết định là quá trình chọn một hay một số phương án trong các phương án,
dựa vào các đánh giá của các chuyên gia Trong bài toán ra quyết định đa tiêu chí
(multi-criteria decision making, MCDM), các chuyên gia cần đánh giá mỗi phương
án theo tất cả các tiêu chí Tính không chắc chắn và tính mờ trong suy nghĩ củacon người dẫn đến yêu cầu ra quyết định với thông tin cho bằng từ trong nhiềubài toán thực tế Năm 2000, Herrera và Herrera-Viedma [22] đề xuất mô hình giảibài toán ra quyết định tập thể với các đánh giá được cho bằng từ Mô hình gồmcác bước như sau (xem các Hình 1.3 và 1.4, Trang 26):
1 Xác định tập từ cùng với ngữ nghĩa của các từ Trong bước này, biến ngôn
ngữ [70] cùng với ngữ nghĩa được thiết lập, cung cấp cơ sở để đánh giá cácphương án theo nhiều tiêu chí khác nhau;
2 Lựa chọn các toán tử gộp thích hợp cho bài toán đang quan tâm Bước này
phụ thuộc vào các đặc trưng của bài toán và cách biểu diễn các từ;
3 Chọn ra một hay nhiều phương án tốt nhất Bước này được chia thành hai
Trang 39Hình 1.3: Các bước của bài toán ra quyết định tập thể
Hình 1.4: CW trong bài toán ra quyết đinh tập thể
2 Sử dụng quan hệ mờ về độ ưa thích hơn (fuzzy preference relation); và
3 Sử dụng hàm lợi ích (utility function).
Tùy theo bài toán và thói quen đánh giá, chuyên gia có thể sử dụng cách nàyhay cách khác; trong cùng một bài toán mỗi một chuyên gia có thể đánh giá theonhững cách khác nhau Thành thử, việc quy các đánh giá về một dạng chung làcông việc đầu tiên để giải bài toán ra quyết định tập thể Chiclana và các cộng
sự [11] chỉ ra, thứ tự về độ ưa thích hơn và hàm lợi ích có thể được chuyển thànhquan hệ mờ về độ ưa thích hơn Vì vậy, quan hệ mờ về độ ưa thích hơn thườngđược xem là đầu vào chuẩn của bài toán ra quyết định tập thể Năm 1998, Delgado
và các cộng sự bắt đầu nghiên cứu các tình huống mà các quan hệ mờ về độ ưathích hơn được cho bằng từ [16] Một số mô hình ra quyết định tập thể dựa vàoquan hệ mờ về độ ưa thích hơn là:
• Năm 2007, Xu [59] đưa ra khái niệm quan hệ mờ trực cảm về độ ưa thích hơn
(fuzzy intuitionistic preference relation) và ứng dụng trong bài toán ra quyết
định tập thể Trong đó, độ ưa thích hơn của mỗi cặp phương án được đánhgiá bằng một IFv;
Trang 40• Năm 2012, Zhang [71] quan tâm đến bài toán ra quyết định tập thể mà độ
ưa thích hơn được cho bằng ILV Vì mỗi ILV là hai cặp ngôn ngữ đặc trưng
cho độ thuộc và độ không thuộc nên quan hệ ưa thích hơn ở đây là quan hệ
mờ trực cảm cho bằng cặp ngôn ngữ về độ ưa thích hơn (2-tuple intuitionistic fuzzy linguistic preference relation);
• Năm 2013, Xia và Xu [52] xét đến tình huống độ ưa thích hơn được cho bằng
một vài giá trị giống như khái niệm tập mờ lưỡng lự (hesitant fuzzy set) của Torra [44] Quan hệ mờ tương ứng ở đây là quan hệ mờ lưỡng lự về độ ưa
thích hơn (hesitant fuzzy preference relation);
• Năm 2014, Wang [47] dùng khái niệm ILN để xây dựng mô hình ra quyết
định tập thể dựa trên các quan hệ mờ cho bằng số ngôn ngữ trực cảm về độ
ưa thích hơn
Liên quan trực tiếp đến nội dung luận án là các quy trình của Zhang [71] vàcủa Wang [47] Cả hai quy trình đều liên quan đến thông tin bằng từ có yếu tốtrực cảm
Quy trình mà Zhang [71] đề xuất vào năm 2012 (Quy trình 1.1) giải quyết tìnhhuống như sau:
• Xét X = {x1, , xm} là tập các phương án và D = d1, , dp là tập cácchuyên gia Giả sử rằng e = e1, , ep là véc-tơ trọng số của các chuyêngia, trong đó eklà trọng số của chuyên gia dk(k = 1, , p);
• Độ ưa thích hơn của chuyên gia dk về phương án xi so với phương án xjđược cho bởi Γk
ij là một ILV (i, j = 1, , m; k = 1, , p) Ma trận Pk =
hΓk
ij
i
m×m được gọi là ma trận quyết định cho bởi chuyên gia dk, thể hiện độ
ưa thích hơn của chuyên gia này trên tập các phương án (k =1, , p)
• Vấn đề đặt ra là làm thế nào để chọn ra một hay vài phương án tốt nhất.Sau đây là quy trình giải bài toán nêu trên
Quy trình 1.1 [71] Quy trình gồm các bước sau:
1 Sử dụng toán tử trung bình số học có trọng số ILV−WAA (Định nghĩa 1.22,
Trang 22), gộp các ma trận Pk = hΓk
ijim×m (k = 1, , p), thu được ma trận
... thơng tin cho từ có yếu tố trực cảm< /b>Thơng tin cho từ có yếu tố trực cảm< /b>, kết hợp CW truyền thốngvới khái niệm tập mờ trực cảm [2], bao gồm yếu tố từ trực cảm Như vậy,... class="page_container" data-page="36">
1.2.6.2 Số ngôn ngữ trực cảm< /b>
Một khái niệm khác sử dụng để biểu diễn thơng tin từ có yếu t? ?trực cảm ILN, Wang Li [46] đưa vào năm 2010 Ở định nghĩa dướiđây,... data-page="34">
thông tin từ trực cảm bao gồm thành phần từ ngôn ngữ, độ thuộc độ khôngthuộc Ta quan tâm đến hai khái niệm đề xuất năm gần đây:
giá trị ngôn ngữ trực cảm (intuitionistic