Mục tiêu tổng quát của luận án là đề xuất khái niệm từ trực cảm và ứng dụng trong bài toán ra quyết định với thông tin cho bằng từ có yếu tố trực cảm. Đề xuất độ tương tự từ, độ tương tự véc-tơ từ và ứng dụng vào bài toán phân lớp thông tin. Đề xuất độ tương tự giá trị mờ trực cảm, độ tương tự véc-tơ mờ trực cảm và ứng dụng vào phân lớp thông tin.
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Trang 2Công trình được hoàn thành tại: Trường Đại học Khoa học Tự nhiên, ĐHQG Hà Nội
Người hướng dẫn khoa học: PGS TSKH Bùi Công Cường
PGS TS Đỗ Trung Tuấn
Phản biện:
Phản biện:
Phản biện:
Luận án sẽ được bảo vệ trước Hội đồng cấp Đại học Quốc gia chấm luận án tiến sĩ họp tại
vào hồi giờ ngày tháng năm 20
Có thể tìm hiểu luận án tại:
- Thư viện Quốc gia Việt Nam
- Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội
Trang 3Mở đầu
1 Sơ lược về tính toán với từ
Thông thường, khi đánh giá một đối tượng nào đó, người ta hay quantâm đến các chỉ tiêu định lượng (chỉ tiêu được lượng hóa) Bên cạnh cácchỉ tiêu định lượng, ta cũng cần quan tâm đến các chỉ tiêu định tính Trongnhiều tình huống, việc quy đổi một chỉ tiêu định tính sang định lượng làkhông hợp lý Khi đó, một cách tiếp cận khoa học, khách quan, tương đối
dễ thực hiện là để các cố vấn, chuyên gia phát biểu bằng các từ như vẫndùng trong ngôn ngữ thông thường Ví dụ, độ may rủi của một dự án cóthể được chuyên gia đánh giá bằng từ trong tập dưới đây:
S = hầu_như_không, rất_thấp, thấp, trung_bình, cao, khá_cao, rất_cao (1)
Tính toán trên tập S như ở (1) được gọi là Tính toán với từ (CW) CW,
lần đầu được Zadeh1 đưa ra vào năm 1973, là quá trình tính toán với cácđối tượng là các từ và mệnh đề trong ngôn ngữ tự nhiên Mục đích chínhcủa CW là thu hẹp sự khác nhau giữa cách lập luận của con người vàphương pháp tính toán truyền thống
Trên thế giới, có nhiều hướng để thực hiện CW Người ta hay dùngtập từ dùng để đánh giá là S = s0, s1, , sg , trong đó số phần tử của
S thường là số lẻ, mỗi si (i = 0, , g) ký hiệu cho một giá trị bằng từ của
biến ngôn ngữ 2 Sau đây là một số tiếp cận: dựa trên thứ tự giữa các từ
1L A Zadeh, Outline of a new approach to the analysis of complex systems and decision
pro-cesses, IEEE Transactions on Systems, Man and Cybernetics SMC-3(1), 28-44.
2L A Zadeh, The concept of a linguistic variable and its application to approximate reasoning –
I, Information Information Sciences 8, 199-249, 1975.
Trang 4(Yager, 1981), dựa trên Nguyên lý Suy rộng (Herrera, 2000), dựa trên chỉ
số của các từ (Herrera 2000), dựa trên cặp ngôn ngữ (Herrera, 2000) vàdựa trên các từ mở rộng (Xu, 2004)
Cho tới nay, CW đã và đang được tiếp tục nghiên cứu và ứng dụng
trong nhiều lĩnh vực như ra quyết định, tìm kiếm thông tin, xếp hạng
trong giáo dục,
2 Mục đích của luận án
1 Đề xuất khái niệm từ trực cảm và ứng dụng trong bài toán ra quyết định với thông tin cho bằng từ có yếu tố trực cảm.
2 Đề xuất độ tương tự từ, độ tương tự véc-tơ từ và ứng dụng vào bài
toán phân lớp thông tin
3 Đề xuất độ tương tự giá trị mờ trực cảm, độ tương tự véc-tơ mờ trực
cảm và ứng dụng vào phân lớp thông tin
3 Cấu trúc của luận án
1 Chương 1 trình bày tổng quan về lý thuyết mờ và tính toán với từ, là
cơ sở lý thuyết phục vụ cho các chương sau
2 Chương 2, là đóng góp thứ nhất của luận án, đề xuất khái niệm từtrực cảm và ứng dụng trong bài toán ra quyết định tập thể
3 Trong Chương 3, nghiên cứu sinh đề xuất một số độ đo mới và ứngdụng vào bài toán phân lớp
Trang 5Chương 1
Tổng quan về lý thuyết mờ và tính toán với từ
1.1 Sơ lược về lý thuyết mờ và mờ trực cảm
1.1.1 Tập mờ và biến ngôn ngữ
Năm 1965, Zadeh đưa ra khái niệm tập mờ (fuzzy set).
Định nghĩa 1.1. 1 Cho tập X 6= ∅ Tập mờ A trên X được định nghĩa bởi hàm µA : X → [0, 1] Họ tất cả các tập mờ trên X được ký hiệu là F (X)
Định nghĩa 1.2. 2Biến ngôn ngữlà một bộ năm có dạng(L, T (L), X, G, M):
1 L là tên của biến ngôn ngữ;
2 T(L) là tập các giá trị bằng từ của biến ngôn ngữ;
3 X là không gian nền, gồm tất cả các giá trị bằng số của biến ngônngữ;
4 G là quy tắc cho phép sinh các từ trong T(L); và
5 M là một luật ngữ nghĩa, cho tương ứng mỗi từ s trong T(L) vàomột tập mờ trên X
Theo Zadeh, biến ngôn ngữ là biến mà giá trị của nó không phải số mà
là từ hay câu trong ngôn ngữ tự nhiên Nói chung, từ hay câu đều không
1L A Zadeh, Fuzzy sets, Information and Control 8, 338-353, 1965.
2L A Zadeh, The concept of a linguistic variable and its application to approximate reasoning –
I, Information Information Sciences 8, 199-249, 1975.
Trang 6rõ ràng bằng số, tuy nhiên lại gần với cách mà con người hiểu và giải thíchthế giới thực.
1.1.2 Tập mờ trực cảm và giá trị mờ trực cảm
Năm 1986, Atanassov khái quát tập mờ của Zadeh thành tập mờ trực cảm.
Định nghĩa 1.3. 3 Cho X 6= ∅, mỗi tập mờ trực cảm A trên X được định nghĩa bởi hàm thuộc µA : X → [0, 1] và hàm không thuộc νA : X → [0, 1]
sao cho 0 ≤ µA (x) +νA (x) ≤ 1 với mọi x ∈ X Tập hợp tất cả những tập
mờ trực cảm trên X được ký hiệu là I F (X)
Với mỗi x ∈ X, các đại lượng µA(x), νA(x) và πA(x) = 1− µA(x) −
νA(x) lần lượt được gọi là độ thuộc, độ không thuộc và độ lưỡng lự của x
vào tập A
Theo định nghĩa tập mờ trực cảm thì, quan hệ giữa phần tử x ∈ X vớitập mờ trực cảm A được đặc trưng bởi cặp (µA(x), νA(x)) Mỗi cặp như
vậy được Xu gọi là một giá trị mờ trực cảm (intuitionistic fuzzy value, IFv).
Định nghĩa 1.4. 4 Cặp số α = (µ α , ν α) được gọi là một giá trị mờ trực cảm nếu µ α , ν α ∈ [0, 1] và
µ α +ν α ≤ 1 (1.1)
Tập hợp tất cả các giá trị mờ trực cảm được ký hiệu là θ.
1.2 Toán tử gộp thông tin cho bằng từ
1.2.1 Gộp dựa trên thứ tự giữa các từ
Ta ký hiệu tập từ liên quan đến biến ngôn ngữ T là S Trên S có sẵn mộtquan hệ thứ tự thông thường Các từ được đánh chỉ số sao cho thứ tự giữa
3K T Atanassov, Intuitionistic fuzzy sets, Fuzzy Sets and Systems 20, 87-96, 1986.
4Z S Xu, Intuitionistic fuzzy aggregation operators, IEEE Transactions on Fuzzy Systems 15,
1179-1187, 2007.
Trang 7các chỉ số chính là thứ tự theo ý nghĩa thông thường giữa các từ Nếu chọntập chỉ số là {0, 1, , g} thì tập từ S có dạng S = s0, s1, , sg Yager(1981-1998) định nghĩa các phép toán cơ bản trên S (phép phủ định, max,min và trung vị) Dựa trên các phép toán cơ bản, người ta định nghĩanhiều phép gộp cho các từ trên S.
1.2.2 Gộp dựa trên Nguyên lý Suy rộng
Hướng nghiên cứu này xuất hiện trong các công bố của Bonissone vàDecker (1986), Bordogna và Passi (1993), Chang và Chen (1994), Chen(1997), Degani và Bortolan (1988), Delgado và các cộng sự (1993), Lee(1996), Đây là tiếp cận sử dụng Nguyên lý Suy rộng, gồm khai khâu:
• Mỗi từ được đồng nhất với một số mờ Các số mờ được gộp nhờ hàm
˜
F với ˜F là hàm suy rộng từ hàm rõ F theo Nguyên lý Suy rộng;
• Trong đa số trường hợp, số mờ nhận được ở bước trước không tươngứng với một từ nào trong S Để giải quyết vấn đề này, người ta sửdụng hàm app1(·) để xấp xỉ số mờ với một từ
Quá trình gộp được Herrera và Martínez (2000) mô tả như sau:
Sn −→ F (F˜ R) app−→1(·) S (1.2)
1.2.3 Gộp dựa trên chỉ số của các từ
Quá trình gộp có sử dụng toán tử gộp dựa trên chỉ số của các từ đượcHerrera (2000) mô tả như dưới đây:
Sn −→ [c 0, g] app−→ {2(·) 0, 1, , g} −→ S, (1.3)
• c là toán tử gộp chỉ số của các từ, cho tương ứng n chỉ số với một sốthực thuộc đoạn[0, g];
Trang 8• app2(·) là một phép xấp xỉ, cho tương ứng mỗi số thực thuộc đoạn
[0, g] với số nguyên thuộc tập {0, 1, , g}, số nguyên này ứng vớimột từ trong S
1.2.4 Gộp dựa trên biểu diễn theo cặp ngôn ngữ
Herrera và Martínez (2000) đề xuất biểu diễn theo cặp ngôn ngữ (linguistic
2-tuples) Theo đó thì thông tin cho bằng từ được biểu diễn bằng một cặp
có dạng (si, e), với si ∈ S là một từ và số e là hệ số sai khác (symbolic
translation ), e được dùng để đo sự khác giữa thông tin ngôn ngữ và từ si
1.2.6 Gộp thông tin cho bằng từ có yếu tố trực cảm
cảm Ta quan tâm đến hai khái niệm được đề xuất trong những năm gần
đây: giá trị ngôn ngữ trực cảm (ILV) 5 và số ngôn ngữ trực cảm (ILN) 6
Định nghĩa 1.5. Mỗi giá trị ngôn ngữ trực cảm là một cặp có dạng Γ =(si, e), sj, δ, trong đó, (si, e), sj, δ là các cặp ngôn ngữ thỏa mãn
(si, e) ≤ neg sj, δ Ký hiệu Π là tập hợp tất cả các giá trị ngôn ngữ trựccảm
5Y Zhang, H X Ma, B H Liu, J Liu, Group decision making with 2-tuple intuitionistic fuzzy
linguistic preference relations, Soft Computing 16, 1439-1446, 2012.
6J Q Wang and H B Li, Multi-criteria decision-making method based on aggregation operators
for intuitionistic linguistic fuzzy numbers, Control and Decision 25 (10), 1571-1574, 1584, 2010.
Trang 9Zhang đề xuất toán tử trung bình số học (ILV−AA) và toán tử trung
để giải quyết bài toán ra quyết định tập thể với các đánh giá là giá trị ngônngữ trực cảm
Định nghĩa 1.6. Một số ngôn ngữ trực cảm có dạng α = Dsθ(α) , µ(α), ν(α)E,trong đó sθ(α) ∈ S¯ là một từ, µ(α) ∈ [0, 1] và ν(α) ∈ [0, 1] lần lượt là độthuộc và độ không thuộc vào từ sθ(α) của đối tượng cần đánh giá, µ(α)
và ν(α) thỏa mãn điều kiện µ(α) + ν(α) ≤ 1 Tập hợp tất cả các số ngônngữ trực cảm được ký hiệu là Ω
Wang cũng đề xuất các toán tử gộp cho số ngôn ngữ trực cảm là toán
và toán tử gộp lai (ILN−HA) Dựa vào các toán tử ILN−WAA và ILN−HA,
Wang (2014) phát triển một tiếp cận cho bài toán ra quyết định tập thể,trong đó các đánh giá là số ngôn ngữ trực cảm
1.2.7 Ra quyết định với thông tin cho bằng từ
Liên quan trực tiếp đến nội dung luận án là các quy trình ra quyết địnhcủa Zhang (2012) và của Wang (2014)
Quy trình mà Zhang giải quyết tình huống như sau:
• Xét X = {x1, , xm} là tập các phương án và D = d1, , dp làtập các chuyên gia Giả sử rằng e = e1, , ep là véc-tơ trọng sốcủa các chuyên gia;
• Độ ưa thích hơn của chuyên gia dkvề phương án xiso với phương án
xjđược cho bởi giá trị ngôn ngữ trực cảmΓk
ij Ma trận Pk = hΓk
ij
i
m×m
được gọi là ma trận quyết định cho bởi chuyên gia dk;
• Vấn đề đặt ra là làm thế nào để chọn ra một hay vài phương án tốtnhất
Trang 10Quy trình 1.1 Quy trình gồm các bước sau:
1 Sử dụng toán tử trung bình số học có trọng số ILV−WAA, gộp các ma
3 Chọn ra một hay một vài phương án tốt nhất.
Wang quan tâm đến tình huống, so với tình huống của Zhang, có thêm
sự xuất hiện của các tiêu chí Ngoài ra, các đánh giá là các số ngôn ngữtrực cảm (ILN) thay vì giá trị ngôn ngữ trực cảm (ILV) Cụ thể:
• Gọi X = {x1, , xm} là tập các phương án, C = {c1, , cn} làtập các tiêu chí và D = d1, , dp là tập các chuyên gia Giả sửvéc-tơ trọng số của các tiêu chí và các chuyên gia lần lượt là w =(w1, , wn) và e = e1, , ep;
• Mỗi chuyên gia dk đưa ra đánh giá về phương án xi theo tiêu chí cj
bởi ILN αkij ∈ Ω Ma trận Rk = hαkij
i
m×n được gọi là ma trận quyếtđịnh của chuyên gia dk;
• Ta cần sắp xếp để chọn ra một hay vài phương án tốt nhất
Quy trình 1.2 Quy trình này gồm các bước như sau.
1 Xác định đánh giá tổng hợp αki của chuyên gia ekvề phương án xi nhờ toán
tử ILN−WAA;
2 Gộp các giá trị α1i, , αip bằng toán tử ILN−HA để thu được đánh giá
của tập thể chuyên gia, αi, về phương án xi;
3 Lựa chọn một hay vài phương án tốt nhất.
Trang 111.3 Độ tương tự mờ và độ tương tự mờ trực cảm
Độ tương tự là công cụ quan trọng giúp xác định mức độ giống nhau giữahai đối tượng Đây là khái niệm có nhiều ứng dụng trong các bài toán liênquan đến nhận dạng mẫu như phân lớp, phân cụm và truy vấn thông tin.Năm 2014, Baccour và các cộng sự 7 đưa ra khái niệm độ tương tự mờ
Định nghĩa 1.7. Cho tập X 6= ∅ Ánh xạ sim : F (X) × F (X) → [0, 1]
được gọi là một độ tương tự mờ trên X nếu như:
1 Đối xứng: sim(A, B) = sim(B, A), với mọi A, B ∈ F (X);
2 Phản xạ: sim(A, B) = 1 ⇔ A = B, với mọi A, B ∈ F (X);
3 Đơn điệu: nếu A ⊂ B ⊂ Cthì sim(A, B) ≥ sim(A, C)và sim(B, C) ≥
sim(A, C), với mọi A, B, C ∈ F (X)
Độ tương tự mờ sớm được Turksen và Zhong (1988) ứng dụng trong
xấp xỉ lập luận tương tự (analogical reasoning) Năm 2000, Candan và các
cộng sự ứng dụng độ tương tự mờ để tìm kiếm trong cơ sở dữ liệu đaphương tiện
Độ tương tự mờ trực cảm 8 là sự mở rộng của độ tương tự mờ Độtương tự mờ trực cảm có thể ứng dụng trong nhiều bài toán, chẳng hạntrong bài toán ra quyết định (Xu, 2007), chẩn đoán y khoa (Szmidt, 2004)
và nhận dạng mẫu (Feng, 2002; Hwang, 2012; Julian, 2012)
7L Baccour, A M Alimi, R I John, Some Notes on Fuzzy Similarity Measures and
Applica-tion to ClassificaApplica-tion of Shapes, RecogniApplica-tion of Arabic Sentences and Mosaic, IAENG International
Journal of Computer Science 41 (2), 81-90, 2014.
8L Baccour, A M Alimi, R I John, Intuitionistic Fuzzy Similarity Measures and Their Role
in Classification, Journal of Intelligent Systems 25 (2), 221-237, 2016.
Trang 12Chương 2
Từ trực cảm và gộp các từ trực cảm
Chương này đề xuất khái niệm từ trực cảm (ILL), các phép toán cơ bản,
toán tử gộp và ứng dụng trong bài toán ra quyết định với đầu vào là thôngtin cho bằng từ có yếu tố trực cảm
Nội dung của chương liên quan đến các kết quả nghiên cứu của tácgiả trong các công trình CT 1, CT 2, CT 5, CT 6, CT 7 và CT 8
2.1 Tập từ trực cảm và một số phép toán cơ bản
Định nghĩa 2.1. [CT 5] Mỗi từ trực cảm (ILL) ˜a trên tập từ S = s0, s1, , sg
có dạng ˜a = si, sj, với si, sj ∈ S thỏa mãn i+ j ≤ g Trong đó, các từ si và
sj lần lượt biểu diễn độ thuộc và độ không thuộc của một đối tượng cầnđánh giá vào một tập nào đó
Nếu ˜a = si, sj là một ILL, thì ta ký hiệu si = µ˜a và sj = ν˜a Tập tất cảcác ILL được ký hiệu làS, nghĩa là:
S = n si, sj ∈ S2
i+ j ≤ go.
Giống như tập từ mở rộng của Xu (20014), nghiên cứu sinh cũng xét
tới các ILL mở rộng [CT 6] Đó là các ILL có chỉ số của độ thuộc và độ
không thuộc có thể nhận giá trị không nguyên
Trang 132.2 Toán tử gộp các từ trực cảm
2.2.1 Giá trị lớn nhất và giá trị nhỏ nhất của các từ trực cảm
Định nghĩa 2.2. [CT 2] Giá trị lớn nhất, max, và giá trị nhỏ nhất, min, của
bộ các ILL (˜a1, , ˜an) trong ¯S lần lượt được định nghĩa như sau:
max(a1, , an) = ˜b1, min(a1, , an) = ˜bn,với ˜bj là phần tử lớn thứ j của các ˜ai
2.2.2 Trung vị của các từ trực cảm
Định nghĩa 2.3. [CT 6] Xét(˜a1, , ˜an)là bộ các ILL trongS Giả sử ˜b1, , ˜bn
là một hoán vị của (˜a1, , ˜an) thỏa mãn ˜b1 ≥ ˜b2 ≥ · · · ≥ ˜bn
1 Trung vị: trung vị của(˜a1, , ˜an), ký hiệu là ILL−MED(˜a1, , ˜an),được định nghĩa bởi:
ILL−MED(˜a1, , ˜an) =
j=1
uj (i = 1, , n) Trung vị có trọng số của các từ trực cảm
được ký hiệu là ILL−WMED và được định nghĩa như sau:
ILL−WMED((w1, ˜a1), ,(wn, ˜an)) = ˜bk.Trong đó, k là số nguyên dương nhỏ nhất mà Tk ≥ 0.5.
Trang 142.2.3 Tổ hợp lồi của các từ trực cảm
Định nghĩa 2.4. Với ˜a1, ˜a2 ∈ S là các ILL, giả sử ˜si = min(˜a1, ˜a2) và ˜sj =
max(˜a1, ˜a2) Tổ hợp lồi của ˜a1và ˜a2với véc-tơ trọng số là w = (w1, w2), được
ký hiệu bởi C{wi, ˜ai, i = 1, 2}, được định nghĩa như sau:
C{wi, ˜ai, i = 1, 2} = ˜sk.Trong đó, k = i + round[w1(j−i)] với round là phép làm tròn thông
thường
Để cho tiện, ta cũng dùng C{w1, w2, ˜a1, ˜a2} thay choC{wi, ˜ai, i = 1, 2}
Định nghĩa 2.5. Với n ≥ 2, tổ hợp lồi của ˜a1, , ˜an ∈ S với véc-tơ trọng
số là w = (w1, , wn) được ký hiệu bởi Cn{wk, ˜ak, k = 1, , n} và được
định nghĩa như sau:
Để cho tiện, tùy trường hợp, ta cũng sử dụng ký hiệuCn {w1, , wn, ˜a1, , ˜an}
thay cho Cn{wi, ˜ai, i = 1, , n}
2.2.4 Toán tử OWA cho các từ trực cảm
Dựa vào tổ hợp lồi, ta định nghĩa được toán tử OWA cho các ILL
Định nghĩa 2.6 Toán tử OWA cho các ILL trong S với véc-tơ trọng số w =
(w1, , wn), ký hiệu là ILL−OWA1, được định nghĩa như dưới đây:
ILL−OWA1w(˜a1, , ˜an) = Cn {wk, ˜ak, k = 1, , n},
với mọi (˜a1, , ˜an) ∈ Sn
...2.2.4 Toán tử OWA cho từ trực cảm
Dựa vào tổ hợp lồi, ta định nghĩa toán tử OWA cho ILL
Định nghĩa 2.6 Toán tử OWA cho ILL trong S với véc-tơ trọng số w =
(w1,... 13
2.2 Toán tử gộp từ trực cảm
2.2.1 Giá trị lớn giá trị nhỏ từ trực cảm
Định nghĩa 2.2. [CT 2] Giá... go.
Giống tập từ mở rộng Xu (20014), nghiên cứu sinh xét
tới ILL mở rộng [CT 6] Đó ILL có số độ thuộc độ
khơng thuộc nhận giá