Dự thảo tóm tắt Luận án Tiến sĩ Toán học: Nghiên cứu một số quy trình gộp thông tin bằng từ và ứng dụng

Mục tiêu tổng quát của luận án là đề xuất khái niệm từ trực cảm và ứng dụng trong bài toán ra quyết định với thông tin cho bằng từ có yếu tố trực cảm. Đề xuất độ tương tự từ, độ tương tự véc-tơ từ và ứng dụng vào bài toán phân lớp thông tin. Đề xuất độ tương tự giá trị mờ trực cảm, độ tương tự véc-tơ mờ trực cảm và ứng dụng vào phân lớp thông tin.

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

Trang 2

Công trình được hoàn thành tại: Trường Đại học Khoa học Tự nhiên, ĐHQG Hà Nội

Người hướng dẫn khoa học: PGS TSKH Bùi Công Cường

PGS TS Đỗ Trung Tuấn

Phản biện:

Luận án sẽ được bảo vệ trước Hội đồng cấp Đại học Quốc gia chấm luận án tiến sĩ họp tại

vào hồi giờ ngày tháng năm 20

Có thể tìm hiểu luận án tại:

- Thư viện Quốc gia Việt Nam

- Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội

Trang 3

Mở đầu

1 Sơ lược về tính toán với từ

Thông thường, khi đánh giá một đối tượng nào đó, người ta hay quantâm đến các chỉ tiêu định lượng (chỉ tiêu được lượng hóa) Bên cạnh cácchỉ tiêu định lượng, ta cũng cần quan tâm đến các chỉ tiêu định tính Trongnhiều tình huống, việc quy đổi một chỉ tiêu định tính sang định lượng làkhông hợp lý Khi đó, một cách tiếp cận khoa học, khách quan, tương đối

dễ thực hiện là để các cố vấn, chuyên gia phát biểu bằng các từ như vẫndùng trong ngôn ngữ thông thường Ví dụ, độ may rủi của một dự án cóthể được chuyên gia đánh giá bằng từ trong tập dưới đây:

S = hầu_như_không, rất_thấp, thấp, trung_bình, cao, khá_cao, rất_cao (1)

Tính toán trên tập S như ở (1) được gọi là Tính toán với từ (CW) CW,

lần đầu được Zadeh1 đưa ra vào năm 1973, là quá trình tính toán với cácđối tượng là các từ và mệnh đề trong ngôn ngữ tự nhiên Mục đích chínhcủa CW là thu hẹp sự khác nhau giữa cách lập luận của con người vàphương pháp tính toán truyền thống

Trên thế giới, có nhiều hướng để thực hiện CW Người ta hay dùngtập từ dùng để đánh giá là S = s0, s1, , sg , trong đó số phần tử của

S thường là số lẻ, mỗi si (i = 0, , g) ký hiệu cho một giá trị bằng từ của

biến ngôn ngữ 2 Sau đây là một số tiếp cận: dựa trên thứ tự giữa các từ

1L A Zadeh, Outline of a new approach to the analysis of complex systems and decision

pro-cesses, IEEE Transactions on Systems, Man and Cybernetics SMC-3(1), 28-44.

2L A Zadeh, The concept of a linguistic variable and its application to approximate reasoning –

I, Information Information Sciences 8, 199-249, 1975.

Trang 4

(Yager, 1981), dựa trên Nguyên lý Suy rộng (Herrera, 2000), dựa trên chỉ

số của các từ (Herrera 2000), dựa trên cặp ngôn ngữ (Herrera, 2000) vàdựa trên các từ mở rộng (Xu, 2004)

Cho tới nay, CW đã và đang được tiếp tục nghiên cứu và ứng dụng

trong nhiều lĩnh vực như ra quyết định, tìm kiếm thông tin, xếp hạng

trong giáo dục,

2 Mục đích của luận án

1 Đề xuất khái niệm từ trực cảm và ứng dụng trong bài toán ra quyết định với thông tin cho bằng từ có yếu tố trực cảm.

2 Đề xuất độ tương tự từ, độ tương tự véc-tơ từ và ứng dụng vào bài

toán phân lớp thông tin

3 Đề xuất độ tương tự giá trị mờ trực cảm, độ tương tự véc-tơ mờ trực

cảm và ứng dụng vào phân lớp thông tin

3 Cấu trúc của luận án

1 Chương 1 trình bày tổng quan về lý thuyết mờ và tính toán với từ, là

cơ sở lý thuyết phục vụ cho các chương sau

2 Chương 2, là đóng góp thứ nhất của luận án, đề xuất khái niệm từtrực cảm và ứng dụng trong bài toán ra quyết định tập thể

3 Trong Chương 3, nghiên cứu sinh đề xuất một số độ đo mới và ứngdụng vào bài toán phân lớp

Trang 5

Chương 1

Tổng quan về lý thuyết mờ và tính toán với từ

1.1 Sơ lược về lý thuyết mờ và mờ trực cảm

1.1.1 Tập mờ và biến ngôn ngữ

Năm 1965, Zadeh đưa ra khái niệm tập mờ (fuzzy set).

Định nghĩa 1.1. 1 Cho tập X 6= ∅ Tập mờ A trên X được định nghĩa bởi hàm µA : X → [0, 1] Họ tất cả các tập mờ trên X được ký hiệu là F (X)

Định nghĩa 1.2. 2Biến ngôn ngữlà một bộ năm có dạng(L, T (L), X, G, M):

1 L là tên của biến ngôn ngữ;

2 T(L) là tập các giá trị bằng từ của biến ngôn ngữ;

3 X là không gian nền, gồm tất cả các giá trị bằng số của biến ngônngữ;

4 G là quy tắc cho phép sinh các từ trong T(L); và

5 M là một luật ngữ nghĩa, cho tương ứng mỗi từ s trong T(L) vàomột tập mờ trên X

Theo Zadeh, biến ngôn ngữ là biến mà giá trị của nó không phải số mà

là từ hay câu trong ngôn ngữ tự nhiên Nói chung, từ hay câu đều không

1L A Zadeh, Fuzzy sets, Information and Control 8, 338-353, 1965.

2L A Zadeh, The concept of a linguistic variable and its application to approximate reasoning –

I, Information Information Sciences 8, 199-249, 1975.

Trang 6

rõ ràng bằng số, tuy nhiên lại gần với cách mà con người hiểu và giải thíchthế giới thực.

1.1.2 Tập mờ trực cảm và giá trị mờ trực cảm

Năm 1986, Atanassov khái quát tập mờ của Zadeh thành tập mờ trực cảm.

Định nghĩa 1.3. 3 Cho X 6= ∅, mỗi tập mờ trực cảm A trên X được định nghĩa bởi hàm thuộc µA : X → [0, 1] và hàm không thuộc νA : X → [0, 1]

sao cho 0 ≤ µA (x) +νA (x) ≤ 1 với mọi x ∈ X Tập hợp tất cả những tập

mờ trực cảm trên X được ký hiệu là I F (X)

Với mỗi x ∈ X, các đại lượng µA(x), νA(x) và πA(x) = 1− µA(x) −

νA(x) lần lượt được gọi là độ thuộc, độ không thuộc và độ lưỡng lự của x

vào tập A

Theo định nghĩa tập mờ trực cảm thì, quan hệ giữa phần tử x ∈ X vớitập mờ trực cảm A được đặc trưng bởi cặp (µA(x), νA(x)) Mỗi cặp như

vậy được Xu gọi là một giá trị mờ trực cảm (intuitionistic fuzzy value, IFv).

Định nghĩa 1.4. 4 Cặp số α = (µ α , ν α) được gọi là một giá trị mờ trực cảm nếu µ α , ν α ∈ [0, 1] và

µ α +ν α ≤ 1 (1.1)

Tập hợp tất cả các giá trị mờ trực cảm được ký hiệu là θ.

1.2 Toán tử gộp thông tin cho bằng từ

1.2.1 Gộp dựa trên thứ tự giữa các từ

Ta ký hiệu tập từ liên quan đến biến ngôn ngữ T là S Trên S có sẵn mộtquan hệ thứ tự thông thường Các từ được đánh chỉ số sao cho thứ tự giữa

3K T Atanassov, Intuitionistic fuzzy sets, Fuzzy Sets and Systems 20, 87-96, 1986.

4Z S Xu, Intuitionistic fuzzy aggregation operators, IEEE Transactions on Fuzzy Systems 15,

1179-1187, 2007.

Trang 7

các chỉ số chính là thứ tự theo ý nghĩa thông thường giữa các từ Nếu chọntập chỉ số là {0, 1, , g} thì tập từ S có dạng S = s0, s1, , sg Yager(1981-1998) định nghĩa các phép toán cơ bản trên S (phép phủ định, max,min và trung vị) Dựa trên các phép toán cơ bản, người ta định nghĩanhiều phép gộp cho các từ trên S.

1.2.2 Gộp dựa trên Nguyên lý Suy rộng

Hướng nghiên cứu này xuất hiện trong các công bố của Bonissone vàDecker (1986), Bordogna và Passi (1993), Chang và Chen (1994), Chen(1997), Degani và Bortolan (1988), Delgado và các cộng sự (1993), Lee(1996), Đây là tiếp cận sử dụng Nguyên lý Suy rộng, gồm khai khâu:

• Mỗi từ được đồng nhất với một số mờ Các số mờ được gộp nhờ hàm

˜

F với ˜F là hàm suy rộng từ hàm rõ F theo Nguyên lý Suy rộng;

• Trong đa số trường hợp, số mờ nhận được ở bước trước không tươngứng với một từ nào trong S Để giải quyết vấn đề này, người ta sửdụng hàm app1(·) để xấp xỉ số mờ với một từ

Quá trình gộp được Herrera và Martínez (2000) mô tả như sau:

Sn −→ F (F˜ R) app−→1(·) S (1.2)

1.2.3 Gộp dựa trên chỉ số của các từ

Quá trình gộp có sử dụng toán tử gộp dựa trên chỉ số của các từ đượcHerrera (2000) mô tả như dưới đây:

Sn −→ [c 0, g] app−→ {2(·) 0, 1, , g} −→ S, (1.3)

• c là toán tử gộp chỉ số của các từ, cho tương ứng n chỉ số với một sốthực thuộc đoạn[0, g];

Trang 8

• app2(·) là một phép xấp xỉ, cho tương ứng mỗi số thực thuộc đoạn

[0, g] với số nguyên thuộc tập {0, 1, , g}, số nguyên này ứng vớimột từ trong S

1.2.4 Gộp dựa trên biểu diễn theo cặp ngôn ngữ

Herrera và Martínez (2000) đề xuất biểu diễn theo cặp ngôn ngữ (linguistic

2-tuples) Theo đó thì thông tin cho bằng từ được biểu diễn bằng một cặp

có dạng (si, e), với si ∈ S là một từ và số e là hệ số sai khác (symbolic

translation ), e được dùng để đo sự khác giữa thông tin ngôn ngữ và từ si

1.2.6 Gộp thông tin cho bằng từ có yếu tố trực cảm

cảm Ta quan tâm đến hai khái niệm được đề xuất trong những năm gần

đây: giá trị ngôn ngữ trực cảm (ILV) 5 và số ngôn ngữ trực cảm (ILN) 6

Định nghĩa 1.5. Mỗi giá trị ngôn ngữ trực cảm là một cặp có dạng Γ =(si, e), sj, δ, trong đó, (si, e), sj, δ là các cặp ngôn ngữ thỏa mãn

(si, e) ≤ neg sj, δ Ký hiệu Π là tập hợp tất cả các giá trị ngôn ngữ trựccảm

5Y Zhang, H X Ma, B H Liu, J Liu, Group decision making with 2-tuple intuitionistic fuzzy

linguistic preference relations, Soft Computing 16, 1439-1446, 2012.

6J Q Wang and H B Li, Multi-criteria decision-making method based on aggregation operators

for intuitionistic linguistic fuzzy numbers, Control and Decision 25 (10), 1571-1574, 1584, 2010.

Trang 9

Zhang đề xuất toán tử trung bình số học (ILV−AA) và toán tử trung

để giải quyết bài toán ra quyết định tập thể với các đánh giá là giá trị ngônngữ trực cảm

Định nghĩa 1.6. Một số ngôn ngữ trực cảm có dạng α = Dsθ(α) , µ(α), ν(α)E,trong đó sθ(α) ∈ S¯ là một từ, µ(α) ∈ [0, 1] và ν(α) ∈ [0, 1] lần lượt là độthuộc và độ không thuộc vào từ sθ(α) của đối tượng cần đánh giá, µ(α)

và ν(α) thỏa mãn điều kiện µ(α) + ν(α) ≤ 1 Tập hợp tất cả các số ngônngữ trực cảm được ký hiệu là Ω

Wang cũng đề xuất các toán tử gộp cho số ngôn ngữ trực cảm là toán

và toán tử gộp lai (ILN−HA) Dựa vào các toán tử ILN−WAA và ILN−HA,

Wang (2014) phát triển một tiếp cận cho bài toán ra quyết định tập thể,trong đó các đánh giá là số ngôn ngữ trực cảm

1.2.7 Ra quyết định với thông tin cho bằng từ

Liên quan trực tiếp đến nội dung luận án là các quy trình ra quyết địnhcủa Zhang (2012) và của Wang (2014)

Quy trình mà Zhang giải quyết tình huống như sau:

• Xét X = {x1, , xm} là tập các phương án và D = d1, , dp làtập các chuyên gia Giả sử rằng e = e1, , ep là véc-tơ trọng sốcủa các chuyên gia;

• Độ ưa thích hơn của chuyên gia dkvề phương án xiso với phương án

xjđược cho bởi giá trị ngôn ngữ trực cảmΓk

ij Ma trận Pk = hΓk

ij

i

m×m

được gọi là ma trận quyết định cho bởi chuyên gia dk;

• Vấn đề đặt ra là làm thế nào để chọn ra một hay vài phương án tốtnhất

Trang 10

Quy trình 1.1 Quy trình gồm các bước sau:

1 Sử dụng toán tử trung bình số học có trọng số ILV−WAA, gộp các ma

3 Chọn ra một hay một vài phương án tốt nhất.

Wang quan tâm đến tình huống, so với tình huống của Zhang, có thêm

sự xuất hiện của các tiêu chí Ngoài ra, các đánh giá là các số ngôn ngữtrực cảm (ILN) thay vì giá trị ngôn ngữ trực cảm (ILV) Cụ thể:

• Gọi X = {x1, , xm} là tập các phương án, C = {c1, , cn} làtập các tiêu chí và D = d1, , dp là tập các chuyên gia Giả sửvéc-tơ trọng số của các tiêu chí và các chuyên gia lần lượt là w =(w1, , wn) và e = e1, , ep;

• Mỗi chuyên gia dk đưa ra đánh giá về phương án xi theo tiêu chí cj

bởi ILN αkij ∈ Ω Ma trận Rk = hαkij

i

m×n được gọi là ma trận quyếtđịnh của chuyên gia dk;

• Ta cần sắp xếp để chọn ra một hay vài phương án tốt nhất

Quy trình 1.2 Quy trình này gồm các bước như sau.

1 Xác định đánh giá tổng hợp αki của chuyên gia ekvề phương án xi nhờ toán

tử ILN−WAA;

2 Gộp các giá trị α1i, , αip bằng toán tử ILN−HA để thu được đánh giá

của tập thể chuyên gia, αi, về phương án xi;

3 Lựa chọn một hay vài phương án tốt nhất.

Trang 11

1.3 Độ tương tự mờ và độ tương tự mờ trực cảm

Độ tương tự là công cụ quan trọng giúp xác định mức độ giống nhau giữahai đối tượng Đây là khái niệm có nhiều ứng dụng trong các bài toán liênquan đến nhận dạng mẫu như phân lớp, phân cụm và truy vấn thông tin.Năm 2014, Baccour và các cộng sự 7 đưa ra khái niệm độ tương tự mờ

Định nghĩa 1.7. Cho tập X 6= ∅ Ánh xạ sim : F (X) × F (X) → [0, 1]

được gọi là một độ tương tự mờ trên X nếu như:

1 Đối xứng: sim(A, B) = sim(B, A), với mọi A, B ∈ F (X);

2 Phản xạ: sim(A, B) = 1 ⇔ A = B, với mọi A, B ∈ F (X);

3 Đơn điệu: nếu A ⊂ B ⊂ Cthì sim(A, B) ≥ sim(A, C)và sim(B, C) ≥

sim(A, C), với mọi A, B, C ∈ F (X)

Độ tương tự mờ sớm được Turksen và Zhong (1988) ứng dụng trong

xấp xỉ lập luận tương tự (analogical reasoning) Năm 2000, Candan và các

cộng sự ứng dụng độ tương tự mờ để tìm kiếm trong cơ sở dữ liệu đaphương tiện

Độ tương tự mờ trực cảm 8 là sự mở rộng của độ tương tự mờ Độtương tự mờ trực cảm có thể ứng dụng trong nhiều bài toán, chẳng hạntrong bài toán ra quyết định (Xu, 2007), chẩn đoán y khoa (Szmidt, 2004)

và nhận dạng mẫu (Feng, 2002; Hwang, 2012; Julian, 2012)

7L Baccour, A M Alimi, R I John, Some Notes on Fuzzy Similarity Measures and

Applica-tion to ClassificaApplica-tion of Shapes, RecogniApplica-tion of Arabic Sentences and Mosaic, IAENG International

Journal of Computer Science 41 (2), 81-90, 2014.

8L Baccour, A M Alimi, R I John, Intuitionistic Fuzzy Similarity Measures and Their Role

in Classification, Journal of Intelligent Systems 25 (2), 221-237, 2016.

Trang 12

Chương 2

Từ trực cảm và gộp các từ trực cảm

Chương này đề xuất khái niệm từ trực cảm (ILL), các phép toán cơ bản,

toán tử gộp và ứng dụng trong bài toán ra quyết định với đầu vào là thôngtin cho bằng từ có yếu tố trực cảm

Nội dung của chương liên quan đến các kết quả nghiên cứu của tácgiả trong các công trình CT 1, CT 2, CT 5, CT 6, CT 7 và CT 8

2.1 Tập từ trực cảm và một số phép toán cơ bản

Định nghĩa 2.1. [CT 5] Mỗi từ trực cảm (ILL) ˜a trên tập từ S = s0, s1, , sg

có dạng ˜a = si, sj, với si, sj ∈ S thỏa mãn i+ j ≤ g Trong đó, các từ si và

sj lần lượt biểu diễn độ thuộc và độ không thuộc của một đối tượng cầnđánh giá vào một tập nào đó

Nếu ã = si, sj là một ILL, thì ta ký hiệu si = µã và sj = νã Tập tất cảcác ILL được ký hiệu làS, nghĩa là:

S = n si, sj ∈ S2

i+ j ≤ go.

Giống như tập từ mở rộng của Xu (20014), nghiên cứu sinh cũng xét

tới các ILL mở rộng [CT 6] Đó là các ILL có chỉ số của độ thuộc và độ

không thuộc có thể nhận giá trị không nguyên

Trang 13

2.2 Toán tử gộp các từ trực cảm

2.2.1 Giá trị lớn nhất và giá trị nhỏ nhất của các từ trực cảm

Định nghĩa 2.2. [CT 2] Giá trị lớn nhất, max, và giá trị nhỏ nhất, min, của

bộ các ILL (˜a1, , ˜an) trong ¯S lần lượt được định nghĩa như sau:

max(a1, , an) = ˜b1, min(a1, , an) = ˜bn,với ˜bj là phần tử lớn thứ j của các ˜ai

2.2.2 Trung vị của các từ trực cảm

Định nghĩa 2.3. [CT 6] Xét(˜a1, , ˜an)là bộ các ILL trongS Giả sử ˜b1, , ˜bn

là một hoán vị của (˜a1, , ˜an) thỏa mãn ˜b1 ≥ ˜b2 ≥ · · · ≥ ˜bn

1 Trung vị: trung vị của(ã1, , ãn), ký hiệu là ILL−MED(ã1, , ãn),được định nghĩa bởi:

ILL−MED(˜a1, , ˜an) =

j=1

uj (i = 1, , n) Trung vị có trọng số của các từ trực cảm

được ký hiệu là ILL−WMED và được định nghĩa như sau:

ILL−WMED((w1, ˜a1), ,(wn, ˜an)) = ˜bk.Trong đó, k là số nguyên dương nhỏ nhất mà Tk ≥ 0.5.

Trang 14

2.2.3 Tổ hợp lồi của các từ trực cảm

Định nghĩa 2.4. Với ã1, ã2 ∈ S là các ILL, giả sử ˜si = min(ã1, ã2) và ˜sj =

max(ã1, ã2) Tổ hợp lồi của ã1và ã2với véc-tơ trọng số là w = (w1, w2), được

ký hiệu bởi C{wi, ˜ai, i = 1, 2}, được định nghĩa như sau:

C{wi, ˜ai, i = 1, 2} = ˜sk.Trong đó, k = i + round[w1(j−i)] với round là phép làm tròn thông

thường

Để cho tiện, ta cũng dùng C{w1, w2, ã1, ã2} thay choC{wi, ãi, i = 1, 2}

Định nghĩa 2.5. Với n ≥ 2, tổ hợp lồi của ˜a1, , ˜an ∈ S với véc-tơ trọng

số là w = (w1, , wn) được ký hiệu bởi Cn{wk, ˜ak, k = 1, , n} và được

định nghĩa như sau:

Để cho tiện, tùy trường hợp, ta cũng sử dụng ký hiệuCn {w1, , wn, ˜a1, , ˜an}

thay cho Cn{wi, ˜ai, i = 1, , n}

2.2.4 Toán tử OWA cho các từ trực cảm

Dựa vào tổ hợp lồi, ta định nghĩa được toán tử OWA cho các ILL

Định nghĩa 2.6 Toán tử OWA cho các ILL trong S với véc-tơ trọng số w =

(w1, , wn), ký hiệu là ILL−OWA1, được định nghĩa như dưới đây:

ILL−OWA1w(ã1, , ãn) = Cn {wk, ãk, k = 1, , n},

với mọi (˜a1, , ˜an) ∈ Sn

2.2.4 Toán tử OWA cho từ trực cảm

Dựa vào tổ hợp lồi, ta định nghĩa toán tử OWA cho ILL

Định nghĩa 2.6 Toán tử OWA cho ILL trong S với véc-tơ trọng số w =

(w1,... 13

2.2 Toán tử gộp từ trực cảm

2.2.1 Giá trị lớn giá trị nhỏ từ trực cảm

Định nghĩa 2.2. [CT 2] Giá... go.

Giống tập từ mở rộng Xu (20014), nghiên cứu sinh xét

tới ILL mở rộng [CT 6] Đó ILL có số độ thuộc độ

khơng thuộc nhận giá

Định dạng
Số trang	27
Dung lượng	414,79 KB