Toán tử Owa trong một số bài toán tối ưu
Trang 1ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC KHOA HỌC
-
ĐỖ THÙY NINH
TOÁN TỬ OWA TRONG MỘT SỐ
BÀI TOÁN TỐI ƯU
Trang 23.1 Ra quyết định dựa trên độ quan trọng 363.2 Thuật toán phân cụm 403.3 Bài toán áp dụng 43
Trang 3Mở đầu
Toán tử trung bình trọng số có sắp xếp (Ordered Weighted Averagingoperater- OWA) được Yager giới thiệu năm 1988 là một công cụ hữu íchnhằm tích hợp các thuộc tính của đối tượng theo các tiêu chí khác nhau.Toán tử này đã được sử dụng trong nhiều dạng bài toán và đã thu đượcnhững kết quả tốt [7] [8]
Tiếp sau Yager, nhiều nhà toán học khác cũng đã nghiên cứu, pháttriển toán tử OWA và đạt được nhiều thành công như: O'Hagan [6], PerterMajlender [3], Robert Fuller [4],
Mục đích của đề tài này là nghiên cứu về toán tử OWA, các tính chấtquan trọng của nó và bước đầu ứng dụng trong một số bài toán cụ thể.Nội dung bản luận văn gồm có phần mở đầu, ba chương, phần kết luận
và tài liệu tham khảo
Chương 1 trình bày về toán tử OWA cùng một số tính chất đặc trưng của
nó và được dẫn giải bởi các ví dụ cụ thể Chương này cũng nêu một số dạngkhác của toán tử OWA
Chương 2 trình bày các thuật toán nhằm tối ưu độ phân tán của các trọng
Em xin gửi lời cảm ơn chân thành tới các thầy giáo, cô giáo trường Đạihọc Khoa học, khoa Toán - Tin và các giáo sư đã hết lòng giảng dạy, truyền
đạt cho em nhiều kiến thức khoa học trong suốt thời gian em học tập tại
đây
Trang 4Cuối cùng, tôi xin gửi lời cảm ơn tới những người thân, những người bạncủa tôi đã động viên và cổ vũ tôi rất nhiều trong suốt thời gian vừa qua.
Do điều kiện về thời gian và trình độ có hạn nên bản luận văn khôngtránh khỏi những thiếu sót Em rất mong nhận được những ý kiến đóng gópquý báu của các quý thầy cô và toàn thể các bạn
Thái Nguyên, tháng 09 năm 2009
Đỗ Thuỳ Ninh
Trang 5Chương 1
Toán tử OWA
Quá trình tích hợp thông tin xuất hiện trong rất nhiều ứng dụng của các
hệ tri thức chẳng hạn như trong mạng nơron, điều khiển mờ, hệ chuyêngia và hệ trợ giúp quyết định, đặc biệt trong các bài toán phải xử lý nhữngthông tin bất định Năm 1988, R.Yager [8] [9] đã định nghĩa toán tử trungbình trọng số có sắp xếp (Ordered Weighted Averaging operator) viết tắt làOWA nhằm cung cấp một phương pháp kết hợp các thuộc tính gắn với sựthoả mãn những tiêu chí nào đó Chương này trình bày về toán tử OWA,các tính chất cơ bản và một số dạng khác của toán tử này
Định nghĩa 1.1.2 Toán tử OWA với vectơ trọng số W là một ánh xạ F :
Rn −→ R được xác định như sau: Với mỗi vectơ a = (a1, a2, , an) ∈ Rn
F (a) =
nX
j=1
wjbj,trong đó bj là phần tử lớn thứ j của vectơ a
Ví dụ 1.1.1 Giả sử cho vectơ
W = (0, 4; 0, 3; 0, 2; 0, 1)T và a = (0, 7; 1; 0, 3; 0, 6) Khi đó, ta có vectơ
b = (1; 0, 7; 0, 6; 0, 3),
Trang 6và toán tử OWA:
F (a) =
4X
j=1
wjbj = 0, 4.1 + 0, 3.0, 7 + 0, 2.0, 6 + 0, 1.0, 3 = 0, 76
ý nghĩa cơ bản của toán tử này là sắp xếp lại vectơ cần tích hợp, nghĩa
là phần tử cần tích hợp ai không liên kết với trọng số wi mà trọng số wi sẽkết hợp với một phần tử ở vị trí tương ứng của tập các phần tử tích hợp saukhi đã được sắp xếp Sự khác nhau giữa các toán tử OWA được phân biệtbởi các trọng số này
Tính tổng quát của toán tử OWA là ở chỗ bằng việc lựa chọn những trọng
số, ta có thể thực hiện các dạng toán tử kết hợp khác nhau Bằng cách lựachọn thích hợp các trọng số trong vectơ W , ta có thể nhấn mạnh các tham
số khác nhau trên cơ sở vị trí của chúng trong thứ tự sau khi xếp Nếu ta
đặt hầu hết các trọng số gần đầu của W , ta có thể nhấn mạnh các điểm caohơn, trong khi đó, nếu đặt các trọng số gần cuối của W sẽ nhấn mạnh các
điểm thấp hơn
1.1.2 Một số trường hợp đặc biệt
• Nếu trọng số w1 = 1 và wj = 0 với mọi j 6= 1, vectơ trọng số ký hiệu
là W∗ = (1, 0, , 0)T, ký hiệu toán tử OWA ứng với trọng số W∗ là F∗
Ta có F∗(a) = F∗(a1, , an) = maxj(aj) Như vậy toán tử chọn số lớnnhất (max) là một dạng của toán tử OWA
• Nếu trọng số wn = 1và wj = 0 với mọi j 6= n, vectơ trọng số ký hiệu
là W∗ = (0, 0, , 1)T, ký hiệu toán tử OWA ứng với trọng số W∗ là F∗
Ta có F∗(a) = F∗(a1, , an) = minj(aj) Như vậy toán tử chọn số bé nhất
j=1
aj
Từ đó toán tử trung bình đơn giản cũng là một dạng của toán tử OWA
Trang 7•Nếu wk = 1và wj = 0với mọi j 6= k, toán tử OWA F (a1, , an) = bk( giá trị lớn thứ k của vectơ a) Như vậy việc chọn một thành phần củavectơ cũng là trường hợp đặc biệt của họ toán tử OWA Trường hợp riêng
ta thu được phần tử ở giữa vectơ a bằng cách:
Nếu n là lẻ lấy wn+1
2 = 1 và đặt wj = 0, j 6= n+12 Nếu n là chẵn lấy wn
2 và đặt wj = 0 cho tất cả các số hạngkhác
1.1.3 Một số tính chất
Sau đây ta đều giả thiết W = (w1, , wn)T là vectơ trọng số
Tính chất 1.1.1 Đối với mỗi toán tử OWA, ta có:
F∗(a1, , an) 6 F (a1, , an) 6 F∗(a1, , an),
⇔ min(ai) 6 F (a1, , an) 6 max(ai)
(Hay giá trị của toán tử OWA bị chặn bởi giá trị lớn nhất và nhỏ nhất củavectơ a)
Chứng minh Giả sử toán tử OWA với vectơ trọng số W = (w1, , wn)T
đã cho như trên và b = (b1, , bn) là vectơ sắp xếp lại của vectơ a (Nghĩa
là b1 ≥ b2 ≥ ≥ bn.) Ta có
F∗(a1, , an) = b10 + b20 + + bn1 = bn = min(ai),
F (a1, , an) = b1w1 + b2w2 + + bnwn =
nX
i=1
wibi ≥
nX
i=1
wibn = bn
nX
i=1
wi = bn = min(ai),
nX
wibi ≤
nX
wib1 = b1
nX
wi = b1 = max(ai)
Trang 8Từ đó
min(ai) 6
nX
i=1
wibi 6 max(ai) hay F∗ 6 F 6 F∗
2Tính chất 1.1.2 (Tính hoán vị)
Ta có
F (a1, , an) = F (d1, , dn),với mọi hoán vị d = (d1, , dn) của a = (a1, , an)
Chứng minh Vì sự sắp xếp là duy nhất nên vectơ cần tích hợp a và hoán
vị d đều có chung vectơ sau khi sắp xếp là b = (b1, , bn) Vậy
F (a1, , an) = F (d1, , dn)
2Tính chất 1.1.3 (Tính đơn điệu)
Giả sử a = (a1, a2, , an)và c = (c1, c2, , cn)là hai vectơ của toán tửOWA thoả mãn ai ≥ ci (i = 1, , n) Thế thì F (a1, , an) ≥ F (c1, , cn)Chứng minh Giả sử vectơ sau khi sắp xếp của vectơ a là b = (b1, , bn),vectơ sau khi sắp xếp của vectơ c là d = (d1, , dn) Vì hai vectơ a, c thoảmãn ai ≥ ci, nên bi ≥ di với mọi i
Nếu vectơ c = (c1, , cn) với c1 = c2 = = cn = a thì ta có
F (c1, , cn) = a
Trang 9Chứng minh Ta có
F (c1, , cn) = a.w1 + + a.wn = a.(w1 + + wn) = a.1 = a
21.1.4 Đặc trưng của toán tử OWA
Trong phần này ta nghiên cứu hai phép đo quan trọng, phụ thuộc vàovectơ trọng số, hữu ích cho việc đặc trưng hoá các toán tử OWA [1]
i=1(n − i)wi
Ví dụ 1.1.2 Ta xét một ví dụ sau
xa nhau thì Disp càng nhỏ Điều đó chứng tỏ nếu ta xét các thuộc tính mộtcách đồng đều nhau thì Disp lớn và ngược lại Nói cách khác, độ đo Dispchỉ mức độ sử dụng các thuộc tính
Với độ đo Orness, nếu trọng số cao ở đầu thì Orness lớn, trọng số cao
ở cuối thì Orness nhỏ Nếu các trọng số đều bằng nhau thì Orness tiến tới0.5 Nghĩa là độ đo Orness xác định điểm nhấn mạnh
Trang 10Ngoài hai độ đo cơ bản trên, người ta còn phát triển thêm một số độ đokhác [3], chẳng hạn
Hs(W ) = −
nX
i=1
wiR
1 R
.Nhận xét: Sử dụng công thức tính giới hạn ta có:
Trang 111.2.1 Xác định vectơ trọng số qua các lượng tử mờ
1 Xác định hàm định lượng từ mờ Q (chẳng hạn "thoả mãn đa số cáctiêu chuẩn")
2 Tính wi theo công thức wi = Q(i/n) − Q((i − 1)/n)
3 Tính vectơ a, trong đó ai = Ai(x)
4 Sử dụng toán tử OWA với vectơ trọng số W và vectơ a vừa xác định
Ví dụ 1.2.1 Cho lượng tử mờ Q được xác định Q(i) = i2, và n = 3
Khi đó vectơ trọng số W xác định như sau:
1.2.2 Xác định vectơ W gắn với độ quan trọng
Giả sử ta có n cặp (u , a ) trong đó u ∈ [0, 1]là trọng số quan trọng và
Trang 12(ai ∈ [0, 1]) là thuộc tính tương ứng Có thể xem uj là sự quan trọng của
điều kiện thứ j và aj là sự thoả mãn của một lựa chọn đã cho đối với tiêuchuẩn thứ j
Trước hết ta sắp xếp lại các aj, kí hiệu bi là giá trị lớn nhất thứ i củacác ai Kí hiệu vi là sự quan trọng gắn với điểm có giá trị lớn nhất thứ i.Khi đó ta có thể xem xét tập n cặp (vi, bi) trong đó các bi được sắp xếptheo thứ tự giảm Bước tiếp theo là thu nhận các trọng số OWA như sau
wi = Q(Si/T ) − Q(Si−1/T ) với i = 1, , n trong đó Q là một lượng từ
mờ như nêu trên,
Si =
iX
k=1
vk, T = Sn =
nX
"hầu hết") Sử dụng thuật toán trên ta được:
Trang 13vectơ trọng số W có thể là mô hình tốt nhất cho quá trình kết hợp được sửdụng trong tập dữ liệu này Điều này có nghĩa là tìm một vectơ trọng số Wsao cho với toàn bộ tập dữ liệu, ta thoả mãn điều kiện một cách chính xácnhất có thể với mọi quan sát
F (a1, a2, , an) = dk,trong đó F chỉ ra sự kết hợp OWA của các tham số sử dụng W Ta ký hiệucác đối tượng đã được sắp lại thứ tự của mẫu thứ k là (bk1, bk2, , bkn)trong
đó bkj là thành phần lớn nhất thứ j của tập tham số (ak1, ak2, , akn) Sửdụng những tham số có thứ tự này, bài toán trở thành tìm vectơ trọng số
W = (w1, w2, , wn)T thoả mãn tốt nhất
bk1w1 + bk2w2 + + bknwn = dk,với mọi k chạy từ 1 tới m
Sử dụng kỹ thuật giảm độ dốc gradient ta tìm một vectơ trọng số
W = (w1, w2, , wn)T
Trang 14tối thiểu hoá những sai số ek
ek = 1
2((bk1w1 + bk2w2 + + bknwn) − dk)
2,
và các wi phải thoả mãn các điều kiện:
nX
eλi, i = 1, , n
Như vậy đối với bất kỳ giá trị nào của các tham số λi thì các trọng số
wi sẽ dương và tổng bằng 1 Bởi vậy bài toán tối thiểu hoá có rằng buộc cóthể chuyển thành bài toán quy hoạch phi tuyến không ràng buộc tìm kiếm
eλ1+ bk2 e
λ2nPi=1
eλ2+ + bkn e
λnnPi=1
eλn
− dk
2
Sử dụng phương pháp độ dốc gradient, ta có thể thu được luật sau choviệc cập nhật các tham số
λi(l + 1) = λi(l) − βwi(l)(bki − bdk)( bdk− dk),trong đó λi(l + 1) là ước lượng mới của chúng ta về λi Kí hiệu β là mộthằng số chỉ tỉ lệ học (0 ≤ β ≤ 1), với mỗi i, wi(l) = e
λi(l)nPi=1
eλi(l)
là ước lượngcủa wi sau lần lặp thứ l và
Trang 151.3 Một số biến thể của OWA
Ngoài dạng cơ bản trên của toán tử OWA, người ta còn xét một số dạngkhác của nó tuỳ thuộc vào các ứng dụng cũng như khả năng tổng quát hoá.Sau đây sẽ trình bày một số dạng thường gặp
1.3.1 Toán tử WOWA
Trước hết xét một số khái niệm sau:
Định nghĩa 1.3.1 Một hàm Q : [0, 1] −→ [0, 1] là mộtLượng hoá mờ khônggiảm đơn điệu chính quy nếu thoả mãn:
(i)Q(0) = 0,(ii)Q(1) = 1,(iii)x > y ⇒ Q(x) ≥ Q(y)
Hai lượng hoá đặc biệt là:
(i)Qx(0) = 0, Qx(x) = 1, x 6= 0,(ii)Qn(1) = 1, Qn(x) = 0, x 6= 1
Định nghĩa 1.3.2 Cho P là một vectơ n chiều thì ánh xạ W M : Rn
Định nghĩa 1.3.3 Cho Q là một lượng hoá mờ không giảm, ánh xạ cho bởi
OW AQ(a1, , an) =
nX
i=1(Q(i/n) − Q((i − 1)/n))aσ(i),
Trang 16trong đó {σ(1), , σ(n)} là một hoán vị của {1, , n}, tức là ta có
aσ(i−1) ≥ aσ(i) với mọi i = {2, , n}, hay aσ(i) là phần tử lớn thứ i của tập(a1, , an)
lượng hoá mờ không giảm là tương đương nhau vì wi có thể định nghĩa qua
nội suy các điểm {i/n, Q(i/n)} với i ∈ {0, 1, , n}
Để thừa nhận hai trọng số trong một bài toán ta xét một dạng toán tửOWA trọng số (WOWA) Toán tử này tập hợp một tập các giá trị sử dụnghai vectơ trọng số: một tương ứng tới vectơ P trong ý nghĩa trọng số, vàmột tương ứng tới W trong toán tử OWA
Định nghĩa 1.3.4 Đặt P và W là hai vectơ trọng số của không gian n
Or-dered Weighted Averaging) của không gian n chiều nếu:
Cũng tương tự như toán tử OWA, ta có thể định nghĩa WOWA sử dụnglượng hoá mờ (thay cho vectơ trọng số w)
Định nghĩa 1.3.5 Cho Q là một lượng hoá mờ không giảm, P là một vectơ
Trang 17thoả mãn tiên đề sau:
1 à(∅) = 0, à(X) = 1, ( điều kiện biên)
2 A ⊆ B kéo theo à(A) ≤ à(B), ( tính đơn điệu)
Độ đo mờ thay thế tiên đề của tính chất cộng độ đo bởi tính đơn điệu.Suy ra những tính chất độ đo cũng là độ đo mờ
hàm f : X −→ R được định nghĩa:
nX
i=1(f (xs(i)) − f (xs(i−1)))à(As(i)),trong đó f(xs(i)) chỉ ra tính hoán vị, 0 ≤ f(xs(1)) ≤ ≤ f (xs(N )) ≤ 1,
Các toán tử WOWA có thể được biểu thị như là tích phân Choquet khixấp xỉ độ đo mờ được định nghĩa
Ta có thể định nghĩa độ đo tính tuyển của lượng hoá Q như sau:
định nghĩa:
Orness(Q) =
Z 1Q(x)dx
Trang 181.3.2 Toán tử LOWA
Sử dụng khái niệm tổ hợp lồi của J.Delgado, F.Herrera và cộng sự đã
định nghĩa một lớp toán tử LOWA trực tiếp suy rộng toán tử OWA củaR.Yager và áp dụng trong các bài toán quyết định tập thể Tuy nhiên trongquá trình tìm cách ứng dụng định nghĩa vào trong bài toán đánh giá và ướclượng các dự án công thức đã cho tỏ ra không phù hợp Với gợi ý đó, tácgiả đã sử dụng công thức dưới đây [1]:
Cho S = {s1, s2, , sT}là tập nhãn, sắp toàn phần s1 < s2 < < sT.Cho a = {a1, a2, , am} là tập các phần tử cần tích hợp, mỗi ai nhậngiá trị trong S Tập b = {b1, b2, , bm} là tập a đã sắp xếp, trong đó
bj là phần tử lớn thứ j của a Như vậy b = {sim, si(m−1), , si1} với
im ≥ im−1 ≥ ≥ i1
Cho W = {w1, w2, , wm}là vectơ trọng số, wi ∈ [0, 1]và Piwi = 1
Định nghĩa 1.3.8 Cho tập a = {a1, a2, , am}, W = {w1, w2, , wm}
là vectơ trọng số, toán tử LOWA là một tổ hợp thực của vectơ a với trọng
số w, Low : (a, w) −→ S cho bởi công thức truy toán sau:
Low(a, W ) = C{(wim, aim), (1 − wim, Low(a0, w0))},
ở đây a0
= {ai(m−1), , ai1}, w0 = {w0i1, w0i2, , wi(m−1)0 }, w0j = wj
1 − wim,
C là phép tổ hợp của hai nhãn (sj, si), j ≥ i với trọng số wj > 0, wi > 0,
wj + wi = 1, C{(wj, sj), (wi, si)} = sk, với k = i + round(wj, (j − i)).Nhận xét: Rõ ràng nếu tập S nhận các giá trị trên R1 thì toán tử Low chophép lấy trung bình có trọng số quen biết, (do vậy Low(a,W) sẽ là kỳ vọngtoán học khi W là vectơ xác suất)
Ví dụ 1.3.1 Cho a = (s1, s2, s3), w = (0.2; 0.3; 0.5)
Khi đó ta tính được b = (s3, s2, s1), w3 = 0.5, w2 = 0.3, w1 = 0.2 vàLow(a, w) = C{(0.5, s3), (0.5, Low((s2, s1), (0.2/0.5, 0.3/0.5)))}
Trang 19liªn kÕt víi vect¬ träng sè W vµ
GOW A(a1, , an) =
nX
wjbλj
1
λ,
Trang 20trong đó Pn
j=1
wj = 1, wj ∈ [0, 1], bj là giá trị ai của cặp IGOWA (ui, ai) lớnthứ j, ui biến thứ tự cảm sinh, ai là biến đối số, λ ∈ (−∞, ∞) là tham sốToán tử IOWA được giới thiệu bởi Yager và là một mở rộng của toán tửOWA ý nghĩa khác biệt của toán tử này không phải là việc phát triển vớigiá trị của đối số ai mà là việc phát triển thứ tự biến cảm sinh
R được liên kết bởi các vectơ trọng số n chiều và
IGOW A((u1, a1), , (un, an)) =
nX
Trang 21Chương 2
Tối ưu các trọng số
Ta đã biết việc xác định véc tơ trọng số W quyết định đến hiệu quảcủa toán tử OWA Người ta thường quan tâm đến hai khía cạnh: Sử dụnghầu hết các thuộc tính hay chỉ sử dụng một số thuộc tính đặc trưng của đốitượng Điều này dẫn đến việc khảo sát độ phân tán của véc tơ trọng số.Ngoài ra việc sử dụng các thuộc tính còn phụ thuộc vào điểm nhấn trongvéctơ trọng số, nghĩa là cần thoả một ràng buộc nào đó về độ đo tính tuyển.Chương này trình bày hai bài toán tối ưu véc tơ trọng số W theo hai hướngcực đại và cực tiểu độ phân tán [3] [6]
2.1 Độ phân tán cực đại
Trong chương trước ta đã biết đọ đo Disp đo độ phân tán vectơ trọng số
vectơ kết hợp là tương đối đều nhau Tuy nhiên việc đánh giá cũng cần thoả
điều kiện nào đó về điểm nhấn, nghĩa là cho trước một giá trị α ∈ [0, 1] để
đánh giá mức độ cực đại này Từ đó ta có bài toán sau
Cực đại hoá:
Disp(W ) = −
nX
i=1
wiln wi,với điều kiện:
n − 1
nX
i=1(n − i)wi, 0 ≤ α ≤ 1,
nX
Trang 22Cực đại hoá:
Disp(W ) = −
nX
i=1
wiln wi,với điều kiện:
Orness(W ) = α, 0 ≤ α ≤ 1,
w1 + + wn = 1, 0 ≤ wi ≤ 1, i = 1, , n
Nếu n = 2 thì từ Orness(w1, w2) = α,chúng ta đặt w1 = α, w2 = 1 − α.Ngoài ra nếu α = 0 hoặc α = 1 thì vectơ trọng số liên kết là duy nhất
và được định nghĩa: (0, 0, , 0, 1)T và (1, 0, , 0, 0)T
Nếu n > 3 và 0 < α < 1, với λ1, λ2 là các số thực ta đặt:
L(W, λ1, λ2) = −
nX
i=1
wiln wi+ λ1
nX
i=1
n − i
n − 1wi− α+ λ2
nX
Trang 231 , un = w
1 (n−1)
n ,th× (2.3) ®îc viÕt l¹i
wj = un−j1 uj−1n víi mäi 1 ≤ j ≤ n Tõ ®iÒu kiÖn Orness(W ) = α ta t×m
®îc:
nX
i=1(n − i)un−i1 ui−1n = (n − 1)α,
Trang 24un−j1 uj−1n = 1 ⇔ u
n
1 − un n
u1 − un = 1
⇔ un1 − unn = u1 − un
(2.5)
nX
w1[(n − 1)α + 1 − nw1]n = [(n − 1)α]n−1[((n − 1)α − n)w1 + 1] (2.8)Vì thế giá trị tối ưu của w1 sẽ thoả mãn phương trình (2.8) w1 được tínhtheo wn có thể xác định từ phương trình (2.7) và trọng số khác tính được từphương trình (2.3)
Trang 25Ví dụ 2.1.1 Xác định vectơ cực đại với n = 5, α = 0, 4:
Ta có bài toán cực đại hoá:
−
nX
i=1
wiln wi,thoả điều kiện:
n − 1
nX
i=1(n − i)wi, 0 ≤ α ≤ 1,
nX
w3∗ = 4
q(w1∗)2(w∗5)2 = 0.192
w4∗ = 4
q(w1∗)(w∗5)3 = 0.2353
wiln wi,