- 11 2 Một số thuật toán cơ bản giải bài toán vận chuyển tối wu rời rac.. MỞ DẦU.Luận văn này trình bày vé chính quy hóa Entropi của bài toán vận chuyển tối ưu với ba chương gồm: e Chươn
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM THÀNH PHÓ HÒ CHÍ MINH
Phạm Quốc Bình
CHÍNH QUY HÓA ENTROPI CỦA BÀI TOÁN
VẬN CHUYÊN TÓI ƯU.
LUẬN VĂN THẠC SĨ TOÁN HỌC.
Thành phố Hồ Chí Minh — Năm 2024
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHAM THÀNH PHO HO CHÍ MINH
Phạm Quốc Bình
CHÍNH QUY HÓA ENTROPI CỦA BÀI TOÁN
VAN CHUYEN TOI UU.
Nganh: Toan Giai Tich.
Mã số: 8460102.
LUẬN VĂN THẠC SĨ TOÁN HỌC.
NGƯỜI HƯỚNG DAN KHOA HỌC:
TS TRAN TRÍ DŨNG.
Thành phố Hồ Chi Minh — Năm 2024
Trang 3Mục lục
MO DAU Q TQ TQ y1
1 Kiến thức chuẩn bị 6
1.2 Bài toán Monge QC cv ee ee TF 1.3 Bài toán Kantorovich 0000000000000 00048 9
1.4 Tinh metric của bai toán van chuyển toi wu 2 - 11
2 Một số thuật toán cơ bản giải bài toán vận chuyển tối wu rời rac 16 2.1 Bài toán van chuyển tdi vu tuyển tính Kantorouich 16
2.2 Phép biến đổi C ,e.:4 18
2.3 Phuong dn bổ sung 2 Q TQ Q2 19 2.4 Các đình hình da giác của bài toán van chuyén tối u 21
2.41 Cấu trúc cây ` .-ễ-2.4.2 Quy tắc góc Tay Bắc 22
2.5 Mô ta phóng đoán của lưới don hình ” 23
2.5.1 Cặp đối ngẫu bố sung cho P 23
2.5.2 Cập nhật lưới đơn hình ¬ 25
2.5.3 Cải thiện phương án cơ ban 25
3 Một số thuật toán mở rộng giải bài toán vận chuyển tối wu rời rac 27 9.1 Chính quy hóa Entropi ¬ ¬ 27
3.2 Thuật toán Sinkhorn va sự hội tu của nó 3]
3.3 Dạng tương đương của thuật toán Sinkhorn iia ee lo 3.4 Xap xi chính quụ của chi phi van chuyén tôi ưu 39
KET LUẬN .- 0.000 ee 4 TÀI LIEU THAM KHẢO 13
Trang 4MỞ DẦU.
Luận văn này trình bày vé chính quy hóa Entropi của bài toán vận chuyển tối
ưu với ba chương gồm:
e Chương 1: Kiến thức chuẩn bị
e Chương 2: Một số thuật toán co bản giải bài toán vin chuyển téi ua rời rac.
e Chương 3: Một số thuật toán md rộng giải bài toán vận chuyển tôi wu rời rac.
Luận văn này được nghiên cứu đựa trên các phương pháp nghiên cứu sau Thứnhất về phương pháp luận: Hệ thống lại các khái niệm, định lý hay hé quả có liên
quan đến một số thuật toán cd bản va mở rộng giải bài toán vận chuyển téi ưu rời
rac để làm cơ sở lý thuyết cho việc thực hiện nghiên cứu và chứng minh các kết
quả có liên quan Thứ hai vé phương pháp toán học: Sử dung logic toán học với
mục đích xây dựng và chứng minh các kết quả trong quá trình nghiên cứu về chính
quy hóa Entropi của bài toán vận chuyển tối ưu Thứ ba vẻ phương pháp phân tích
và tổng hợp: Phân tích và đánh giá các kết quả đã có hay đạt được liên quan về
chính quy hóa Entropi của bài toán vận chuyển tối wa Thứ tư về phương pháp giả
thuyết: Dat ra những giả thuyết xoay quanh về bài toán vận chuyển tối ưu, đặcbiệt liên quan đến vấn dé trong tâm của luận văn là vẻ chính quy hóa Entropi củabài toán vận chuyển tối ưu, từ đó chứng minh để công nhận hoặc chỉ ra phản ví
dụ để bác bỏ Cuối cùng về phương pháp logic: Trình bày lập luận và chứng minh
một cách chặt chẽ các kết quả nghiên cứu được.
Luận van này được nghiên cứu dựa trên hình thức hoc tập dưới sự dẫn dat từ
giảng viên hướng dẫn nghiên cứu, tham khảo các tài liệu sách báo có chủ để liên
quan đến luận văn, thực hiện các chuyên dé nghiên cứu, tham gia các buổi hop
Seminar.
Mục đích của chương | là đưa ra cơ sở lý thuyết của bài toán van chuyển tối
ưu Chương này gồm các nội dung sau:
e Dé do.
e Bài toán Monge.
e Bai toan Kantorovich.
e Tinh Metric của bài toán van chuyển tối ưu.
Chương này trình bày về những điều cơ bản của bài toán van chuyển tối ưu
Trước tiên là giới thiệu các khái niệm vẻ sự liên kết tối ưu giữa các vectơ xác suất
Trang 5(a, b}, khái quát bài toán vận chuyển này giữa các độ đo rời rac (a, đ} và cudi cùng
là tong quát bài toán với các độ đo bất kỳ Ban đầu, những điều này có thé bị bỏ
qua và chỉ tập trung vào việc tính toán giữa các vectơ xác suất, cu thé là biểu đỗ
tần số, là điều kiện tiên quyết để thực hiện các thuật toán chỉ tiết trong chương 2
và 3 Dể hiểu rõ vẫn để, ta xem xót cách thức áp dụng cho độ đo tùy ý, và có thể
ap dung vào các van đề phức tạp hơn (ví dụ: để di chuyển vị trí của các điểm đámmây hoặc trong việc thống ké các điểm liên tục)
Mục đích của chương 2 là trình bày một số thuật toán cơ bản giải bài toán vận chuyển tối ưu rời rac Chương này gồm các nội dung sau:
e Bài toán vận chuyển tối ưu tuyến tính Kantorovich
e Phép biến doi C.
e Phương án bồ sung
e Các đỉnh hình đa giác của bài toán vận chuyển tối ưu.
e M6 tả phóng đoán của lưới đơn hình.
Chương này mô ta các thuật toán phố biển nhắt về tối ưu hóa tổ hợp và
quy hoạch tuyến tính được sử dụng để giải các bài toán van chuyển tối ưu rời
rac, cũng như được mé tả trong bài toán vân chuyển tối uu cơ bản Lefa,b) =
min {C, P) với (C, P} := 3_GuP„ ({1.10) trong chương 1) hoặc bài toán doi
Pe€Ut(a.b) m
ngẫu Lo(a,b) = | maz [{f,a) + (a,b) với RIC) = {{f,9) € R" x RTM : VỤ,¿) €
VF @
fr] x [rn], fe g < C}.
Mục đích của chương 3 là trình bay một số thuật toán mở rộng giải bài toán
vận chuyển tối ưu rời rac Chương này gồm các nội dung sau:
e Chính quy hóa Entropi.
e Thuật toán Sinkhorn và sự hội tu của nó.
e Dang tương đương của thuật toán Sinkhorn.
e Xắp xỉ chính quy hóa của chi phí vận chuyển téi ưu.
Chương này giới thiệu một họ các sơ dé số để giải gin đúng các bài toán vận
chuyển tối uu của Kantorovich và dang tong quát của nó Nó hoat động bang cách thêm một hình phạt chính quy hóa entropi vào bài toán ban đẫu Việc chính quy
Trang 6hóa này có một số lợi ích quan trọng Việc cực tiểu hóa bài toán chính quy có thểđược giải quyết bằng một phương pháp sơ đỗ cực tiểu hóa thay thé cơ bản: sơ đỏ
đó chuyển thành các bước lặp là tích các vectd ma trận đơn giản, khiến chúng đặc biệt phù hợp với việc thực thi GPU; đối với một số ứng dụng, tích các vectơ ma
trân này không yêu cau lưu trữ ma trận chi phí ø x m, nhưng thay vào đó chỉ yêu cau ve việc đánh giá hạt nhãn.
Trang 7Các ký hiệu
¢ Jr]: Tập hợp các số tự nhiên Á1, n}.
@ lam: Ma trận trong R"*" với tat cả các thành phan đều bằng 1 1: Vectơ
mot.
e ï„: Ma tran đơn vi với kích cỡ m x nr.
e Với u € BR”, diag(u) là ma tran vn x n với đường chéo là u và các thành phan
con lai bang 0.
e ©,: Don hình xác suất
e (a,b): Dé thị tan số histograms các đơn hình ©, x
Yyn-e (a, 3): Các độ đo, xác đình trên các không gian (4, }}.
° = : “Tỉ số tương doi của độ đo « theo độ do đ.
e c(z,}: Chi phí mat dat, với ma trân chi phí theo cặp liên kết Cj; = (efx, M/)),;
được đánh giá trên hỗ trợ của a, 3.
e 7: Dé do ghép đôi giữa a và ở tức là với A C AV x(A x Y) = afA), và với
BC },xz(X x BỊ = 6(B) Với các độ đo rời rac r= À ” Pade:
tự
e ¿((a 2) : Tap hợp các độ đo ghép đối, với các độ đo rời rac Ula, 6}.
e Ric} : Tap hợp các phương án đối ngẫu chấp nhận được với độ do rời rac
R(C).
eT:Y>y: Ánh xạ Monge, đặc biệt thỏa man Tya = 3.
e (f,9) : Các phương án đối ngẫu với các dé do rời rac (f, g) là các biến đối
ngẫu.
Trang 8e (u,v) = (:7.-) : Chia tỉ lệ Sinkhorn.
e
` 4
ek =e : Hạt nhân Gibbs cua Sinkhorn.
e Lefa,b) và £,(a, 8}: Giá trị của bài toán tối ưu liên kết bài toán van chuyển
tỗi ưu với chi phí C (dé thị tan số histogram) và e ( độ đo tùy ý).
e I„(a.b) và W,(a,3) : Khoảng cách p-Wasserstein liên kết khoảng cách mặt
đất bởi ma tran D (đồ thị tần số histogram) và khoảng cách đ (độ đo tùy ý}
e (,): Dối với tích võ hướng Euclide thông thường giữa các vectơ; cho hai ma
trận cùng kích thước A và B, {A,B} := tr(ATØ} là tích phan Frobenius.
e /@ g(z.U} := f(z) + gly), với hai hàm ƒ : ¥ — RB, g : ý = 8, xác định bói
ƒ@øg:*x}y¬R
ef@g:= ft? +1,g7 clRnX" với hai vectơ f e lầ", g e R”
e a@ là độ đo tích trên Ä x3, J g(x /)d(a @ 3){x ) := | g(x /)dœ(z)d9(w).
Xxy Xxy
e a@b:=ab! € R"X với a € R",b c R”
e uv = (ay) € RE" với (u,v) € (R“)?,
Trang 9Phan này tập trung hoàn toàn vào việc nghiên cứu hình hoc sinh ra bởi bài toán
vận chuyển tối ưu trên đơn hình
Dinh nghĩa 1.2 (D6 đo rời rac) Một độ đo rời rac với trọng số a € R” vàrì ,#„ € ¥ là không gian vectơ được biểu dién như sau
a= "đỗ, (11)
inl
trong đó J, là Dirac tai điểm z, tức là ở, : P(A’) — {0:1} được cho bởi
är(4)=1 nếu ré A, ô;(4)=0 nếu zrợ A.
Ngoài ra, độ do được biểu điễn như trên gọi là độ đo xác suất nếu a € Đ„ và là độ
đo đương nếu tất cả các phan tử của vectơ a không âm Dé tránh sự thoái hóa ở
những vị trí không có khối lương được tính đến, ta sẽ giả sử khi xét các độ đo rờirac mA tat cả các phan tử của a đều đương
6
Trang 10Mệnh dé 1.1 Cho + là không gian metric và ánh xạ ƒ : VY + liên tục Khi
Ký hiệu M.(24’) là tập hợp tat cả các độ do dương trên XY Tập hợp các dé đo
xác suất được ký hiệu JAM‘ (2V) Xem hình 1.1 minh họa các độ đo khác nhau.
Rời rạc d=1 Rời rạc d=2 Liên tục d=1 Liên tục d=2
Hinh 1.1
| Gabriel Peyré and Marco Cuturi, 2020, Hình 2.1.]
1.2 Bài toán Monge.
Cho ma trận chi phí C = (Ci j)nxn.Ciy > 0 với moi (7,7) € [[n] x [n] và a € R”.
Xét bài toán tối ưu trong Perm(n) là tap hợp các hoán vị của n phan tử
Trang 11Ta có thé đánh giá hàm chi phi trên bằng cách sử dung các hoán vị trong tap hợpPerm{n) Tuy nhiên, tập hợp đó có n! phan tử, rất lớn ngay cả đối với n nhỏ Vi
du, xét một tap hợp như vậy có hơn 10° phan tử [Dantzig, 1983] khi n bằng 70 (n
nhỏ) Do đó, bài toán tối uu chỉ có thể được giải quyết nếu tồn tại các thuật toán
hiệu quả để téi wa hóa hàm chi phí đó trên tập hợp các hoán vi
Nhận xét 1.1 Lim ý rằng bài toán gan tối ưu có thể có một số phương an
1 14) Trong trường hợp này chỉ có hai phép
bài toán Monge j17§1] tìm một ánh xạ biến mỗi điểm 2; thành một điểm y; và day
khối lượng của œ vẻ phía khối lượng của , tức là tìm ánh xạ 7 : {z z„} 9
{⁄\ v„} sao cho
¥7 € [m],b; = » aj, (1.4)
¿T{#)=vw;
mà ta viết ở dang rút gọn là Tya = 8.
Nhận xét 1.2 Do (1.4) nên 7 là toàn ánh Anh xa này sẽ giảm thiểu chi phí vận
chuyển, được tham số hóa bởi hàm e(z y) được xác định với mỗi điểm (x,y) € ¥ xy,
min {Det T(zi)) : Tra = oh (1.5)
Dinh nghĩa 1.4 (Toán tử day tới) Dối với ánh xa liên tue T : ¥ 4 Y, xác
định toán tử đẩy tới tương ứng của nó là Ty: 4(V) — (V) Cho độ đo đẩy tới
ứ € M(Y) của a € /M(), kí hiệu là Tya = 3 thỏa man
Vh € cor), h436) = fr (T(x)) da(xr) (1.6)
y x
Một cách tương đương, với mọi tập do dude B CY, ta có
8(B} = œ({z € X: T(x) € BY) = a(TT!(B)) (1.7)
Trang 12Lưu ý rằng T; bảo toàn tính đương, tức là néu a € ,M} (3X) thì Ta € M} ().
Định nghĩa 1.5 (Bài toán Monge với đô đo tùy ý) Bài toán Monge (1.5) có
thể được mở rộng cho trường hợp hai độ đo xác suất tùy ý (a, đ) trên hai khonggian (+,}) có thể được liên kết thông qua ánh xạ T: ¥ > },
mịn [ cá,Te))áaG) :†iịa =8) (1.8)
x
Dinh nghĩa 1.6 (Ánh xa kéo lùi) Anh xa kéo lai của hàm 7? : C(Y) + C(X)
được định nghĩa là ánh xạ tuyến tính sao cho T¥g = goT với mỗi g € C{Y) Day tới
và kéo lùi thực sự liên kết với nhau, theo nghĩa là
V(œ.ø) € ,M(V) x CŒ) f satta) = [tra
y x
Nhận xét 1.3 (D6 do và biến ngẫu nhién) D6 do Radon có thể được xem
như biểu dién cho sự phân bỗ của các biển ngẫu nhiên Một biển ngẫu nhiên X
trên Y là một ánh xạ X : Ø 3 + từ không gian xác suất (O,P), và phân bố acủa nó là độ đo Radon a € M4(2’) sao cho P(X € A) = af{A} = J da(x) trong đó
AXeA={yeR: Xứ) € A} Một cách tương đương, đó là sự day tới của P bởi
X,a = XP Ap dụng đầy tới khác 8 = Tya cho T : Ý — Y, theo (1.6), tương đương
với định nghĩa một biến ngẫu nhiên khác Y = 7(X) :œ € 23 T(X(w)) eY.
1.3 Bài toán Kantorovich.
Định nghĩa 1.7 Cho «a € 3*,bc RTM Tập hợp các ma tran ghép đồi có dang là
U{(a,b):= {PC R?X":Pl„=a va PTL, =}, (1.9)
trong đó vectø ma trận được ký hiệu như sau:
Plin = (= rs) eR” va Pll, = (= rs) éR*:
Trang 13Tập hợp U/{a b) bị chặn và xác định bởi n +m ràng buộc đẳng thức và do đó là một
da giác lỗi (bao lỗi của một tập hữu hạn các ma trận) [Brualdi, 2006, §8.1] Ngoài
ra, P nằm trong f/(a,b) khi và chỉ khi P? nam trong U/(b,a} Bài toán vận chuyểntối uu của Kantorovich có dạng:
Le(a,b) = min (C, P)với (C,P) = 3” Gi2P¿, (1.10)
PeU(ah) :
ij
trong đó C = (Ci
j}nxn-Day là bài toán tối ưu tuyến tinh, và đối với các bài toán như vậy, các phương
an tối wu của nó không nhất thiết duy nhất.
Định nghĩa 1.8 (Ma trân hoán vị ghép đồi) Đối với hoán vị ø € Perm(n), tađình nghĩa ma tran hoán vị tương ứng P„ như sau:
điều nay chứng tỏ rằng bài toán tối wu (1.2) có thể được viết lại duéi dang bài toán
Kantorovich (1.10) trong đó các ghép doi P là các ma trận hoán vị:
n
min = Cio) = min (C Po).
ơEPcrm(n}m n hề œ€Perm{(n)
i
Tiếp theo, ta có thé dé đàng kiểm tra tập hợp các ma trận hoán vị hoàn toàn nằm
trong đa giác Birkhoff U (= —) Thật vậy, với mọi hoán vi ø ta có Pl), = =
Trang 14vị tôi ưu o* € Perm(n) cho bài toán (1.2) [Bertsimas và Tsitsiklis, 1997, Dinh lý 2 7|.
Định nghĩa 1.9 (Bài toán Kantorovich giữa các độ đo rời rac) Déi với các độ
đo rời rac a, 8 có dạng (1.3), ma trận C với C¡¿ := c{z¿, w;), ta định nghĩa
Dinh nghĩa 1.10 (Bài toán Kantorovich giữa các độ đo tiy ý) Xét ghép đôi
me AfT(A' x Y) Trong trường hợp rời rac, 7 = > P; 54¢;,;) Trong trường hợp tổng
tử
quát, ràng buộc bao toàn khéi lượng (1.9) được viết lại như sau
Wí(a,) = {re MEX): Pye =a và Py =9} (1.13)
GO đây Px, và Pyy là các ánh xạ day tới (xem Dinh nghĩa 4) của các hình chiếu
Py(z,w) = x và Py(z,w) = y Bài toán Kantorovich (1.10) khi đó được tong quát
(ii) Dj; = 0 khi va chỉ khi i = j;
(ii) Vi, 3,4) € [a], Dix < Diy + Dạy.
Khi đó
Ip(a.b) := [Lpz(a,b)|* (1.15)
(lưu ý rằng W, phụ thuộc vào D) xác định khoảng cách p—Wasserstein trên Dy,
tức là W„ là đối xứng, dương, W’,(a,6) = 0 khi và chỉ khi a = b, và nó thỏa man bat
đẳng thức tam giác
Va,b,e € En, W(a,e) < W,(a,b} + W(b, ).
Trang 15Chứng minh Tinh doi xứng và sự xác định của khoảng cách dé đàng chứng minh.
Vì C = DP có đường chóo không, Wp(a,a) = 0, với ma trận vân chuyển tỗi
ưu tương ứng P* = điag(a) That vậy, ta có Ptl, = a và (P*]l1„ = «a nên
P* € Ufa.a) Do (ii) nên DP Phy = 0 với moi i,j € [nr] Do đó, > DE Pe; = = 0.
sao cho P;,;,> 0 Điển này dẫn đến DEriot todo > 9 (do ii) và do đó » DƑjPig > 0.
iv 1
Vay x a min 2-1 DƑ va] > 0.
PE (a,b)
Do tính déi xứng của DP nên W„(a,b) cũng là một ham đối xứng Thật vay,
Wy(a,b) = (Lepe(a,b))? = cia Pts ~ F „>E)
iJ ig 1
-| min ng = [Lpr{b.a)|* = W„(b.a).
P?eU(b.a)
1t
Ta chứng minh bat đẳng thức tam giác của khoảng cách Wasserstein cho các
độ do tùy ý Cho a,b,c € S„ Cho P và Q là hai phương án téi wu của bài toán vận
chuyển giữa a và b, b và e tương ứng Ta định nghĩa một vectơ 6 sao cho b; = b;
nếu by > 0, và ở; := 1 nếu b¡ = 0 thì
S := Pdiag (;) Qcx"
Trang 16và lưu ý rằng Š € U(a,c) That vậy, vì
t
S1, = Pdiag (; Jat, = Pdiag (;) b=P (5) = Pl suppis) = 2
trong đó ký hiệu 1s„„„¡;; là vectơ có kích thước n với các vectơ tại các chỉ SỐ j
trong đó b, > 0 và các trường hợp khác bằng 0, và ta sử dung Pl supp(oy = Pin = a
vi P;; = 0 déi với những ÿ có 6; = 0 Thật vậy, do P71, = 6 nên » P;5 = by Với
những chi số 7 có 6; = 0 thi Pj = 0 với mọi 2 € [n] Ngược lại, với những chi số 7
2 ` Pj m¬ P ° F 2 4
có b; > 0 thì ` ra = 1 Tương tự, ta chứng minh được STL, = e Bat đẳng thức
tam giác Suy ra từ
Diéu này dẫn đến điều phải di ng mình a)
Nhận xét 1.4 (Các trường hợp 0 < p < 1) Lưu ý rằng néu 0 < p < 1 thì
DP chính là khoảng cách Khi với p > 1, WẢN- là khoàng cách Ngược lại, trong
Trang 17trường hợp p < 1, [W,(a,b)]” là khoảng cách xác định khoảng cách trên đơn hình.
Nhận xét 1.5 (Khoáng cách Wasserstein giữa các độ đo) Mệnh dé 1.3 có thé
được khái quát hóa để giải quyết các độ đo tùyý không cần phải rời rac
Mệnh dé 1.4 Giả sử X = Y và với một số p > 1,e(z.y) = |d(z wìÌ”, trong đó d
là khoảng cách trên +, tức là
(i) díz,) = d{y, x) > 0;
(i1) d{x,y) = 0 khi và chỉ khi 2 = y;
(ii) V{(z.w,z) € +3, d(x, z} < d{z, y) + dy, z).
Khi đó khoảng cách p-Wasserstein trên ¥,
Wa, 3) = (Lav (ex, 3)]* (1.16)
(lưu ý rằng W, phụ thuộc vào d), thực sự là một khoảng cách, cụ thể là W, đối
xứng, không am, W,{a, ở) = 0 khi và chỉ khi a = 3, và nó thỏa mãn bat đẳng thức
tam giác
¥(a, 3,7) € MEX), Wyle, 7) < W,(a, 8) + Wp(đ, +).
Chứng minh Chứng minh tuân theo cách tiếp cận tương tự như trong Mệnh dé
1:3: 0
Định nghĩa 1.11 (Hội tụ yếu) Trên miễn compact ÄY.(ø¿)¿ hội tụ yếu về
a trong M1! (Y} (ký hiệu là a; > œ} khi và chỉ khi với hàm liên tục bất kỳ
ge C(X), [oi + J sa Khái niệm hội tụ yêu này tương ứng với sit hội tu theo
x
vectd ngẫu¡nhiền, Sự hội tụ này có thể được biểu dién tương đương với Wplay,a) + 0
[Villani, 2009, Dinh lý 6.8].
Dinh nghĩa 1.12 (Phép tình tiến) Trên không gian Euclide ¥ = E#, xét
c(x,y) = ||z — w|\*, ta định nghĩa phép tịnh tiến là 7; : z 6 z — 7 toán tử tịnh tiến.
Khi đó, ta có
W2(Tya, T 48)? = Wola, 3)? — 2 (> —7',ma — mạ) + ||r — 7l,
trong đó mạ := [xia € R? là giá trị trung bình của a Đặc biệt,
x
Wola, 3)? = Wola,3)? + ||ma — raạ||
Trang 18trong đó ä = T„„„œ, 8 = Ting, 3.
Nhận xét 1.6 (Trường hợp p = +00) Giới hạn của I2 khi p + +00 là
MHx(a ở):= min sup da 0ì, (1.17)
nella Bye r.y)€Supp(x)
Trang 19trong đó U{a,b):= {Pe RY": Pl,=a và PTI„ — b}.
Goi I, là ma tran đồng nhất có kích thước ø và đặt @ là tích Kronecker, Ma
trận cấp (m +m) x nm là:
A = | an’ Lg E Rie Hin) xm
% 1ƒ
16
Trang 20Định nghĩa 2.1 (Bài toán vân chuyển tối ưu tuyến tính Kantorovich) ChoPcE"z",pe[lR^" sao cho phan tử thứ i+ n{7 — 1) của p bằng P,,, (P được liệt kêtheo cột) để có được sự tương đương sau:
P € U(a,b) pc BY”, Ap = lÌ :
Do đó ta có thể viết bài toán vận chuyển tối ưu ban dau thành
Lo(œ,b} = min cTp, (2.2)
trong đó vectd e có nm chiên bằng với các cột xếp chồng lên nhau có trong ma
tran chỉ phí Œ Bài toán (2.2) được gọi là bài toán vận chuyến tỗi um tuyến tính
Kantorovich.
Nhận xét 2.1 Lim ý rằng một trong các n +m rang buộc được mé ta ở trên
là du thừa hay nói cách khác, các vectơ đường thắng của ma trận A không độc lập
tuyến tính That vậy, tổng n dòng dau tiên và m dòng tiếp theo sẽ cho cùng một
vectở (tức là A bs =A [>] = 12) Ta có thể chi ra rằng việc loại bỏ một dong
TMm VẢ)
a
b
Dinh nghĩa 2.2 Bai toán đối ngẫu [Bertsimas và Tsitsiklis, 1997, tr 143] tương
ứng với bài toán (2.2) được đình nghĩa là:
trong A và thành phan tương ứng trong | để xác định một hệ tuyến tính.
đó ràng buộc Ap = ø không còn xảy ra nhưng thay vào đó lại mang một chi phí
kh? (Ap — q) được tham số hóa bởi một vectơ chi phí tùy ý h € "+", Mức téi ưu
phụ thuộc vào vectơ chi phí k, được định nghĩa như sau:
H(h):= min [cp — hÏ(Ap — 4)|
pen
Nhận xét 2.2 Cho g = | Xét bài toán vận chuyển tối wu cơ bản, trong
Đầu tiên hãy lưu ý rằng bài toán này không có ràng buộc biên đối với p Thật
vay, giả sử p* là nghiệm tối ưu bat kỳ của bài toán (3.2), ta có
H(h) = aur, [c"p —hT (Ap - q)] < cp - hT{( Ap° = q) < cl p* = š.
Trang 21Với mọi vectd chỉ phí h; ham đó được gọi là hàm đối ngẫu Lagrange của L Mục
tiêu của lý thuyết đối ngẫu là tìm chặn dưới lớn nhất z bằng cách cực đại hóa H
với vectơ chi phí h bat kỳ, tức là
z= mae, H(h} = max ( ¬ ganic " Athy") :
Khi dó, z < z.
2.2 Phép biến đổi C.
Xót bài toán vận chuyển tối ưu đối ngẫu Kantorovich:
Lela, bìcla, b) ¡ 5 oy UF a} + {g, b}} (2.4)= x ca) + {g,b}), 2.4
trong đó tap hợp các biến déi ngẫu chap nhận được là:
R(C) := {(f.g) € R" x RTM :Ví(¡,j) € [ee] x Em].ƒ ø < C}.
Xét một cặp đối ngẫu chap nhận được bat kỳ (ƒ ø}.
Định nghĩa 2.3 Vects biến đối C của f, ký biệu là f° e RTM và được định nghĩa
là
V5 = min Cs = 2)
Dễ dang chứng minh rằng (f,©) € R(C) va ƒ€ là vectơ lớn nhất có thể sao cho
ràng buộc nay được thỏa man Vi vậy ta có diéu sau
(f,a) + (9.0) < (fa) + (f°, b).
Kết qua nay trước tiên cho phép ta phát biểu lại bài toán đối ngẫu như sau
Tương tự, ta xét biến đổi Ở của g, tức là veetd ø? e E* được định nghĩa là:
(9°); = min (Ci; — g;}.
7;e|ml
Khi đó.
(F,2) + (9,8) < (oa) + (9,0).
Trang 22Nhận xét 2.3 Bắt dau từ một f cho trước, bằng việc thay thé các biển đổi Œ
và Œ vài lan để cải thiện ƒ Thật vậy, ta có day bat đẳng thức
(fsa) + (97,5) < (026 a) + (9,0) < (0Ô a) + (FOC?) <
Mệnh đề 2.1 Cho ƒ € BR", ƒ'c[R",gøe RTM Khi đó ta có các mệnh dé sau đây:
(i) fs fsa fez se,
(ii) O° > ƒ,gʰ > g,
(ii) Ta có (ƒ2Ẻ), = min (Ci - fe) = min |Ci; — min (Cig — ƒz)|
-jelm] je[m] |? zein]
Vì = mere (lu — fr) > —(Cij — fi) nên (f£°°); > min (Cis - Cụ + ñ) = fi
véeln jEeym
Hệ thức g°© > g thu được theo cách tương tự.
(iii} Ta có fC° > ƒ (do (ñ)) Do đó, từ (i) ta thu được O°" < ƒ€,
Mat khác, từ (ii) ta suy ra /Œứ€ > fe với g = f°.
Vậy đẳng thức đã được chứng mình
2.3 Phương án bo sung.
Mệnh dé 2.2 Cho P* và ƒ*,ø* là phương án tối uu của L.(a,3) =
sup J ƒ(œ)de¿{(z] + / g(y)d3{y}| và các bài toán đỗi ngẫu (2.1) tương ứng.
(ƒ.g)€R() Y hy
Trang 23Vì (ƒ*,ø*) € R(C) nén mỗi phan tử của ma trận C — f* 6 g* phải không am Do
đó, vì tat cả các phan tử của P đều không im nên ràng buộc tích võ hướng ở trên phải bằng 0 Đỗi với bắt kỳ cặp chỉ số (¿ 7) nào sao cho P;; > 0,C¿ÿ — (fi + ø;) phải
bằng 0, và với cặp chỉ số (¡, 7) tùy ý sao cho Cy, > fi + gj, Pịy = 0 H
Kết quả ngược lai cũng đúng.
Định nghĩa 2.4 Ma trận P é R?*"' và một cặp vectơ (ƒ ø) được gọi là bổ sung
tương ứng với ma trận C nếu với mọi cặp chỉ số (i,j) sao cho P„¡ > 0,C(¡ = fi +g.
Nếu một cặp biển cơ bản và đối ngẫu chip nhãn được là bổ sung thì ta có thể
kết luận chúng là tối ưu.
Mệnh dé 2.3 Nếu P và (ƒ.ø) lần lượt là các phương án bổ sung và chap nhận
được cho các bài toán cơ bản £,(œ,đ) = sup [reat + Jae20) và
(/.gìeR()
x y
đối ngẫu (2.1), thì P và (f, 9) đều là phương án tối wu cơ bản và đối ngẫu
Chứng minh Boi tính đối ngẫu yếu, ta có
Lc(a.b} < (P.C) = {P, ƒ @ g) = fa, f) + {b,gu) = Lc(a.)
và do đó P và (ƒ,ø) lan lượt là phương án tối ưu cơ bản và đối ngẫu 0