1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Toán giải tích: Chính quy hóa Entropi của bài toán vận chuyển tối ưu

47 2 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Chính quy hóa Entropi của bài toán vận chuyển tối ưu
Tác giả Phạm Quốc Bỉnh
Người hướng dẫn TS. Trần Trí Dũng
Trường học Trường Đại Học Sư Phạm Thành Phố Hồ Chí Minh
Chuyên ngành Toán Giải Tích
Thể loại Luận văn thạc sĩ
Năm xuất bản 2024
Thành phố Thành phố Hồ Chí Minh
Định dạng
Số trang 47
Dung lượng 31,53 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

- 11 2 Một số thuật toán cơ bản giải bài toán vận chuyển tối wu rời rac.. MỞ DẦU.Luận văn này trình bày vé chính quy hóa Entropi của bài toán vận chuyển tối ưu với ba chương gồm: e Chươn

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM THÀNH PHÓ HÒ CHÍ MINH

Phạm Quốc Bình

CHÍNH QUY HÓA ENTROPI CỦA BÀI TOÁN

VẬN CHUYÊN TÓI ƯU.

LUẬN VĂN THẠC SĨ TOÁN HỌC.

Thành phố Hồ Chí Minh — Năm 2024

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC SƯ PHAM THÀNH PHO HO CHÍ MINH

Phạm Quốc Bình

CHÍNH QUY HÓA ENTROPI CỦA BÀI TOÁN

VAN CHUYEN TOI UU.

Nganh: Toan Giai Tich.

Mã số: 8460102.

LUẬN VĂN THẠC SĨ TOÁN HỌC.

NGƯỜI HƯỚNG DAN KHOA HỌC:

TS TRAN TRÍ DŨNG.

Thành phố Hồ Chi Minh — Năm 2024

Trang 3

Mục lục

MO DAU Q TQ TQ y1

1 Kiến thức chuẩn bị 6

1.2 Bài toán Monge QC cv ee ee TF 1.3 Bài toán Kantorovich 0000000000000 00048 9

1.4 Tinh metric của bai toán van chuyển toi wu 2 - 11

2 Một số thuật toán cơ bản giải bài toán vận chuyển tối wu rời rac 16 2.1 Bài toán van chuyển tdi vu tuyển tính Kantorouich 16

2.2 Phép biến đổi C ,e.:4 18

2.3 Phuong dn bổ sung 2 Q TQ Q2 19 2.4 Các đình hình da giác của bài toán van chuyén tối u 21

2.41 Cấu trúc cây ` .-ễ-2.4.2 Quy tắc góc Tay Bắc 22

2.5 Mô ta phóng đoán của lưới don hình ” 23

2.5.1 Cặp đối ngẫu bố sung cho P 23

2.5.2 Cập nhật lưới đơn hình ¬ 25

2.5.3 Cải thiện phương án cơ ban 25

3 Một số thuật toán mở rộng giải bài toán vận chuyển tối wu rời rac 27 9.1 Chính quy hóa Entropi ¬ ¬ 27

3.2 Thuật toán Sinkhorn va sự hội tu của nó 3]

3.3 Dạng tương đương của thuật toán Sinkhorn iia ee lo 3.4 Xap xi chính quụ của chi phi van chuyén tôi ưu 39

KET LUẬN .- 0.000 ee 4 TÀI LIEU THAM KHẢO 13

Trang 4

MỞ DẦU.

Luận văn này trình bày vé chính quy hóa Entropi của bài toán vận chuyển tối

ưu với ba chương gồm:

e Chương 1: Kiến thức chuẩn bị

e Chương 2: Một số thuật toán co bản giải bài toán vin chuyển téi ua rời rac.

e Chương 3: Một số thuật toán md rộng giải bài toán vận chuyển tôi wu rời rac.

Luận văn này được nghiên cứu đựa trên các phương pháp nghiên cứu sau Thứnhất về phương pháp luận: Hệ thống lại các khái niệm, định lý hay hé quả có liên

quan đến một số thuật toán cd bản va mở rộng giải bài toán vận chuyển téi ưu rời

rac để làm cơ sở lý thuyết cho việc thực hiện nghiên cứu và chứng minh các kết

quả có liên quan Thứ hai vé phương pháp toán học: Sử dung logic toán học với

mục đích xây dựng và chứng minh các kết quả trong quá trình nghiên cứu về chính

quy hóa Entropi của bài toán vận chuyển tối ưu Thứ ba vẻ phương pháp phân tích

và tổng hợp: Phân tích và đánh giá các kết quả đã có hay đạt được liên quan về

chính quy hóa Entropi của bài toán vận chuyển tối wa Thứ tư về phương pháp giả

thuyết: Dat ra những giả thuyết xoay quanh về bài toán vận chuyển tối ưu, đặcbiệt liên quan đến vấn dé trong tâm của luận văn là vẻ chính quy hóa Entropi củabài toán vận chuyển tối ưu, từ đó chứng minh để công nhận hoặc chỉ ra phản ví

dụ để bác bỏ Cuối cùng về phương pháp logic: Trình bày lập luận và chứng minh

một cách chặt chẽ các kết quả nghiên cứu được.

Luận van này được nghiên cứu dựa trên hình thức hoc tập dưới sự dẫn dat từ

giảng viên hướng dẫn nghiên cứu, tham khảo các tài liệu sách báo có chủ để liên

quan đến luận văn, thực hiện các chuyên dé nghiên cứu, tham gia các buổi hop

Seminar.

Mục đích của chương | là đưa ra cơ sở lý thuyết của bài toán van chuyển tối

ưu Chương này gồm các nội dung sau:

e Dé do.

e Bài toán Monge.

e Bai toan Kantorovich.

e Tinh Metric của bài toán van chuyển tối ưu.

Chương này trình bày về những điều cơ bản của bài toán van chuyển tối ưu

Trước tiên là giới thiệu các khái niệm vẻ sự liên kết tối ưu giữa các vectơ xác suất

Trang 5

(a, b}, khái quát bài toán vận chuyển này giữa các độ đo rời rac (a, đ} và cudi cùng

là tong quát bài toán với các độ đo bất kỳ Ban đầu, những điều này có thé bị bỏ

qua và chỉ tập trung vào việc tính toán giữa các vectơ xác suất, cu thé là biểu đỗ

tần số, là điều kiện tiên quyết để thực hiện các thuật toán chỉ tiết trong chương 2

và 3 Dể hiểu rõ vẫn để, ta xem xót cách thức áp dụng cho độ đo tùy ý, và có thể

ap dung vào các van đề phức tạp hơn (ví dụ: để di chuyển vị trí của các điểm đámmây hoặc trong việc thống ké các điểm liên tục)

Mục đích của chương 2 là trình bày một số thuật toán cơ bản giải bài toán vận chuyển tối ưu rời rac Chương này gồm các nội dung sau:

e Bài toán vận chuyển tối ưu tuyến tính Kantorovich

e Phép biến doi C.

e Phương án bồ sung

e Các đỉnh hình đa giác của bài toán vận chuyển tối ưu.

e M6 tả phóng đoán của lưới đơn hình.

Chương này mô ta các thuật toán phố biển nhắt về tối ưu hóa tổ hợp và

quy hoạch tuyến tính được sử dụng để giải các bài toán van chuyển tối ưu rời

rac, cũng như được mé tả trong bài toán vân chuyển tối uu cơ bản Lefa,b) =

min {C, P) với (C, P} := 3_GuP„ ({1.10) trong chương 1) hoặc bài toán doi

Pe€Ut(a.b) m

ngẫu Lo(a,b) = | maz [{f,a) + (a,b) với RIC) = {{f,9) € R" x RTM : VỤ,¿) €

VF @

fr] x [rn], fe g < C}.

Mục đích của chương 3 là trình bay một số thuật toán mở rộng giải bài toán

vận chuyển tối ưu rời rac Chương này gồm các nội dung sau:

e Chính quy hóa Entropi.

e Thuật toán Sinkhorn và sự hội tu của nó.

e Dang tương đương của thuật toán Sinkhorn.

e Xắp xỉ chính quy hóa của chi phí vận chuyển téi ưu.

Chương này giới thiệu một họ các sơ dé số để giải gin đúng các bài toán vận

chuyển tối uu của Kantorovich và dang tong quát của nó Nó hoat động bang cách thêm một hình phạt chính quy hóa entropi vào bài toán ban đẫu Việc chính quy

Trang 6

hóa này có một số lợi ích quan trọng Việc cực tiểu hóa bài toán chính quy có thểđược giải quyết bằng một phương pháp sơ đỗ cực tiểu hóa thay thé cơ bản: sơ đỏ

đó chuyển thành các bước lặp là tích các vectd ma trận đơn giản, khiến chúng đặc biệt phù hợp với việc thực thi GPU; đối với một số ứng dụng, tích các vectơ ma

trân này không yêu cau lưu trữ ma trận chi phí ø x m, nhưng thay vào đó chỉ yêu cau ve việc đánh giá hạt nhãn.

Trang 7

Các ký hiệu

¢ Jr]: Tập hợp các số tự nhiên Á1, n}.

@ lam: Ma trận trong R"*" với tat cả các thành phan đều bằng 1 1: Vectơ

mot.

e ï„: Ma tran đơn vi với kích cỡ m x nr.

e Với u € BR”, diag(u) là ma tran vn x n với đường chéo là u và các thành phan

con lai bang 0.

e ©,: Don hình xác suất

e (a,b): Dé thị tan số histograms các đơn hình ©, x

Yyn-e (a, 3): Các độ đo, xác đình trên các không gian (4, }}.

° = : “Tỉ số tương doi của độ đo « theo độ do đ.

e c(z,}: Chi phí mat dat, với ma trân chi phí theo cặp liên kết Cj; = (efx, M/)),;

được đánh giá trên hỗ trợ của a, 3.

e 7: Dé do ghép đôi giữa a và ở tức là với A C AV x(A x Y) = afA), và với

BC },xz(X x BỊ = 6(B) Với các độ đo rời rac r= À ” Pade:

tự

e ¿((a 2) : Tap hợp các độ đo ghép đối, với các độ đo rời rac Ula, 6}.

e Ric} : Tap hợp các phương án đối ngẫu chấp nhận được với độ do rời rac

R(C).

eT:Y>y: Ánh xạ Monge, đặc biệt thỏa man Tya = 3.

e (f,9) : Các phương án đối ngẫu với các dé do rời rac (f, g) là các biến đối

ngẫu.

Trang 8

e (u,v) = (:7.-) : Chia tỉ lệ Sinkhorn.

e

` 4

ek =e : Hạt nhân Gibbs cua Sinkhorn.

e Lefa,b) và £,(a, 8}: Giá trị của bài toán tối ưu liên kết bài toán van chuyển

tỗi ưu với chi phí C (dé thị tan số histogram) và e ( độ đo tùy ý).

e I„(a.b) và W,(a,3) : Khoảng cách p-Wasserstein liên kết khoảng cách mặt

đất bởi ma tran D (đồ thị tần số histogram) và khoảng cách đ (độ đo tùy ý}

e (,): Dối với tích võ hướng Euclide thông thường giữa các vectơ; cho hai ma

trận cùng kích thước A và B, {A,B} := tr(ATØ} là tích phan Frobenius.

e /@ g(z.U} := f(z) + gly), với hai hàm ƒ : ¥ — RB, g : ý = 8, xác định bói

ƒ@øg:*x}y¬R

ef@g:= ft? +1,g7 clRnX" với hai vectơ f e lầ", g e R”

e a@ là độ đo tích trên Ä x3, J g(x /)d(a @ 3){x ) := | g(x /)dœ(z)d9(w).

Xxy Xxy

e a@b:=ab! € R"X với a € R",b c R”

e uv = (ay) € RE" với (u,v) € (R“)?,

Trang 9

Phan này tập trung hoàn toàn vào việc nghiên cứu hình hoc sinh ra bởi bài toán

vận chuyển tối ưu trên đơn hình

Dinh nghĩa 1.2 (D6 đo rời rac) Một độ đo rời rac với trọng số a € R” vàrì ,#„ € ¥ là không gian vectơ được biểu dién như sau

a= "đỗ, (11)

inl

trong đó J, là Dirac tai điểm z, tức là ở, : P(A’) — {0:1} được cho bởi

är(4)=1 nếu ré A, ô;(4)=0 nếu zrợ A.

Ngoài ra, độ do được biểu điễn như trên gọi là độ đo xác suất nếu a € Đ„ và là độ

đo đương nếu tất cả các phan tử của vectơ a không âm Dé tránh sự thoái hóa ở

những vị trí không có khối lương được tính đến, ta sẽ giả sử khi xét các độ đo rờirac mA tat cả các phan tử của a đều đương

6

Trang 10

Mệnh dé 1.1 Cho + là không gian metric và ánh xạ ƒ : VY + liên tục Khi

Ký hiệu M.(24’) là tập hợp tat cả các độ do dương trên XY Tập hợp các dé đo

xác suất được ký hiệu JAM‘ (2V) Xem hình 1.1 minh họa các độ đo khác nhau.

Rời rạc d=1 Rời rạc d=2 Liên tục d=1 Liên tục d=2

Hinh 1.1

| Gabriel Peyré and Marco Cuturi, 2020, Hình 2.1.]

1.2 Bài toán Monge.

Cho ma trận chi phí C = (Ci j)nxn.Ciy > 0 với moi (7,7) € [[n] x [n] và a € R”.

Xét bài toán tối ưu trong Perm(n) là tap hợp các hoán vị của n phan tử

Trang 11

Ta có thé đánh giá hàm chi phi trên bằng cách sử dung các hoán vị trong tap hợpPerm{n) Tuy nhiên, tập hợp đó có n! phan tử, rất lớn ngay cả đối với n nhỏ Vi

du, xét một tap hợp như vậy có hơn 10° phan tử [Dantzig, 1983] khi n bằng 70 (n

nhỏ) Do đó, bài toán tối uu chỉ có thể được giải quyết nếu tồn tại các thuật toán

hiệu quả để téi wa hóa hàm chi phí đó trên tập hợp các hoán vi

Nhận xét 1.1 Lim ý rằng bài toán gan tối ưu có thể có một số phương an

1 14) Trong trường hợp này chỉ có hai phép

bài toán Monge j17§1] tìm một ánh xạ biến mỗi điểm 2; thành một điểm y; và day

khối lượng của œ vẻ phía khối lượng của , tức là tìm ánh xạ 7 : {z z„} 9

{⁄\ v„} sao cho

¥7 € [m],b; = » aj, (1.4)

¿T{#)=vw;

mà ta viết ở dang rút gọn là Tya = 8.

Nhận xét 1.2 Do (1.4) nên 7 là toàn ánh Anh xa này sẽ giảm thiểu chi phí vận

chuyển, được tham số hóa bởi hàm e(z y) được xác định với mỗi điểm (x,y) € ¥ xy,

min {Det T(zi)) : Tra = oh (1.5)

Dinh nghĩa 1.4 (Toán tử day tới) Dối với ánh xa liên tue T : ¥ 4 Y, xác

định toán tử đẩy tới tương ứng của nó là Ty: 4(V) — (V) Cho độ đo đẩy tới

ứ € M(Y) của a € /M(), kí hiệu là Tya = 3 thỏa man

Vh € cor), h436) = fr (T(x)) da(xr) (1.6)

y x

Một cách tương đương, với mọi tập do dude B CY, ta có

8(B} = œ({z € X: T(x) € BY) = a(TT!(B)) (1.7)

Trang 12

Lưu ý rằng T; bảo toàn tính đương, tức là néu a € ,M} (3X) thì Ta € M} ().

Định nghĩa 1.5 (Bài toán Monge với đô đo tùy ý) Bài toán Monge (1.5) có

thể được mở rộng cho trường hợp hai độ đo xác suất tùy ý (a, đ) trên hai khonggian (+,}) có thể được liên kết thông qua ánh xạ T: ¥ > },

mịn [ cá,Te))áaG) :†iịa =8) (1.8)

x

Dinh nghĩa 1.6 (Ánh xa kéo lùi) Anh xa kéo lai của hàm 7? : C(Y) + C(X)

được định nghĩa là ánh xạ tuyến tính sao cho T¥g = goT với mỗi g € C{Y) Day tới

và kéo lùi thực sự liên kết với nhau, theo nghĩa là

V(œ.ø) € ,M(V) x CŒ) f satta) = [tra

y x

Nhận xét 1.3 (D6 do và biến ngẫu nhién) D6 do Radon có thể được xem

như biểu dién cho sự phân bỗ của các biển ngẫu nhiên Một biển ngẫu nhiên X

trên Y là một ánh xạ X : Ø 3 + từ không gian xác suất (O,P), và phân bố acủa nó là độ đo Radon a € M4(2’) sao cho P(X € A) = af{A} = J da(x) trong đó

AXeA={yeR: Xứ) € A} Một cách tương đương, đó là sự day tới của P bởi

X,a = XP Ap dụng đầy tới khác 8 = Tya cho T : Ý — Y, theo (1.6), tương đương

với định nghĩa một biến ngẫu nhiên khác Y = 7(X) :œ € 23 T(X(w)) eY.

1.3 Bài toán Kantorovich.

Định nghĩa 1.7 Cho «a € 3*,bc RTM Tập hợp các ma tran ghép đồi có dang là

U{(a,b):= {PC R?X":Pl„=a va PTL, =}, (1.9)

trong đó vectø ma trận được ký hiệu như sau:

Plin = (= rs) eR” va Pll, = (= rs) éR*:

Trang 13

Tập hợp U/{a b) bị chặn và xác định bởi n +m ràng buộc đẳng thức và do đó là một

da giác lỗi (bao lỗi của một tập hữu hạn các ma trận) [Brualdi, 2006, §8.1] Ngoài

ra, P nằm trong f/(a,b) khi và chỉ khi P? nam trong U/(b,a} Bài toán vận chuyểntối uu của Kantorovich có dạng:

Le(a,b) = min (C, P)với (C,P) = 3” Gi2P¿, (1.10)

PeU(ah) :

ij

trong đó C = (Ci

j}nxn-Day là bài toán tối ưu tuyến tinh, và đối với các bài toán như vậy, các phương

an tối wu của nó không nhất thiết duy nhất.

Định nghĩa 1.8 (Ma trân hoán vị ghép đồi) Đối với hoán vị ø € Perm(n), tađình nghĩa ma tran hoán vị tương ứng P„ như sau:

điều nay chứng tỏ rằng bài toán tối wu (1.2) có thể được viết lại duéi dang bài toán

Kantorovich (1.10) trong đó các ghép doi P là các ma trận hoán vị:

n

min = Cio) = min (C Po).

ơEPcrm(n}m n hề œ€Perm{(n)

i

Tiếp theo, ta có thé dé đàng kiểm tra tập hợp các ma trận hoán vị hoàn toàn nằm

trong đa giác Birkhoff U (= —) Thật vậy, với mọi hoán vi ø ta có Pl), = =

Trang 14

vị tôi ưu o* € Perm(n) cho bài toán (1.2) [Bertsimas và Tsitsiklis, 1997, Dinh lý 2 7|.

Định nghĩa 1.9 (Bài toán Kantorovich giữa các độ đo rời rac) Déi với các độ

đo rời rac a, 8 có dạng (1.3), ma trận C với C¡¿ := c{z¿, w;), ta định nghĩa

Dinh nghĩa 1.10 (Bài toán Kantorovich giữa các độ đo tiy ý) Xét ghép đôi

me AfT(A' x Y) Trong trường hợp rời rac, 7 = > P; 54¢;,;) Trong trường hợp tổng

tử

quát, ràng buộc bao toàn khéi lượng (1.9) được viết lại như sau

Wí(a,) = {re MEX): Pye =a và Py =9} (1.13)

GO đây Px, và Pyy là các ánh xạ day tới (xem Dinh nghĩa 4) của các hình chiếu

Py(z,w) = x và Py(z,w) = y Bài toán Kantorovich (1.10) khi đó được tong quát

(ii) Dj; = 0 khi va chỉ khi i = j;

(ii) Vi, 3,4) € [a], Dix < Diy + Dạy.

Khi đó

Ip(a.b) := [Lpz(a,b)|* (1.15)

(lưu ý rằng W, phụ thuộc vào D) xác định khoảng cách p—Wasserstein trên Dy,

tức là W„ là đối xứng, dương, W’,(a,6) = 0 khi và chỉ khi a = b, và nó thỏa man bat

đẳng thức tam giác

Va,b,e € En, W(a,e) < W,(a,b} + W(b, ).

Trang 15

Chứng minh Tinh doi xứng và sự xác định của khoảng cách dé đàng chứng minh.

Vì C = DP có đường chóo không, Wp(a,a) = 0, với ma trận vân chuyển tỗi

ưu tương ứng P* = điag(a) That vậy, ta có Ptl, = a và (P*]l1„ = «a nên

P* € Ufa.a) Do (ii) nên DP Phy = 0 với moi i,j € [nr] Do đó, > DE Pe; = = 0.

sao cho P;,;,> 0 Điển này dẫn đến DEriot todo > 9 (do ii) và do đó » DƑjPig > 0.

iv 1

Vay x a min 2-1 DƑ va] > 0.

PE (a,b)

Do tính déi xứng của DP nên W„(a,b) cũng là một ham đối xứng Thật vay,

Wy(a,b) = (Lepe(a,b))? = cia Pts ~ F „>E)

iJ ig 1

-| min ng = [Lpr{b.a)|* = W„(b.a).

P?eU(b.a)

1t

Ta chứng minh bat đẳng thức tam giác của khoảng cách Wasserstein cho các

độ do tùy ý Cho a,b,c € S„ Cho P và Q là hai phương án téi wu của bài toán vận

chuyển giữa a và b, b và e tương ứng Ta định nghĩa một vectơ 6 sao cho b; = b;

nếu by > 0, và ở; := 1 nếu b¡ = 0 thì

S := Pdiag (;) Qcx"

Trang 16

và lưu ý rằng Š € U(a,c) That vậy, vì

t

S1, = Pdiag (; Jat, = Pdiag (;) b=P (5) = Pl suppis) = 2

trong đó ký hiệu 1s„„„¡;; là vectơ có kích thước n với các vectơ tại các chỉ SỐ j

trong đó b, > 0 và các trường hợp khác bằng 0, và ta sử dung Pl supp(oy = Pin = a

vi P;; = 0 déi với những ÿ có 6; = 0 Thật vậy, do P71, = 6 nên » P;5 = by Với

những chi số 7 có 6; = 0 thi Pj = 0 với mọi 2 € [n] Ngược lại, với những chi số 7

2 ` Pj m¬ P ° F 2 4

có b; > 0 thì ` ra = 1 Tương tự, ta chứng minh được STL, = e Bat đẳng thức

tam giác Suy ra từ

Diéu này dẫn đến điều phải di ng mình a)

Nhận xét 1.4 (Các trường hợp 0 < p < 1) Lưu ý rằng néu 0 < p < 1 thì

DP chính là khoảng cách Khi với p > 1, WẢN- là khoàng cách Ngược lại, trong

Trang 17

trường hợp p < 1, [W,(a,b)]” là khoảng cách xác định khoảng cách trên đơn hình.

Nhận xét 1.5 (Khoáng cách Wasserstein giữa các độ đo) Mệnh dé 1.3 có thé

được khái quát hóa để giải quyết các độ đo tùyý không cần phải rời rac

Mệnh dé 1.4 Giả sử X = Y và với một số p > 1,e(z.y) = |d(z wìÌ”, trong đó d

là khoảng cách trên +, tức là

(i) díz,) = d{y, x) > 0;

(i1) d{x,y) = 0 khi và chỉ khi 2 = y;

(ii) V{(z.w,z) € +3, d(x, z} < d{z, y) + dy, z).

Khi đó khoảng cách p-Wasserstein trên ¥,

Wa, 3) = (Lav (ex, 3)]* (1.16)

(lưu ý rằng W, phụ thuộc vào d), thực sự là một khoảng cách, cụ thể là W, đối

xứng, không am, W,{a, ở) = 0 khi và chỉ khi a = 3, và nó thỏa mãn bat đẳng thức

tam giác

¥(a, 3,7) € MEX), Wyle, 7) < W,(a, 8) + Wp(đ, +).

Chứng minh Chứng minh tuân theo cách tiếp cận tương tự như trong Mệnh dé

1:3: 0

Định nghĩa 1.11 (Hội tụ yếu) Trên miễn compact ÄY.(ø¿)¿ hội tụ yếu về

a trong M1! (Y} (ký hiệu là a; > œ} khi và chỉ khi với hàm liên tục bất kỳ

ge C(X), [oi + J sa Khái niệm hội tụ yêu này tương ứng với sit hội tu theo

x

vectd ngẫu¡nhiền, Sự hội tụ này có thể được biểu dién tương đương với Wplay,a) + 0

[Villani, 2009, Dinh lý 6.8].

Dinh nghĩa 1.12 (Phép tình tiến) Trên không gian Euclide ¥ = E#, xét

c(x,y) = ||z — w|\*, ta định nghĩa phép tịnh tiến là 7; : z 6 z — 7 toán tử tịnh tiến.

Khi đó, ta có

W2(Tya, T 48)? = Wola, 3)? — 2 (> —7',ma — mạ) + ||r — 7l,

trong đó mạ := [xia € R? là giá trị trung bình của a Đặc biệt,

x

Wola, 3)? = Wola,3)? + ||ma — raạ||

Trang 18

trong đó ä = T„„„œ, 8 = Ting, 3.

Nhận xét 1.6 (Trường hợp p = +00) Giới hạn của I2 khi p + +00 là

MHx(a ở):= min sup da 0ì, (1.17)

nella Bye r.y)€Supp(x)

Trang 19

trong đó U{a,b):= {Pe RY": Pl,=a và PTI„ — b}.

Goi I, là ma tran đồng nhất có kích thước ø và đặt @ là tích Kronecker, Ma

trận cấp (m +m) x nm là:

A = | an’ Lg E Rie Hin) xm

% 1ƒ

16

Trang 20

Định nghĩa 2.1 (Bài toán vân chuyển tối ưu tuyến tính Kantorovich) ChoPcE"z",pe[lR^" sao cho phan tử thứ i+ n{7 — 1) của p bằng P,,, (P được liệt kêtheo cột) để có được sự tương đương sau:

P € U(a,b) pc BY”, Ap = lÌ :

Do đó ta có thể viết bài toán vận chuyển tối ưu ban dau thành

Lo(œ,b} = min cTp, (2.2)

trong đó vectd e có nm chiên bằng với các cột xếp chồng lên nhau có trong ma

tran chỉ phí Œ Bài toán (2.2) được gọi là bài toán vận chuyến tỗi um tuyến tính

Kantorovich.

Nhận xét 2.1 Lim ý rằng một trong các n +m rang buộc được mé ta ở trên

là du thừa hay nói cách khác, các vectơ đường thắng của ma trận A không độc lập

tuyến tính That vậy, tổng n dòng dau tiên và m dòng tiếp theo sẽ cho cùng một

vectở (tức là A bs =A [>] = 12) Ta có thể chi ra rằng việc loại bỏ một dong

TMm VẢ)

a

b

Dinh nghĩa 2.2 Bai toán đối ngẫu [Bertsimas và Tsitsiklis, 1997, tr 143] tương

ứng với bài toán (2.2) được đình nghĩa là:

trong A và thành phan tương ứng trong | để xác định một hệ tuyến tính.

đó ràng buộc Ap = ø không còn xảy ra nhưng thay vào đó lại mang một chi phí

kh? (Ap — q) được tham số hóa bởi một vectơ chi phí tùy ý h € "+", Mức téi ưu

phụ thuộc vào vectơ chi phí k, được định nghĩa như sau:

H(h):= min [cp — hÏ(Ap — 4)|

pen

Nhận xét 2.2 Cho g = | Xét bài toán vận chuyển tối wu cơ bản, trong

Đầu tiên hãy lưu ý rằng bài toán này không có ràng buộc biên đối với p Thật

vay, giả sử p* là nghiệm tối ưu bat kỳ của bài toán (3.2), ta có

H(h) = aur, [c"p —hT (Ap - q)] < cp - hT{( Ap° = q) < cl p* = š.

Trang 21

Với mọi vectd chỉ phí h; ham đó được gọi là hàm đối ngẫu Lagrange của L Mục

tiêu của lý thuyết đối ngẫu là tìm chặn dưới lớn nhất z bằng cách cực đại hóa H

với vectơ chi phí h bat kỳ, tức là

z= mae, H(h} = max ( ¬ ganic " Athy") :

Khi dó, z < z.

2.2 Phép biến đổi C.

Xót bài toán vận chuyển tối ưu đối ngẫu Kantorovich:

Lela, bìcla, b) ¡ 5 oy UF a} + {g, b}} (2.4)= x ca) + {g,b}), 2.4

trong đó tap hợp các biến déi ngẫu chap nhận được là:

R(C) := {(f.g) € R" x RTM :Ví(¡,j) € [ee] x Em].ƒ ø < C}.

Xét một cặp đối ngẫu chap nhận được bat kỳ (ƒ ø}.

Định nghĩa 2.3 Vects biến đối C của f, ký biệu là f° e RTM và được định nghĩa

V5 = min Cs = 2)

Dễ dang chứng minh rằng (f,©) € R(C) va ƒ€ là vectơ lớn nhất có thể sao cho

ràng buộc nay được thỏa man Vi vậy ta có diéu sau

(f,a) + (9.0) < (fa) + (f°, b).

Kết qua nay trước tiên cho phép ta phát biểu lại bài toán đối ngẫu như sau

Tương tự, ta xét biến đổi Ở của g, tức là veetd ø? e E* được định nghĩa là:

(9°); = min (Ci; — g;}.

7;e|ml

Khi đó.

(F,2) + (9,8) < (oa) + (9,0).

Trang 22

Nhận xét 2.3 Bắt dau từ một f cho trước, bằng việc thay thé các biển đổi Œ

và Œ vài lan để cải thiện ƒ Thật vậy, ta có day bat đẳng thức

(fsa) + (97,5) < (026 a) + (9,0) < (0Ô a) + (FOC?) <

Mệnh đề 2.1 Cho ƒ € BR", ƒ'c[R",gøe RTM Khi đó ta có các mệnh dé sau đây:

(i) fs fsa fez se,

(ii) O° > ƒ,gʰ > g,

(ii) Ta có (ƒ2Ẻ), = min (Ci - fe) = min |Ci; — min (Cig — ƒz)|

-jelm] je[m] |? zein]

Vì = mere (lu — fr) > —(Cij — fi) nên (f£°°); > min (Cis - Cụ + ñ) = fi

véeln jEeym

Hệ thức g°© > g thu được theo cách tương tự.

(iii} Ta có fC° > ƒ (do (ñ)) Do đó, từ (i) ta thu được O°" < ƒ€,

Mat khác, từ (ii) ta suy ra /Œứ€ > fe với g = f°.

Vậy đẳng thức đã được chứng mình

2.3 Phương án bo sung.

Mệnh dé 2.2 Cho P* và ƒ*,ø* là phương án tối uu của L.(a,3) =

sup J ƒ(œ)de¿{(z] + / g(y)d3{y}| và các bài toán đỗi ngẫu (2.1) tương ứng.

(ƒ.g)€R() Y hy

Trang 23

Vì (ƒ*,ø*) € R(C) nén mỗi phan tử của ma trận C — f* 6 g* phải không am Do

đó, vì tat cả các phan tử của P đều không im nên ràng buộc tích võ hướng ở trên phải bằng 0 Đỗi với bắt kỳ cặp chỉ số (¿ 7) nào sao cho P;; > 0,C¿ÿ — (fi + ø;) phải

bằng 0, và với cặp chỉ số (¡, 7) tùy ý sao cho Cy, > fi + gj, Pịy = 0 H

Kết quả ngược lai cũng đúng.

Định nghĩa 2.4 Ma trận P é R?*"' và một cặp vectơ (ƒ ø) được gọi là bổ sung

tương ứng với ma trận C nếu với mọi cặp chỉ số (i,j) sao cho P„¡ > 0,C(¡ = fi +g.

Nếu một cặp biển cơ bản và đối ngẫu chip nhãn được là bổ sung thì ta có thể

kết luận chúng là tối ưu.

Mệnh dé 2.3 Nếu P và (ƒ.ø) lần lượt là các phương án bổ sung và chap nhận

được cho các bài toán cơ bản £,(œ,đ) = sup [reat + Jae20) và

(/.gìeR()

x y

đối ngẫu (2.1), thì P và (f, 9) đều là phương án tối wu cơ bản và đối ngẫu

Chứng minh Boi tính đối ngẫu yếu, ta có

Lc(a.b} < (P.C) = {P, ƒ @ g) = fa, f) + {b,gu) = Lc(a.)

và do đó P và (ƒ,ø) lan lượt là phương án tối ưu cơ bản và đối ngẫu 0

Ngày đăng: 01/05/2025, 22:42

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1. Jason Altschuler, Jonathan Weed, and Philippe Rigollet. Near-linear time ap- proximation algorithms for optimal transport via Sinkhorn iteration. arXivpreprint arXiv:1705.09634, 2017 Sách, tạp chí
Tiêu đề: Near-linear time approximation algorithms for optimal transport via Sinkhorn iteration
Tác giả: Jason Altschuler, Jonathan Weed, Philippe Rigollet
Nhà XB: arXiv
Năm: 2017
2. Dimitris Bertsimas and John N Tsitsiklis. Introduction to Linear Optimiza- tion. Athena Scientific, 1997 Sách, tạp chí
Tiêu đề: Introduction to Linear Optimization
Tác giả: Dimitris Bertsimas, John N Tsitsiklis
Nhà XB: Athena Scientific
Năm: 1997
3. Garrett Birkhoff. Extensions of jentzsch’s theorem. Transactions of the Amer- ican Mathematical Society, 85(1):219-227, 1957 Sách, tạp chí
Tiêu đề: Extensions of jentzsch’s theorem
Tác giả: Garrett Birkhoff
Nhà XB: Transactions of the American Mathematical Society
Năm: 1957
4. Lev M Bregman. The relaxation method of finding the common point of con- vex sets and its application to the solution of problems in convex programming.USSR Computational Mathematics and Mathematical Physics, 7(3):200-217,1967.ou . Richard A Brualdi. Combinatorial Matrix Classes, volume 108. CambridgeUniversity Press, 2006 Sách, tạp chí
Tiêu đề: Combinatorial Matrix Classes
Tác giả: Richard A Brualdi
Nhà XB: Cambridge University Press
Năm: 2006
6. Lenaic Chizat, Gabriel Peyré, Bernhard Schmitzer, and Franccois-Xavier Vialard.Scaling algorithms for unbalanced transport problems. Mathematics of Com- putation, 87:2563-2609, 2018b Sách, tạp chí
Tiêu đề: Scaling algorithms for unbalanced transport problems
Tác giả: Lenaic Chizat, Gabriel Peyré, Bernhard Schmitzer, Franccois-Xavier Vialard
Nhà XB: Mathematics of Computation
Năm: 2018
9, Joel Franklin and Jens Lorenz. On the scaling of multidimensional matrices.Linear Algebra and its Applications, 114:717-735, 1989 Sách, tạp chí
Tiêu đề: On the scaling of multidimensional matrices
Tác giả: Joel Franklin, Jens Lorenz
Nhà XB: Linear Algebra and its Applications
Năm: 1989
10. Leonid Kantorovich. On the transfer of masses (in russian). Doklady Akademii Nauk, 37{2): 227-229, 1942 Sách, tạp chí
Tiêu đề: On the transfer of masses (in russian)
Tác giả: Leonid Kantorovich
Nhà XB: Doklady Akademii Nauk
Năm: 1942
11. Christian Léonard. A survey of the Schrédinger problem and some of its con-nections with optimal transport. Discrete Continuous Dynamical Systems Se-ries A, 34(4):1533-1574, 2014 Sách, tạp chí
Tiêu đề: A survey of the Schrédinger problem and some of its connections with optimal transport
Tác giả: Christian Léonard
Nhà XB: Discrete Continuous Dynamical Systems Series A
Năm: 2014
12. Christian Léonard. From the Schrodinger problem to the Monge-Kantorovichproblem. Journal of Functional Analysis, 262(4):1879-1920, 2012 Sách, tạp chí
Tiêu đề: From the Schrodinger problem to the Monge-Kantorovich problem
Tác giả: Christian Léonard
Nhà XB: Journal of Functional Analysis
Năm: 2012
7. George B. Dantzig. Reminiscences Aabout the origins of linear programming, pages 78-86. Springer, 1983.œ% Arnaud Dessein, Nicolas Papadakis, and Jean-Luc Rouas. Regularized optimal transport and the rot mover’s distance. Journal of Machine Learning Research,19(15):1-53, 2018 Khác

HÌNH ẢNH LIÊN QUAN

| Gabriel Peyré and Marco Cuturi, 2020, Hình 2.1.] - Luận văn thạc sĩ Toán giải tích: Chính quy hóa Entropi của bài toán vận chuyển tối ưu
abriel Peyré and Marco Cuturi, 2020, Hình 2.1.] (Trang 10)
Hình 2.1. Với n = 3,m = 4. tat cả các toa độ của biểu đỗ nguỗn a được mô tả - Luận văn thạc sĩ Toán giải tích: Chính quy hóa Entropi của bài toán vận chuyển tối ưu
Hình 2.1. Với n = 3,m = 4. tat cả các toa độ của biểu đỗ nguỗn a được mô tả (Trang 25)
Hình 2.2. Vận chuyển chấp nhận được P và tập các cạnh tương ứng S(P) và - Luận văn thạc sĩ Toán giải tích: Chính quy hóa Entropi của bài toán vận chuyển tối ưu
Hình 2.2. Vận chuyển chấp nhận được P và tập các cạnh tương ứng S(P) và (Trang 27)
Hình 2.3. Nam biến đối ngẫu ƒt, fo, 91, 92, 93 tương ứng với 5 nút xuất hiện trong - Luận văn thạc sĩ Toán giải tích: Chính quy hóa Entropi của bài toán vận chuyển tối ưu
Hình 2.3. Nam biến đối ngẫu ƒt, fo, 91, 92, 93 tương ứng với 5 nút xuất hiện trong (Trang 28)
Hình 2.4. Việc thêm cạnh i,j vào đồ thị G(P) có thể dẫn đến đỗ thị (a) van - Luận văn thạc sĩ Toán giải tích: Chính quy hóa Entropi của bài toán vận chuyển tối ưu
Hình 2.4. Việc thêm cạnh i,j vào đồ thị G(P) có thể dẫn đến đỗ thị (a) van (Trang 29)
Hỡnh 3.1: Tỏc động của ô đến việc tối tru húa hàm tuyến tớnh trờn đơn hỡnh, - Luận văn thạc sĩ Toán giải tích: Chính quy hóa Entropi của bài toán vận chuyển tối ưu
nh 3.1: Tỏc động của ô đến việc tối tru húa hàm tuyến tớnh trờn đơn hỡnh, (Trang 31)
Inh 3.3. Hình trên: điễn biến của ghép đôi a!&#34; = diag(ul \Qdiag(v) ở lần lặp - Luận văn thạc sĩ Toán giải tích: Chính quy hóa Entropi của bài toán vận chuyển tối ưu
nh 3.3. Hình trên: điễn biến của ghép đôi a!&#34; = diag(ul \Qdiag(v) ở lần lặp (Trang 36)
Và ô = 0,1. Hỡnh dưới: tỏc động của ‹ đến tốc độ hội tu của thuật toỏn Sinkhorn, - Luận văn thạc sĩ Toán giải tích: Chính quy hóa Entropi của bài toán vận chuyển tối ưu
1. Hỡnh dưới: tỏc động của ‹ đến tốc độ hội tu của thuật toỏn Sinkhorn, (Trang 36)
Của ma trận dương K. | Gabriel Peyré and Marco Cuturi, 2020, Hình 4.7. - Luận văn thạc sĩ Toán giải tích: Chính quy hóa Entropi của bài toán vận chuyển tối ưu
a ma trận dương K. | Gabriel Peyré and Marco Cuturi, 2020, Hình 4.7 (Trang 38)
Hình 3.4. Bén trái: metric Hilbert dy là khoảng cách trên các tia trong hình nón (ở day là các vectd dương) - Luận văn thạc sĩ Toán giải tích: Chính quy hóa Entropi của bài toán vận chuyển tối ưu
Hình 3.4. Bén trái: metric Hilbert dy là khoảng cách trên các tia trong hình nón (ở day là các vectd dương) (Trang 38)
Hỡnh 3.5. Hiển thị hàm minz trong 2-D, z € R?, khi thay đổi ô. [ Gabriel Peyrộ - Luận văn thạc sĩ Toán giải tích: Chính quy hóa Entropi của bài toán vận chuyển tối ưu
nh 3.5. Hiển thị hàm minz trong 2-D, z € R?, khi thay đổi ô. [ Gabriel Peyrộ (Trang 41)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm