Bài toán cặp ghép trong pascal
Trang 1Bàn luận thêm về Cặp ghép
Nguyễn Tuấn Dũng
'Ghép cặp' các đốitượng theo một quan hệ nào đó là một bài toán mang tính hết sức tự nhiên và cónhiều ý nghĩa trong ứng dụng thực tiễn Chẳng hạn, các sinh viên ngành sư phạmdo được nhà nước đào tạo miễn phí nên khi ra trường họ được phân công về dạyhọc
ở các trường miền núi Nhưng những sinh viên đó được đưa ra danh sách nhữngtrường mà mình muốn công tác với độ ưu tiên khác nhau Một bài toán đặt ra làphải bố trí các sinh viên này sao cho phù hợp nhất (có thể được) với sở thíchcủa mỗi người, tuy nhiên ở đây, sinh viên nào có kết quả học tập tốt hơn sẽđược ưu tiên hơn Hay ta có thể gặp vấn đề ghép cặp trong các bài toán quenthuộc khác như: bài toán phân công công việc, bài toán hôn nhân bền vững, bàitoán xếp thời khoá biểu
Trong số 26(11/2001), tác giả Lê Văn Chương đã giới thiệu với chúng ta thuật toánKuhn-Munkres giải bài toán tìm cặp ghép có tổng trọng số lớn nhất ở đây, không đi vào thuật toán tìm cặpghép có tổng trọng số lớn nhất nữa vì điều đó khá rõ ràng trong số báo
trước.Tuy nhiên, chúng ta sẽ xem xét thêm một chút để giúp các bạn phần nào tiếp cậngần bài toán hơn và đỡ nhầm lẫn trong lúc cài đặt chương trình Để tiện theodõi, ta tóm tắt lại bài toán:
Cho G = (X U Y,E) là đồ thị hai phía đầy đủ, trong đó: X, Y là hai tập hữu hạn gồm n phần tử, E là tập các cạnh của đồ thịvà với mỗi cạnh được gán với một trọng số C ij Cần tìm tập cặp ghépđầy đủ M có tổng trọng số lớn nhất.
Đối với bài toánnày có thể sử dụng bài toán luồng cực đại để giải bằng cách thêm vào G hai đỉnhgiả S và T, nối với các đỉnh xi thuộc X và nối T với các đỉnh yj thuộc Ybằng các cạnh có trọng số là 0 Tuy nhiên, bài toán cặp ghép cực đại là trườnghợp riêng của bài toán luồng nên nó có những đặc điểm riêng và do đó dẫn đếnviệc giải quyết nó thì cũng có những thuật toán đặc thù, mà tiêu biểu là thuậttoán gán nhãn, trong đó ta có thể đi theo hai hướng chính:
Trang 2Hướng thứnhất, xuất phát từ một cặp ghép M đầy đủ bất kỳ của G, ta xây dựng một nhãnF
tương ứng với M, nếu F chấp nhận được thì M là nghiệm cần tìm, ngược lại nhãnF là không chấp nhận được thì ta tiếp tục điều chỉnh
Hướng thứ hai,xây dựng một nhãn F chấp nhận được, sau đó tìm M tương ứng với F bằng
cách:khởi tạo M là tập rỗng, chừng nào mà M chưa đầy đủ thì ta còn tiếp tục điềuchỉnh (tăng cặp ghép)
Thuật toánKunh-Munkres trình bày trên số báo 26 là cách giải thứ hai, được trình bày khárõ ràng Tuy nhiên có điểm cần chú ý trong bước 5 (sửa nhãn), lượng sửa nhãnkhông phải:
d:=min {F(xi)+ F (yj) - Cij, xi thuộc S, yj thuộc T} (cóthể do lỗi khi in ấn) mà là:
d:=min {F(xi)+ F(yj) - Cij, xi thuộc S, yj thuộc T } (*)
Bởi vì, trongbước 3 khi không tìm được đường tăng cặp ghép ta mới phải sửa nhãn sao cho:
- Nhãn Fmớivẫn chấp nhận được
- Fmớivẫn tương ứng với M đang có, để cho số cạnh của G (F, M) không bị giảm đi
- Tăng thêm sốcạnh trong đồ thị cân bằng tương ứng G (F, M)
Muốn tăng sốcạnh trong G(F, M) thì ta phải có thêm cặp xi', yj' khác,cụ thể (xi', yj') thuộc G(F, M), sao cho: F(xi')+ F(yj') = C'ij Đồng thời để cho sau khi thêm cạnh vàoG(F, M) ta
có thể tìm đường tăng cặp ghép thì cạnh cần thêm đó được chọn làcạnh nối giữa một đỉnh
xi đã được đi đến trong quá trình tìm đường ởbước 3 với một đỉnh yj' chưa được đi đến trong quá trình đó
Nếu lượng sửanhãn là d:=min{F(xi)+ F (yj) - Cij, xi thuộc S, yj thuộc T} thìsẽ dẫn đến những sai sót khiến chương trình không cho ra kết quả Thật vậy, tacho ra công thức sửa nhãn:
F(xi) := F(xi)- d với xi thuộcS
F(yj) := F(yj)+ d với yj thuộcT
Xét một ví dụđơn giản, sau khi sửa nhãn với lượng sửa nhãn d như trên, đối với những đỉnh xithuộc S vàyj thuộc T,ta có:
F(xi) mới :=F(xi) cũ - d
F(yj)mới :=F(yj)cũ
Trang 3Suy ra:
A = F(xi)mới +F(yj)mới - Cij = F(xi)cũ+ F(yj)cũ - Cij - d
Nhận thấy A cóthể dương, bằng không, hay âm tuỳ thuộc vào các xi, yjgán nhãn Fcũ vì d chỉ
là min {F(xi)cũ +F(yj)cũ - Cij } đối với những đỉnh xithuộc S, yjthuộc T.Do đó có thể xảy ra F(xi)mới + F(yj)mới< Cij với một vài cặp cạnh (xi,yj) nào đómà xi thuộc S,yj thuộc T.Nói cách khác, nhãn Fmới sẽ là không chấp nhận được, ít nhất là đốivới những đỉnh yj thuộc T
Trong khi đó,theo như dưới đây ta sẽ thấy việc gán nhãn công thức (*) là hoàn toàn đúng đắn.Thật vậy:
Ta có công thứcsửa nhãn:
F(xi) := F(xi)- d với xi thuộc S
F(yj) := F(yj)+ d với yj thuộc T
Nhận thấy, dotính chất đặc biệt của G(F, M), chỉ có thể đi từ yj sang xikhi và chỉ khi (xi, yj) thuộc M nên tập S (tập các đỉnh đếnđược trong bước 3 tìm đường tăng cặp ghép) sẽ là tập các đỉnh của X đã đượcghép cặp (trừ x0) Đồng thời, khi không có đường tăng cặp ghép nghĩalà trong khi tìm đường đi, ta chỉ đến được các yj đã bị ghép cặp Dođó tập T cũng là tập các đỉnh của Y đã ghép cặp (với các đỉnh thuộc S)
Bây giờ ta sẽxem xét các trường hợp:
- Xét các đỉnh yjthuộc T: F(yj)mới := F(yj)cũ
Suy ra: F(xi)mới + F(yj)mới- Cij = F(xi)cũ + F(yj)cũ- Cij - D >= 0
(vì D = min {F(xi)cũ+ F (yj)cũ - Cij } với xi thuộc S, yjthuộc T)
do đó: F(xi)mới + F(yj)mới>= Cij , xi thuộc S, yj thuộc T (1)
Vậy nhãn F vẫnchấp nhận được đối với những xi thuộc S và yj thuộc T
Ngoài ra ta còncó thêm đẳng thức F(xi) + F(yj) = Cij trong đóxithuộc S,yj thuộc Ttương ứng với việc xảy ra dấu '=' trong bất đẳng thức lượng sửa nhãn (luôn luônxảy ra) Do đó dẫn tới việc làm tăng thêm số cạnh của G(F, M)
- Xét yjthuộc T:F(yj)mới := F(yj)cũ + D
Do đó: F(xi)mới+ F(yj)mới = F(xi)cũ - D + F(yj)cũ+ D = F(xi)cũ +F(yj)cũ = Cij (2)
Trang 4bởi vì với xithuộc S vàyj thuộcT trong bước 3 thì (xi, yj) là một cạnh của đồ thị cânbằng tương ứng G(F, Mcũ)
Như vậy, nhãn Fmớivẫn tương ứng tập cặp ghép Mcũ ngay cả với những đỉnh bị sửa
nhãn.Đối với những đỉnh còn lại của Mcũ không bị sửa nhãn thì cũng vẫntương ứng với Fmới
vì Fmới là giữ nguyên giá trị của Fcũđối với những đỉnh này
2 Đối với x i thuộc S:F(xi)mới = F(xi)cũ
mà: F(yj)mới= F(yj)cũ với yj thuộc T
F(yj)mới = F(yj)cũ+ D với yj thuộc T
thì: F(xi)mới+ F(yj)mới >= F(xi)cũ + F(yj)cũ>= Cij (3)
(vì nhãn Fcũlà chấp nhận được)
Tóm lại, từ (1)(2) (3) ta kết luận sau khi sửa nhãn, nhãn Fmới vẫn chấp nhận đượcvà tương ứng với Mcũ đang có, đồng thời thêm được cạnh trong G(F,M) Do đó, quay lại bước 3 ta vẫn có thể tìm được đường tăng cặp ghép và tiếptục các bước tiếp theo của thuật toán
Trên đây đã bànluận một số chi tiết trong các bước thực hiện thuật toán Kuhn-Munkres Tiếptheo, vấn đề đặt ra là đối với bài toán tìm cặp ghép đầy đủ có tổng trọng sốnhỏ nhất thì sao?
Cặp ghép đầy đủ cótổng trọng số nhỏ nhất
Nếu bạn xem xétkỹ lưỡng một chút về thuật toán Kuhn-Munkres thì có thể thấy ngay bài toán nàyhoàn toàn tương tự với bài toán tìm cặp ghép có tổng trọng số lớn nhất Chỉ
cầnsửa lại một chút như sau:
+ Thứ nhất,nhãn F được gọi là chấp nhận được nếu F(xi) + F(yj) <=Cij
Như vậy, có thểkhởi tạo: F(xi) := 0
F(yj):= min {Cij, xi thuộcX }, yj thuộcY
+ Thứ hai,lượng sửa nhãn: d:= max{F(xi)+ F(yj) - Cij , xi thuộc S, yj thuộc T}
với nhận xét: d<= 0
Hoặc: d:=min {Cij - F(xi)- F(yj), xi thuộcS, yj thuộc T}
thì d >= 0 vàkhi đó, công thức sửa nhãn sẽ là: F(xi):= F(xi) + d
F(yj):= F(yj) - d
Trang 5Cách khác, đơngiản hơn, chúng ta có thể thấy để tìm M có tổng trọng số nhỏ nhất, chỉ cần đổidấu các phần tử của ma trận trọng số rồi tìm cặp ghép có tổng trọng số lớn nhấtvới ma trận trọng số mới này Cặp ghép đó sẽ chính là cặp ghép có tổng trọng sốnhỏ nhất cần tìm đối với ma trận trọng số ban đầu
Như chúng ta đãbiết bài toán cặp ghép được xem xét theo hai khía cạnh Trường hợp thứ nhất,người ta quan tâm đến việc ghép cặp đầy đủ và thoả mãn tính tối ưu như bài
toánKuhn-Munkres ở trên Nhưng trong trường hợp khác, người ta lại không quan tâmđến việc ghép cặp đầy đủ với tổng trọng số lớn nhất mà cần tìm một tập cặp ghépcó số lượng cặp ghép là cực đại (không quan tâm đến trọng số trên các cạnh củacặp ghép) Khi đó chúng ta sẽ có một bài toán khác dưới đây:
Cặp ghép cực đại
Để minh hoạ, taxét một bài toán cụ thể, bài toán Phân công thợ-việc: Có N người thợvà M
công việc, mỗi công việc, mỗi một người thợ chỉ biết làm một số công việcnhất định Cần phân công mỗi thợ chỉ làm một việc và mỗi việc chỉ được làm bởimột thợ sao cho có nhiều công việc được làm nhất Khả năng làm việc của các thợđược cho trong ma trận C ij với C ij
= 1 thì thợ i biết làmviệc j, C ij =0 thì thợ i không biết làm việc j.
Ta nhận thấyhoàn toàn có thể giải bài toán này bằng thuật toán Kunh-Munkres Tuy nhiên, vấnđề ở đây là bài toán của chúng ta đơn giản hơn nhiều và tất nhiên, có thể giảiquyết nó bằng một cách riêng khá dễ dàng
Bàn luận thêm về cặp ghép
Nguyễn Tuấn Dũng
(Tiếp theo số trước)
Nhắc lại bài toán phân công Thợ - Việc: Có N người thợ và M công việc, mỗi côngviệc,
mỗi một người thợ chỉ biết làm một số công việc nhất định Cần phân côngmỗi thợ chỉ làm một việc và mỗi việc chỉ được làm bởi một thợ sao cho có nhiềucông việc được làm nhất Khả năng làm việc của các thợ được cho trong ma trận C ij với C ij = 1 thì thợ i biết làm việc
j, C ij =0 thì thợ ikhông biết làm việc j.
Ta nhận thấy hoàn toàn có thể giải bài toán nàybằng thuật toán Kunh-Munkres Tuy nhiên, vấn đề ở đây là bài toán của chúng tađơn giản hơn nhiều và tất nhiên, có thể giải quyết nó bằng một cách riêng khádễ dàng
Với các khái niệm và định nghĩa như trong bàitoán Kunh-Munkres (tuy nhiên, đồ thị hai phía G ở đây không nhất thiết đầy đủ),ta sử dụng định lý sau để có được thuật toán:
Trang 6Tập cặp ghép M (có thể không đầy đủ) là cực đạikhi và chỉ khi không tìm được đường đi bắt đầu từ một đỉnh tự do thuộc X và kếtthúc tại một đỉnh tự do thuộc Y trên đồ thị G' = (X
U Y, E') Đường đi đó gọilà đường tăng cặp ghép, và G' nhận được từ G bằng cách định hướng lại các cạnhcủa G theo quy tắc:
- Những cạnh (x, y) thuộc Mtrong đồ thị G được định hướng ngược lại trở thành cung (y, x) trong đồ thị G'
- Những cạnh (x, y) không thuộc M trong đồ thị Gđược định hướng trở thành cung (x, y) trong đồ thị G'.
Như vậy, ta có nhận xét sau: giả sử đã xây dựngđược một tập cặp ghép M nhưng vẫn có đường tăng cặp ghép từ đỉnh tự do x0thuộc X đến đỉnh tự do y0 thuộc Y:
x0 > y1 > x1 > y2 > > xt > y0
trongđó các cạnh đậm là các cạnh thuộc tập cặp ghép đã có Dễ thấy vì đường tăng
cặpghép xuất phát từ đỉnh tự do x0 thuộc X đến đỉnh tự do y0thuộc Y nên số cạnh nhạt trên đường đi sẽ lớn hơn số cạnh đậm Khi đó nếu đổichỗ các cạnh nhạt thành cạnh đậm, các cạnh đậm thành cạnh nhạt thì ta được tậpcặp ghép mới M' có lực lượng lớn hơn M
Tómlại, sơ đồ thuật toán như sau:
Bước 1 : Khởi tạo tập cặpghép M là rỗng.
Bước 2 : Tìm đường cặpghép từ một đỉnh x0 tự do thuộc X đến một đỉnh y0 tự dothuộc Y: +Nếu có thì chuyển sang bước 3
+Nếu không có thì tập cặp ghép hiện thời là cực đại và kết thúc thuật toán
Bước 3 : tăng cặp ghép:
Trang 7Thựchiện việc đổi cạnh nhạt thành đậm và cạnh đậm thành nhạt Tuy nhiên trong khicài đặt không phải xây dựng cụ thể đồ thị G' và đổi màu cạnh
Quayvề bước 2
Chươngtrình bài Phân công Thợ việc:
ProgramCapghepcucdai;
Uses Crt;
Const
Inf = 'Matching.inp';
Outf = 'Matching.out';
MaxN = 200;
MaxM = 200;
Var
A :array[0 MaxN,0 MaxM]of 0 1;
Tho:array[1 MaxN]of byte;
Viec :array[1 MaxM]of byte;
Pred :array[1 MaxN]of byte;
N,M :byte;
X0, Y0 : byte;
PathFound:boolean;
Procedure ReadInp;
var f:text;i,x:byte;
begin
fillchar(A, sizeof (A),0);
assign(f,inf); reset(f);
Trang 8for i:=1 to n do
begin
while not(seekeoln(f)) do
begin
read(f,x);
A[i,x]:=1;
end;
readln(f);
end;
close(f);
end;
Procedure WriteOut;
var f:text; i,socv:byte;
begin
socv:=0;
for i:=1 to n do
if viec[i]>0 theninc(socv);
assign(f,outf); rewrite(f);
writeln(f,socv);
for i:=1 to n do
if viec[i]>0 thenwriteln(f,{'Thó,}i:3,{' - viec',}viec[i]:3); close(f);
Trang 9ProcedureFindPath(x:byte); var y:byte;
begin
for y:=1 to m do
begin
if(Pred[y]=0)and (A[x,y]=1) then begin
Pred[y]:=x;
ifTho[y]=0 then
begin
Y0:=y;
PathFound:=true;
Exit;
end
else
begin
FindPath(Tho[y]);
end;
end;
ifPathFound then Exit;
end;
end;
Trang 10Procedure IncM;
var x,y,y1:byte;
begin
y:=y0;
while pred[y]<>x0 do
begin
x:=pred[y];
tho[y]:=x;
y1:=viec[x];
viec[x]:=y;
y:=y1;
end;
viec[X0]:=y; tho[y]:=X0; end;
Procedure Matching;
var Stop: boolean;x:byte; begin
fillchar(Tho, sizeof(Tho),0); fillchar(Viec, sizeof(Viec),0); Stop:=false;
While not(Stop) do
begin
PathFound:=false;
Trang 11for x:=1 ton do
ifviec[x]=0 then
begin
X0:=x;
FindPath(x);
ifPathFound then Break;
end;
if PathFoundthen IncM {TangCG} else Stop:=true;
end;
end;
BEGIN
clrscr;
ReadInp;
Matching;
WriteOut;
END
Córất nhiều bài toán được giải quyết bằng việc ghép cặp sao cho số cặp ghép làcực đạị
Chẳng hạn như bài Xếp các con xe trên bàn cờ quốc tế: Trênbàn cờ quốc tế kích thước N x
N (N < 251), người ta đánh dấu một ô bằng cách ghi trên đó số 1, các o còn lại ghi số 0 Hãy tìm cách đặt nhiều nhất các con xe vào các ô
được đánh dấu sao cho không có hai con xe nào ăn được nhau (tức là không có hai con nào xếp trên cùng một hàng hay cùng một cột)
Tuynhiên, có một dạng bài toán khác khá hay và thực tế mà cũng được giải bằngthuật toán ghép cặp cực đạị Đó là bài toán ta sẽ trình bày dưới đây:
Hệđại diện phân biệt
Trang 12Định nghĩa : Cho một họtập con S 1 , S 2 , , S m thuộc X.
Mộtbộ sắp thứ tự gồm m phần tử (a 1 , a 2 , , a m )với a 1 thuộc S 1 , a 2 thuộc S 2 , ,a m thuộc S m , trong đó: a i khác a j với i khác j (i, j = 1, 2, , m) đượcgọi là một hệ đại diện phân biệt của
họ S 1 , S 2 , , S m
Bàitoán đặt ra là cần phải xây dựng một hệ đại diện phân biệt của một họ chotrước
Vídụ, nhà trường tổ chức một buổi họp cán bộ của trường, đề nghị mỗi tổ chức cửmột người đi họp và mỗi người chỉ được đại diện cho một tổ chức Tuy nhiên, mộtngười có thể giữ nhiều chức vụ trong các tổ chức khác nhau Chẳng hạn, một bíthư liên chi có thể vừa là một lớp trưởng, một phó bí thư của lớp cũng có thểlà hội trưởng hội sinh viên của khoa Cần lập chương trình sắp xếp mọi ngườiđi họp sao cho thích hợp
Quaylại bài toán, trước hết, gọi tập Y = S1 U S2 U S3U U Sm là hợp của tất cả các Si (chính là tập các phầntử khác nhau của họ S) Chúng ta có nhận xét sau về điều kiện để tồn tại một hệđại diện phân biệt là:
+Nếu lực lượng (số phần tử) của Y là n thì n tối thiểu phải bằng m Nghĩa là n>= m
Đểgiải bài toán hệ đại diện phân biệt, ta xây dựng đồ thị hai phía biểu diễn mốiquan hệ giữa các tập Si thuộc X và các phần tử yj thuộc Ycủa họ (j = 1, 2, , n) bằng ma trận Cij được định nghĩa như sau:
Cij= 1 tương đương với phần tử yj thuộc tập Si
Cij= 0 tương đương với phần tử yj không thuộc Si
Từđây ta thấy bài toán đã được đưa về việc tìm một tập cặp ghép cực đại M (có lựclượng lớn nhất) của đồ thị G Nếu lực lượng của M tìm được bằng đúng m thì tađã tìm được một
hệ đại diện phân biệt Còn nếu không thì kết luận là không tồntại một hệ đại diện phân biệt nào của họ S
Trang 13Trênđây chỉ là vài vấn đề bổ sung thêm cho bài toán cặp ghép mà tôi xin được giớithiệu để các bạn tham khảo và xem xét Còn vô số bài toán khác liên quan đếnviệc 'ghép cặp' trong
lý thuyết đồ thị cũng như trong thực tế phứctạp Mong được bạn đọc góp ý thêm