1. Trang chủ
  2. » Luận Văn - Báo Cáo

Một số vấn đề về lý thuyết trò chơi

68 372 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 68
Dung lượng 1,65 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Các kết quả này có thể đợc liệt kê trong bảng sau: Đây là trò chơi hai ngời, mỗi đối thủ đều có hai chiến thuật tơng ứng vớiviệc chọn mặt sấp hay mặt ngửa.. Nếu đối thủ 1 chọn chiến thu

Trang 1

Lời nói đầu

Chúng ta đang sống trong thời đại mới, thời đại của ngành công nghệthông tin đang ở đỉnh cao của sự phát triển Có thể nói công nghệ thông tin

đã đóng một vai trò quan trọng trong đời sống của chúng ta Đất nớc càngphát triển thì đòi hỏi sự đóng góp của ngành công nghệ thông tin càng cao.Ngành công nghệ thông tin đã đóng góp rất lớn vào các ngành kinh tế, khoahọc, giáo dục,… Nhằm giúp con ng Nhằm giúp con ngời ngày càng chinh phục đợc đỉnh caocủa thế giới

Chúng ta đang sống trong thời đại của nền kinh tế công nghiệp hoá hiện đại hoá Đời sống của con ngời ngày càng đợc nâng cao Nh vậy nhucầu về vui chơi giải trí của con ngời ngày càng đợc đòi hỏi Và những tròchơi đợc thiết kế bằng máy tính đã ra đời và đang trên đà phát triển để đápứng những nhu cầu đòi hỏi đó của con ngời Có thể nói để lập trình đợc mộttrò chơi thì lý thuyết trò chơi đóng một vai trò hết sức quan trọng Nó quyết

-định đến sự thành công hay thất bại của trò chơi Vì lý do đó tôi đã mạnh dạn

chọn đề tài: “ Một số vấn đề về lý thuyết trò chơi ” làm khoá luận tốt nghiệp

đại học

Để hoàn thành khoá luận, tôi đã nhận đợc sự hớng dẫn nhiệt tình của Côgiáo, Tiến sĩ Phan Lê Na Nhân dịp này cho phép tôi bày tỏ lòng biết ơn sâusắc đến cô giáo Phan Lê Na Đồng thời tôi xin gửi lời cảm ơn đến các thầycô giáo trong khoa CNTT và các bạn sinh viên trong lớp đã giúp đỡ tôi rấtnhiều trong thời gian làm khoá luận

Trang 2

1.4 Các chiến thuật hỗn hợp 7

1.6 Các điểm yên ngựa trong các chiến thuật hỗn hợp 121.7 Các chiến thuật tối u và các tính chất của chúng 121.8 Chiến thuật u thế và rút gọn trò chơi 15

2.4 Các tính chất của các chiến thuật tối u 32

Chơng III Các trò chơi không hợp tác n ng ời 39

3.1 Khái niệm trò chơi không hợp tác n ngời 393.2 Các yếu tố của trò chơi không hợp tác n ngời 40

Chơng IV. Các trò chơi hợp tác n ng ời 49

4.2 Tính chất hàm dặc trng của trò chơi 51

4.4 Chiến thuật tơng đơng và tiêu chuẩn hoá (0, 1) 54

5.3 Xây dựng trò chơi “Đỏ- Đen” bằng Gambit 615.3.1 Mô tả trò chơi “Đỏ - Đen” gồm hai ngời chơi 615.3.2 Xây dựng trò chơi “Đỏ- Đen” bằng Gambit 625.3.3 Giải thích trò chơi ở dạng hình cây 635.4 Chơng trình xây dựng trò chơi “Đỏ- Đen” bằng

Trang 3

Chơng I Trò chơi ma trận

1.1 Giới thiệu chung

Khi nghiên cứu một số bài toán thực tế trong các lĩnh vực kinh tế xã hộihay trong chiến tranh ngời ta thờng gặp những tình huống trong đó có cácbên với quyền lợi đối lập nhau Mỗi bên đều tìm cách hành động sao chomình có lợi nhất Những tình huống nh thế gọi là các tình huống xung đột

Có rất nhiều ví dụ về các tình huống nh thế: xung đột vũ trang giữa các quốcgia, giữa hai phe phái, cạnh tranh giữa các công ty… Nhằm giúp con ng

Việc nghiên cứu, phân tích những tình huống nh thế nhằm nắm đợc bảnchất của nó và để đề ra những giải pháp tốt nhất đối với mỗi bên tham gia đã

dẫn đến sự ra đời của một môn toán học mới: Lý thuyết trò chơi Lý thuyết

trò chơi là lý thuyết toán học về các tình huống xung đột

Lý thuyết trò chơi là một thành phần quan trọng trong ngành toán học.Vấn đề nghiên cứu trong lý thuyết trò chơi là: Có hai hoặc nhiều ngời thamgia và đợc gọi là các ngời chơi, các ngời chơi đa ra cách giải quyết trong mộttình huống đối lập hay cạnh tranh, mỗi ngời chơi với mục đích là thu đợc kếtquả có lợi nhất sau mỗi lần tham gia

Một trò chơi đợc tiến hành theo những quy tắc nhất định Tập hợp nhữngquy định, những điều kiện mà các bên tham gia đều phải thuân theo gọi làquy tắc chơi (hoặc luật chơi) Nh vậy một trò chơi bao gồm các ngời chơi,các chiến thuật và kết quả của các ngời chơi sau khi trò chơi kết thúc

1.2 Khái niệm về trò chơi ma trận

Trang 4

Giả sử đối thủ 1 có m chiến thuật i = 1,… Nhằm giúp con ng., m; đối thủ 2 có n chiến thuậtj=1,… Nhằm giúp con ng., n cho aij là kết quả mà đối thủ 1 thu đợc từ đối thủ 2 nếu đối thủ 1chọn chiến thuật i và đối thủ 2 chọn chiến thuật j Khi đó ma trận kết quả là:

a11 a12… Nhằm giúp con ng… Nhằm giúp con ng a1n

A=( aij ) = a21 a22… Nhằm giúp con ng… Nhằm giúp con ng a2n

… Nhằm giúp con ng… Nhằm giúp con ng… Nhằm giúp con ng… Nhằm giúp con ng… Nhằm giúp con ng… Nhằm giúp con ng

am1 am2 … Nhằm giúp con ng… Nhằm giúp con ng amn

Trò chơi hoàn toàn đợc xác định bởi ma trận trên Nh vậy, trò chơi này

đ-ợc gọi là một trò chơi ma trận

Ví dụ minh hoạ

Ta hãy thử xây dựng ma trận của một số trò chơi đơn giản thờng ngày

Ví dụ 1.1: Trò chơi úp bát hay sấp ngửa.

Giả sử chỉ có hai ngời chơi tham gia vào trò chơi, một nhà cái - đối thủ 1

và một nhà con - đối thủ 2 Nhà cái úp một đồng tiền giấu kín trong bát Nhàcon đặt một đồng tiền vào bên sấp hoặc bên ngửa Khi mở bát nếu đúng thìnhà cái phải trả cho nhà con một đồng, trái lại nếu sai thì nhà con phải trảcho nhà cái

Các kết quả này có thể đợc liệt kê trong bảng sau:

Đây là trò chơi hai ngời, mỗi đối thủ đều có hai chiến thuật tơng ứng vớiviệc chọn mặt sấp hay mặt ngửa Trò chơi có thông tin không đầy đủ vì đốithủ 2 không biết đợc sự lựa chọn của đối thủ 1 (đồng tiền bị úp kín trongbát), đối thủ 1 không biết sự lựa chọn của đối thủ 2 vì khi đối thủ 2 đặt đồngtiền xuống thì cũng là lúc cuộc chơi kết thúc Bảng kết quả ở trên có dạng làmột ma trận kết quả Kết quả là một hàm của các chiến thuật của hai ngờichơi

Trang 5

Ví dụ 1.2: Trò chơi “ Oẳn – tù – tì ”.

Đây là trò chơi mà trẻ em thờng chơi Kéo thắng giấy, giấy thắng búa, vàbúa lại thắng kéo Có hai ngời chơi: đối thủ 1 và đối thủ 2 Mỗi đối thủ có 3chiến thuật Các chiến thuật 1, 2, 3 tơng ứng với búa, giấy và kéo Giả sửrằng ngời thắng sẽ nhận đợc kết quả là 1 còn ngời thua sẽ bị mất là -1, trờnghợp hoà là 0, khi đó ma trận kết quả là:

Ví dụ 1.3:

Đối thủ 1 chọn một số trong 4 số p = 0, 1, 2, 3 và không để cho đối thủ 2biết; đối thủ 2 chọn một số trong 3 số q = 0, 1, 2 Kết quả cho đối thủ 1(nghĩa là đối thủ 2 trả cho đối thủ 1) đợc xác định bằng hàm

Đối thủ 2

1-10

-10

-1

123

12

10

-1-4-93

210

Trang 6

Nếu đối thủ 1 chọn chiến thuật đầu tiên i=1, thì có thể chắc chắn thu đợcgiá trị nhỏ nhất

là giá trị nhỏ nhất của các phần tử ở hàng thứ i trong ma trận kết quả Khi đó

đối thủ 1 muốn có kết quả là lớn nhất, thì có thể chọn i để cho (1.1) là lớnvới khả năng có thể Có nghĩa là, đối thủ 1 có thể chọn i để thu đợc kết quảlà:

i m

 1

là giá trị lớn nhất của các phần tử ở cột thứ j trong ma trận kết quả Khi đó

đối thủ 2 muốn kết quả bị thua là nhỏ nhất thì phải cố gắng chọn j để làmcho kết quả bị thua là:

1minj n i m

 1 max aij

trong khi đối thủ 2 có thể chọn j để làm cho đối thủ 1 thu đợc kết quả là:

1minj  n max1i m aij

Vấn đề đặt ra là có mối quan hệ nào giữa hai giá trị này không? Để giảithích điều này, chúng ta xét 3 ví dụ đã đa ra ở trên

Trong Ví dụ 1:

i m

 1

Nh vậy

Trang 7

i m

 1

 1 maxaij

 1 maxaij

Trong Ví dụ 3:

i m

 1

1minj  n max1i m aij = min (0, 2, 8) = 0.

Hai kết quả này bằng nhau

Chúng ta thấy i m

 1

 1 max aij có thể là bằng hoặc không

bằng nhau

Nhận thấy

i m

 1

1 min

m i

 1 maxaij

ij  max1i m aij , i,j.

Khi đó phía bên trái của bất đẳng thức phụ thuộc vào j Lấy giá trị nhỏnhất đối với j trên cả hai vế chúng ta đợc

1minj  n aij  1minj n i m

 1 max aij

 1 maxaij

1.3 Điểm yên ngựa

Nếu các phần tử của ma trận ( aij ) của một trò chơi ma trận thoả mãn i m

 1

max

n

j 

 1

 1 maxaij

(1.6)

v đợc gọi là giá trị của trò chơi v là giá trị chung của (1.2) và (1.4)

Nếu (1.6) đúng, thì sẽ tồn tại một i* và j* để cho

1minj  n ai*j = i m

 1

Trang 8

1minj  n ai*j ≤ ai*j* ≤ i m

 1

maxaij*. 

m i

 1

maxaij* = ai*j* = v =

n j

1 minai*j

Vậy i,j chúng ta có

aij*  ai*j* = v  aij* (1.7)

Điều này nói rằng, nếu đối thủ 1 chọn chiến thuật i*, thì khi đó có kếtquả không thể nhỏ hơn v nếu đối thủ 2 không chọn chiến thuật j*; nếu đốithủ 2 chọn chiến thuật j* thì khi đó có kết quả không thể vợt qúa v nếu đốithủ 1 không chọn chiến thuật i*

Chúng ta gọi i* và j* là các chiến thuật tối u tơng ứng với đối thủ 1 và

đối thủ 2 Điểm (i*, j*) đợc gọi là điểm yên ngựa của trò chơi Và i = i*, j

=j* là một lời giải của trò chơi

Mối quan hệ (1.7) chỉ ra rằng kết quả tại điểm yên ngựa (i*, j*) là giá trịcủa trò chơi Với điều kiện là đối thủ 1 dựa vào chiến thuật tối u i*, ngời đó

có thể hi vọng tăng kết quả đạt đợc nếu đối thủ 2 không chọn chiến thuật tối

u j* Tơng tự, nếu đối thủ 2 dựa vào chiến thuật tối u j* thì kết quả của đốithủ 1 có thể giảm nếu ngời đó không chọn chiến thuật tối u i*

Ví dụ minh hoạ

Trong Ví dụ 1.3, i* = 1, j* = 1 là một điểm yên ngựa của trò chơi a11 = 0

là phần tử nhỏ nhất trong hàng đầu tiên và đồng thời là phần tử lớn nhấttrong cột thứ nhất.Trong Ví dụ 1.4, a31 = a32 = 2 là hai phần tử nhỏ nhất ởhàng thứ 3 và đồng thời là hai phần tử lớn nhất ở cột thứ nhất và cột thứ hai t-

ơng ứng

Khi số các điểm yên ngựa của một trò chơi ma trận vợt quá 1, chúng ta

có định lý sau:

Định lý 1.1

Trang 9

Cho (i*, j*) và (i 0 , j 0 ) là các điểm yên ngựa của một trò chơi ma trận (a ij ) Khi đó (i*,j 0 ) và (i 0 , j*) là các điểm yên ngựa của ma trận đó, và giá trị tại tất cả các điểm yên ngựa là bằng nhau, tức là:

a i*j* = a i 0 j 0 = a i*j 0 =a i 0 j* (1.8)

Chứng minh

Khi (i*,j*) là một điểm yên ngựa, thì

aij* ≤ ai*j* ≤ ai*j i,j ,(1.9)

và khi (i0,j 0) là một điểm yên ngựa, thì

aij0 ≤ ai0j0 ≤ aij0 , i,j .(1.10)

Từ (1.9) và (1.10)  ai*j* ≤ ai*j0 ≤ ai0j0 ≤ai0j* ≤ ai*j*

 (1.8) đợc chứng minh

Kết hợp (1.8), (1.9) và (1.10), suy ra

aij0  ai*j0  ai*j ,i,j

Vậy (i*,j 0) là một điểm yên ngựa

Hoàn toàn tơng tự ta cũng chứng minh đợc (i0, j*) là một điểm yên ngựa

1.4 Các chiến thuật hỗn hợp

Khi một trò chơi ma trận không có điểm yên ngựa, nghĩa là nếu

i m

 1

 1 maxaij

thì chúng ta không thể giải quyết trò chơi nh ở mục trớc đợc Chẳng hạn ờng hợp ở ma trận kết quả của trò chơi ‘Oẳn – tù - tì’ trong mục 1.2 là:

 1 maxaij

Đối thủ 1 có thể chắc chắn thu đợc giá trị nhỏ nhất là -1, đối thủ thứ 2 cóthể đảm bảo rằng kết quả thất bại tại giá trị lớn nhất là 1 Trong giải phápnày, đối thủ 1 sẽ cố gắng thu đợc một kết quả lớn hơn –1, đối thủ 2 sẽ cốgắng làm cho kết quả của đối thủ nhỏ hơn 1 Với các giả định đó, mỗi ngờichơi tìm cách ngăn cản đối thủ của mình từ việc tìm ra cách lựa chọn chiếnthuật thực sự Để làm đợc điều này, đối thủ 1 có thể dựa vào một vài phơngsách ngẫu nhiên để xác định chiến thuật đang chọn Tơng tự, đối thủ 2 cũng

sẽ lựa chọn chiến thuật của mình dựa vào một vài phơng pháp ngẫu nhiên.Một chiến thuật hiểu theo nghĩa nh thế gọi là một chiến thuật hỗn hợp

Định nghĩa

Trang 10

Cho ma trận kết quả của một trò chơi ma trận là A= (a ij ) trong đó i=1, ,m; j=1, ,n Một chiến thuật hỗn hợp của đối thủ 1 là tập các số x i  0, i=1, ,m thoả mãn

Nhân mỗi kết quả aij với khả năng xiyj tơng ứng và lấy tổng i,j Khi đókết quả mong muốn của đối thủ 1 là:

Cho Sm là tập tất cả X=(x1,… Nhằm giúp con ng… Nhằm giúp con ng,xm) thoả mãn điều kiện

Xi ≥ 0 ,i=1, ,m, … Nhằm giúp con ng 

Trong đó Sn là tập tất cả Y= (y1,… Nhằm giúp con ng… Nhằm giúp con ng,yn ) thoả mãn điều kiện

Yj  0 , j =1,… Nhằm giúp con ng.,n, 

n

j j

Y S

n

min max

Nếu đối thủ 2 chọn chiến thuật Y  Sn , thì kết quả mong muốn của đốithủ 1 là lớn nhất

Trang 11

X S

m

max min

Y S

X S

m

max min

ij x y a

Lấy giá trị lớn nhất XSm trên cả hai phía của bất phơg trình, chúng tathu đợc

Y S

Một số cách chứng minh về định lý Minimax đã đợc đa ra trong tài liệu

về lý thuyết trò chơi ở đây chỉ nêu ra cách chứng minh của Newmann (Đợc

đa ra trong Von Newmann và Morgenstern (1944))

Trang 12

H chính là một tập lồi Điều này có thể dễ dàng chứng minh bằng cáchchứng minh mọi tổ hợp tuyến tính lồi của hai điểm bất kỳ của H cũng  H.

Để chứng minh định lý Minimax, chúng ta cần đa ra hai bổ đề sau

1

= a i1 y 1 +a i 2 y 2 + +a in y n ≤ 0 ,i = 1, ,m ; hoặc (2) tồn tại các số x 1 , ,x m với

Y S

X S

m

max min = v 2

Chứng minh

Từ Định lý 1.2 chúng ta chứng minh đợc v1 ≤ v2 Chúng ta chỉ cần chứngminh v1 ≥ v2

Từ Bổ đề 2, một trong hai trờng hợp sau phải đúng

(1) y1,… Nhằm giúp con ng… Nhằm giúp con ng ,yn ≥ 0 , 

n

j j

j j

ij y x

Nh vậy

Trang 13

X S

i

i

ij x y a

Y S

a11-k a12-k… Nhằm giúp con ng… Nhằm giúp con ng… Nhằm giúp con ng a1n-k

(aij –k) = a21-k a22-k… Nhằm giúp con ng… Nhằm giúp con ng… Nhằm giúp con ng a2n-k

… Nhằm giúp con ng… Nhằm giúp con ng… Nhằm giúp con ng… Nhằm giúp con ng… Nhằm giúp con ng… Nhằm giúp con ng… Nhằm giúp con ng… Nhằm giúp con ng… Nhằm giúp con ng… Nhằm giúp con ng

am1-k am 2-k… Nhằm giúp con ng… Nhằm giúp con ng… Nhằm giúp con ngamn-k

Trong đó k là một số tuỳ ý Và chúng ta thấy:

Không bao giờ tồn tại v1- k < 0 < v2 - k ,

hay không bao giờ tồn tại v1  k  v2 (1.15)

Nh vậy, không tồn tại v1  v2, mặt khác nếu k thoả mãn v1  k  v2,dẫn đến mâu thuận với (1.15)

Nh vậy định lý Minimax đợc chứng minh

1.6 Các điểm yên ngựa trong các chiến thuật hỗn hợp

Cho A = (aij ) là ma trận kết quả của một trò chơi ma trận mn

Nếu X = (x1,… Nhằm giúp con ng… Nhằm giúp con ng,xm)  Sm và Y=(y1,… Nhằm giúp con ng… Nhằm giúp con ng,yn )  Sn tơng ứng với cácchiến thuật hỗn hợp của đối thủ1 và đối thủ 2 thì khi đó kết quả mong muốn

Trang 14

 

 

m i n j

j i

ij x y a

X min 

max XAY t và

m

n X S S

Y max 

min XAY t

là tồn tại và bằng nhau.

1.7 Các chiến thuật tối u và các tính chất của chúng

Nếu ma trận trò chơi A = (aij ) có một điểm yên ngựa và nếu (X*,Y*) là một

điểm yên ngựa, nghĩa là:

XAY*t ≤ X*AY*t ≤ X*AYt , X Sm và Y Sn

thì khi đó chúng ta nói rằng X*,Y* là các chiến thuật tối u tơng ứng của đốithủ 1 và đối thủ 2, và

X*AY*t

là giá trị của trò chơi Có nghĩa là, kết quả mong muốn của trò chơi tại điểmyên ngựa (X*,Y*) là giá trị của trò chơi Chúng ta cũng nói rằng (X*,Y*) làmột giải pháp của trò chơi Theo Định lý 1.5 giá trị của trò chơi là giá trịchung của

v1 =

n

m Y S S

X min 

max XAYt và v2 =

m

n X S S

Y max 

min XAYt

Định nghĩa (1.16) của điểm yên ngựa cho thấy, với điều kiện đối thủ 1 đa

ra chiến thuật tối u X*, thì có thể chắc chắn thu đợc kết qủa mong muốnX*AY*t nhỏ nhất Tơng tự, với điều kiện đối thủ 2 đa ra chiến thuật tối u Y*,thì có thể làm cho kết quả mong muốn của đối thủ 1 giảm tại giá trị lớn nhấtX*AY*t mà không ảnh hởng đến đối thủ 1 đa ra cách chọn chiến thuật nhthế nào

Các ký hiệu sau sẽ đợc áp dụng Chúng ta ký hiệu vectơ hàng thứ i của

ma trận A bởi Ai và vectơ cột thứ j bởi Aj Nh vậy

XAj = 

m

i i

ij x a

1

XAj là kết quả mong muốn khi đối thủ 1 chọn chiến thuật hỗn hợp X và

đối thủ 2 chọn chiến thuật thuần tuý j; AiYt là kết quả mong muốn khi đốithủ 2 chọn chiến thuật hỗn hợp Y và đối thủ 1 chọn chiến thuật thuần tuý i

 Tính chất của các chiến thuật tối u

Định lý 1.6

Trang 15

Cho A = (a ij ) là ma trận kết quả của một ma trận trò chơi mn có giá trị

là v.

(1) cho Y* là một chiến thuật tối u của đối thủ 2 Nếu

A i Y* t  v,

thì x i * = 0 trong mỗi chiến thuật tối u X* của đối thủ 1.

(2) cho X* là một chiến thuật tối u của đối thủ 1 Nếu

Trang 16

Giả sử rằng

v ≤ X*Aj , j = 1,… Nhằm giúp con ng… Nhằm giúp con ng , n (1.17)Cho (X0,Y0) là một điểm yên ngựa của trò chơi, tức là

XAY0t ≤ X0AY0t ≤ X0AYt , X  Sm và Y  Sn (1.18)

Chúng ta sẽ chứng minh (X*, Y0) là một điểm yên ngựa của trò chơi.Cho Y = (y1,… Nhằm giúp con ng… Nhằm giúp con ng,yn )  Sn là một chiến thuật hỗn hợp bất kỳ của đối thủ

2 Nhân hai vế của (1.17) bởi yj và lấy tổng với j = 1,… Nhằm giúp con ng ,n Chúng ta thu đợc

v ≤ 

n

j 1 X*Aj yj = X*A Yt (1.19)

Trong trờng hợp đặc biệt

Từ (1.18), (1.22) và (1.19)  XAY0t ≤ X*AY0t ≤ X*AYt

Vậy chúng ta đã chứng minh đợc (X*,Y0) là một điểm yên ngựa của tròchơi Khi đó, X* là một chiến thuật tối u của đối thủ1 

1.8 Chiến thuật u thế và rút gọn trò chơi

thì chúng ta nói rằng chiến thuật k của đối thủ 2 u thế hơn chiến thuật l.

Nếu các bất đẳng thức (1.23) hoặc (1.24) đợc thay thế bởi các bất đẳngthức đúng, thì chúng ta nói rằng chiến thuật k của đối thủ 1 hoặc 2 hoàn toàn

u thế hơn chiến thuật l

Khái niệm về tính u thế cho các chiến thuật hỗn hợp là tơng tự

Ta thấy rằng khi tìm chiến thuật tối u của một trò chơi có thể loại bỏkhông xét các chiến thuật u thế (nghĩa là cả một chiến thuật khác u thế hơnnó) mà không ảnh hởng gì đến kết quả Điều này đợc chính xác hoá bởi định

lý sau đây

Định lý1.8

Giả sử G là trò chơi với ma trận là A = (a ij ) có các hàng i 0 , i 1 , ,i r u thế.Thế thì tồn tại chiến thuật tối u X* với các thành phần x i0 = x i1 =.= x ir Hơn nữa, nếu gọi G 0 là trò chơi với ma trận là A 0 nhận đợc từ A sau khi đã

Trang 17

loại bỏ các hàng u thế nói trên thì mọi chiến thuật X* tối u đối với G 0 cũng là tối u đối với G.

Ta có định lý hoàn toàn tơng tự đối với cột

Trang 18

4 2

0 8

Dễ dàng xác định đợc các chiến thuật tối u của trò chơi có ma trận 22

là ma trận con của ma trận gốc 44 đợc thiết lập bởi hàng thứ 3, thứ 4 và cộtthứ 3, thứ 4 của nó

Ta chỉ xét trờng hợp không có điểm yên ngựa, bằng việc thay đổi cáchàng hoặc các cột của ma trận, nghĩa là, bằng việc đánh số lại hai chiến thuậtcủa đối thủ 1 hoặc đối thủ 2, có thể thấy rằng chỉ có một trờng hợp sau cần

đợc xét:

a b, a c, d b, d c

Trong trờng hợp này, trò chơi phải có một giải pháp chiến thuật hỗn hợp.Cho X* = (x*, 1-x*), Y* = (y*,1-y*) là các chiến thuật tối u tơng ứngcủa đối thủ 1 và đối thủ 2 Trong đó

ay* + b(1-y*) = v, cy* + d(1-y*) = v

Từ hai phơng trình đầu suy ra:

x*=

c b d a

c d

b d

Trang 19

v =

c b d a

bc ad

C¸c ph¬ng tr×nh (1.26), (1.27), (1.28) lµ c¸c chiÕn thuËt tèi u vµ gi¸ trÞcña trß ch¬i (1.25) khi nã kh«ng cã ®iÓm yªn ngùa trong c¸c chiÕn thuËtthuÇn tuý

C¸c c«ng thøc nµy còng tho¶ m·n cho trêng hîp

Trang 20

Trên mặt phẳng dựng hai đờng vuông góc với trục Ox tại các điểm x= 0

và x=1 Chúng ta biểu diễn hai chiến thuật thuần tuý A1, A2 Các đờng thẳng

B1B1 và B2B2 sẽ biểu diễn các chiến thuật B1, B2 tơng ứng theo nghĩa nh sau.Giả sử đối thủ 2 chọn chiến thuật thuần tuý B1 Nếu đối thủ 1 sử dụng chiếnthuật X* = (x*,1-x*) thì số chi trả (trung bình) trong trờng hợp này là ax* +c(1-x*) chính là tung độ của điểm M Tơng tự đối với B2 Nh vậy, mức thắngtối thiểu của đối thủ 1 dù cho đối thủ 2 sử dụng bất cứ chiến thuật nào chính

là đờng gấp khúc tô đậm ở bên dới

V(X*) = minj1,2 (ax* + c(1-x*))

Ta cần tìm chiến thuật tối u X* của đối thủ 1 theo tiêu chuẩn là làm cực

đại mức thắng V(X*) này Từ đó thấy ngay rằng lời giải là điểm N sao cho

có tung độ cao nhất trên đờng gấp khúc này (xem Hình 1.1)

Trang 21

Nếu đối thủ 1 chọn chiến thuật thuần tuý , tức là, khi x = 1 và nếu đối

thủ 2 chọn chiến thuật thuần tuý 1 thì kết quả là a, nh trong Hình 1.2 Nếu

đối thủ 1 chọn , tức là khi x = 0 thì kết quả tơng ứng với 1 là d Chúng ta

có đờng ad trong hình.

Giả sử rằng đối thủ 1 chọn một chiến thuật hỗn hợp X = (x, 1-x) đợc môtả bởi P trong hình Thì có thể thấy rằng đờng cao PQ mô tả kết quả mongmuốn khi đối thủ 1 sử dụng X và đối thủ 2 sử dụng 1 Tổng là:

XA1 = 

2 1

aQ

P

dfe

1

23

B '

A '

Trang 22

Tơng tự, tơng đơng với các chiến thuật 2 và 3 của đối thủ 2 chúng ta có

đờng be và cd Các đờng cao của các điểm trên các đờng này mô tả các kết

quả mong muốn nếu đối thủ 1 sử dụng X trong khi đối thủ 2 sử dụng 2 và 3tơng ứng

Với chiến thuật hỗn hợp X bất kỳ của đối thủ 1, thì kết quả mong muốn

của ngời đó là giá trị nhỏ nhất của 3 tung độ trên các đờng ad, be, cf tại điểm

min

i

i ij

j a x (1.29)

Hàm này đợc mô tả bằng đờng đậm trong hình

Đối thủ 1 muốn chọn một X để đạt giá trị lớn nhất của hàm (1.29).Chúng ta thấy từ hình trên, ngời đó sẽ chọn chiến thuật hỗn hợp tơng ứng với

điểm A' tại điểm này kết quả mong muốn là :

2 i

i ij j

S

đây chính là giá trị của trò chơi

Chú ý rằng điểm B' tronh Hình 1.2 là điểm giao nhau của đờng ad và cf.

Toạ độ x= x* của điểm A' và giá trị của A'B' có thể đợc tìm thấy bằng cáchgiải hai phơng trình tuyến tính hai ẩn

Đồ thị cũng chỉ ra rằng chiến thuật tối u của đối thủ 2 không chứa chiếnthuật thuần tuý 2 nh vậy, cách giải của ma trận trò chơi 2ì3 có thể suy ra

từ cách giải của ma trận trò chơi 2ì2

Trang 23

trong đó 0 ≤ y ≤ 1, y=1 và y= 0 mô tả các chiến thuật thuần tuý 1 và 2

max

j

j ij

i a y .

Hình 1.3

Đối thủ 2 muốn chọn một Y để giá trị lớn nhất ở trên là nhỏ nhất ở đây

Y đợc mô tả bằng điểm A' Kết quả mong muốn tại điểm này là:

Cho 123 là một tam giác đều có các đờng phân giác vuông góc Với mỗi

điểm X nằm trong tam giác này, cho x1, x2, x3 là khoảng cách từ X đến cáccạch của tam giác đối ngợc với các đỉnh 1, 2, 3 tơng ứng Thì khi đó x1, x2, x3

thoả mãn điều kiện (1.30) và (1.31) (xem Hình 1.4) Chúng đợc gọi là toạ độBarycentric của X

Các toạ độ Barycentric của các đỉnh 1, 2 và 3 là (1,0,0), (0,1,0) và (0,0,1)tơng ứng Các phơng trình tơng ứng của 3 cạnh 23, 31, 12 của tam giác là:

13

Trang 24

îc gi¶ sö lµ ©m) XÐt ph¬ng tr×nh (1.33), chia toµn bé mÆt ph¼ng thµnh haiphÇn C¸c ®iÓm X trong mét nöa mÆt ph¼ng tho¶ m·n ®iÒu kiÖn

Trang 25

3 1

3

max , max ,

R S X R

S X R S

XAj tại các đỉnh thích hợp và đa ra một sự so sánh giữa các giá trị đó, giá trịlớn nhất phải là v Trong quá trình so sánh, các chiến thuật tối u của đối thủ

S Y

t T S Y

t T S

3 2

1

1 3 2

3 1

3

min,min

,min

Trang 26

Trong đó Ti là miền mà hàm tuyến tính AiYt thoả mãn

đợc coi là các điểm tơng ứng với các chiến thuật tối u của đối thủ 2

Ví dụ minh hoạ

Ví dụ 1.5: Tính giá trị và các chiến thuật tối u của trò chơi có ma trận kết

(0, 0, 1)(2, -6, -1)t = -1

Trang 27

So sánh 5 phơng trình trên, chúng ta thấy giá trị của trò chơi A là:

X1*, X2* là các chiến thuật tối u của đối thủ 1

Bây giờ tính các chiến thuật tối u của đối thủ 2 Chúng ta có

()

)0,9

2,9

7(

()

1

32

Trang 28

Trở lại với ma trận gốc B, chúng ta thu đợc giá trị của B

Trang 29

đối thủ 2 chọn y 0, 1 x, y đợc gọi là các chiến thuật thuần tuý của đối thủ

1 và đối thủ 2 tơng ứng Và kết quả đợc mô tả bằng giá trị hàm P(x, y)

Đối thủ 1 thu đợc một kết quả P(x, y); kết quả phải trả của đối thủ 2 là P(x, y) Nói cách khác, đối thủ 2 trả một lợng P(x, y) cho đối thủ 1

-Một trò chơi nh vậy đợc gọi là một trò chơi vô hạn Khi đó tổng các kếtquả của đối thủ 1 và đối thủ 2 luôn luôn bằng 0 Nh vậy, trò chơi vô hạn này

là trò chơi vô hạn có tổng bằng 0

Trang 30

max0x10miny1 P(x,y) Tơng tự, với mỗi y 0, 1 mà đối thủ 2 chọn, thì kết quả mà đối thủ 2phải mất là lớn nhất

Cũng giống nh trong trờng hợp của trò chơi ma trận, chúng ta có

max0x10miny1 P(x, y) ≤ 0min1max0 1

y x P(x, y)

Nếu xẩy ra trờng hợp

max0x1min0y1 P(x, y) = min0 1max0 1

y x P(x, y) thì (x*, y*)  0, 1x0, 1 : P(x, y*)  P(x*, y*)  P(x*, y) x,y 0,1

Điểm (x* ,y*) đợc gọi là một điểm yên ngựa của hàm kết quả P(x, y) hay

là một điểm yên ngựa của trò chơi Giá trị tại điểm yên ngựa đợc gọi là giátrị của trò chơi P(x*, y*)

Một chiến thuật hỗn hợp của đối thủ 1 là một hàm phân phối F(x) đợcxác định trên đoạn 0, 1 Với mỗi x0, 1, F(x) là một quá trình ngẫu nhiênkhi chọn một số không lớn hơn x Nghĩa là chúng ta có:

Trang 31

F(x) = Pr{ ≤ x} Trong đó  là một giá trị ngẫu nhiên.

Khi x = 0 thì

F(0) = Pr{ <0 }= 0

Định nghĩa

F(b) F(a) =Pr {a <  ≤ b} F(b) F(0) =Pr {0 ≤ ≤b}

F(x) đợc xác định nh trên có các tính chất sau

(1) F(x) không âm : F(x) ≥ 0 , 0 ≤ x ≤ 1.

(2) F(0) = 0 , F(1) = 1

(3) F(x) không tăng: Nếu x 1 ,x 2  0, 1 và x 1 < x 2 thì F(x 1 ) ≤ F(x 2 ) (4) F(x) là một hàm liên tục phải trong khoảng ( 0, 1), nghĩa là:

F(x 0 + 0) = F(x 0 ) , 0 < x < 1.

F(x) thoả mãn 4 tính chất trên là một hàm phân phối

Khi hàm kết quả P(x, y) của một trò chơi thoả mãn (2.1), các đối thủ 1

và đối thủ 2 chọn chiến thuật x,y0, 1 tơng ứng các hàm phân phối F(x) vàG(y) – là các chiến thuật hỗn hợp

Nếu đối thủ 1 chọn chiến thuật thuần tuý x và đối thủ 2 chọn chiến thuậthỗn hợp G(y) thì kết quả mong muốn của đối thủ 1 là:

Đây là tích phân Stieltjes

Tơng tự, nếu đối thủ 2 sử dụng chiến thuật thuần tuý y và đối thủ 1 sửdụng chiến thuật hỗn hợp F(x) thì kết quả mong muốn của đối thủ 1 là: 

1

0

) ( ) , (x y dF x

Trang 32

Tơng tự, đối thủ 2 có thể ngăn cản đối thủ 1 bằng cách đa ra giá trịkhông lớn hơn

v2 = minG maxF E(F, G)

Chúng ta giả sử rằng cả v1 và v2 đều tồn tại

 v1 = maxF

G

minE(F, G) ≤ minG maxF E(F, G) = v2

2.3 Các trò chơi liên tục

G F

F G

tồn tại và bằng nhau.

Một trò chơi vô hạn với một hàm liên tục đợc gọi là trò chơi liên tục.Khi v1 = v2, thì giá trị chung v = v1 = v2 đợc gọi là giá trị của trò chơi.Khi đó tồn tại các chiến thuật tối u F*(x), G*(y) sao cho

E(F, G*) ≤ E(F*, G*) ≤ E(F*, G)

với mọi hàm phân phối F và G

(F*,G*) đợc gọi là một điểm yên ngựa của E(F, G) hay là một điểm yênngựa của trò chơi liên tục Đây cũng đợc gọi là một giải pháp của trò chơi

2.4 Các tính chất của các chiến thuật tối u.

( ) (

dG y g

y

G    

Định lý này đa ra giá trị nhỏ nhất (lớn nhất) của một hàm liên tục với cácchiến thuật hỗn hợp cụ thể là bằng nhau đối với giá trị nhỏ nhất (lớn nhất)của hàm đó

( ) (

x

Chúng ta có

Trang 33

      

1

0 1 0 1

0

) ( ) , ( max )

( ) ( ) , (

* ) , ( max )

( ) ( ) , ( max

F F

=   

1

0 1

* ) , ( min )

( ) ( ) , ( min

G G

F

=  

1

0 1

Trang 34

(1) Điều kiện cần và đủ cho hàm phân phối F*(x) đối với một chiến thuật tối u của đối thủ 1 là:

v ≤

1

0

) (

* ) ,

* ) ,

* ) ,

* ) ,

P , 0 ≤ y ≤ 1.(2.3)

Cho (F0, G0) là một điểm yên ngựa của trò chơi, tức là

E(F, G0) ≤ E(F0, G0) ≤ E(F0,G)(2.4)

với mọi hàm phân phối F và G

Chúng ta cần chứng minh (F*, G0) là một điểm yên ngựa của trò chơi.Tích phân hai vế của (2.3) với mối quan hệ của hàm phân phối G(y)

Trong trờng hợp đặc biệt

(2.6)

Từ (2.4)  E(F*, G0) ≤ E(F0, G0) = v (2.7)

Từ (2.6) và (2.7)  E(F*, G0) = E(F0, G0) = v (2.8)Kết hợp (2.4), (2.8) và (2.5) chúng ta có

E(F, G0) ≤ E(F*, G0) ≤ E(F*, G)

Vậy chúng ta đã chứng minh đợc (F*, G0) là một điểm yên ngựa của tròchơi Khi đó F*(x) là một chiến thuật tối u của đối thủ 1

Ngày đăng: 15/12/2015, 11:16

HÌNH ẢNH LIÊN QUAN

Đồ thị cũng chỉ ra rằng chiến thuật tối u của đối thủ 2 không chứa chiến thuật thuần tuý 2 - Một số vấn đề về lý thuyết trò chơi
th ị cũng chỉ ra rằng chiến thuật tối u của đối thủ 2 không chứa chiến thuật thuần tuý 2 (Trang 22)
Nh vậy, các điểm (E 1 , E 2 ) thoả mãn (3.28), (3.29) và (3.30) hình thành một miền đó là miền tô đen V trong Hình 3.2 - Một số vấn đề về lý thuyết trò chơi
h vậy, các điểm (E 1 , E 2 ) thoả mãn (3.28), (3.29) và (3.30) hình thành một miền đó là miền tô đen V trong Hình 3.2 (Trang 47)
Bảng thể hiện các mối tơng quan của các chơng - Một số vấn đề về lý thuyết trò chơi
Bảng th ể hiện các mối tơng quan của các chơng (Trang 66)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w