1. Trang chủ
  2. » Thể loại khác

Lí thuyết trò chơi

23 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Lí thuyết trò chơi
Trường học Học viện Công nghệ Bách Khoa Hà Nội
Chuyên ngành Kinh tế học
Thể loại Giáo trình
Năm xuất bản 2023
Thành phố Hà Nội
Định dạng
Số trang 23
Dung lượng 505,99 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

“Ngay từ 1838, với tác phẩm Recherches sur les principes mathématiques de la théorie des richesses, lí thuy ết kinh t ế có đư ợc … một khái niệm cân bằng, khái niệm này không gì khác hơn

Trang 1

“Ngay từ 1838, với tác phẩm Recherches sur les principes mathématiques

de la théorie des richesses, lí thuy ết kinh t ế có đư ợc … một khái niệm cân bằng, khái niệm này không gì khác hơn là vi ệc áp dụng vào một trư ờng hợp đặc biệt lời giải của một trò chơi không hợp tác mà sau này được Nash hình thức hoá -và cũng có một công c ụ để xác định sự tồn tại của cân bằng

và tính toán những trạng thái thực hiện cân bằng này: hàm ph ản ứng”

Nhận định trên c ủa Dos Santos Ferreira (1991) b ộc lộ và biện minh cho tính chất gần như là m ột tiên đề của cách các nhà kinh t ế đánh giá tác ph ẩm của Cournot như là đi ểm xuất phát c ủa lí thuy ết trò chơi Hợp thành b ởi toàn bộ những phương pháp toán h ọc thích hợp cho vi ệc nghiên cứu việc ra

Trang 2

quyết định của những tác nhân duy lí và thông minh đ ứng trước một tình thế có sự tương h ỗ lẫn nhau, lí thuyết này có hai mảng: những trò chơi hợp tác và những trò chơi không h ợp tác Trong trư ờng hợp đầu những đấu thủ

có thể kí kết những thoả thuận và/hoặc hứa hẹn và/hoặc đe do ạ có hiệu lực, những dữ liệu cơ bản là các nhóm và những vấn đề được tìm hi ểu là sự hình thành những liên minh và vi ệc phân chia những thu hoạch Trong trường hợp thứ hai, những đấu thủ không thể lấy những cam kết có tính ràng buộc trước khi hành đ ộng và đi ều được nhấn mạnh là chi ến lư ợc của

họ Minh ho ạ cho sự phân biệt trên mà tác gi ả là Nash (1951), ngư ời đã đề nghị và gợi ý vư ợt qua sự phân biệt này b ằng cách trình bày l ại những trò chơi hợp tác dưới dạng những trò chơi không hợp tác (“chương trình

Nash”) Có thể kể một lịch sử nhỏ của lí thuyết trò chơi (Weintraub, 1992)

Augustin Cournot (1801 -1877)

Trang 3

Tất cả bắt đầu vào năm 1928 khi von Neumann ch ứng minh, cho các trò chơi không h ợp tác có hai đấu thủ và tổng bằng không và

với một số lớn chiến lược nhưng hữu hạn, định lí minimax (maximum

minimorum = minimorum maximorum ) Định lí này là “hòn đá t ảng”

(Auman, 1987) c ủa lí thuy ết trò chơi Rồi von Neumann và Morgenstern (VNM) làm việc với nhau tại Princeton và k ết quả của sự hợp tác này là tác phẩm, công bố năm 1944, The Theory of Games and Economic Behavior Tiếp đó, bỏ qua những kết quả cơ bản thu đư ợc về những trò chơi hợp tác

có hai đấu thủ, các nhà kinh tế quan tâm đến những trò chơi hợp tác có n đấu thủ Khái niệm cái lõi của nền kinh tế, kết quả của những nghiên cứu này bắt nguồn từ tác phẩm của Edgeworth, Mathematical Psychics xuất bản năm 1881, nổi lên vào cuối những năm 1950 như một khái niệm lời giải cho những vấn đề kinh t ế và cho phép, thông qua nh ững định lí tương

đương, củng cố lí thuyết cân bằng chung Sau đó, những vấn đề do thông tin không đối xứng đặt ra phục hồi lại tất cả tầm quan trọng ngày nay được dành cho cân b ằng Nash (1951) Dưới ánh sáng của những bài tổng hợp của Aumann (1987), Dimand và Dimand (1996), Schmidt (1990, 1995) và

Weintraub (1992) cũng như những tuyển tập do Dimand và Dimand (1997)

và Rubinstein (1990) t ập hợp, có thể tu chỉnh vài đi ểm bản phác th ảo lịch

sử trên

Trang 4

Dos Santos Ferreira

Về những nguồn gốc của lí thuyết trò chơi, dù không ph ải tìm ngược lên đến Thánh kinh (Brams, 1980) cần nói rõ là lời giải minimax đầu tiên với chiến lược hỗn hợp của một trò chơi (trò chơi bài tây có tên

là Le Her) có hai đ ấu thủ và tổng không là do Waldegrave tìm ra vào năm

1713 và những công t rình của Borel, xuất bản suốt những năm 1920, đ ịnh nghĩa một cách chặt chẽ khái niệm chiến lược hỗn hợp và bổ sung định lí Zermelo (có từ 1913 v ề trò chơi cờ vua và vận dụng những chi ến lư ợc

thuần tuý) vừa báo trư ớc những kết quả của von Neumann đư ợc Ville khái quát hoá Còn đối với thời kì được Weintraub (1992) nghiên cứu, cần nêu, một mặt, việc thực hiện “chương trình Nash” do lí thuy ết mặc cả cung cấp, trong đó cách tiếp cận tiên đề hoá (Nash, 1950) và cách tiếp cận chiến lược (Rubinstein, 1982) được kết hợp và, mặt khác, sự xuất hiện của một tính đối ngẫu mới – chuẩn tắc, thực chứng – do sự nở rộ, như một đối trọng của

Trang 5

những mô hình lí thuy ết, của những công trình c ủa kinh tế học thực nghiệm

về trò chơi Cu ối cùng v ề thời kì gần đây, ph ải kể đến giải Nobel về kinh tế học năm 1994 đư ợc đồng thời trao cho Harsanyi, Nash và Selten S ự kiện

này, đặc biệt được các tạp chí International Journal of Game

Theory và Games and Economic Behavior chào mừng, đã làm rõ ưu th ế

hiện nay của lí thuy ết trò chơi không h ợp tác lẫn sự nở rộ, trong lí thuy ết này, của ba ý tưởng (Gul, 1997): cân b ằng, tính đáng tin và thông tin

không đối xứng Những sách giáo khoa mới đây (có thể thấy một danh sách

có phân tích trong Binmore, 1992), sách cơ b ản (Gibbons, 1992) hay sách mũi nhọn (Fudenberg & Tirole, 1991, và bằng tiếng Pháp, Gremaq, 1988 và Demange & Ponsard, 1994) ph ản ảnh tình hình này Th ật vậy, ngoài hai

ngoại lệ đặc biệt là những sách c ủa Moulin, như Cooperative

Microeconomics, 1995 và ba t ập Handbook of Game Theory with Econo mic Applications do Aumann và Hart ch ủ biên trong những năm 1990, nh ững

tác phẩm trên có đ ặc điểm kép là bỏ qua lí thuy ết trò chơi hợp tác để dành chỗ cho lí thuyết trò chơi không h ợp tác và trình bày lí thuy ết này bằng cách chéo hai phân bi ệt cơ bản: động và tĩnh; thông tin đ ầy đủ và thông tin không đầy đủ Dàn trình bày điển hình này được dùng lại trong những phát triển dư ới đây mà mục đích là, không quay l ại những định nghĩa toán h ọc của những khái ni ệm chính v ề cân bằng nhưng ch ỉ ra, thông qua nh ững ví

dụ, bằng cách nào tìm ra nh ững cân b ằng này

Trang 6

Edgeworth (1845 -1926)

Trò chơi tĩnh

Xét hai sinh viên – Camille (C) và Dominique (D) – ngày mai sẽ thi môn lí

thuyết trò chơi Đ ể chuẩn bị ôn thi, c ả hai đều cần đến quyển Games and

Information của Ramusen mà thư vi ện chỉ có hai ấn bản: bản in l ần đầu

(R89) chỉ có thể tham kh ảo tại chỗ; bản in lần thứ hai (R94), đ ầy đủ hơn bản in lần thứ nhất, có thể mượn đư ợc về nhà Do đó, đêm trư ớc kì thi c ả hai sinh viên đều giáp mặt với một đối chọn: ôn thi t ại thư vi ện (B) hay mượn R94 (E) về ôn thi ở nhà Nếu C và D đều chọn B thì họ sẽ cùng sử dụng R89 và R94 và c ả hai đều ôn thi t ốt Nếu một trong hai ch ọn B và người kia chọn E thì người sử dụng một mình R94 sẽ làm bài thi tốt và người kia học trong R89 sẽ có một kết quả trung bình Cuối cùng nếu C và

D đều chọn E thì họ sẽ cãi nhau và bị đuổi ra khỏi thư viện C và D phải lấy quyết định đồng th ời Như thế trò chơi s ố 1 như vừa được xác định là

có thông tin đầy đủ nhưng không hoàn hảo vì mỗi đấu thủ biết tất cả những phần tử của cấu trúc c ủa trò chơi nhưng, vào lúc ra quy ết định, không biết người kia sẽ làm gì Do đó, ta có trò chơi dư ới dạng chiến lược và dưới dạng mở rộng:

Trang 7

Về mặt biểu đồ, dạng chiến lược có vẻ ngoài là m ột ma trận: C có những dòng, D có những cột và, trong mỗi ô, là chi trả (lợi ích VNM) c ủa C và D được lần lượt xác định Dạng mở rộng được biểu trưng bằng một cây mà mỗi mắt không cuối cùng đư ợc gán cho m ỗi đấu thủ cho biết là đ ối thủ phải lấy một quyết định ở giai đoạn này của trò chơi, và nh ững nhánh xuất phát

từ cùng một mắt là những hành đ ộng có thể của đối thủ mà mắt này đư ợc gán cho đấu thủ ấy Tập những mắt trong đó một đấu thủ không biết phân biệt mắt nào khi ph ải ra một quyết định vào m ột thời điểm của trò chơi, được lồng trong một viền tượng trưng cho tập thông tin của đấu thủ này Bằng trò chơi này (trò chơi “k ẻ nhát gan”), có th ể minh hoạ hai khái ni ệm

cơ bản về cân bằng: cân bằng Nash (1951) với chiến lược thuần tuý (được đánh dấu hoa thị * trong ma trận những thu hoạch) và với chiến lược hỗn hợp và cân bằng tương quan c ủa Aumann (1974) Cân b ằng đầu là một dạng

Trang 8

những chiến lược sao cho chiến lư ợc của mỗi đấu thủ là đáp tr ả tốt nhất cho những chiến lược đư ợc các đấu thủ khác ch ọn Cân b ằng thứ hai nằm trong sự tiếp nối của cân bằng Nash v ới chiến lư ợc hỗn hợp: trong cả hai trường hợp, hành động của mỗi đấu thủ tuỳ thuộc vào thông điệp mà Tự nhiên gởi cho mỗi đấu thủ nhưng, trong trư ờng hợp thứ nhất, những thông điệp là riêng tư và độc lập với nhau trong lúc trong trư ờng hợp thứ hai các thông điệp có tương quan với nhau Về khái niệm đầu, có thể phân biệt ba trường hợp được minh hoạ theo thứ tự bởi “thế lưỡng nan của người tù”,

“cặp đôi tiền bạc” và trò chơi “kẻ nhát gan” (Walisser, 1988) Trong trò chơi đầu (theo thứ tự, thứ hai) chỉ có duy nhất một cân bằng Nash với chiến lư ợc thuần tuý (theo th ứ tự, chiến lược hỗn hợp) Trong trư ờng hợp thứ ba, có hai cân b ằng Nash với chiến lược thuần tuý và một cân bằng Nash với chiến lược hỗn hợp Có một phương pháp sơ đ ẳng để tìm ra ba cân bằng này trong trò chơi s ố 1 Kí hi ệu bằng (q, 1 - q) chiến lược hỗn hợp theo đó D chơi B v ới xác suất q và bằng (p, 1 - p) chiến lược hỗn hợp theo đó C chơi B với xác suất p Nếu D chơi (q, 1 - q) thì những chi trả dự kiến của C là 3q + 1 (1 - q) = 2q + 1 n ếu C chơi B và 4q n ếu C chơi E Do

đó, nếu q > 1/2 thì đáp trả tốt nhất của C (MRC) là E (p = 0) Ngược lại, nếu q < 1/2 thì MRC là B (p = 1) Cu ối cùng n ếu q = 1/2 thì b ất kì giá trị nào của p cũng là một MRC Tương tự như vậy, nếu D chơi (p, 1 - p) thì những chi tr ả dự kiến của D là 2p + 1 nếu D chơi B và b ằng 4p n ếu D chơi

E Do đó nếu p > 1/2 thì đáp trả tốt nhất của D (MRD) là E (q = 0) Ngược lại, nếu p > 1/2 thì MRD là B (q = 1) Cu ối cùng n ếu p = 1/2 thì b ất kì giá trị nào của q cũng là m ột MRD (xem biểu đồ dưới đây)

Trang 9

MRC và MRD cắt nhau tại ba điểm: (p = 1/2, q = 1/2), (p = 0, q = 1), và (p

= 1 q = 0) Điểm đầu là cân bằng Nash với chiến lược hỗn hợp của trò chơi

số 1: mục đích mỗi đấu thủ nhắm đến thông qua vi ệc sử dụng những xổ số này là đặt mỗi đấu khủ khác vào một tình thế bàng quan trong đó đấu thủ

đó không có chiến lược nào được ưa thích trong số những chiến lược được đấu thủ này gán cho một xác suất không bằng không Hai điểm còn lại

tương ứng với hai cân bằng Nash với chiến lược thuần tuý: (E, B) và (B, E) Để nhanh chóng tìm ra hai cân bằng này, chỉ cần so sánh theo hàng và theo cột thể theo định nghĩa của cân bằng Nash và gạch bên trên nh ững chi trả tương ứng với những đáp trả tốt nhất Mọi dạng chiến lược nào gắn với một ô trong đó có hai chi tr ả được gạch trên là m ột cân bằng Nash v ới

chiến lư ợc thuần tuý Để giải thích sự trồi lên của một cân bằng như thế, có thể nêu bốn luận chứng cạnh tranh nhau: có liên l ạc trao đổi trư ớc, những

dự kiến tự hoàn thành, lí thuy ết mặc điểm và tập huấn (xem mục cân bằng Nash) Gi ải thích th ứ nhất đặt cơ sở cho khái ni ệm cân bằng tương quan Một cách nôm na, đ ịnh nghĩa m ột cân bằng tương quan qui l ại là tìm một

xổ số trên những kết cục của trò chơi sao cho m ỗi đấu thủ tối đa hoá l ợi ích của bản thân có tính đ ến những chỉ thị mình nhận được Kí hiệu bằng r1, r2,

Trang 10

r3, r4 những xác suất của (B, B), (B, E), (E, B), và (E, E) N ếu C đư ợc lệnh chơi B (theo thứ tự E) thì quyền lợi của C là tuân thủ nếu 3r1 + r2 ³

4r1 (theo thứ tự 4r3 + r 2 ³ 3r 3 + r4), nghĩa là r2 ³ r1 (theo thứ tự r3 ³ r4)

Tương tự như thế, nếu D nhận chỉ thị chơi B (hay E) thì quyền lợi của D là tuân thủ nếu r3 ³ r1 (theo thứ tự r 2 ³ r4) Do đó để cho (r1, r2, r3, r4) hợp thành một cân bằng tương quan thì r1 + r2 + r3 + r4 = 1 và Min (r2, r3) ³ Max (r1, r4) Điều này xác định một continuum những cân bằng tương quan trong đó ta thấy có ba cân bằng Nash được định nghĩa như trên, mọi tổ hợp lồi của những cân b ằng Nash với chiến lược thuần tuý và những cân b ằng tương quan khác, như (1/3, 1/3, 1/3, 0) Có th ể thu được cân bằng cuối này nhờ cơ chế phối hợp sau: một ngư ời thứ ba (A) ném m ột con súc sắc có sáu mặt; nếu mặt con súc sắc là 1 hay 2 thì A nói v ới C và D phải chơi B; nếu mặt con súc sắc là 3 hay 4 thì A nói v ới C (theo thứ tự D) phải chơi B

(theo thứ tự E); và nếu mặt con súc sắc là 5 hay 6 thì A nói v ới C (theo thứ

tự D) phải chơi E (theo thứ tự B) Thông điệp gởi cho mỗi đấu thủ không cho biết lệnh ra cho đấu thủ kia Nếu C và D đ ồng ý với nhau thực hiện cơ chế phối hợp này, thì tho ả thuận tự có hiệu lực: quyền lợi của mỗi đấu thủ

là tuân thủ những chỉ thị mình nhận đư ợc; làm như th ế mỗi đấu thủ sẽ nhận được một chi trả kì vọng bằng với 8/3 và do đó lớn hơn 2, vốn là chi trả kì vọng gắn với cân bằng Nash với chiến lược hỗn hợp Đặc điểm cơ b ản của cân bằng này là mỗi đấu thủ không bi ết chắc chắn lựa chọn của mỗi đấu thủ khác Sự không chắc chắn này sinh ra t ừ tính ít nhiều không đ ầy đủ của thông tin m ỗi đấu thủ có đư ợc

Trang 11

John Nash (1928 -2015)

Để nghiên cứu loại tình thế này, xét trò chơi số 2 Chris (C), một sinh viên nước ngoài, trình độ tiếng Pháp trung bình, phải chuẩn bị, giống như D, một bài trình bày v ề lí thuyết trò chơi Ho ặc là C khá (b) hoặc là yếu (m) tiếng Anh C bi ết chính xác kiểu của mình; ngư ợc lại D chỉ biết rằng có 90

% là C thuộc kiểu b (p = 0,9) Đ ối chọn C phải giáp m ặt là như sau: l ấy

trên kệ sách hoặc là từ điển tiếng Anh Harrap’s (A) hoặc là từ điển tiếng Pháp Le Petit Robert (F) Còn D, giống như trong trò chơi s ố 1, phải lựa

chọn giữa B hoặc E Trong m ọi trường hợp, phải học ở thư vi ện và càng chuẩn bị tốt nếu có được R94 M ột cách thứ yếu, C càng có hi ệu quả khi lựa từ điển có ích nhất đối với mình tu ỳ theo kiểu của bản thân D, có trình

độ tiếng Anh trung bình, có một cái nhìn lưỡng phân về tình hình: thích chuẩn bị ở thư viện với C nếu C thuộc kiểu b; trường hợp ngư ợc lại thích

tự chuẩn bị ở nhà một mình C và D ph ải lấy quyết định đồng thời Hai tình thế này, dưới dạng chi ến lư ợc, là như sau:

Trang 12

Nhờ Harsanyi (1967 -1968), có th ể biến đổi một trò chơi như th ế với thông tin không đầy đủ thành một trò chơi với thông tin không hoàn h ảo trong đó

Tự nhiên (N) đi trư ớc và chọn kiểu của C:

Trong biểu trưng dư ới dạng chiến lư ợc, mỗi chiến lược của C làm rõ lần lượt hành động của C là thuộc kiểu b và thuộc kiểu m: nếu C chơi, ví dụ,

FA thì có nghĩa là, nếu hành động của C là thuộc kiểu b thì chơi F và nếu

Trang 13

hành động của C là thu ộc kiểu m thì C chơi A Trong m ỗi ô, những thu hoạch lần lư ợt đư ợc ghi là những thu hoạch của C nếu C thuộc kiểu b, nếu

C thuộc kiểu m và D (có tính đ ến p) Bằng trò chơi này, ta có th ể minh hoạ cân bằng bayesian, tức là một cân bằng Na sh của trò chơi bayesian trong

đó mỗi đấu thủ ước tính thu hoạch của mình bằng kì vọng lợi ích bị điều kiện hoá bởi thông tin riêng c ủa mình Trong trư ờng hợp này, ở thế cân bằng, C chơi FA và D chơi B M ột cách tiên nghi ệm điều này là hiển nhiên

vì F và A là những chi ến lư ợc khống chế của C khi C thu ộc, theo th ứ tự, kiểu b và m Đương nhiên, n ếu p nhỏ hơn 0,5 thì D s ẽ chọn E Vấn đề trở thành ít tầm thư ờng hơn nếu ta cho C khả năng chơi trư ớc D

Trò chơi động

Để thấy điều này, trước hết xét trò chơi số 1’, trò chơi này là phiên bản động của trò chơi số 1 trong đó C đi trước:

Trang 14

Oscar Morgenstern (1902 -1977)

Bằng trò chơi này, v ốn là một trò chơi có thông tin không ch ỉ đầy đủ mà còn là hoàn hảo vì D khi ph ải ra một quyết định biết C đã làm những gì, có thể minh hoạ hai khái ni ệm cân bằng: cân bằng Nash động và cân bằng Nash động hoàn hảo (Selten, 1965) Khái niệm sau chỉ đơn giản khái quát hoá cân b ằng Nash Trong trò chơi s ố 1’, những so sánh theo dòng và theo cột làm nổi lên ba cân bằng loại này: (B, EE), (E, BB)* và (E, EB) Khi D chọn chiến lược EE (theo thứ tự BB) thì D quy ết định chơi E (theo th ứ tự B) bất luận quyết định của C là gì đi n ữa và khi D ch ọn EB thì D quy ết định chơi E (theo thứ tự B) nếu C chơi B (theo thứ tự E) Trong hai trường hợp đầu, D có l ời đe doạ nhưng sẽ không thực hiện đe doạ này nếu bị thách thức: quả thế, D không có quy ền lợi gì để chơi E (theo th ứ tự B) nếu C chơi E (theo thứ tự B) Trong trường hợp cuối, D là đáng tin vì nếu C chơi

B (hay theo thứ tự E), thì quyền lợi của D là ph ải chơi E (theo th ứ tự B) Ý tưởng này về tính đáng tin tạo cơ sở cho khái niệm cân bằng Nash động hoàn hảo (trong trò chơi con), khái ni ệm này là một dạng những chiến lược sao cho những hành động đư ợc những chiến lược này chủ trương h ợp thành một cân bằng Nash trong t ất cả những trò chơi con, m ột trò chơi con trong một trò chơi với thông tin hoàn h ảo, là m ọi cây trò chơi có đư ợc bằng cách lấy một mắt bất kì của cây ban đầu như đi ểm gốc Để tìm ra một cân bằng

Ngày đăng: 30/12/2022, 07:20

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w