1. Trang chủ
  2. » Giáo án - Bài giảng

Bài giảng lý thuyết trò chơ

99 10 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Lý Thuyết Trò Chơi
Tác giả Th.S Đào Văn Khiềm, Th.S Trần Văn Khiềm
Trường học Trường Đại Học Thủy Lợi
Chuyên ngành Kinh Tế
Thể loại Bài giảng
Năm xuất bản 2015
Thành phố Hà Nội
Định dạng
Số trang 99
Dung lượng 3,6 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Trong Trò chơi RNTT, một kết cục đơn của NewCleaner có thể là kết quả của một trong các các tổ hợp chiến lược sau: {Đặt giá cao nếu NewCleaner ra nhập, giá thấp nếu NewCleaner ở ngoài} {

Trang 1

TRƯỜNG ĐẠI HỌC THỦY LỢI

Trang 2

Bài giảng Lý thuyết trò chơi

-

-

Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL 1 MỤC LỤC Chương 1: CÁC QUY TẮC TRÕ CHƠI 5

1.1 ĐỊNH NGHĨA 5

Mô tả Trò chơi 5

Tính duy nhất 8

1.2 CÁC CHIẾN LƯỢC TRỘI CỦA BÀI TOÁN NỖI NAN GIẢI CỦA NGƯỜI TÙ 9

1.3 TRỘI LẶP: TRẬN CHIẾN TRÊN BIỂN BISMARCK 10

1.4 CÂN BẰNG NASH 11

Cuộc chiến Giới tính 12

1.5 CÁC ĐIỂM TRỌNG TÂM 13

Chương 2: THÔNG TIN 15

2.1 BẢNG CHIẾN LƯỢC VÀ DẠNG MỞ RỘNG CỦA MỘT TRÕ CHƠI 15

Bảng 2.1 Hợp tác có sắp hạng 15

2.2 TẬP THÔNG TIN 17

Hình 2.3 Tập thông tin và Bảng phân chia thông tin 18

2.3 THÔNG TIN KHÔNG HOÀN HẢO, TẤT ĐỊNH, ĐỐI XỨNG VÀ ĐẦY ĐỦ 19

Bảng 2.4 Bảng phân loại thông tin 19

Loại thông tin 19

2.4 BIẾN ĐỔI HARSANYI VÀ TRÕ CHƠI BAYER 21

Hình 2.6 Trò chơi HĐTNDĐIII nguyên thuỷ 22

Hình 2.7 HĐTNDĐIII sau biến đổi Harsanyi 23

Cập nhật niềm tin bằng quy tắc Bayer 23

Cập nhật niềm tin trong HĐTNDĐIII 24

Trò chơi dàn xếp Png 26

Trật tự chơi 26

Thanh toán 26

Chương 3 CÁC CHIẾN LƯỢC HỖN HỢP VÀ LIÊN TỤC 28

3.1 CHIẾN LƯỢC HỖN HỢP: TRÕ CHƠI PHÖC LỢI 28

Trò chơi Phúc lợi 28

Giải thích chiến lược hỗn hợp 29

3.2 MỘT SỐ TRÕ CHƠI ỨNG DỤNG 29

Trò chơi Gà con và Phương pháp cân bằng thanh toán 29

Chiến tranh Tiêu hao 30

Chiến lược tương quan 31

3.3 CHIẾN LƯỢC HỖN HỢP VỚI CÁC THAM SỐ TỔNG QUÁT VÀ TRÕ CHƠI N ĐỐI THỦ31 Phân loại Trò chơi với chiến lược hỗn hợp 32

3.4 NGẪU NHIÊN NGƯỢC VỚI HỖN HỢP: TRÕ CHƠI KIỂM TOÁN 33

3.5 CÁC CHIẾN LƯỢC LIÊN TỤC: TRÕ CHƠI COURNOT 34

Trật tự chơi 35

Chương 4: TRÕ CHƠI ĐỘNG VỚI THÔNG TIN ĐỐI XỨNG 38

4.1 HOÀN HẢO TIỂU TRÕ CHƠI 38

4.2 VÍ DỤ VỀ TÍNH HOÀN HẢO: NGĂN CẢN NHẬP NGÀNH I (NCNNI) 39

Có khi nào cần phải sử dụng cân bằng không hoàn hảo? 41

4.3 ĐE DỌA TIN CẬY, CHI PHÍ CHÌM, VÀ VẤN ĐỀ TẬP MỞ TRONG KIỆN TỤNG LẠM DỤNG 41

Kiện tụng Lạm dụng I: Tống tiền đơn giản 41

Trật tự chơi 41

Thanh toán 41

Kiện tụng Lạm dụng II: sử dụng chi phí chìm một cách chiến lược 42

Kiện tụng Lạm dụng II và vấn đề tập mở 43

Kiện tụng Lạm dụng III: Xúc cảm hận thù 43

4.4 TÁI HỢP TÁC TỚI CÂN BẰNG THỐNG TRỊ PARETO TRONG TIỂU TRÕ CHƠI 44

Chương 5: UY TÍN VÀ TRÕ CHƠI LẶP CÓ THÔNG TIN ĐỐI XỨNG 46

5.1 TRÕ CHƠI LẶP VÔ HẠN VÀ NGHỊCH LÝ CHUỖI CỬA HÀNG 46

Trang 3

Bài giảng Lý thuyết trò chơi

-

-

Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL 2 Nghịch lý Chuỗi cửa hàng 46

5.2 TRÕ CHƠI LẶP VÔ HẠN, TRỪNG PHẠT MINMAX, VÀ ĐỊNH LÝ DÂN GIAN 46

Chiến lược Grim 47

Tit-for-Tat 47

Maximin và Minimax 48

Cam kết trước 49

5.3 UY TÍN: NỖI NAN GIẢI CỦA NGƯỜI TÙ MỘT PHÍA 49

5.4 CHẤT LƯỢNG SẢN PHẨM TRONG MỘT TRÕ CHƠI LẶP VÔ HẠN 50

Chất lượng sản phẩm 50

Trật tự chơi 50

Thanh toán 51

5.5 CÂN BẰNG MARKOV VÀ CÁC THẾ HỆ GỐI TIẾP TRONG CHI PHÍ ĐỔI KHÁCH HÀNG52 Trật tự chơi 52

Thanh toán 52

5.6 CÂN BẰNG TIẾN HÓA: TRÕ CHƠI DIỀU HÂU- BỒ CÂU 53

Chương 6:TRÕ CHƠI ĐỘNG CÓ THÔNG TIN KHÔNG ĐẦY ĐỦ 56

6.1 CÂN BẰNG BAYER HOÀN HẢO: NGĂN CẢN NHẬP NGÀNH II VÀ III (NCNGII VÀ III)56 Ngăn cản Nhập ngành II: Chiến tranh không bao giờ có lợi 56

Hoàn hảo Bàn tay run 57

Cân bằng hoàn hảo Bayer và cân bằng chuỗi 57

Xét lại NCNNII 58

6.2 TINH LỌC CÂN BẰNG BAYER HOÀN HẢO: ĐĂNG KÝ BẢO VỆ LUẬN VĂN TIẾN SỸ58 NCNNIII: Chiến tranh đôi khi là có lợi 58

Cân bằng Chung Hợp lý cho Trò chơi NCNNIII 58

Cân bằng không hợp lý cho NCNNIII 59

6.3 TẦM QUAN TRỌNG CỦA VẤN ĐỀ HIỂU BIẾT CHUNG: NCNN IV VÀ V 59

Cân bằng cho NCNNIV 59

Cân bằng của NCNN V 60

6.4 THÔNG TIN KHÔNG HOÀN HẢO TRONG TRÕ CHƠI NNGCNT LẶP: MÔ HÌNH BÈ LŨ 4 TÊN 61

Mô hình Bè lũ 4 tên 61

6.5 VÕNG ĐUA AXELROD 62

6.6 TÍN DỤNG VÀ TUỔI ĐỜI CỦA CÔNG TY: MÔ HÌNH DIMOND 63

Chương 7: SUY ĐỒI ĐẠO ĐỨC: CÁC HÀNH ĐỘNG ẨN DẤU 65

7.1 PHÂN LOẠI MÔ HÌNH THÔNG TIN PHI ĐỐI XỨNG 65

Bảng 7.1 Ứng dụng của các mô hình Chủ sở hữu – Người làm công 67

7.2 MÔ HÌNH CHỦ SỞ HỮU-NGƯỜI LÀM CÔNG 67

Trò chơi Sản xuất 67

Trật tự chơi 67

Thanh toán 67

Trật tự chơi 70

TCSXIII: mức lương phẳng trong điều kiện bất định 71

TCSXV: Mức lương dựa trên sản lượng trong điều kiện bất định 72

7.3 CÁC RÀNG BUỘC TƯƠNG THÍCH ĐỘNG CƠ, THAM GIA VÀ CẠNH TRANH 72

7.4 HỢP ĐỒNG TỐI ƯU: TRÕ CHƠI BROADWAY 73

Trò chơi Broadway I 73

Trật tự chơi 73

Thanh toán 73

Bán cửa hàng 75

Chương 8: NHỮNG CHỦ ĐỀ TIẾP THEO CỦA SUY ĐỒI ĐẠO ĐỨC 77

8.1 LƯƠNG HIỆU QUẢ 77

Trò chơi Quản trị viên may mắn 77

Trật tự chơi 77

Thanh toán 77

8.2 CUỘC ĐẤU 78

Trang 4

Bài giảng Lý thuyết trò chơi

-

-

Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL 3 8.3 THỂ CHẾ VÀ BÀI TOÁN NGƯỜI LÀM CÔNG 79

Các cách thức làm giảm nhẹ vấn đề Người làm công 79

Thể chế Nhà nước và vấn đề Người làm công 80

Thể chế Tư nhân và vấn đề Người làm công 81

8.4 TÁI THƯƠNG LƯỢNG: TRÕ CHƠI LẤY LẠI(CHIẾM HỮU LẠI) 81

Trò chơi Lấy lại 81

Trật tự chơi 82

Thanh toán 82

8.5 SƠ ĐỒ KHÔNG GIAN TRẠNG THÁI: TRÕ CHƠI BẢO HIỂM I VÀ II 83

Hình 8.1 Trò chơi Bảo hiểm I 83

Trò chơi Bảo hiểm I: Mức cẩn thận có thể quan sát được 83

Trật tự chơi 83

Thanh toán 83

Trò chơi Bảo hiểm II: Mức cẩn thận không quan sát được 84

Trật tự chơi 84

Hình 8.2 Trò chơi Bảo hiểm II với Bảo hiểm toàn phần và một phần 85

8.6 SẢN XUẤT CHUNG BỞI NHIỀU NGƯỜI LÀM CÔNG: MÔ HÌNH TỔ ĐỘI CỦA HOLMSTROM 86

Tổ đội(Holmstrom, 1982) 86

Trật tự chơi 86

Thanh toán 86

Chương 9: LỰA CHỌN NGHỊCH 88

9.1 GIỚI THIỆU: TRÕ CHƠI SẢN XUẤT VI 88

Trò chơi Sản xuất VI: Lựa chọn nghịch 88

Trật tự chơi 88

Thanh toán 88

TCSXVIa: Lựa chọn nghịch, với những tham số đặc biệt 88

Trật tự chơi 88

Thanh toán 89

9.2 LỰA CHỌN NGHỊCH TRONG ĐIỀU KIỆN TẤT ĐỊNH: XE CŨ I VÀ II 90

Mô hình cơ bản của thị trường xe cũ 91

Trất tự chơi 91

Thanh toán 91

Thị trường Xe cũ I: Thị hiếu đồng nhất, hai kiểu Người bán 91

Mô hình Xe cũ II: Thị hiếu đồng nhất, Tập kiểu của Người bán là Trù mật 92

Hình 9.2 TTXCII: Thị hiếu đồng nhất 93

9.3 KHÔNG ĐỒNG NHẤT: XE CŨ III VÀ IV 93

TTXCIII: Người mua đánh giá xe cao hơn Người bán 93

TTXCIV: Những Người bán đánh giá khác nhau 94

Hình 9.4 TTXCIV: Những Người bán đánh giá xe khác nhau 94

Nhiều Người bán hơn Người mua 95

Người mua không đồng nhất: thừa cung 96

Ghét rủi ro 96

9.4 LỰA CHỌN NGHỊCH TRONG ĐIỀU KIỆN BẤT ĐỊNH: TRÕ CHƠI BẢO HIỂM III 96

Trò chơi Bảo hiểm III 97

Trật tự chơi 97

Thanh toán 97

Trang 5

Bài giảng Lý thuyết trò chơi

-

-

Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL

4

Trang 6

Bài giảng Lý thuyết trò chơi

1.1 ĐỊNH NGHĨA

Lý thuyết Trò chơi quan tâm tới các hành động của những người làm quyết định có ý thức

về việc các hành động của họ tác động lẫn nhau

Cách tốt nhất để hiểu các tình huống nào có thể được mô hình hóa như là trò chơi và những tình huống nào thì không thể là xem xét các ví dụ giống như sau:

1 Các thành viên OPEC lựa chọn sản lượng hàng năm của họ;

2 General Motors mua thép từ USX;

3 Hai nhà chế tạo, một sản xuất đai ốc (nut) và một sản xuất bu lông (bolt) quyết định xem sử dụng thước đo hoặc tiêu chuẩn Hoa kỳ;

4 Một ban giám đốc sắp đặt kế hoạch tùy chọn vốn cho một quan chức quản trị cao cấp;

5 Lực lượng Không quân Hoa kỳ thuê phi công máy bay phản lực chiến đấu;

6 Một công ty điện quyết định liệu có đặt hàng một hà máy năng lượng mới khi đã biết ước lượng cầu của nó đối với điện trong mười năm

Bốn ví dụ đầu là các trò chơi Trong (1), các thành viên OPEC đang chơi một trò chơi vì Saudi Arabia biến sản lượng dầu của Kuwait được dựa vào dự báo của Kuwait về sản lượng của Saudi, và sản lượng từ cả hai quyết định đều đóng vai trò quan trọng trong giá cả quốc tế Trong (2), một phần đáng kể của kinh doanh thép của Hoa kỳ là giữa General Motors và USX, các công

ty nhận thức được rằng các khối lượng kinh doanh bởi mỗi một trong số họ đều tác động tới giá

cả Một bên muốn giá thấp, còn bên kia muốn giá cao, do vậy đây là một trò chơi với xung đội giữa hai đối thủ Trong (3), các nhà chế tạo đai ốc và bu lông không xung đột với nhau, nhưng các hành động của một bên tác động tới các hành động mong đợi của bên kia, do vậy tình huống tuy nhiên là một trò chơi Trong (4) ban giám đốc lựa chọn một kế hoạch tùy chọn vốn khi dự báo tác động lên các hành động của CEO

Lý thuyết trò chơi là không thích hợp cho việc mô hình hóa hai ví dụ cuối Trong (5), mỗi

cá nhân phi công tác động đến Lực lượng Không quân Hoa kỳ một cách không đáng kể, và mỗi công nhân đưa ra quyết định làm thuê không quan tâm tới tác động lên các chính sách của Lực lượng Không quân Trong (6), công ty điện đối mặt với một quyết định phức tạp, nhưng, điều đó không ảnh hưởng tới tác nhân hợp lý khác Các tình huống này là thích hợp hơn cho việc sử dụng

lý thuyết quyết định hơn là lý thuyết trò chơi

Lý thuyết trò chơi như được trình bày trong tài liệu này là một công cụ mô hình hóa, chứ không phải một hệ thống tiên đề

Mô tả Trò chơi

Các khái niệm cơ bản: Đối thủ, hành động, thanh toán và thông tin (viết tắt là PAPI _ player, actions, payoffs, và information), và chúng được gọi là quy tắc của Trò chơi Để tối đa thanh toán (lợi ích) của mình, các đối thủ thiết lập ra kế hoạch, hay chiến lược để chọn ra các

hành động phụ thuộc vào thông tin mà họ có được tại từng thời điểm Tổ hợp các chiến lược của

từng đối thủ được họ lựa chọn gọi là cân bằng (equilibrium) Dựa vào cân bằng, các nhà nghiên cứu có thể xác định được các hành động cụ thể của mỗi đối thủ và từ đó chỉ ra được các kết cục

của các Trò chơi

Trang 7

Bài giảng Lý thuyết trò chơi

Đối thủ: là các cá nhân làm quyết định Mục tiêu của mỗi đối thủ là tối đa lợi ích của mình

bằng việc lựa chọn các hành động Trong trường hợp ví dụ, NewCleaner và OldCleaner là các

đối thủ của Trò chơi

Đôi khi cần phải sử dụng khái niệm Giả-đối thủ (pseudo-player), khi mà các hành động được thực hiện một cách thuần tuý cơ khí

Tự nhiên là một giả-đối thủ khi mà các hành động ngẫu nhiên được tiến hành tại mỗi thời

điểm cụ thể trong Trò chơi với một xác suất riêng biệt Ví dụ như quá trình suy thoái kinh tế xảy

ra tại từng thời điểm cụ thể của Trò chơi Ra nhập thị trường với một xác suất giả dụ là 0.3 có suy thoái và 0.7 không suy thoái

Hành động hay Bước đi của đối thủ thứ i, ký hiệu là ai làm một lựa chọn mà đối thủ này

có thể thực hiện

Tập hành động của đối thủ i, Ai = {a i } là tập các hành động có thể có của anh ta

Tổ hợp các hành động là một tập có trật tự a = {a i }, i = 1, …, n trong đó a i là hành động của đối thủ thứ i

Ví dụ trong Trò chơi RNTT, NewCleaner có tập hành động là {Ra nhập, ở ngoài}, còn tập hành động của OldCleaner là {Giá thấp, Giá cao} hay đơn giản là {Thấp, Cao}

Thanh toán của đối thủ thứ i, i (s 1 , …, s n ):

(1) là lợi ích mà đối thủ thứ i nhận được sau khi tất cả các đối thủ và Tự nhiên đã lựa chọn các chiến lược của họ và Trò chơi đã kết thúc; hoặc

(2) là lợi ích dự kiến mà đối thủ đó nhận được như một hàm số của các chiến lược được anh ta và các đối thủ khác lựa chọn

Trò chơi RNTT được tóm tắt trong Bảng 1.1 dưới đây

Một cách thuận tiện là mô tả cả thông tin lẫn hành động đồng thời trong một trật tự chơi Sau đây sẽ là trật tự chơi của Trò chơi nói trên:

1 NewCleaner lựa chọn một trong các quyết định {Ra nhập, ở ngoài}

2 OldCleaner chọn mức giá từ {Thấp, Cao}

Trang 8

Bài giảng Lý thuyết trò chơi

Kết cục của một Trò chơi là tập hợp các phần tử cần quan tâm mà những nhà nghiên cứu

chọn ra từ các giá trị của hành động, thanh toán, và các biến số khác sau khi Trò chơi đã kết thúc Các kết cục của Trò chơi RNTT được thể hiện qua cây quyết định sau:

Hình 1 1 Bài toán Ra nhập ngành dưới dạng cây quyết định

Hình 1.2 Bài toán Ra nhập ngành dưới dạng cây Trò chơi

Vì Lý thuyết Trò chơi xem xét các tình huống khi quyết định của một đối thủ luôn phụ

thuộc vào quyết định của các đối thủ khác, do vậy cần phải xét đến chiến lược, tức là kế hoạch

của các đối thủ

Chiến lược s i của đối thủ i là một quy tắc nói cho anh ta biết cần chọn hành động nào tại mỗi thời điểm của Trò chơi khi tập thông tin được coi là đã cho

Trang 9

Bài giảng Lý thuyết trò chơi

High Price if NewCleaner Entered, Low Price if NewCleaner Stayed Out

Low Price if NewCleaner Entered, High Price if NewCleaner Stayed Out

High Price No Matter What

Low Price No Matter What

Cân bằng

Lưu ý tập chiến lược là tập hợp của các chiến lược, còn tập kết cục là tập của các biến bất

kỳ được coi là đáng quan tâm Thông thường nhiều tổ hợp chiến lược khác nhau cùng dẫn đến cùng một kết cục Trong Trò chơi RNTT, một kết cục đơn của NewCleaner có thể là kết quả của một trong các các tổ hợp chiến lược sau:

{Đặt giá cao nếu NewCleaner ra nhập, giá thấp nếu NewCleaner ở ngoài}

{Đặt giá thấp nếu NewCleaner ra nhập, giá cao nếu NewCleaner ở ngoài}

Để dự báo được điều gì sẽ xảy ra chúng ta cần chọn lựa một hoặc nhiều tổ hợp chiến lược thể hiện hành vi hợp lý nhất của các đối thủ khi họ hành động để tối đa lợi ích của mình

Một cân bằng là một tổ hợp chiến lược bao gồm những chiến lược tốt nhất của mỗi đối thủ

trong Trò chơi

1, , n

mỗi đối thủ trong số n đối thủ trong trò chơi

Chiến lược cân bằng là các chiến lược mà các đối thủ chọn ra khi cố gắng tối đa các thanh

toán cá nhân của họ Trong lý thuyết trò chơi, cân bằng được sử dụng khác với trong các lĩnh vực kinh tế khác Ví dụ, trong mô hình cân bằng tổng quát, cân bằng là tập giá cả tạo thành từ hành vi

tối ưu của các cá nhân trong nền kinh tế Trong lý thuyết trò chơi, tập giá sẽ là kết cục cân bằng,

nhưng tự thân cân bằng sẽ là một tóm tắt chiến lược _ các quy tắc của cá nhân để mua hoặc bán _ tạo ra kết cục

Khái niệm cân bằng hoặc khái niệm lời giải   *

: , , n, , , n

tắc xác định một cân bằng dựa trên các tóm tắt chiến lược có thể và các hàm thanh toán

Chúng ta một cách ẩn ý đã sử dụng một khái niệm cân bằng trong phân tích trên, là quy tắc lựa chọn một chiến lược cho mỗi một trong số hai đối thủ như dự báo của chúng ta về trò chơi Nói chung người ta chỉ chấp nhận một vài khái niệm cân bằng, và những mục còn lại của chương này được giành cho việc tìm kiếm cân bằng sử dụng hai khái niệm nổi tiếng nhất trong số chúng:

chiến lược thống trị và cân bằng Nash

Khái niệm cân bằng sẽ được làm rõ hơn trong các phần sau của chương này

Tính duy nhất

Mô hình có thể không có cân bằng hoặc có nhiều cân bằng Trong trường hợp không có cân bằng, nhà nghiên cứu không thể dự đoán được mô hình, nhưng trong trường hợp ngược lại, nếu có quá nhiều cân bằng thì nhà nghiên cứu cũng không thể xác định chính xác kết cục của mô

Trang 10

Bài giảng Lý thuyết trò chơi

-

-

Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL

9

hình Do vậy, tính duy nhất của nghiệm của bài toán là rất quan trọng

1.2 CÁC CHIẾN LƯỢC TRỘI CỦA BÀI TOÁN NỖI NAN GIẢI CỦA NGƯỜI TÙ

a) Định nghĩa:

Đối với một véc tơ bất kỳ yy1, ,y n, ký hiệu yi là y1, ,y i1,y i1, ,y n, là một phần của y không gắn với đối thủ i

Sử dụng ký hiệu này, ví dụ, sSmith là tóm tắt chiến lược của mỗi đối thủ ngoại trừ đối thủ

Smith Tóm tắt này là đặc biệt lý thú cho Smith, vì anh ta sử dụng nó để giúp cho việc lựa chọn

chiến lược riêng của anh ta, và ký hiệu mới sau đây sẽ giúp cho xác định phản ứng tốt nhất của anh ta

Phản ứng tốt nhất của đối thủ i hoặc đáp trả tốt nhất cho các chiến lược si được chọn bởi các đối thủ khác là chiến lược *

Một khái niệm cân bằng quan trọng đầu tiên là cân bằng chiến lược trội (dominance) (hoặc

chiến lược thống trị) được phát biểu như sau:

i

nào đó bất kể các đối thủ khác lựa chọn các chiến lược nào, theo nghĩa bất kể chiến lược nào mà

i

i

s là bị thống trị nếu tồn tại một '

s là một chiến lược thống trị nếu chiến lược đó là một phản ứng tốt nhất

ngặt của đối thủ so với bất kỳ chiến lược nào mà các đối thủ khác có thể chọn, theo nghĩa bất kể

Ví dụ: Nỗi nan giải của người tù

Để minh hoạ cho khái niệm cân bằng chiến lược trội, chúng ta xét bài toán Nỗi nan giải của người tù (NNGCNT) được mô tả trong Bảng 1.2 sau đây:

Phân tích cân bằng bằng khái niệm cân bằng chiến lược trội cho thấy lời giải cân bằng đạt được tại (-8, -8)

Bảng 2: Nỗi nan giải của người tù

Trang 11

Bài giảng Lý thuyết trò chơi

Trò chơi hợp tác là một trò chơi trong đó các đối thủ có thể đưa ra các cam kết trói buộc,

như là đối chọi với trò chơi bất-hợp tác, trong đó họ không thể cam kết

Phân biệt giữa các trò chơi hợp tác và bất-hợp tác có mâu thuẫn hoặc không mâu thuẫn, như sẽ được chỉ ra trong các ví dụ sau đây về các tình huống thường được mô hình hóa theo cách này hay cách khác:

Trò chơi hợp tác không mâu thuẫn Các thành viên của lực lượng lao động lựa chọn cần phải tiến

hành các nhiệm vụ khó khăn như nau để phối hợp mọt cách tốt nhất với nhau

Trò chơi hợp tác có mâu thuẫn Mặc cả về giá cả giữa một nhà độc quyền và một độc quyền

mua

Trò chơi bất-hợp tác có mâu thuẫn Nỗi nan giải của người tù

Trò chơi bất-hợp tác không mâu thuẫn Hai công ty đặt ra chuẩn mực sản phẩm mà không có

thông tin liên lạc

1.3 TRỘI LẶP: TRẬN CHIẾN TRÊN BIỂN BISMARCK

Rất ít Trò chơi có cân bằng chiến lược thống trị, nhưng đôi khi khái niệm này vẫn tỏ ra hữu ích mặc dù nó không phải là một cân bằng chiến lược thống trị chính xác theo nghĩa của của nó Điều này được minh hoạ trong mô hình sau:

Chúng ta thấy Trò chơi này không có chiến lược thống trị đúng theo nghĩa của khái niệm này vì đối thủ Imamura không có phương án thống trị thực sự Nhưng chúng ta vẫn có thể giải bài toán này được nhờ sử dụng khái niệm thống trị yếu (hay thống trị yếu)

Chiến lược s’ i được gọi là bị thống trị yếu nếu tồn tại một chiến lược s* i khác nào đó của đối thủ i sao cho nó có thể là tốt hơn và không bao giờ là xấu hơn, tức là chiến lược đó sẽ mang lại cho anh ta một thanh toán cao hơn và không bao giờ mang lại một thanh toán xấu hơn Về mặt toán học, s’ i là bị thống trị yếu (bị thống trị yếu) nếu tồn tại s” i sao cho:

Vậy, cân bằng chiến lược thống trị yếu là sơ đồ chiến lược có được bằng cách xoá bỏ tất

cả các chiến lược bị thống trị yếu của mỗi đối thủ Từ đó chúng ta có khái niệm sau:

Một cân bằng chiến lược lặp là một tổ hợp chiến lược nhận được bằng cách xoá chiến

lược bị thống trị yếu từ tập chiến lược một trong các đối thủ, sau đó tính toán lại xem có xuất hiện chiến lược bị thống trị yếu nào nữa không, sau đó tiếp tục loại bỏ nó nếu có và cứ

Trang 12

Bài giảng Lý thuyết trò chơi

-

-

Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL

11

tiếp tục quá trình này cho đến khi mỗi đối thủ còn lại một chiến lược

Áp dụng cho ví dụ trên ta có cân bằng thống trị lặp là (North, North) và đó là điều đã xảy

ra vào năm 1943

Trò chơi có tổng bằng không là một Trò chơi trong đó tổng số các thanh toán của tất cả

các đối thủ luôn bằng không bất kể họ chọn chiến lược nào Trò chơi không phải là Trò chơi có

tổng bằng không là Trò chơi có tổng khác không Đây là một lớp bài toán rất đặc biệt trong Lý

thuyết Trò chơi nhưng chúng không phải là phổ biến trong các bài toán kinh tế

Nhấn và tấm ván và Chờ máng thức ăn tại đầu kia

Boxed Pigs không có cân bằng chiến lược thống trị, vì cái mà con lợn to chọn phụ thuộc vào cái mà nó nghĩ con lợn con sẽ chọn Nếu nó tìn rằng con lợn con sẽ nhấn vào tấm ván, lợn to

sẽ đợi ở máng, nhưng nếu nó tin lợn con sẽ đợi, lợn to sẽ nhấn tấm ván Ở đây tồn tại một cân

bằng thống trị lặp, (Nhấn, Đợi), nhưng chúng ta sẽ sử dụng cách lý luận khác để xét đoán kết cục: cân bằng Nash

chiến lược của anh ta khi đã biết các đối thủ khác không rời bỏ Về mặt hình thức,

Tóm tắt chiến lược (Nhấn, Đợi) là một cân bằng Nash Cách thức để tiếp cận cân bằng

Nash là đề nghị một tóm tắt chiến lược và kiểm tra xem liệu chiến lược của mỗi đối thủ có là

phản ứng tốt nhất cho các chiến lược của những người khác hay không Nếu lợn to chọn Nhấn, lợn nhỏ sẽ muốn chờ Nếu lợn nhỏ chọn Chờ, lợn lớn sẽ muốn nhấn Điều này khẳng định (Nhấn, Chờ) là cân bằng Nash, và trên thực tế đó là cân bằng Nash duy nhất

Trang 13

Bài giảng Lý thuyết trò chơi

Mọi cân bằng chiến lược thống trị là một cân bằng Nash, nhưng không phải mỗi cân bằng Nash là một cân bằng chiến lược thống trị Nếu một chiến lược là thống trị nó là một phản ứng

tốt nhất cho bất kỳ chiến lược nào mà các đối thủ khác chọn, kể cả các chiến lược cân bằng của

họ Nếu một chiến lược là một bộ phận của cân bằng Nash, nó chỉ cần là phản ứng tốt nhất cho

các chiến lược cân bằng của các đối thủ khác

Xét mô hình Nỗi nan giải của người tù (NNGCNT) với một đôi chút biến đổi như được thể hiện trong Bảng 1.7’ dưới đây Trong trường hợp này Trò chơi không có cân bằng thống trị, nhưng có cân bằng thống trị lặp là (Confess, Confess) Còn nếu xét theo quan điểm cân bằng Nash thì Trò chơi này có 2 cân bằng Nash, trong đó có một cân bằng Nash thực sự và một cân bằng Nash yếu

Trong trường hợp có quá nhiều cân bằng cần phải có các điều kiện để tinh lọc Ví dụ như trong Trò chơi trên, nếu bổ sung thêm điều kiện tối ưu Pareto thì ta có thể loại trừ bớt một cân bằng (Confess, Confess) ra khỏi các lời giải của bài toán

Cuộc chiến Giới tính

Xét một ví dụ một Trò chơi giữa một người đàn ông và một người đàn bà, khi mà người đàn ông thích đi xem box còn người phụ nữ lại thích đi xem ballet Mặc dù ích kỷ nhưng họ rất yêu nhau nên sẵn sàng hy sinh ưa thích của mình để chiều sở thích của người kia Trò chơi này được biểu hiện trong Bảng 1.7 dưới đây:

Trò chơi này không có cân bằng thống trị lặp nhưng có 2 cân bằng Nash là (Prize Fight, Prize Fight) và (Ballet, Ballet)

Trang 14

Bài giảng Lý thuyết trò chơi

-

-

Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL

13

Trong Trò chơi này, nếu có người đi trước thì kết quả có thể bị ảnh hưởng nhiều, ví dụ

người đàn ông có thể mua vé xem box trước Điều này có tên gọi là Lợi thế của người đi trước

Trò chơi Hợp tác

Đôi khi có thể sử dụng mức thanh toán để để lựa chọn giữa các cân bằng Nash Trong Trò chơi dưới đây, Smith và Jones cố gắng quyết định xem nên thiết kế loại máy tính có ổ đĩa mềm lớn hay nhỏ Tình huống của Trò chơi này được biểu hiện trong Bảng 1.8 dưới đây:

Trò chơi này có 2 cân bằng Nash là (Large, Large) và (Small, Small), trong đó cân bằng thứ nhất đạt hiệu quả Pareto, còn cân bằng kia thì không

1.5 CÁC ĐIỂM TRỌNG TÂM

Như chúng ta đã thấy việc có quá nhiều cân bằng sẽ gây khó khăn cho việc dự báo kết quả,

Trang 15

Bài giảng Lý thuyết trò chơi

1 Hãy khoanh tròn một trong những con số sau: 100, 14, 15, 16, 17, 18

2 Hãy khoanh tròn một trong những con số sau: 7, 100, 13, 261, 99, 666

3 Hãy đặt tên Đầu hay Cuối

4 Hãy đặt tên Cuối hay Đầu

5 Bạn hãy chia chiếc bánh và sẽ không nhận được gì nếu phần của bạn là 100%

6 Bạn đang cần gặp một người bạn nào đó ở Hà nội Bao giờ? ở đâu?

Tất cả các Trò chơi ở trên đều có rất nhiều cân bằng Nash và việc lựa chọn cân bằng nào liên quan nhiều đến vấn đề tâm lý Xác định một cách hình thức cân bằng nào là điểm trọng tâm

là một công việc rất khó khăn và tuỳ thuộc vào hoàn cảnh Trong ví dụ (1) 100 là điểm trọng tâm

vì nó khác biệt với những số còn lại (nó lớn nhất và xếp đầu tiên) Trong ví dụ (2) Schelling cho rằng 7 là điểm trọng tâm, nhưng Satanist lại cho 666 mới là điểm trọng tâm (3) và (4) là như nhau ngoại trừ trật tự sắp xếp nhưng nhiều khi trật tự sắp xếp lại ảnh hưởng rất nhiều đến kết quả Trong ví dụ (5) thông thường người ta chia theo tỷ lệ 50:50 nhưng nếu năm ngoái bạn đã từng chia theo tỷ lệ 60:40 thì năm nay bạn sẽ lại chia như vậy Trong ví dụ (6) Schelling thấy rất nhiều điểm lý thú, nhưng điều này còn phụ thuộc nhiều vào việc bạn biết nhiều về thành phố Hà nội hay không?

Biên giới là một loại điểm trọng tâm đặc biệt Ví dụ như hai quốc gia có cùng chung biên

giới, một hành động quân sự của một quốc gia nào đó gần đường biên giới sẽ là một dấu hiệu nguy hiểm cho quốc gia kia

Dàn xếp và Thông tin liên lạc đều rất quan trọng nếu không có những điểm trọng tâm rõ

ràng Nếu các bên được thông tin liên lạc với nhau thì họ sẽ có thể hợp tác với nhau như trong Trò chơi Hợp tác có sắp đặt để có được cân bằng hiệu quả Pareto Nếu họ không thể thông tin liên lạc với nhau thì người dàn xếp có thể đứng ra hoà giải, dàn xếp cân bằng giữa họ, và cân bằng bị ảnh hưởng bởi các yếu tố bên ngoài

Một trong những điểm bất lợi trong những điểm trọng tâm là nó gây ra tình trạng không linh hoạt Ví dụ khi Trò chơi được lặp đi lặp lại và các giá trị thanh toán dần thay đổi, khi đó cân bằng cần thiết cũng thay đổi theo, nhưng điểm trọng tâm sẽ khó thay đổi một cách linh hoạt khi điều kiện thay đổi

Trang 16

Bài giảng Lý thuyết trò chơi

-

-

Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL

15

Chương 2: THÔNG TIN

2.1 BẢNG CHIẾN LƯỢC VÀ DẠNG MỞ RỘNG CỦA MỘT TRÕ CHƠI

Trong Chương 1 chúng ta đã xem xét bài toán Hợp tác có sắp hạng, được thể hiện lại trong Bảng 2.1 sau đây:

Bảng 2.1 Hợp tác có sắp hạng

Định nghĩa

Bảng chiến lược (hay Bảng chuẩn) bao gồm:

(1) Tất cả các sơ đồ chiến lược có thể s 1 , …, s p

(2) Các hàm số thanh toán gắn si với n-vector thanh toán i , i = 1, …, p

Hay viết ngắn gọn hơn là:

HĐTNDĐI cho thấy chỉ cần một chút thay đổi sẽ làm bảng chiến lược bị thay đổi rất phức tạp Bảng 2.2 sẽ cho chúng ta thấy bảng chiến lược của Trò chơi HĐTNDĐI này:

Trang 17

Bài giảng Lý thuyết trò chơi

Thông thường bảng chiến lược là quá phức tạp để mô tả một Trò chơi, do vậy ngoài bảng

chiến lược người ta còn hay sử dụng dạng mở rộng và cây chiến lược để mô tả một Trò chơi

- Nút trước nút X là một nút phải đạt đến trước khi đạt đến nút X

- Nút đầu là một nút không có nút trước

- Nút cuối hoặc điểm kết thúc là một nút không có nút tiếp theo

- Cành là một hành động trong tập hành động của đối thủ tại một nút cụ thể

- Đường đi là một chuỗi các nút và cành bắt đầu từ nút đầu tới nút cuối

Những khái niệm này có thể được sử dụng để định nghĩa một dạng mở rộng và một cây trò chơi

Dạng mở rộng là một mô tả của Trò chơi bao gồm:

(1) Cấu hình của các nút và cành không có vòng lặp từ nút đầu đến các nút cuối

(2) Một chỉ dẫn nút nào thuộc về đối thủ nào

(3) Các giá trị xác suất mà Tự nhiên sử dụng để chọn lựa các cành tại các nút của nó (4) Tập thông tin mà tại đó các nút của mỗi đối thủ được phân chia

(5) Thanh toán cho mỗi đối thủ tại mỗi nút cuối

Trang 18

Bài giảng Lý thuyết trò chơi

-

-

Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL

17

Cây Trò chơi giống hệt như dạng mở rộng ngoại trừ (5) được thay bởi

(5') các kết cục tại mỗi nút cuối

Payoffs to: (Smith,Jones)

Hình 2.1: Đi theo người dẫn đầu I trong dạng mở rộng

Ví dụ về dạng mở rộng và cây trò chơi trong trường hợp của HĐTNDĐI được biểu diễn trong hình vẽ dưới đây: Hình 2.1

Trong Hình 2.2, chúng ta cho Smith đi trước nhưng không cho Jones biết gì về bước đi của Smith, do vậy Trò chơi vẫn được xem như Trò chơi đồng thời Mô tả của Trò chơi này được bổ sung thêm một đường chấm chấm để thể hiện thông tin của Jones vẫn giống như trường hợp hai đối thủ cùng tiến hành nước đi

Xem Hình vẽ 2.4 Smith tiến hành bước đi S1 vào năm 1984 và Jones tiến hành một trong các nước đi J1, J2, J3, J4 vào năm 1985 hoặc 1986 Smith biết rõ bước đi của mình, nhưng Jones chỉ có thể nói rằng Smith đã đi đến J1, J2 hoặc “chỗ khác”; anh ta không phân biệt được J3 với J4

S

J1 11 11 11 11 11 11

11 J2

S

J1 11 11 11 11 11 11

11 J2

Trang 19

Bài giảng Lý thuyết trò chơi

Hình 2.3 Tập thông tin và Bảng phân chia thông tin

Để mô tả tập thông tin trên biểu đồ, chúng ta cần vẽ một đường xung quanh các nút của cùng một tập thông tin Tuy nhiên, cần lưu ý, tại mỗi thời điểm trong Trò chơi luôn có nhiều tập thông tin của nhiều đối thủ khác nhau, nhưng để tránh rườm rà, lộn xộn, người ta thường chỉ biểu diễn tập thông tin của đối thủ nào tại bước đi của mình

Bảng phân chia thông tin là một bộ các tập thông tin sao cho:

(1) mỗi đường đi được thể hiện bởi một nút trong một tập thông tin đơn trong bảng phân cách, và

(2) các nút trước của tất cả các nút trong cùng một tập thông tin đơn nằm trong cùng một tập thông tin

Bảng phân chia thông tin thể hiện các vị trí khác nhau mà đối thủ biết anh ta có khả năng phân biệt tại một giai đoạn của Trò chơi bằng cách phân chia tập tất cả các nút có thể thành các tập con có tên là tập thông tin Một trong các bảng phân chia thông tin của Smith là {{J1}, {J2}, {J3}, {J4}} Tập thông tin này không thể bao gồm thêm tập thông tin {S1}, vì nếu vậy thì đường

đi qua S1 và J1 sẽ được biểu diễn bởi hai nút trong cùng một tập thông tin (trái với định nghĩa tập thông tin) Thay vào đó, {S1} nằm trong một bảng phân chia thông tin riêng biệt tạo thành bởi chính tập thông tin này Bảng phân chia thông tin chỉ phù hợp theo giai đoạn chứ không phụ thuộc vào thứ tự thời gian

Bảng phân chia thông tin {{J1}, {J2}, {J3, J4}}của Jones kém hơn bảng phân chia thông tin của Smith vì một trong hai lý do: hoặc số tập thông tin trong bảng phân chia thông tin của Jones

ít hơn số tập thông tin của Smith hoặc số phần tử trong một tập thông tin của Jones nhiều hơn số phần tử trong các tập thông tin của Smith Bảng 2.3 cho ta một số ví dụ về bảng phân chia thông tin

Bảng 2.3 Bảng phân chia thông tin

Trang 20

Bài giảng Lý thuyết trò chơi

Bảng phân chia thông tin (bpctt) I là bpctt của Smith, bpctt II là bpctt của Jones Chúng ta

nói bpctt II thô hơn và bpctt I tinh hơn Kết hợp hai hay nhiều tập thông tin vào một bpctt _ là

điều làm cho giảm số tập thông tin và tăng số các nút trong một hay nhiều tập thông tin của bpctt

_ sẽ làm cho bpctt này thô hơn Tách biệt một hoặc nhiều tập thông tin trong một bpctt _ là điều

làm tăng số các tập thông tin và làm giảm số các nút trong một hay nhiều tập thông tin _ sẽ làm

cho bpctt này tinh hơn Nếu ta làm tinh một bpctt đến cùng thì chúng ta sẽ nhận được một một bpctt bao gồm các tập thông tin đơn, tức là các tập thông tin chỉ bao gồm một nút, như bpctt I

Ngược lại, làm thô một bpctt đến cùng thì chúng ta sẽ nhận được một bpctt giống như bpctt II trong Bảng 2.3 nói trên, tức là khi đối thủ không thể phân biệt được bất cứ nút nào bằng quan sát trực tiếp

Chất lượng thông tin được xác định một cách độc lập với lợi ích của nó đối với các đối thủ:

có thể có khả năng xảy ra là thông tin của đối thủ được cải thiện nhưng hậu quả lại làm cho thanh toán của anh ta bị giảm đi

Hiểu biết chung

Chúng ta đã ngầm giả thiết các đối thủ biết hình dáng của cây trò chơi Và trên thực tế, chúng ta cũng đã giả thiết các đối thủ cũng biết các đối thủ khác biết hình dáng của cây trò chơi Khái niệm “hiểu biết chung” được sử dụng để tránh phải nhắc đi nhắc lại giả thiết có tính truy hồi sau:

Thông tin là hiểu biết chung nếu tất cả các đối thủ đều biết nó, nếu như mỗi đối thủ biết

rằng tất cả các đối thủ đều biết nó, nếu mỗi đối thủ đều biết rằng tất cả các đối thủ đều biết rằng tất cả các đối thủ biết nó, và …

2.3 THÔNG TIN KHÔNG HOÀN HẢO, TẤT ĐỊNH, ĐỐI XỨNG VÀ ĐẦY ĐỦ

Chúng ta phân biệt cấu trúc thông tin của một Trò chơi theo bốn cách cho nên một Trò chơi

cụ thể nào đó có thể có thông tin hoàn hảo, đầy đủ, tất định và đối xứng Bảng phân loại được trình bày trong Bảng 2.4

Bảng 2.4 Bảng phân loại thông tin

Loại thông

tin

ý nghĩa

Hoàn hảo Mỗi tập thông tin đều là tập đơn

Tất định Tự nhiên không đi sau bất kỳ một đối thủ nào

Đối xứng Không có đối thủ nào có thông tin khác với các đối thủ khác khi anh

ta tiến hành bước đi hoặc ở nút cuối Đầy đủ Tự nhiên không tiến hành bước đi đầu tiên hoặc bước khởi đầu của

Tự nhiên là quan sát được bởi tất cả các đối thủ

Trang 21

Bài giảng Lý thuyết trò chơi

-

-

Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL

20

Loại thứ nhất chia các Trò chơi thành Trò chơi có thông tin hoàn hảo và Trò chơi có thông

tin không hoàn hảo Trong Trò chơi có thông tin hoàn hảo mỗi tập thông tin đều là một tập đơn Trong trường hợp ngược lại Trò chơi có thông tin không hoàn hảo Ví dụ Hợp tác có sắp hạng

là Trò chơi có thông tin không hoàn hảo vì có bước đi đồng thời, còn HĐTNDĐI là Trò chơi có thông tin hoàn hảo Tất cả các Trò chơi có thông tin không đầy đủ và Trò chơi có thông tin phi

đối xứng đều là Trò chơi có thông tin không hoàn hảo

Trong Trò chơi tất định Tự nhiên không tiến hành bước đi sau bất kỳ đối thủ nào, trong trường hợp ngược lại thì Trò chơi được gọi là Trò chơi bất định Bước đi của Trò chơi bất định

có thể được tiết lộ hoặc không tiết lộ cho các đối thủ ngay lập tức Trò chơi tất định có thể trở thành Trò chơi có thông tin hoàn hảo nếu nó không có các bước đi đồng thời

Đối với các Trò chơi có thông tin bất định, nếu chúng ta loại bỏ đối thủ Tự nhiên và thay thế thanh toán bởi các kỳ vọng của chúng thì chúng ta sẽ có thể Trò chơi bất định trở thành Trò chơi tất định

Trong một Trò chơi có thông tin đối xứng, tập thông tin của một đối thủ tại

(1) nút bất kỳ, nơi mà anh ta chọn lựa hành động, hoặc

Trang 22

Bài giảng Lý thuyết trò chơi

Trong Trò chơi có thông tin không đầy đủ, Tự nhiên tiến hành bước đi đầu tiên và ít nhất

có một đối thủ không quan sát thấy điều này Nếu không thì Trò chơi là có thông tin đầy đủ

Một Trò chơi có thông tin không đầy đủ thì cũng có thông tin không hoàn hảo vì tập thông tin nào đó có nhiều hơn một nút Hai loại Trò chơi có thông tin đầy đủ nhưng không hoàn hảo là: Trò chơi có các bước đi đồng thời và trò chơi mà trong quá trình sau này của Trò chơi, Tự nhiên tiến hành bước đi không tiết lộ tức thời cho tất cả các đối thủ

Nhiều Trò chơi có thông tin không đầy đủ là Trò chơi có thông tin phi đối xứng, nhưng hai khái niệm này là không tương đương Nếu không có bước đi ban đầu của Tự nhiên, nhưng Smith tiến hành bước đi đầu tiên mà Jones không quan sát được và sau đó Smith tiến hành các bước đi sau đó trong trò chơi thì Trò chơi có thông tin phi đối xứng nhưng đầy đủ Chúng ta sẽ gặp lại tình huống này trong bài toán Ông chủ - Người làm công trong Chương 7 sau này

2.4 BIẾN ĐỔI HARSANYI VÀ TRÕ CHƠI BAYER

Phép biến đổi Harsanyi: Hành động theo người dẫn đầu III (HĐTNDĐIII)

Khái niệm “thông tin không đầy đủ” được sử dụng theo hai nghĩa khác nhau trong các tài liệu tham khảo và thông thường không được định nghĩa một cách chính thức Định nghĩa trong mục 2.3 thường được các nhà kinh tế sử dụng, nhưng nhiều khi họ lại sử dụng định nghĩa cũ về thông tin không đầy đủ như sau

có thông tin không đầy đủ Theo định nghĩa cũ, một Trò chơi có thông tin không đầy đủ đã được biến đổi thành một Trò chơi có thông tin đầy đủ Theo định nghĩa mới, Trò chơi nguyên thuỷ không được định nghĩa rõ ràng, còn Trò chơi đã được biến đổi là Trò chơi có thông tin không đầy đủ

Chúng ta hãy xem xét Trò chơi HĐTNDĐIII như một ví dụ về phép biến đổi Harsanyi Giả

sử Jones không biết chính xác về thanh toán của Trò chơi Anh ta có một số ý tưởng nào đó về thanh toán, và chúng ta sử dụng phân phối xác suất chủ quan để mô tả niềm tin này của anh ta Anh ta gán một xác suất 0.7 cho khả năng Trò chơi sẽ là (A) trong Hình 2.6 (đó chính là HĐTNDĐI), 0.1 cho khả năng Trò chơi sẽ là (B), và 0.2 cho khả năng (C) Trong thực tế Trò

Trang 23

Bài giảng Lý thuyết trò chơi

Trò chơi không thể phân tích được dưới dạng 2.6 Một cách tiếp cận tự nhiên để sử lý tình huống như vậy là sử dụng biến đổi Harsanyi Chúng ta có thể mô hình hoá lại bài toán như trong Hình 2.7, trong đó Tự nhiên tiến hành bước đi đầu tiên và lựa chọn thanh toán của các Trò chơi (A), (B) và (C) phù hợp với phân phối xác suất chủ quan của Jones Smith quan sát được bước đi của Tự nhiên, còn Jones thì không Hình 2.7 mô tả cùng một Trò chơi như Hình 2.6, nhưng bây giờ chúng ta có thể phân tích nó Cả Smith lẫn Jones đều biết các quy tắc chơi, và khác biệt giữa

họ là Smith quan sát thấy bước đi của Tự nhiên Tuy nhiên, cần lưu ý, vì là phân phối xác suất

mà Jones đưa ra là phân phối xác suất chủ quan, nên phân phối này có thể không phải là phân phối mà Tự nhiên thực sự thực hiện trong thực tế

Hình 2.6 Trò chơi HĐTNDĐIII nguyên thuỷ

Thông thường cái mà Tự nhiên chọn ở bước đi đầu tiên của Trò chơi là tập chiến lược, bảng phân chia thông tin, và hàm thanh toán của một đối thủ Chúng ta nói rằng đối thủ có thể là một trong một số “kiểu”, một khái niệm mà chúng ta sẽ có dịp quay lại ở các chương sau Khi Tự nhiên tiến hành bước đi, đặc biệt khi nó ảnh hưởng đến các tập chiến lược và thanh toán của tất

cả các đối thủ thì người ta thường nói rằng Tự nhiên đã chọn một “trạng thái của tự nhiên” cụ thể Trong Hình 2.7 Tự nhiên chọn trạng thái của tự nhiên là một trong các trạng thái (A), (B), hoặc (C)

Kiểu của một đối thủ là tập chiến lược, bảng phân chia thông tin, và hàm thanh toán mà

Tự nhiên chọn cho anh ta tại bước đi đầu tiên của Trò chơi có thông tin không đầy đủ

Trạng thái của tự nhiên là bước đi của Tự nhiên

Trang 24

Bài giảng Lý thuyết trò chơi

bước đi của Tự nhiên Giả thiết mô hình hoá này có tên gọi là học thuyết Harsanyi

Hình 2.7 HĐTNDĐIII sau biến đổi Harsanyi

Một hàm ý của học thuyết Harsanyi là ít ra các đối thủ là dễ tiếp thu những điều mới mẻ trong quan điểm của mình Chủ đề tiếp theo của chúng ta sẽ là một đối thủ cập nhật niềm tin của anh ta khi tiếp nhận những thông tin mới như thế nào Có thể là nhờ việc quan sát bước đi của Tự nhiên hoặc có thể là nhờ việc quan sát các bước đi của đối thủ khác _ một người nhận được nhiều thông tin tốt hơn

Cập nhật niềm tin bằng quy tắc Bayer

Khi phân loại cấu trúc thông tin của một Trò chơi chúng ta không đề cập đến việc một đối thủ nào đó có thể suy luận được gì từ các bước đi của các đối thủ khác Khi mô tả cây Trò chơi,

chúng ta chỉ cố gắng mô tả những phần tử ngoại sinh của mô hình không bị làm vẩn đục bởi các

quan điểm cân bằng Tuy nhiên, để xác định được cân bằng, chúng ta cần xem xét những niềm tin này thay đổi như thế nào trong suốt quá trình chơi

Một bộ phận của quy tắc chơi là việc thu thập các niềm tin tiền nghiệm của các đối thủ

khác nhau _ các niềm tin mà họ sẽ cập nhật trong quá trình chơi Một đối thủ giữ các niềm tin tiền nghiệm liên quan đến kiểu của các đối thủ khác, và khi xem xét các bước đi của các đối thủ khác anh ta cập nhật niềm tin của mình với giả định họ đang theo đuổi hành vi cân bằng

Cân bằng Bayer là cân bằng Nash mà trong đó các đối thủ cập nhật niềm tin theo quy tắc Bayer Khi này thủ tục 2 bước để kiểm tra cân bằng Nash trở thành thủ tục 3 bước như sau:

(1) Đề xuất sơ đồ chiến lược

Trang 25

Bài giảng Lý thuyết trò chơi

anh ta quan sát bước đi của Smith _ Large Khi thấy Large, Jones cập nhật niềm tin hậu nghiệm

của mình Prob(Tự nhiên chọn (A)| Smith chọn Large)

Quy tắc Bayer cho thấy làm thế nào để khôi phục được niềm tin tiền nghiệm khi có thông tin mới giống như bước đi của Smith ở đây hai thông tin được sự dụng: xác suất khi thấy Smith chọn trạng thái tự nhiên (A), Prob(Large| (A)), và xác suất khi thấy Smith chọn Large khi Tự nhiên không chọn (A), Prob(Large| (B) hoặc (C)) Từ hai con số này Jones có thể tính được xác suất Prob(Smith chọn Large), là giá trị xác suất cận biên khi thấy Large như kết quả của một trong những trạng thái tự nhiên mà Tự nhiên có thể chọn

Để xác định được hậu nghiệm của mình Prob(Tự nhiên chọn (A)|Smith chọn Large), Jones sử dụng xác suất và tiền nghiệm của anh ta Xác suất đồng thời của việc thấy Smith chọn Large và Tự nhiên chọn (A) là:

Vì cái

mà Jones cần tính là Prob (A| Large) cho nên chuyển vế ta có:

 |  Prob Large A Prob A |    

Prob A Large

Prob Large

Thay (1) vào (3) ta có hậu nghiệm mà Jones cần tìm:

Tổng quát hơn, từ bước đi x của Tự nhiên và số liệu quan sát được:

 |  Prob data x Prob x |    

Prob x data

Prob data

Công thức (6) cho ta lời phát biểu của quy tắc Bayer

(Xác suất hậu nghiệm cho bước đi của Tự nhiên) = [(Khả năng của bước đi của Đối thủ).(Xác suất tiền

nghiệm cho bước đi của Tự nhiên)]/(bước đi của Đối thủ) (6)

Cập nhật niềm tin trong HĐTNDĐIII

Bây giờ chúng ta sẽ quay trở lại với những con số trong ví dụ HĐTNDĐIII để sử dụng quy tắc vừa nhận được Jones có tiền nghiệm là xác suất của sự kiện Tự nhiên chọn (A) bằng 0.7 và anh ta cần cập nhật niềm tin khi nhìn thấy Smith chọn Large Tiền nghiệm của Jones là Prob(A)

= 0.7, và anh ta cần tính Prob(A|Large)

Sử dụng Quy tắc Bayer từ phương trình (4), chúng ta cần các giá trị Prob(Large| A), Prob(Large| B) và Prob(Large| C) Những giá trị này phụ thuộc vào cái mà Smith sẽ làm tại cân

Trang 26

Bài giảng Lý thuyết trò chơi

-

-

Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL

25

bằng, bởi vậy các niềm tin của Jones không thể được tính toán độc lập với cân bằng

Như là một ứng viên cho vị trí cân bằng trong HĐTNDĐIII, Smith cần phải chọn Large nếu trạng thái tự nhiên là (A) hoặc (B) và chọn Small nếu trạng thái là (C) và Jones phản ứng Large bằng Large, phản ứng với Small bằng Small Điều này có thể ký hiệu là (L| A, L| B, S| C; L| L, S| S) Chúng ta sẽ kiểm tra rằng đây có phải là một cân bằng không, bắt đầu với việc tính toán Prob(A| Large)

Nếu Jones quan sát thấy Large, anh ta có thể loại trừ khả năng (C), nhưng anh ta vẫn chưa biết trạng thái thực là (A) hay (B) Quy tắc Bayer cho anh ta biết rằng xác suất hậu nghiệm của (A) là:

Và xác suất hậu nghiệm của (B) là 1 – 0,875 = 0.125 Nhưng chúng ta cũng có thể tính bằng công thức tương tự như (7) là:

Hình 2.8 minh hoạ Quy tắc Bayer

Tính toán tướng tự đối với Prob(A| Small) Sử dụng (4) ta có:

Trang 27

Bài giảng Lý thuyết trò chơi

có thể dàn xếp với nhau bên ngoài toà án

Vì trên thực tế, Trò chơi này bao gồm từ hai Trò chơi: bên bị có tội và ngược lại, bên bị là

vô tội Vì vậy chúng ta để Tự nhiên đi trước và quyết định bên bị có tội với một xác suất là q và không có tội với một xác suất là 1 – q, nhưng điều này không được tiết lộ cho bên đơn, mà chỉ mình bên bị là biết rõ Ta có tóm tắt sau:

Trò chơi dàn xếp Png Đối thủ

Bên đơn và bên bị

Trật tự chơi

(0) Tự nhiên chọn bên bị là có tội với xác suất q = 0,13 và vô tội với xác suất 1 – q

(1) Bên đơn quyết định Khởi kiện hoặc chỉ ấm ức

(2) Bên bị đề nghị Dàn xếp với một khối lượng bồi thường là S = 0,15 cho bên bị hoặc Kháng cự lại với S = 0

(3) Có hai khả năng:

a) Nếu bên bị đề nghị S = 0,15 thì bên đơn có thể Dàn xếp hoặc Từ chối và ra toà

b) Nếu bên bị đề nghị S = 0 thì bên đơn có thể Bỏ kiện với chi phí P = 0 cho mình và D = 0 cho bên bị, hoặc kiện ra toà với chi phí P = 0.1 cho bản thân và D = 0,2 cho bên bị (4) Nếu trường hợp phải ra toà thì bên đơn sẽ thắng một khoản W=1 nếu bên bị có tội, và W = 0 nếu bên bị vô tội

Thanh toán

Bên đơn có thanh toán là S + W – P và bên bị có thanh toán là - S – W – D

Chúng ta có biểu diễn của Trò chơi này trên Hình 2.9 sau đây:

Trang 28

Bài giảng Lý thuyết trò chơi

-

-

Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL

27

Trang 29

Bài giảng Lý thuyết trò chơi

-

-

Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL

28

Chương 3 CÁC CHIẾN LƯỢC HỖN HỢP VÀ LIÊN TỤC

3.1 CHIẾN LƯỢC HỖN HỢP: TRÕ CHƠI PHÖC LỢI

Chúng ta sẽ mở rộng khái niệm cân bằng Nash để đưa ra các dự báo về các kết cục cho những trường hợp không có chiến lược trội và cả khi không có cân bằng Nash thông thường Thông thường sẽ rất có lợi và thực tế khi mở rộng không gian chiến lược bằng cách thêm vào các chiến lược ngẫu nhiên và khi đó cân bằng Nash hầu như luôn tồn tại Chiến lược ngẫu nhiên được gọi là “chiến lược hỗn hợp”

Một chiến lược thuần tuý gắn mỗi một tập thông tin có thể của đối thủ với một hành động

có thể chọn bất kỳ một trong số một vài hành động khác nhau trong tình huống đã cho Đó là một điều không được dự báo trước, nhưng lại có lợi cho anh ta và chiến lược hỗn hợp thường xuyên xảy ra trong thực tế

Trò chơi Phúc lợi

Trò chơi Phúc lợi mô hình hoá một chính phủ muốn giúp đỡ người nghèo tìm kiếm công ăn việc làm, nhưng không giúp đỡ nếu người nghèo không tìm kiếm công ăn việc làm Bài toán này cũng giống như bài toán cha mẹ quyết định giúp đỡ một đứa con lười biếng ở một mức độ bao nhiêu Chúng ta xét một ví dụ được cho ở Bảng 3.1 sau đây

Nhận xét: không có cân bằng Nash như được định nghĩa trong các chương trước, tuy nhiên Trò chơi này sẽ có cân bằng Nash hỗn hợp Thanh toán của các đối thủ là các giá trị kỳ vọng của các thanh toán từ Bảng 3.1 Nếu Chính phủ chơi Aid với xác suất  và Người nghèo chơi Làm việc với xác suất  thì kỳ vọng thanh toán của Chính phủ là:

Trang 30

Bài giảng Lý thuyết trò chơi

ra được số người nghèo muốn Làm việc trong tổng số những người nghèo tại khu vực cần Giúp

đỡ

3.2 MỘT SỐ TRÕ CHƠI ỨNG DỤNG

Trò chơi Gà con và Phương pháp cân bằng thanh toán

Trang 31

Bài giảng Lý thuyết trò chơi

Trò chơi nói trên có hai cân bằng Nash thuần tuý, tuy nhiên các cân bằng này là phi đối xứng, do

đó khó có thể kết luận được cân bằng nào sẽ thực sự xảy ra Do vậy, để bảo đảm tính đối xứng,

có lẽ cân bằng hỗn hợp sẽ là tốt nhất trong trường hợp này

Để xác định cân bằng chúng ta sử dụng phương pháp cân bằng thanh toán, thay vì phải sử

dụng đạo hàm Hơn nữa, lưu ý rằng bài toán này là đối xứng, cho nên chỉ cần sử dụng một giá trị xác suất thay vì hai xác suất khác nhau

đường của hai cậu bé Nhưng điểu gì sẽ xảy ra khi x = 0,5? Khi đó  sẽ bằng 2, là điều không thể

có được vì giá trị xác suất chỉ nằm giữa 0 và 1 mà thôi Do vậy, khi x = 0,5, chỉ còn lời giải cân

bằng thuần tuý, chứ không thể tồn tại cân bằng hỗn hợp được nữa

Chiến tranh Tiêu hao

Ta hãy hình dung Smith và Jones điều hành hai công ty trong một ngành công nghiệp độc quyền tự nhiên với một mức cầu đủ mạnh để một công ty có thể sinh lợi nhưng không đủ cho cả hai công ty cùng tồn tại Các hành động có thể là Tiếp tục ở lại trong ngành và Rời bỏ ngành Khi

cả hai cùng Tiếp tục ở lại ngành, mỗi đối thủ đều nhận được một khoản là - 1 Nếu một công ty Rời bỏ ngành thì công ty còn lại sẽ nhận được một khoản lợi nhuận độc quyền bằng 3 Giả sử tỷ

lệ chiết khấu là r > 0, mặc dù điều này không thực sự có ý nghĩa trong mô hình, thậm chí thời hạn chơi có thể là vô hạn

Chiến tranh Tiêu hao có một dãy trù mật các cân bằng Nash Một cân bằng là Smith chọn (Tiếp tục ở lại ngành bất kể Jones làm gì) và Jones chọn Rời bỏ ngành ngay lập tức, là cân bằng tốt nhất cho cả hai Nhưng chúng ta chọn lời giải đối xứng trong đó mỗi đối thủ chọn một cân bằng hỗn hợp: xác suất cố định  để Rời bỏ ngành trong khi đối thủ của mình vẫn còn chưa Rời

Trang 32

Bài giảng Lý thuyết trò chơi

Nếu Smith rời bỏ ngành, anh ta sẽ nhận được một khoản V Rời bỏ ngành = 0

Nếu Smith tiếp tục ở lại ngành, cái anh ta nhận được sẽ còn phụ thuộc vào cái mà Jones làm Về măt ký hiêu, ta có:

Sau khi biến đổi một chút giá trị này biến thành:

Sau khi cho vào phương trình V Tiếp tục ở lại ngành = V Rời bỏ ngành = 0 chúng ta nhận được kết quả là  = 0,25 tại cân bằng và giá trị này độc lập với tỷ lệ chiết khấu r

Chiến lược tương quan

Liệu các đối thủ có thể sử dụng cùng một thiết bị ngẫu nhiên cho các chiến lược hỗn hợp của họ hay không (VD: tung đồng xu, máy xổ số…) Nếu họ có thể, chúng ta gọi các chiến lược

tạo thành là các chiến lược tương quan

Thông thường thiết bị ngẫu nhiên hóa không được mô hình hóa một cách tường minh khi một mô hình viện dẫn tới cân bằng tương quan

Một cách để mô hình hóa các chiến lược tương quan là chỉ ra một bước đi trong đó Tự nhiên trao cho mỗi đối thủ khả năng cam kết hành động trước ví dụ như Tiếp tục với xác suất bằng nhau

Một thiết bị phối hợp khác, hữu ích trong các trò chơi có một vấn đề về hợp tác, giống như

Trận chiến Giới tính, là cheap talk Cheap talk liên quan tới thông tin liên lạc không tốn kém

trước khi trò chơi thực sự bắt đầu

3.3 CHIẾN LƯỢC HỖN HỢP VỚI CÁC THAM SỐ TỔNG QUÁT VÀ TRÕ CHƠI

Trang 33

Bài giảng Lý thuyết trò chơi

Phân loại Trò chơi với chiến lược hỗn hợp

Bảng 3.5: Các trò chơi 2-2 với Cân bằng chiến lược hỗn hợp

Các trò chơi bất hợp tác Trò chơi hợp tác Trò chơi cống hiến

Trò chơi Bất hợp tác có một cân bằng hỗn hợp đơn Thanh toán hoặc là (a) a > c, d > b, x

> w, và y > z, hoặc (b) c > a, b > d, w > x, và z > y Trò chơi Phúc lợi là một Trò chơi Bất hợp tác, cũng giống như Trò chơi Kiểm toán trong phần tiếp theo

Trò chơi Hợp tác có ba cân bằng: hai cân bằng chiến lược thuần tuý đối xứng và một cân

bằng chiến lược hỗn hợp Thanh toán có dạng a > c, d > b, w > x và z > y Trò chơi Hợp tác có

sắp đặt và Chiến tranh Giới tính là hai biến thể của Trò chơi Hợp tác, trong đó các đối thủ có cùng một cân bằng chiến lược thuần tuý đối xứng nhau

Trò chơi Cống hiến có ba cân bằng: hai cân bằng chiến lược thuần tuý phi đối xứng và

một cân bằng chiến lược hỗn hợp Thanh toán là c > a, b > d, x > w, và y > z Một điều kiện nữa cũng cần phải được thoả mãn là: c < b và y > x

Sở dĩ có tên gọi là Cống hiến là bởi vì thông thường trong các bài toán công cộng, các đối thủ muốn thực hiện một số hành động để cung cấp hàng hoá công cộng, nhưng muốn người khác phải gánh chịu chi phí Khác với Trò chơi NNGCNT, trong Trò chơi Cống hiến các đối thủ muốn một mình gánh chịu chi phí nếu cần thiết

Bây giờ chúng ta xem xét một Trò chơi cống hiến cụ thể để thấy được khả năng mở rộng một bài toán 2-2 sang một bài toán có nhiều đối thủ Đó là Trò chơi Trách nhiệm Dân sự được trình bày trong Bảng 3.6, trong đó Smith và Jones cùng quan sát thấy một vụ trộm, và mỗi một đối thủ đều muốn có người đi gọi cảnh sát để ngăn chặn vụ trộm này (vì khi đó lợi ích của họ sẽ được tăng thêm), nhưng người này muốn người kia đi báo cảnh sát vì nếu không, thanh toán của anh ta sẽ bị giảm đi ít nhiều

a,ω b,x

a,ω b,x

Trang 34

Bài giảng Lý thuyết trò chơi

*N Phương trình (17) cho ta thấy *N = 0,3 cho nên *N = 0,3.*, là đại lượng tăng theo N Khi

N tăng lên 38, xác suất của trường hợp không ai đi báo cảnh sát sẽ là xấp xỉ 0,29, vì * xấp xỉ 0,97 Đó là trường hợp của một vụ án ở New york trong thời gian cách đây không xa

3.4 NGẪU NHIÊN NGƯỢC VỚI HỖN HỢP: TRÕ CHƠI KIỂM TOÁN

Ba mô hình tiếp theo sẽ minh hoạ sự khác biệt giữa chiến lược hỗn hợp và hành động ngẫu nhiên, một khác biệt tinh tế nhưng rất quan trọng

Trong cả ba trò chơi, chi phí của kiểm toán là C , trong đó C < 4 và chi phí để bị bắt là hình phạt F > 1

Bảng 8 chỉ ra một cách: trò chơi có bước-đi-đồng-thời 2-2

Trò chơi Kiểm toán I là trò chơi bất-hợp tác, với cân bằng chiến lược hỗn hợp duy nhất

Phương pháp cân bằng-thanh toán nói cho chúng ta là

Trang 35

Bài giảng Lý thuyết trò chơi

Trò chơi Kiểm toán II

Mô hình hóa như một trò chơi kế tiếp: IRS chọn chính sách của chính phủ trước, và các kẻ tình nghi phản ứng với chính sách này

Cân bằng chiến lược thuần túy: IRS chọn Kiểm toán, dự đoán rằng kẻ tình nghi sau đó sẽ chọn Tuân thủ

Các thanh toán là 4 – C cho IRS và -1 cho các kẻ tình nghi (giống hệt Kiểm toán I nhưng

có nhiều kiểm toán hơn và ít gian lận hơn và ít thanh toán-phạt hơn.)

Trò chơi Kiểm toán III

Giả sử IRS không phải chấp nhận một chính sách kiểm toán hoặc tin cậy mọi kẻ tình nghi, nhưng thay vào đó có thể kiểm toán một mẫu ngẫu nhiên

IRS tuyên bố trước rằng sẽ kiểm toán một mẫu ngẫu nhiên 1/ F những kẻ tình nghi (lựa chọn một phần a của giao hoàn thuế để kiểm toán.)

Chúng ta biết rằng IRS muốn ngăn chặn trốn thuế vì nó muốn chọn  = 1 và sao chép kết quả của Kiểm toán II nếu nó phải làm như vậy Nó sẽ chọn  sao cho:

Tức là:

Tại cân bằng, vì vậy IRS sẽ chọn  = 1/F và Doanh nghiệp sẽ chọn Tuân thủ Thanh toán của IRS sẽ là 4 - C, là giá trị tốt hơn 4 – C trong hai Trò chơi trên, còn thanh toán của Doanh nghiệp vẫn là - 1 như trước đây

Cân bằng của IRS là cân bằng chiến lược thuần tuý, mặc dù hành động của nó là ngẫu nhiên Điều này khác với Kiểm toán I, vì IRS phải đi trước và tiến hành kiểm toán tốn kém thậm chí cả khi Doanh nghiệp Tuân thủ Kiểm toán III còn khác hai Trò chơi kia từ một khía cạch khác nữa: tập hành động của IRS là liên tục Trong Kiểm toán I và II, tập hành động là {Kiểm toán, Tin cậy} mặc dù tập chiến lược là   [0, 1] trong chiến lược hỗn hợp Trong Kiểm toán III, tập hành động là   [0, 1] mặc dù tập chiến lược hỗn hợp là không thể có bởi vì Trò chơi

có những bước đi kế tiếp

3.5 CÁC CHIẾN LƯỢC LIÊN TỤC: TRÕ CHƠI COURNOT

Đa số các trò chơi cho tới nay được giới thiệu có các không gian chiến lược rời rạc

Trang 36

Bài giảng Lý thuyết trò chơi

-

-

Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL

35

Trò chơi Cournot, có một không gian chiến lược liên tục thậm chí không có hỗn hợp Nó

mô hình hóa tình trạng độc quyền đôi (duopoly) trong đó các công ty lựa chọn các mức sản lượng trong cạnh tranh với nhau

Trò chơi Cournot Đối thủ:

Công ty Apex và Brydox

Trật tự chơi

Apex và Brydox đồng thời chọn khối lượng hàng bán ra là qa và qb từ tập [0, ),

Thanh toán

Chi phí cận biên là hằng số c = 12 Cầu là tổng khối lượng bán được, Q = q a + q b và chúng ta sẽ

giả thiết cầu này là tuyến tính (để biết tổng quát, hãy xem Chương 14), và, trên thực tế, sẽ sử dụng hàm cụ thể sau:

Thanh toán của các đối thủ là lợi nhuận thu được

Để giải quyết bài toán này, chúng ta phải đưa ra khái niệm hàm phản ứng tốt nhất của

mỗi công ty, tức là một hàm mà trong đó, ứng với mỗi lựa chọn của đối thủ, công ty sẽ đưa ra một khối lượng tối ưu cho chính bản thân mình Các đường này được mô tả trong Hình 3.1 sau đây

Hàm phản ứng tốt nhất của Apex là:

Và hàm phản ứng tốt nhất của Brydox cũng được xác định một cách tương tự Dễ dàng

Trang 37

Bài giảng Lý thuyết trò chơi

-

-

Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL

36

nhận thấy cân bằng của Trò chơi Cournot chính là giao điểm E của hai đường phản ứng này, và

vì vậy E được gọi là cân bằng Cournot Tại cân bằng Cournot, ta có: q a q b40  c / 3  36

Giá cân bằng khi đó bằng 48  120  36  36

Cân bằng Cournot ngoài đặc điểm là một cân bằng Nash, còn có một tính chất khác đặc

biệt quan trọng nữa là tính ổn định

Cân bằng Stackelberg

Trò chơi này chỉ khác Trò chơi Cournot tại một điểm là một trong hai đối thủ, ví dụ như Apex, được quyền đi trước Khi đó Apex sẽ lựa chọn như thể nào? Khi đó Apex sẽ dự tính khối lượng tối ưu của Brydox theo (28) sẽ là:

Anh ta sẽ thế giá trị này vào hàm thanh toán của mình:

Từ đó có điều kiện bậc I là:

Và kết cục cuối cùng là: qa = 60 và qb = 30

3.6 Các chiến lược liên tục: Trò chơi Bertrand

Một phiên bản thay thế tự nhiên cho mô hình độc quyền-đôi trong đó hai công ty chọn các mức sản lượng một cách đồng thời là mô hình trong đó các công ty chọn giá một cách đồng thời

Cân bằng này gọi là cân bằng Bertrand

Trò chơi Bertrand Đối thủ: Các công ty Apex và Brydox

Trật tự chơi: Apex và Brydox đồng thời lựa chọn các mức giá pa và pb từ tập [0,∞)

Thanh toán

Chi phí cận biên là hằng số c = 12 Cầu là hàm số của tổng khối lượng bán được, Q = 120

- p Hàm thanh toán của Apex (hàm thanh toán của Brydox sẽ là tương tự) là

Trò chơi Bertrand có một cân bằng Nash duy nhất: = = c = 12

Rõ ràng đây là một cân bằng Nash yếu: nếu một trong hai công ty đi chệch tới một mức giá cao hơn, công ty đó sẽ mất toàn bộ người tiêu dùng của nó và do vậy thất bại trong việc tăng lợi nhuận của mình lên trên giá trị 0

3.7 Tồn tại cân bằng

Trang 38

Bài giảng Lý thuyết trò chơi

(1) Không gian chiến lƣợc không bị chặn

(2) Không gian chiến lƣợc mở

(3) Không gian chiến lƣợc rời rạc

(4) Hàm phản ứng không-liên tục phát sinh từ các hàm thanh toán không-lõm hoặc không-liên tục

Trang 39

Bài giảng Lý thuyết trò chơi

-

-

Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL

38

Chương 4: TRÕ CHƠI ĐỘNG VỚI THÔNG TIN ĐỐI XỨNG

Trong chương này chúng ta sẽ nhiều lần sử dụng dạng mở rộng để nghiên cứu các trò chơi có các bước đi xuất hiện một cách tuần tự

Mục 4.1 khái niệm cân bằng Nash hoàn hảo

Mục 4.2 Trò chơi cản trở nhập ngành

Mục 4.3 Mở rộng ý tưởng hoàn hảo sử dụng ví dụ kiện tụng lạm dụng

4.1 HOÀN HẢO TIỂU TRÕ CHƠI

Cân bằng Hoàn hảo của Đi-theo-Người-dẫn-đầu I

Cân bằng Hoàn hảo tiểu-trò chơi là một khái niệm cân bằng dựa trên trật tự các bước đi và

sự phân biệt giữa đường cân bằng và cân bằng

Đường cân bằng là đường đi qua cây trò chơi dẫn tới cân bằng, nhưng bản thân cân bằng

là một tổ hợp chiến lược bao gồm các phản ứng của đối thủ với việc đi chệch của các đối thủ khác ra khỏi đường cân bằng

Trong trò chơi Đi-theo-Người-dẫn-đầu I, có ba cân bằng Nash chiến lược-thuần túy trong

đó chỉ có một cân bằng là hợp lý

Dạng chiến lược:

có ba cân bằng Nash như sau:

nhưng chỉ có E2 là một cân bằng hợp lý vì trật tự các bước đi có ảnh hưởng đến quyết định của các đối thủ Vấn đề của bảng chiến lược, và bởi vậy của cân bằng Nash, là nó bỏ qua ai là người tiến hành bước đi trước tiên Smith đi bước đầu tiên, và sẽ là hợp lý khi Jones được phép _ trên thực tế đó là điều bắt buộc phải _ suy nghĩ lại chiến lược của mình sau bước đi của Smith

Hình 1: Đi theo người dẫn đầu I

Trang 40

Bài giảng Lý thuyết trò chơi

-

-

Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL

39

Hãy xét chiến lược (Small, Small) tại cân bằng E 3 Nếu Smith đi chệch khỏi cân bằng bằng

cách chọn Large, thì sẽ là bất hợp lý nếu Jones cứ khăng khăng chọn phản ứng Small Thay vào

đó, anh ta sẽ chọn Large Nhưng nếu Smith dự kiến phản ứng Large, anh ta sẽ chọn Large ngay trong bước đi đầu tiên của mình, và như vậy E 3 không phải là một cân bằng Lập luận một cách

tương tự chúng ta cũng thấy Jones sẽ không hợp lý nếu lựa chọn chiến lược (Large, Large), do vậy chỉ có E 2 là cân bằng duy nhất

Chúng ta nói E 1 và E 2 là các cân bằng Nash nhưng không phải cân bằng Nash “hoàn hảo” Một tổ hợp chiến lược là cân bằng hoàn hảo nếu nó vẫn còn là cân bằng dọc theo tất cả các đường đi có thể, không chỉ đường cân bằng, mà tất cả các đường đi khác dẫn đến các “Tiểu Trò chơi” khác

Một Tiểu Trò chơi là một Trò chơi bao gồm một nút đơn trong mỗi bảng phân chia thông

tin của các đối thủ, các nút sau của nó, và các thanh toán gắn với các nút cuối

Một tổ hợp chiến lược là một cân bằng Nash hoàn hảo tiểu Trò chơi nếu (a) nó là cân

bằng Nash cho toàn bộ Trò chơi; và (b) và quy tắc hành động thích hợp của nó là một cân bằng Nash cho mỗi Tiểu Trò chơi

Dạng mở rộng của Đi theo người dẫn đầu 1 trong Hình 4.1 (bản sao của Hình 2.1) có ba

Tiểu Trò chơi: (1) toàn bộ Trò chơi, Tiểu Trò chơi bắt đầu tại nút J 1, và (3) Tiểu Trò chơi bắt đầu

tại nút J 2 Tổ hợp chiến lược E 1 không phải là một cân bằng Nash hoàn hảo tiểu Trò chơi vì nó chỉ là cân bằng Nash trong Tiểu Trò chơi (1) và (3), chứ không phải là một cân bằng Nash trong

Tiểu Trò chơi (2) E 3 không phải là cân bằng Nash hoàn hảo Tiểu Trò chơi vì nó chỉ là cân bằng Nash trong Tiểu Trò chơi (1) và (2), chứ không phải trong Tiểu Trò chơi (3) Tổ hợp chiến lược

E 2 là hoàn hảo vì nó là cân bằng Nash trong cả ba Tiểu Trò chơi

Khái niệm hợp lý kế tiếp thường được sử dụng để biểu diễn ý tưởng một đối thủ sẽ tối đa

lợi ích của anh ta tại mỗi thời điểm trong Trò chơi, tái tối ưu quyết định của mình tại mỗi thời điểm và tính toán đến việc sẽ tái tối ưu trong tương lai Đây là một sự pha trộn giữa ý tưởng chi phí chìm trong kinh tế học và những mong đợi hợp lý Hợp lý kế tiếp là tiêu chuẩn chuẩn hoá đến mức thông thường người ta sử dụng “cân bằng” để nói đến “cân bằng Nash hoàn hảo Tiểu Trò chơi” trong Trò chơi có thông tin đối xứng và “cân bằng Bayer hoàn hảo” trong Trò chơi có thông tin phi đối xứng

4.2 VÍ DỤ VỀ TÍNH HOÀN HẢO: NGĂN CẢN NHẬP NGÀNH I (NCNNI)

Chúng ta xét một tình huống sau: Công ty độc quyền trong ngành có thể duy trì vị trí của mình bằng cách đe doạ tiến hành chiến tranh giá cả chống lại bất kỳ công ty nào muốn ra nhập

Ngày đăng: 10/04/2021, 10:44

TỪ KHÓA LIÊN QUAN