Trong Trò chơi RNTT, một kết cục đơn của NewCleaner có thể là kết quả của một trong các các tổ hợp chiến lược sau: {Đặt giá cao nếu NewCleaner ra nhập, giá thấp nếu NewCleaner ở ngoài} {
Trang 1TRƯỜNG ĐẠI HỌC THỦY LỢI
Trang 2Bài giảng Lý thuyết trò chơi
-
-
Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL 1 MỤC LỤC Chương 1: CÁC QUY TẮC TRÕ CHƠI 5
1.1 ĐỊNH NGHĨA 5
Mô tả Trò chơi 5
Tính duy nhất 8
1.2 CÁC CHIẾN LƯỢC TRỘI CỦA BÀI TOÁN NỖI NAN GIẢI CỦA NGƯỜI TÙ 9
1.3 TRỘI LẶP: TRẬN CHIẾN TRÊN BIỂN BISMARCK 10
1.4 CÂN BẰNG NASH 11
Cuộc chiến Giới tính 12
1.5 CÁC ĐIỂM TRỌNG TÂM 13
Chương 2: THÔNG TIN 15
2.1 BẢNG CHIẾN LƯỢC VÀ DẠNG MỞ RỘNG CỦA MỘT TRÕ CHƠI 15
Bảng 2.1 Hợp tác có sắp hạng 15
2.2 TẬP THÔNG TIN 17
Hình 2.3 Tập thông tin và Bảng phân chia thông tin 18
2.3 THÔNG TIN KHÔNG HOÀN HẢO, TẤT ĐỊNH, ĐỐI XỨNG VÀ ĐẦY ĐỦ 19
Bảng 2.4 Bảng phân loại thông tin 19
Loại thông tin 19
2.4 BIẾN ĐỔI HARSANYI VÀ TRÕ CHƠI BAYER 21
Hình 2.6 Trò chơi HĐTNDĐIII nguyên thuỷ 22
Hình 2.7 HĐTNDĐIII sau biến đổi Harsanyi 23
Cập nhật niềm tin bằng quy tắc Bayer 23
Cập nhật niềm tin trong HĐTNDĐIII 24
Trò chơi dàn xếp Png 26
Trật tự chơi 26
Thanh toán 26
Chương 3 CÁC CHIẾN LƯỢC HỖN HỢP VÀ LIÊN TỤC 28
3.1 CHIẾN LƯỢC HỖN HỢP: TRÕ CHƠI PHÖC LỢI 28
Trò chơi Phúc lợi 28
Giải thích chiến lược hỗn hợp 29
3.2 MỘT SỐ TRÕ CHƠI ỨNG DỤNG 29
Trò chơi Gà con và Phương pháp cân bằng thanh toán 29
Chiến tranh Tiêu hao 30
Chiến lược tương quan 31
3.3 CHIẾN LƯỢC HỖN HỢP VỚI CÁC THAM SỐ TỔNG QUÁT VÀ TRÕ CHƠI N ĐỐI THỦ31 Phân loại Trò chơi với chiến lược hỗn hợp 32
3.4 NGẪU NHIÊN NGƯỢC VỚI HỖN HỢP: TRÕ CHƠI KIỂM TOÁN 33
3.5 CÁC CHIẾN LƯỢC LIÊN TỤC: TRÕ CHƠI COURNOT 34
Trật tự chơi 35
Chương 4: TRÕ CHƠI ĐỘNG VỚI THÔNG TIN ĐỐI XỨNG 38
4.1 HOÀN HẢO TIỂU TRÕ CHƠI 38
4.2 VÍ DỤ VỀ TÍNH HOÀN HẢO: NGĂN CẢN NHẬP NGÀNH I (NCNNI) 39
Có khi nào cần phải sử dụng cân bằng không hoàn hảo? 41
4.3 ĐE DỌA TIN CẬY, CHI PHÍ CHÌM, VÀ VẤN ĐỀ TẬP MỞ TRONG KIỆN TỤNG LẠM DỤNG 41
Kiện tụng Lạm dụng I: Tống tiền đơn giản 41
Trật tự chơi 41
Thanh toán 41
Kiện tụng Lạm dụng II: sử dụng chi phí chìm một cách chiến lược 42
Kiện tụng Lạm dụng II và vấn đề tập mở 43
Kiện tụng Lạm dụng III: Xúc cảm hận thù 43
4.4 TÁI HỢP TÁC TỚI CÂN BẰNG THỐNG TRỊ PARETO TRONG TIỂU TRÕ CHƠI 44
Chương 5: UY TÍN VÀ TRÕ CHƠI LẶP CÓ THÔNG TIN ĐỐI XỨNG 46
5.1 TRÕ CHƠI LẶP VÔ HẠN VÀ NGHỊCH LÝ CHUỖI CỬA HÀNG 46
Trang 3Bài giảng Lý thuyết trò chơi
-
-
Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL 2 Nghịch lý Chuỗi cửa hàng 46
5.2 TRÕ CHƠI LẶP VÔ HẠN, TRỪNG PHẠT MINMAX, VÀ ĐỊNH LÝ DÂN GIAN 46
Chiến lược Grim 47
Tit-for-Tat 47
Maximin và Minimax 48
Cam kết trước 49
5.3 UY TÍN: NỖI NAN GIẢI CỦA NGƯỜI TÙ MỘT PHÍA 49
5.4 CHẤT LƯỢNG SẢN PHẨM TRONG MỘT TRÕ CHƠI LẶP VÔ HẠN 50
Chất lượng sản phẩm 50
Trật tự chơi 50
Thanh toán 51
5.5 CÂN BẰNG MARKOV VÀ CÁC THẾ HỆ GỐI TIẾP TRONG CHI PHÍ ĐỔI KHÁCH HÀNG52 Trật tự chơi 52
Thanh toán 52
5.6 CÂN BẰNG TIẾN HÓA: TRÕ CHƠI DIỀU HÂU- BỒ CÂU 53
Chương 6:TRÕ CHƠI ĐỘNG CÓ THÔNG TIN KHÔNG ĐẦY ĐỦ 56
6.1 CÂN BẰNG BAYER HOÀN HẢO: NGĂN CẢN NHẬP NGÀNH II VÀ III (NCNGII VÀ III)56 Ngăn cản Nhập ngành II: Chiến tranh không bao giờ có lợi 56
Hoàn hảo Bàn tay run 57
Cân bằng hoàn hảo Bayer và cân bằng chuỗi 57
Xét lại NCNNII 58
6.2 TINH LỌC CÂN BẰNG BAYER HOÀN HẢO: ĐĂNG KÝ BẢO VỆ LUẬN VĂN TIẾN SỸ58 NCNNIII: Chiến tranh đôi khi là có lợi 58
Cân bằng Chung Hợp lý cho Trò chơi NCNNIII 58
Cân bằng không hợp lý cho NCNNIII 59
6.3 TẦM QUAN TRỌNG CỦA VẤN ĐỀ HIỂU BIẾT CHUNG: NCNN IV VÀ V 59
Cân bằng cho NCNNIV 59
Cân bằng của NCNN V 60
6.4 THÔNG TIN KHÔNG HOÀN HẢO TRONG TRÕ CHƠI NNGCNT LẶP: MÔ HÌNH BÈ LŨ 4 TÊN 61
Mô hình Bè lũ 4 tên 61
6.5 VÕNG ĐUA AXELROD 62
6.6 TÍN DỤNG VÀ TUỔI ĐỜI CỦA CÔNG TY: MÔ HÌNH DIMOND 63
Chương 7: SUY ĐỒI ĐẠO ĐỨC: CÁC HÀNH ĐỘNG ẨN DẤU 65
7.1 PHÂN LOẠI MÔ HÌNH THÔNG TIN PHI ĐỐI XỨNG 65
Bảng 7.1 Ứng dụng của các mô hình Chủ sở hữu – Người làm công 67
7.2 MÔ HÌNH CHỦ SỞ HỮU-NGƯỜI LÀM CÔNG 67
Trò chơi Sản xuất 67
Trật tự chơi 67
Thanh toán 67
Trật tự chơi 70
TCSXIII: mức lương phẳng trong điều kiện bất định 71
TCSXV: Mức lương dựa trên sản lượng trong điều kiện bất định 72
7.3 CÁC RÀNG BUỘC TƯƠNG THÍCH ĐỘNG CƠ, THAM GIA VÀ CẠNH TRANH 72
7.4 HỢP ĐỒNG TỐI ƯU: TRÕ CHƠI BROADWAY 73
Trò chơi Broadway I 73
Trật tự chơi 73
Thanh toán 73
Bán cửa hàng 75
Chương 8: NHỮNG CHỦ ĐỀ TIẾP THEO CỦA SUY ĐỒI ĐẠO ĐỨC 77
8.1 LƯƠNG HIỆU QUẢ 77
Trò chơi Quản trị viên may mắn 77
Trật tự chơi 77
Thanh toán 77
8.2 CUỘC ĐẤU 78
Trang 4Bài giảng Lý thuyết trò chơi
-
-
Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL 3 8.3 THỂ CHẾ VÀ BÀI TOÁN NGƯỜI LÀM CÔNG 79
Các cách thức làm giảm nhẹ vấn đề Người làm công 79
Thể chế Nhà nước và vấn đề Người làm công 80
Thể chế Tư nhân và vấn đề Người làm công 81
8.4 TÁI THƯƠNG LƯỢNG: TRÕ CHƠI LẤY LẠI(CHIẾM HỮU LẠI) 81
Trò chơi Lấy lại 81
Trật tự chơi 82
Thanh toán 82
8.5 SƠ ĐỒ KHÔNG GIAN TRẠNG THÁI: TRÕ CHƠI BẢO HIỂM I VÀ II 83
Hình 8.1 Trò chơi Bảo hiểm I 83
Trò chơi Bảo hiểm I: Mức cẩn thận có thể quan sát được 83
Trật tự chơi 83
Thanh toán 83
Trò chơi Bảo hiểm II: Mức cẩn thận không quan sát được 84
Trật tự chơi 84
Hình 8.2 Trò chơi Bảo hiểm II với Bảo hiểm toàn phần và một phần 85
8.6 SẢN XUẤT CHUNG BỞI NHIỀU NGƯỜI LÀM CÔNG: MÔ HÌNH TỔ ĐỘI CỦA HOLMSTROM 86
Tổ đội(Holmstrom, 1982) 86
Trật tự chơi 86
Thanh toán 86
Chương 9: LỰA CHỌN NGHỊCH 88
9.1 GIỚI THIỆU: TRÕ CHƠI SẢN XUẤT VI 88
Trò chơi Sản xuất VI: Lựa chọn nghịch 88
Trật tự chơi 88
Thanh toán 88
TCSXVIa: Lựa chọn nghịch, với những tham số đặc biệt 88
Trật tự chơi 88
Thanh toán 89
9.2 LỰA CHỌN NGHỊCH TRONG ĐIỀU KIỆN TẤT ĐỊNH: XE CŨ I VÀ II 90
Mô hình cơ bản của thị trường xe cũ 91
Trất tự chơi 91
Thanh toán 91
Thị trường Xe cũ I: Thị hiếu đồng nhất, hai kiểu Người bán 91
Mô hình Xe cũ II: Thị hiếu đồng nhất, Tập kiểu của Người bán là Trù mật 92
Hình 9.2 TTXCII: Thị hiếu đồng nhất 93
9.3 KHÔNG ĐỒNG NHẤT: XE CŨ III VÀ IV 93
TTXCIII: Người mua đánh giá xe cao hơn Người bán 93
TTXCIV: Những Người bán đánh giá khác nhau 94
Hình 9.4 TTXCIV: Những Người bán đánh giá xe khác nhau 94
Nhiều Người bán hơn Người mua 95
Người mua không đồng nhất: thừa cung 96
Ghét rủi ro 96
9.4 LỰA CHỌN NGHỊCH TRONG ĐIỀU KIỆN BẤT ĐỊNH: TRÕ CHƠI BẢO HIỂM III 96
Trò chơi Bảo hiểm III 97
Trật tự chơi 97
Thanh toán 97
Trang 5Bài giảng Lý thuyết trò chơi
-
-
Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL
4
Trang 6Bài giảng Lý thuyết trò chơi
1.1 ĐỊNH NGHĨA
Lý thuyết Trò chơi quan tâm tới các hành động của những người làm quyết định có ý thức
về việc các hành động của họ tác động lẫn nhau
Cách tốt nhất để hiểu các tình huống nào có thể được mô hình hóa như là trò chơi và những tình huống nào thì không thể là xem xét các ví dụ giống như sau:
1 Các thành viên OPEC lựa chọn sản lượng hàng năm của họ;
2 General Motors mua thép từ USX;
3 Hai nhà chế tạo, một sản xuất đai ốc (nut) và một sản xuất bu lông (bolt) quyết định xem sử dụng thước đo hoặc tiêu chuẩn Hoa kỳ;
4 Một ban giám đốc sắp đặt kế hoạch tùy chọn vốn cho một quan chức quản trị cao cấp;
5 Lực lượng Không quân Hoa kỳ thuê phi công máy bay phản lực chiến đấu;
6 Một công ty điện quyết định liệu có đặt hàng một hà máy năng lượng mới khi đã biết ước lượng cầu của nó đối với điện trong mười năm
Bốn ví dụ đầu là các trò chơi Trong (1), các thành viên OPEC đang chơi một trò chơi vì Saudi Arabia biến sản lượng dầu của Kuwait được dựa vào dự báo của Kuwait về sản lượng của Saudi, và sản lượng từ cả hai quyết định đều đóng vai trò quan trọng trong giá cả quốc tế Trong (2), một phần đáng kể của kinh doanh thép của Hoa kỳ là giữa General Motors và USX, các công
ty nhận thức được rằng các khối lượng kinh doanh bởi mỗi một trong số họ đều tác động tới giá
cả Một bên muốn giá thấp, còn bên kia muốn giá cao, do vậy đây là một trò chơi với xung đội giữa hai đối thủ Trong (3), các nhà chế tạo đai ốc và bu lông không xung đột với nhau, nhưng các hành động của một bên tác động tới các hành động mong đợi của bên kia, do vậy tình huống tuy nhiên là một trò chơi Trong (4) ban giám đốc lựa chọn một kế hoạch tùy chọn vốn khi dự báo tác động lên các hành động của CEO
Lý thuyết trò chơi là không thích hợp cho việc mô hình hóa hai ví dụ cuối Trong (5), mỗi
cá nhân phi công tác động đến Lực lượng Không quân Hoa kỳ một cách không đáng kể, và mỗi công nhân đưa ra quyết định làm thuê không quan tâm tới tác động lên các chính sách của Lực lượng Không quân Trong (6), công ty điện đối mặt với một quyết định phức tạp, nhưng, điều đó không ảnh hưởng tới tác nhân hợp lý khác Các tình huống này là thích hợp hơn cho việc sử dụng
lý thuyết quyết định hơn là lý thuyết trò chơi
Lý thuyết trò chơi như được trình bày trong tài liệu này là một công cụ mô hình hóa, chứ không phải một hệ thống tiên đề
Mô tả Trò chơi
Các khái niệm cơ bản: Đối thủ, hành động, thanh toán và thông tin (viết tắt là PAPI _ player, actions, payoffs, và information), và chúng được gọi là quy tắc của Trò chơi Để tối đa thanh toán (lợi ích) của mình, các đối thủ thiết lập ra kế hoạch, hay chiến lược để chọn ra các
hành động phụ thuộc vào thông tin mà họ có được tại từng thời điểm Tổ hợp các chiến lược của
từng đối thủ được họ lựa chọn gọi là cân bằng (equilibrium) Dựa vào cân bằng, các nhà nghiên cứu có thể xác định được các hành động cụ thể của mỗi đối thủ và từ đó chỉ ra được các kết cục
của các Trò chơi
Trang 7Bài giảng Lý thuyết trò chơi
Đối thủ: là các cá nhân làm quyết định Mục tiêu của mỗi đối thủ là tối đa lợi ích của mình
bằng việc lựa chọn các hành động Trong trường hợp ví dụ, NewCleaner và OldCleaner là các
đối thủ của Trò chơi
Đôi khi cần phải sử dụng khái niệm Giả-đối thủ (pseudo-player), khi mà các hành động được thực hiện một cách thuần tuý cơ khí
Tự nhiên là một giả-đối thủ khi mà các hành động ngẫu nhiên được tiến hành tại mỗi thời
điểm cụ thể trong Trò chơi với một xác suất riêng biệt Ví dụ như quá trình suy thoái kinh tế xảy
ra tại từng thời điểm cụ thể của Trò chơi Ra nhập thị trường với một xác suất giả dụ là 0.3 có suy thoái và 0.7 không suy thoái
Hành động hay Bước đi của đối thủ thứ i, ký hiệu là ai làm một lựa chọn mà đối thủ này
có thể thực hiện
Tập hành động của đối thủ i, Ai = {a i } là tập các hành động có thể có của anh ta
Tổ hợp các hành động là một tập có trật tự a = {a i }, i = 1, …, n trong đó a i là hành động của đối thủ thứ i
Ví dụ trong Trò chơi RNTT, NewCleaner có tập hành động là {Ra nhập, ở ngoài}, còn tập hành động của OldCleaner là {Giá thấp, Giá cao} hay đơn giản là {Thấp, Cao}
Thanh toán của đối thủ thứ i, i (s 1 , …, s n ):
(1) là lợi ích mà đối thủ thứ i nhận được sau khi tất cả các đối thủ và Tự nhiên đã lựa chọn các chiến lược của họ và Trò chơi đã kết thúc; hoặc
(2) là lợi ích dự kiến mà đối thủ đó nhận được như một hàm số của các chiến lược được anh ta và các đối thủ khác lựa chọn
Trò chơi RNTT được tóm tắt trong Bảng 1.1 dưới đây
Một cách thuận tiện là mô tả cả thông tin lẫn hành động đồng thời trong một trật tự chơi Sau đây sẽ là trật tự chơi của Trò chơi nói trên:
1 NewCleaner lựa chọn một trong các quyết định {Ra nhập, ở ngoài}
2 OldCleaner chọn mức giá từ {Thấp, Cao}
Trang 8Bài giảng Lý thuyết trò chơi
Kết cục của một Trò chơi là tập hợp các phần tử cần quan tâm mà những nhà nghiên cứu
chọn ra từ các giá trị của hành động, thanh toán, và các biến số khác sau khi Trò chơi đã kết thúc Các kết cục của Trò chơi RNTT được thể hiện qua cây quyết định sau:
Hình 1 1 Bài toán Ra nhập ngành dưới dạng cây quyết định
Hình 1.2 Bài toán Ra nhập ngành dưới dạng cây Trò chơi
Vì Lý thuyết Trò chơi xem xét các tình huống khi quyết định của một đối thủ luôn phụ
thuộc vào quyết định của các đối thủ khác, do vậy cần phải xét đến chiến lược, tức là kế hoạch
của các đối thủ
Chiến lược s i của đối thủ i là một quy tắc nói cho anh ta biết cần chọn hành động nào tại mỗi thời điểm của Trò chơi khi tập thông tin được coi là đã cho
Trang 9Bài giảng Lý thuyết trò chơi
High Price if NewCleaner Entered, Low Price if NewCleaner Stayed Out
Low Price if NewCleaner Entered, High Price if NewCleaner Stayed Out
High Price No Matter What
Low Price No Matter What
Cân bằng
Lưu ý tập chiến lược là tập hợp của các chiến lược, còn tập kết cục là tập của các biến bất
kỳ được coi là đáng quan tâm Thông thường nhiều tổ hợp chiến lược khác nhau cùng dẫn đến cùng một kết cục Trong Trò chơi RNTT, một kết cục đơn của NewCleaner có thể là kết quả của một trong các các tổ hợp chiến lược sau:
{Đặt giá cao nếu NewCleaner ra nhập, giá thấp nếu NewCleaner ở ngoài}
{Đặt giá thấp nếu NewCleaner ra nhập, giá cao nếu NewCleaner ở ngoài}
Để dự báo được điều gì sẽ xảy ra chúng ta cần chọn lựa một hoặc nhiều tổ hợp chiến lược thể hiện hành vi hợp lý nhất của các đối thủ khi họ hành động để tối đa lợi ích của mình
Một cân bằng là một tổ hợp chiến lược bao gồm những chiến lược tốt nhất của mỗi đối thủ
trong Trò chơi
1, , n
mỗi đối thủ trong số n đối thủ trong trò chơi
Chiến lược cân bằng là các chiến lược mà các đối thủ chọn ra khi cố gắng tối đa các thanh
toán cá nhân của họ Trong lý thuyết trò chơi, cân bằng được sử dụng khác với trong các lĩnh vực kinh tế khác Ví dụ, trong mô hình cân bằng tổng quát, cân bằng là tập giá cả tạo thành từ hành vi
tối ưu của các cá nhân trong nền kinh tế Trong lý thuyết trò chơi, tập giá sẽ là kết cục cân bằng,
nhưng tự thân cân bằng sẽ là một tóm tắt chiến lược _ các quy tắc của cá nhân để mua hoặc bán _ tạo ra kết cục
Khái niệm cân bằng hoặc khái niệm lời giải *
: , , n, , , n
tắc xác định một cân bằng dựa trên các tóm tắt chiến lược có thể và các hàm thanh toán
Chúng ta một cách ẩn ý đã sử dụng một khái niệm cân bằng trong phân tích trên, là quy tắc lựa chọn một chiến lược cho mỗi một trong số hai đối thủ như dự báo của chúng ta về trò chơi Nói chung người ta chỉ chấp nhận một vài khái niệm cân bằng, và những mục còn lại của chương này được giành cho việc tìm kiếm cân bằng sử dụng hai khái niệm nổi tiếng nhất trong số chúng:
chiến lược thống trị và cân bằng Nash
Khái niệm cân bằng sẽ được làm rõ hơn trong các phần sau của chương này
Tính duy nhất
Mô hình có thể không có cân bằng hoặc có nhiều cân bằng Trong trường hợp không có cân bằng, nhà nghiên cứu không thể dự đoán được mô hình, nhưng trong trường hợp ngược lại, nếu có quá nhiều cân bằng thì nhà nghiên cứu cũng không thể xác định chính xác kết cục của mô
Trang 10Bài giảng Lý thuyết trò chơi
-
-
Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL
9
hình Do vậy, tính duy nhất của nghiệm của bài toán là rất quan trọng
1.2 CÁC CHIẾN LƯỢC TRỘI CỦA BÀI TOÁN NỖI NAN GIẢI CỦA NGƯỜI TÙ
a) Định nghĩa:
Đối với một véc tơ bất kỳ yy1, ,y n, ký hiệu yi là y1, ,y i1,y i1, ,y n, là một phần của y không gắn với đối thủ i
Sử dụng ký hiệu này, ví dụ, sSmith là tóm tắt chiến lược của mỗi đối thủ ngoại trừ đối thủ
Smith Tóm tắt này là đặc biệt lý thú cho Smith, vì anh ta sử dụng nó để giúp cho việc lựa chọn
chiến lược riêng của anh ta, và ký hiệu mới sau đây sẽ giúp cho xác định phản ứng tốt nhất của anh ta
Phản ứng tốt nhất của đối thủ i hoặc đáp trả tốt nhất cho các chiến lược si được chọn bởi các đối thủ khác là chiến lược *
Một khái niệm cân bằng quan trọng đầu tiên là cân bằng chiến lược trội (dominance) (hoặc
chiến lược thống trị) được phát biểu như sau:
i
nào đó bất kể các đối thủ khác lựa chọn các chiến lược nào, theo nghĩa bất kể chiến lược nào mà
i
i
s là bị thống trị nếu tồn tại một '
s là một chiến lược thống trị nếu chiến lược đó là một phản ứng tốt nhất
ngặt của đối thủ so với bất kỳ chiến lược nào mà các đối thủ khác có thể chọn, theo nghĩa bất kể
Ví dụ: Nỗi nan giải của người tù
Để minh hoạ cho khái niệm cân bằng chiến lược trội, chúng ta xét bài toán Nỗi nan giải của người tù (NNGCNT) được mô tả trong Bảng 1.2 sau đây:
Phân tích cân bằng bằng khái niệm cân bằng chiến lược trội cho thấy lời giải cân bằng đạt được tại (-8, -8)
Bảng 2: Nỗi nan giải của người tù
Trang 11Bài giảng Lý thuyết trò chơi
Trò chơi hợp tác là một trò chơi trong đó các đối thủ có thể đưa ra các cam kết trói buộc,
như là đối chọi với trò chơi bất-hợp tác, trong đó họ không thể cam kết
Phân biệt giữa các trò chơi hợp tác và bất-hợp tác có mâu thuẫn hoặc không mâu thuẫn, như sẽ được chỉ ra trong các ví dụ sau đây về các tình huống thường được mô hình hóa theo cách này hay cách khác:
Trò chơi hợp tác không mâu thuẫn Các thành viên của lực lượng lao động lựa chọn cần phải tiến
hành các nhiệm vụ khó khăn như nau để phối hợp mọt cách tốt nhất với nhau
Trò chơi hợp tác có mâu thuẫn Mặc cả về giá cả giữa một nhà độc quyền và một độc quyền
mua
Trò chơi bất-hợp tác có mâu thuẫn Nỗi nan giải của người tù
Trò chơi bất-hợp tác không mâu thuẫn Hai công ty đặt ra chuẩn mực sản phẩm mà không có
thông tin liên lạc
1.3 TRỘI LẶP: TRẬN CHIẾN TRÊN BIỂN BISMARCK
Rất ít Trò chơi có cân bằng chiến lược thống trị, nhưng đôi khi khái niệm này vẫn tỏ ra hữu ích mặc dù nó không phải là một cân bằng chiến lược thống trị chính xác theo nghĩa của của nó Điều này được minh hoạ trong mô hình sau:
Chúng ta thấy Trò chơi này không có chiến lược thống trị đúng theo nghĩa của khái niệm này vì đối thủ Imamura không có phương án thống trị thực sự Nhưng chúng ta vẫn có thể giải bài toán này được nhờ sử dụng khái niệm thống trị yếu (hay thống trị yếu)
Chiến lược s’ i được gọi là bị thống trị yếu nếu tồn tại một chiến lược s* i khác nào đó của đối thủ i sao cho nó có thể là tốt hơn và không bao giờ là xấu hơn, tức là chiến lược đó sẽ mang lại cho anh ta một thanh toán cao hơn và không bao giờ mang lại một thanh toán xấu hơn Về mặt toán học, s’ i là bị thống trị yếu (bị thống trị yếu) nếu tồn tại s” i sao cho:
Vậy, cân bằng chiến lược thống trị yếu là sơ đồ chiến lược có được bằng cách xoá bỏ tất
cả các chiến lược bị thống trị yếu của mỗi đối thủ Từ đó chúng ta có khái niệm sau:
Một cân bằng chiến lược lặp là một tổ hợp chiến lược nhận được bằng cách xoá chiến
lược bị thống trị yếu từ tập chiến lược một trong các đối thủ, sau đó tính toán lại xem có xuất hiện chiến lược bị thống trị yếu nào nữa không, sau đó tiếp tục loại bỏ nó nếu có và cứ
Trang 12Bài giảng Lý thuyết trò chơi
-
-
Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL
11
tiếp tục quá trình này cho đến khi mỗi đối thủ còn lại một chiến lược
Áp dụng cho ví dụ trên ta có cân bằng thống trị lặp là (North, North) và đó là điều đã xảy
ra vào năm 1943
Trò chơi có tổng bằng không là một Trò chơi trong đó tổng số các thanh toán của tất cả
các đối thủ luôn bằng không bất kể họ chọn chiến lược nào Trò chơi không phải là Trò chơi có
tổng bằng không là Trò chơi có tổng khác không Đây là một lớp bài toán rất đặc biệt trong Lý
thuyết Trò chơi nhưng chúng không phải là phổ biến trong các bài toán kinh tế
Nhấn và tấm ván và Chờ máng thức ăn tại đầu kia
Boxed Pigs không có cân bằng chiến lược thống trị, vì cái mà con lợn to chọn phụ thuộc vào cái mà nó nghĩ con lợn con sẽ chọn Nếu nó tìn rằng con lợn con sẽ nhấn vào tấm ván, lợn to
sẽ đợi ở máng, nhưng nếu nó tin lợn con sẽ đợi, lợn to sẽ nhấn tấm ván Ở đây tồn tại một cân
bằng thống trị lặp, (Nhấn, Đợi), nhưng chúng ta sẽ sử dụng cách lý luận khác để xét đoán kết cục: cân bằng Nash
chiến lược của anh ta khi đã biết các đối thủ khác không rời bỏ Về mặt hình thức,
Tóm tắt chiến lược (Nhấn, Đợi) là một cân bằng Nash Cách thức để tiếp cận cân bằng
Nash là đề nghị một tóm tắt chiến lược và kiểm tra xem liệu chiến lược của mỗi đối thủ có là
phản ứng tốt nhất cho các chiến lược của những người khác hay không Nếu lợn to chọn Nhấn, lợn nhỏ sẽ muốn chờ Nếu lợn nhỏ chọn Chờ, lợn lớn sẽ muốn nhấn Điều này khẳng định (Nhấn, Chờ) là cân bằng Nash, và trên thực tế đó là cân bằng Nash duy nhất
Trang 13Bài giảng Lý thuyết trò chơi
Mọi cân bằng chiến lược thống trị là một cân bằng Nash, nhưng không phải mỗi cân bằng Nash là một cân bằng chiến lược thống trị Nếu một chiến lược là thống trị nó là một phản ứng
tốt nhất cho bất kỳ chiến lược nào mà các đối thủ khác chọn, kể cả các chiến lược cân bằng của
họ Nếu một chiến lược là một bộ phận của cân bằng Nash, nó chỉ cần là phản ứng tốt nhất cho
các chiến lược cân bằng của các đối thủ khác
Xét mô hình Nỗi nan giải của người tù (NNGCNT) với một đôi chút biến đổi như được thể hiện trong Bảng 1.7’ dưới đây Trong trường hợp này Trò chơi không có cân bằng thống trị, nhưng có cân bằng thống trị lặp là (Confess, Confess) Còn nếu xét theo quan điểm cân bằng Nash thì Trò chơi này có 2 cân bằng Nash, trong đó có một cân bằng Nash thực sự và một cân bằng Nash yếu
Trong trường hợp có quá nhiều cân bằng cần phải có các điều kiện để tinh lọc Ví dụ như trong Trò chơi trên, nếu bổ sung thêm điều kiện tối ưu Pareto thì ta có thể loại trừ bớt một cân bằng (Confess, Confess) ra khỏi các lời giải của bài toán
Cuộc chiến Giới tính
Xét một ví dụ một Trò chơi giữa một người đàn ông và một người đàn bà, khi mà người đàn ông thích đi xem box còn người phụ nữ lại thích đi xem ballet Mặc dù ích kỷ nhưng họ rất yêu nhau nên sẵn sàng hy sinh ưa thích của mình để chiều sở thích của người kia Trò chơi này được biểu hiện trong Bảng 1.7 dưới đây:
Trò chơi này không có cân bằng thống trị lặp nhưng có 2 cân bằng Nash là (Prize Fight, Prize Fight) và (Ballet, Ballet)
Trang 14Bài giảng Lý thuyết trò chơi
-
-
Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL
13
Trong Trò chơi này, nếu có người đi trước thì kết quả có thể bị ảnh hưởng nhiều, ví dụ
người đàn ông có thể mua vé xem box trước Điều này có tên gọi là Lợi thế của người đi trước
Trò chơi Hợp tác
Đôi khi có thể sử dụng mức thanh toán để để lựa chọn giữa các cân bằng Nash Trong Trò chơi dưới đây, Smith và Jones cố gắng quyết định xem nên thiết kế loại máy tính có ổ đĩa mềm lớn hay nhỏ Tình huống của Trò chơi này được biểu hiện trong Bảng 1.8 dưới đây:
Trò chơi này có 2 cân bằng Nash là (Large, Large) và (Small, Small), trong đó cân bằng thứ nhất đạt hiệu quả Pareto, còn cân bằng kia thì không
1.5 CÁC ĐIỂM TRỌNG TÂM
Như chúng ta đã thấy việc có quá nhiều cân bằng sẽ gây khó khăn cho việc dự báo kết quả,
Trang 15Bài giảng Lý thuyết trò chơi
1 Hãy khoanh tròn một trong những con số sau: 100, 14, 15, 16, 17, 18
2 Hãy khoanh tròn một trong những con số sau: 7, 100, 13, 261, 99, 666
3 Hãy đặt tên Đầu hay Cuối
4 Hãy đặt tên Cuối hay Đầu
5 Bạn hãy chia chiếc bánh và sẽ không nhận được gì nếu phần của bạn là 100%
6 Bạn đang cần gặp một người bạn nào đó ở Hà nội Bao giờ? ở đâu?
Tất cả các Trò chơi ở trên đều có rất nhiều cân bằng Nash và việc lựa chọn cân bằng nào liên quan nhiều đến vấn đề tâm lý Xác định một cách hình thức cân bằng nào là điểm trọng tâm
là một công việc rất khó khăn và tuỳ thuộc vào hoàn cảnh Trong ví dụ (1) 100 là điểm trọng tâm
vì nó khác biệt với những số còn lại (nó lớn nhất và xếp đầu tiên) Trong ví dụ (2) Schelling cho rằng 7 là điểm trọng tâm, nhưng Satanist lại cho 666 mới là điểm trọng tâm (3) và (4) là như nhau ngoại trừ trật tự sắp xếp nhưng nhiều khi trật tự sắp xếp lại ảnh hưởng rất nhiều đến kết quả Trong ví dụ (5) thông thường người ta chia theo tỷ lệ 50:50 nhưng nếu năm ngoái bạn đã từng chia theo tỷ lệ 60:40 thì năm nay bạn sẽ lại chia như vậy Trong ví dụ (6) Schelling thấy rất nhiều điểm lý thú, nhưng điều này còn phụ thuộc nhiều vào việc bạn biết nhiều về thành phố Hà nội hay không?
Biên giới là một loại điểm trọng tâm đặc biệt Ví dụ như hai quốc gia có cùng chung biên
giới, một hành động quân sự của một quốc gia nào đó gần đường biên giới sẽ là một dấu hiệu nguy hiểm cho quốc gia kia
Dàn xếp và Thông tin liên lạc đều rất quan trọng nếu không có những điểm trọng tâm rõ
ràng Nếu các bên được thông tin liên lạc với nhau thì họ sẽ có thể hợp tác với nhau như trong Trò chơi Hợp tác có sắp đặt để có được cân bằng hiệu quả Pareto Nếu họ không thể thông tin liên lạc với nhau thì người dàn xếp có thể đứng ra hoà giải, dàn xếp cân bằng giữa họ, và cân bằng bị ảnh hưởng bởi các yếu tố bên ngoài
Một trong những điểm bất lợi trong những điểm trọng tâm là nó gây ra tình trạng không linh hoạt Ví dụ khi Trò chơi được lặp đi lặp lại và các giá trị thanh toán dần thay đổi, khi đó cân bằng cần thiết cũng thay đổi theo, nhưng điểm trọng tâm sẽ khó thay đổi một cách linh hoạt khi điều kiện thay đổi
Trang 16Bài giảng Lý thuyết trò chơi
-
-
Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL
15
Chương 2: THÔNG TIN
2.1 BẢNG CHIẾN LƯỢC VÀ DẠNG MỞ RỘNG CỦA MỘT TRÕ CHƠI
Trong Chương 1 chúng ta đã xem xét bài toán Hợp tác có sắp hạng, được thể hiện lại trong Bảng 2.1 sau đây:
Bảng 2.1 Hợp tác có sắp hạng
Định nghĩa
Bảng chiến lược (hay Bảng chuẩn) bao gồm:
(1) Tất cả các sơ đồ chiến lược có thể s 1 , …, s p
(2) Các hàm số thanh toán gắn si với n-vector thanh toán i , i = 1, …, p
Hay viết ngắn gọn hơn là:
HĐTNDĐI cho thấy chỉ cần một chút thay đổi sẽ làm bảng chiến lược bị thay đổi rất phức tạp Bảng 2.2 sẽ cho chúng ta thấy bảng chiến lược của Trò chơi HĐTNDĐI này:
Trang 17Bài giảng Lý thuyết trò chơi
Thông thường bảng chiến lược là quá phức tạp để mô tả một Trò chơi, do vậy ngoài bảng
chiến lược người ta còn hay sử dụng dạng mở rộng và cây chiến lược để mô tả một Trò chơi
- Nút trước nút X là một nút phải đạt đến trước khi đạt đến nút X
- Nút đầu là một nút không có nút trước
- Nút cuối hoặc điểm kết thúc là một nút không có nút tiếp theo
- Cành là một hành động trong tập hành động của đối thủ tại một nút cụ thể
- Đường đi là một chuỗi các nút và cành bắt đầu từ nút đầu tới nút cuối
Những khái niệm này có thể được sử dụng để định nghĩa một dạng mở rộng và một cây trò chơi
Dạng mở rộng là một mô tả của Trò chơi bao gồm:
(1) Cấu hình của các nút và cành không có vòng lặp từ nút đầu đến các nút cuối
(2) Một chỉ dẫn nút nào thuộc về đối thủ nào
(3) Các giá trị xác suất mà Tự nhiên sử dụng để chọn lựa các cành tại các nút của nó (4) Tập thông tin mà tại đó các nút của mỗi đối thủ được phân chia
(5) Thanh toán cho mỗi đối thủ tại mỗi nút cuối
Trang 18Bài giảng Lý thuyết trò chơi
-
-
Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL
17
Cây Trò chơi giống hệt như dạng mở rộng ngoại trừ (5) được thay bởi
(5') các kết cục tại mỗi nút cuối
Payoffs to: (Smith,Jones)
Hình 2.1: Đi theo người dẫn đầu I trong dạng mở rộng
Ví dụ về dạng mở rộng và cây trò chơi trong trường hợp của HĐTNDĐI được biểu diễn trong hình vẽ dưới đây: Hình 2.1
Trong Hình 2.2, chúng ta cho Smith đi trước nhưng không cho Jones biết gì về bước đi của Smith, do vậy Trò chơi vẫn được xem như Trò chơi đồng thời Mô tả của Trò chơi này được bổ sung thêm một đường chấm chấm để thể hiện thông tin của Jones vẫn giống như trường hợp hai đối thủ cùng tiến hành nước đi
Xem Hình vẽ 2.4 Smith tiến hành bước đi S1 vào năm 1984 và Jones tiến hành một trong các nước đi J1, J2, J3, J4 vào năm 1985 hoặc 1986 Smith biết rõ bước đi của mình, nhưng Jones chỉ có thể nói rằng Smith đã đi đến J1, J2 hoặc “chỗ khác”; anh ta không phân biệt được J3 với J4
S
J1 11 11 11 11 11 11
11 J2
S
J1 11 11 11 11 11 11
11 J2
Trang 19Bài giảng Lý thuyết trò chơi
Hình 2.3 Tập thông tin và Bảng phân chia thông tin
Để mô tả tập thông tin trên biểu đồ, chúng ta cần vẽ một đường xung quanh các nút của cùng một tập thông tin Tuy nhiên, cần lưu ý, tại mỗi thời điểm trong Trò chơi luôn có nhiều tập thông tin của nhiều đối thủ khác nhau, nhưng để tránh rườm rà, lộn xộn, người ta thường chỉ biểu diễn tập thông tin của đối thủ nào tại bước đi của mình
Bảng phân chia thông tin là một bộ các tập thông tin sao cho:
(1) mỗi đường đi được thể hiện bởi một nút trong một tập thông tin đơn trong bảng phân cách, và
(2) các nút trước của tất cả các nút trong cùng một tập thông tin đơn nằm trong cùng một tập thông tin
Bảng phân chia thông tin thể hiện các vị trí khác nhau mà đối thủ biết anh ta có khả năng phân biệt tại một giai đoạn của Trò chơi bằng cách phân chia tập tất cả các nút có thể thành các tập con có tên là tập thông tin Một trong các bảng phân chia thông tin của Smith là {{J1}, {J2}, {J3}, {J4}} Tập thông tin này không thể bao gồm thêm tập thông tin {S1}, vì nếu vậy thì đường
đi qua S1 và J1 sẽ được biểu diễn bởi hai nút trong cùng một tập thông tin (trái với định nghĩa tập thông tin) Thay vào đó, {S1} nằm trong một bảng phân chia thông tin riêng biệt tạo thành bởi chính tập thông tin này Bảng phân chia thông tin chỉ phù hợp theo giai đoạn chứ không phụ thuộc vào thứ tự thời gian
Bảng phân chia thông tin {{J1}, {J2}, {J3, J4}}của Jones kém hơn bảng phân chia thông tin của Smith vì một trong hai lý do: hoặc số tập thông tin trong bảng phân chia thông tin của Jones
ít hơn số tập thông tin của Smith hoặc số phần tử trong một tập thông tin của Jones nhiều hơn số phần tử trong các tập thông tin của Smith Bảng 2.3 cho ta một số ví dụ về bảng phân chia thông tin
Bảng 2.3 Bảng phân chia thông tin
Trang 20Bài giảng Lý thuyết trò chơi
Bảng phân chia thông tin (bpctt) I là bpctt của Smith, bpctt II là bpctt của Jones Chúng ta
nói bpctt II thô hơn và bpctt I tinh hơn Kết hợp hai hay nhiều tập thông tin vào một bpctt _ là
điều làm cho giảm số tập thông tin và tăng số các nút trong một hay nhiều tập thông tin của bpctt
_ sẽ làm cho bpctt này thô hơn Tách biệt một hoặc nhiều tập thông tin trong một bpctt _ là điều
làm tăng số các tập thông tin và làm giảm số các nút trong một hay nhiều tập thông tin _ sẽ làm
cho bpctt này tinh hơn Nếu ta làm tinh một bpctt đến cùng thì chúng ta sẽ nhận được một một bpctt bao gồm các tập thông tin đơn, tức là các tập thông tin chỉ bao gồm một nút, như bpctt I
Ngược lại, làm thô một bpctt đến cùng thì chúng ta sẽ nhận được một bpctt giống như bpctt II trong Bảng 2.3 nói trên, tức là khi đối thủ không thể phân biệt được bất cứ nút nào bằng quan sát trực tiếp
Chất lượng thông tin được xác định một cách độc lập với lợi ích của nó đối với các đối thủ:
có thể có khả năng xảy ra là thông tin của đối thủ được cải thiện nhưng hậu quả lại làm cho thanh toán của anh ta bị giảm đi
Hiểu biết chung
Chúng ta đã ngầm giả thiết các đối thủ biết hình dáng của cây trò chơi Và trên thực tế, chúng ta cũng đã giả thiết các đối thủ cũng biết các đối thủ khác biết hình dáng của cây trò chơi Khái niệm “hiểu biết chung” được sử dụng để tránh phải nhắc đi nhắc lại giả thiết có tính truy hồi sau:
Thông tin là hiểu biết chung nếu tất cả các đối thủ đều biết nó, nếu như mỗi đối thủ biết
rằng tất cả các đối thủ đều biết nó, nếu mỗi đối thủ đều biết rằng tất cả các đối thủ đều biết rằng tất cả các đối thủ biết nó, và …
2.3 THÔNG TIN KHÔNG HOÀN HẢO, TẤT ĐỊNH, ĐỐI XỨNG VÀ ĐẦY ĐỦ
Chúng ta phân biệt cấu trúc thông tin của một Trò chơi theo bốn cách cho nên một Trò chơi
cụ thể nào đó có thể có thông tin hoàn hảo, đầy đủ, tất định và đối xứng Bảng phân loại được trình bày trong Bảng 2.4
Bảng 2.4 Bảng phân loại thông tin
Loại thông
tin
ý nghĩa
Hoàn hảo Mỗi tập thông tin đều là tập đơn
Tất định Tự nhiên không đi sau bất kỳ một đối thủ nào
Đối xứng Không có đối thủ nào có thông tin khác với các đối thủ khác khi anh
ta tiến hành bước đi hoặc ở nút cuối Đầy đủ Tự nhiên không tiến hành bước đi đầu tiên hoặc bước khởi đầu của
Tự nhiên là quan sát được bởi tất cả các đối thủ
Trang 21Bài giảng Lý thuyết trò chơi
-
-
Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL
20
Loại thứ nhất chia các Trò chơi thành Trò chơi có thông tin hoàn hảo và Trò chơi có thông
tin không hoàn hảo Trong Trò chơi có thông tin hoàn hảo mỗi tập thông tin đều là một tập đơn Trong trường hợp ngược lại Trò chơi có thông tin không hoàn hảo Ví dụ Hợp tác có sắp hạng
là Trò chơi có thông tin không hoàn hảo vì có bước đi đồng thời, còn HĐTNDĐI là Trò chơi có thông tin hoàn hảo Tất cả các Trò chơi có thông tin không đầy đủ và Trò chơi có thông tin phi
đối xứng đều là Trò chơi có thông tin không hoàn hảo
Trong Trò chơi tất định Tự nhiên không tiến hành bước đi sau bất kỳ đối thủ nào, trong trường hợp ngược lại thì Trò chơi được gọi là Trò chơi bất định Bước đi của Trò chơi bất định
có thể được tiết lộ hoặc không tiết lộ cho các đối thủ ngay lập tức Trò chơi tất định có thể trở thành Trò chơi có thông tin hoàn hảo nếu nó không có các bước đi đồng thời
Đối với các Trò chơi có thông tin bất định, nếu chúng ta loại bỏ đối thủ Tự nhiên và thay thế thanh toán bởi các kỳ vọng của chúng thì chúng ta sẽ có thể Trò chơi bất định trở thành Trò chơi tất định
Trong một Trò chơi có thông tin đối xứng, tập thông tin của một đối thủ tại
(1) nút bất kỳ, nơi mà anh ta chọn lựa hành động, hoặc
Trang 22Bài giảng Lý thuyết trò chơi
Trong Trò chơi có thông tin không đầy đủ, Tự nhiên tiến hành bước đi đầu tiên và ít nhất
có một đối thủ không quan sát thấy điều này Nếu không thì Trò chơi là có thông tin đầy đủ
Một Trò chơi có thông tin không đầy đủ thì cũng có thông tin không hoàn hảo vì tập thông tin nào đó có nhiều hơn một nút Hai loại Trò chơi có thông tin đầy đủ nhưng không hoàn hảo là: Trò chơi có các bước đi đồng thời và trò chơi mà trong quá trình sau này của Trò chơi, Tự nhiên tiến hành bước đi không tiết lộ tức thời cho tất cả các đối thủ
Nhiều Trò chơi có thông tin không đầy đủ là Trò chơi có thông tin phi đối xứng, nhưng hai khái niệm này là không tương đương Nếu không có bước đi ban đầu của Tự nhiên, nhưng Smith tiến hành bước đi đầu tiên mà Jones không quan sát được và sau đó Smith tiến hành các bước đi sau đó trong trò chơi thì Trò chơi có thông tin phi đối xứng nhưng đầy đủ Chúng ta sẽ gặp lại tình huống này trong bài toán Ông chủ - Người làm công trong Chương 7 sau này
2.4 BIẾN ĐỔI HARSANYI VÀ TRÕ CHƠI BAYER
Phép biến đổi Harsanyi: Hành động theo người dẫn đầu III (HĐTNDĐIII)
Khái niệm “thông tin không đầy đủ” được sử dụng theo hai nghĩa khác nhau trong các tài liệu tham khảo và thông thường không được định nghĩa một cách chính thức Định nghĩa trong mục 2.3 thường được các nhà kinh tế sử dụng, nhưng nhiều khi họ lại sử dụng định nghĩa cũ về thông tin không đầy đủ như sau
có thông tin không đầy đủ Theo định nghĩa cũ, một Trò chơi có thông tin không đầy đủ đã được biến đổi thành một Trò chơi có thông tin đầy đủ Theo định nghĩa mới, Trò chơi nguyên thuỷ không được định nghĩa rõ ràng, còn Trò chơi đã được biến đổi là Trò chơi có thông tin không đầy đủ
Chúng ta hãy xem xét Trò chơi HĐTNDĐIII như một ví dụ về phép biến đổi Harsanyi Giả
sử Jones không biết chính xác về thanh toán của Trò chơi Anh ta có một số ý tưởng nào đó về thanh toán, và chúng ta sử dụng phân phối xác suất chủ quan để mô tả niềm tin này của anh ta Anh ta gán một xác suất 0.7 cho khả năng Trò chơi sẽ là (A) trong Hình 2.6 (đó chính là HĐTNDĐI), 0.1 cho khả năng Trò chơi sẽ là (B), và 0.2 cho khả năng (C) Trong thực tế Trò
Trang 23Bài giảng Lý thuyết trò chơi
Trò chơi không thể phân tích được dưới dạng 2.6 Một cách tiếp cận tự nhiên để sử lý tình huống như vậy là sử dụng biến đổi Harsanyi Chúng ta có thể mô hình hoá lại bài toán như trong Hình 2.7, trong đó Tự nhiên tiến hành bước đi đầu tiên và lựa chọn thanh toán của các Trò chơi (A), (B) và (C) phù hợp với phân phối xác suất chủ quan của Jones Smith quan sát được bước đi của Tự nhiên, còn Jones thì không Hình 2.7 mô tả cùng một Trò chơi như Hình 2.6, nhưng bây giờ chúng ta có thể phân tích nó Cả Smith lẫn Jones đều biết các quy tắc chơi, và khác biệt giữa
họ là Smith quan sát thấy bước đi của Tự nhiên Tuy nhiên, cần lưu ý, vì là phân phối xác suất
mà Jones đưa ra là phân phối xác suất chủ quan, nên phân phối này có thể không phải là phân phối mà Tự nhiên thực sự thực hiện trong thực tế
Hình 2.6 Trò chơi HĐTNDĐIII nguyên thuỷ
Thông thường cái mà Tự nhiên chọn ở bước đi đầu tiên của Trò chơi là tập chiến lược, bảng phân chia thông tin, và hàm thanh toán của một đối thủ Chúng ta nói rằng đối thủ có thể là một trong một số “kiểu”, một khái niệm mà chúng ta sẽ có dịp quay lại ở các chương sau Khi Tự nhiên tiến hành bước đi, đặc biệt khi nó ảnh hưởng đến các tập chiến lược và thanh toán của tất
cả các đối thủ thì người ta thường nói rằng Tự nhiên đã chọn một “trạng thái của tự nhiên” cụ thể Trong Hình 2.7 Tự nhiên chọn trạng thái của tự nhiên là một trong các trạng thái (A), (B), hoặc (C)
Kiểu của một đối thủ là tập chiến lược, bảng phân chia thông tin, và hàm thanh toán mà
Tự nhiên chọn cho anh ta tại bước đi đầu tiên của Trò chơi có thông tin không đầy đủ
Trạng thái của tự nhiên là bước đi của Tự nhiên
Trang 24Bài giảng Lý thuyết trò chơi
bước đi của Tự nhiên Giả thiết mô hình hoá này có tên gọi là học thuyết Harsanyi
Hình 2.7 HĐTNDĐIII sau biến đổi Harsanyi
Một hàm ý của học thuyết Harsanyi là ít ra các đối thủ là dễ tiếp thu những điều mới mẻ trong quan điểm của mình Chủ đề tiếp theo của chúng ta sẽ là một đối thủ cập nhật niềm tin của anh ta khi tiếp nhận những thông tin mới như thế nào Có thể là nhờ việc quan sát bước đi của Tự nhiên hoặc có thể là nhờ việc quan sát các bước đi của đối thủ khác _ một người nhận được nhiều thông tin tốt hơn
Cập nhật niềm tin bằng quy tắc Bayer
Khi phân loại cấu trúc thông tin của một Trò chơi chúng ta không đề cập đến việc một đối thủ nào đó có thể suy luận được gì từ các bước đi của các đối thủ khác Khi mô tả cây Trò chơi,
chúng ta chỉ cố gắng mô tả những phần tử ngoại sinh của mô hình không bị làm vẩn đục bởi các
quan điểm cân bằng Tuy nhiên, để xác định được cân bằng, chúng ta cần xem xét những niềm tin này thay đổi như thế nào trong suốt quá trình chơi
Một bộ phận của quy tắc chơi là việc thu thập các niềm tin tiền nghiệm của các đối thủ
khác nhau _ các niềm tin mà họ sẽ cập nhật trong quá trình chơi Một đối thủ giữ các niềm tin tiền nghiệm liên quan đến kiểu của các đối thủ khác, và khi xem xét các bước đi của các đối thủ khác anh ta cập nhật niềm tin của mình với giả định họ đang theo đuổi hành vi cân bằng
Cân bằng Bayer là cân bằng Nash mà trong đó các đối thủ cập nhật niềm tin theo quy tắc Bayer Khi này thủ tục 2 bước để kiểm tra cân bằng Nash trở thành thủ tục 3 bước như sau:
(1) Đề xuất sơ đồ chiến lược
Trang 25Bài giảng Lý thuyết trò chơi
anh ta quan sát bước đi của Smith _ Large Khi thấy Large, Jones cập nhật niềm tin hậu nghiệm
của mình Prob(Tự nhiên chọn (A)| Smith chọn Large)
Quy tắc Bayer cho thấy làm thế nào để khôi phục được niềm tin tiền nghiệm khi có thông tin mới giống như bước đi của Smith ở đây hai thông tin được sự dụng: xác suất khi thấy Smith chọn trạng thái tự nhiên (A), Prob(Large| (A)), và xác suất khi thấy Smith chọn Large khi Tự nhiên không chọn (A), Prob(Large| (B) hoặc (C)) Từ hai con số này Jones có thể tính được xác suất Prob(Smith chọn Large), là giá trị xác suất cận biên khi thấy Large như kết quả của một trong những trạng thái tự nhiên mà Tự nhiên có thể chọn
Để xác định được hậu nghiệm của mình Prob(Tự nhiên chọn (A)|Smith chọn Large), Jones sử dụng xác suất và tiền nghiệm của anh ta Xác suất đồng thời của việc thấy Smith chọn Large và Tự nhiên chọn (A) là:
Vì cái
mà Jones cần tính là Prob (A| Large) cho nên chuyển vế ta có:
| Prob Large A Prob A |
Prob A Large
Prob Large
Thay (1) vào (3) ta có hậu nghiệm mà Jones cần tìm:
Tổng quát hơn, từ bước đi x của Tự nhiên và số liệu quan sát được:
| Prob data x Prob x |
Prob x data
Prob data
Công thức (6) cho ta lời phát biểu của quy tắc Bayer
(Xác suất hậu nghiệm cho bước đi của Tự nhiên) = [(Khả năng của bước đi của Đối thủ).(Xác suất tiền
nghiệm cho bước đi của Tự nhiên)]/(bước đi của Đối thủ) (6)
Cập nhật niềm tin trong HĐTNDĐIII
Bây giờ chúng ta sẽ quay trở lại với những con số trong ví dụ HĐTNDĐIII để sử dụng quy tắc vừa nhận được Jones có tiền nghiệm là xác suất của sự kiện Tự nhiên chọn (A) bằng 0.7 và anh ta cần cập nhật niềm tin khi nhìn thấy Smith chọn Large Tiền nghiệm của Jones là Prob(A)
= 0.7, và anh ta cần tính Prob(A|Large)
Sử dụng Quy tắc Bayer từ phương trình (4), chúng ta cần các giá trị Prob(Large| A), Prob(Large| B) và Prob(Large| C) Những giá trị này phụ thuộc vào cái mà Smith sẽ làm tại cân
Trang 26Bài giảng Lý thuyết trò chơi
-
-
Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL
25
bằng, bởi vậy các niềm tin của Jones không thể được tính toán độc lập với cân bằng
Như là một ứng viên cho vị trí cân bằng trong HĐTNDĐIII, Smith cần phải chọn Large nếu trạng thái tự nhiên là (A) hoặc (B) và chọn Small nếu trạng thái là (C) và Jones phản ứng Large bằng Large, phản ứng với Small bằng Small Điều này có thể ký hiệu là (L| A, L| B, S| C; L| L, S| S) Chúng ta sẽ kiểm tra rằng đây có phải là một cân bằng không, bắt đầu với việc tính toán Prob(A| Large)
Nếu Jones quan sát thấy Large, anh ta có thể loại trừ khả năng (C), nhưng anh ta vẫn chưa biết trạng thái thực là (A) hay (B) Quy tắc Bayer cho anh ta biết rằng xác suất hậu nghiệm của (A) là:
Và xác suất hậu nghiệm của (B) là 1 – 0,875 = 0.125 Nhưng chúng ta cũng có thể tính bằng công thức tương tự như (7) là:
Hình 2.8 minh hoạ Quy tắc Bayer
Tính toán tướng tự đối với Prob(A| Small) Sử dụng (4) ta có:
Trang 27Bài giảng Lý thuyết trò chơi
có thể dàn xếp với nhau bên ngoài toà án
Vì trên thực tế, Trò chơi này bao gồm từ hai Trò chơi: bên bị có tội và ngược lại, bên bị là
vô tội Vì vậy chúng ta để Tự nhiên đi trước và quyết định bên bị có tội với một xác suất là q và không có tội với một xác suất là 1 – q, nhưng điều này không được tiết lộ cho bên đơn, mà chỉ mình bên bị là biết rõ Ta có tóm tắt sau:
Trò chơi dàn xếp Png Đối thủ
Bên đơn và bên bị
Trật tự chơi
(0) Tự nhiên chọn bên bị là có tội với xác suất q = 0,13 và vô tội với xác suất 1 – q
(1) Bên đơn quyết định Khởi kiện hoặc chỉ ấm ức
(2) Bên bị đề nghị Dàn xếp với một khối lượng bồi thường là S = 0,15 cho bên bị hoặc Kháng cự lại với S = 0
(3) Có hai khả năng:
a) Nếu bên bị đề nghị S = 0,15 thì bên đơn có thể Dàn xếp hoặc Từ chối và ra toà
b) Nếu bên bị đề nghị S = 0 thì bên đơn có thể Bỏ kiện với chi phí P = 0 cho mình và D = 0 cho bên bị, hoặc kiện ra toà với chi phí P = 0.1 cho bản thân và D = 0,2 cho bên bị (4) Nếu trường hợp phải ra toà thì bên đơn sẽ thắng một khoản W=1 nếu bên bị có tội, và W = 0 nếu bên bị vô tội
Thanh toán
Bên đơn có thanh toán là S + W – P và bên bị có thanh toán là - S – W – D
Chúng ta có biểu diễn của Trò chơi này trên Hình 2.9 sau đây:
Trang 28Bài giảng Lý thuyết trò chơi
-
-
Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL
27
Trang 29Bài giảng Lý thuyết trò chơi
-
-
Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL
28
Chương 3 CÁC CHIẾN LƯỢC HỖN HỢP VÀ LIÊN TỤC
3.1 CHIẾN LƯỢC HỖN HỢP: TRÕ CHƠI PHÖC LỢI
Chúng ta sẽ mở rộng khái niệm cân bằng Nash để đưa ra các dự báo về các kết cục cho những trường hợp không có chiến lược trội và cả khi không có cân bằng Nash thông thường Thông thường sẽ rất có lợi và thực tế khi mở rộng không gian chiến lược bằng cách thêm vào các chiến lược ngẫu nhiên và khi đó cân bằng Nash hầu như luôn tồn tại Chiến lược ngẫu nhiên được gọi là “chiến lược hỗn hợp”
Một chiến lược thuần tuý gắn mỗi một tập thông tin có thể của đối thủ với một hành động
có thể chọn bất kỳ một trong số một vài hành động khác nhau trong tình huống đã cho Đó là một điều không được dự báo trước, nhưng lại có lợi cho anh ta và chiến lược hỗn hợp thường xuyên xảy ra trong thực tế
Trò chơi Phúc lợi
Trò chơi Phúc lợi mô hình hoá một chính phủ muốn giúp đỡ người nghèo tìm kiếm công ăn việc làm, nhưng không giúp đỡ nếu người nghèo không tìm kiếm công ăn việc làm Bài toán này cũng giống như bài toán cha mẹ quyết định giúp đỡ một đứa con lười biếng ở một mức độ bao nhiêu Chúng ta xét một ví dụ được cho ở Bảng 3.1 sau đây
Nhận xét: không có cân bằng Nash như được định nghĩa trong các chương trước, tuy nhiên Trò chơi này sẽ có cân bằng Nash hỗn hợp Thanh toán của các đối thủ là các giá trị kỳ vọng của các thanh toán từ Bảng 3.1 Nếu Chính phủ chơi Aid với xác suất và Người nghèo chơi Làm việc với xác suất thì kỳ vọng thanh toán của Chính phủ là:
Trang 30Bài giảng Lý thuyết trò chơi
ra được số người nghèo muốn Làm việc trong tổng số những người nghèo tại khu vực cần Giúp
đỡ
3.2 MỘT SỐ TRÕ CHƠI ỨNG DỤNG
Trò chơi Gà con và Phương pháp cân bằng thanh toán
Trang 31Bài giảng Lý thuyết trò chơi
Trò chơi nói trên có hai cân bằng Nash thuần tuý, tuy nhiên các cân bằng này là phi đối xứng, do
đó khó có thể kết luận được cân bằng nào sẽ thực sự xảy ra Do vậy, để bảo đảm tính đối xứng,
có lẽ cân bằng hỗn hợp sẽ là tốt nhất trong trường hợp này
Để xác định cân bằng chúng ta sử dụng phương pháp cân bằng thanh toán, thay vì phải sử
dụng đạo hàm Hơn nữa, lưu ý rằng bài toán này là đối xứng, cho nên chỉ cần sử dụng một giá trị xác suất thay vì hai xác suất khác nhau
đường của hai cậu bé Nhưng điểu gì sẽ xảy ra khi x = 0,5? Khi đó sẽ bằng 2, là điều không thể
có được vì giá trị xác suất chỉ nằm giữa 0 và 1 mà thôi Do vậy, khi x = 0,5, chỉ còn lời giải cân
bằng thuần tuý, chứ không thể tồn tại cân bằng hỗn hợp được nữa
Chiến tranh Tiêu hao
Ta hãy hình dung Smith và Jones điều hành hai công ty trong một ngành công nghiệp độc quyền tự nhiên với một mức cầu đủ mạnh để một công ty có thể sinh lợi nhưng không đủ cho cả hai công ty cùng tồn tại Các hành động có thể là Tiếp tục ở lại trong ngành và Rời bỏ ngành Khi
cả hai cùng Tiếp tục ở lại ngành, mỗi đối thủ đều nhận được một khoản là - 1 Nếu một công ty Rời bỏ ngành thì công ty còn lại sẽ nhận được một khoản lợi nhuận độc quyền bằng 3 Giả sử tỷ
lệ chiết khấu là r > 0, mặc dù điều này không thực sự có ý nghĩa trong mô hình, thậm chí thời hạn chơi có thể là vô hạn
Chiến tranh Tiêu hao có một dãy trù mật các cân bằng Nash Một cân bằng là Smith chọn (Tiếp tục ở lại ngành bất kể Jones làm gì) và Jones chọn Rời bỏ ngành ngay lập tức, là cân bằng tốt nhất cho cả hai Nhưng chúng ta chọn lời giải đối xứng trong đó mỗi đối thủ chọn một cân bằng hỗn hợp: xác suất cố định để Rời bỏ ngành trong khi đối thủ của mình vẫn còn chưa Rời
Trang 32Bài giảng Lý thuyết trò chơi
Nếu Smith rời bỏ ngành, anh ta sẽ nhận được một khoản V Rời bỏ ngành = 0
Nếu Smith tiếp tục ở lại ngành, cái anh ta nhận được sẽ còn phụ thuộc vào cái mà Jones làm Về măt ký hiêu, ta có:
Sau khi biến đổi một chút giá trị này biến thành:
Sau khi cho vào phương trình V Tiếp tục ở lại ngành = V Rời bỏ ngành = 0 chúng ta nhận được kết quả là = 0,25 tại cân bằng và giá trị này độc lập với tỷ lệ chiết khấu r
Chiến lược tương quan
Liệu các đối thủ có thể sử dụng cùng một thiết bị ngẫu nhiên cho các chiến lược hỗn hợp của họ hay không (VD: tung đồng xu, máy xổ số…) Nếu họ có thể, chúng ta gọi các chiến lược
tạo thành là các chiến lược tương quan
Thông thường thiết bị ngẫu nhiên hóa không được mô hình hóa một cách tường minh khi một mô hình viện dẫn tới cân bằng tương quan
Một cách để mô hình hóa các chiến lược tương quan là chỉ ra một bước đi trong đó Tự nhiên trao cho mỗi đối thủ khả năng cam kết hành động trước ví dụ như Tiếp tục với xác suất bằng nhau
Một thiết bị phối hợp khác, hữu ích trong các trò chơi có một vấn đề về hợp tác, giống như
Trận chiến Giới tính, là cheap talk Cheap talk liên quan tới thông tin liên lạc không tốn kém
trước khi trò chơi thực sự bắt đầu
3.3 CHIẾN LƯỢC HỖN HỢP VỚI CÁC THAM SỐ TỔNG QUÁT VÀ TRÕ CHƠI
Trang 33Bài giảng Lý thuyết trò chơi
Phân loại Trò chơi với chiến lược hỗn hợp
Bảng 3.5: Các trò chơi 2-2 với Cân bằng chiến lược hỗn hợp
Các trò chơi bất hợp tác Trò chơi hợp tác Trò chơi cống hiến
Trò chơi Bất hợp tác có một cân bằng hỗn hợp đơn Thanh toán hoặc là (a) a > c, d > b, x
> w, và y > z, hoặc (b) c > a, b > d, w > x, và z > y Trò chơi Phúc lợi là một Trò chơi Bất hợp tác, cũng giống như Trò chơi Kiểm toán trong phần tiếp theo
Trò chơi Hợp tác có ba cân bằng: hai cân bằng chiến lược thuần tuý đối xứng và một cân
bằng chiến lược hỗn hợp Thanh toán có dạng a > c, d > b, w > x và z > y Trò chơi Hợp tác có
sắp đặt và Chiến tranh Giới tính là hai biến thể của Trò chơi Hợp tác, trong đó các đối thủ có cùng một cân bằng chiến lược thuần tuý đối xứng nhau
Trò chơi Cống hiến có ba cân bằng: hai cân bằng chiến lược thuần tuý phi đối xứng và
một cân bằng chiến lược hỗn hợp Thanh toán là c > a, b > d, x > w, và y > z Một điều kiện nữa cũng cần phải được thoả mãn là: c < b và y > x
Sở dĩ có tên gọi là Cống hiến là bởi vì thông thường trong các bài toán công cộng, các đối thủ muốn thực hiện một số hành động để cung cấp hàng hoá công cộng, nhưng muốn người khác phải gánh chịu chi phí Khác với Trò chơi NNGCNT, trong Trò chơi Cống hiến các đối thủ muốn một mình gánh chịu chi phí nếu cần thiết
Bây giờ chúng ta xem xét một Trò chơi cống hiến cụ thể để thấy được khả năng mở rộng một bài toán 2-2 sang một bài toán có nhiều đối thủ Đó là Trò chơi Trách nhiệm Dân sự được trình bày trong Bảng 3.6, trong đó Smith và Jones cùng quan sát thấy một vụ trộm, và mỗi một đối thủ đều muốn có người đi gọi cảnh sát để ngăn chặn vụ trộm này (vì khi đó lợi ích của họ sẽ được tăng thêm), nhưng người này muốn người kia đi báo cảnh sát vì nếu không, thanh toán của anh ta sẽ bị giảm đi ít nhiều
a,ω b,x
a,ω b,x
Trang 34Bài giảng Lý thuyết trò chơi
*N Phương trình (17) cho ta thấy *N = 0,3 cho nên *N = 0,3.*, là đại lượng tăng theo N Khi
N tăng lên 38, xác suất của trường hợp không ai đi báo cảnh sát sẽ là xấp xỉ 0,29, vì * xấp xỉ 0,97 Đó là trường hợp của một vụ án ở New york trong thời gian cách đây không xa
3.4 NGẪU NHIÊN NGƯỢC VỚI HỖN HỢP: TRÕ CHƠI KIỂM TOÁN
Ba mô hình tiếp theo sẽ minh hoạ sự khác biệt giữa chiến lược hỗn hợp và hành động ngẫu nhiên, một khác biệt tinh tế nhưng rất quan trọng
Trong cả ba trò chơi, chi phí của kiểm toán là C , trong đó C < 4 và chi phí để bị bắt là hình phạt F > 1
Bảng 8 chỉ ra một cách: trò chơi có bước-đi-đồng-thời 2-2
Trò chơi Kiểm toán I là trò chơi bất-hợp tác, với cân bằng chiến lược hỗn hợp duy nhất
Phương pháp cân bằng-thanh toán nói cho chúng ta là
Và
Trang 35Bài giảng Lý thuyết trò chơi
Trò chơi Kiểm toán II
Mô hình hóa như một trò chơi kế tiếp: IRS chọn chính sách của chính phủ trước, và các kẻ tình nghi phản ứng với chính sách này
Cân bằng chiến lược thuần túy: IRS chọn Kiểm toán, dự đoán rằng kẻ tình nghi sau đó sẽ chọn Tuân thủ
Các thanh toán là 4 – C cho IRS và -1 cho các kẻ tình nghi (giống hệt Kiểm toán I nhưng
có nhiều kiểm toán hơn và ít gian lận hơn và ít thanh toán-phạt hơn.)
Trò chơi Kiểm toán III
Giả sử IRS không phải chấp nhận một chính sách kiểm toán hoặc tin cậy mọi kẻ tình nghi, nhưng thay vào đó có thể kiểm toán một mẫu ngẫu nhiên
IRS tuyên bố trước rằng sẽ kiểm toán một mẫu ngẫu nhiên 1/ F những kẻ tình nghi (lựa chọn một phần a của giao hoàn thuế để kiểm toán.)
Chúng ta biết rằng IRS muốn ngăn chặn trốn thuế vì nó muốn chọn = 1 và sao chép kết quả của Kiểm toán II nếu nó phải làm như vậy Nó sẽ chọn sao cho:
Tức là:
Tại cân bằng, vì vậy IRS sẽ chọn = 1/F và Doanh nghiệp sẽ chọn Tuân thủ Thanh toán của IRS sẽ là 4 - C, là giá trị tốt hơn 4 – C trong hai Trò chơi trên, còn thanh toán của Doanh nghiệp vẫn là - 1 như trước đây
Cân bằng của IRS là cân bằng chiến lược thuần tuý, mặc dù hành động của nó là ngẫu nhiên Điều này khác với Kiểm toán I, vì IRS phải đi trước và tiến hành kiểm toán tốn kém thậm chí cả khi Doanh nghiệp Tuân thủ Kiểm toán III còn khác hai Trò chơi kia từ một khía cạch khác nữa: tập hành động của IRS là liên tục Trong Kiểm toán I và II, tập hành động là {Kiểm toán, Tin cậy} mặc dù tập chiến lược là [0, 1] trong chiến lược hỗn hợp Trong Kiểm toán III, tập hành động là [0, 1] mặc dù tập chiến lược hỗn hợp là không thể có bởi vì Trò chơi
có những bước đi kế tiếp
3.5 CÁC CHIẾN LƯỢC LIÊN TỤC: TRÕ CHƠI COURNOT
Đa số các trò chơi cho tới nay được giới thiệu có các không gian chiến lược rời rạc
Trang 36Bài giảng Lý thuyết trò chơi
-
-
Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL
35
Trò chơi Cournot, có một không gian chiến lược liên tục thậm chí không có hỗn hợp Nó
mô hình hóa tình trạng độc quyền đôi (duopoly) trong đó các công ty lựa chọn các mức sản lượng trong cạnh tranh với nhau
Trò chơi Cournot Đối thủ:
Công ty Apex và Brydox
Trật tự chơi
Apex và Brydox đồng thời chọn khối lượng hàng bán ra là qa và qb từ tập [0, ),
Thanh toán
Chi phí cận biên là hằng số c = 12 Cầu là tổng khối lượng bán được, Q = q a + q b và chúng ta sẽ
giả thiết cầu này là tuyến tính (để biết tổng quát, hãy xem Chương 14), và, trên thực tế, sẽ sử dụng hàm cụ thể sau:
Thanh toán của các đối thủ là lợi nhuận thu được
Để giải quyết bài toán này, chúng ta phải đưa ra khái niệm hàm phản ứng tốt nhất của
mỗi công ty, tức là một hàm mà trong đó, ứng với mỗi lựa chọn của đối thủ, công ty sẽ đưa ra một khối lượng tối ưu cho chính bản thân mình Các đường này được mô tả trong Hình 3.1 sau đây
Hàm phản ứng tốt nhất của Apex là:
Và hàm phản ứng tốt nhất của Brydox cũng được xác định một cách tương tự Dễ dàng
Trang 37Bài giảng Lý thuyết trò chơi
-
-
Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL
36
nhận thấy cân bằng của Trò chơi Cournot chính là giao điểm E của hai đường phản ứng này, và
vì vậy E được gọi là cân bằng Cournot Tại cân bằng Cournot, ta có: q a q b40 c / 3 36
Giá cân bằng khi đó bằng 48 120 36 36
Cân bằng Cournot ngoài đặc điểm là một cân bằng Nash, còn có một tính chất khác đặc
biệt quan trọng nữa là tính ổn định
Cân bằng Stackelberg
Trò chơi này chỉ khác Trò chơi Cournot tại một điểm là một trong hai đối thủ, ví dụ như Apex, được quyền đi trước Khi đó Apex sẽ lựa chọn như thể nào? Khi đó Apex sẽ dự tính khối lượng tối ưu của Brydox theo (28) sẽ là:
Anh ta sẽ thế giá trị này vào hàm thanh toán của mình:
Từ đó có điều kiện bậc I là:
Và kết cục cuối cùng là: qa = 60 và qb = 30
3.6 Các chiến lược liên tục: Trò chơi Bertrand
Một phiên bản thay thế tự nhiên cho mô hình độc quyền-đôi trong đó hai công ty chọn các mức sản lượng một cách đồng thời là mô hình trong đó các công ty chọn giá một cách đồng thời
Cân bằng này gọi là cân bằng Bertrand
Trò chơi Bertrand Đối thủ: Các công ty Apex và Brydox
Trật tự chơi: Apex và Brydox đồng thời lựa chọn các mức giá pa và pb từ tập [0,∞)
Thanh toán
Chi phí cận biên là hằng số c = 12 Cầu là hàm số của tổng khối lượng bán được, Q = 120
- p Hàm thanh toán của Apex (hàm thanh toán của Brydox sẽ là tương tự) là
Trò chơi Bertrand có một cân bằng Nash duy nhất: = = c = 12
Rõ ràng đây là một cân bằng Nash yếu: nếu một trong hai công ty đi chệch tới một mức giá cao hơn, công ty đó sẽ mất toàn bộ người tiêu dùng của nó và do vậy thất bại trong việc tăng lợi nhuận của mình lên trên giá trị 0
3.7 Tồn tại cân bằng
Trang 38Bài giảng Lý thuyết trò chơi
(1) Không gian chiến lƣợc không bị chặn
(2) Không gian chiến lƣợc mở
(3) Không gian chiến lƣợc rời rạc
(4) Hàm phản ứng không-liên tục phát sinh từ các hàm thanh toán không-lõm hoặc không-liên tục
Trang 39Bài giảng Lý thuyết trò chơi
-
-
Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL
38
Chương 4: TRÕ CHƠI ĐỘNG VỚI THÔNG TIN ĐỐI XỨNG
Trong chương này chúng ta sẽ nhiều lần sử dụng dạng mở rộng để nghiên cứu các trò chơi có các bước đi xuất hiện một cách tuần tự
Mục 4.1 khái niệm cân bằng Nash hoàn hảo
Mục 4.2 Trò chơi cản trở nhập ngành
Mục 4.3 Mở rộng ý tưởng hoàn hảo sử dụng ví dụ kiện tụng lạm dụng
4.1 HOÀN HẢO TIỂU TRÕ CHƠI
Cân bằng Hoàn hảo của Đi-theo-Người-dẫn-đầu I
Cân bằng Hoàn hảo tiểu-trò chơi là một khái niệm cân bằng dựa trên trật tự các bước đi và
sự phân biệt giữa đường cân bằng và cân bằng
Đường cân bằng là đường đi qua cây trò chơi dẫn tới cân bằng, nhưng bản thân cân bằng
là một tổ hợp chiến lược bao gồm các phản ứng của đối thủ với việc đi chệch của các đối thủ khác ra khỏi đường cân bằng
Trong trò chơi Đi-theo-Người-dẫn-đầu I, có ba cân bằng Nash chiến lược-thuần túy trong
đó chỉ có một cân bằng là hợp lý
Dạng chiến lược:
có ba cân bằng Nash như sau:
nhưng chỉ có E2 là một cân bằng hợp lý vì trật tự các bước đi có ảnh hưởng đến quyết định của các đối thủ Vấn đề của bảng chiến lược, và bởi vậy của cân bằng Nash, là nó bỏ qua ai là người tiến hành bước đi trước tiên Smith đi bước đầu tiên, và sẽ là hợp lý khi Jones được phép _ trên thực tế đó là điều bắt buộc phải _ suy nghĩ lại chiến lược của mình sau bước đi của Smith
Hình 1: Đi theo người dẫn đầu I
Trang 40Bài giảng Lý thuyết trò chơi
-
-
Giảng viên: Đào Văn Khiêm – Trần Văn Khiêm Bộ môn Kinh tế- ĐHTL
39
Hãy xét chiến lược (Small, Small) tại cân bằng E 3 Nếu Smith đi chệch khỏi cân bằng bằng
cách chọn Large, thì sẽ là bất hợp lý nếu Jones cứ khăng khăng chọn phản ứng Small Thay vào
đó, anh ta sẽ chọn Large Nhưng nếu Smith dự kiến phản ứng Large, anh ta sẽ chọn Large ngay trong bước đi đầu tiên của mình, và như vậy E 3 không phải là một cân bằng Lập luận một cách
tương tự chúng ta cũng thấy Jones sẽ không hợp lý nếu lựa chọn chiến lược (Large, Large), do vậy chỉ có E 2 là cân bằng duy nhất
Chúng ta nói E 1 và E 2 là các cân bằng Nash nhưng không phải cân bằng Nash “hoàn hảo” Một tổ hợp chiến lược là cân bằng hoàn hảo nếu nó vẫn còn là cân bằng dọc theo tất cả các đường đi có thể, không chỉ đường cân bằng, mà tất cả các đường đi khác dẫn đến các “Tiểu Trò chơi” khác
Một Tiểu Trò chơi là một Trò chơi bao gồm một nút đơn trong mỗi bảng phân chia thông
tin của các đối thủ, các nút sau của nó, và các thanh toán gắn với các nút cuối
Một tổ hợp chiến lược là một cân bằng Nash hoàn hảo tiểu Trò chơi nếu (a) nó là cân
bằng Nash cho toàn bộ Trò chơi; và (b) và quy tắc hành động thích hợp của nó là một cân bằng Nash cho mỗi Tiểu Trò chơi
Dạng mở rộng của Đi theo người dẫn đầu 1 trong Hình 4.1 (bản sao của Hình 2.1) có ba
Tiểu Trò chơi: (1) toàn bộ Trò chơi, Tiểu Trò chơi bắt đầu tại nút J 1, và (3) Tiểu Trò chơi bắt đầu
tại nút J 2 Tổ hợp chiến lược E 1 không phải là một cân bằng Nash hoàn hảo tiểu Trò chơi vì nó chỉ là cân bằng Nash trong Tiểu Trò chơi (1) và (3), chứ không phải là một cân bằng Nash trong
Tiểu Trò chơi (2) E 3 không phải là cân bằng Nash hoàn hảo Tiểu Trò chơi vì nó chỉ là cân bằng Nash trong Tiểu Trò chơi (1) và (2), chứ không phải trong Tiểu Trò chơi (3) Tổ hợp chiến lược
E 2 là hoàn hảo vì nó là cân bằng Nash trong cả ba Tiểu Trò chơi
Khái niệm hợp lý kế tiếp thường được sử dụng để biểu diễn ý tưởng một đối thủ sẽ tối đa
lợi ích của anh ta tại mỗi thời điểm trong Trò chơi, tái tối ưu quyết định của mình tại mỗi thời điểm và tính toán đến việc sẽ tái tối ưu trong tương lai Đây là một sự pha trộn giữa ý tưởng chi phí chìm trong kinh tế học và những mong đợi hợp lý Hợp lý kế tiếp là tiêu chuẩn chuẩn hoá đến mức thông thường người ta sử dụng “cân bằng” để nói đến “cân bằng Nash hoàn hảo Tiểu Trò chơi” trong Trò chơi có thông tin đối xứng và “cân bằng Bayer hoàn hảo” trong Trò chơi có thông tin phi đối xứng
4.2 VÍ DỤ VỀ TÍNH HOÀN HẢO: NGĂN CẢN NHẬP NGÀNH I (NCNNI)
Chúng ta xét một tình huống sau: Công ty độc quyền trong ngành có thể duy trì vị trí của mình bằng cách đe doạ tiến hành chiến tranh giá cả chống lại bất kỳ công ty nào muốn ra nhập