Trò chơi một lần không lặp lại... Trò chơi một lần không lặp lại ttTrò chơi quảng cáo: Hình thức thông thường H L Chiến lược B • Chiến lược ưu thế?. Trò chơi quảng cáo: Chiến lược ưu thế
Trang 1C9 LÝ THUYẾT TRỊ CHƠI
Phải quan tâm đến hành vi của đối thủ cạnh tranh
Phải phán đốn cho được hành vi của họ
Khái niệm cơ bản của một trị chơi:
Trang 2Trò chơi một lần không lặp lại
Trang 3Trò chơi một lần không lặp lại (tt)
Trò chơi quảng cáo: Hình thức thông thường
H L
Chiến lược
B
• Chiến lược ưu thế?
• Cân bằng Nash?
Trang 4Trò chơi một lần không lặp lại (tt)
Trò chơi quảng cáo: Hình thức thông thường
10, 10-10, 7
Giảm
15, 8
10, 20
Tăng A
Giảm Tăng
Chiến lược
B
• Chiến lược ưu thế?
• Cân bằng Nash?
Trang 5điểm cân bằng Nash
Không có ựiểm cân bằng Nash:
Nhiều ựiểm cân bằng Nash:
0, 0 -1, 1
1, -1
Giấy
1, -1
0, 0 -1, 1
Kéo A
đá Chiến lược
B
0, 0
2, 1
Núi A
Biển Núi
Chiến lược
B
Trang 6Trò chơi ñịnh giá Bertrand
10, 10-10, 50
Cao
50, -10
0, 0
Thấp A
Cao Thấp
Chiến lược
B
• Một lần không lặp lại
• Cân bằng Nash? Giải thích? Nhận xét?
• Kết quả nào tốt nhất? Giải thích tại sao lại không chọn?
Trang 7Kiểm tra nhân viên
-1, 1
1, -1
Không kiểm tra
1, -1 -1, 1
Kiểm traNgười quản lý
Trốn việcLàm việc
Chiến lược
Nhân viên
• Mâu thuẫn về mục tiêu lợi ích nên phải kiểm tra
• Kiểm tra ñột xuất sẽ có tác dụng Tại sao?
Trang 8Trò chơi lặp lại vô số lần
Không thú nhận
0,5; 10 3; 3
Thú nhận A
Không thú nhận Thú nhận
Chiến lược
B
Trang 9Hợp tác
Nghịch lý người tù xuất hiện nhiều trong thực tế
Trò chơi quảng cáo:
Chiến lược ưu thế? Chiến lược cân bằng Nash?
Chiến lược tốt hơn? … nhưng không ổn ñịnh
Giải thích tại sao?
H L
Chiến lược
B
Trang 10Hợp tác (tt)
Cân bằng Stackelberg: Dẫn ñầu – theo sau
Chiến lược mang lại lợi ích cao nhất cho cả hai là …,
nhưng lại không ổn ñịnh Giải thích tại sao?
Không có dấu hiệu nào về chọn lựa của ñối thủ!
Trang 11Chiến lược ñe dọa
Trò chơi quảng cáo
Có cơ hội ñe dọa
Kết quả nào ñạt ñược?
H L
Chiến lược
B
Trang 12Chiến lược kích thích
Trò chơi ñịnh giá lặp lại:
10, 10 -40, 50
Giá cao
50, -40
0, 0
Giá thấp A
Giá cao Giá thấp
Trang 13Nếu không lừa dối thì nhận ñược khoản lợi là 10 vĩnhviễn, với giá trị hiện tại là (i là lãi suất):
Nếu lừa dối thì nhận ñược khoản lợi là 50 chỉ một lần
So sánh hai trường hợp: không lừa dối nếu:
hay:
.
) 1
(
10
) 1
(
10 1
10
i
i i
i
+
+ +
+
=
.
) 1
≤ i
Trang 140, -10
0, 0
Không mua Khách hàng
Chất lượng cao Chất lượng thấp
Chiến lược
Doanh nghiệp
Trang 15Trò chơi lặp lại vài lần
Trò chơi lặp lại vài lần không biết chắc giai ñoạn cuối : Trò chơi ñịnh giá cho ñến khi sản phẩm bị lạc hậu:
Xác suất trò chơi chấm dứt là với
So sánh hai tình huống lừa dối và không lừa dối
10, 10 -40, 50
Giá cao
50, -40
0, 0
Giá thấp Doanh nghiệp A
Giá cao Giá thấp
Chiến lược
Doanh nghiệp B
θ 0 < θ ≤ 1
Trang 16Lợi ích nhận ñược nếu không lừa dối:
Lợi ích nhận ñược nếu lừa dối là 50
Không lừa dối nếu:
hay:
.
10
10 )
1 ( 10 )
1 ( 10 )
1 (
θ
θ θ
− +
=
ΠKLDA
KLD A
%.
20
≤
θ
Trang 17Trò chơi lặp lại biết chắc giai ñoạn cuối: Trò chơi ñịnhgiá hai lần.
Không có cơ hội trả ñũa nên xem lần chơi thứ hai là lầncuối
Kết quả giống trò chơi một lần không lặp lại
10, 10 -40, 50
Giá cao
50, -40
0, 0
Giá thấp Doanh nghiệp A
Giá cao Giá thấp
Chiến lược
Doanh nghiệp B
Trang 18Ứng dụng
Trò chơi bỏ việc
Trò chơi bán hàng di ñộng
Trang 19Trò chơi nhiều giai ñoạn (trước sau)
Trang 20B có thể dựa trên quyết ñịnh của A nhưng không ngượclại.
Nếu chiến lược của B là (X, X) thì A sẽ chọn X
Nếu A chọn X thì B có ñộng cơ thay ñổi chọn lựa của
mình không? Cân bằng Nash?
Chiến lược hợp lý hơn: A: L và B: L Tại sao không chọn?
Vì ñe dọa của B A có nên tin không?
Trang 21ðiểm cân bằng khác: B: L nếu A: L và B: X nếu A: X.
ðe dọa ñáng tin và không ñáng tin
Trang 22-1, 1
5, 5
0, 10
• B dọa sẽ cứng rắn Khi ñó, ñiểm cân bằng Nash là?
• ðe dọa này ñáng tin không?
• ðiểm cân bằng Nash khác là?
Trang 23Trò chơi mặc cả theo trình tự
Ai ra quyết ñịnh trước là quan trọng
Thí dụ, mua bán xe
Trang 24C12 SỰ LỰA CHỌN KHI KHÔNG CHẮC CHẮN VỀ
Trang 251 2
iX p
Trang 26Giá trị kỳ vọng là vô cùng lớn nhưng ít người tham giatrò chơi này Tại sao?
Hữu dụng kỳ vọng (hữu dụng tâm lý) ñược quan tâm
hơn giá trị kỳ vọng do quy luật MU giảm dần
Giải thích của Bernoulli:
Hàm hữu dụng kỳ vọng U = ln (Xi )
Hữu dụng biên giảm dần:
0
1 dX
0 1
2 i
X dMU
X MU
Trang 27Hữu dụng kỳ vọng:
39 ,
1 )
2
ln(
2
1 )
( )
(
1 1
i
i
p X
E
Trang 28RỦI RO VÀ SỢ RỦI RO*
* Sợ rủi ro: Risk Averse
W* W*+h W*+2h W*-h
W*-2h
•
•
W0
Trang 29SỰ SẴN LÒNG TRẢ TIỀN MUA BẢO HIỂM
Giá trị tài sản hiện tại W* = 100.000 ñvt; rủi ro bị mấtchiếc xe trị giá 20.000 ñvt với xác suất là 25%; hàm hữudụng: U(W) = ln(W)
Không bảo hiểm:
U = 0,75ln100.000 + 0,25ln80.000 = 11,45714 (i)
Trả bảo hiểm 5.000 ñvt:
U = ln95.000 = 11,46163 (ii)
So sánh: (ii) > (i) nên bảo hiểm có lợi hơn
Tiền bảo hiểm tối ña (x) :
ln(100.000 – x) = 11,45714 Suy ra: x = 5.426 ñvt