Bài giảng Lý thuyết trò chơi (Game Theory) tập trung làm rõ khái niệm lý thuyết trò chơi, trò chơi động với thông tin đầy đủ, trò chơi tĩnh với thông tin đầy đủ, phân tích tình huống. Với các bạn chuyên ngành Kinh tế thì đây là tài liệu hữu ích.
Trang 1Hoai Bao 1
Lý thuyết trò chơi (Game Theory)
Nguyễn Hoài Bảo November 6, 2007
Trang 2Nội dung hôm nay
xử hàng ngày
Trang 3Lưu ý:
Những hình ảnh sử dụng trong bài giảng này được lấy về từ
http://images.google.com.vn/ và chỉ có tính minh hoạ.
Trang 4Hồ Ngọc Hà vs Đức Trí
Tiếp tục hợp
tác hay không?
Tiếp tục hợp tác hay không?
Trang 5Ai gọi ai?
Trang 6Tuổi Trẻ vs Thanh Niên
Chọn tin gì để đăng trên trang bìa hôm nay???
Trang 7Attila Elizabeth (SYM) vs Air Blade (Honda)
Trang 8Ghen hay không?
Trang 9Trả tiền nhậu hay Karaoke?
Trang 10Làm thế nào để có câu trả lời cho các tình
Trang 11Lý thuyết trò chơi là gì?
Game Theory: Nghiên cứu các tình huống ra quyết định có
liên quan đến nhiều người và các quyết định của mỗi người ảnh hưởng đến quyết định của người khác
Hay nói các khác: Lý thuyết trò chơi sẽ xác định xác suất
thành công khi cho trước một không gian chiến lược Nghĩa
là mỗi người đều có hơn 1 sự lựa chọn và lựa chọn của họ ảnh hưởng lẫn nhau
Ví dụ: Hồ Ngọc Hà sẽ đoán xem Đức Trí có hợp tác với
mình nữa hay không Nếu có thì mình được gì và mất gì, nếu không thì được gì và mất gì Đức Trí cũng toan tính
như vậy
Ví dụ: Nếu hai người cùng gọi, thì máy của cả hai đều bận Tốt nhất là một người gọi và một người thì đợi Vấn đề là ai đợi?
Trang 12Lý thuyết trò chơi là gì?
Ví dụ: Ban Biên tập báo Thanh Niên sẽ phải có một cuộc họp kín để quyết định chọn tin gì đưa lên trang 1 của
báo ngày hôm nay Và họ cũng biết ban Biên tập báo
Tuổi Trẻ cũng họp ở đâu đó để bàn về việc này
Ví dụ: Có hai dòng xe, một dòng dành cho “phái yếu” và một dòng dành cho “phái mạnh” Với ngân sách có hạn, bản thân Honda lẫn SYM đề không thể đầu tư cùng một lúc cả hai dòng này và họ lại là đối thủ cạnh tranh của nhau Nếu cả hai cùng tung ra cùng lúc 1 dòng xe cho phái mạnh (hoặc phái yếu) thì cả hai đều thiệt Chiến
lược tốt nhất là mỗi hãng chọn dòng xe để đầu tư Vấn
đề là làm sao biết đối thủ của mình đang đầu tư dòng xe nào?
Trang 13Lý thuyết trò chơi là gì?
Ví dụ: Nên ghen ra mặt hay không? Nó tuỳ thuộc vào
“cô kia” có “để ý” anh ấy hay không? Nếu cô kia đang để
ý thì mình ghen và mất tình bạn (được tìn yêu); còn
ngược lại thì không cần ghen (được cả tình yêu lẫn tình bạn) Và ngược lại
Ví dụ: Ai là người sẽ trả tiền trong buổi họp mặt hôm
nay Nếu hội “con gái” dành trả tiền cho buổi tiệc nhậu thì “hội con trai” trả tiền cho chầu karaoke; và người lại Hội nào sẽ hành động trước? Tiền trả cho nhậu (bình quân đầu người) là ít hay nhiều hơn tiền trả cho karaoke (bình quân đầu người)?
Trang 14Những khái niệm cơ bản
Người chơi (Players): Là những người tham gia vào một hay
nhiều trò chơi Ví dụ: Hà và Trí, Honda và SYM; hai cô gái …
Luật chơi (Rules): Là những nguyên tắc và chế tài trong một cuộc chơi
Kế cục (Payoff): Là lượng hữu dụng (thường là tiền) mà một người chơi khi thắng hoặc thua của một chiên lược cụ thể trong trò chơi.
Chiến lược (Strategy): Là một tập các phải ứng của người chơi có thể xảy ra trong một trò chơi Một chiến lược phải trọn vẹn, xác định
Trang 15Những khái niệm cơ bản
Chiến lược thuần tuý (Pure Strategy): Là chiến lược dự trên phán đoán các chiến lược của đối thủ
Chiến lược hỗn hợp (Mixed Strategy): Là chiến lược khi không
dự đoán được chiến lược của đối thủ.
Cân bằng (Equilibrium): Là một kết quả (outcome) mà trong đó
các bên tham gia cuộc chơi không muốn thay đổi.
Cân bằng áp đảo (Dominant Strategy Equilibrium): Là một cân bằng mà trong đó mỗi người chơi đều sử dụng chiến lược áp đảo của mình.
Cân bằng Nash (Nash Equilibrium): Là cân bằng mà trong đó các người chơi hành động điều tốt nhất mà họ có thể làm khi đối với
hành động của đối phương.
Tình thế lưỡng nan của người tù (Prinsoner’s dlemma): Là một kết cục mà mặc dù mọi người hành động khônn ngoan theo tư lợi của mình nhưng kết nhận được thì không khôn ngoan
Trang 16Các dạng trò chơi
Trò chơi đồng thời (Simultaneous-move game): hay còn gọi là trò chơi tĩnh: là dạng trò chơi mà các nguời chơi phải hành động cùng lúc
– Ban biên tập báo Thanh Niên và Tuổi Trẻ phải ra quyết định
đồng thời.
– Hai cô gái phải cùng quyết định
Trò chơi luôn phiên (Sequential-move game): hay
còn gọi là trò chơi động, là dạng trò chơi có nhiều giai đoạn và mỗi người chơi sẽ hành động ở mỗi giai đoạn.– Nếu Honda ra quyết định trước thì SYM sẽ rất dễ dàng có quyết định.
– Trả tiền nhậu hay karaoke là trò chơi luôn phiên.
Trang 17Các dạng trò chơi
Căn cứ vào thông tin
Trò chơi với thông tin đầy
đủ (complete
information): là mỗi người
chơi có thể tính toán
được kết cục (payoff) của
các người chơi còn lại
Trò chơi với thông tin
không đầy đủ (incomplete
information)
Khả năng hợp tác:
Trò chơi hợp tác (cooperative games): các người chơi cùng lập
chương trình hành động
và có biện pháp chế tài cho những thoả thuận chung
Trò chơi bất hợp tác (non- cooperative games): không có hợp đồng (khế ước), hoặc nếu có thì rất khó chế tài
Trang 18Trong bài giảng này:
Trò chơi có thông tin hoàn hảo;
Trò chơi không hợp tác; và
Trò chơi luôn phiên và đồng thời.
Trang 19Năm giả định quan trọng
1 Mỗi người ra quyết định (người chơi – player) luôn có hai hay nhiều lựa chọn.
2 Mỗi lựa chọn phải dẫn đến một kết cục rõ ràng (thắng, thua hay hoà) khi kết thúc cuộc chơi.
3 Kết cục cụ thể cho mỗi người chơi phải gắn với mỗi giai đoạn kết thúc (một trò chơi có tổng bằng không – zero sum game nghĩa là tổng tất cả các kết cục của các người chơi là bằng zero khi kết thúc mỗi giai đoạn chơi).
4 Các người chơi đều có kiến thức hoàn hảo về trò chơi cũng như về đối phương của họ Nghĩa là anh ta/chị ta biết đầy đủ chi tiết các luật lệ của trò chơi cũng như kết cục của tất cả các người khác
5 Tất cả những quyết định của người chơi là duy lý (rational), mỗi người chơi, chẳng hạn có hai lựa chọn, thì khi đó họ sẽ lựa chọn cái nào đem lại kết cục tốt nhất
Trang 20Trò chơi luôn phiên
(Sequential-move game)
Trang 21Tình huống của Honda vs SYM
Honda
Nam (-5; -5)
Nữ ( 10 ; 20 )
Nam ( 20 ; 10 )
Nữ (-5-5)
Trang 22Qui luật 1:
Nhìn xa hơn và suy luận ngược về
(Look ahead and reason backward)
Trang 23Người tiên phong là người khôn?
Không chắc!
Trong chợ, nếu gian hàng của bạn là người niêm yết giá
cố định trước, đối thủ của bạn sẽ có cơ hội hạ giá để
Trang 24Chiến thuật
Đe doạ (a threat) : là chiến lược tác động vào chi phí để đối phương thay đổi hành vi hay niềm tin.
Lời hứa (a promise) : là chiến lược tác động
vào lợi ích để đối phương thay đổi hành vi hay niềm tin.
Mức độ tin cậy (credibility) của “đe doạ” hay
“lời hứa” trong trò chơi là yếu tố then chốt.
Ví dụ: đội mũ bảo hiểm hay không?
Trang 25Đe doạ không tin cậy và tin cậy
$10 (XYX)
$70 (ABC)
$0 (XYX)
Trang 26Trò chơi đồng thời (Simultaneously-move game)
Trang 27“Quay bài” hay không?
Trang 28Qui luật 2:
Nếu có chiến lược áp đảo, hãy sử dụng.
(If you have a dominant strategy, use it)
Trang 29Tình thế lưỡng nan của người tù
Trang 30Nhận xét:
Mặc dù mọi người hành động khôn ngoan,
nhưng kết quả chung lại không khôn ngoan.
Mọi người vứt rác bừa bãi, hệ quả là ai cũng
chiệu thiệt do đường phố bẩn thiểu.
Tất cả các tỉnh đều ưu đãi đầu tư và cạnh tranh nhau, tất cả đều có kết cục xấu (chạy đua xuống đáy)
Ai cũng cố vượt lên khi đến ngã tư, không chịu nhường, hậu quả là tất cả bị kẹt lại.
Trang 31Chiến lược của A và B
Công ty B
Giảm giá Không làm
gì cả
Cải tiến chất lượng
Trang 32Chiến lược của A và B
Đối với công ty A:
Không có chiến lược áp
đảo
“Giảm giá” là chiến lược
bị áp đảo bởi hai chiến
lược còn lại
Hãy loại bỏ chiến lược
“giảm giá” ra khỏi trò chơi
cho dù B chọn chiến lược
gì đi chăng nữa
Đối với công ty B:
Không có chiến lược thống trị
“Giảm giá” là chiến lược
bị áp đảo bởi chiến lược
“cải tiến chất lượng”
Lưu ý, giảm giá không phải là chiến lược bị áp đảo bởi chiến lược
“không làm gì cả”
Trang 33Chiến lược lập lại
Trang 34Qui luật 3:
Nếu không có chiến lược áp đảo, cố tìm một chiến lược
áp đảo lặp lại khác.
(If you do not have any dominant strategy, try to find an
iterated dominant strategy)
Trang 35Khi không có chiến lược áp đảo
dựa theo: Không
Trang 36Qui luật 4:
Nếu không có chiến lược áp đảo, giả sử đối phương của mình họ sử dụng chiến lược áp đảo của họ, khi đó chọn
chiến lược phù hợp tiếp theo.
(If you do not have any dominant strategy, then assume that your rival will use this dominant strategy and choose
your strategy accordingly)
Trang 38Nếu không có chiến lược áp đảo
chơi là hành xử dựa trên các chiến lược
mà họ nghĩ rằng đối thủ của mình sẽ sử dụng.
thấp” thì Pepsi nên chọn “giá thấp”
Ngược lại, nếu Pepsi chọn “giá thấp” thì Coke cũng chọn “giá thấp” Cân bằng này
có tên gọi là cân bằng Cân bằng Nash.
Trang 40Qui luật 5:
Nếu cả hai đều không có chiến lược áp đảo, nên
chọn một tình huống cân bằng chung
(If neither firms has a dominant strategy, you
should choose the equilibrium)
Trang 41Nếu không có cân bằng Nash
Trang 42Chiến lược hỗn hợp
lược “giá thấp”; khi đó (1-p) là xác suất
của chiến lược “quảng cáo”.
“giá thấp”; khi đó (1-q) là xác suất của
chiến lược “quảng cáo”.
(p; q <1)
Trang 4314 (KĐ)
15 (ĐP)
15 (KĐ)
17q+15(1-q) 14q+15(1-q) 15p+17(1-p)
15p+14(1-p)
17p+15(1-p) 14p+15(1-p)
Trong bảng trên, các ô cập nhật lợi nhuận kỳ vọng (expected
profit) cho mỗi chiến lược của từng công ty
Trang 4414 (KĐ)
15 (ĐP)
15 (KĐ)
17q+15(1-q) 14q+15(1-q) 15p+17(1-p)
15p+14(1-p)
17p+15(1-p) 14p+15(1-p)
Lợi nhuận kỳ vọng của Đức Phát khi họ chọn giá thấp
Trang 45Nếu q <0.5 lựa chọn tốt nhất cho Đức Phát là nên giảm giá, và
ngược lại, nếu q>0.5 thì Quảng cáo
q
Trang 46Nếu p <0.5 lựa chọn tốt nhất cho Kinh Đô là nên giảm giá, và
ngược lại, nếu p>0.5 thì Quảng cáo
p
Trang 47Nếu cả hai đều chọn trung dung:
14 (KĐ)
15 (ĐP)
15 (KĐ)
16 14.5 16
14.5
16 14.5
16 14.5
Khi này lựa chọn chiến lược không còn ý nghĩa nữa!
Trang 49họ tin chắc rằng đối thủ của mình không tham gia thị trường ngách
Trang 50Qui luật 6:
Phải tìm chiến lược hỗn hợp khi không có chiến lược cân bằng Và ngay cả khi có chiến lược cân
bằng cũng thử tìm một chiến lược hỗn hợp.
(Try mixed strategy even if pure strategy
equilibrium exists, and definitely if pure strategy
equilibrium does not exist.)
Trang 51Phụ lục:
Những tác giả nghiên cứu và
phát triển lý thuyết trò chơi
Trang 52In the beginning
Some game-theoretic ideas
traced back to the 18-th
century.
Emile Borel (1871~1956) and
John von Neumann
(1903~1957) began the major
development of game theory.
52
Trang 53Xem phim “A beautiful
Mind” nói về cuộc đời
của John Nash
Trang 54Game theory, spring
Trang 55Nobel Prize in Economic Sciences 1994
John C Harsanyi John F Nash Jr Reinhard Selten
"for their pioneering analysis of equilibria in the
theory of non-cooperative games"
Trang 56Nobel Prize in Economic Sciences 2005
Robert J Aumann Thomas C Schelling
"for having enhanced our understanding of
conflict and cooperation through
game-theory analysis"