Chương 7 trình bày lý thuyết trò chơi và tư duy chiến lược. Chương này giúp người học có thêm những hiểu biết về lý thuyết trò chơi và các tư duy chiên lược như: Một số khái niệm cơ bản, trò chơi đồng thời, cân bằng Nash, chiến lược ưu thế, trò chơi quảng cáo,... Mời các bạn cùng tham khảo để nắm bắt các nội dung chi tiết.
Trang 11 12/13/2012 GVC: PHAN THẾ CÔNG
Trang 2John Nash (1928 )
Received his Ph.D from
Princeton University with a
28-page thesis on his 22-nd
Xem phim “A beautiful
Mind” nói về cuộc đời của
Trang 3Nobel Prize in Economic Sciences 1994
John C Harsanyi John F Nash Jr Reinhard Selten
"for their pioneering analysis of equilibria in the
theory of non-cooperative games"
12/13/2012 GVC: PHAN THẾ CÔNG
Nobel Prize in Economic Sciences 2005
Robert J Aumann Thomas C Schelling
"for having enhanced our understanding of
conflict and cooperation through
game-theory analysis"
Trang 4Lý thuyết trò chơi
Lý thuyết trò chơi là một nhánh của toán học ứng
dụng thường được sử dụng trong phân tích kinh
tế
Nó sử dụng các mô hình để nghiên cứu các tình
huống chiến thuật, trong đó những người tham gia
(người chơi) cố gắng để tối đa kết quả thu được của
mình có tính đến hành động và phản ứng của các đối
thủ khác
7 12/13/2012 GVC: PHAN THẾ CÔNG
Một số khái niệm cơ bản
Trò chơi: một tình huống mà trong đó người chơi
(người tham gia) đưa ra quyết định chiến lược có
tính đến hành động và phản ứng của các đối thủ
Nếu tôi tin rằng các đối thủ cạnh tranh của tôi là
người có lý trí và hành động để tối đa hóa lợi nhuận
của họ thì tôi phải tính đến hành vi của họ như thế
nào khi ra quyết định tối đa hóa lợi nhuận của mình
Trang 5Một số khái niệm cơ bản
Người chơi:
Những người tham gia và hành động của họ có tác
động đến kết quả của của bạn.
Chiến lược:
Nguyên tắc hoặc kế hoạch hành động trong khi tiến
hành trò chơi
Kết cục:
Giá trị tương ứng với một kết quả có thể xảy ra.
Phản ánh lợi ích thu được của mỗi người chơi
9 12/13/2012 GVC: PHAN THẾ CÔNG
Một số khái niệm cơ bản
Trò chơi đồng thời:
Các đối thủ ra quyết định khi không biết đến quyết
định của đối phương
Trò chơi tuần tự:
Một người chơi ra quyết định trước, người chơi tiếp
theo ra quyết định căn cứ vào quyết định của người
đi trước.
Trang 6Một số khái niệm cơ bản
Trò chơi hợp tác:
là trò chơi mà trong đó những người chơi có thể đàm
phán những cam kết ràng buộc lẫn nhau cho phép họ
cùng lập các kế hoạch chiến lược chung
Trò chơi bất hợp tác:
Các bên tham gia không thể đàm phán và thực thi có
hiệu lực các cam kết ràng buộc
11 12/13/2012 GVC: PHAN THẾ CÔNG
Các giả định để nghiên cứu
Những người chơi là những người có lý trí
Mục đích của những người chơi đều là tối đa hóa kết cục
của bản thân họ
Những người chơi đều là những người biết tính toán hoàn
hảo
Hiểu biết chung:
Mỗi người chơi đều biết nguyên tắc của trò chơi
Mỗi người chơi đều biết rằng người khác cũng biết nguyên
tắc của trò chơi
Mỗi người chơi đều biết người chơi khác cũng là người có
lý trí
Trang 7Trò chơi đồng thời
Trong khi tôi đưa ra quyết định của mình thì bạn
cũng vậy
Tôi và bạn đều đưa ra quyết định mà không biết đến
quyết định của người khác
Cái mà tôi quyết định có ảnh hưởng đến kết cục
của bạn và cái mà bạn quyết định cũng ảnh hưởng
đến kết cục của tôi
Cần phải đưa ra quyết định như thế nào?
13 12/13/2012 GVC: PHAN THẾ CÔNG
Trò chơi đồng thời
Xác định ma trận lợi ích (ma trận kết cục): chỉ ra
tất cả các kết cục của mỗi người chơi tương ứng
với tất cả các hành động của mỗi người
Xác định hành động có kết quả tốt nhất cho cả
mình và đối thủ
Tìm ra cân bằng Nash
Trang 8Cân bằng Nash
Cân bằng Nash là một tập hợp các chiến lược
(hoặc hành động) mà mỗi người chơi có thể làm
điều tốt nhất cho mình, khi cho trước hành động
của các đối thủ
Mỗi người chơi không có động cơ xa rời chiến lược
Nash của mình nên đây là các chiến lược ổn định
15 12/13/2012 GVC: PHAN THẾ CÔNG
Cân bằng Nash
Nhắc lại:
Cân bằng Cournot chính là cân bằng Nash:
Hai hãng ra quyết định sản lượng đồng thời.
Mỗi hãng sản xuất ở mức sản lượng làm hãng tối đa hóa
lợi nhuận khi biết các hãng đối thủ sản xuất bao nhiêu.
Cân bằng Stackelberg cũng là cân bằng Nash:
Một hãng ra quyết định sản lượng trước, một hãng hành
động theo sau
Mỗi hãng làm điều tốt nhất cho mình khi cho trước quyết
định của đối thủ
Trang 912/13/2012 GVC: PHAN THẾ CÔNG
Giải quyết trò chơi
Phản ứng tốt nhất của hãng A
Nếu Hãng B không quảng cáo: Quảng cáo
Nếu Hãng B quảng cáo: Quảng cáo
Hãng A sẽ quảng cáo bất kể hãng B có quảng cáo hay
Trang 10Chiến lược ưu thế
Chiến lược ưu thế là một chiến lược hoặc hành
động mang lại kết cục tốt nhất dù cho các đối thủ
có quyết định làm gì đi chăng nữa
Nếu một trò chơi có chiến lược ưu thế:
các đối thủ sẽ lựa chọn chiến lược ưu thế của mình
19 12/13/2012 GVC: PHAN THẾ CÔNG
Chiến lược ưu thế và cân bằng
Nash
Chiến lược ưu thế: Tôi đang làm điều tốt nhất có thể
được cho tôi, bất kể bạn có làm điều gì đi nữa Bạn
đang làm điều tốt nhất có thể cho bạn, bất kể tôi làm
gì đi nữa.
Cân bằng Nash: Tôi đang làm điều tốt nhất có thể
được, cho trước cái bạn đang làm Bạn đang làm điều
tốt nhất có thể được, cho trước cái tôi đang làm
Cân bằng chiến lược ưu thế là trường hợp đặc biệt
của cân bằng Nash
Trang 11Chiến lược ưu thế
Nguyên tắc:
Nếu bạn có chiến lược ưu thế, hãy sử dụng nó
Dự đoán rằng đối thủ của bạn cũng sử dụng chiến
lược ưu thế của họ nếu như họ cũng có chiến lược ưu
thế
21 12/13/2012 GVC: PHAN THẾ CÔNG
Tình thế lưỡng nan của những người tù
20 , 0 1 , 1
- Chiến lược ưu thế của người A: Thú tội
- Chiến lược ưu thế của người B: Thú tội
- Cân bằng xảy ra khi cả hai người cùng thú tội
Trang 12Trò chơi quảng cáo
- Cả hai hãng đều có chiến lược ưu thế
- Ở trạng thái cân bằng, kết cục của hai hãng đều bị giảm
đi so với trường hợp hai hãng hợp tác với nhau
12/13/2012 GVC: PHAN THẾ CÔNG
Ra quyết định như thế nào
khi chỉ có một người chơi có chiến
lược ưu thế?
Giả định rằng người chơi kia sử dụng
chiến lược ưu thế của họ, khi đó
sẽ chọn chiến lược phù hợp nhất
khi đã biết chiến lược họ sử dụng
Trang 13Khi chỉ một người chơi có chiến
- Hãng A không có chiến lược ưu thế
- Hãng B có chiến lược ưu thế: Quảng cáo
- Hãng A cho rằng B sẽ quảng cáo khi đó lựa chọn tốt nhất
của hãng A là Quảng cáo
12/13/2012 GVC: PHAN THẾ CÔNG
Nếu không người
chơi nào có chiến
lược ưu thế?
Trang 14Quyết định giá khi không có
chiến lược ưu thế
12/13/2012 GVC: PHAN THẾ CÔNG
Loại trừ liên tiếp những chiến lược bị lấn át
Xác định xem có người chơi nào có chiến lược bị
lấn át không?
Chiến lược bị lấn át là một chiến lược luôn có chiến
lược khác tốt hơn nó
Nếu có chiến lược bị lấn át:
Loại bỏ chiến lược bị lấn át
Làm giảm kích thước của ma trận lợi ích
Lặp lại bước trên cho đến khi không còn chiến lược bị
lấn át
Xác định điểm cân bằng
Trang 15Loại trừ liên tiếp những chiến lược bị lấn át
12/13/2012 GVC: PHAN THẾ CÔNG
Giả sử có hai hãng Alpha và Beta
Hai hãng có 3 sự lựa chọn:
Không mở rộng khả năng sản xuất: giữ nguyên quy
mô
Mở rộng khả năng sản xuất với quy mô nhỏ
Mở rộng khả năng sản xuất với quy mô lớn
Loại trừ liên tiếp những chiến lược bị lấn át
Trang 16Loại trừ liên tiếp những chiến lược bị lấn át
Hãng Beta Giữ nguyên Nhỏ Lớn
12/13/2012 GVC: PHAN THẾ CÔNG
Loại trừ liên tiếp những chiến lược bị lấn át
Thứ tự loại trừ chiến lược bị lấn át không tác động đến kết quả
Hãng Beta Giữ nguyên Nhỏ Lớn
Trang 17Phân tích phản ứng tốt nhất
Ứng với mỗi chiến lược của đối thủ, tìm phản ứng tốt
nhất của người chơi
Ứng với mỗi chiến lược của người chơi 2, tìm phản ứng tốt
nhất của người chơi 1: Trong mỗi cột, tìm kết cục cao nhất
của người chơi 1
Ứng với mỗi chiến lược của người chơi 1, tìm phản ứng tốt
nhất của người chơi 2: Trong mỗi dòng, tìm kết cục cao
nhất của người chơi 2
Cân bằng Nash xảy ra tại ô xảy ra kết cục cao nhất của cả
hai người chơi
Khi phân tích phản ứng tốt nhất không tìm ra cân bằng Nash
không có cân bằng Nash đối với các chiến lược thuần túy
Trang 18 Nghiên cứu triển khai chỉ thành công khi cả hai hãng
đều tham gia
Nếu nghiên cứu triển khai thành công, mỗi hãng sẽ
kiếm được $95.000
35 12/13/2012 GVC: PHAN THẾ CÔNG
Phân tích phản ứng tốt nhất
Có hai cân bằng Nash: cả hai cùng đầu tư, hoặc cả
hai cùng không đầu tư
Các ô khác không phải là cân bằng Nash:
Nếu hãng 1 đầu tư và hãng 2 không đầu tư: cả hai
hãng đều có động cơ thay đổi chiến lược của mình
Đầu tư KhôngHãng 1 Đầu tư 50 , 50 0 , 45
Không 45 , 0 45 , 45
Hãng 2
Trang 19Chiến lược maximin
Người chơi 2
Dưới -1000, 0 2, 1
Chiến lược maximin
Trong trò chơi này, chơi “bên phải” là một chiến lược ưu thế
đối với người chơi 2 vì bằng việc sử dụng chiến lược này,
người chơi 2 sẽ được lợi hơn (thu được 1 chứ không phải là 0),
bất kể người chơi 1 có làm gì đi nữa Như vậy, người chơi 1 sẽ
dự kiến rằng người chơi 2 sẽ chơi chiến lược “bên phải”.
Trong trường hợp này, người chơi 1 sẽ được lợi hơn bằng việc
chơi “bên dưới” (và thu được 2) chứ không phải là chơi “bên
trên” (và thu được 1) Rõ ràng, kết cục (dưới, phải) là cân bằng
Nash của trò chơi này Nhưng lưu ý rằng, người chơi 1 phải
biết rằng người chơi 2 hiểu trò chơi này và là người có lí trí.
Nếu người chơi 2 tình cờ bị lỗi và chơi “bên trái” thì sẽ cực kỳ
thiệt hại cho người chơi 1.
Trang 20Chiến lược maximin
Nếu là người chơi 1, bạn sẽ làm gì? Nếu bạn là người thận trọng, và
lo ngai rằng việc người chơi 2 có thể không được thông tin đầy đủ
hoặc không có lí trí, bạn có thể chọn chơi “bên trên” Trong trường
hợp đó, bạn chắc chắn sẽ được 1, và bạn không có cơ hội mất 1000.
Chiến lược như thế được gọi là chiến lược cực đại tối thiểu
(maximin) vì nó cực đại hoá cái lợi tổi thiểu có thể thu được Nếu cả
hai người chơi cùng sử dụng chiến lược cực đại tối thiểu thì kết cục
sẽ là (trên, phải) Chiến lược cực đại tối thiểu là chiến lược thận
trọng, nhưng không phải là chiến lược tối đa hoá lợi nhuận (vì người
chơi 1 thu được lợi nhuận bằng 1 chứ không phải bằng 2).
Lưu ý rằng, nếu người chơi 1 biết chắc rằng người chơi 2 sử dụng
chiến lược cực đại tối thiểu thì người này sẽ thích chơi “bên dưới”
(và thu được 2), thay vì theo chiến lược cực đại tối thiểu là chơi
“bên trên”.
Chiến lược maximin
Nhưng thú tội là một chiến lược ưu thế đối với
mỗi người tù – nó đem lại kết cục tốt hơn cho họ,
không cần biết đến chiên lược của người tù kia
Các chiến lược ưu thế cũng là các chiến lược cực
đại tối thiểu
Kết cục trong đó cả hai người tù cùng thú tội vừa
là cân bằng Nash vừa là giải pháp cực đại tối
thiểu Như vậy, theo cách suy luật logic nhất thì
thú tội là hợp lý nhất đối với mỗi người tù
Trang 21Chiến lược maximin
Chiến lược maximin (cực đại hóa tối thiểu)
Đối với mỗi chiến lược, xác định kết cục thấp nhất
Trong các kết cục thấp nhất này, lựa chọn kết cục có
giá trị cao nhất
Chiến lược maximin là chiến lược thận trọng,
nhưng không tối đa hóa lợi nhuận
Nó có thể là cân bằng Nash, có thể không.
41 12/13/2012 GVC: PHAN THẾ CÔNG
Chiến lược maximin
Nếu hãng 1 không đầu tư mất lớn nhất là -10
Nếu hãng 1 đầu tư mất lớn nhất là -100
Nếu hãng 1 lựa chọn theo nguyên tắc maximin
chọn không đầu tư
Không Đầu tưHãng 1 Không 0 , 0 -10 , 10
Đầu tư -100 , 0 20 , 10
Hãng 2
Trang 22Trò chơi tuần tự
Nếu hai hãng quyết định đồng thời có 2 cân
bằng Nash không biết chắc các hãng sẽ lựa
chọn như thế nào
Nếu hãng 1 là hãng quyết định trước:
Hãng 1 sẽ quyết định đầu tư và hãng 2 cũng quyết
Hãng A có hai sự lựa chọn là: không phản ứng gì
hoặc đe dọa bằng cách giảm giá
Hãng B có hai sự lựa chọn là gia nhập thị trường
hoặc không
Trang 24…và suy luận ngược
Xem xét quyết định của hãng B
phản ứng
Trang 25Nguyên tắc
Nhìn xa hơn và suy luận ngược
Dự đoán rằng đối thủ của bạn có hành động gì vào
ngày mai, để bạn đưa ra được phản ứng tốt nhất ngày
hôm nay
49 12/13/2012 GVC: PHAN THẾ CÔNG
Giải quyết trò chơi tuần tự
Bắt đầu bằng quyết định cuối cùng trong trò chơi
Xác định chiến lược mà người chơi sẽ chọn
Cắt bớt cây trò chơi:
Loại bỏ chiến lược bị lấn át
Lặp lại quá trình trên cho đến khi xác định được
quyết định của người chơi đầu tiên
Trang 26Hai hãng quyết định sản lượng
Hai hãng độc quyền cạnh tranh nhau về sản lượng
Hàm cầu thị trường là P = 30 – Q
Trong đó Q = Q1+ Q2
Giả định cả hai hãng có chi phí biên bằng 0
Cân bằng Cournot xảy ra khi hai hãng đều quyết định sản
lượng Q1= Q2= 10 và lợi nhuận mỗi hãng là 100
Nếu hãng 1 quyết định trước Q1= 15 và Q2= 7,5, lợi nhuận
tương ứng là 112,5 và 56,25
51 12/13/2012 GVC: PHAN THẾ CÔNG
Hai hãng quyết định sản lượng