Bài giảng Kinh tế học quản lý (Managerial Economics): Chương 7 - Phan Thế Công

Chương 7 trình bày lý thuyết trò chơi và tư duy chiến lược. Chương này giúp người học có thêm những hiểu biết về lý thuyết trò chơi và các tư duy chiên lược như: Một số khái niệm cơ bản, trò chơi đồng thời, cân bằng Nash, chiến lược ưu thế, trò chơi quảng cáo,... Mời các bạn cùng tham khảo để nắm bắt các nội dung chi tiết.

Trang 1

1 12/13/2012 GVC: PHAN THẾ CÔNG

Trang 2

John Nash (1928 )

 Received his Ph.D from

Princeton University with a

28-page thesis on his 22-nd

 Xem phim “A beautiful

Mind” nói về cuộc đời của

Trang 3

Nobel Prize in Economic Sciences 1994

John C Harsanyi John F Nash Jr Reinhard Selten

"for their pioneering analysis of equilibria in the

theory of non-cooperative games"

12/13/2012 GVC: PHAN THẾ CÔNG

Nobel Prize in Economic Sciences 2005

Robert J Aumann Thomas C Schelling

"for having enhanced our understanding of

conflict and cooperation through

game-theory analysis"

Trang 4

Lý thuyết trò chơi

 Lý thuyết trò chơi là một nhánh của toán học ứng

dụng thường được sử dụng trong phân tích kinh

tế

 Nó sử dụng các mô hình để nghiên cứu các tình

huống chiến thuật, trong đó những người tham gia

(người chơi) cố gắng để tối đa kết quả thu được của

mình có tính đến hành động và phản ứng của các đối

thủ khác

7 12/13/2012 GVC: PHAN THẾ CÔNG

Một số khái niệm cơ bản

 Trò chơi: một tình huống mà trong đó người chơi

(người tham gia) đưa ra quyết định chiến lược có

tính đến hành động và phản ứng của các đối thủ

 Nếu tôi tin rằng các đối thủ cạnh tranh của tôi là

người có lý trí và hành động để tối đa hóa lợi nhuận

của họ thì tôi phải tính đến hành vi của họ như thế

nào khi ra quyết định tối đa hóa lợi nhuận của mình

Trang 5

 Người chơi:

 Những người tham gia và hành động của họ có tác

động đến kết quả của của bạn.

 Chiến lược:

 Nguyên tắc hoặc kế hoạch hành động trong khi tiến

hành trò chơi

 Kết cục:

 Giá trị tương ứng với một kết quả có thể xảy ra.

 Phản ánh lợi ích thu được của mỗi người chơi

9 12/13/2012 GVC: PHAN THẾ CÔNG

 Trò chơi đồng thời:

 Các đối thủ ra quyết định khi không biết đến quyết

định của đối phương

 Trò chơi tuần tự:

 Một người chơi ra quyết định trước, người chơi tiếp

theo ra quyết định căn cứ vào quyết định của người

đi trước.

Trang 6

 Trò chơi hợp tác:

 là trò chơi mà trong đó những người chơi có thể đàm

phán những cam kết ràng buộc lẫn nhau cho phép họ

cùng lập các kế hoạch chiến lược chung

 Trò chơi bất hợp tác:

 Các bên tham gia không thể đàm phán và thực thi có

hiệu lực các cam kết ràng buộc

11 12/13/2012 GVC: PHAN THẾ CÔNG

Các giả định để nghiên cứu

 Những người chơi là những người có lý trí

 Mục đích của những người chơi đều là tối đa hóa kết cục

của bản thân họ

 Những người chơi đều là những người biết tính toán hoàn

hảo

 Hiểu biết chung:

 Mỗi người chơi đều biết nguyên tắc của trò chơi

 Mỗi người chơi đều biết rằng người khác cũng biết nguyên

tắc của trò chơi

 Mỗi người chơi đều biết người chơi khác cũng là người có

lý trí

Trang 7

Trò chơi đồng thời

 Trong khi tôi đưa ra quyết định của mình thì bạn

cũng vậy

 Tôi và bạn đều đưa ra quyết định mà không biết đến

quyết định của người khác

 Cái mà tôi quyết định có ảnh hưởng đến kết cục

của bạn và cái mà bạn quyết định cũng ảnh hưởng

đến kết cục của tôi

 Cần phải đưa ra quyết định như thế nào?

13 12/13/2012 GVC: PHAN THẾ CÔNG

Trò chơi đồng thời

 Xác định ma trận lợi ích (ma trận kết cục): chỉ ra

tất cả các kết cục của mỗi người chơi tương ứng

với tất cả các hành động của mỗi người

 Xác định hành động có kết quả tốt nhất cho cả

mình và đối thủ

 Tìm ra cân bằng Nash

Trang 8

Cân bằng Nash

 Cân bằng Nash là một tập hợp các chiến lược

(hoặc hành động) mà mỗi người chơi có thể làm

điều tốt nhất cho mình, khi cho trước hành động

của các đối thủ

 Mỗi người chơi không có động cơ xa rời chiến lược

Nash của mình nên đây là các chiến lược ổn định

15 12/13/2012 GVC: PHAN THẾ CÔNG

Cân bằng Nash

 Nhắc lại:

 Cân bằng Cournot chính là cân bằng Nash:

 Hai hãng ra quyết định sản lượng đồng thời.

 Mỗi hãng sản xuất ở mức sản lượng làm hãng tối đa hóa

lợi nhuận khi biết các hãng đối thủ sản xuất bao nhiêu.

 Cân bằng Stackelberg cũng là cân bằng Nash:

 Một hãng ra quyết định sản lượng trước, một hãng hành

động theo sau

 Mỗi hãng làm điều tốt nhất cho mình khi cho trước quyết

định của đối thủ

Trang 9

Giải quyết trò chơi

 Phản ứng tốt nhất của hãng A

 Nếu Hãng B không quảng cáo: Quảng cáo

 Nếu Hãng B quảng cáo: Quảng cáo

 Hãng A sẽ quảng cáo bất kể hãng B có quảng cáo hay

Trang 10

Chiến lược ưu thế

 Chiến lược ưu thế là một chiến lược hoặc hành

động mang lại kết cục tốt nhất dù cho các đối thủ

có quyết định làm gì đi chăng nữa

 Nếu một trò chơi có chiến lược ưu thế:

 các đối thủ sẽ lựa chọn chiến lược ưu thế của mình

19 12/13/2012 GVC: PHAN THẾ CÔNG

Chiến lược ưu thế và cân bằng

Nash

 Chiến lược ưu thế: Tôi đang làm điều tốt nhất có thể

được cho tôi, bất kể bạn có làm điều gì đi nữa Bạn

đang làm điều tốt nhất có thể cho bạn, bất kể tôi làm

gì đi nữa.

 Cân bằng Nash: Tôi đang làm điều tốt nhất có thể

được, cho trước cái bạn đang làm Bạn đang làm điều

tốt nhất có thể được, cho trước cái tôi đang làm

 Cân bằng chiến lược ưu thế là trường hợp đặc biệt

của cân bằng Nash

Trang 11

Chiến lược ưu thế

 Nguyên tắc:

 Nếu bạn có chiến lược ưu thế, hãy sử dụng nó

 Dự đoán rằng đối thủ của bạn cũng sử dụng chiến

lược ưu thế của họ nếu như họ cũng có chiến lược ưu

thế

21 12/13/2012 GVC: PHAN THẾ CÔNG

Tình thế lưỡng nan của những người tù

20 , 0 1 , 1

- Chiến lược ưu thế của người A: Thú tội

- Chiến lược ưu thế của người B: Thú tội

- Cân bằng xảy ra khi cả hai người cùng thú tội

Trang 12

Trò chơi quảng cáo

- Cả hai hãng đều có chiến lược ưu thế

- Ở trạng thái cân bằng, kết cục của hai hãng đều bị giảm

đi so với trường hợp hai hãng hợp tác với nhau

Ra quyết định như thế nào

khi chỉ có một người chơi có chiến

lược ưu thế?

Giả định rằng người chơi kia sử dụng

chiến lược ưu thế của họ, khi đó

sẽ chọn chiến lược phù hợp nhất

khi đã biết chiến lược họ sử dụng

Trang 13

Khi chỉ một người chơi có chiến

- Hãng A không có chiến lược ưu thế

- Hãng B có chiến lược ưu thế: Quảng cáo

- Hãng A cho rằng B sẽ quảng cáo  khi đó lựa chọn tốt nhất

của hãng A là Quảng cáo

Nếu không người

chơi nào có chiến

lược ưu thế?

Trang 14

Quyết định giá khi không có

chiến lược ưu thế

Loại trừ liên tiếp những chiến lược bị lấn át

 Xác định xem có người chơi nào có chiến lược bị

lấn át không?

 Chiến lược bị lấn át là một chiến lược luôn có chiến

lược khác tốt hơn nó

 Nếu có chiến lược bị lấn át:

 Loại bỏ chiến lược bị lấn át

 Làm giảm kích thước của ma trận lợi ích

 Lặp lại bước trên cho đến khi không còn chiến lược bị

lấn át

 Xác định điểm cân bằng

Trang 15

 Giả sử có hai hãng Alpha và Beta

 Hai hãng có 3 sự lựa chọn:

 Không mở rộng khả năng sản xuất: giữ nguyên quy

mô

 Mở rộng khả năng sản xuất với quy mô nhỏ

 Mở rộng khả năng sản xuất với quy mô lớn

Trang 16

Hãng Beta Giữ nguyên Nhỏ Lớn

Thứ tự loại trừ chiến lược bị lấn át không tác động đến kết quả

Hãng Beta Giữ nguyên Nhỏ Lớn

Trang 17

Phân tích phản ứng tốt nhất

 Ứng với mỗi chiến lược của đối thủ, tìm phản ứng tốt

nhất của người chơi

 Ứng với mỗi chiến lược của người chơi 2, tìm phản ứng tốt

nhất của người chơi 1: Trong mỗi cột, tìm kết cục cao nhất

của người chơi 1

 Ứng với mỗi chiến lược của người chơi 1, tìm phản ứng tốt

nhất của người chơi 2: Trong mỗi dòng, tìm kết cục cao

nhất của người chơi 2

 Cân bằng Nash xảy ra tại ô xảy ra kết cục cao nhất của cả

hai người chơi

 Khi phân tích phản ứng tốt nhất không tìm ra cân bằng Nash

không có cân bằng Nash đối với các chiến lược thuần túy

Trang 18

 Nghiên cứu triển khai chỉ thành công khi cả hai hãng

đều tham gia

 Nếu nghiên cứu triển khai thành công, mỗi hãng sẽ

kiếm được $95.000

35 12/13/2012 GVC: PHAN THẾ CÔNG

Phân tích phản ứng tốt nhất

 Có hai cân bằng Nash: cả hai cùng đầu tư, hoặc cả

hai cùng không đầu tư

 Các ô khác không phải là cân bằng Nash:

 Nếu hãng 1 đầu tư và hãng 2 không đầu tư: cả hai

hãng đều có động cơ thay đổi chiến lược của mình

Đầu tư KhôngHãng 1 Đầu tư 50 , 50 0 , 45

Không 45 , 0 45 , 45

Hãng 2

Trang 19

Chiến lược maximin

Người chơi 2

Dưới -1000, 0 2, 1

 Trong trò chơi này, chơi “bên phải” là một chiến lược ưu thế

đối với người chơi 2 vì bằng việc sử dụng chiến lược này,

người chơi 2 sẽ được lợi hơn (thu được 1 chứ không phải là 0),

bất kể người chơi 1 có làm gì đi nữa Như vậy, người chơi 1 sẽ

dự kiến rằng người chơi 2 sẽ chơi chiến lược “bên phải”.

Trong trường hợp này, người chơi 1 sẽ được lợi hơn bằng việc

chơi “bên dưới” (và thu được 2) chứ không phải là chơi “bên

trên” (và thu được 1) Rõ ràng, kết cục (dưới, phải) là cân bằng

Nash của trò chơi này Nhưng lưu ý rằng, người chơi 1 phải

biết rằng người chơi 2 hiểu trò chơi này và là người có lí trí.

Nếu người chơi 2 tình cờ bị lỗi và chơi “bên trái” thì sẽ cực kỳ

thiệt hại cho người chơi 1.

Trang 20

 Nếu là người chơi 1, bạn sẽ làm gì? Nếu bạn là người thận trọng, và

lo ngai rằng việc người chơi 2 có thể không được thông tin đầy đủ

hoặc không có lí trí, bạn có thể chọn chơi “bên trên” Trong trường

hợp đó, bạn chắc chắn sẽ được 1, và bạn không có cơ hội mất 1000.

Chiến lược như thế được gọi là chiến lược cực đại tối thiểu

(maximin) vì nó cực đại hoá cái lợi tổi thiểu có thể thu được Nếu cả

hai người chơi cùng sử dụng chiến lược cực đại tối thiểu thì kết cục

sẽ là (trên, phải) Chiến lược cực đại tối thiểu là chiến lược thận

trọng, nhưng không phải là chiến lược tối đa hoá lợi nhuận (vì người

chơi 1 thu được lợi nhuận bằng 1 chứ không phải bằng 2).

 Lưu ý rằng, nếu người chơi 1 biết chắc rằng người chơi 2 sử dụng

chiến lược cực đại tối thiểu thì người này sẽ thích chơi “bên dưới”

(và thu được 2), thay vì theo chiến lược cực đại tối thiểu là chơi

“bên trên”.

 Nhưng thú tội là một chiến lược ưu thế đối với

mỗi người tù – nó đem lại kết cục tốt hơn cho họ,

không cần biết đến chiên lược của người tù kia

 Các chiến lược ưu thế cũng là các chiến lược cực

đại tối thiểu

 Kết cục trong đó cả hai người tù cùng thú tội vừa

là cân bằng Nash vừa là giải pháp cực đại tối

thiểu Như vậy, theo cách suy luật logic nhất thì

thú tội là hợp lý nhất đối với mỗi người tù

Trang 21

 Chiến lược maximin (cực đại hóa tối thiểu)

 Đối với mỗi chiến lược, xác định kết cục thấp nhất

 Trong các kết cục thấp nhất này, lựa chọn kết cục có

giá trị cao nhất

 Chiến lược maximin là chiến lược thận trọng,

nhưng không tối đa hóa lợi nhuận

 Nó có thể là cân bằng Nash, có thể không.

41 12/13/2012 GVC: PHAN THẾ CÔNG

 Nếu hãng 1 không đầu tư  mất lớn nhất là -10

 Nếu hãng 1 đầu tư  mất lớn nhất là -100

 Nếu hãng 1 lựa chọn theo nguyên tắc maximin 

chọn không đầu tư

Không Đầu tưHãng 1 Không 0 , 0 -10 , 10

Đầu tư -100 , 0 20 , 10

Hãng 2

Trang 22

Trò chơi tuần tự

 Nếu hai hãng quyết định đồng thời  có 2 cân

bằng Nash  không biết chắc các hãng sẽ lựa

chọn như thế nào

 Nếu hãng 1 là hãng quyết định trước:

 Hãng 1 sẽ quyết định đầu tư và hãng 2 cũng quyết

 Hãng A có hai sự lựa chọn là: không phản ứng gì

hoặc đe dọa bằng cách giảm giá

 Hãng B có hai sự lựa chọn là gia nhập thị trường

hoặc không

Trang 24

…và suy luận ngược

 Xem xét quyết định của hãng B

phản ứng

Trang 25

Nguyên tắc

 Nhìn xa hơn và suy luận ngược

 Dự đoán rằng đối thủ của bạn có hành động gì vào

ngày mai, để bạn đưa ra được phản ứng tốt nhất ngày

hôm nay

49 12/13/2012 GVC: PHAN THẾ CÔNG

Giải quyết trò chơi tuần tự

 Bắt đầu bằng quyết định cuối cùng trong trò chơi

 Xác định chiến lược mà người chơi sẽ chọn

 Cắt bớt cây trò chơi:

 Loại bỏ chiến lược bị lấn át

 Lặp lại quá trình trên cho đến khi xác định được

quyết định của người chơi đầu tiên

Trang 26

Hai hãng quyết định sản lượng

 Hai hãng độc quyền cạnh tranh nhau về sản lượng

 Hàm cầu thị trường là P = 30 – Q

 Trong đó Q = Q1+ Q2

 Giả định cả hai hãng có chi phí biên bằng 0

 Cân bằng Cournot xảy ra khi hai hãng đều quyết định sản

lượng Q1= Q2= 10 và lợi nhuận mỗi hãng là 100

 Nếu hãng 1 quyết định trước Q1= 15 và Q2= 7,5, lợi nhuận

tương ứng là 112,5 và 56,25

51 12/13/2012 GVC: PHAN THẾ CÔNG

Hai hãng quyết định sản lượng

Định dạng
Số trang	26
Dung lượng	434,01 KB