Đồ án Nghiên cứu về lý thuyết trò chơi và ứng dụng trong trò chơi Caro được nghiên cứu với mục tiêu giúp các bạn sinh viên làm quen với phương pháp nghiên cứu khoa học, làm việc nhóm. Nâng cao hiểu biết và mở rộng kiến thức. Rèn luyện kỹ năng lập trình và khả năng áp dụng kiến thức vào giải quyết bài toán thực tế. Mời các em cùng tham khảo nội dung chi tiết tại đây nhé.
Trang 2L I NH N XÉT C A GI NG VIÊN Ờ Ậ Ủ Ả
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
………
Trang 3M C L C Ụ Ụ
Trang 4L I M Đ U Ờ Ở Ầ
1. Đ tài nghiên c u:ề ứ
Lý thuy t trò ch i là m t ế ơ ộ lĩnh v c có nhi u ng d ng trong th c ti nự ề ứ ụ ự ễ Ngành này nghiên c u các tình hu ng chi n thu t trong đó các đ i th l aứ ố ế ậ ố ủ ự
ch n các hành đ ng khác nhau đ c g ng làm t i đa k t qu nh n đọ ộ ể ố ắ ố ế ả ậ ược. Ban
đ u đầ ược phát tri n nh là m t công c đ nghiên c u hành vi kinh t h c,ể ư ộ ụ ể ứ ế ọ ngày nay Lý thuy t trò ch i đế ơ ược s d ng trong nhi u ngành khoa h c, tử ụ ề ọ ừ Sinh h c t i Tri t h c. Đ c bi t, Lý thuy t trò ch i đọ ớ ế ọ ặ ệ ế ơ ược phát tri n m nh mể ạ ẽ cùng v i s phát tri n c a trí tu nhân t o và ng d ng c a trí tu nhân t oớ ự ể ủ ệ ạ ứ ụ ủ ệ ạ trong vi c ch t o robots. T nh ng ng d ng ti m năng c a lý thuy t tròệ ế ạ ừ ữ ứ ụ ề ủ ế
ch i và s đam mê tìm hi u ki n th c cũng nh nh m nâng cao ki n th c vàơ ự ể ế ứ ư ằ ế ứ
k năng l p trình, nhóm sinh viên chúng em đã ch n đ tài tìm hi u v lýỹ ậ ọ ề ể ề thuy t trò ch i và ng d ng trong trò ch i caro.ế ơ ứ ụ ơ
2. M c tiêu nghiên c u:ụ ứ
Làm quen v i phớ ương pháp nghiên c u khoa h c, làm vi c nhóm.ứ ọ ệ
Nâng cao hi u bi t và m r ng ki n th c.ể ế ở ộ ế ứ
Rèn luy n k năng l p trình và kh năng áp d ng ki n th c vào gi i quy tệ ỹ ậ ả ụ ế ứ ả ế bài
Tìm hi u C b n v lý thuy t trò ch i.ể ơ ả ề ế ơ
Tìm hi u m t s gi i thu t tìm ki m trong trí tu nhân t o.ể ộ ố ả ậ ế ệ ạ
Trang 5 Tìm hi u ngôn ng l p trình Csharp.ể ữ ậ
Cài đ t chặ ương trình th nghi m.ử ệ
5. Ph m vi nghiên c u:ạ ứ
Tìm hi u C b n v lý thuy t trò ch i: L ch s c a lý thuy t trò ch i, cáchể ơ ả ề ế ơ ị ử ủ ế ơ
bi u di n, phân lo i trò ch i, các ng d ng c a lý thuy t trò ch i.ể ễ ạ ơ ứ ụ ủ ế ơ
Tìm hi u m t s gi i thu t tìm ki m trong trí tu nhân t o: Tìm ki m có ể ộ ố ả ậ ế ệ ạ ế
đ i th , tìm ki m t i u.ố ủ ế ố ư
Ngôn ng l p trình Csharp.ữ ậ
Cài đ t chặ ương trình c caro gi a ngờ ữ ười và máy tính s d ng gi i thu t ử ụ ả ậMiniMax và gi i thu t tìm ki m AlphaBeta.ả ậ ế
6. Phương pháp nghiên c u:ứ
Tham kh o tài li u c a th y cô, trên m ng.ả ệ ủ ầ ạ
Tham kh o ý ki n b n bè, th y cô.ả ế ạ ầ
Cài đ t chặ ương trình th nghi m.ử ệ
7. N i dung nghiên c u:ộ ứ
Lý thuy t c b n v trò ch i.ế ơ ả ề ơ
ng d ng trong trò ch i Caro.Ứ ụ ơ
Trang 6CH ƯƠ NG 1: TÌM HI U C B N V LÝ THUY T TRÒ CH I Ể Ơ Ả Ề Ế Ơ
là ngườ ầi đ u tiên hình th c hóa nó trong th i k trứ ờ ỳ ước và trong Chi n tranhế
L nh, ch y u do áp d ng c a nó trong chi n lạ ủ ế ụ ủ ế ược quân s , n i ti ng nh t làự ổ ế ấ khái ni m đ m b o phá h y l n nhau (ệ ả ả ủ ẫ mutual assured destruction). B t đ uắ ầ
t nh ng năm 1970, Lý thuy t trò ch i b t đ u đừ ữ ế ơ ắ ầ ược áp d ng cho nghiên c uụ ứ
v hành vi đ ng v t, trong đó có s phát tri n c a các loài qua ch n l c tề ộ ậ ự ể ủ ọ ọ ự nhiên. Do các trò ch i hay nh Song đ tù nhân (ơ ư ề prisoner's dilemma), trong đó
l i ích cá nhân làm h i cho t t c m i ngợ ạ ấ ả ọ ười, Lý thuy t trò ch i đã b t đ uế ơ ắ ầ
được dùng trong Chính tr h c, Đ o đ c h c và tri t h c. Cu i cùng, Lýị ọ ạ ứ ọ ế ọ ố thuy t trò ch i g n đây đã thu hút đế ơ ầ ượ ực s chú ý c a các nhà Khoa h c máyủ ọ tính do ng d ng c a nó trong Trí tu nhân t o và Đi u khi n h c.ứ ụ ủ ệ ạ ề ể ọ
Bên c nh các m i quan tâm có tính ch t hàm lâm, lý thuy t trò ch i đãạ ố ấ ế ơ
nh n đậ ượ ực s chú ý trong văn hóa đ i chúng. John Nash, m t nhà lý thuy t tròạ ộ ế
ch i, ngơ ười đã nh n đậ ược gi i thả ưởng Nobel, đã là ch đ trong cu n h i kýủ ề ố ồ năm 1998 c a tác gi Sylvia Nasar và trong b phim M t tâm h n đ p (ủ ả ộ ộ ồ ẹ A Beautiful Mind) năm 2001. M t s trò ch i truy n hình (ộ ố ơ ề game show) đã sử
Trang 7d ng các tính hu ng c a lý thuy t trò ch i, trong đó có Friend or Foe? vàụ ố ủ ế ơ Survivor.
Tuy tương t v i Lý thuy t quy t đ nh, nh ng Lý thuy t trò ch i nghiênự ớ ế ế ị ư ế ơ
c u các quy t đ nh đứ ế ị ược đ a ra trong m t môi trư ộ ường trong đó các đ i thố ủ
tương tác v i nhau. Nói cách khác, Lý thuy t trò ch i nghiên c u cách l aớ ế ơ ứ ự
ch n hành vi t i u khi chi phí và l i ích c a m i l a ch n là không c đ nhọ ố ư ợ ủ ỗ ự ọ ố ị
mà ph thu c vào l a ch n c a các cá nhân khác.ụ ộ ự ọ ủ
2. L ch s c a ngành Lý thuy t trò ch i:ị ử ủ ế ơ
Nh ng th o lu n đ u tiên đữ ả ậ ầ ược bi t đ n v lý thuy t trò ch i xu t hi nế ế ề ế ơ ấ ệ trong m t lá th vi t b i ộ ư ế ở James Waldegrave vào năm 1713. Trong lá th này,ư Waldegrave đ a ra l i gi i ư ờ ả chi n thu t h n h pế ậ ỗ ợ minimax cho m t trò đánh bàiộ hai người ch i ơ Le Her. Ch đ n khi s xu t b n Nghiên c u v nh ng Đ nhỉ ế ự ấ ả ứ ề ữ ị
lu t toán h c c a lý thuy t Tài s n c a ậ ọ ủ ế ả ủ Antoine Augustin Cournot vào năm
1838 thì nh ng phân tích chung v lý thuy t trò ch i m i đữ ề ế ơ ớ ược theo đu i.ổ Trong tác ph m này Cournot xem xét ẩ duopoly và đ a m t m t phiên b n gi iư ộ ộ ả ớ
h n c a ạ ủ cân b ng Nashằ
M c dù nh ng phân tích c a Cournot là t ng quát h n là c a Waldegrave,ặ ữ ủ ổ ơ ủ
lý thuy t trò ch i ch a th t s t n t i nh là m t ngành duy nh t cho đ n khiế ơ ư ậ ự ồ ạ ư ộ ấ ế
John von Neumann xu t b n m t lo t các bài báo vào năm 1928. Nh ng k tấ ả ộ ạ ữ ế
qu này sau này đả ược m r ng thêm ra trong cu n sách xu t b n năm 1944 Lýở ộ ố ấ ả thuy t trò ch i và các hành vi kinh t b i von Neumann và ế ơ ế ở Oskar Morgenstern. Tác ph m uyên thâm này ch a đ ng phẩ ứ ự ương pháp tìm nh ng l i gi i t i uữ ờ ả ố ư cho nh ng trò ch i t ng b ng không v i hai ngữ ơ ổ ằ ớ ười ch i. Trong su t kho ngơ ố ả
th i gian này, nh ng tác ph m v lý thuy t trò ch i ch y u t p trung vào lýờ ữ ẩ ề ế ơ ủ ế ậ thuy t các ế trò ch i h p tácơ ợ , phân tích v nh ng chi n thu t t i u cho m tề ữ ế ậ ố ư ộ nhóm các cá nhân, gi s r ng h có th b o đ m nh ng th a thu n gi hả ử ằ ọ ể ả ả ữ ỏ ậ ữ ọ
v i nh ng chi n thu t thích h p.ớ ữ ế ậ ợ
Trang 8Vào năm 1950, th o lu n đ u tiên c a ả ậ ầ ủ Prisoner's dilemma xu t hi n, vàấ ệ
m t thí nghi m độ ệ ược làm v trò ch i này t i công ty ề ơ ạ RAND. Vào kho ngả cùng th i gian đó, ờ John Nash phát tri n m t đ nh nghĩa v m t chi n thu tể ộ ị ề ộ ế ậ
"t i u" cho các trò ch i v i nhi u ngố ư ơ ớ ề ười ch i, và ch a m t t i u nào đơ ư ộ ố ư ượ c
đ nh nghĩa trị ước đó, được bi t đ n nh là ế ế ư cân b ng Nashằ Cân b ng này là đằ ủ
t ng quát, cho phép s phân tích v ổ ự ề trò ch i không h p tácơ ợ thêm vào nh ng tròữ
ch i có h p tác.ơ ợ
Lý thuy t trò ch i tr i qua m t th i gian sôi đ ng trong nh ng năm 1950,ế ơ ả ộ ờ ộ ữ trong nh ng năm đó nh ng khái ni m v ữ ữ ệ ề c t lõiố , d ng trò ch i bao quátạ ơ , trò
ch i giơ ả, trò ch i l pơ ặ , và giá tr Shapleyị được phát tri n. Thêm vào đó, nh ngể ữ
ng d ng đ u tiên c a lý thuy t trò ch i vào
di n ra trong th i gian này.ễ ờ
Vào năm 1965, Reinhard Selten gi i thi u ớ ệ khái ni m l i gi iệ ờ ả c a ủ các cân
b ng lý tằ ưởng c a các trò ch i conủ ơ , làm chính xác thêm cân b ng Nashằ equilibrium (sau đó cũng ông gi i thi u ớ ệ s hoàn thi n rung tayự ệ ). Vào năm 1967,
John Harsanyi phát tri n các khái ni m ể ệ thông tin hoàn toàn và trò ch iơ Bayesian. Ông ta, cùng v i John Nash và Reinhard Selten, đo t ớ ạ gi i thả ưở ngNobel v kinh t vào năm 1994.ề ế
Trong nh ng năm 1970, lý thuy t trò ch i đữ ế ơ ược áp d ng r ng rãi vào ụ ộ sinh
h cọ , ch y u là do k t qu c a các công trình c a ủ ế ế ả ủ ủ John Maynard Smith và
chi n lế ược ti n hóa b n v ngế ề ữ c a ông. Thêm vào đó, nh ng khái ni m v ủ ữ ệ ề cân
b ng liên quanằ , s hoàn toàn rung tay, và ự ki n th c chungế ứ được gi i thi u vàớ ệ phân tích
Vào năm 2005, nh ng lý thuy t gia trò ch i ữ ế ơ Thomas Schelling và Robert Aumann đo t ạ gi i thả ưởng Nobel v kinh t Schelling là v các mô hình đ ng,ề ế ề ộ các ví d ban đ u c a ụ ầ ủ lý thuy t ti n hóa trò ch iế ế ơ Aumann đóng góp thêm vào
trường cân b ngằ (equilibrium school), phát tri n m t cân b ng làm thô điể ộ ằ
Trang 9nh ng cân b ng liên quan nhau và phát tri n các phân tích chi ti t v gi sữ ằ ể ế ề ả ử
ví d , có hai đ u th , m t ngụ ấ ủ ộ ười ch n hàng, ngọ ười kia ch n c t. M i đ u thọ ộ ỗ ấ ủ
có hai chi n lế ược, m i chi n lỗ ế ược được bi u di n b i m t ô để ễ ở ộ ược xác đ nhị
b i s hi u hàng và s hi u c t c a nó. M c thở ố ệ ố ệ ộ ủ ứ ưởng ph t đạ ược ghi trong ô
đó. Giá tr th nh t là m c thị ứ ấ ứ ưởng ph t cho đ u th ch i theo hàng (trong víạ ấ ủ ơ
d là ụ Đ u th 1 ấ ủ ); giá tr th hai là m c thị ứ ứ ưởng ph t cho đ u th ch i theo c tạ ấ ủ ơ ộ (trong ví d là ụ Đ u th 2 ấ ủ ). Gi s ả ử Đ u th 1 ấ ủ ch i hàng trên và ơ Đ u th 2 ấ ủ
ch i c t trái. Khi đó, ơ ộ Đ u th 1 ấ ủ nh n 4 đi m và ậ ể Đ u th 2 ấ ủ nh n 3 đi m.ậ ể
Khi m t trò ch i độ ơ ược bi u di n b ng d ng chu n t c, ngể ễ ằ ạ ẩ ắ ười ta coi r ngằ
m i đ u th hành đ ng m t cách đ ng th i, ho c ít nh t không bi t v hànhỗ ấ ủ ộ ộ ồ ờ ặ ấ ế ề
đ ng c a ngộ ủ ười kia. N u các đ u th có thông tin v l a ch n c a các đ uế ấ ủ ề ự ọ ủ ấ
th khác, trò ch i thủ ơ ường được bi u di n b ng d ng m r ng.ể ễ ằ ạ ở ộ
3.2 D ng m r ng:ạ ở ộ
Các trò ch i d ng m r ng c g ng mô t các trò ch i có th t quanơ ạ ở ộ ố ắ ả ơ ứ ự
tr ng. đây, các trò ch i đọ Ở ơ ược bi u di n b ng cây. M i đ nh (ho c nút) bi uể ễ ằ ỗ ỉ ặ ể
di n m t đi m mà ngễ ộ ể ười ch i có th l a ch n. Ngơ ể ự ọ ười ch i đơ ược ch rõ b ngỉ ằ
m t s ghi c nh đ nh. Các đo n th ng đi ra t đ nh đó bi u di n các hànhộ ố ạ ỉ ạ ẳ ừ ỉ ể ễ
đ ng có th cho ngộ ể ười ch i đó. M c thơ ứ ưởng ph t đạ ược ghi rõ t i đáy cây.ạCác trò ch i m r ng còn có th mô t các trò ch i điơ ở ộ ể ả ơ đ ngồ th i. Ho c cóờ ặ
m t độ ường ch m ch m ho c m t đấ ấ ặ ộ ường tròn v quanh hai đ nh khác nhau đẽ ỉ ể
bi u di n r ng chúng đ u thu c cùng m t t p h p thông tin (nghĩa là, ngể ễ ằ ề ộ ộ ậ ợ ườ i
ch i không bi t h đang đi m nào).ơ ế ọ ở ể
Trang 104. Các lo i trò ch i:ạ ơ
4.1 Trò ch i đ i x ng:ơ ố ứ
M t trò ch i đ i x ng là m t trò ch i mà ph n l i cho vi c ch i m tộ ơ ố ứ ộ ơ ầ ợ ệ ơ ộ chi n thu t nào đó ch ph thu c vào các chi n thu t đế ậ ỉ ụ ộ ế ậ ược s d ng, chử ụ ứ không ph thu c vào ngụ ộ ười nào đang ch i. N u nh ơ ế ư danh tính c a nh ngủ ữ
người ch i có th thay đ i mà không làm thay đ i ph n l i đ i v i chi nơ ể ổ ổ ầ ợ ố ớ ế thu t ch i, thì m t trò ch i là đ i x ng. Nhi u trò ch i 2×2 thậ ơ ộ ơ ố ứ ề ơ ường đượ cnghiên c u là đ i x ng. Nh ng bi u di n chu n c a trò ch i con gà, song đứ ố ứ ữ ể ễ ẩ ủ ơ ề
tù nhân, đi săn nai là nh ng trò ch i đ i x ng.ữ ơ ố ứ
Đa s nh ng trò ch i b t đ i x ng đố ữ ơ ấ ố ứ ược nghiên c u là nh ng trò ch i màứ ữ ơ các t p h p chi n thu t khác nhau đậ ợ ế ậ ượ ử ục s d ng b i hai ngở ười ch i. Ch ngơ ẳ
h n, trò ch i t i h u th và tạ ơ ố ậ ư ương t nh v y trò nhà đ c tài có chi n thu tự ư ậ ộ ế ậ khác nhau cho m i ngỗ ười ch i. Tuy v y, có th x y ra trơ ậ ể ả ường h p m t tròợ ộ
ch i có nh ng chi n thu t gi ng nhau cho c hai ngơ ữ ế ậ ố ả ười ch i, nh ng v n b tơ ư ẫ ấ
đ i x ng. Ch ng h n, trò ch i đố ứ ẳ ạ ơ ược minh h a bên ph i là b t đ i x ng m cọ ả ấ ố ứ ặ
dù cho có cùng t p các chi n thu t cho c 2 ngậ ế ậ ả ười ch i.ơ
4.2 Trò ch i t ng b ng không và t ng khác không:ơ ổ ằ ổ
Trong trò ch i t ng b ng không, v i m i t h p c a các chi n lơ ổ ằ ớ ọ ổ ợ ủ ế ược ch i,ơ
t ng đi m c a t t c các ngổ ể ủ ấ ả ười ch i trong ván ch i luôn b ng 0. Nói m tơ ơ ằ ộ cách không chính th c, đ u th này hứ ấ ủ ưởng l i trên thi t h i c a các đ u thợ ệ ạ ủ ấ ủ khác. M t ví d là trò Poker, trong đó ngộ ụ ười này th ng s đi m b ng đúng sắ ố ể ằ ố
đi m mà ngể ười kia thua. Các lo i c c đi n nh c vây, c vua và c tạ ờ ổ ể ư ờ ờ ờ ướ ngcũng là các trò ch i t ng b ng không. Nhi u trò ch i mà các nhà lý thuy t tròơ ổ ằ ề ơ ế
ch i nghiên c u, trong đó có song đ tù nhân n i ti ng, là các trò ch i t ngơ ứ ề ổ ế ơ ổ khác không, do có m t s k t c c có t ng k t qu l n h n ho c nh h nộ ố ế ụ ổ ế ả ớ ơ ặ ỏ ơ không. Nói m t cách không chính th c, trong các trò ch i t ng khác không,ộ ứ ơ ổ
m t thu ho ch c a đ u th này không nh t thi t tộ ạ ủ ấ ủ ấ ế ương ng v i m t thi t h iứ ớ ộ ệ ạ
c a m t đ u th khác. Có th bi n đ i m t trò ch i b t k thành m t trò ch iủ ộ ấ ủ ể ế ổ ộ ơ ấ ỳ ộ ơ
Trang 11t ng b ng không b ng cách b sung m t đ u th "bù nhìn" sao cho các thi tổ ằ ằ ổ ộ ấ ủ ệ
h i c a đ u th này bù l i t ng thu ho ch c a các đ u th khác.ạ ủ ấ ủ ạ ổ ạ ủ ấ ủ
4.3 Trò ch i đ ng th i và trò ch i tu n t :ơ ồ ờ ơ ầ ự
Trong các trò ch i đ ng th i (simultaneous game), c hai đ u th th cơ ồ ờ ả ấ ủ ự
hi n các nệ ước đi m t cách đ ng th i, ho c n u không thì đ u th này sộ ồ ờ ặ ế ấ ủ ẽ không bi t v các hành đ ng trế ề ộ ước đó c a các đ i th khác (và nh v y cũngủ ố ủ ư ậ
t o "hi u ng" đ ng th i). Trong các trò ch i tu n t (sequential game),ạ ệ ứ ồ ờ ơ ầ ự
người đi sau có bi t m t s (nh ng không nh t thi t toàn b ) thông tin v cácế ộ ố ư ấ ế ộ ề
nước đi trước
Bi u di n d ng chu n t c để ễ ạ ẩ ắ ược dùng đ bi u di n các trò ch i đ ng th i,ể ể ễ ơ ồ ờ còn Bi u di n d ng m r ng để ễ ạ ở ộ ược dùng cho các trò ch i tu n t ơ ầ ự
4.4 Trò ch i thông tin hoàn h o và không hoàn h o:ơ ả ả
Các trò ch i thông tin hoàn h o (games of perfect information) l p thànhơ ả ậ
m t t p con quan tr ng c a các trò ch i tu n t M t trò ch i độ ậ ọ ủ ơ ầ ự ộ ơ ược g i là cóọ thông tin hoàn h o n u m i đ u th bi t t t c các nả ế ọ ấ ủ ế ấ ả ước đi mà t t c các đ uấ ả ấ
th khác đã th c hi n. Do v y ch có các trò ch i tu n t m i có th là các tròủ ự ệ ậ ỉ ơ ầ ự ớ ể
ch i thông tin hoàn h o. H u h t các trò ch i đơ ả ầ ế ơ ược nghiên c u trong lý thuy tứ ế trò ch i là các trò ch i thông tin không hoàn h o, tuy m t s trò ch i hay nhơ ơ ả ộ ố ơ ư
c vây, c vua l i là trò ch i thông tin hoàn h o.ờ ờ ạ ơ ả
Tính ch t thông tin hoàn h o thấ ả ường b nh m l n v i khái ni m thông tinị ầ ẫ ớ ệ
đ y đ Tính ch t thông tin đ y đ đòi h i r ng m i ngầ ủ ấ ầ ủ ỏ ằ ỗ ười ch i bi t v cácơ ế ề chi n lế ược và thành qu thu đả ược c a các ngủ ười ch i khác, nh ng khôngơ ư
nh t thi t bi t v các hành đ ng c a h ấ ế ế ề ộ ủ ọ
4.5 Các trò ch i dài vô t n:ơ ậ
B i các lý do hi n nhiên, các trò ch i đở ể ơ ược nghiên c u b i các kinh t giaứ ở ế
và nh ng ngữ ười ch i trong th gi i th c nhìn chung là k t thúc trò ch i trongơ ế ớ ự ế ơ
h u h n các bữ ạ ước đi. Các nhà toán h c lý thuy t không b c n tr b i đi u đó,ọ ế ị ả ở ở ề
Trang 12và lý thuy t gia v t p h p đ c bi t nghiên c u v các trò ch i k t thúc sauế ề ậ ợ ặ ệ ứ ề ơ ế
vô h n các bạ ước đi, b i ngớ ười th ng (hay là ph n l i) là không bi t đắ ầ ợ ế ược cho
đ n sau khi các bế ước đi đó đã hoàn thành
S chú ý thự ường không ph i là quá nhi u v cách nào t t nh t đ ch i tròả ề ề ố ấ ể ơ
ch i, mà đ n gi n là ch ph thu c vào ngơ ơ ả ỉ ụ ộ ười ch i hay ngơ ười kia có hay không m t chi n thu t chi n th ng. (Có th ch ng minh r ng, s d ng tiênộ ế ậ ế ắ ể ứ ằ ử ụ
đ ch n l a, là có nh ng trò ch i v iề ọ ự ữ ơ ớ ngay c là đ y đ thông tin hoàn toàn,ả ầ ủ
và ch có k t qu là "th ng" hay "thua"ỉ ế ả ắ và không người ch i nào có chi nơ ế thu t đ chi n th ng). S t n t i c a nh ng chi n thu t nh v y, cho nh ngậ ể ế ắ ự ồ ạ ủ ữ ế ậ ư ậ ữ trò ch i đơ ược thi t k m t cách thông minh, có nh ng k t qu quan tr ngế ế ộ ữ ế ả ọ trong lý thuy t miêu t t p h p.ế ả ậ ợ
5. ng d ng c a lý thuy t trò ch i:Ứ ụ ủ ế ơ
Các trò ch i trong d ng này hay d ng khác đơ ạ ạ ược s d ng r ng rãi trongử ụ ộ nhi u ngành nghiên c u khác nhau.ề ứ
5.1 Kinh t và kinh doanh:ế
Các nhà kinh t h c đã s d ng lý thuy t trò ch i đ phân tích m t di nế ọ ử ụ ế ơ ể ộ ệ
r ng các hi n tộ ệ ượng kinh t , trong đó có đ u giá, ế ấ m c cặ ả, duopoly và oligopoly, các t ch c ổ ứ m ng lạ ưới xã h iộ và các h th ng b u cệ ố ầ ử. Nghiên c uứ này thường t p trung vào m t t p c th các chi n lậ ộ ậ ụ ể ế ược được bi t v i tên cácế ớ
tr ng thái cân b ngạ ằ trong trò ch i. N i ti ng nh t là ơ ổ ế ấ cân b ng Nashằ c a nhàủ toán h c ọ John Nash, người đã được gi i thả ưởng Nobel cho công trình nghiên
c u c a ông v lý thuy t trò ch i.ứ ủ ề ế ơ
Công d ng đ u tiên là đ cung c p thông tin cho chúng ta v vi c là toànụ ầ ể ấ ề ệ
b dân s s th c s hành x nh th nào. M t s h c gi tin r ng b ngộ ố ẽ ự ự ử ư ế ộ ố ọ ả ằ ằ cách tìm ra nh ng đi m cân b ng c a nh ng trò ch i h có th d đoán đữ ể ằ ủ ữ ơ ọ ể ự ượ cdân s s hành x nh th nào khi đ i phó v i nh ng tình hu ng gi ng nhố ẽ ử ư ế ố ớ ữ ố ố ư trò ch i đang đơ ược nghiên c u. Quan đi m đ c bi t này v lý thuy t trò ch iứ ể ặ ệ ề ế ơ
Trang 13đã b ch trích g n đây. Th nh t, nó b ch trích b i vì nh ng gi s đị ỉ ầ ứ ấ ị ỉ ở ữ ả ử ược ra
b i các lý thuy t gia trò ch i thở ế ơ ường b vi ph m. M t s lý thuy t gia trò ch iị ạ ộ ố ế ơ
có th gi s r ng nh ng ngể ả ử ằ ữ ười ch i luôn hành x h p lý đ làm t i u hóaơ ử ợ ể ố ư
ph n th ng c a anh ta (mô hình Homo economicus), nh ng ngầ ắ ủ ư ười th t thậ ườ nghành đ ng ho c là không h p lý, ho c là hành đ ng h p lý đ là t i u ph nộ ặ ợ ặ ộ ợ ể ố ư ầ
th ng c a m t nhóm ngắ ủ ộ ườ ới l n h n (ơ hành đ ng v thaộ ị ). Nh ng lý thuy t giaữ ế trò ch i tr l i b ng cách so sánh nh ng gi s c a h v i nh ng gi sơ ả ờ ằ ữ ả ử ủ ọ ớ ữ ả ử
đượ ử ục s d ng trong v t lý. Do v y trong khi nh ng gi s c a h không ph iậ ậ ữ ả ử ủ ọ ả luôn luôn đúng, h có th xem lý thuy t trò ch i nh là m t lý tọ ể ế ơ ư ộ ưởng khoa
h c h p lý gi ng nh là các mô hình đọ ợ ố ư ược s d ng b i các ử ụ ở nhà v t lýậ Tuy nhiên, nh ng ch trích thêm c a vi c s d ng này c a lý thuy t trò ch i đãữ ỉ ủ ệ ử ụ ủ ế ơ
được gi m đi b i vì m t s thí nghiêm cho th y r ng các cá nhân không ch iả ở ộ ố ấ ằ ơ
nh ng chi n lữ ế ược cân b ng. Ví d , trong ằ ụ trò ch i Centipedeơ , Đoán 2/3 trung bình, và trò Nhà đ c tàiộ , người ta thường không ch i v i cân b ng Nash. Sơ ớ ằ ự tranh cãi v n ti p di n liên quan đ n s quan tr ng c a nh ng thí nghi mẫ ế ễ ế ự ọ ủ ữ ệ này
Thay vào đó, m t s tác gi cho r ng cân b ng Nash không đ a ra nh ngộ ố ả ằ ằ ư ữ
d đoán cho toàn dân s con ngự ố ười, nh ng thiên v cung c p m t l i gi iư ề ấ ộ ờ ả thích t i sao nh ng dân s ch i theo cân b ng Nash v n duy trì trong tr ngạ ữ ố ơ ằ ẫ ở ạ thái đó. Tuy nhiên, câu h i t i sao dân s đ t đ n nh ng đi m đó v n là bàiỏ ạ ố ạ ế ữ ể ẫ toán m ở
M t s lý thuy t gia trò ch i đã xoay qua ộ ố ế ơ lý thuy t ti n hóa trò ch iế ế ơ đ lýể
gi i nh ng lo l ng này. Nh ng mô hình này gi s ho c là không có s h p lýả ữ ắ ữ ả ử ặ ự ợ nào ho c là ặ h p lý b ch nợ ị ặ trên ph n c a các ngầ ủ ười ch i. M c cho tên g i, lýơ ặ ọ thuy t ti n hóa trò ch i không c n thi t gi s ế ế ơ ầ ế ả ử ch n l c t nhiênọ ọ ự theo nghĩa
c a sinh h c. Lý thuy t ti n hóa trò ch i bao g m c sinh h c cũng nh làủ ọ ế ế ơ ồ ả ọ ư
ti n hóa văn hóa và cũng nh các mô hình h c t p cá nhân (ví d , bi n đ ngế ư ọ ậ ụ ế ộ
c a ủ trò ch i giơ ả)
Trang 14Theo ý ki n khác, m t s h c gi cho r ng lý thuy t trò ch i không ph i làế ộ ố ọ ả ằ ế ơ ả
m t công c d đoán cho hành vi c a con ngộ ụ ự ủ ười, mà nh là m t đ ngh đư ộ ề ị ể
người ta nên ph i hành x nh th nào. B i vì m t ả ử ư ế ở ộ cân b ng Nashằ c a m tủ ộ trò ch i bao g m nh ng đáp l i t t nh t cho nh ng hành đ ng c a các ngơ ồ ữ ạ ố ấ ữ ộ ủ ườ i
ch i khác, ch i m t chi n thu t là m t ph n c a m t cân b ng Nash trông cóơ ơ ộ ế ậ ộ ầ ủ ộ ằ
v là h p lý. Tuy nhiên, vi c s d ng này c a lý thuy t trò ch i cũng đã b chẻ ợ ệ ử ụ ủ ế ơ ị ỉ trích. Đ u tiên, trong m t s trầ ộ ố ường h p là h p lý đ ch i m t chi n lợ ợ ể ơ ộ ế ượ ckhông cân b ng n u nh m t ngằ ế ư ộ ười mong đ i nh ng ngợ ữ ười khác cũng ch iơ
nh ng chi n lữ ế ược không cân b ng. Ví d , xem ằ ụ Đoán 2/3 giá tr trung bìnhị
Th hai là, ứ Song đ tù nhânề đ a ra m t ph n ví d n i b t khác. Trongư ộ ả ụ ổ ậ
Song đ tù nhânề , m i ngỗ ười ch i đi theo s thích riêng c a anh ta d n đ n cơ ở ủ ẫ ế ả hai người ch i đ u b thi t thòi thêm n u nh h không theo đu i nh ng sơ ề ị ệ ế ư ọ ổ ữ ở thích riêng c a h M t s h c gi tin r ng đi u này bi u di n s th t b iủ ọ ộ ố ọ ả ằ ề ể ễ ự ấ ạ
c a lý thuy t trò ch i nh là m t khuy n cáo cho hành x ủ ế ơ ư ộ ế ử
Trang 15Không gi ng nh trong kinh t , ph n l i cho nh ng trò ch i trong ố ư ế ầ ợ ữ ơ sinh h cọ
thường được di n d ch nh là tễ ị ư ương ng v i ứ ớ s thích nghiự Thêm vào đó, chú
ý đã ít h n v ơ ề các cân b ngằ có liên quan đ n khái ni m c a s h p lý, nh ngế ệ ủ ự ợ ư
là thiên v nh ng th có th duy trì đề ữ ứ ể ược b i các l c ở ự ti n hóaế Cân b ngằ
được bi t đ n nhi u nh t trong sinh h c đế ế ề ấ ọ ược bi t đ n nh là ế ế ư chi n lế ượ c
ti n hóa b n v ngế ề ữ (vi t t t ESS cho Evolutionary Stable Strategy), là đế ắ ượ c
gi i thi u l n đ u b i ớ ệ ầ ầ ở John Maynard Smith (mô t trong cu n sách năm 1982ả ố
c a ông). M c đu đ ng l c ban đ u c a nó không liên quan đ n b t c yêuủ ặ ộ ự ầ ủ ế ấ ứ
c u v tinh th n nào c a ầ ề ầ ủ cân b ng Nashằ , m i ESS là m t cân b ng Nash.ỗ ộ ằ
Trong sinh h c, lý thuy t trò ch i đã đọ ế ơ ược s d ng đ hi u đử ụ ể ể ược nhi uề
hi n tệ ượng khác nhau. Nó đượ ử ục s d ng l n đ u đ gi i thích s ti n hóa (vàầ ầ ể ả ự ế
b n v ng) c a ề ữ ủ t l gi i tínhỷ ệ ớ kho ng 1:1.ả Ronald Fisher (1930) đ ngh r ng tề ị ằ ỉ
l gi i tính 1:1 là k t qu c a nh ng l c ti n hóa tác đ ng lên nh ng cá nhânệ ớ ế ả ủ ữ ự ế ộ ữ
là nh ng ngữ ười có th để ược xem nh là c g ng làm t i đa s cháu ch t c aư ố ắ ố ố ắ ủ mình
Thêm vào đó, nh ng nhà sinh v t đã s d ng ữ ậ ử ụ lý thuy t trò ch i ti n hóaế ơ ế và ESS đ gi i thích s n i lên c a ể ả ự ổ ủ liên l c gi a muông thúạ ữ (Maynard Smith& Harper, 2003). S phân tích c a ự ủ các trò ch i tín hi uơ ệ và các trò ch i liên l cơ ạ khác đã cung c p m t s tr c giác vào trong s ti n hóa c a vi c liên l c gi aấ ộ ố ự ự ế ủ ệ ạ ữ muôn thú
Cu i cùng, các nhà sinh v t đã s d ng ố ậ ử ụ trò ch i di u hâub câuơ ề ồ (cũng
được bi t đ n nh là con gà) đ phân tích nh ng hành vi đánh nhau và tranhế ế ư ể ữ giành lãnh th ổ
Trang 165.4 Chính tr h c:ị ọ
Các nghiên c u trong ứ khoa h c chính trọ ị cũng có s d ng lý thuy t trò ch i.ử ụ ế ơ
M t thuy t trò ch i gi i thích cho ộ ế ơ ả lý thuy t dân ch hòa bìnhế ủ r ng tính côngằ khai và tranh lu n c i m trong các n n dân ch s g i m t thông đi p rõậ ở ở ề ủ ẽ ở ộ ệ ràng và kh tín v các m c tiêu đ n nh ng ch đ khác. Ngả ề ụ ế ữ ế ộ ượ ạc l i, khó mà
bi t đế ược nh ng ch đích c a c a các lãnh đ o phi dân ch (đ c tài), r ng sữ ủ ủ ủ ạ ủ ộ ằ ẽ
có s nhự ượng b chung hi u qu nào, và các l i h a h n có độ ệ ả ờ ứ ẹ ược tôn tr ngọ hay không. Do đó, s t n t i s vi c không tin tẽ ồ ạ ự ệ ưởng và không mong mu nố
nh m t o ra s nhằ ạ ự ượng b chung n u ít nh t m t trong các thành ph n c aộ ế ấ ộ ầ ủ
s bàn cãi này là thành ph n phi dân ch ự ầ ủ
5.5 Tri t h c:ế ọ
Lý thuy t trò ch i đã đế ơ ược đ a vào m t vài s d ng trong ư ộ ử ụ tri t h cế ọ Hai bài báo b i ở W.V.O. Quine (1960, 1967), David Lewis (1969) s d ng lý thuy tử ụ ế trò ch i đ phát tri n m t tri t lý c a ơ ể ể ộ ế ủ h i nghộ ị. Khi làm vi c đó, ông đã cungệ
c p nh ng phân tích đ u tiên c a ấ ữ ầ ủ ki n th c chungế ứ và s d ng nó trong vi cử ụ ệ phân tích nh ng cách ch i trong ữ ơ nh ng trò ch i đữ ơ ược qu n lýả Thêm vào đó, ông l n đ u tiên đ ngh r ng ngầ ầ ề ị ằ ười ta có th hi u để ể ược ý nghĩa dưới các
đi u ki n c a ề ệ ủ trò ch i đánh tín hi uơ ệ Đ ngh sau đã đề ị ược theo đu i b i m tổ ở ộ vài tri t gia tính t Lewis (Skyrms 1996, Grim et al. 2004).ế ừ
Nai Thỏ
Nai 3, 3 0, 2
Thỏ 2, 0 2, 2
Trò săn nai
Trong đ o đ cạ ứ , m t s tác gi đã c g ng theo đu i d án này, b t đ uộ ố ả ố ắ ổ ự ắ ầ
b i ở Thomas Hobbes, b ng cách suy di n ra đ o đ c t nh ng l i ích cá nhân.ằ ễ ạ ứ ừ ữ ợ
B i vì nh ng trò ch i gi ng nh ở ữ ơ ố ư Prisoner's Dilemma đ a ra nh ng mâu thu nư ữ ẫ
Trang 17rõ ràng gi a đ o đ c và l i ích cá nhân, gi i thích t i sao h p tác là c n thi tữ ạ ứ ợ ả ạ ợ ầ ế
b i l i ích cá nhân là m t ph n quan tr ng c a d án này. Chi n lở ợ ộ ầ ọ ủ ự ế ược chung này là m t ph n c a quan đi m ộ ầ ủ ể h p đ ng xã h iợ ồ ộ t ng quát trong ổ tri t h cế ọ chính trị
Cu i cùng, m t s tác gi khác đã c g ng s d ng ố ộ ố ả ố ắ ử ụ lý thuy t ti n hóa tròế ế
ch iơ đ gi i thích s phát tri n trong quan đi m con ngể ả ự ể ể ườ ề ại v đ o đ c vàứ
nh ng hành x tữ ử ương ng c a muông thú. Nh ng tác gi này đã xem xét m tứ ủ ữ ả ộ
s trò ch i bao g m Song đ tù nhân, săn nai, và ố ơ ồ ề trò m c c c a Nashặ ả ủ nh đư ể cung c p m t l i gi i thích v s phát tri n c a các quan đi m v đ o đ c.ấ ộ ờ ả ề ự ể ủ ể ề ạ ứ
CH ƯƠ NG 2: NG D NG TRONG TRÒ CH I CARO Ứ Ụ Ơ
1. Gi i thi u v trí tu nhân tớ ệ ề ệ ạo:
Trí tu nhân t o (hay AI: Artificial Intelligence), là n l c tìm hi u nh ngệ ạ ỗ ự ể ữ
y u t trí tu Lý do khác đ nghiên c u lĩnh v c này là cách đ ta t tìm hi uế ố ệ ể ứ ự ể ự ể
b n thân chúng ta. Không gi ng tri t h c và tâm lý h c, hai khoa h c liên quanả ố ế ọ ọ ọ
đ n trí tu , còn AI cế ệ ố g ng thi t l p các các y u t trí tu cũng nh tìm bi tắ ế ậ ế ố ệ ư ế
Trang 18v chúng. Lý do khác đ nghiênề ể c u AI là đ t o ra các th c th thông minhứ ể ạ ự ể giúp ích cho chúng ta. AI có nhi u s nề ả ph m quan tr ng và đáng l u ý, th mẩ ọ ư ậ chí ngay t lúc s n ph m m i đừ ả ẩ ớ ược hình thành. M c dù không d báo đặ ự ượ c
tương lai, nh ng rõ ràng máy tính đi n t v i đ thông minh nh t đ nh đã cóư ệ ử ớ ộ ấ ị
nh h ng l n t i cu c s ng ngày nay và t ng lai phát tri n
Khi máy móc ngày càng tăng kh năng, các nhi m v đả ệ ụ ược coi là c n "tríầ thông minh" thường b lo i b kh i đ nh nghĩa v AI, m t hi n tị ạ ỏ ỏ ị ề ộ ệ ượng đượ c
g i là hi u ng AI. M t câu châm ngôn trong Đ nh lý c a Tesler nói r ng "AIọ ệ ứ ộ ị ủ ằ
là b t c đi u gì ch a đấ ứ ề ư ược th c hi n." Ví d , nh n d ng ký t quang h cự ệ ụ ậ ạ ự ọ
thường b lo i tr kh i nh ng th đị ạ ừ ỏ ữ ứ ược coi là AI, đã tr thành m t công nghở ộ ệ thông thường. kh năng máy hi n đ i thả ệ ạ ường được phân lo i nh AI baoạ ư
g m thành công hi u l i nói c a con ngồ ể ờ ủ ười, c nh tranh m c cao nh t trongạ ở ứ ấ trò ch i chi n lơ ế ược (ch ng h n nh c vây, c vua, c caro), xe ho t đ ngẳ ạ ư ờ ờ ờ ạ ộ
đ c l p, đ nh tuy n thông minh trong m ng phân ph i n i dung, và mô ph ngộ ậ ị ế ạ ố ộ ỏ quân s ự
Trí tu nhân t o có th đệ ạ ể ược phân thành ba lo i h th ng khác nhau: tríạ ệ ố
tu nhân t o phân tích, l y c m h ng t con ngệ ạ ấ ả ứ ừ ười và nhân t o. AI phân tíchạ
ch có các đ c đi m phù h p v i trí tu nh n th c; t o ra m t đ i di n nh nỉ ặ ể ợ ớ ệ ậ ứ ạ ộ ạ ệ ậ
th c v th gi i và s d ng h c t p d a trên kinh nghi m trong quá kh đứ ề ế ớ ử ụ ọ ậ ự ệ ứ ể thông báo các quy t đ nh trong tế ị ương lai. AI l y c m h ng t con ngấ ả ứ ừ ười có các y u t t trí tu nh n th c và c m xúc; hi u c m xúc c a con ngế ố ừ ệ ậ ứ ả ể ả ủ ườ i,ngoài các y u t nh n th c và xem xét chúng trong vi c ra quy t đ nh. AIế ố ậ ứ ệ ế ị nhân cách hóa cho th y các đ c đi m c a t t c các lo i năng l c (nghĩa là tríấ ặ ể ủ ấ ả ạ ự
tu nh n th c, c m xúc và xã h i), có kh năng t ý th c và t nh n th cệ ậ ứ ả ộ ả ự ứ ự ậ ứ
được trong các tương tác
2. Gi i quy t v n đ b ng tìm ki m:ả ế ấ ề ằ ế
V n đ tìm ki m, m t cách t ng quát, có th hi u là tìm m t đ i tấ ề ế ộ ổ ể ể ộ ố ượ ng
th a mãn m t s đòi h i nào đó, trong m t t p h p r ng l n các đ i tỏ ộ ố ỏ ộ ậ ợ ộ ớ ố ượng .
Trang 19Chúng ta có th k ra r t nhi u v n đ m vi c gi i quy t nó để ể ấ ề ấ ề ́ ệ ả ế ược quy về
v n đ tìm ki m.ấ ề ế
Các trò ch i, ch ng h n c vua, c carô, c vây có th xem nh ng v n đơ ẳ ạ ờ ờ ờ ể ữ ấ ề tìm ki m. Trong s r tnhi u nế ố ấ ề ước đi được phép th c hi n, ta ph i tìm ra cácự ệ ả
nước đi d n t i tình th k t cu c ta là ngẫ ớ ế ế ộ ́ ười th ng.ắ
Ch ng minh đ nh lý cũng có th xem nh ng v n đ tìm ki m. Cho m t t pứ ị ể ữ ấ ề ế ộ ậ các tiên đ vàcác lu t suy di n, trong trề ậ ễ ường h p này m c tiêu c a ta là tìm raợ ụ ủ
m t ch ng minh (m t dãy các lu t suy di n độ ứ ộ ậ ễ ược áp d ng) đ đụ ể ược đ a đ nư ế công th c mà ta c n ch ng minh.ứ ầ ứ
Trong các lĩnh v c nghiên c u c a Trí Tu Nhân T o, chúng ta thự ứ ủ ệ ạ ườ ngxuyên ph i đ i đ u v i v n đ tìm ki m. Đ c bi t trong l p k ho ch và h cả ố ầ ớ ấ ề ế ặ ệ ậ ế ạ ọ máy, tìm ki m đóng vai trò quan tr ng. Các k thu t tìm ki m bao g m:ế ọ ỹ ậ ế ồ
Các k thu t tìm ki m kinh nghi m (tìm ki m heuristic) trong đó chúng taỹ ậ ế ệ ế
d a vào kinh nghi m và s hi u bi t c a chúng ta v v n đ c n gi i quy tự ệ ự ể ế ủ ề ấ ề ầ ả ế
đ xây d ng nên hàm đánh giá hể ự ướng d n s tìm ki m.ẫ ự ế
Các k thu t tìm ki m t i u.ỹ ậ ế ố ư
Các phương pháp tìm ki m có đ i th , t c là các chi n lế ố ủ ứ ế ược tìm ki mế
nước đi trongcác trò ch i hai ngơ ười, ch ng h n c vua, c tẳ ạ ờ ờ ướng, c carô.ờ
3. Gi i quy t bài toán:ả ế
3.1 Gi i thi u trò ch i:ớ ệ ơ