Nghịch lý Boy or Girl là một câu hỏi xác suất đơn giản: "Nếu bạn biết rằng một gia đình có hai đứa trẻ, ít nhất một người con là con trai, tính xác suất cả hai đứa trẻ cùng là con trai?"
Trang 1ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC KINH TẾ - LUẬT
BÁO CÁO
LÝ THUYẾT XÁC SUẤT
Tên đề tài: Boy or Girl paradox
Nhóm sinh viên thực hiện: Nhóm 5
1 Nguyễn Trần Kim Ngân K22416C K224161827 100%
2 Lê Minh Nguyên K22416C K224161829 100%
3 Huỳnh Lê Đông Quân K22416C K224161832 100%
4 Thái Thị Ngọc Tuyền K22416C K224161840 100%
5 Lê Huỳnh Thúy Vy K22416C K224161843 100%
TP.HCM, Ngày 04 tháng 03 năm 2023
Trang 2Lời mở đầu
Xác suất là một lĩnh vực toán học rất quan trọng, đóng vai trò quan trọng trong nhiều lĩnh vực của khoa học và kinh tế Trong thực tế, xác suất có thể được sử dụng để dự đoán các sự kiện trong tương lai, đánh giá rủi ro, thiết kế các chiến lược kinh doanh, và nhiều ứng dụng khác Trong bài báo cáo này, chúng tôi sẽ tập trung vào một trong những vấn đề thú vị và gây tranh cãi của xác suất, đó là Nghịch lý Boy or Girl
Nghịch lý Boy or Girl là một câu hỏi xác suất đơn giản: "Nếu bạn biết rằng một gia đình có hai đứa trẻ, ít nhất một người con là con trai, tính xác suất cả hai đứa trẻ cùng là con trai?" Trả lời câu hỏi này đôi khi gây tranh cãi, vì câu trả lời có thể trái ngược với những gì chúng
ta nghĩ Và để hiểu rõ hơn về câu hỏi này, chúng ta cần nghiên cứu các khái niệm và công thức cơ bản của xác suất
Bài báo này sẽ trực tiếp vào việc giải thích các vấn đề của Nghịch lý Boy or Girl, giải thích
lý do vì sao câu trả lời đôi khi lại trái ngược với những gì chúng ta nghĩ Cuối cùng, chúng tôi sẽ đưa ra ví dụ và các giải thích cụ thể để giúp hiểu rõ hơn về vấn đề này
Tổng kết lại, Nghịch lý Boy or Girl là một vấn đề thú vị trong xác suất, và được đặt ra từ nhiều năm trước đến nay vẫn là chủ đề nóng hổi của các nhà toán học và những người yêu thích lý thuyết xác suất
Do kiến thức và khả năng có hạn, bài thảo luận của nhóm 5 không tránh khỏi những thiếu sót Chúng tôi rất mong nhận được sự chia sẻ và góp ý từ phía giảng viên để bài báo cáo của nhóm được hoàn thiện hơn
Trang 3Mục lục
I GIỚI THIỆU ĐỀ TÀI 3
1 Lời mở đầu 3
2 Nguồn gốc của Nghịch lý Boy or Girl 3
II NỘI DUNG CHÍNH 4
1 Các giả định chung 4
2 Câu hỏi đầu tiên 5
3 Câu hỏi thứ hai 5
4 Phân tích sự mơ hồ 7
5 Phân tích Bayes 9
III ỨNG DỤNG VÀ MỞ RỘNG 10
1 Biến thể thứ nhất: Trình bày bởi Bar-Hillel & Falk 10
2 Biến thể thứ hai: Trình bày bởi Marilyn vos Savant 11
Tài liệu tham khảo 13
Trang 4I GIỚI THIỆU ĐỀ TÀI
1 Lời mở đầu
Hiện nay, những nghiên cứu về xác suất và thống kê đã đóng góp và xây dựng cho việc hiểu và giải quyết các vấn đề thực tế trong đời sống Tuy nhiên, việc hiểu lầm cũng xảy ra và mắc phải hiểu lầm trong tư duy và dẫn đến việc tạo ra các nghịch lý, một trong số đó chính
là nghịch lý Boy or Girl
Nghịch lý Boy or Girl là một ví dụ trong lý thuyết xác suất và liên quan đến việc dự đoán giới tính của một đứa trẻ dựa trên thông tin về giới tính của các anh chị em của nó Trong trường hợp với câu hỏi đơn giản nhất, giả sử rằng một gia đình có hai đứa trẻ và bạn biết rằng ít nhất trong số họ là con trai Nếu bạn được hỏi về xác suất để đứa trẻ còn lại cũng là con trai, câu trả lời có thể là1
2, tuy nhiên đó chưa phải là đáp án chính xác
Để giải thích điều này, chúng ta có thể sử dụng phương pháp đếm số trường hợp khả dĩ hoặc phân tích Bayes Sau đó ta sẽ được kết quả phân tích là1
3 Chúng tôi làm báo cáo này để làm rõ các vấn đề trên
Nghịch lý Boy or Girl đến từ việc người ta thường không xem xét đầy đủ tất cả các khả năng có thể xảy ra và dẫn đến kết quả dự đoán sai lệch Nghịch lý này cho thấy rằng đôi khi việc suy nghĩ logic không đủ để xác định xác suất của một sự kiện và cần sử dụng các công thức xác suất chính xác
2 Nguồn gốc của Nghịch lý Boy or Girl
Nghịch lý lần đầu xuất hiện ít nhất là vào năm 1959, bởi nhà toán học người Mỹ Martin Gardner giới thiệu trong chuyên mục “Mathematical Games column” tháng 10 năm
1959 trên tạp chí Khoa học Mỹ Ông đã diễn đạt định lý với hai câu hỏi này như sau:
- Ông Jones có hai người con Người con lớn là con gái Xác suất mà cả hai người con
là con gái là gì?
- Ông Smith có hai người con Ít nhất một trong số họ là người con trai Xác suất để cả hai người con đều là con trai là bao nhiêu?
Trang 5Đối với câu hỏi một, Martin Gardner đã đưa ra câu trả lời là 12 Nhưng thắc mắc chỉ thật
sự đến khi trả lời câu hỏi thứ hai Đối với câu hỏi thứ hai, Gardner ban đầu đưa ra đáp án13, thế nhưng chính ông cũng đã phải thừa nhận là đáp án có thể xảy ra vấn đề khác vì các dữ kiện đưa ra không rõ ràng Cụm từ “ Ít nhất một trong số họ là người con trai” tùy vào cách hiểu khác nhau đã tạo ra sự rối loạn về mặt thông tin cho người tiếp thụ và có thể trả lời đáp
án là12
1 Các giả định chung
Mặc dù người đặt ra nghịch lý có vẻ đã nghĩ đến một thế giới mà chỉ có hai giới tính duy nhất là trai hoặc gái và sự phân bổ của hai giới tính này là bằng nhau Nhưng hai câu hỏi được đặt ra không nêu đến hoặc bắt buộc về vấn đề được nói trên Sự khác biệt của cả hai câu hỏi về góc nhìn của toán học mà trong đó tỉ lệ trai và gái đã được xác định trong một không gian nhất định tại một thời điểm không nhất thiết phải bằng nhau và không nhất thiết phải cộng lại bằng 1 cũng gây nên thú vị không kém Nghịch lý còn có thể được phân tích theo ba giới tính sau: Trai, Gái, Khác
Để đơn giản hoá vấn đề, chúng ta sẽ phân tích nghịch lý theo hướng là thế giới chỉ có hai giới tính và tỷ lệ mỗi giới tính là bằng nhau Để dễ hiểu hơn, ví dụ rằng mỗi khi một gia đình sinh ra đứa trẻ, cha mẹ đứa trẻ ấy sẽ tung một đồng xu hai mặt công bằng để xác định giới tính của người con
Từ hai câu hỏi trên, những giả định được đưa ra để đưa ra hướng giải quyết cho vấn đề:
- Mỗi người con chỉ có thể là con trai hoặc con gái
- Xác suất mà người con là trai hay gái là12 (xác suất tung xu)
- Giới tính của người con thứ nhất không phụ thuộc (độc lập) vào giới tính của người con còn lại
Từ những giả định trên, ta có thể tạo không gian mẫu như bảng sau Biết rằng xác suất mỗi kết quả là bằng nhau
Trang 6Người con thứ nhất Người con thứ hai
Bảng 1.1: Không gian mẫu biểu hiện các tình huống
2 Câu hỏi đầu tiên
“Ông Johns có hai người con Người con lớn hơn là con gái Xác suất mà cả hai người con của ông Johns là con gái là gì?"
Dựa vào các giả định được nêu ở trên, ta có thể loại hai kết quả có trai trong đó Khi đó, không gian mẫu trở thành {Gái - Trai; Gái - Gái} Do xác suất của hai kết quả bằng nhau nên xác suất mà cả hai người con là gái là12
Người con thứ nhất Người con thứ hai
Bảng 2.1: Không gian mẫu của câu hỏi thứ nhất
3 Câu hỏi thứ hai
“Ông Smith có hai người con và trong đó có ít nhất một người con trai Tính xác suất để hai người con của ông Smith đều là con trai.”
Trang 7Câu hỏi này tương tự với câu hỏi đầu tiên nhưng thay vì cho biết giới tính người con đầu, giả thiết câu hỏi chỉ cho ta biết “có ít nhất một người con trai” Vì vậy, nó lại có hai cách giải hợp lý cho ra hai kết quả khác nhau như sau:
Lưu ý: Ông Smith chỉ có 2 người con nên các biến cố sau đây là các biến cố xung khắc
- Cách 1:
Đây là lời giải được ông đưa ra khi câu hỏi lần đầu xuất hiện ở một mục trong bài báo của ông cho tờ Scientific Science, xuất bản năm 1959:
“Ông Smith có hai người con và trong đó có ít nhất một người con trai” sẽ gồm ba trường hợp sau: {Trai - Gái, Gái - Trai, Trai - Trai} Vậy trường hợp “hai người con của ông Smith đều là con trai” có xác suất là 13
- Cách 2:
Sau khi câu hỏi và lời giải của Gardner được đưa ra, nhiều người đọc và nhà khoa học khác nghiên cứu về xác suất gồm Bar-Hillel và Falk, Grinstead và Snell , đã phản ánh rằng giả thiết “có ít nhất một người con trai” của Gardner gây ra sự “mơ hồ” và họ có lời giải khác cho câu hỏi của ông như sau:
Ta có thể hiểu giả thiết ông Smith “có ít nhất một người con trai” tương đương với “một trong hai người con là con trai”, vậy người con còn lại có thể là trai hoặc gái (hai trường hợp) Vì thế, xác suất “hai người con của ông Smith đều là con trai” là12
Ngoài ra, Bar-Hillel và Falk còn lập luận cho thấy sự “mơ hồ” trong giả thiết trong câu hỏi của Gardner bằng việc đặt ra các giả định ứng với giả thiết như sau:
Giả sử, ta gặp ông Smith đi cùng với một người con trai của ông trên đường, tương đương với dữ kiện ta biết rằng ông Smith “có ít nhất một người con trai” Các trường hợp có thể xảy ra lúc này gồm:
+ Ông Smith có hai người con trai và ông chọn một người con trai để đi cùng
+ Ông Smith có một người con trai, một người con gái và chọn con trai để đi cùng
Trang 8Chúng ta có thể loại trừ trường hợp ông Smith có một người con trai, một người con gái và chọn con gái để đi cùng, dù trường hợp này đúng với giả thiết “có ít nhất một người con trai”
Chính Gardner cũng nhận ra điều “mơ hồ” đó Vì thế, ông cũng đã kết luận rằng giả thiết
“ông Smith có ít nhất một người con trai” chưa đầy đủ để có thể đưa ra đáp án chính xác
4 Phân tích sự mơ hồ
Đối với câu hỏi thứ hai, nếu ta áp dụng lý thuyết xác suất, xác suất để hai đứa trẻ đều là con trai sẽ là13 Lý do là vì có 4 trường hợp có thể xảy ra: Trai - Trai, Trai - Gái, Gái - Trai, Gái - Gái Và vì chúng ta đã biết một trong hai đứa trẻ là con trai, chỉ còn lại 3 trường hợp còn lại Trong số đó, chỉ có một trường hợp là Trai - Gái, do đó xác suất người con còn lại là con trai sẽ là13
Người con thứ nhất Người con thứ hai
Bảng 4.1: Không gian mẫu của câu hỏi thứ hai khi áp dụng lý thuyết xác suất
Cách tính toán trên khi chúng tôi đồng thời cùng xem xét giới tính hai đứa trẻ để tìm xác suất cả hai người con là con trai Tuy nhiên, nếu chỉ nhìn vào dữ liệu "ít nhất một trong hai đứa trẻ là con trai", người trả lời có thể hiểu rằng có một đứa trẻ được chọn đầu tiên chắc chắn là con trai và đứa trẻ còn lại được chọn ngẫu nhiên Sau đây, chúng tôi sẽ xem xét các
Trang 9nhất một người con trai” và ALOG đại diện cho sự kiện “ít nhất một người con gái”, ta có bảng mô tả không gian mẫu như sau:
Người
con lớn Ngườicon nhỏ P(gia đìnhnày) P(ALOBcho gia
đình này)
P(ALOG cho gia đình này)
P(ALOB
và gia đình này)
P(ALOG
và gia đình này)
4
4
4
1 2
1 2
1 8
1 8
4
1 2
1 2
1 8
1 8
4
4
0
Bảng 4.2: Bảng mô tả không gian mẫu cho từng trường hợp
Vì vậy, nếu ít nhất một là con trai khi thực tế được chọn ngẫu nhiên, thì xác suất cả hai đều là con trai là:
�(���� ��� ��)
1 4
0 + 18 +18 +14
=12
Ta có thể thấy, sự mơ hồ này phần nào phụ thuộc vào cách người đặt câu hỏi đưa ra các giả định ban đầu, người ta không chắc chắn rằng câu nói “ít nhất một đứa trẻ là con trai” được hiểu như thế nào Nếu người đặt câu hỏi đã nêu rõ rằng họ chỉ muốn tìm xác suất của đứa trẻ còn lại là con trai khi đã biết một trong hai đứa trẻ là con trai, thì câu đố này sẽ không còn là mơ hồ
Trả lời từ góc độ xác suất: Sự mơ hồ trong câu hỏi thứ hai đến từ việc người hỏi không đưa ra đủ thông tin để tính toán chính xác xác suất Nếu người hỏi nêu rõ các giả định và
Trang 10thông tin ban đầu, và sử dụng lý thuyết xác suất đúng cách, thì sự mơ hồ này sẽ được giải quyết
Trả lời từ góc độ ngôn ngữ: Sự mơ hồ trong câu hỏi thể đến từ ngôn ngữ được sử dụng Các từ và cụm từ có thể có nhiều ý nghĩa khác nhau, gây hiểu nhầm và sự mơ hồ cho người đọc hoặc người trả lời Do đó, cần phải sử dụng ngôn ngữ rõ ràng và chính xác để tránh sự
mơ hồ
Tóm lại, để giải quyết sự mơ hồ trong nghịch lý Boy or Girl, cần sử dụng đúng lý thuyết xác suất, sử dụng ngôn ngữ rõ ràng và chính xác, và kiểm tra tính hợp lý và logic của các giả định và kết luận
5 Phân tích Bayes
Thông thường, mọi người hay nghĩ đã có ít nhất một người con trai thì người còn lại sẽ
là con gái hoặc con trai (với khả năng bằng nhau1) Do đó xác suất để cả hai người đều là con trai thì đáp án là 12 Tưởng chừng như chẳng có gì tranh cãi ở đây nhưng theo lập luận xác suất cổ điển, chúng ta xem xét một không gian mẫu chứa hai phần tử tương ứng với hai người con Chúng ta giả sử xác suất là con trai hay con gái là như nhau Dễ thấy có ba trường hợp như sau:
- Cả hai đều là con gái (GG) – với xác suất P(GG) =14
- Cả hai đều là con trai (TT) – với xác suất P(TT) =14
- Có một người con gái và một người con trai (G - T) – với xác suất P(G - T) =12 Đây là những xác suất được tính từ trước Bây giờ chúng ta xét thêm phần giả thiết "ít nhất một người là con trai" Áp dụng định lý Bayes, chúng ta được:
P TT T = P T TT) x P(TT)P(T) = 1 x (14 )
(34) = 13 Trong đó:
P(A|B) có nghĩa là "xác suất của A cho trước B"
P(T|TT): xác suất có ít nhất một người con trai nếu cả hai đều là con trai bằng 1
P(TT): xác suất của cả hai người con trai bằng 1
4 P(T) là xác suất có ít nhất hai người là con trai, bao gồm các trường hợp Trai - Trai và Gái - Trai là14+12=34
Tuy nhiên nếu ta hiểu giả thiết “có ít nhất một người con trai” tương đương với việc
“chọn một người con ngẫu nhiên và người đó là con trai” thì lại khác Hãy gọi mệnh đề
"người được chọn là con trai" là mệnh đề "t" Áp dụng định lý Bayes ta có:
Trang 11P TT t = P t TT) x P(TT)P(t) = 1 x (14 )
(12) = 12 Trong đó: P(t) là xác suất chọn được một người con trai bằng12vì khả năng ta chọn được con trai hay con gái từ tất cả các trường hợp là như nhau
Như vậy, ta đã giải thích về hai kết quả được đưa ra với hai cách diễn giải khác nhau
về giả thiết “có ít nhất một người con trai” bằng cách áp dụng định luật Bayes Tuy nhiên, cách làm này chỉ đúng khi ta giả định tỷ lệ nam nữ trong dân số là 50:50
III ỨNG DỤNG VÀ MỞ RỘNG
1 Biến thể thứ nhất: Trình bày bởi Bar-Hillel & Falk
“ Ông Smith có hai người con Chúng ta gặp ông ấy đi dạo trên đường với một người con trai mà ông ấy tự hào giới thiệu là con trai của mình Tính xác suất để người con còn lại của ông Smith cũng là con trai.”
Câu trả lời dựa vào trực giác là 12, và với giả định tự nhiên, câu trả lời này là chính xác Tuy nhiên, khi giả định khác được áp dụng, câu trả lời cũng sẽ khác đi
- Nếu giả sử trước khi Smith giới thiệu người kia là con trai của mình, chúng ta có bốn
sự kiện xảy ra: {Trai - Trai, Gái - Gái, Gái - Trai, Trai - Gái}→ bắt đầu với xác suất là14
- Sau khi biết được rằng ông ấy có ít nhất một người con trai, sự kiện có hai con gái (Gái – Gái) bị loại bỏ, còn lại ba sự kiện: {Trai - Trai, Gái - Trai, Trai - Gái}, các sự kiện này có xác suất bằng nhau nên xác suất người con thứ hai cũng là con trai là13
Giả định tự nhiên là ông Smith đã chọn người con đi cùng một cách ngẫu nhiên Nếu như vậy, khi cặp Trai - Trai có hai lần xác suất hơn Trai - Gái hoặc Gái - Trai trong việc chọn ra người con trai đi dạo (và cặp Gái - Gái có xác suất bằng 0), thì sự kiện Trai - Gái và Gái - Trai có xác suất bằng nhau với sự kiện Trai - Trai, và do đó, xác suất để người con còn lại của ông Smith cũng là con trai là12
Bar-Hillel & Falk đưa ra một kịch bản giả định khác, trong đó họ tưởng tượng ra một nền văn hóa trong đó những người con trai được chọn một cách chắc chắn hơn những người
Trang 12con gái để đi dạo Trong trường hợp này, các cặp Trai - Trai, Trai - Gái và Gái - Trai có xác suất bằng nhau để trở thành người con trai được dẫn đi dạo Do đó, xác suất để người con còn lại cũng là con trai trong trường hợp này là 13
2 Biến thể thứ hai: Trình bày bởi Marilyn vos Savant
Năm 1991, Marilyn vos Savant trả lời một độc giả yêu cầu cô trả lời một biến thể của nghịch lý Boy or Girl mà bao gồm cả chó beagle Năm 1996, cô lại đăng câu hỏi đó với một hình thức khác Các câu hỏi của năm 1991 và năm 1996, lần lượt được đặt ra như sau:
- Một chủ tiệm bán chó nói rằng cô có hai con chó beagle Nhưng cô không biết chúng
là đực, cái hay cả hai đều đực Bạn muốn mua một con chó đực và cô liên lạc với người đang tắm cho chó để hỏi: "Ít nhất có một con chó là đực không?" "Có!" cô trả lời Xác suất
để con chó còn lại cũng là đực là bao nhiêu?
- Giả sử một phụ nữ và một đàn ông (không liên quan gì nhau) đều có hai đứa con Biết rằng ít nhất một người con của phụ nữ là con trai và người con trai đầu tiên của người đàn ông là con trai Hãy giải thích tại sao xác suất người phụ nữ có hai con trai không bằng với xác suất người đàn ông có hai con trai
Đối với định dáng thứ hai mà vos Savant đưa ra, cô đã đưa ra câu trả lời kinh điển rằng xác suất cho rằng người phụ nữ có hai con trai là khoảng 13 trong khi xác suất cho rằng người đàn ông có hai con trai là khoảng12
Để trả lời các ý kiến phản hồi từ độc giả mà đặt câu hỏi về phân tích của cô, Vos Savant đã tiến hành một cuộc khảo sát độc giả với đúng hai người con, ít nhất một trong số
đó là con trai Trong số 17.946 phản hồi, 35,9% phản hồi cho rằng hai người con đều là con trai
Các bài báo của vos Savant được thảo luận bởi Carlton và Stansfield trong một bài báo
năm 2005 trên Tạp chí The American Statistician Các tác giả không thảo luận về sự mơ hồ
có thể có trong câu hỏi và kết luận rằng câu trả lời của vos Savant là chính xác từ khía cạnh