TRƯỜNG ĐẠI HỌC KHOA HỌCKHOA THỊ KIM THOA CÁC SỐ TỔ HỢP VÀ MỘT SỐ ỨNG DỤNG TRONG THỐNG KÊ LUẬN VĂN THẠC SĨ TOÁN HỌC Thái Nguyên - 2017... Vì thế, tôi chọn nghiên cứu đề tài " Các số tổ hợ
Trang 1TRƯỜNG ĐẠI HỌC KHOA HỌC
KHOA THỊ KIM THOA
CÁC SỐ TỔ HỢP
VÀ MỘT SỐ ỨNG DỤNG TRONG THỐNG KÊ
LUẬN VĂN THẠC SĨ TOÁN HỌC
Thái Nguyên - 2017
Trang 2TRƯỜNG ĐẠI HỌC KHOA HỌC
KHOA THỊ KIM THOA
Trang 32 Một số ứng dụng của số nhị thức trong thống kê 29
2.1 Một số khái niệm của xác suất 29
Trang 4Lời cảm ơn
Luận văn này được thực hiện tại Trường Đại học Khoa học - Đại học TháiNguyên và hoàn thành với sự hướng dẫn của GS.TSKH Hà Huy Khoái(Trường Đại học Thăng Long) Tác giả xin được bày tỏ lòng biết ơn chânthành và sâu sắc tới người hướng dẫn khoa học của mình, người đã đặt vấn
đề nghiên cứu, dành nhiều thời gian hướng dẫn và tận tình giải đáp nhữngthắc mắc của tác giả trong suốt quá trình làm luận văn
Tác giả xin trân trọng cảm ơn Ban Giám hiệu Trường Đại học Khoahọc - Đại học Thái Nguyên, Ban Chủ nhiệm Khoa Toán - Tin, cùng cácgiảng viên đã tham gia giảng dạy, đã tạo mọi điều kiện tốt nhất để tác giảhọc tập và nghiên cứu
Tác giả muốn gửi những lời cảm ơn tốt đẹp nhất tới tập thể Lớp B, caohọc Toán khóa 9 (2015 - 2017) đã động viên và giúp đỡ tác giả rất nhiềutrong suốt quá trình học tập
Nhân dịp này, tác giả cũng xin chân thành cảm ơn Sở Giáo dục vàĐào tạo Hải Phòng, Ban Giám hiệu và các đồng nghiệp ở Trường THPTNguyễn Đức Cảnh, Huyện Kiến Thụy, Thành phố Hải Phòng đã tạo điềukiện cho tác giả hoàn thành tốt nhiệm vụ học tập và công tác của mình.Cuối cùng, tác giả muốn dành những lời cảm ơn đặc biệt nhất đến bố
mẹ và đại gia đình đã luôn động viên và chia sẻ những khó khăn để tác giảhoàn thành tốt luận văn này
Trang 5Mở đầu
Các số nhị thức là đề tài đã được đề cập nhiều trong các tài liệu về Toán học
ở trường THPT Với mỗi công thức của các số nhị thức, người ta thườngdùng phương pháp chứng minh quy nạp Phương pháp này có ưu điểm là
dễ hiểu, gọn, nhưng nhiều khi làm mất "ý nghĩa tổ hợp" của đẳng thức.Điều này làm cho học sinh đôi khi không hiểu sâu vấn đề, và do đó khókhăn khi vận dụng
Vì thế, tôi chọn nghiên cứu đề tài " Các số tổ hợp và một số ứng dụng
trong thống kê"làm luận văn thạc sĩ của mình
Một phần của luận văn này được dành để trình bày nhiều công thứccủa các số tổ hợp với hai cách chứng minh: chứng minh đại số và chứngminh tổ hợp, nhằm giúp độc giả hiểu sâu hơn bản chất vấn đề
Phần còn lại của luận văn được dành để giới thiệu một số ứng dụngcủa các số tổ hợp trong thống kê, với mục đích giúp người đọc, đặc biệt làcác em học sinh thấy rõ hơn những ứng dụng của Toán học trong đời sốngthực tiễn
Luận văn gồm hai chương:
• Chương 1 Các số nhị thức: những khía cạnh đại số và tổ hợp đượcdành để trình bày về các đồng nhất thức của các số nhị thức, phântích những khía cạnh đại số và tổ hợp của các số nhị thức như tínhđối xứng; tính chất tổng dòng, tổng cột, tổng đường chéo, tính chẵn
Trang 6lẻ của các số nhị thức; nghịch đảo các số nhị thức cũng được trìnhbày trong chương này Tài liệu sử dụng là tài liệu số [2].
• Chương 2 Một số ứng dụng của số nhị thức trong thống kê trình bàymột số khái niệm của xác suất, sự phân bố nhị thức và phép hồi quyCatalan Tài liệu sử dụng là tài liệu số [1] và [2]
Thái Nguyên, ngày 10 tháng 7 năm 2017
Tác giả
Khoa Thị Kim Thoa
Trang 8Mệnh đề 1.1.1 Các số tổ hợp n
k thỏa mãn quan hệ hồi quy Pascal (1.1).
n0
=n − 1
k− 1
+n − 1
Mệnh đề 1.1.2 Các số nhị thức thỏa mãn quan hệ hồi quy Pascal (1.1).
Hệ quả 1.1.3 Với mọi k,n ∈ N,
nk
Trang 9
Chứng minh đại số, chứng minh tổ hợp
• Chứng minh đại số của đẳng thức được thực hiện bằng những biếnđổi đại số Thông thường, người ta dùng phương pháp quy nạp.Phương pháp quy nạp có ưu điểm là đưa ra chứng minh rất ngắngọn, nhưng nhược điểm lớn nhất là nhiều khi không làm rõ đượcbản chất vấn đề cũng như ý nghĩa của công thức
• Chứng minh tổ hợp được dùng nhằm khắc phục nhược điểm nêutrên Cụ thể là trong chứng minh đẳng thức nào đó bằng phươngpháp tổ hợp, người ta thường tính đại lượng ở hai vế của đẳng thứctheo hai cách khác nhau Từ đó thấy rõ bản chất của vấn đề đang xét.Chúng ta sẽ minh hoạ hai phương pháp nêu trên qua một số ví dụ
Tính đối xứng
Một số đồng nhất thức là sự khái quát của tính chất dễ dàng nhận thấytrong tam giác Pascal Một trong các tính chất đó là mỗi dòng của tamgiác Pascal có tính xuôi ngược, nó được đọc giống nhau từ phải sang tráihoặc từ trái sang phải Ví dụ chúng ta quan sát tính đối xứng của dòng 8:
Mệnh đề 1.1.6 (Tính đối xứng theo dòng) Với số nguyên n, k bất kỳ mà
0 ≤ k ≤ n,
nk
=
n
n− k
Trang 10
Chứng minh (Chứng minh tổ hợp).Đại lượng ở vế trái của đẳng thức (1.4) là số các cách khác nhau để chọn k phần tử từ tập n phần tử Vế phải làcác cách khác nhau để chọn (n-k) phần tử còn lại từ tập đó Vì mỗi cáchchọn k phần tử từ tập n phần tử chính là một cách chọn (n-k) phần tử cònlại trong n phần tử nên hai cách chọn đều có số lượng như nhau.
Chứng minh (Chứng minh tổ hợp ).Theo hệ quả 1.1.3, các số hạng ở vếtrái là số cách chọn các tập con lực lượng k từ tập S gồm n phần tử, và làmnhư vậy với mỗi giá trị của k Như vậy, số các tập con của tập hữu hạn S
1n
Trang 12Chứng minh. Bằng quy nạp trên dòng thứ n, ta có
* Bước cơ sở. Cho n = 0, tổng các hạng tử xuống dòng 0 là 1 trong cột
c= 0 và là 0 trong cột c 6= 0
1
=
n
+nc
=
n
c+ 1
+nc
Định nghĩa 1.1.10 Đường chéo từ góc trên bên trái của bảng hai chiều
hướng xuống phía dưới bên phải được gọi là đường chéo đông nam Đường chéo theo hướng ngược lại gọi là đường chéo tây bắc.
Định nghĩa 1.1.11 Đường chéo từ góc dưới bên trái của bảng hai chiều
hướng lên phía trên bên phải được gọi là đường chéo đông bắc Đường chéo theo hướng ngược lại gọi là đường chéo tây nam.
Trang 13Chúng ta thấy rằng tổng các hạng tử đầu tiên trên một đoạn hữu hạntrên đường chéo đông nam của tam giác Pascal hiển thị ngay bên dướihạng tử cuối cùng về phía đông nam.
Ví dụ 1.1.12 Theo dõi bảng tam giác Pascal ta thấy,
Mệnh đề 1.1.13 (Tính chất tổng đường chéo đông nam) Tổng n + 1
hạng tử đầu tiên trên đường chéo đông nam từ dòng r, cột 0 trong tam giác Pascal bằng hạng tử trong dòng r + n + 1, cột n, hạng tử ngay bên dưới
hạng tử cuối cùng của đường chéo, tức là:
n
∑
k=0
r + kk
Trang 14Hệ quả sau đây chỉ đơn giản là đảo ngược thứ tự của tổng các phần tửtrên đường chéo.
Hệ quả 1.1.14 (Tính chất tổng đường chéo tây bắc) Đối với số nguyên
m không âm bất kỳ với 0 ≤ m ≤ n, các hệ số nhị thức thỏa mãn phương
m− 1
+ · · · + n − m
m− m
ở vế trái của phương trình ta được kết quả tổng đường chéo đông nam
n − m0
+n − m + 1
1
+ · · · + n
m
mà bắt đầu từ dòng n − m và bao gồm m + 1 hạng tử trở xuống, kết thúc
ở dòng n, cột m Theo mệnh đề 1.1.13 giá trị của tổng đường chéo đôngnam là hệ số nhị thức
n + 1m
Tổng của các hạng tử trên đường chéo đông bắc là các số Fibonacci
Ví dụ tổng 1 + 5 + 6 + 1 dọc theo đường chéo về phía đông bắc bắt đầu từ
6
0
là số Fibonacci f7 = 13
Ví dụ 1.1.15 Các số Fibonacci trong hộp hiển thị ở đây không thực sự
xuất hiện ở các vị trí hiển thị Chúng chỉ đơn giản là các tổng dọc theođường chéo về phía đông bắc dẫn đến chúng
Trang 15Mệnh đề 1.1.16 ( Tính chất đường chéo đông bắc Fibonacci) Tổng các
hạng tử trên đường chéo đông bắc từ dòng n, cột 0 trong tam giác Pascal bằng số Fibonacci fn+1, tức là:
n
∑
k=0
n − kk
= fn−1
* Bước quy nạp Bằng quan hệ hồi quy Pascal, ta có
n − kk
=n − k − 1
k− 1
+n − k − 1
k
Trang 16
∑
k=0
n − k − 1k
n−1
∑
k=0
n − k − 1k
= fn−1+ fn ( giả thiết quy nạp)
= fn+1 ( phép hồi quy Fibonacci)
8
74
Trang 17Nguyên tắc chung của hệ thức này được gọi là tính hấp thu, được thiếtlập bởi mệnh đề tiếp theo.
Mệnh đề 1.1.18 ( Tính hấp thu) Với 0 ≤ k ≤ n, ta có:
nk
(n − 1)k−1(k − 1)! = n
k
là số cách chọn k phần tử từ tập n phần tử nhân với k Ở vế phải là lấy phần
tử n nhân với số cách chọn k − 1 phần tử từ n − 1 phần tử còn lại
nn − 1
k− 1
Hai kết quả này là tương đương nhau
Tính hấp thu là một trường hợp đặc biệt của mối quan hệ giữa mộtphần tử và các phần tử khác dọc theo đường chéo tây bắc Mối quan hệnày được biểu thị bằng một đồng nhất thức tổ hợp bậc cao, là sự tổng quáthóa cho minh họa sau đây
Ví dụ 1.1.19 Tiếp theo, ta nhận thấy rằng ở vị trí 1 về phía tây bắc của hệ
41
71 = 35 ·4
7
Trang 18ở vị trí 3 về phía tây bắc của 7
4
trong tam giác Pascal, ta có
4 =4
1
=74
= 4hoặc tương đương
74
·43
Tính chất của phương trình sau đây là tính chất tập con của tập con
Mệnh đề 1.1.20 (Đồng nhất thức tập con của một tập con) Đối với
0 ≤ k ≤ m ≤ n, ta có:
nm
mk
=nk
mk
Trang 19mk
là số cách chọn m phần tử từ tập có n phần tử nhân với số cách chọn k phần
tử từ tập có m phần tử Điều này rõ ràng tương đương với số cách chọn kphần tử từ tập n nhân với số cách chọn m − k phần tử từ tập n − k phần tửcòn lại như ở vế phải
nk
n − k
m− k
Phép nhân chập Vandermonde.
Định lí 1.1.21 (Phép nhân chập Vandermonde) Giả sử m, n, k là các số
nguyên không âm , khi đó
n
∑
j=0
nj
tử màu xanh và k − j phần tử màu đỏ là tích n
j
m k− j
Vì vậy tổng tất cảcác tích này ở vế trái phải giống như ở vế phải
Chứng minh (Chứng minh khác) Tổng bên trái của phương trình tổ hợptrên bằng hệ số của xk ở vế trái của phương trình đa thức
(1 + x)n(1 + x)m= (1 + x)n+m
Trang 20và hệ số nhị thức ở vế phải của phương trình tổ hợp bằng hệ số của xk ở vếphải của phương trình đa thức đó.
Trang 21hạn như
16593
có hệ thống bởi nhà toán học người Anh James Glaisher (1848-1928)
Định lí 1.1.22 Giả sử n và k là các số nguyên không âm, khi đó
Chứng minh. Để chứng minh định lý này ta xét 4 trường hợp sau đây
*Trường hợp 1: n chẵn và k lẻ. Vì n là chẵn, rõ ràng trong trường hợp nàygiá trị ở vế phải của đồng nhất thức hấp thu
knk
Trang 22≡n/2k/2
≡bn/2cbk/2c
Sự tương đương đầu tiên trong (1.13) là vì mỗi thừa số đứng trước hệ sốnhị thức trong tử số và mẫu số là lẻ và phép nhân của một số nguyên vớimột số lẻ không làm thay đổi tính chẵn lẻ Điều thứ hai là vì n/2 = bn/2c
và k/2 = bk/2c cho cả n và k đều chẵn
*Trường hợp 3: n lẻ và k lẻ.Tương tự như trường hợp 1, điểm bắt đầu củachúng ta là đồng nhất thức hấp thu
knk
≡n − 1
k− 1
mod 2
Từ n − 1 và k − 1 đều là chẵn, theo trường hợp 2 thì
n − 1
k− 1
≡bn/2cbk/2c
mod 2
và như vậy thì
nk
≡bn/2cbk/2c
mod 2
Trang 23*Trường hợp 4: n lẻ và k chẵn.Theo tính đối xứng của đồng nhất thức thì
≡n − 1
k
mod 2
Áp dụng trường hợp 2 vào vế phải, ta thu được
nk
≡b(n − 1)/2c
bk/2c
mod 2
vì n là lẻ, nên chỉ số trên b(n − 1)/2c bằng bn/2c
Một thuật toán đơn giản quyết định tính chẵn lẻ của một hệ số nhị thức
là áp dụng định lí 1.1.22 lặp đi lặp lại cho đến khi chỉ số trên là chẵn vàchỉ số dưới là lẻ hoặc chỉ số dưới là 0
Ví dụ 1.1.23 Cả thẩy có hai kiểu kết thúc (chẵn, lẻ):
165
93
≡8246
≡4123
≡2011
≡182
≡91
≡40
Trang 24đạt được bằng cách xóa bít ngoài cùng bên phải Chúng ta cũng quan sátthấy trong trường hợp 1 cuả định lý 1.1.22 với n là số chẵn và k là số lẻ, làphân biệt bởi một 0-bit ở cuối bên phải của số nhị phân đối với n và 1-bit
ở cuối bên phải của số nhị phân đối với k
Ví dụ 1.1.24 Trong biểu diễn các số dạng nhị phân
16510 = 101001012
9310 = 010111012xét từ phải sang trái, sự xuất hiện của số 0 đầu tiên ở hàng trên tại 21− bit
Vì cũng tồn tại 0-bit ở ngay bên dưới nó, ta tiếp tục phân tích Số 0 tiếptheo ở hàng trên xuất hiện tại 23− bit và có 1-bit bên dưới nó Vì vậy quátrình phân tích kết thúc, và kết luận về tính chẵn lẻ là chẵn
Trong biểu diễn dạng nhị phân
7510 = 10010112
1110 = 00010112
ta thấy rằng có 0-bit hàng dưới mỗi khi có 0-bit ở hàng trên, vì vậy kếtluận về tính chẵn lẻ là lẻ
Mệnh đề 1.1.25 Số các số nhị thức lẻ trong dòng n của tam giác Pascal
là2w, trong đó w là số các 1-bits trong phép biểu diễn nhị phân của n.
Trang 25Hệ quả 1.1.26 Nếu số nguyên n có dạng 2r− 1, thì mỗi hệ số nhị thức
trong hàng n của tam giác Pascal là số lẻ.
Chứng minh. Không có 0-bits trong biểu diễn nhị phân của 2n− 1
1.2 Nghịch đảo các số nhị thức
Trong phần này sẽ phát triển một kỹ thuật đối với các hệ số nhị thức, đượcgọi là nghịch đảo nhị thức Ứng dụng chính của nó trong phần này là lờigiải cho một quan hệ hồi quy
Định nghĩa 1.2.1 Biến đổi của dãy h fni bởi nghịch đảo nhị thức là dãy
Có một tính chất đặc trưng của bất kỳ khái niệm toán học nào, gọi làphép toán đối ngẫu, là áp dụng hai lần phép toán sẽ khôi phục lại đối tượngban đầu Định lý 1.2.2 khẳng định rằng phép biến đổi nghịch đảo nhị thứccác dãy có tính chất nói trên
Định lí 1.2.2 Giả sử h fni là một dãy và hgni là biến đổi của nó bởi phép
nghịch đảo nhị thức Khi đó, với mọi n ≥0
Nói cách khác, biến đổi hai lần phục hồi lại dãy ban đầu h fni.
Chứng minh. Xuất phát từ vế phải của phương trình (1.15) và thay thếcông thức nghịch đảo của phương trình (1.14) đối với gj
n
∑
j=0
nj
(−1)jgj =
n
∑
j=0
nj
(−1)j
j
∑
i=0
ji
(−1)ifi
Trang 26ji
ji
n − i
j− i
(−1)j+ifi
Sau đó rút gọn thừa số bên trong tổng
(−1)kTổng bên trong −→ số mũ nhị thức
fi(i = n)
=nn
Trang 27đồng nhất thức tập con của tập con thường làm biến đổi dễ dàng hơn, nócho phép giảm số lần xuất hiện chỉ số trong.
Một vài ví dụ cơ bản của phép nghịch đảo
Ba ví dụ đầu tiên sau đây về phép nghịch đảo nhằm giới thiệu phép nghịchđảo được tiến hành như thế nào
Ví dụ 1.2.3 Dãy số không đổi
(−1)jfj
(−1)j
Trang 28được nghịch đảo như sau
(−1)jfj
(−1)i+1
(−1)i
là đồng nhất thức nhị thức thông thường mà số lần xuất hiện của biến chỉ
số được rút gọn trong trường hợp như vậy Dãy 0 1 2 3 ··· cũng
n 1
Theo đó, không có gì phải ngạc nhiênnếu nghịch đảo của dãy n
r
tương tự như ví dụ 1.2.3
Ví dụ 1.2.5 Dãy số nhị thức
fn =n
r
Trang 29
đối với số không âm cố định r có dãy nghịch đảo là
(−1)jfj
nj
n − r
j− r
(−1)j
=nr
(−1)i+r
=nr
n−r
∑
i=0
n − ri
(−1)i+r
(−1)i
Sự xáo trộn
Nghịch đảo nhị thức có nhiều ứng dụng đặc biệt
Trang 30Ví dụ 1.2.6 Mỗi hoán vị của đoạn các số nguyên [1 : n] có thể thu được
bằng cách chọn r số từ đoạn [1 : n] và làm thay đổi thứ tự của chúng Theo
đó, nếu Dj là một sự xáo trộn (thay đổi thứ tự) số, thì
(−1)jgj
(−1)jgj
(−1)jj!
Trang 31hai ví dụ, kết hợp cả phương pháp nghịch đảo các số nhị thức với đồng nhấtthức của các số nhị thức đã đề cập trước đây.
Ví dụ 1.2.7 Khi hai thừa số của một số hạng là hai hệ số nhị thức có chứa
chỉ số của phép lấy tổng như là chỉ số dưới, mấu chốt của sự đơn giản hoá
là thiết lập một ánh xạ của phép nhân chập Vandermonde để rút gọn sốhạng đó Dãy số
(−1)jfj
(−1)j(−1)jN
nj
Ví dụ 1.2.8 Đôi khi tồn tại thương của hai hệ số nhị thức mà cả hai đều
chứa chỉ số của phép lấy tổng Dãy số
(−1)jfj
Trang 32
N j
Ở đây chúng ta áp dụng đồng nhất thức tập con của một tập con
Nn
nj
=Nj
N n
n j
N− j n− j
=Nn
Trang 33Chương 2
Một số ứng dụng của số nhị thức trong thống kê
Thống kê là khoa học nghiên cứu các phương pháp thu thập, phân tích và
xử lý các số liệu nhằm phát hiện các quy luật thống kê trong tự nhiên và
xã hội Trong thống kê, giá trị trung bình, phương sai, độ lệch chuẩn, làcác số đặc trưng để thu được các thông tin quan trọng Các số đặc trưngnày phản ánh những khía cạnh khác nhau của dấu hiệu điều tra và có mốiliên hệ mật thiết với các số nhị thức Vì vậy trong chương này tác giả xintrình bày một số ứng dụng của số nhị thức trong thống kê để thấy rõ hơn
về mối quan hệ đó
2.1 Một số khái niệm của xác suất
Xác suất và các biến ngẫu nhiên
Một số định nghĩa cơ bản được nhắc lại từ cơ sở của thống kê và xác suất
Định nghĩa 2.1.1 Không gian xác suất rời rạc là một cặp hΩ,Pri xác định
như sau:
• Tập rời rạc Ω được gọi là không gian mẫu
• Một tập hợp con của Ω được gọi là biến cố