1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Các số tổ hợp và một số ứng dụng trong thống kê

54 8 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Các số tổ hợp và một số ứng dụng trong thống kê
Người hướng dẫn GS.TSKH. Hà Huy Khoái
Trường học Đại Học Thái Nguyên
Chuyên ngành Phương pháp Toán sơ cấp
Thể loại Luận văn thạc sĩ
Năm xuất bản 2017
Thành phố Thái Nguyên
Định dạng
Số trang 54
Dung lượng 242,28 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

  • Mở đầu

  • 1 Các số nhị thức: những khía cạnh đại số và tổ hợp

    • 1.1 Đồng nhất thức các số nhị thức: chứng minh đại số và tổ hợp

    • 1.2 Nghịch đảo các số nhị thức

  • 2 Một số ứng dụng của số nhị thức trong thống kê

    • 2.1 Một số khái niệm của xác suất

    • 2.2 Phân bố nhị thức

    • 2.3 Hồi quy Catalan

  • Kết luận

  • Tài liệu tham khảo

Nội dung

Nghịch đảo các số nhị thức

Trong phần này, chúng ta sẽ phát triển kỹ thuật nghịch đảo nhị thức đối với các hệ số nhị thức, với ứng dụng chính là giải quyết một quan hệ hồi quy Định nghĩa 1.2.1 nêu rõ rằng biến đổi của dãy hf n i bởi nghịch đảo nhị thức sẽ tạo ra dãy hg n i với g n n.

Một tính chất quan trọng trong toán học là phép toán đối ngẫu, cho phép khôi phục lại đối tượng ban đầu khi áp dụng hai lần Định lý 1.2.2 khẳng định rằng biến đổi nghịch đảo nhị thức của các dãy sẽ giữ được tính chất này Cụ thể, nếu hf n i là một dãy và hg n i là biến đổi nghịch đảo nhị thức của nó, thì với mọi n≥0, f n n sẽ được xác nhận.

Nói cách khác, biến đổi hai lần phục hồi lại dãy ban đầu hf n i.

Chứng minh Xuất phát từ vế phải của phương trình (1.15) và thay thế công thức nghịch đảo của phương trình (1.14) đối vớig j n

Sự thay đổi thứ tự của phép lấy tổng là hữu ích ở đây n

(−1) j+i f i (1.17) Áp dụng đồng nhất thức tập con của một tập con (Mệnh đề 1.1.20) ta đưa về phép lấy tổng theo chỉ số j n

(−1) j+i f i Sau đó rút gọn thừa số bên trong tổng n

(−1) k Tổng bên trong−→số mũ nhị thức n

Trong phương trình (1.17), chỉ số j xuất hiện hai lần trong hệ số nhị thức, một lần ở chỉ số trên và một lần ở chỉ số dưới Trong trường hợp này, việc áp dụng đồng nhất thức tập con giúp đơn giản hóa quá trình, cho phép giảm số lần xuất hiện của chỉ số trong.

Một vài ví dụ cơ bản của phép nghịch đảo

Ba ví dụ đầu tiên sau đây về phép nghịch đảo nhằm giới thiệu phép nghịch đảo được tiến hành như thế nào.

Ví dụ 1.2.3 Dãy số không đổi hf n i=1 1 1 1 ã ãã có nghịch đảo là g n n

Một cách tổng quát, dãy hf n i=c c c c ããã có nghịch đảo là hg n i=c 0 0 0ããã

Ví dụ 1.2.4 Dãy số tự nhiên hf n i=0 1 2 3 ããã được nghịch đảo như sau g n n

(−1) j (1.18) Áp dụng đồng nhất thức hấp thu để loại bỏ sự xuất hiện của chỉ số j. n

(−1) j Thay j =i+1để sắp xếp các hệ số nhị thức với giới hạn của tổng.

Trong phương trình (1.18), chỉ số tổng j xuất hiện trong hệ số nhị thức và là một nhân tử Đồng nhất thức hấp thu là đồng nhất thức nhị thức thông thường, trong đó số lần xuất hiện của biến chỉ số được rút gọn Các chỉ số 0, 1, 2, 3 cũng có thể được biểu diễn dưới dạng n.

Theo đó, không có gì phải ngạc nhiên nếu nghịch đảo của dãy n r tương tự như ví dụ 1.2.3.

Ví dụ 1.2.5 Dãy số nhị thức f n n r đối với số không âm cố định r có dãy nghịch đảo là g n n

(−1) j (1.19) Áp dụng đồng nhất thức tập con của một tập con và đặt nhân tử chung n

Trong phương trình (1.19), số hạng với chỉ số tổng là j xuất hiện hai lần trong các hệ số nhị thức khác nhau, một lần ở chỉ số trên và một lần ở chỉ số dưới Để đơn giản hóa, đồng nhất thức tập con thường được áp dụng để loại bỏ một trong những lần xuất hiện của các số hạng này, giúp rút gọn tổng.

Nghịch đảo nhị thức có nhiều ứng dụng đặc biệt.

Mỗi hoán vị của dãy số nguyên từ 1 đến n có thể được tạo ra bằng cách chọn r số từ dãy này và sắp xếp lại thứ tự của chúng Do đó, nếu D_j là một hoán vị của các số, thì số lượng hoán vị có thể được tính bằng n!.

Từ đó suy ra rằng f n = (−1) n D n có nhị thức nghịch đảo g n =n! Bởi tính chất đối ngẫu nghịch đảo nhị thức, ta có f n = (−1) n D n n

Vì vậy, tỷ lệ giữa các xáo trộn và số các hoán vị của một tập hợp n đối tượng tiến dần đếne − 1 khi n lớn.

Các ví dụ khác về phép nghịch đảo

Các phương pháp lấy tổng được giới thiệu trong phần này rất phổ biến trong các phép biến đổi dãy Chúng tôi sẽ bổ sung thêm hai ví dụ, kết hợp cả phương pháp nghịch đảo các số nhị thức và đồng nhất thức của các số nhị thức đã được đề cập trước đó.

Khi hai thừa số của một số hạng là hai hệ số nhị thức với chỉ số tổng là chỉ số dưới, việc đơn giản hoá có thể thực hiện thông qua ánh xạ của phép nhân chập Vandermonde Điều này giúp rút gọn số hạng, với dãy số f n = (−1) n.

N n có dãy nhị thức nghịch đảo là g n n

N j n j áp dụng đồng nhất thức đối xứng ta được n

N j n n− j và sau đó dùng phép nhân chập Vandermonde

Ví dụ 1.2.8 Đôi khi tồn tại thương của hai hệ số nhị thức mà cả hai đều chứa chỉ số của phép lấy tổng Dãy số f n = (−1) n

− 1 có biến đổi qua phép nghịch đảo nhị thức là dãy g n n

N j Ở đây chúng ta áp dụng đồng nhất thức tập con của một tập con

N− j n− j có thể đơn giản hóa bằng cách sử dụng đồng nhất thức tổng đường chéo

Một số ứng dụng của số nhị thức trong thống kê

Thống kê là khoa học nghiên cứu các phương pháp thu thập, phân tích và xử lý số liệu để phát hiện quy luật trong tự nhiên và xã hội Các chỉ số như giá trị trung bình, phương sai và độ lệch chuẩn là những số đặc trưng quan trọng, phản ánh các khía cạnh khác nhau của dấu hiệu điều tra và có mối liên hệ chặt chẽ với các số nhị thức Chương này sẽ trình bày một số ứng dụng của số nhị thức trong thống kê để làm rõ mối quan hệ này.

Một số khái niệm của xác suất

Xác suất và các biến ngẫu nhiên

Không gian xác suất rời rạc được định nghĩa là một cặp (Ω, P) trong đó Ω là tập hợp các kết quả có thể xảy ra và P là hàm xác suất xác định xác suất của từng kết quả.

• Tập rời rạcΩđược gọi là không gian mẫu.

• Một tập hợp con củaΩđược gọi là biến cố.

• Tập2 của tất cả các tập con củaΩđược gọi là không gian biến cố.

• Hàm xác suấtPr : 2 Ω −→R được gọi là độ đo xác suất, thỏa mãn các tiên đề sau:

1 0≤Pr(A)≤ 1, với mọi biến cố A ⊆Ω Số Pr(A) được gọi là xác suất của biến cố A.

3 Nếu các biến cố A s , với s∈ S là các tập con đôi một rời nhau củaΩthì

Biến ngẫu nhiên X trên một không gian mẫu được định nghĩa là một hàm giá trị thực Nó được phân loại là biến ngẫu nhiên rời rạc khi tập hợp các giá trị của nó là hữu hạn hoặc vô hạn đếm được.

Ký hiệu: Giả sửX : Ω−→Rlà một biến ngẫu nhiên rời rạc trên một không gian mẫu Ω với độ đo xác suất là Pr Với x∈ R, xác suất của tập

{ω ∈Ω|X(ω) =x}được ký hiệu là Pr(x).

Giá trị trung bình và phương sai.

Giá trị trung bình của một biến ngẫu nhiên, hay giá trị kỳ vọng, được hiểu là trung bình có trọng số Phương sai và độ lệch chuẩn là các chỉ số đo lường sự phân tán xung quanh giá trị trung bình Cụ thể, giả sử X là một biến ngẫu nhiên rời rạc trên không gian mẫu Ω với độ đo xác suất Pr, và D là tập hợp các giá trị của X, thì giá trị kỳ vọng của biến ngẫu nhiên X được ký hiệu là E(X) hoặc à X, được tính bằng tổng các giá trị của X.

E(X) = X = ∑ x ∈ D x Pr(x) (2.1) Định nghĩa 2.1.4 Giả sử X : Ω−→R là một biến ngẫu nhiên rời rạc trên không gian mẫu Ω với độ đo xác suất Pr, và D là tập hợp các giá trị của X Phương sai của biến ngẫu nhiên X, ký hiệu là V(X) hoặc σ X 2, được tính bằng tổng.

Độ lệch chuẩn của biến ngẫu nhiên rời rạc X, ký hiệu là SD(X) hoặc σX, được định nghĩa là căn bậc hai của phương sai Công thức tính độ lệch chuẩn được thể hiện qua E([X−à X]²) = Pr(x).

Các chỉ số giá trị trung bình (ký hiệu là à) và phương sai (ký hiệu là σ²) được định nghĩa như sau: khi tính toán giá trị trung bình hoặc phương sai của một bảng số, mọi phần tử trong bảng đều được coi là có giá trị như nhau.

Mệnh đề 2.1.7 Giả sử X : Ω−→Rlà biến ngẫu nhiên rời rạc Khi đó σ X 2 =E(X 2 )−à 2 (2.4)

Phân bố nhị thức

Một ví dụ điển hình về phân bố nhị thức là khi thực hiện n lần tung đồng tiền Nếu ta coi việc xuất hiện mặt trước là "thành công", thì số lần xuất hiện mặt trước sẽ tuân theo phân bố nhị thức Để tính giá trị trung bình và phương sai của phân bố này, chúng ta áp dụng các đồng nhất thức của các số nhị thức từ chương 1 Định nghĩa 2.2.1 cho biết rằng biến ngẫu nhiên rời rạc X có phân phối nhị thức B(n, p) nếu X đại diện cho số lần xuất hiện của sự kiện A trong n phép thử độc lập Bernoulli, với xác suất xuất hiện A trong mỗi phép thử là p.

Mệnh đề 2.2.2 Giá trị kỳ vọng của biến ngẫu nhiên nhị thức X trên n phép thử, mỗi phép thử có xác suất thành công plà

Chứng minh Phương trình (2.1) xác định giá trị kỳ vọng

Chúng ta thay xác suất của biến ngẫu nhiên nhị thức như đã được cho bởi phương trình (2.5) n

Sự hấp thu loại trừ 1 trong 4 lần xuất hiện chỉ số j của tổng n

∑ i= 0 n−1 i p i (1−p) n − 1 − i mà ta nhận ra là một khai triển nhị thức, và rút gọn

Mệnh đề 2.2.3 Phương sai của biến ngẫu nhiên nhị thức X trong n phép thử với xác suất thành công p là:

Chứng minh Một lần nữa ta bắt đầu từ phương trình (2.1)

Chỉ số j trong tổng đã xuất hiện 4 lần, và việc áp dụng sự hấp thu để giảm số mũ của j trong một lần xuất hiện là một bước hợp lý.

Thay i = j−1 để sắp xếp các chỉ số của các hệ số nhị thức với giới hạn trên và dưới của tổng là một bước hợp lý khác.

(1+i) n−1 i p i (1−p) n − 1 − i Chia tổng này giống như ở đây

Vì tổng trong phần thứ nhất đã được nhận thấy như là một khai triển nhị thức

∑ i= 0 i n−1 i p i (1−p) n − 1 − i Áp dụng sự hấp thu một lần nữa để loại trừ sự xuất hiện của chỉ số tổng

Thay k=i−1 rồi sắp xếp lại chỉ số dưới của hệ số nhị thức với giới hạn dưới của tổng.

=np(1−p). Ước lượng không chệch của giá trị trung bình

Một phương pháp thống kê trực quan để ước lượng tỷ lệ cá thể trong một tập hợp lớn N với đặc điểm cụ thể, như sở thích về toán học, là lấy mẫu ngẫu nhiên và sử dụng tỷ lệ trong mẫu để ước lượng tỷ lệ tổng quát Chúng ta sẽ áp dụng đồng nhất thức của các số nhị thức để xác nhận tính chính xác của phương pháp này Theo định nghĩa 2.2.4, ước lượng θb của đặc trưng thống kê θ được coi là không chệch nếu giá trị kỳ vọng E(θb) của mẫu ngẫu nhiên bằng θ.

Mệnh đề 2.2.5 nhấn mạnh rằng tỷ lệ mẫu là một ước lượng chính xác của tỷ lệ các cá thể có đặc trưng đã xác định, đồng thời phản ánh đầy đủ tập hợp các đối tượng liên quan.

Giả sử trong một tập hợp N đối tượng có M cá thể với đặc điểm cụ thể, một mẫu cỡ n được lấy ra Biến ngẫu nhiên quan tâm là số m cá thể có đặc điểm đó và tỷ lệ tương ứng.

X = m n của những cá thể với đặc điểm đang xét Tổng số các cách để chọn một mẫu kích thước n là

Số cách chọn một mẫu kích thước n sao cho có thể có đúng j cá thể với đặc điểm quy định là tích

Số cách chọn j cá thể từ tập M với đặc điểm đang xét là N−M n− j, trong khi số cách chọn n− j cá thể còn lại từ tập N−M cá thể không có đặc điểm đó.

N−M n− j Áp dụng đồng nhất thức hấp thu để loại bỏ một lần xuất hiện của chỉ số tổng

Bây giờ sử dụng phép nhân chập Vandermonde

N Như vậy, phương pháp trực quan ước lượng giá trị trung bình là không chệch. Ước lượng không chệch của phương sai

Giả sử X là một biến ngẫu nhiên trên không gian mẫu Ω Các biến ngẫu nhiên phân bố đồng nhất

X1, X2, , Xn là các giá trị của biến X trên n mẫu từ tập hợp Ω, với giá trị trung bình mẫu là X Các nhà thống kê tính toán phương sai bằng ước lượng σc² = ∑(Xi - X)² / (n - 1) = (∑Xi² - n(∑Xi)²) / (n - 1), sử dụng n - 1 làm mẫu số thay vì n Điều này sẽ được giải thích ở mệnh đề tiếp theo.

Mệnh đề 2.2.6 Thống kê mẫu σc 2 = ∑(X i −X) 2 n−1 = ∑X i 2 −n − 1 (∑X i ) 2 n−1 (2.6) là một ước lượng không chệch của phương sai của biến ngẫu nhiên X. Chứng minh.

E(X i X j ) Chia tổng kép thành hai phần

E(X)E(X)ã(j6=i) cả hai tổng đều giải được

Do đó, phép chia chon−1dẫn tới ước lượng không chệch.

Hồi quy Catalan

Dãy Catalan {C n }được định nghĩa bởi quan hệ hồi quy c0=1; giá trị ban đầu c n =c0c n − 1+c1c n − 2+ããã+c n − 1c0 với n≥1

Trong lý thuyết đồ thị, tập T ↓ của cây nhị nguyên có thể được định nghĩa một cách đệ quy:

• CâyK 1 • với một đỉnh duy nhất được lấy làm gốc thuộc tậpT ↓

• Nếu T ∈ T ↓ và nếu v là một đỉnh của cây T, thì mỗi một trong các cây sau đây là thuộc tậpT ↓

1 Cây thu được bằng cách nối một đỉnh mới đếnv, gọi là con trái của đỉnhυ (một đỉnh có nhiều nhất một con trái).

2 Cây thu được bằng cách nối một đỉnh mới đến v, gọi là con phải của đỉnhv(một đỉnh có nhiều nhất một con phải).

Hình ảnh dưới đây minh họa các cây nhị phân với 0, 1, 2 và 3 đỉnh Qua việc thử nghiệm với những trường hợp nhỏ này, ta có thể dễ dàng nhận thấy rằng số Catalan n tương ứng với số lượng cây nhị phân có n đỉnh.

Hình 2.1: Cây nhị phân nhỏ nhất

Trong khoa học máy tính, mỗi con của một đỉnh trong cây nhị phân được phân loại thành con trái hoặc con phải, điều này có vai trò quan trọng trong các ứng dụng như cây tìm kiếm nhị phân và cây ưu tiên Cây con trái của cây nhị phân T là cây con có gốc là con trái của gốc T, trong khi cây con phải là cây con có gốc là con phải của gốc T.

Mệnh đề 2.3.3 Với n≥0, số cây nhị phân n đỉnh bằng số Catalanc n

Chứng minh Bằng quy nạp trên số đỉnh n.

*Bước cơ sở Rõ ràng c0 =1 vàc1 =1là số cây nhị phân tương ứng với 0 và 1 đỉnh.

*Giả thiết quy nạp Cho n>0, giả sử đối với tất cả các số nguyên k thỏa mãn 0≤k

Ngày đăng: 08/06/2021, 15:52

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w