câu hỏi lý thuyết xác xuất thống kê
Trang 1Phần 1 : LÍ THUYẾT
Lí thuyết xác suất
Câu 1: Phân biệt các khái niệm: Hoán vị, tổ hợp, chỉnh hợp (lặp và không lặp) của một tập con từ tập n phần tử
Nêu các công thức xác định các số hoán vị, tổ hợp, chỉnh hợp Thí dụ minh họa
Nội
Chỉnh hợp
Khái
niệm
Hoán vị của n
phần tử là một
nhóm có thứ tự
gồm đủ mặt n
phần tử đã cho
Tổ hợp chập k của n phần tử (k n≤ ) là một nhóm không phân biệt thứ tự, gồm k phần tử khác nhau chọn từ n phần
tử đã cho
Chỉnh hợp (không lặp) chập k của n phần tử (
k n≤ ) là một nhóm (bộ)
có thứ tự gồm k phần tử khác nhau chọn từ n phần
tử đã cho
Chỉnh hợp lặp chập k của n phần tử là một nhóm có thứ tự gồm k phần tử chọn từ n phần
tử đã cho, trong đó mỗi phần
tử có thể có mặt 1,2,…,k lần trong nhóm
Công
thức
Số hoán vị của n
phần tử được ký
hiệu là P n
!
n
P =n
Số tổ hợp chập k của n phần tử ký hiệu là C n k
!
!( )!
n
k n k
−
−
Số chỉnh hợp chập k của
n phần tử ký hiệu là A n k
!
k n
n A
n k
=
−
Số chỉnh hợp lặp chập k của n phần tử ký hiệu là B n k
n
B =n
Thí
dụ
Một bàn có 4 học
sinh Mỗi cách
xếp chỗ 4 học
sinh vào 1 bàn là
1 hoán vị của 4
phần tử Do đó số
cách xếp là
4 4! 24
Chọn ngẫu nhiên 2 quyển sách từ trên giá sách có 3 quyển sách Mỗi cách chọn là 1 tổ hợp chập 2 của 3 phần tử Do đó có
2
C = cách chọn
Cho 3 chữ số 1,2,3 Mỗi
số tự nhiên gồm 2 chữ số khác nhau được lập từ 2 trong 3 chữ số trên là một chỉnh hợp không lặp chập 2 của 3 phần tử Do
đó có thể lập được
2 3
A = 3.2 = 6 số
Cho 5 hòn bi vào 3 hộp Mỗi cách xếp 5 hòn bi vào 3 hộp
là một chỉnh hợp lặp chập 5 của 3
Do đó có B35 = =35 243 cách xếp
Câu 2 : Thế nào là một phép thử ? Một biến cố (sự kiện) ?
- Quan hệ giữa các biến cố phép tính của các biến cố
- Biến cố chắc chắn; không thể; xung khắc; đối lập biểu diễn qua sơ đồ Ven – Euler ?
Trả lời:
- Phép thử: là sự thể hiện một nhóm các điều kiện xác định (G) có tính lặp lại
Kí hiệu: T
Sự kiện (biến cố) : là kết quả của phép thử Kí hiệu: E, A, B, C, …
Có 2 loại sự kiện là:
+ Sự kiện ngẫu nhiên (Random Effect) : có thể xuất hiện hoặc không xuất hiện khi thực hiện phép thử, không phụ thuộc vào chủ quan Sự kiện ngẫu nhiên là đối tượng nghiên cứu của khoa học ngẫu nhiên
+ Sự kiện tất định (Definity Events) : luôn xuất hiện (Ω hoặc ) hoặc luôn không xuất hiện khi thực hiện phép thửƱ (Ø)
* Quan hệ (relation) giữa các biến cố:
+ Quan hệ bao hàm: A⊂B
+ quan hệ tương đương: A B≡
* Phép tính (Calculus):
+ Hợp (tổng): A B C∪ =
+ Giao (tích): A B D∩ =
+ Trừ (hiệu): \A B E=
+ Hiệu đối xứng: F = A ∆ B = (A\B) (B\A)∪
+ Đối lập (bù): A đối lập với A ( có cái này thì ko có cái kia)
+ Xung khắc: A B∩ = ∅ (không cùng xảy ra)
+ Nhóm đầy đủ: 1 2 n
i j
∩ = ∅
Trang 2* Biểu diễn qua sơ đồ Ven – Euler các biến cố:
Biến cố chắc chắn xảy ra:
Biến cố không thể xảy ra: (là một tập rỗng)
Biến cố xung khắc:
Biến cố bù (đối lập):
Câu 3 :
A, B,C là 3 biến cố gắn với phép thử G Biểu diễn qua A, B, C các biến cố sau đây :
- Chỉ có A xảy ra : A∩B∩C ( tương tự cho B, C)
- Ít nhất một trong 3 biến cố xảy ra: A∪B∪C
- Nhiều nhất một biến cố xảy ra:
(A ∩B ∩C) ∪ (A ∩B ∩C) ∪ (A ∩ B ∩C) ∪ (A ∩B ∩ C )
- Không có biến cố nào xảy ra: A∩B∩C
Câu 4 : Các định nghĩa xác suất một biến cố Ý nghĩa của xác suất là gì?
- Gọi P(A) là tần suất được xuất hiện biến cố A trong định nghĩa xác suất theo tần suất Có thể viết như sau được không? ( ) lim ( )
n
→∞
=
- Hai biến cố có xác suất bằng nhau thì có tương đương hay không?
- Một biến cố có xác suất 0, có thể xảy ra hay không?
Trả lời :
• Định nghĩa xác suất một biến cố:
-Giả sử phép thử có n biến cố đồng khả năng có thể xảy ra, trong đó có m biến cố đồng khả năng thuận lợi cho biến cố A (A là tổng khả năng của m biến cố sơ cấp này) Khi đó xác suất của biến cố A, ký hiệu P(A) được định nghĩa bởi công thức sau: P A( ) m
n
= , trong đó m là số trường hợp thuận lợi cho A, n là số trường hợp đồng khả năng
n
→∞
= vì ta có P A( ) m
n
=
%
( ) lim
n
m
P A
n
→∞
Khi cho số phép thử tăng lên vô hạn thì tần suất xuât hiện biến cố A dần về một số xác định gọi là xác suất của biến cố A
•Hai biến cố có xác suất bằng nhau không tương đương vì 2 biến cố A và B tương đương nhau B A⊂B A
• Có thể xảy ra một biến cố có xác suất bằng không Đó là trường hợp không xuất hiện khả năng nào thuận lợi cho A
Trang 3Câu 5 :
• Hai biến cố A và B là độc lập khi và chỉ khi P(A ∩ B) = P(A).P(B)
trong đó, A ∩ B là giao của A và B, nghĩa là, nó là biến cố rằng cả hai biến cố A và B đều xảy ra
Tổng quát hơn, một tập hợp biến cố bất kỳ (có thể gồm nhiều hơn hai biến cố) là độc lập lẫn nhau khi và chỉ khi với mọi tập con hữu hạn A1, , An của tập hợp trên, ta có
• Mối quan hệ giữa khái niệm độc lập và xung khắc
Công thức nhân xác suất:
1 P(A∩B) = P(A) P(B) ( Với A, B độc lập )
P(A∩B) = P(B/A) P(A) = P( A/B) P(B)
2 P(A∩B∩C) = P(A) P(B) P(C) ( Với A,B,C độc lập)
= P(A) P(B/A) P(C/AB)
3 P( A∪B) = P(A) + P(B) ( Với A∩ B = ∅)
P( A∪B) = P( A) + P(B) - P(A∩B) ( Với A, B bất kì)
4 P(A∪B∪C) = P(A) + P(B) + P(C) = P(A) + P(B) + P(C) - P(AB) - P(BC) - P(AC) + P(ABC)
• Chứng minh nếu A, B độc lập thì , B và , cũng độc lập
Hai biến cố độc lập là hai biến cố xảy ra nhưng không liên quan gì đến nhau cho nên biến cố đối của A tức và B cũng độc lập với nhau tức là xảy ra không hề liên quan đến nhau Tương tự như vậy thì và cũng độc lập với nhau
• Chứng minh nếu P(A/B)= P(A/) thì A B độc lập
ta có P(A/B)= P(A/) nghĩa là xác suất của biến cố A dưới điều kiện B xảy ra giống như xác suất của biến cố A dưới điều kiện B không xảy ra=> cho nên hai biến cố AB việc xảy ra hay không xảy ra biến cố này thì không ảnh hưởng gì đến việc xảy ra của biến cố kia tức là hai biến cố A, B độc lập
Câu 6: Tại sao lại gọi là một hệ đầy đủ các biến cố? Ý nghĩa của công thức xác suất đầy đủ, công thức Bayes.
Trả lời:
-Gọi là 1 hệ đầy đủ các biến cố vì khi ta thực hiện phép thử ngẫu nhiên sẽ có nhiều khả năng xảy ra, có thể là đối lập, xung khắc từng đôi….Trong các khả năng xảy ra đó lại xảy ra nhiều giai đoạn khác nhau nữa, những hoạt động tiếp theo phụ thuộc vào hoạt động xảy ra trước đó =>Cần phải tính xác suất để thức hiện được công việc qua nhiều giai đoạn nhưng tổng của chúng luôn là biến cố chắc chắn =>Hệ đầy đủ các biến cố
-Ý nghĩa của công thức Bayes: Công thức Bayes còn được gọi là công thức xác suất hậu nghiệm khi và chỉ khi sự kiện đã xảy ra, tìm nguyên nhân gây ra sự kiện đó với xác suất lớn nhất công thức Bayes được ứng dụng trong Khoa học - Kĩ thuật, đặc biệt trong khoa học lắp ráp
Câu 7:
- Biến ngẫu nhiên là 1 biến số nhận giá trị tùy thuộc sự kiện ngẫu nhiên
- Có 2 loại biến ngẫu nhiên:
+ Biến ngẫu nhiên rời rạc (discrete): Tập giá trị nhận là hữu hạn hoặc đếm được
+ Biến ngẫu nhiên liên tục (continious): Tập giá trị nhận lấp đầy 1 khoảng hữu hạn hoặn vô hạn.)
- Hàm phân phối của biến ngẫu nhiên X được xác định như sau:
F (x) = P {X < x}
Trong đó x là biến của hàm F, x R∈¡ Ký hiệu X=F(x) nghĩa là biến X có hàm phân phối là F(x)
- Tính chất của hàm phân phối:
+ Hàm phân phối xác định với mọi x € (-∞ , +∞)
+ Hàm phân phối là hàm không giảm: nếu x1 < x2 thì F(x1) ≤ F(x2)
F(-∞) = 0, F(+∞) = 1, 0≤F(x)≤1 với mọi x € (-∞ , +∞)
P {a≤x<b} = F(b) - F(a)
- Giải thích bằng hình học
-∞ x +∞
{X<x
Trang 4
{X<x2}
x1
x2
{ X<x1}
a { X<b } b
{X<a } {a ≤X<b}
- Phân phối nhị thức:
Xét n phép thử Bernoulli với biến cố A có P(A) = p
Gọi X là số lần xuất hiện biến cố A Khi đó phân phối của X được gọi là phân phối nhị thức, ký hiệu là B(n,p)
- Phân phối Poison:
Biến ngẫu nhiên X gọi là có phân phối Poison nếu
P{X=k} =e-λ λk / k! (k = 0, 1, 2, 3…… )
λ là tham số, λ >0
- Phân phối chuẩn
Là phân phối của biến ngẫu nhiên liên tục với hàm mật độ 2
2
1 ( )
2
x
µ δ
π δ
−
−
Câu 8:
-Định nghĩa hàm mật độ: Biến ngẫu nhiên X được gọi là có phân phối liên tục tuyệt đối nếu hàm phân phối có dạng F x X( ) x f t dt( )
−∞
=∫ , x R∈¡ Hàm dưới dấu tích phân f(x) được gọi là hàm mật độ của X
+ ( ) dF x X( )
f x
dx
= tại các điểm liên tục của f(x) + ( ) 0,f x ≥ ∀x
+ +∞ f x dx( ) 1
∫
a
P a X≤ < =b ∫ f x dx
Câu 9:
* Định nghĩa, ý nghĩa và tính chất của kì vọng:
- Định nghĩa:
Kì vọng của biến ngẫu nhiên X là một số, ký hiệu EX, được xác định như sau:
i
x p
=∑ nếu (P X =x i)= p i (X là biến ngẫu nhiên rời rạc)
EX x p x dx ( )
+∞
−∞
= ∫ nếu ( )p x là hàm mật độ (X là biến ngẫu nhiên liên tục)
- Ý nghĩa:
Kì vọng của biến ngẫu nhiên là giá trị trung bình mà biến ngẫu nhiên nhạn, hoặc là trọng tâm phân phối xác suất với khối lượng 1 Kì vọng là trung bình có trọng lượng
Trang 5Trong trường hợp các xác suất p bằng nhau (phân phối đều rời rạc) thì trung bình có trọng lượng trùng với trung i
bình số học:
1
1 EX=
n i i
x
n ∑=
- Tính chất:
1 EC = C (C = const)
2 E(CX) = CEX
3. E(X±Y) = EX±EY
4 E(X.Y) = EX EY ( Nếu X, Y độc lập)
→ Kì vọng bảo toàn tuyến tính
5. E ( ) ( ).i i
i
f X =∑ f x p nếu (P X =x i)= p i
Hoặc E f X( ) f x p x dx( ) ( )
+∞
−∞
= ∫ nếu p(x) là hàm mật độ
* Định nghĩa, ý nghĩa và tính chất của phương sai:
- Định nghĩa:
Phương sai của biến ngẫu nhiên X là một số không âm, ký hiệu DX, được xác định như sau:
DX E X EX= − =EX − EX Nếu X rời rạc:
i i i
i i i
x p
x p
=
∑
∑ Nếu ( )p x là hàm mật độ:
2 2
x p x dx
x p x dx
+∞
−∞
+∞
−∞
=
∫
∫
- Ý nghĩa :
Phương sai của biến ngẫu nhiên là số đo của mức độ tập trung, phân tán của các giá trị biến ngẫu nhiên xung quanh giá trị trung bình của nó DX càng lớn thì các giá trị của biến ngẫu nhiên càng phân tán DX càng nhỏ thì các giá trị của X càng tập trung quanh EX Phương sai còn được gọi là bình phương độ lệch trung bình
- Tính chất :
1 DC = 0 ; C = const
2. D(CX) = C2 DX
3 D(-X) = DX
4. D(X±Y) = DX ± DY (X, Y độc lập)
* Kì vọng, phương sai của các biến ngẫu nhiên theo các phân phối thường gặp :
- Phân phối đều rời rạc : p i P X( x i) 1
n
+ Kì vọng :
1
1 EX=
n i i
x
n ∑=
2
- Phân phối nhị thức: X : B n p( , )
{ } m m n m
n
P X =m =C p q − với q= −1 p; m=0,n
Khi đó: + Kì vọng:
1
EX n EXi
i
np
=
Trang 6+ Phương sai:
1
n i i
npq
=
=
∑
- Phân phối chuẩn: X : N( ,µ σ2)
Là phân phối của biến ngẫu nhiên liên tục với hàm mật độ:
2 2
2
1 ( )
2
x
µ σ
σ π
−
−
= ⋅ (−∞ < < +∞x )
Ta có: + Kì vọng: EX=µ
+ Phương sai: DX=σ2
Câu 10: * Các mô hình của xác suất thống kê cổ điển Cho ví dụ
1/ Mô hình siêu hình học (Hyber Geometry)
Bài toán: 1 lô hàng có n sản phẩm trong đó có m phế phẩm Rút ngẫu nhiên k sản phẩm Tìm xác suất để:
a) Có đúng p phế phẩm
b) Xét trường hợp p=0, p=k
c) Có ít nhất 1 phế phẩm
d) Có nhiều nhất 1 phế phẩm
Giải:
a) Đặt A là sự kiện có p phế phẩm khi rút k sản phẩm
Công thức: P(A) : = mA
n
N =
)!
(
!
k
n
k
n
− mA = p. k p
m n m
C C−− P(A) = p. k p
m n m k n
C C C
−
−
b) A0 (p=0) => p(A0)
Ak (p=k) => p(Ak)
p=0 => P(A0) =
m n m n m
p=k => P(Ak) =
0
.
C C C
c) Gọi C là sự kiện không có phế phẩm nào
Có ít nhất 1 phế phẩm => p≥1 => C là sự kiện của xác suất
C (p < 1 <=> p=0) => C = A0
P(C) = 1 - P(C ) = 1 -
k
n m k n
C C
− hoặc:
P(C) =
1
.
p k p k
m n m k
C C
C
−
−
=
∑
d) Gọi D là sự kiện có nhiều nhất 1 phế phẩm => p≤1 => Có 2 trường hợp là có 1 phế phẩm và không có phế phẩm nào
Gọi D’ và D’’ lần lượt là sự kiện có 1 phế phẩm và không có phế phẩm nào
Trang 7mD’ = 1. k 1
m n m
C C−−
mD’’ = Cn m k−
mD = mD’ + mD’’ = 1. k 1
m n m
C C−− + Cn m k−
P(D) =
k n
C C C
C
−
2/ Mô hình đi tàu
Bài toán: 3 nữ sinh L, H, C đi tàu hỏa với 10 toa tàu Tính xác suất trong các trường hợp sau đây: a) Mỗi toa tàu không chứa quá 1 nữ sinh
b) 3 nữ sinh ngồi 3 toa khác nhau
c) 3 nữ sinh ngồi 3 toa liền kề nhau
d) 3 nữ sinh ngồi cùng 1 toa
e) L luôn ngồi toa đầu
f) H, C ngồi các toa đầu cuối
g) Toa 5 không có ai ngồi
Giải:
Số trường hợp đồng khả năng: n = 10.10.10 = 1000 103
a) Gọi A là sự kiện cần tính xác suất
mA = 10.9.8 = 720
1 cách chọn là 1 chỉnh hợp chập 3 của 10 nên số cách chọn là mA = A103 = 8.9.10
Xác suất để mỗi toa tàu không chứa quá 1 nữ sinh là: P(A) = mA
n = 1%
b) Gọi B là sự kiện 3 nữ sinh ngồi ở 3 toa khác nhau => B≡A
c) Gọi B là sự kiện 3 nữ sinh ngồi 3 toa liền kề
3 cô có thể đổi chỗ cho nhau => có 3! = 6 cách sắp xếp
Có 8 vị trí mà các cố có thể ngồi liền kề nhau
mC = 3! 8 = 48 => P(C) =
48
1000 = 4,8%
d) Gọi D là sự kiện 3 nữ sinh ngồi cùng 1 toa
mD = 10 ; P(D) = 10
1000= 1%
e) Gọi E là sự kiện L ngồi toa đầu
mE = 1.10.10 = 100 P(E) = 100
1000= 10%
f) Gọi F là sự kiện H, C ngồi các toa đầu cuối => mF = 2.10 = 20
P(F) = 20
1000= 2%
g) Gọi G là sự kiện toa 5 không có ai ngồi
mG = 9.9.9 = 729 P(G) = 729
1000= 72,9%
3/ Mô hình xếp chỗ ngồi
Bài toán 1: 3 người L, H, C ngồi trên 1 băng ghế trống 10 chỗ Tìm xác suất:
a) 3 nữ sinh ngồi ở 3 vị trí liền kề
Trang 8b) L luôn ngồi ở vị trí đầu
c) H, C luôn ngồi ở vị trí đầu cuối
Giải:
Số trường hợp đồng khả năng : n = 10.9.8 = 720
a) Gọi A là sự kiện 3 nữ sinh ngồi ở 3 vị trí liền kề
Có 3 ! = 6 cách xếp chỗ cho 3 người
Có 8 chỗ mà 3 người có thể ngồi liền kề
mA = 6.8 = 48 P(A) = 48
720 ≈6,6%
b) Gọi B là sự kiện L luôn ngồi ở vị trí đầu
mB = 1.9.8 = 72 P(B) = 72
720 = 10%
c) Gọi C là sự kiện C, H luôn ngồi ở vị trí đầu cuối
mC = 2.8 = 16 P(C) = 16
720 ≈2,2%
Bài toán 2 : Một tổ gồm 10 người tổ chức liên hoan ngồi quanh bàn tròn Mọi người ngồi vào chỗ một cách ngẫu nhiên Tìm khả năng để cho A và B ngồi cạnh nhau
Giải :
Số trường hợp đồng khả năng : n = 10!
A có thể ngồi 1 trong 10 chỗ, B có thể ngồi ở 2 chỗ bên cạnh A
=> m = 10.2.8!
Xác suất cần tìm là : P = 10.2.8!
10! =
2 9
4/ Mô hình bắn súng:
Bài toán : 2 xạ thủ bắn vào bia 1 cách độc lập Xác suất trúng tương ứng là 0,7 và 0,8 Tìm các xác suất:
a) Có đúng 1 xạ thủ trúng đích
b) Có ít nhất 1 xạ thủ trúng đích
Giải:
a) P(A)=0,7 => P(Ā)= 1 - 0,7 = 0,3
P(B)=0,8 => P(B)= 1 - 0,8 = 0,2
Gọi A1 là biến cố có đúng 1 xạ thủ trúng đích
Xạ thủ A trúng và xạ thủ B trượt hoặc ngược lại
A1 = A.B đối lập ∪ Ā.B
(A,B) và (Ā, B) là các sự kiện đôi một xung khắc
=> P(A1)=P(A).P(B) + P(Ā).P(B)
= 0,7 0,2 + 0,3 0,8 = 0,38
b) Có ít nhất 1 xạ thủ trúng đích => P A ( ∪ B ) = P A ( ) P B + ( ) P A ( − B ) ∩
= 0,7 + 0,8 - 0,56 = 0,94
Lý thuyết thống kê toán
Câu 1: Đối tượng và nội dung nghiên cứu của Thống kê toán là gì?
Thống kê toán học là một ngành khoa học nghiên cứu việc thu thập thông tin qua các dữ liệu của các đối tượng cần nghiên cứu
để từ đó rút ra những kết luận bằng số về bản chất đối tượng tùy theo yêu cầu nghiên cứu
Đối tượng nghiến cứu của thống kê toán: thông tin qua các dữ liệu.
Nội dung của nghiên cứu thống kê toán: từ thông tin qua các dữ liệu rút ra kết luận bằng số về bản chất đối tượng.
Câu 2: Các khái niệm cơ sở của thống kê toán
1 Khái niệm
Trong những vấn đề thực tế, ta thường phải nghiên cứu một hay nhiều dấu hiệu định tính hoặc định lượng của các phần tử thuộc một tập hợp nào đó, chẳng hạn như: chiều cao của thanh niên Việt Nam, tình hình thu nhập và chi tiêu của các hệ gia đình…
Trang 9Để nghiên cứu tập hợp các phần tử theo dấu hiệu nghiên cứu, ta có thể sử dụng phương pháp nghiên cứu toàn bộ, nghĩa là khảo sát dấu hiệu nghiên cứu trên từng phần tử của tập hợp Nhưng phương pháp này gặp nhiều khó khăn.
Vì vậy, trong thực tế, người ta thường áp dụng phương pháp nghiên cứu chọn mẫu Nội dung của phương pháp này là từ tập hợp nghiên cứu, được gọi là tổng thể, chọn ra một số các phần tử, được gọi là mẫu, khảo sát dấu hiệu nghiên cứu trên mẫu, dựa vào
đó mà phân tích, rút ra kết luận cho tổng thể.
Cơ sở khoa học của phương pháp này là lí thuyết xác suất và thống kê toán.
2 Một số phương pháp chọn mẫu chủ yếu:
a) Chọn mẫu ngẫu nhiên, đơn giản: là loại mẫu được chọn trực tiếp từ danh sách đã được đánh số của tổng thể Các phần tử của mẫu được chọn ra từ tổng thể bằng cách rút thăm theo một bảng số ngẫu nhiên.
Phương pháp này có ưu điểm là cho phép thu được một mẫu có tính đại diện cao nếu giữa các phần tử của tổng thể không có gì
là khác biệt nhiều Nếu kết cấu của tổng thể phức tạp thì chọn theo phương pháp này sẽ khó đảm bảo tính đại diện Một nhược điểm nữa là trong trường hợp quy mô của tổng thể khá lớn thì việc đánh số tất cả các phần tử sẽ rất khó khăn.
b) Mẫu hệ thống: là loại mẫu mà chỉ có phần tử đầu tiên được chọn ngẫu nhiên, sau đó dựa trên một quy tắc hay một thủ tục nào đó đề chọn ra các phần tử tiếp theo Chẳng hạn, trên một danh sách gồm N sinh viên, cần chọn ra một mẫu kích thước n, ta chia danh sách thành n phần bằng nhau, ở phần T 1 gồm “N/n” phần tử, chọn ngẫu nhiên ra 1 phần tử, sau đó cứ cách “N/n” phần
tử cho vào mẫu cho đến khi đủ n phần tử.
Nhược điểm của phương pháp này là dễ mắc sai số hệ thống khi các phần tử của tổng thể không được sắp xếp một cách ngẫu nhiên mà theo một trật tự chủ quan nào đó Tuy vậy, do tính đơn giản, mẫu hệ thống thường được dùng ở cấp chọn mẫu cuối cùng và khi tổng thể tương đối thuần nhất.
c) Mẫu phân tổ
Để chọn mẫu phân tổ, trước hết người ta phân chia tổng thể thành các tổ có độ thuần nhất cao để chọn ra các phần tử đại diện cho từng tổ Việc phân tổ có hiệu quả khi tổng thể nghiên cứu không thuần nhất theo dấu hiệu nghiên cứu Sau khi đã phân tổ thì kích thước mẫu được phân bổ cho mỗi tổ theo 1 quy tắc nào đó, chẳng hạn tỉ lệ thuận với kích thước mỗi tổ.
3 Ý nghĩa của mẫu
Trong ngành chọn mẫu, khảo sát không nhiều các đơn vị nghiên cứu nên thường được tiến hành trong thời gian ngắn Dữ liệu được xử lí, phân tích nhanh chóng nên thông tin thu được từ điều tra chọn mẫu có tính thời sự, cập nhật.
Chi phí cho công tác tổ chức nghiên cứu giảm Do đó, nghiên cứu chọn mẫu tiết kiệm được nhân lực, vật lực, tài chính.
Có thể mở rộng nội dung nghiên cứu hoặc đi sâu tìm hiểu mặt nào đó của đối tượng.
Có thể tuyển chọn những điều tra viên tốt: Có trình độ, có kinh nghiệm, có điều kiện tập huấn thì thông tin thu được có tính chính xác cao.
4 Các đặc trưng mẫu
Giả sử (X1, X2, …,Xn) là mẫu ngẫu nhiên sinh ra từ X có EX=µ, DX = 2
a Thống kê
Hàm T = T(X1, X2,…,Xn) được gọi là một thống kê
Ví dụ : T = T(X1, X2,…,Xn) = max {X1, X2,…,Xn} là một thống kê
b Trung bình mẫu (kì vọng mẫu)
Thống kê trung bình mẫu, kí hiệu : X, xác định bởi :
Trên mẫu cụ thể (x1,x2,…,xn), thống kê X nhận giá trị :
Nếu mẫu sắp xếp theo bảng phân phối tần số thì :
Kì vọng mẫu số là một biến ngẫu nhiên có các đặc trưng :
c Phương sai mẫu
Phương sai mẫu, kí hiệu MS xác định bởi :
Với mẫu thực nghiệm được sắp xếp theo tần số, phương sai mẫu nhận giá trị tính theo công thức :
Trang 10Dùng các phép biến đổi, ta được:
Thống kê :
Gọi là phương sai mẫu điều chỉnh
d Độ lệch tiêu chuẩn mẫu
- thống kê được gọi là độ lệch tiêu chuẩn mẫu
- thống kê S = được gọi là độ lệch tiêu chuẩn mẫu điều chỉnh
e Phân bố của X và S2
* Nếu (X1, X2,…, Xn) là mẫu ngẫu nhiên được rút ra từ biến ngẫu nhiên chuẩn N(µ, 2) thì:
n.X cũng có phân phối chuẩn
có phân phối
X có phân phối chuẩn
X và S2 độc lập với nhau và ngược lại
có phân phối student với n-1 bậc tự do
* Nếu (X1, X2,…, Xn) là mẫu từ biến ngẫu nhiên chuẩn N(µ1, 1 2) , còn (Y1, Y2,…, Yn) là mẫu từ biến ngẫu nhiên chuẩn N(µ2, 2 2) độc lập với mẫu trên Khi đó:
Có phân phối student với n + m - 2 bậc tự do, trong đó Sx, Sy là 2 phương sai mẫu tương ứng với mẫu X và mẫu Y
5 Phân phối thực nghiệm và hàm phân phối thực nghiệm
Giả sử mẫu thực nghiệm (x1, x2, …, xn) sinh từ X Ta xây dựng hàm:
Được gọi là hàm phân phối thực nghiệm
6 Định lí Glivenco
Giả sử F(x) là hàm phân phối của biến ngẫu nhiên X mà ta cần tìm Fn(x) là hàm phân phối thực nghiệm nhận được từ mẫu ngẫu nhiên cỡ n sinh ra từ X Khi đó:
Như vậy, hàm phân phối thực nghiệm là 1 xấp xỉ của hàm phân phối lí thuyết Với n cố định, hàm phân phối thực nghiệm cho ta hình ảnh hình học về phân phối lí thuyết cần tìm
Định lí Glivenco là cách tìm dạng của hàm phân phối thực nghiệm