Tóm tắt công thức, kiến thức xác suất thống kê - Công thức tính xác suất - ước lượng khoảng, ước lượng điểm - kiểm định
Trang 1XÁC SUẤT THỐNG KÊ
Trang 2Mục lục
Chương 1: Xác suất và công thức tính xác suất 2
I Quy tắc đếm 2
II Phép thử và biến cố 2
III Định nghĩa xác suất 3
IV Công thức tính xác suất 4
Chương 2: Biến ngẫu nhiên và một số luật phân phối xác suất thông dụng 5
I Biến ngẫu nhiên và luật phân phối xác suất 5
II Tham số đặc trưng của biến ngẫu nhiên 6
III Biến ngẫu nhiên liên tục thông dụng 7
IV Biến ngẫu nhiên rời rạc thông dụng 8
Chương 3: Thống kê và dữ liệu 9
I Tổng thể và mẫu 9
II Các tham số đặc trưng của mẫu 9
Chương 4: Ước lượng tham số 10
I Ước lượng trung bình 11
II Ước lượng tỉ lệ: 11
Chương 5: Kiểm định giả thiết thống kê 11
I Tổng quan về bài toán 11
II Các bài toán liên quan đến tỷ lệ 12
III Một số kiểm định liên quan đến trung bình 13
IV Kiểm định sự độc lập và luật phân phối xác suất 14
Trang 3Chương 1: Xác suất và công thức tính xác suất
I Quy tắc đếm
1 Quy tắc nhân
Một việc nào đó cần thực hiện qua k giai đoạn
Khi đó số cách thực hiện là: n=n1.n2… n k
2 Quy tắc cộng
Thực hiện một công việc nào đó có k trường hợp xảy ra
Khi đó số cách thực hiện công việc là: n=n1+n2+…+n k
3 Chỉnh hợp
Lấy k phần tử từ n phần tử có quan tâm thức tự
A n k= n !
( n−k )!
4 Chỉnh hợp lặp
Chọn k phần tử từ n phần tử, có thể lặp lại, có quan tâm đến thứ tự sắp xếp
B n k=n k
5 Tổ hợp
Lấy k phần tử từ n phần tử không quan tâm đến thứ tự
C n k= n !
(n−k )! k !
6 Hoán vị
Cách sắp xếp có thứ tự gồm đủ mặt n phần tử đã cho
P n=n!
II Phép thử và biến cố
1 Phép thử và biến cố
Phép thử: thực hiện một hoạt động tác động lên đối tượng.
Biến cố: là kết quả nhận được khi thực hiện phép thử.
Trang 47 Phân loại biến cố
Biến cố chắc chắn: luôn xảy ra khi thực hiện phép thử Kí hiệu Ω
Biến cố không thể: không bao giờ xảy ra khi thực hiện phép thử Kí hiệu ∅
Biến cố ngẫu nhiên: có thể xảy ra hoặc không xảy ra Kí hiệu bằng các chữ cái in
hoa,
8 Mối quan hệ giữa các biến cố
a) Biến cố độc lập
Hai biến cố được gọi là độc lập nếu biến cố này xảy ra hay không không ảnh hưởng tới biến cố kia
b) Biến cố xung khắc
Hai biến cố xung khắc nhau nếu biến cố này xảy ra thì biến cố kia không xảy ra và ngược lại
c) Biến cố đối lập
Biến cố không xảy ra của biến cố A được gọi lả biến cố đối của A
{A ´A=∅
A + ´A=1
d) Biến cố tổng
C= A+B
C xảy ra khi A xảy ra hoặc B xảy ra hoặc cả hai
e) Biến cố tích
C= A B
C xảy ra khi A và B đồng thời xảy ra
III Định nghĩa xác suất
1 Xác suất cổ điển
P ( A )= n( A)
số trường hợp thuậnlợicủa A
số trường hợp có thể xảy ra
9 Xác suất theo thống kê
lim
n → ∞
m
n
m số lần xuất hiện của biến số A
Trang 5n số lần thực hiện phép thử
10 Xác suất thống kê theo hình học
P ( A )= Độ đo của miền A
Độ đo của miền Ω
IV Công thức tính xác suất
1 Công thức cộng
P ( A +B)=P ( A )+P (B )−P( A B)
P(A1+A2+…+ A n)=∑
1
n
P( A i)−∑
i< j
P(A i A j)+∑
i< j<k
P(A i A j A k)+…+(−1) n−1 P¿) Khi A1, A2,… , A n là các biến cố xung khắc từng đôi thì
P(A1+A2+…+ A n)=P(A1)+P(A2)+…+P (A n)
11 Công thức nhân
P(A1A2)=P(A1) P (A2∨A1)
P(A1A2… A n)=P(A1) P(A2|A1)… P( A n∨A1A2… A n−1)
Khi A1, A2,… , A n là các biến cố độc lập toàn phần thì
P(A1A2… A n)=P(A1) P (A2)… P( A n)
12 Công thức xác suất toàn phần
Khi A1, A2,… , A n là các biến cố đầy đủ, A là biến cố xảy ra cùng với biến cố A i ta
có
P ( A )=∑
i
n
P(A i) P( A∨A i)
13 Công thức Bayes
Khi A1, A2,… , A n là các biến cố đầy đủ, A là biến cố xảy ra cùng với biến cố A i ta
có
P(A i|A)=P( A i A)
P(A i) P( A∨A i)
∑
i n
P(A i) P( A∨ A i)
Trang 614 Công thức Bernoulli
Giả sử thực hiện n phép thử trong đó chỉ có một trong hai trường hợp xảy ra Biến
cố A xảy ra với xác suất p hoặc không xảy ra với xác suất q = 1 – p Khi đó, xác suất để trong n lần thực hiện phép thử xảy ra k lần là:
P p(n , k )=C n k p k q n−k
Chương 2: Biến ngẫu nhiên và một số luật phân phối xác suất thông dụng
I Biến ngẫu nhiên và luật phân phối xác suất
1 Khái niệm và phân loại biến ngẫu nhiên
a) Khái niệm
Biến ngẫu nhiên là biến nhận các giá trị là các khả năng có thể xảy ra của phép thử ngẫu nhiên
- TXĐ: Ω
- Đại diện cho kết quả của phép thử
- Là biến về số lượng nên luôn có giá trị là số
f) Phân loại
- Biến ngẫu nhiên rời rạc: X(Ω) hữu hạn hoặc vô hạn đếm được, cách quãng nhau
- Biến ngẫu nhiên liên tục: X(Ω) lấp đầy một khoảng hay một số khoảng hay cả trục số
15 Hàm mật độ xác suất
Biểu diễn quan hệ giữa các giá trị của biến ngẫu nhiên với xác suất tương ứng
a) Đối với biến ngẫu nhiên rời rạc
Hàm mật độ xác suất thường được biểu diễn dưới dạng bảng phân phối xác suất:
g) Đối với hàm ngẫu nhiên liên tục
Hàm mật độ xác suất y=f (x )
−∞
+∞
f ( x) dx=1
Trang 7- P (a ≤ X ≤ b )=∫
a
b
f ( x ) dx
- P(X =x0)=0
16 Hàm phân phối xác suất
F ( x )=P( X <x)
Tính chất
P (a ≤ X ≤ b )=F (b )−F (a)
V Tham số đặc trưng của biến ngẫu nhiên
1 Mode: là giá trị của biến ngẫu nhiên mà tại đó nó có nhiều khả năng xảy ra nhất.
Kí hiệu Mod ( X )
- Đối với biến ngẫu nhiên rời rạc: mode là giá trị của biến ngẫu nhiên có xác suất lớn nhất
- Đối với biến ngẫu nhiên liên tục: mode là giá trị làm cho hàm mật độ xác suất đạt giá trị cực đại
17 Kì vọng
- Biến ngẫu nhiên rời rạc: E ( X )=∑
i=1
n
x i p i
- Biến ngẫu nhiên liên tục: E ( X )=∫
−∞
+∞
x f (x )dx
*Tính chất:
- E (C )=C
- E (C X )=C E(X )
- E ( X ± Y )=E ( X ) ± E(Y )
- E ( X Y )=E ( X ) E(Y ) với X, Y độc lập
18 Phương sai
- Biến ngẫu nhiên rời rạc: V ( X )=∑
i=1
n
x i2p i−[E( X )]2
- Biến ngẫu nhiên liên tục: V ( X )=∫
−∞
+∞
x2 f (x)−[E(X )]2
*Tính chất:
Trang 8- V (C)=0
- V (C X )=C2.V ( X)
- V ( X ±Y )=E ( X )+E (Y ) với X , Y độc lập
19 Độ lệch chuẩn
σ =√V (X )
VI Biến ngẫu nhiên liên tục thông dụng
1 Phân phối chuẩn
a) Hàm phân phối
f ( x )= 1
σ√2 π e
−(x− μ)2
2 σ2
h) Tham số đặc trưng
Nếu X N (μ , σ2)
E ( X )=μ
V ( X )=σ2
i) Công thức tính xác suất
P (a ≤ X ≤ b )=φ(b−μ σ )−φ(a−μ σ )
P(¿X −μ∨¿ε)=2 φ(σ ε)
P ( X <x )=0.5+φ(x−μ σ )
P ( X >x )=0.5−φ(x−μ σ )
20 Phân phối chuẩn tắc
- Biến ngẫu nhiên gọi là có phân phối chuẩn tắc nếu nó có phân phối chuẩn với
μ=0 và σ2=1
Trang 9- Phân vị chuẩn: phân vị chuẩn mức xác suất α là giá trị của biến ngẫu nhiên z α
sao cho P(Z <z α)=α
VII Biến ngẫu nhiên rời rạc thông dụng
1 Phân phối nhị thức
a) Khái niệm
Biến ngẫu nhiên rời rạc có tập giá trị X(Ω) = {0,1,…,n,…} với xác suất tương ứng được tính theo công thức Bernoulli được gọi là có phân phối nhị thức.
P ( X=x )=C n x p x q n−x
Kí hiệu: X B(n , p)
j) Các tham số đặc trưng
Trung bình: E ( X )=np
Phương sai: V ( X )=npq
Mode: np−q ≤ mod ( X )≤ np+ p
k) Xấp xỉ phân phối nhị thức
μ=np và σ2
=npq
C n x p x q n− x
= 1
σ√2 π e
−(x−μ)2
2 σ2
21 Phân phối Possion
a) Định nghĩa
Biến ngẫu nhiên được gọi là có phân phối possion với tham số a (a>0) nếu
P ( X=x )= a
x
x ! e
−a
a là mật độ trung bình xảy ra của A trong một khoảng thời gian
l) Các tham số đặc trưng
Trung bình: E ( X )=a
Phương sai: V ( X )=a
Mode: a−1 ≤mod (X )≤ a
Trang 10m) Xấp xỉ phân phối possion
Khi np ≈ npq thì B(n , p)≈ P(a)
22 Phân phối siêu bội
a) Khái niệm
Xét bài toán: Có N bi trong đó có M bi đỏ, ta lấy ra n bi Hỏi xác suất lấy ra được
x bi đỏ.
Ta có công thức
P ( X=x )= C M
x C n− x N− M
C N n
Với cái xác suất tại X =x được tính theo công thức trên thì ta nói X có phân phối siêu bội Kí hiệu X H (N , M , n)
n) Các tham số đặc trưng
Trung bình: E ( X )=np
Phương sai: V ( X )=npq N −n
N −1
Trong đó:
o) Xấp xỉ phân phối siêu bội
- Trong trường hợp n ≤ 0.05 N thì phân phối siêu bội xấp xỉ phân phối nhị thức
- Khi np ≥ 5 và npq ≥ 5 thì phân phối nhị thức xấp xỉ phân phối chuẩn nên trong trường hợp này phân phối siêu bội củng xấp xỉ phân phối chuẩn
Chương 3: Thống kê và dữ liệu
I Tổng thể và mẫu
1 Tổng thể
Tổng thể là một tập hợp các đối tượng cần nghiên cứu, quan sát, thu thập và phân tích theo một số dấu hiệu nào đó
23 Mẫu
Mẫu là một số đơn vị của tổng thể được chọn ra theo một phương pháp nào đó
Trang 11VIII Các tham số đặc trưng của mẫu
1 Mẫu ngẫu nhiên
Trung bình mẫu: X =´ 1
i=1
n
X i
Phương sai mẫu: ^s2=1
i=1
n
(¿(X i− ´X)2)¿
Phương sai mẫu điều chỉnh: s2
= 1
i=1
n
(¿(X i− ´X )2
)¿
24 Mẫu cụ thể
Trung bình mẫu: ´x=1
i=1
n
n i x i
Phương sai mẫu: ^s2=1
i=1
n
(¿n i2x i−´x2)¿
Phương sai mẫu điều chỉnh: s2
= n n−1 s^
2
Chương 4: Ước lượng tham số
- Tìm một giá trị cụ thể θ0 để thay thế cho
giá trị của tham số θ chưa biết của tổng
thể
- ´x là ước lượng gần đúng của μ
- s2 là ước lượng gần đúng của σ2
- f là ước lượng gần đúng của p
- Xây dựng một khoảng giá trị (θ1;θ2) sao cho với một xác suất cho trước tham số θ
của tổng thể rơi vào khoảng (θ1;θ2)
- Một số kí hiệu:
α: mức ý nghĩa
1−α :độ tin cậy
ε : độ chính xác (sai số của ước lượng)
(θ1;θ2)=(θ0−ε ;θ0+ε) trong đó θ0 là ước lượng điểm của tham số θ
Các bước thực hiện ước lượng khoảng:
1 Xác định tham số ước lượng
2 Tính độ chính xác
3 Trả lời
Trang 12I Ước lượng trung bình
Đã biết phương sai
phương sai và
n ≥ 30
Chưa biết phương sai và
n<30
Tính độ
chính xác ε=z1−α
2
σ
√n ε=z1−α
2
s
√n ε=t α2(n−1).
s
√n
IX Ước lượng tỉ lệ:
ε=z
1−α
2
.√f (1−f ) n
Trả lời: (f −ε ; f +ε )
Chương 5: Kiểm định giả thiết thống kê
- Giả thiết thống kê là giả thiết (sự nhận định ban đầu) về: luật phân phối xác suất, các tham số đặc trưng của biến ngẫu nhiên gốc hoặc giả thiết về sự độc lập của các biến ngẫu nhiên
- Giả thiết đưa ra được kí hiệu là H, đối lập với giả thiết là “đối thiết” kí hiệu H ´
- Kiểm định giả thiết thống kê: là dựa trên số liệu thu thập được ⇒ nhận định xem giả thiết H đưa ra có phù hợp không ⇒ từ đó kết luận chấp nhận hay bác bỏ giả thiết (Nếu giả thiết bị bác bỏ thì đối thiết được chấp nhận.)
I Tổng quan về bài toán
1 Các bước thực hiện
1 Xác định loại kiểm định và điều kiện kiểm định cần phải thực hiện để giải quyết bài toán đặt ra
2 Chọn giả thiết và đối thiết thích hợp
3 Thiết lập miền bác bỏ,
4 Tính giá trị quan sát
Trang 135 Trả lời:
- Nếu giá trị quan sát thuộc miền bác bỏ thì bác bỏ giả thiết, chấp nhận đối thiết
- Nếu giá trị quan sát không thuộc miền bác bỏ thì chấp nhận giả thiết, bác bỏ đối thiết
25 Miền bác bỏ:
a) Miền bác bỏ dạng Z
Nếu θ>θ0hoặc θ1>θ2 thì W α=(z 1−α ;+∞)
Nếu θ<θ0hoặc θ1<θ2 thì W α=(−∞;−z 1−α)
Nếu θ ≠ θ0hoặc θ1≠θ2 thì W α=(−∞;−z
1−α 2
)∪(z
1−α 2
;+∞)
p) Miền bác bỏ dạng T với độ tự do n-1 và mức ý nghĩa α
Nếu θ>θ0hoặc θ1>θ2 thì W α=(t α (n−1) ;+∞ )
Nếu θ<θ0hoặc θ1<θ2 thì W α=(−∞;−t α (n−1))
Nếu θ ≠ θ0hoặc θ1≠θ2 thì W α=(−∞;−t α
2
2
X Các bài toán liên quan đến tỷ lệ
1 Kiểm định tỷ lệ
Chọn giả thiết và đối
H : p= p0
´
H : p >p0hoặc
p< p0hoặc p ≠ p0
Dạng Z
z qs=(f − p0)√n
q0=1− p0
Theo nguyên tắc chung của bài toán kiểm định
26 So sánh hai tỷ lệ
Chọn giả thiết và đối
H : p1=p2
´
H : p1>p2hoặc
p1<p2hoặc p1≠ p2
Dạng Z
√f (1−f ) (1
n1+
1
n2)
Theo nguyên tắc chung của bài toán kiểm định
Trong đó f = n1f1+n2f2
n1+n2
Trang 1427 So sánh nhiều tỷ lệ
- Chọn giả thiết và đối thiết:
H: Tỉ lệ mỗi loại trong k tổng thể đúng như nhận định
´
H: Tỉ lệ mỗi loại trong k tổng thể không đúng như nhận định
- Miền bác bỏ:
W α=(χ2α(k −1),+∞)
- Giá trị quan sát:
χ qs2
=∑
i=1
n
(n i− ^n i)2
^
n i
n i là tần số thực tế của loại i được xác định từ mẫu chọn ra.
^
n i là tần số lý thuyết của loại thứ i, n^i=n f i
- Trả lời
XI Một số kiểm định liên quan đến trung bình
1 Kiểm định trung bình
Bước thực hiện Trường hợp 1
Phương sai
V ( X )=σ2 đã biết
Trường hợp 2 Chưa biết phương sai và n ≥ 30
Trường hợp 3 Chưa biết phương sai và n<30
Chọn giả thiết H :μ=μ0
´
H :μ >μ0hoặc μ<μ0hoặc μ ≠ μ0
Giá trị quan sát ( ´x−μ0)√n
σ
( ´x−μ0)√n s
Trả lời Theo nguyên tắc chung của bài toán kiểm định
28 So sánh hai trung bình
Bước thực
hiện Trường hợp 1Đã biết σ x , σ y Trường hợp 2
Chưa biết σ1, σ2
và n x , n y ≥ 30
Trường hợp 3 Chưa biết σ1, σ2 và n x , n y<30
Chọn giả
thiết
H :μ x=μ y
´
H :μ x>μ y hoặc μ x<μ y hoặc μ x ≠ μ y
Bậc tự do (n x+n y−2)
Trang 15s=(n x−1)+(n y−1)sy
n x+n y−2
Giá trị quan
´
x− ´y
√σ x2
n x+
σ2y
n y
z qs= ´x− ´y
√s x2
n x+
s2y
n y
t qs= x− ´y´
s√n1x+
1
n y
Trả lời Theo nguyên tắc chung của bài toán kiểm định
29 So sánh cặp
XII Kiểm định sự độc lập và luật phân phối xác suất
2 Kiểm định sự độc lập
Bước 1: chọn giả thiết, đối thiết
{H : X ,Y phụthuộc´H : X , Y độc lập
Bước 2: thiết lập miền bác bỏ
W α=¿
Bước 3: tính giá trị quan sát
χ qs2=∑
i=1
h
∑
j =1
c (n ij−^n ij)
^
n ij
n ij là tần số thực tế từ mẫu chọn ra
^
n ij là tần số lý thuyết được xác định bằng công thức n^ij=h i c j
n
h i tổng số liệu của hàng thứ i
c j tổng số liệu của cột thứ j