THỐNG KÊ TOÁN µ trung bình tổng thể.. σ2 phương sai tổng thể.. p tỷ lệ tổng thể.. Xtrung bình mẫu ngẫu nhiên.. S2 phương sai mẫu ngẫu nhiên.. F tỷ lệ mẫu ngẫu nhiên.. xtrung bình mẫu..
Trang 1KHÁI NIỆM CƠ BẢN XÁC SUẤT
Công thức Siêu bội P(X=k) =
−
−−
−
−
−−
−
n N
C C
k n
C pk(1 – p)n–k
Công thức cộng
P(A+B) = P(A) + P(B) – P(A.B)
▪ P(A) = 1 − P(A )
▪ P(A1+A2+…+An) = P(A1)+P(A2)+…+P(An)
(Ai) xung khắc từng đôi
▪ P(A+B+C) = P(A) + P(B) + P(C)
– P(AB) – P(BC) – P(AC)
+ P(ABC)
Ghi nhớ
A B + + = A.B A.B = A +B+
Công thức nhân P(A.B) = P(A).P(B/A) = P(B).P(A/B)
▪ P(A/B) = P(A.B)
P(B) =
P(A).P(B / A) P(B)
▪ P(A/B) = P(A)
P(B) (B = A + … )
▪ P(A1.A2 ) = P(A1).P(A2) (Ai) đ.lập t.phần
▪ P(A.B.C) = P(A).P(B/A).P(C/A.B) Công thức Xác suất đầy đủ
(Ai) đầy đủ và xung khắc từng đôi
i =1
P(B A ).P(A )
i =1
P(B A C).P(A C)
Công thức Bayes (Ai) đầy đủ và xung khắc từng đôi
P(Ai/B) = P(A ).P(B / A )i i
P(B)
ĐẠI LƯỢNG NGẪU NHIÊN HAI CHIỀU
▪ Bảng phân phối theo thành phần X (pi bằng tổng pij theo dòng) ⇒ E(X), Var(X), σX
X x1 xm
p p1 pm
▪ Bảng phân phối theo thành phần Y (qj bằng tổng pij theo cột) ⇒ E(Y), Var(Y), σY
Y y1 yn
q q1 qn
Bảng phân phối đồng thời
Y
X y1 yn
x1 p11 p1n Σ= p1
xm pm1 pmn Σ= pm
Σ= q1 Σ= qn
pij ≥ 0, ΣΣpij = 1
pi > 0, Σpi = 1 qj > 0, Σqj = 1
▪ Bảng phân phối theo X có điều kiện Y=yj (cột j chia cho tổng cột j)
⇒ E(X /yj), Var(X /yj)
X /yj x1 xm
p /yj p1j/qj pmj/qj
▪ Bảng phân phối theo Y có điều kiện X=xi (dòng i chia cho tổng dòng i)
⇒ E(Y /xi), Var(Y /xi)
Y /xi y1 yn
q /xi qi1/pi qin/pi
Hiệp phương sai: đo độ phụ thuộc giữa X, Y
Cov(X, Y) =
i j ij
i 1 j 1
x y p
▪ X, Y độc lập ⇔ pij = pi.qj ∀(i, j)
⇒ Cov(X, Y) = 0
▪ Var(aX ± bY) = a2Var(X) + b2Var(Y)
± 2abCov(X, Y)
Hệ số tương quan: đo mức độ phụ thuộc tuyến tính giữa X và Y
XY ρρρρ =
Cov(X, Y)
σ σ
▪ ρ ≤ 1, XY ρ > 0 ⇒ X, Y đồng biến XY
▪ ρ = 1 ⇔ P(Y = aX+b) = 1 (hầu hết) XY
Trang 2ĐẠI LƯỢNG NGẪU NHIÊN
pi > 0
p1+ p2 + + pn = 1
X x1 x2 xn
p p1 p2 pn
Mod(X) = xo ⇔ P(X = xo) =
x max P(X = x) ⇔ f(xo) =
x max f(x)
E(X) =∑n i i
i=1
x p
E(c) = c E(cX) = cE(X)
E(X + Y) = E(X) + E(Y)
E(X.Y) = E(X).E(Y) X, Y độc lập
Var(X) = E(X2) −−−− [E(X)]2
σ(X)= Var (X )
=
−−−−
Var(c) = 0 Var(cX) = c2Var(X) Var(X ± Y) = Var(X) + Var(Y) X, Y độc lập Phân phối Chuẩn X ~ N(µ, σσ2
) Hàm mật độ: f(x) =
2 x /2 1
e 2
µ σ
−
−−
−
−
−−
−
E(X) = µ Var(X) = σσ2
Mod(X) = µ
0
1
2
−
▪ Φ(–x) = –Φ(x) =NORMSDIST(x)–0,5
▪ x ≥ 4 ⇒ Φ(x) ≈ 0,5
▪ Φ(a) > Φ(b) ⇔ a > b
▪ zα = a ⇔ α = 0,5 – Φ(a)
σ ~ N(0; 1)
▪ P(X < x) = 0,5 + Φ(X − µ
σ )
▪ P(X > x) = 0,5 – Φ(X − µ
▪ P(a < X < b) = Φ(b − µ
a − µ
σ )
▪ P(X – µ< a) = 2Φ(a / σ)
a1N(µ1, σ12) + a2N(µ2, σ22) = N(a1µ1 + a1µ1, a12σ12
+ a22σ22
) Phân phối Nhị thức X ~ B(n, p)
P(X=k) = C p qkn k n-k =BINOMDIST(k; n; p; 0)
P(X ≤ k) =BINOMDIST(k; n; p; 1)
E(X) = np Var(X) = npq
Mod(X) ∈∈∈ [(n+1)p–1, (n+1)p]
▪ n đủ lớn, p không quá gần 0 hay 1:
B(n, p) ≈ N(np, npq)
▪ n đủ lớn, p gần 0:
B(n, p) ≈ P(np)
Tổng các phân phối Nhị thức độc lập:
B(n1, p) + B(n2, p) = B(n1 + n2, p)
Phân phối Poisson X ~ P(λλλλ)
k e
k !
λ λλ λ λλλλ =POISSON(k; λ; 0) P(X ≤ k) =POISSON(k; λ; 1) E(X) = λλλλ Var(X) = λλλλ Mod(X) ∈∈∈ [λλλλ–1, λλλλ]
▪ λ ≥ 10: P(λλλλ) ≈ N(λλλλ; λλλλ) Tổng các phân phối Poisson độc lập:
P(λ1) + P(λ2) = P(λ1 + λ2)
Phân phối Siêu bội X ~ H(N, M, n)
Pk =
−
−
n
N
C C
E(X) = np Var(X) = npq −
−
N n
N 1
Mod(X) = ++++ ++++
(n 1)(M 1)
N 2
▪ n đủ nhỏ so với N: H(N, M, n) ≈ B(n, M/N)
Phân phối Chi bình k bậc tự do χχχχ2
~ χχχχ2
(k) E(χχχχ2
(k)) = k Var(χχχχ2
(k)) = 2k
χ2(k)α =CHIINV(α; k) Phân phối Student k bậc tự do T ~ T(k)
E(T) = 0 Var(T(k) ) = k
k 2−−−−
t(k)α =TINV(2*α; k)
▪ k ≥ 30: χχχχ2
(k) ≈ N(0; 1) T(k) ≈ N(0; 1)
Trang 3THỐNG KÊ TOÁN
µ trung bình tổng thể σ2 phương sai tổng thể p tỷ lệ tổng thể
Xtrung bình mẫu ngẫu nhiên S2 phương sai mẫu ngẫu nhiên F tỷ lệ mẫu ngẫu nhiên
xtrung bình mẫu s2 phương sai mẫu f tỷ lệ mẫu n kích thước mẫu εεεε độ chính xác
zα phân vị mức α của phân phối Chuẩn chuẩn tắc P(Z > zα) = ααα
=NORMSINV(1–α) zα = Φ–1(0,5 – ααα) P(Z > Zα) = ααα ⇒⇒⇒ Zα = zαα/2
tα(n) phân vị mức α của phân phối Student với n bậc tự do P(T > tα) = ααα
=TINV(2*α; n) P(T > Tα) = ααα ⇒⇒⇒ Tα = tα/2α
χχχχ2
α(n) phân vị mức α của phân phối Chi bình với n bậc tự do P(χχχχ2
> χχχχ2
α) = ααα =CHIINV(α; n)
Số liệu dạng điểm không có tần số
n
i
i 1
1
x
n∑==== s2 =
2
2
n 1 ==== n ====
−−−−
−−−− ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑
Số liệu dạng khoảng có tần số
xi = (ai + bi)/2 ⇒ số liệu dạng điểm có tần số
Số liệu dạng điểm có tần số
n = k i
i 1
n
=
==
=
∑ x =
k
i i
i 1
1
n x
n∑= == =
s2 =
2
2
n 1 = = = = n = = = =
−−−−
−−−− ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑
Bảng số liệu hai chiều
Số liệu X theo điểm:
Cộng tần số theo dòng
Số liệu Y theo điểm:
Cộng tần số theo cột
Số liệu X biết Y=yj: Lấy cột j
Số liệu Y biết X=xi: Lấy dòng i
Y
x1 n11 n1h
xk nk1 nkh
Đổi biến
xo: bằng xi có tần số lớn nhất h: tuỳ ý
n = k i
i 1
n
=
==
=
∑ u =
k
i i
i 1
1
n u
n∑== = =
x = xo + h u
s2 =
i i
i 1
h
n 1 = == =
−−−−
−−−− ∑
Khoảng tin cậy của trung bình tổng thể µ
µ∈(x− ε, x+ ε) với độ tin cậy 1–α
n ≥≥≥≥ 30 hoặc n < 30, biết σ2
, tổng thể Chuẩn εεεε = z / 2
n α
σ (σ ≈ s)
n < 30, chưa biết σ2, tổng thể Chuẩn
εεεε = t(n 1) /2 s
n α
−−−−
Khoảng tin cậy của tỷ lệ tổng thể p
p∈(f – ε, f + ε) với độ tin cậy 1–α
εεεε = z / 2 f (1 f )
n α
−−−−
Khoảng tin cậy của phương sai tổng thể
σ2∈(a, b) với độ tin cậy 1–α
Chưa biết µ
a =
2 2
/ 2
(n 1)s (n 1)α
−−−−
2 2
1 / 2
(n 1)s (n 1)−α
−−−−
χχ −−
Biết µ
a =
(((( ))))2 1
2 2
n i i
/
x (n)
=
==
=
α
− µ χχχχ
∑
b =
(((( ))))2 1
2
2
n i i
1 /
x (n)
=
==
=
−α
− µ χχχχ
∑
Trang 4Độ tin cậy 1–α ⇔ mức ý nghĩa α
Giá trị kiểm định: z, t, χ2
Loại kiểm định Giá trị kiểm định
Bác bỏ
Ho
Ho: µ = µo
H1: µ ≠ µo
n ≥ 30 hay n < 30, biết σ2, Chuẩn: zαα/2
n < 30, chưa biết σ2, Chuẩn: t(n–1)αα/2 |KĐ| > TH
Ho: µ = µo
H1: µ > µo
n ≥ 30 hay n < 30, biết σ2, Chuẩn: zα α
n < 30, chưa biết σ2, Chuẩn: t(n–1)α KĐ > TH
Ho: µ = µo
H1: µ < µo
o x / n
− µ
n ≥ 30 hay n < 30, biết σ2, Chuẩn: –zα α
n < 30, chưa biết σ2, Chuẩn: –t(n–1)α KĐ < TH
Ho: p = po
Ho: p = po
Ho: p = po
H1: p < po
−−−−
−−−−
o
p (1 p ) / n
Ho: σ2 = σo2
(n–1)1–ααα/2 và χχχχ2
(n–1)αα/2
KĐ > THL hoặc
KĐ < THN
Ho: σ2 = σo2
H1: σ2 > σo2
χχχχ2
Ho: σ2 = σo2
H1: σ2 < σo2
2 2 o
(n 1)s−−−−
σ
χχχχ2
BẢNG KÊ SỐ
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2
0
1
2
−
2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233