NGUYÊN LÝ THỐNG KÊ KINH TẾ Phan Ngọc Bảo Anh Khoa Kế toán – Tài chính – Ngân hàng Email: pnbanh.tdu@gmail.com HỌC PHẦN Phan Ngọc Bảo Anh Khoa Kế toán – Tài chính Ngân hàng Email: pnbanh
Trang 1NGUYÊN LÝ THỐNG KÊ KINH TẾ
Phan Ngọc Bảo Anh Khoa Kế toán – Tài chính – Ngân hàng Email: pnbanh.tdu@gmail.com HỌC PHẦN
Phan Ngọc Bảo Anh Khoa Kế toán – Tài chính Ngân hàng Email: pnbanh.tdu@gmail.com
Chương 4
PHÂN PHỐI CHUẨN
– PHÂN PHỐI MẪU
NỘI DUNG CHƯƠNG 4
PHÂN PHỐI MẪU
PHÂN PHỐI CỦA MỘT VÀI ĐẠI LƯỢNG THỐNG KÊ
BIẾN NGẪU NHIÊN
PHÂN PHỐI CHUẨN – PHÂN PHỐI CHUẨN CHUẨN HÓA
Trang 2BIẾN NGẪU NHIÊN
Biến ngẫu nhiên là đại lượng lấy giá trị thực tùy thuộc
vào kết quả ngẫu nhiên của phép thử
Các chữ in X, Y,… thường dùng để ký hiệu các biến ngẫu
nhiên và Xi, Yi, để chỉ các trị số của chúng
Biến ngẫu nhiên
Biến ngẫu nhiên
rời rạc Biến ngẫu nhiên liên tục
BIẾN NGẪU NHIÊN
Biến ngẫu nhiên được chia thành hai loại:
Biến ngẫu nhiên gọi là rời rạc nếu tập hợp trị số
mà nó có thể lấy là hữu hạn hoặc liệt kê được: số sản
phẩm không đạt tiêu chuẩn kỹ thuật trong một đợt
sản xuất, số chấm xuất hiện khi gieo con xúc xắc,…
Biến ngẫu nhiên liên tục là loại mà trị số của nó có
thể lấy đầy một khoảng nào đó
PHÂN PHỐI XÁC SUẤT Bất kỳ một hình thức nào đó cho biết mối quan hệ giữa
các giá trị có thể có của biến ngẫu nhiên và xác suất
tương ứng được gọi là phân phối xác suất của biến
ngẫu nhiên đó
Để biết được phân phối xác suất của biến ngẫu nhiên X:
Các giá trị có thể có của biến X
Xác suất để nó nhận mỗi giá trị có thể có
Lưu ý: Xác suất tổng bằng 1
Trang 3BNN rời rạc X nhận các giá trị 𝑥1, 𝑥2,…, 𝑥𝑛
Phân phối xác suất của BNN rời rạc có hình thức tổng quát
nhƣ sau: (Bảng phân phối xác suất)
Gọi X là biến ngẫu nhiên liên tục, khi đó phân phối xác
suất của X là một hàm 𝑓(𝑥) sao cho với hai giá trị bất kỳ
dx x f b X a
Trang 4 Phân phối nhị thức
Phân phối Poisson
Phân phối siêu bội
Phân phối chuẩn
Phân phối Chi bình phương (𝜒2)
Phân phối t (phân phối t Student)
Phân phối Fisher – Snedecor (phân phối F)
Phân phối chuẩn là phân phối của biến ngẫu nhiên liên tục
Một biến ngẫu nhiên liên tục X được gọi là có phân phối
chuẩn nếu hàm mật độ xác suất có dạng:
2 2
2 ) (
2
1 )
1/ Phân phối chuẩn đối xứng, có dạng hình chuông
2/ Trung bình = Trung vị = Mode
Trang 5PHÂN PHỐI CHUẨN Tính chất
Xấp xỉ 68% giá trị nằm trong khoảng ± 1σ so với μ
Xấp xỉ 95% giá trị nằm trong khoảng ± 2σ so với μ
Xấp xỉ 99,73% giá trị nằm trong khoảng ± 3σ so với μ
𝑥 𝑓(𝑥)
Trang 6PHÂN PHỐI CHUẨN
c
𝑓(𝑥)
𝑥
? ) ( c X d
P
d
PHÂN PHỐI CHUẨN CHUẨN HÓA
Phân phối chuẩn chuẩn hóa là một phân phối chuẩn có
trung bình () bằng 0 và phương sai (2) bằng 1
Một biến chuẩn chuẩn hóa
Xét biến ngẫu nhiên X ~ N (,2) Ta có thể chuẩn hóa X
bằng cách:
σ
Khi đó E(Z) = 0 và Var(Z) = 1 Ta nói Z có phân phối
chuẩn hóa Ký hiệu X ~ N(0,12)
PHÂN PHỐI CHUẨN CHUẨN HÓA
Phân phối chuẩn chuẩn hóa là một phân phối chuẩn có
trung bình () bằng 0 và phương sai (2) bằng 1
Trang 7
5,02
đƣợc gọi là hàm tích phân Laplace
PHÂN PHỐI CHUẨN CHUẨN HÓA
Hoặc trong Excel dùng hàm (NORMSDIST(Z) – 0,5)
BẢNG PHÂN PHỐI CHUẨN CHUẨN HÓA
Xác suất
Trang 8PHÂN PHỐI CHUẨN CHUẨN HÓA
Trang 9Ví dụ:
Trọng lượng của một loại sản phẩm là X có phân phối
chuẩn với μ = 8,6g, σ2 = 0,36 Lấy một sản phẩm bất kỳ:
a Tính xác suất để SP ấy có trọng lượng từ 8g đến 9,8g
b Tính xác suất để SP ấy có trọng lượng nhỏ hơn 7,8g
PHÂN PHỐI CHUẨN
Một vài giá trị đặc biệt:
PHÂN PHỐI CHUẨN
PHÂN PHỐI CỦA MỘT VÀI ĐẠI LƯỢNG THỐNG KÊ
1 Phân phối Chi bình phương
Giả sử x1, x2, xn là các biến ngẫu nhiên độc lập, cùng có phân
phối chuẩn N (0,1) Khi đó 𝜒2= (𝑛 − 1)𝑆𝜎22 trong đó
phối chuẩn
𝝌𝒏−𝟏;𝜶 𝟐 là một số sao cho 𝑝(𝜒2> 𝜒𝑛−1;𝛼 2 ) = 𝛼
Muốn tìm giá trị này ta có thể tra bảng hoặc trong Excel dùng
Trang 101 Phân phối Chi bình phương
Phân phối Chi bình phương có thể được sử dụng để:
- Kiểm định tính độc lập của hai biến
- So sánh sự phù hợp giữa các tần số quan sát và tần số lý
thuyết
- Suy rộng cho phương sai tổng thể
PHÂN PHỐI CỦA MỘT VÀI ĐẠI LƯỢNG THỐNG KÊ
2 Phân phối t (phân phối t Student)
Giả sử x1, x2, xn là biến ngẫu nhiên, cùng có phân phối
chuẩn Khi đó 𝑡 =𝑥 −𝜇
𝑆 𝑛 có phân phối Student bậc tự do (n-1)
Ký hiệu: 𝑡 =𝑆𝑥 −𝜇𝑛~𝑡𝑛−1
Phân phối t là phân phối xác suất có hình dáng gần giống với
phân phối chuẩn với hai đuôi dài hơn Khi n càng lớn thì phân
phối t sẽ tiến rất nhanh về phân phối chuẩn
t n-1; là một số sao cho P(t > tn-1;) =
Muốn tìm giá trị này ta có thể tra bảng hoặc trong Excel dùng
hàm TINV(2,df) Trong đó, df là bậc tự do
PHÂN PHỐI CỦA MỘT VÀI ĐẠI LƯỢNG THỐNG KÊ
3 Phân phối Fisher (F)
- Giả sử có hai mẫu độc lập có nx, ny quan sát lấy từ hai tổng thể
có phân phối chuẩn, phương sai tổng thể và phương sai mẫu lần
lượt là x , y , Sx , Sy thì khi đó 𝐹 =𝑆𝑋2/𝜎𝑋2
𝑆𝑌2 /𝜎𝑌2 có phân phối Fisher bậc tự do của tử (nx - 1) và bậc tự do của mẫu (ny - 1)
Ký hiệu: F ~ Fv1,v2
- F v1,v2; là một số sao cho p(F > Fv1;v2;) =
- Muốn tìm giá trị này ta có thể tra bảng hoặc trong Excel dùng
hàm FINV(,df1,df2) Trong đó, df1,df2 là bậc tự do
PHÂN PHỐI CỦA MỘT VÀI ĐẠI LƯỢNG THỐNG KÊ
Trang 11Tổng thể: toàn bộ các đơn vị thuộc đối tượng điều tra
Mẫu: một số đơn vị nhất định được chọn ra từ tổng thể để
tiến hành điều tra thực tế
MỐI LIÊN HỆ GIỮA TỔNG THỂ VÀ MẪU
𝑋𝑖− 𝜇 2𝑁
PHÂN PHỐI MẪU
Định lý giới hạn trung tâm
Định lý: Khi cỡ mẫu n đủ lớn thì phân phối của
trung bình mẫu 𝑥 sẽ xấp xỉ phân phối chuẩn, bất
chấp hình dáng phân phối của tổng thể
Định lý: Một biến ngẫu nhiên là tổng của nhiều biến
ngẫu nhiên khác sẽ có phân phối xấp xỉ phân phối
chuẩn
Một vài tính chất của phân phối mẫu
- Nếu X có phân phối 2
m thì 𝑛𝑥 cũng có phân phối 2
nm
- Nếu X có phân phối chuẩn N(µ, 2) thì:
1/ 𝑛𝑥 cũng có phân phối chuẩn N(nµ, n2) và
𝑥 ~ N(µ, 2/n)
2/ Với kích thước mẫu khá lớn (n30), thì phân phối của
trung bình mẫu sẽ xấp xỉ phân phối chuẩn và 𝑧 =𝜎𝑥 −𝜇
Trang 12Phan Ngọc Bảo Anh Khoa Kế toán – Tài chính Ngân hàng Email: pnbanh.tdu@gmail.com
tiến hành điều tra thực tế
MỐI LIÊN HỆ GIỮA TỔNG THỂ VÀ MẪU
𝑋𝑖− 𝜇 2𝑁
Trang 13Ước lượng là phỏng đoán một giá trị chưa biết của tổng
thể dựa vào quan sát trên mẫu lấy ra từ tổng thể đó
Trung bình, tỷ lệ và phương sai mẫu (hiệu chỉnh) lần lượt
là những ước lượng điểm (ước lượng không chệch) của
trung bình, tỷ lệ, phương sai của tổng thể
Mục đích: Dựa vào dữ liệu mẫu, với độ tin cậy cho
trước, xác định khoảng giá trị mà đặc trưng của tổng thể
có thể rơi vào
ƯỚC LƯỢNG KHOẢNG TIN CẬY
Kết quả của ước lượng điểm là một giá trị cụ thể
Không thể hiện tính chính xác của ước lượng
ƯỚC LƯỢNG KHOẢNG
Trang 14Gọi là đặc trưng của tổng thể cần ước lượng
Giả sử dựa vào mẫu quan sát, ta tìm được hai biến ngẫu
nhiên A và B sao cho:
P(A < < B) = 1 -
Giả sử a, b là giá trị cụ thể của A, B
Khoảng (a,b) được gọi là khoảng ước lượng với độ tin
4 Ước lượng chênh lệch giữa hai trung bình tổng thể
5 Ước lượng chênh lệch giữa hai tỷ lệ tổng thể
6 Ước lượng kích thước cỡ mẫu
ƯỚC LƯỢNG KHOẢNG TIN CẬY
1 ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO
x n1/2
Chưa biết 2
Trang 15+ 𝑝 là tỷ lệ các quan sát có tính chất A nào đó của mẫu
+ Khoảng tin cậy (1-).100 (%) của tỷ lệ p các quan sát
có tính chất A của tổng thể đƣợc xác định bởi:
𝑝 − 𝑧𝛼 2 𝑝 1 − 𝑝
𝑛 < 𝑝 < 𝑝 + 𝑧𝛼 2
𝑝 1 − 𝑝 𝑛
p p
z
p (1 ) (1 )
^
^ 2 /
) 1 (
f f z
Trang 16Phân phối chuẩn: là phân phối có dạng hình chuông và đối
xứng qua trung bình 𝜇
Phân phối chuẩn đơn giản: đối xứng qua trung bình 𝜇 = 0
Ý nghĩa của bảng phân phối chuẩn đơn giản: Giá trị 𝜑(𝑍)
cho biết xác suất để biến Z nằm trong khoảng (0,Z)
ƢỚC LƢỢNG KHOẢNG TIN CẬY
Trang 17ƯỚC LƯỢNG KHOẢNG TIN CẬY
ngẫu nhiên 15 bao và tính được trọng lượng trung
bình 39,8kg Tìm khoảng tin cậy 99% của trọng
lượng trung bình các bao bột mì
Giả sử trọng lượng bao bột mì có phân phối chuẩn
và phương sai là 0,144
Ví dụ 1:
Trang 18Gọi là trọng lượng trung bình một bao bột mì
Ta có: n = 15 𝑥 = 39,8 2 = 0,144
(1-) = 99% => = 1% => Z/2 = Z0,5% = 2,575
15144,0575,28,3915
144,0575
z
KL: Với khoảng tin cậy 99%, trọng lượng trung bình của
mỗi bao bột mì được ước lượng trong khoảng từ 39,55 kg
đến 40,05 kg
Ví dụ 1:
Ví dụ 2:
Một công ty điện thoại muốn ước lượng thời gian trung
bình của một cuộc điện thoại đường dài vào ngày cuối
tuần Mẫu ngẫu nhiên 20 cuộc gọi đường dài vào ngày
cuối tuần cho thấy thời gian trung bình là 14,8 phút, độ
lệch chuẩn 5,6 phút Hãy ước lượng thời gian trung
bình của một cuộc gọi đường dài vào ngày cuối tuần,
với độ tin cậy 95%
Gọi là thời gian trung bình của một cuộc gọi đường dài
vào ngày cuối tuần
Ta có: n = 20 𝑥 = 14,8 S = 5,6
(1-) = 95% => = 5% => tn-1, /2 = t19; 0,025 = 2,093
20 6 , 5 093 , 2 8 , 14 20
KL: Với độ tin cậy 95%, thời gian trung bình của một cuộc
điện đàm đường dài vào cuối tuần được ước lượng trong
khoảng từ 12,1792 đến 17,4208 phút
n
stxn
st
x 1 / 2 1 / 2
Ví dụ 2:
Trang 19Ví dụ 3:
Một nghiên cứu được thực hiện nhằm ước lượng thị
phần của sản phẩm nội địa đối với mặt hàng bánh
kẹo Kết quả điều tra chọn mẫu ngẫu nhiên 100
khách hàng cho thấy có 34 người dùng sản phẩm
nội địa Tìm khoảng tin cậy 95% cho tỷ lệ khách
hàng sử dụng bánh kẹo nội địa
Gọi p là thị phần của sản phẩm nội địa đối với mặt hàng
bánh kẹo
Ta có: n = 100 𝑝 = 34/100 = 0,34
(1-) = 95% => = 5% => Z/2 = Z0,025 = 1,96
100)34,01(34,096,134,0p100
)34,01
KL: Với khoảng tin cậy 95%, tỷ lệ khách hàng sử dụng bánh
kẹo nội địa nằm trong khoảng từ 24,72% đến 43,28%
Ví dụ 3:
3 ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO
PHƯƠNG SAI TỔNG THỂ (𝝈𝟐)
Chọn một mẫu ngẫu nhiên n quan sát có phân phối
chuẩn, với độ tin cậy (1 - α) ta có ước lượng phương sai:
2 2 / 1
; 1
2 2
S n S
n
Với 𝜒𝑛−12 có phân phối 𝜒2 với n – 1 bậc tự do
Trang 20Ví dụ 4:
Một nhà sản xuất quan tâm đến biến thiên của tỷ lệ
tạp chất trong một loại hương liệu được cung cấp
Chọn ngẫu nhiên 15 mẫu hương liệu cho thấy độ
lệch chuẩn về tỷ lệ tạp chất là 2,36% Với khoảng
tin cậy 95%, hãy ước lượng độ lệch chuẩn về tỷ lệ
tạp chất trong loại hương liệu đó?
3 ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO
; 14 2
2 / 1
,
26
36,2
4 ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO
KHÁC BIỆT GIỮA TRUNG BÌNH HAI TỔNG THỂ
4.1 Ước lượng khoảng tin cậy dựa trên sự phối hợp
từng cặp (Mẫu phối hợp từng cặp)
4.2 Ước lượng khoảng tin cậy dựa vào mẫu độc lập
Trang 214 ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO
KHÁC BIỆT GIỮA TRUNG BÌNH HAI TỔNG THỂ
4.1 Ước lượng khoảng tin cậy dựa trên sự phối hợp từng
cặp (Mẫu phối hợp từng cặp)
- So sánh giữa “trước” và “sau”
- So sánh giữa các đơn vị về một đặc điểm nào đó
- So sánh giữa các đơn vị phối hợp từng cặp theo không gian
- So sánh giữa các đơn vị phối hợp từng cặp theo thời gian
4.1 Ước lượng KTC dựa trên sự phối hợp từng cặp
Giả sử ta có mẫu n cặp quan sát từ hai tổng thể X, Y
+ Gọi x, y là trung bình của X, Y
+ 𝑑 là trung bình của n sự khác biệt di (di = xi-yi)
+ Sd là độ lệch chuẩn của n sự khác biệt di (di = xi-yi)
Giả sử rằng d i có phân phối chuẩn Công thức xác định
khoảng tin cậy (1-).100 (%) của (x - y) như sau:
n
s t d n
s t
n y x d
n1 , / 2 1 / 2
n
y x n
d
d
n
i i i n
1.1
)(
2 2
1 2
n
d d
n i i n
i i
Trong đó,
;
Ví dụ 5:
Công ty điện lực thực hiện các biện pháp khuyến khích tiết
kiệm điện Lượng điện tiêu thụ ghi nhận ở 12 hộ gia đình
trước và sau khi có biện pháp khuyến khích tiết kiệm điện
Với độ tin cậy 95%, hãy ước lượng khoảng chênh lệch về
lượng điện tiêu thụ trung bình của các hộ gia đình trước và
sau khi thực hiện biện pháp khuyến khích tiết kiệm điện? Giả
sử rằng các khác biệt giữa lượng điện trước và sau khi
khuyến khích tiết kiệm có phân phối chuẩn
4.1 Ước lượng KTC dựa trên sự phối hợp từng cặp
Trang 22khuyến khích tiết kiệm (Kwh)
Gọi µ x , µ y là lượng điện tiêu thụ trung bình của hộ gia đình trước
và sau khi thực hiện biện pháp khuyến khích tiết kiệm điện
st
2 / 1 y x d 2
KL: Khoảng tin cậy 95% của sự khác biệt giữa lượng điện tiêu thụ
trước và sau khi khuyến khích tiết kiệm được ước lượng từ -0,0682
đến 6,9016 (Kwh)
4848 , 5 1 12 9167 , 330 1 )
i d
Trang 234.2 Ước lượng KTC dựa vào mẫu độc lập
Chọn hai mẫu ngẫu nhiên độc lập gồm:
+ trung bình mẫu 𝑦 + phương sai mẫu là S2
x y
x
n n z y x
2 2 2 /
x
n S n S z y x
2 2 2 /
y y x x n y
x
n S n
S t y
y x n
n y
x
n n S t
Một công ty đang muốn xem xét thời gian sản xuất của hai
dây chuyên sản xuất mới và cũ
- Ở dây chuyền mới: 40 sản phẩm được sản xuất với thời
gian trung bình 46,5 phút/ sản phẩm, độ lệch chuẩn là 8
phút
- Ở dây chuyền cũ: 38 sản phẩm được sản xuất với thời
gian trung bình là 51,2 phút/sản phẩm, độ lệch chuẩn là
9,5 phút
Hãy ước lượng khoảng tin cậy 95% cho sự khác biệt về
thời gian sản xuất giữa hai dây chuyền
4.2 Ước lượng KTC dựa vào mẫu độc lập
Trang 24Trường hợp này chưa biết phương sai tổng thể nên ta thay bằng
phương sai mẫu Hai phương sai mẫu khác nhau và n x ,n y >30
nên ta áp dụng công thức:
y y x x y
x y y x
x
n S n
S z y x n
S n
2 / 2
KL: Với độ tin cậy 95%, ta ước lượng dây chuyền sản xuất mới
rút ngắn thời gian trung bình sản xuất một sản phẩm trong khoảng
x
y
x
n p p n p p z p p
^
^
Ví dụ 7:
Kết quả điều tra từ mẫu ngẫu nhiên 1000 người ở mỗi
thành phố X và Y năm 2010 cho thấy tỷ lệ thất nghiệp ở
thành phố X là 7,5%; ở thành phố Y là 7,2% Hãy ước
lượng khoảng tin cậy 99% cho sự khác biệt về tỷ lệ thất
nghiệp giữa hai thành phố trên?
5 ƯỚC LƯỢNG KTC CHO SỰ KHÁC BIỆT
GIỮA HAI TỶ LỆ TỔNG THỂ (trường hợp n40)
Trang 25y
x
n p p n p p z p p
^
^
-0,027 < px – py < 0,033
Vậy, với độ tin cậy 99%, có thể nói rằng tỷ lệ thất nghiệp ở thành
phố X từ thấp hơn 2,7% đến cao hơn 3,3% so với thành phố Y
Ví dụ 7:
Phan Ngọc Bảo Anh Khoa Kế toán – Tài chính Ngân hàng Email: pnbanh.tdu@gmail.com
Chương 6
KIỂM ĐỊNH GIẢ THUYẾT
1 Công ty Coca – Cola muốn đánh giá xem thị phần hiện tại
có được cải thiện so với trước khi áp dụng các biện pháp
khuyến mãi hay không, biết rằng trước khi áp dụng, thị phần
của công ty là 32%
2 BGĐ Công ty Unilever muốn tìm hiểu sở thích của khách
hàng về màu sắc, công dụng của nhãn hàng Clear có giống
nhau không hay sản phẩm nào sẽ được người tiêu dùng yêu
thích hơn?
3 Công ty Vật tư kỹ thuật nông nghiệp Cần Thơ muốn biết
năng suất của cùng một loại cây trồng sử dụng và không sử
dụng thuốc dưỡng Tilt-Super có khác nhau không?
KIỂM ĐỊNH GIẢ THUYẾT
Trang 262 Tỷ lệ
2 Phương sai
Trung bình
Tỷ lệ Phương sai
Kiểm định giả thuyết là gì?
Kiểm định giả thuyết là dựa vào các thông tin mẫu để đưa
ra kết luận – bác bỏ hay chấp nhận - về các giả thuyết của
tổng thể
CÁC KHÁI NIỆM CƠ BẢN
Giả thuyết là gì?
Giả thuyết là một giả định, một niềm tin, hay một tuyên bố
nào đó (mang tính chủ quan) về các tham số của tổng thể
Trang 27Các loại giả thuyết trong thống kê
Giả thuyết H 0 (Null hypothesis): là giả thuyết về giá trị
của tham số tổng thể mà ta cần đƣợc kiểm định
Giả thuyết H0 đƣợc xem nhƣ “đúng” cho đến khi có những
chứng cứ để có thể kết luận nó “sai”
Giả thuyết H 1 (Alternative hypothesis): là giả thuyết đối
lập của giả thuyết H0
- Nếu H0 đúng thì H1 sai và ngƣợc lại
- H0 đƣợc kiểm định dựa trên cơ sở “đối chứng” H1
GIẢ THUYẾT THỐNG KÊ
MỘT SỐ NGUYÊN TẮC LIÊN QUAN
ĐẾN VIỆC ĐẶT GIẢ THUYẾT
- Mô tả tình trạng ngƣợc lại với H0, thể hiện các nghi ngờ
mà ta đang muốn chứng minh trong bài toán kiểm định
(dựa trên thông tin mẫu)
- H1 không chứa dấu “=” (có thể là >, <, ≠)
Tùy theo dạng của các giả thuyết, ta có:
- Kiểm định hai phía (KĐ dạng hai đuôi): (two-tailed)
0 1
0 0
- Kiểm định một phía (KĐ dạng một đuôi): (one-tailed)
Một đuôi phải
Một đuôi trái
CÁC DẠNG KIỂM ĐỊNH
hoặc hoặc
Trang 28Các loại sai lầm trong kiểm định giả thuyết
(1) Sai lầm loại 1: H0 đúng nhưng qua kiểm định kết luận giả
thuyết sai, và do vậy bác bỏ H0 ở mức ý nghĩa nào đó
(2) Sai lầm loại 2: H0 sai nhưng qua kiểm định kết luận giả
thuyết đúng, và do vậy chấp nhận H0 ở mức ý nghĩa nào đó
Sai lầm loại 1
Xác suất quyết dịnh đúng (1-β)
SAI LẦM LOẠI 1 & 2
α : mức ý nghĩa (1-α : độ tin cậy) ; 1-β : độ giá trị
Xác suất xảy ra sai lầm loại I được ký hiệu là
P (Bác bỏ H0 | H0 đúng) =
: gọi là mức ý nghĩa (the level of significance)
SAI LẦM LOẠI 1 & 2
Đặt giả thuyết và phân tích 2 loại sai lầm
1 Công ty Coca – Cola muốn đánh giá xem thị phần
hiện tại có được cải thiện so với trước khi áp dụng các
biện pháp khuyến mãi hay không, biết rằng trước khi áp
dụng, thị phần của công ty là 32%
2 Một công ty dược phẩm đang tiến hành thử nghiệm để
đưa ra thị trường một loại thuốc A trị bệnh Sida
GIẢ THUYẾT THỐNG KÊ