Nguyễn Thống19 KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH VỚI PHÂN PHỐI Phân phối Student bậc tự do df df tăng Phân phối Student Phân phối chuẩn Phân phối Student được áp dụng thay thế phân
Trang 1PGS TS Nguyễn Thống
1
Khoa Kinh tế & Quản trị Kinh doanh
Giảng viên: PGS TS NGUYỄN THỐNG
E-mail : nguyenthong@hcmut.edu.vn or nthong56@yahoo.fr
NỘI DUNG MÔN HỌC
Chương 1: Thống kê mô tả & Phân phối xác
suất cơ bản (ôn).
Chương 2: Kiểm định giả thuyết thống kê
Chương 3: Hồi quy tuyến tính (HQTT) đơn.
Chương 4: Hồi quy tuyến tính bội.
Chương 5: Hồi quy tuyến tính với biến giả & giả
tuyến tính.
Chương 6: Đánh giá chất lượng hồi quy.
Chương 7: Phân tích chuỗi thời gian.
Chương 8: Giới thiệu phần mềm SPSS áp dụng
cho HQTT & Chuỗi thời gian
Được sử dụng khi phải đưa ra các
kết luận liên quan đến các biến ở
dạng xác suất.
Ví dụ: So sánh 2 giá trị của biến
liên tục Xác suất để 2 biến này BẰNG
1 p(t) e
so với một quy luật xác suất DỰ KIẾN.
• Bước 1 : Thành lập giả thiết H0 và phản giả thiết H1.
• Bước 2 : Đề xuất ngưỡng chấp nhận của kiểm định
• Bước 3 : Chọn lựa tham số thống kê thích hợp cho
Trang 2Dùng phân phối chuẩn
Dùng phân phối Student
Ví dụ Kết quả công bố của cơ quan
quản lý lao động về lương trung bình
theo giờ của các khu công nghiệp là
15000đ/giờ Giả thiết giá trị TB tuân
theo phân phối chuẩn.
Để kiểm định, lấy mẫu ngẫu nhiên 60
người, kết quả tính có X tb =14000đ/giờ,
Độ lệch chuẩn giá trị trung bình của mẫu có kích thước n
Độ lệch chuẩn tập hợp mẹ (hoặc mẫu khảo sát)
Trang 3PGS TS Nguyễn Thống
13
Từ đó:
a=1012,14
Ngồi ra từ số liệu mẫu ta thấy:
Giả thiết H0 được chấp nhận.
Kết luận: Với mức độ rủi ro là 5% (độ tin
cậy 95%) ta cĩ thể kết luận giá trị lương
trung bình là 15000đ/h.
n
* 96 , 1 96 , 1
HCM cơng bố lương TB của cơng
giá trị TB với độ tin cậy 95%.
KINH TẾ LƯỢNG
Chương 2: Kiểm định giả thuyết thống kê
PGS TS Nguyễn Thống
15
cơng bố lương TB của SV ra
trường sau 1 năm là 8Tr./tháng.
Khảo sát 160 SV cho thấy lương
TB là 8.6Tr./tháng và cĩ độ lệch
chuẩn là 3.1Tr./tháng.
Kiểm định sự khác biệt giữa kết
quả cơng bố và khảo sát với mức
9
; 15 X c
5 2
; 5 4 X b
4
; 15 X a
X X X
9 0
; 2 X c
02 0
; 5 0 X b
4 0
; 1 X a
X X X
phụ thuộc khơng những vào
thuộc vào độ lệch chuẩn của nĩ.
Trang 4PGS TS Nguyễn Thống
19
KIỂM ĐỊNH GIÁ TRỊ
TRUNG BÌNH VỚI PHÂN PHỐI
Phân phối
Student bậc
tự do df
df tăng Phân phối Student
Phân phối chuẩn
Phân phối Student được áp dụng
thay thế phân phối chuẩn trong kiểm định giá trị trung bình khi:
Mẫu cĩ kích thước bé (n < 30);
Phân phối mẹ là phân phối
chuẩn nhưng độ lệch chuẩn khơng biết.
Để kiểm định kết quả này, người ta lấy một mẫu ngẫu nhiên n =16 gia đình
là 4000$.
Hãy kiểm định kết quả công bố với độ rũi
ro là =5% (độ tin cậy 95%).
Trang 5Ngồi ra từ số liệu mẫu ta thấy:
Giả thiết H0 được chấp nhận.
Kết luận: Với một độ tin cậy 95% (hay với mức độ
rủi ro là 5%) ta cĩ thể nĩi là thu nhập bình
quân của dân thành phố A là 15000$.
B ài tập 1 : Tương tự bài trên với n=26 và giá trị độ
Bài tập 2 Cơ quan thống kê thành phố
A cho biết thu nhập trung bình của
nhân viên Văn phịng doanh nghiệp
vừa và nhỏ là 3600$/năm.
Để kiểm định kết quả này, người ta lấy
một mẫu ngẫu nhiên n =16 gia đình
300$.
Hãy kiểm định kết quả công bố với độ rũi
ro là =5% (độ tin cậy 95%).
PGS TS Nguyễn Thống
28
KIỂM ĐỊNH GIẢ THIẾT
VỀ SỰ SAI BIỆT CỦA GIÁ TRỊ TRUNG BÌNH VÀ 0
VỚI PHÂN PHỐI STUDENT.
Hãy kiểm định sự sai biệt của giá trị trung bình nói trên và giá trị 0 với độ rũi ro là 5% (độ tin cậy 95%).
Trang 6Kết luận : Với độ tin cậy 95%, giá trị X là
khác 0 theo quan điểm thống kê.
1
H 065 1 5 , 1
kiểm định giá trị TB của 1 biến
(Kiểm định xem gía trị X là KHÁC 0 hay BẰNG 0 theo quan điểm thống kê).
vào:
Bản thân giá trị TB tính ra
Độ lệch chuẩn của biến thống
kê nghiên cứu.
Trang 7PGS TS Nguyễn Thống
37
Ví dụ : Khảo sát một mẫu thống kê có
kích thước n=10, cho thấy giá trị
trung bình là x tb =10 và độ lệch
chuẩn là s=6 Với rũi ro 5%, so sánh
giá trị trung bình nêu trên với 0.
6
* 262 2 262
Bài tập 5: Tương tự bài trên với n=12 và s=15.
VỚI PHÂN PHỐI STUDENT
Trang 8PGS TS Nguyễn Thống
43
ĐẶT VẤN ĐỀ
Trong thực hành, khi nghiên cứu giá
trị trung bình của một biến thống
kê ta cần xem xét sự sai biệt của 2
giá trị này có nghĩa (khác 0) hay
Hãy đánh giá cĩ sự KHÁC nhau về
lương TB của 2 Cơng ty với độ
biệt giữa 2 giá trị trung bình.
H1 : CÓ sự khác biệt giữa 2 giá
trị trung bình.
a X
X1 2
a X
X X
Ước lượng độ lệch chuẩn của tập hợp mẹ:
Độ lệch chuẩn của biến thống kê là hiệu 2 giá trị trung bình, theo lý thuyết thống kê:
2 n n
s ) 1 n ( s ) 1 n (
21
2222112
X
n
1 n
12
Kết luận:
a a
&
: sanh
Trang 9PGS TS Nguyễn Thống
49
Bài tập: Để xác định giá trị ma sát trong
trung bình của một tầng địa chất, người
ta tiến hành lấy mẫu và thí nghiệm hai
lần khác nhau.
Lần 1: n 1 =16 có 1 =22,3 0 và 1 =2 0
Lần 2: n 2 =12 có 2 =24,0 0 và 2 =1.8 0
Hãy kiểm định giả thiết về sự khác biệt
của 2 giá trị trên với độ rũi ro = 5%.
biệt giữa 2 giá trị trung bình.
H1 : CÓ sự khác biệt giữa 2 giá
trị trung bình.
a X
X1 2
a X
X X
Ước lượng độ lệch chuẩn của tập hợp mẹ:
Độ lệch chuẩn của biến thống kê là hiệu 2 giá
trị trung bình, theo lý thuyết thống kê:
68 3
2 n n
s ) 1 n ( s ) 1 n (
21
2222112
n
1 n
1
21X
1 XX
Trang 10PGS TS Nguyễn Thống
55
Đặt vấn đề : Xét một đại lượng là
tổng các giá trị bình phương Mỗi
giá trị bình phương là một biến
thống kế.
Trong một số trường hợp ta cần
kiểm định xem một đại lượng này
BẰNG zero hay KHƠNG theo quan
Hàm mật độ xác suất 2 được sử dụng để
kiểm định các biến thống kê có dạng là
một TỔNG BÌNH PHƯƠNG.
p
20
Dạng hàm mật độ xác suất 2 với bậc tự do df
e(%,df)
H0 2= 0
H1 2> 0 S= = Pr( 2> e)
Ví dụ 1 : Kiểm định sự phù hợp (bài tốn 1D)
Một nhà cung cấp tủ lạnh phân chia vùng kinh
doanh ra làm 4 khu vực Người ta muốn kiểm
tra xem số tủ lạnh bán ra cĩ bằng nhau ở 4 khu
vực này hay khơng.
Để kiểm tra giả thiết này, người ta lấy một mẫu
ngẫu nhiên gồm 40 hồ sơ khách hàng đã mua
KHƠNG cĩ sự khác biệt về doanh số của
4 khu vực (H0)
10 10 (=40/4)
10 10 40
0 e2
i 1,4 e
f f
4 f
Để đánh giá cĩ sự khác biệt hay khơng, ta sẽ
so sánh với giá trị lý thuyết:
• Nếu : : kết luận cĩ sự khác biệt ở các khu A, B, C, D
• Nếu : : kết luận khơng cĩ sự khác biệt ở các khu A, B, C, D
Trong đĩ được xác định từ phân phối
cĩ bậc tự do dl=k-m-1 và ngưỡng rủi ro α (thường là 5%).
(k=4 số khu vực khảo sát, số tham số tính từ
số liệu mẫu khảo sát)
2 e 2
2 e
e2
7 81
,
2 e 2
4
Trang 11PGS TS Nguyễn Thống
61
Bài tập 1 : Một Tổng cơng ty kinh doanh
điện máy tại 5 khu vực Nhằm đánh giá
doanh số của 5 khu người ta lấy ngẫu
nhiên 100 hố đơn trong quá khứ và cĩ
kết quả sau Hãy kiểm định với ngưỡng
rũi ro 5% xem cĩ sự khác nhau doanh thu
giữa các khu Kết luận cĩ nên giảm số
khu vực kinh doanh?
KIỂM ĐỊNH VỚI 2 (bài tốn 2D)
Ví dụ Người ta muốn kiểm tra xem
cĩ liên hệ hay khơng giữa số
người mua sản phẩm & giới
tính Kết quả ghi nhận trình bày
trong bảng sau Kiểm định giả
thiết với độ tin cậy 99% (rũi ro
Số liệu bảng trên cĩ ý nghiã là yếu tố giới tính
và quyết định mua sắm là ĐỘC LẬP nhau
Trang 12PGS TS Nguyễn Thống
67
Bậc tự do (mảng 2D): dl = (r - 1)(k -1) = (2 -1)(2 -1) = 1
Với r, k số phân loại cho mỗi biến xét.
Với = 1% và dl =1, tra từ bảng phân phối 2, ta có:
Kết luận: Với độ tin cậy là 99%, ta có thể kết luận
quyết định mua sắm và giới tính là KHÔNG ĐỘC
LẬP
8 27 f
f f
i e
2eo2
KIỂM ĐỊNH VỚI 2 (bài tốn 2D)
Bài tập 1 Một cửa hàng bán đĩa nhạc
khảo sát 200 khách hàng một cách
ngẫu nhiên để đánh giá xem có sự liên
quan hay không giữa tuổi tác & giới
tính đối với người đi mua nhạc với độ
KIỂM ĐỊNH VỚI 2 (bài tốn 2D)
Hãy kiểm định giả thiết với rũi ro =5%
Thời gian \ Số con nuơi >=3 <3
Hãy kiểm định giả thuyết với rũi ro =5%.
Lương (tr./năm)
Thương mại Dịch vụ Tự do Tổng
Trang 13PGS TS Nguyễn Thống
73
Bài tập 5 Một thăm dò về thu nhập hàng tháng
được thực hiện trên 3 loại đối tượng khác Kiểm
tra xem có sự khác biệt lương trong các lĩnh
Kết luận: Với độ rũi ro =5%, ta có thể nói là
lương nhận được của các đối tượng nghiên
cứu thì độc lập với 3 loại ngành nghề ở trên
e
2eo2
a Xác định số sự cố trung bình ( thông số trong phân phối Poisson) Giá trị này sẽ được dùng để kiểm định giả thiết là số lượng sự cố thì phân bố theo một phân phối Poisson.
c Kiểm định giả thiết là số lượng sự cố xảy ra tuân theo phân phối Poisson với độ rũi ro =5%.
(Xem bảng tra phân phối Poisson ở sau)
Trang 14Số lần quan sát (f0)
b Số lần sự cố lý thuyết được tính từ bảng tra
phân phối Poisson với = 3,2 và n = 40 cho ta:
) h / co _ su ( 2 , 3 40 128 x x
Do đó: ta chấp nhận H0.
Kết luận: Với độ rủi ro = 5%, số lượng sự cố trong 1h, xảy ra trong nhà máy là tuân theo p/phối Poisson có =3,2.
675 , 0
Kiểm định với độ tin cậy 90%.
Trang 15Số lần quan sát (f0)
nạn trung bình X tính trên 1000 người
đàn ông trên một giờ Số liệu này lấy từ
một mẫu gồm 50 Xí nghiệp trên cùng một
ngành.
Từ số liệu tính được giá trị trung bình Xtb=
2,32 và độ lệch chuẩn của tập hợp mẹ ước
lượng từ mẫu là s = 0,42.
Kiểm định giả thiết là phân phối này tuân
theo một phân phối chuẩn với độ rũi ro
Số liệu quan sát được:
Số tai nạn trung bình X (nghìn người/giờ)
Số Xí nghiệp được quan sát
Tính giá trị Xác định số Xí nghiệp lý thuyết từ 50 Xí nghiệp.
Giá trị biến chuẩn tương ứng, t
Xác suất cho từng khoảng(p)
Số Xí nghiệp lý thuyết
1,45 1,75 -2,07 -1,36 0,085 4,5 1,75 2,05 -1,36 -0,64 0,17 8,5 2,05 2,35 -0,64 0,07 0,27 13,5 2,35 2,65 0,07 0,79 0,26 13,0 2,65 2,95 0,79 1,50 0,15 7,0 2,95 3,25 1,50 2,24 0,065 3,5
Trang 16PGS TS Nguyễn Thống
91
(*) giá trị biên lấy chính là giá trị trung bình các biên
ở số liệu ban đầu.
(**) với , s = 0,42 và x=1.45 ta có t=-2.07:
(***) Tra từ bảng phân phối chuẩn.
Ta có:
Ta thấy: : giả thiết H0 được chấp nhận.
Kết luận : Với độ rũi ro =5%, số lượng tai nạn trong
các Xí nghiệp quan trắc (dựa vào số tai nạn trung
bình xảy ra) tuân theo quy luật phân phối chuẩn có
giá trị TB là 2,32 và độ lệch chuẩn s = 0,42.
x 2 32 ,
s x
2 07 1 . 45 0
Bài tập : Để đánh giá chất lượng đề
thi của một mơn học người ta
muốn kiểm định xem điểm kết
quả thi của thí sinh cĩ tuân theo
một phân phối chuẩn? Hãy kiểm
định với độ tin cậy 95% Số liệu
xem sau (giá trị TB & độ lệch
chuẩn ước lượng từ mẫu).
PGS TS Nguyễn Thống
94
KIỂM ĐỊNH THỐNG KÊ CỦA GIÁ TRỊ LÀ TỶ SỐ 2 TỔNG CÁC BÌNH
PHƯƠNG BIẾN THỐNG KÊ
VỚI HÀM PHÂN PHỐI XÁC SUẤT FISHER
(xem bảng tra sau)
KINH TẾ LƯỢNG
Chương 2: Kiểm định giả thuyết thống kê
PGS TS Nguyễn Thống
95
ĐÂY LÀ KIỂM ĐỊNH XEM XÉT GIÁ TRỊ BIẾN F
LÀ TỶ SỐ GIỮA 2 ĐẠI LƯỢNG THỐNG KÊ:
BẬC TỰ DO CỦA A & B
MỖI ĐẠI LƯỢNG THỐNG KÊ LÀ TỔNG CỦA CÁC BÌNH PHƯƠNG CỦA CÁC GIÁ TRỊ THỐNG KÊ.
21
) ( B
) ( A ) , ( F
Trang 17PGS TS Nguyễn Thống
97
Kiểm định giá trị F khác 0 với
phân phối Fisher
0
p
H 0
(đại lượng kiểm tra=0)
H 1 (đại lượng kiểm tra khác 0)
Với mức rũi ro 5%, hãy kiểm định giá trị F
khác 0 hay bằng 0 theo quan điểm thống
Bài tập 2 : Xét đại lượng thống kê F là tỷ số
của hai đại lượng thống kê với mỗi đại
lượng là tổng các giá trị bình phương:
A=50 với bậc tự do là 5 và B cĩ giá trị là
20 với bậc tự do là 8.
Với mức rũi ro 5%, hãy kiểm định giá trị F
so với 0 theo quan điểm thống kê.
Kiểm định giá trị tổng các bình phương của đại lượng thống kê khác 0 dùng kiểm định với phân phối 2.
Kiểm định giá trị là tỷ số của 2 đại lượng là tổng các bình phương của đại lượng thống kê khác 0 dùng kiểm định với phân phối Fisher F test.
Trang 18PGS TS Nguyễn Thống
103
Phân phối Chuẩn
t α=Pr(X>t)
Phân phối Student
t0
0 p
t
Trang 190
p
H 0
(đại lượng kiểm tra=0)
H 1 (đại lượng kiểm tra khác 0)
Trang 20PGS TS Nguyễn Thống
115
DẠNG TỔNG QUÁT PHÂN PHỐI POISSON
(Biến rời rạc)