Kiểm định giả thuyết về phương sai của ĐLNN phân phối chuẩn………11... Khái niệm về kiểm định giả thuyết thông kê 1.1 Giả thuyết thống kê Vì không điều tra cả đám đông nên ta không biết dạn
Trang 1TRƯỜNG ĐẠI HỌC THƯƠNG MẠI KHOA HỆ THỐNG THÔNG TIN KINH TẾ
Bài thảo luậnHọc phần: Nguyên lý xác suất thống kêtoán
Trang 2Hà Nội – 2013 MỤC LỤC
trang
I. PHẦN MỞ ĐẦU……….3
II. CƠ SỞ LÝ THUYẾT……….4
1.Khái niệm về kiểm định giả thuyết thống kê……… …4
1.1 Giả thuyết thống kê……… ………
4 1.2 Phương pháp kiểm định một giả thuyết thống kê……… 4
1.2.1 Tiêu chuẩn kiểm định……….5
1.2.2 Miền bác bỏ, quy tắc kiểm định……….5
1.2.3 Các loại sai lầm………
6 1.2.4 Thủ tục kiểm định giả thuyết thông kê……….6
2 Kiểm định giả thuyết về các tham số của ĐLNN……… 6
2.1 Kiểm định giả thuyết về kì vọng toán của một ĐLNN……… 6
2.1.1 ĐLNN X trên đám đông có phân phối chuẩn với σ 2 đã biết……… 7
2.1.2 ĐLNN X trên đám đông có phân phối chuẩn σ 2 chưa biết……… 8
2.1.3 Chưa biết quy luật phân phối xác suất của X nhưng n > 30…… ………9
2.2 So sánh kì vọng toán của hai ĐLNN……… …………9
2.3 X1, X2 cũng có phân phối chuẩn với các phương sai 2 1 σ và 2 2 σ chưa biết và không thể cho rằng chúng bằng………9
Trang 32.4 Kiểm định giả thuyết về tỷ lệ của đám đông………10 2.5 Kiểm định giả thuyết về phương sai của ĐLNN phân phối chuẩn………11
Trang 4I. PHẦN MỞ ĐẦU
Kiểm định giả thuyết thống kê là gì? Tại sao chúng ta phải kiểm định Trong cuộc sống có rất nhiều vấn đề: cần kiểm tra xem điều đó đúng hay sai, nội dung thông tin mà ta nhận được từ các nhà cung cấp có đáng tin cậy hay không? Công việc kiểm tra xem thông tin đưa ra có đáng tin cậy hay không chính là bài toán kiểm định
Trường đại học Thương Mại từ lâu đã nổi tiếng là trường nhiều nữ sinh và cũng là ngôi trường của nhiều hoa hậu, người đẹp của nước ta như Bùi Hà Anh, Nguyễn Thị Loan… Đó là những nữ sinh với chiều cao lý tưởng Nhưng trường ta còn có nhiều bạn gái có chiều cao khiêm tốn Để tìm hiểu chiều cao trung bình của nữ sinh, thì chúng ta sẽ điều tra về chiều cao nữ sinh trường đại học thương mại Theo báo cáo của viện Khoa học Thể dục thể thao năm 2004 chiều cao trung bình của nữ thanh niên Việt Nam là 153.34cm Thông tin này có đáng tin cậy không? Để làm rõ thông tin này đúng hay sai thì chúng ta sẽ làm một bài toán kiểm định
Trang 5II. CƠ SỞ LÝ THUYẾT
1 Khái niệm về kiểm định giả thuyết thông kê
1.1 Giả thuyết thống kê
Vì không điều tra cả đám đông nên ta không biết dạng phân phối xác suất của dấu hiệu cần nghiên cứu X trên đám đông hoặc có thể biết dạng phân phối xác suất của X nhưng chưa biết số đặc trưng θ nào đó của nó Ta có thể đưa ra những nhận xét khác nhau về các yếu tố chưa biết, đó là các giả thuyết thông kê như:
- ĐLNN X phân phối theo quy luật chuẩn
- Tham số θ của X bằng θo
Định nghĩa:
Giả thuyết về dạng phân phối xác suất của ĐLNN, về các tham số đặc trưng của ĐLNN hoặc về tính độc lập của các ĐLNN gọi là giả thuyết thông kê, ký hiệu là H0
Giả thuyết H0 được đưa ra để kiểm định gọi là giả thuyết gốc, giả thuyết trái với giả thuyết gốc gọi là đối thuyết, kí hiệu là H1
H0, H1 lập thành một cặp giả thuyết thống kê và được lựa chọn theo nguyên tắc bác bỏ H0 thì chấp nhận H1 hoặc ngược lại bác bỏ H1 thì chấp nhận H0
Giả thuyết gốc H0: θ = θ0
B.toán 1:
: :
H H
H H
Trang 6- Nguyên tắc chung của việc kiểm định giả thuyết thống kê là sử dụng nguyên lý xác suất nhỏ: “Nếu một biến cố có xác suất khá bé thì trong thực hành ta có thể coi
nó không xảy ra trong một lần thực hiện phép thử”
1.2.1 Tiêu chuẩn kiểm định
Xét một cặp giả thuyết thống kê Ho, H1 Từ đám đông chọn ra 1 mẫu kích thước n:
W = (X1, X2 Xn) Từ mẫu này ta xây dựng thống kê G = f(X1, X2 Xn θn)
Trong đó θ0 là tham số liên quan đến H0, sao cho nếu H0 thì quy luật phân phối xác suất của G hoàn toàn xác định Một thống kê như vậy được gọi là tiêu chuẩn kiểm
định (TCKĐ)
1.2.2 Miền bác bỏ, quy tắc kiểm định
Quy luật phân phối xác suất của G đã biết, α khá bé ta tìm được miền Wα gọi
là miền bác bỏ sao cho : P(G∈
Wα/ H0) = α
Vì α khá bé nên theo nguyên lý xác suất nhỏ ta có biến cố (G∈
Wα/ H0) không xảy ra trong một lần thực hiện phép thử Do đó nếu từ một mẫu cụ thể w = ( x1, x2,
…xn) ta tìm được giá trị thực nghiệm gtn = f( x1, x2, …xn,θ0) mà gtn ∈ Wα thì giả thuyết H0 tỏ ra không đúng, ta có cơ sở bác bỏ H0
Kí hiệu α
W
là miền bù của Wα Vì biến cố (G∈
Wα/ H0) và biến cố (G∈ Wα
/
H0) là hai biến cố đối lập nên
P(G∈Wα
/ H0) = 1 – αVì α khá bé nên (1−α) khá gần 1, do đó theo nguyên lý xác suất lớn: “ Nếu một biến cố có xác suất khá gần 1 thì trong thực hành ta có thể coi nó sẽ xảy ra trong
Trang 7một lần thực hiện phép thử ” Ta có thể coi biến cố (G∈ Wα
/ H0) sẽ xảy ra trong
một lần thực hiện phép thử, nên nếu trong một lần lấy mẫu ta thấy gtn ∈ α
W
thì giả thuyết H0 tỏ ra hợp lí, ta chưa có cơ sở bác bỏ H0
1.2.3 Các loại sai lầm
Sai lầm loại một là bác bỏ H0 khi H0 đúng: P(G∈
Wα/ H0) = α
Sai lầm loại hai là chấp nhận H0 khi H0 sai: P(G∉
Wα/ H1) = β
1.2.4 Thủ tục kiểm định giả thuyết thông kê.
Để kiểm định một giả thuyết thống kê H0 với đối thuyết H1 ta làm như sau:
Trang 8Giả sử dấu hiệu X cần nghiên cứu trên đám đông có E(X) = μ, Var(X) = σ2 , trong đó μ chưa biết Từ một cơ sở nào đó người ta tìm được μ = μ0, nhưng nghi ngờ về điều này Với mức ý nghĩa α cho trước ta cần kiểm định giả thuyết H0: μ =
μ0
Để kiểm định giả thuyết nêu trên, từ đám đông lấy ra một mẫu kích thước n:
W = (X1, X2 Xn) Từ mẫu này ta tính được X =
∑
=
n i
1 1
n i i
Ta lần lượt xét các trường hợp sau:
2.1.1 ĐLNN X trên đám đông có phân phối chuẩn với σ
H H
Trang 9Vì α là khá bé nên theo nguyên lý xác suất nhỏ, biến cố (
H
H
µ µ
µ µ
H
H
µ µ
µ µ
Trang 10H H
n
tαƒ−
sao cho: P(
1 2 /
H
H
µ µ
µ µ
H
H
µ µ
µ µ
: :
1
Trang 11α cho trước, ta tìm được
2 1
2 1
n n
X X
σ
và
2 2
σ
chưa biết và không thể cho rằng chúng bằng.
2 2 1
2 1
2 1
' '
n
S n
S
X X
H H
Trang 12H
µ µ
µ µ
H
H
µ µ
µ µ
2.4 Kiểm định giả thuyết về tỷ lệ của đám đông
Xét một đám đông có tỉ lệ phần tử mang dấu hiệu A là p, trong đó p chưa biết Từ một cơ sở nào đó người ta đặt ra giả thuyết H0: p = p0 Nghi ngờ giả thuyết này với mức ý nghĩa α ta đi kiểm định 3 bài toán sau:
Chọn mẫu kích thước n khá lớn Vì n khá lớn f =
Trang 13p p H
p p H
p p H
p p H
2.5 Kiểm định giả thuyết về phương sai của ĐLNN phân phối chuẩn
Bài toán: ĐLNN X ~ N(μ, σ2) với σ chưa biết Từ cơ sở nào đó người ta đặt giả thuyết H0:
H H
2
2 '
) 1 (
2 2
:
:
o
o o
H
H
σ σ σ σ
Trang 142n− α
2 2
:
:
o
o o
H
H
σ σ
σ σ
1 −
− αn
χ
}
III. PHẦN BÀI TẬP
Đề tài: Với độ tin cậy 95%, hãy ước lượng chiều cao trung bình của nữ sv trường
ĐHTM Theo báo cáo thống kê năm 2010 chiều cao trung bình của nữ thanh niên Việt Nam là 155,4cm Hãy kiểm định giả thuyết cho rằng chiều cao trung bình của
nữ sv trường ĐHTM là cao hơn mức trên
Trang 16Tính toán trên R:
> x<-
c(140,149,150,151,152,153,154,155,156,157,158,159,160,161,162,163,164,165,166,167,169,170)
Trang 18x= 157,8
Phương sai mẫu điều chỉnh: S’2=20,5576
Độ lệch tiêu chuẩn mẫu điều chỉnh: S’=4,533515
Bài giải:
1 Ước lượng chiều cao trung bình của nữ sinh viên ĐHTM
Gọi X là chiều cao của 1 nữ sinh viên trường ĐHTM
X là chiều cao trung bình của 1 nữ sinh viên trường ĐHTM trên mẫu
µ là chiều cao trung bình của 1 nữ sinh viên trường ĐHTM trên đám đông
Vì n = 200 > 30 nên X N(µ, )
XDTK: U =
X n
P(-uα/2 <
X n
µ
σ −
< uα/2) = γ
Trang 19Gọi X là chiều cao của 1 nữ sinh viên trường ĐHTM
X là chiều cao trung bình của 1 nữ sinh viên trường ĐHTM trên mẫu
Trang 20µ là chiều cao trung bình của 1 nữ sinh viên trường ĐHTM trên đám đông.Với mức ý nghĩa α = 0.05 ; Ta đi kiểm định bài toán:
H
H
µ µ
µ µ
µ
σ−
Nếu Ho đúng thì U ≈ N(0,1)
Do γ = 1- α, nên α = 1- 0.95 = 0.05
Với α = 0.05 ta có thể tìm được sao cho : P( U > ) = α
Vi α = 0.05 khá bé nên theo nguyên lý xác suất nhỏ ta có miền bác bỏ :
= { Utn : Utn> } với utn =
0
X n
µ
σ−
Theo bài ra ta có : α = 0.05→ uα = u0.05 = 1.65 (1)
Vì n > 30 nên σ ≈ S’ =4,533515
Trang 21Khi đó: utn =
0
X n
µ
σ−
=
157,8 155, 4 4,533515
Kết luận : Với độ tin cậy 95% hay mức ý nghĩa α =5%; ta có thể cho rằng mức
chiều cao trung bình của các sinh viên trường Đại học Thương Mại cao hơn mức thống kê là 155,4cm
Trang 22=156,5333; s' = 6,576, α = 0,05, μ > μ0 =153,34
Gọi X là chiều cao của nữ công nhân (X: cm)
μ = E(X) là chiều cao trung bình của nữ công nhân trên đám đông
X là chiều cao trung bình của nữ công nhân trên mẫu
Cần kiểm định bài toán:
H
H
µ µ
µ µ
:
) 34 , 153 ( :
1
Vì n=150 > 30 nên: X ≈ (μ, n
2 σ
34 153 533
= 5.94
Trang 23utn
∈
Wα bác bỏ Ho, chấp nhận H1.Kết luận: Với mức ý nghĩa 0,05 ta có thể nói rằng chiều cao của các nữ công nhân công ty vinakorea là cao hơn 153,34cm
đề tài khoa học báo cáo trong hội thảo Hà Nội do Viện Khoa học Thể dục thể thao
tổ chức Theo phân tích của các nhà chuyên môn, hiện tại chiều cao của nữ ở Việt Nam là 1m54 Sau 25 năm chiều cao trung bình của người Việt Nam đã tăng 4,88cm ở nữ Trong tương lai chiều cao trung bình của người Việt Nam có xu hướng tăng nhưng chưa nhanh Tính trung bình mỗi năm chiều cao ở nam tăng 0,24cm, ở nữ là 0,20cm
Trong thực tế người ta sử dụng việc kiểm định giả thuyết để kiểm tra sự đúng sai và so sánh với một chỉ tiêu nhất định Với kích thước mẫu lớn ta có thể dễ dàng kiểm tra Việc kiểm định giả thuyết thống kê về chiều cao giúp ta so sánh được chiều cao trung bình của người Việt Nam với quốc tế Từ đó đưa ra các phương pháp hợp lí giúp cải thiện chiều cao