Ước lượng các tham số của ĐLNN Xét một ĐLNN X thể hiện trên một đám đông nào đó.. Kiểm định giả thuyết thống kê1.Một số khái niệm và định nghĩa 1.1 Giả thuyết thống kê Giả thuyết về quy
Trang 1TRƯỜNG ĐẠI HỌC THƯƠNG MẠI
BÀI THẢO LUẬN NHÓM
Học phần: LÝ THUYẾT XÁC SUẤT VÀ
THỐNG KÊ TOÁN
suất thống kê toán của sinh viên Trường Đại học Thương mại
Nhóm: 9
Lớp HP: 1474AMAT0111
Giáo viên hướng dẫn: Nguyễn Thị Hiên
Hà Nội, ngày 15 tháng 10 năm 2014
Trang 2MỤC LỤC
TRANG
PHẦN A: LÝ THUYẾT THỐNG KÊ TOÁN 3
I Ước lượng tham số của đại lượng ngẫu nhiên 3
1 Ước lượng bằng khoảng tin cậy 3
2 Ước lượng các tham số của ĐLNN .3
2.1 Ước lượng kỳ vọng toán của ĐLNN 4
2.2 Ước lượng tỉ lệ 6
2.3 Ước lượng phương sai 6
II Kiểm định giả thuyết thống kê 7
1 Một số khái niệm và định nghĩa 7
1.1 Giả thuyết thống kê 7
1.2 Tiêu chuẩn kiểm định 7
1.3 Miền bác bỏ 7
1.4 Các loại sai lầm 8
2 Các trường hợp kiểm định 8
2.1 Kiểm định giả thuyết về kỳ vọng toán của ĐLNN 8
2.2 Kiểm định về tỉ lệ đám đông 10
PHẦN B: BÀI TẬP 9
I Đề bài 9
II Giải bài tập 15
1 Bài 1 15
2 Bài 2 27
Trang 3Phần A: LÝ THUYẾT THỐNG KÊ TOÁN
I Ước lượng các tham số của ĐLNN
Xét một ĐLNN X thể hiện trên một đám đông nào đó Các số đặc trưng của
X được gọi là các tham số lý thuyết (hay tham số của đám đông) Ký hiệu chungtham số lý thuyết cần ước lượng là Có hai phương pháp ước lượng là:
Ước lượng điểm
Ước lượng bằng khoảng tin cậy
1 Ước lượng bằng khoảng tin cậy
Để ước lượng tham số θ của ĐLNN X, trước hết từ đám đông ta lấy ra mẫungẫu nhiên W = (X1,X2, … , Xn) Tiếp đến ta xây dựng thống kê G = f(X1,X2, … ,
Xn, θ), sao cho quy luật phân phối xác suất của G hoàn toàn xác định (không phụthuộc vào tham số θ) Với xác suất γ = 1 – α cho trước, ta xác định cặp giá trị α1, α2
thỏa mãn các điều kiện α1 ≥ 0, α2 ≥ 0 và α1 + α2 = α Vì quy luật phân phối xác suấtcủa G ta đã biết, ta tìm được các phân vị g1-α1 α1 và gα2 sao cho P(G > g1-α1 α1) = 1 – α1 vàP(G > ga2)= α2
Khi đó: P(g1-α1 α1 < G < ga2) = 1 -α1 α1 -α1 α2 = 1 – α = γ
Cuối cùng bằng cách biến đổi tương đương ta có: P(θ*
1 < θ < θ*
2) = 1 – α = γTrong đó: γ = 1 – α* được gọi là là độ tin cậy,
1 được gọi là độ dài của khoảng tin cậy
Người ta thường chọn α1 = α2 = α/2 Nếu chọn α1 = 0 và α2 = α hoặc chọn α1
= α và α2 = 0 thì ta sẽ có khoảng tin cậy một phía (dùng để ước lượng giá trị tốithiểu hoặc giá trị tối đa của θ)
2 Ước lượng các tham số của ĐLNN
Trang 42.1 Ước lượng kỳ vọng toán của ĐLNN
Để ước lượng kỳ vọng toán E(X) = µ của ĐLNN X, từ đám đông ta lấy mẫuW=(X1,X2,…,Xn) Từ mẫu này ta tìm được trung bình mẫu X và phương sai mẫuđiều chỉnh S’² Ta sẽ ước lượng µ thông qua X Xét các trường hợp sau:
a) ĐLNN X trên đám đông có phân phối chuẩn đã biết.
b) ĐLNN X trên đám đông có phân phối chuẩn chưa biết.
c) Chưa biết quy luật phân phối xác suất của X nhưng n>30.
Khi n lớn, X có phân phối xấp xỉ chuẩn Mặt khác ta luôn có E X và
Khoảng tin cậy đối xứng ( lấy α1 = α2 = α/2)
Với độ tin cậy γ = 1 – α cho trước ta tìm được phân vị chuẩn u2 sao cho:
P(|U| < u 2) = 1 – α =γ
Thay biểu thức của U vào công thức trên ta có:
P(|X -α1 µ| < u 2) = 1 – α =γ
P(X – ε < µ < X + ε ) = 1 – α =γTrong đó :
ε = u 2 là sai số của ước lượng
γ = 1 – α là độ tin cậy (X – ε; X + ε) là khoảng tin cậy ngẫu nhiên của µ Ở đây ta cần chú ý rằng : Vớixác suất bằng γ = 1 – α khoảng tin cậy ngẫu nhiên này chụp đúng µ (µ là 1 số xácđịnh )
Trong 1 lần lấy mẫu ta tìm được 1 giá trị cụ thể x của X Khi đó ta có 1 khoảngtin cậy cụ thể của µ là (x – ε; x + ε)
Trang 5Ta có những bài toán sau:
Bài toán 1: Biết kích thước mẫu n, biết độ tin cậy γ = 1 – α, tìm sai số ε ( hoặc
khoảng tin cậy ) Vì biết γ = 1 – α tra bảng ta tìm được u2 , từ đó ta tìm được sai
số ε = u 2 và khoảng tin cậy của µ
Bài toán 2: Biết kích thước mẫu n và sai số ε, cần tìm độ tin cậy γ Biết n và ε, ta
tìm được u2.tra bảng tìm được α/2 từ đó tìm được độ tin cậy γ = 1 – α
Từ công thức tìm khoảng tin cậy ta thấy rằng sai số của ước lượng bằng 1 nửa
độ dài của khoảng tin cậy Vì vậy nếu biết khoảng tin cậy đối xứng (a,b) thì ta cóthể tính được sai số của ước lượng theo công thức
Khoảng tin cậy phải (lấy 1 0,2 ; dùng để ước lượng giá trị tối thiểucủa µ)
Trang 7II Kiểm định giả thuyết thống kê
1.Một số khái niệm và định nghĩa
1.1 Giả thuyết thống kê
Giả thuyết về quy luât phân phối xác suất của ĐLNN về tham số đặc trưng
của đại lựơng ngẫu nhiên hoặc tính độc lập của các ĐLNN được gọi là giả thuyết
thống kê,kí hiệu là Ho.
Mọi giả thuyết khác với giả thuyết H đươc gọi là đối thuyết,kí hiêu là H1.Ho
và H1 lập thành một cặp giả thuyết thống kê Ta quy định: khi đã chọn cặp giảthuyết Ho và H1 thì nếu bác bỏ Ho sẽ chấp nhận H1
1.2 Tiêu chuẩn kiểm định
Để kiểm đinh cặp giả thuyết thống kê Ho và H1,từ đám đông ta chọn mẫungẫu nhiên:W=(X1,…,Xn).dựa vào mẫu trên ta xây dưng thống kê
Để xây dựng miền bác bỏ ta sử dụng nguyên lý xác suất nhỏ:Nếu một biến
cố có xác suất nhỏ ta có thể coi nó không xảy ra trong một lần thực hiện phép thử.
Vì đã biết quy luật phân phối xác suất của G, nên với một số α khá bé cho trước ta
có thể tìm được miền Wα gọi là miền bác bỏ, sao cho nếu giả thuyết Ho đúng thì
xác suất để G nhận giá trị thuộc miền Wα bằng α:
P(G Wα/Ho)=α
Vì α khá bé theo nguyên lý xác suất nhỏ ta có thể coi biến cố (G Wα/Ho)không xảy ra trong một lần thưc hiện phép thử.Nên nếu từ một mẫu cụ thể
Trang 8w=(x1, , xn) ta tìm được giá trị thực nghiệm g tn f x 1, , ,x n 0 mà g tnW
(Nghĩa là vừa thực hiện phếp thử thấy biến cố (G Wα/Ho) xảy ra)ta có cơ sở bác
bỏ giả thuyết Ho
Kí hiêu W là miền bù của Wα Khi đó ta có P G W W 0 1 Vì αkhá bé nên 1-α1 α khá gần 1 Theo nguyên lý xác suất lớn: Nếu một biến cố có xácsuất rất gần 1 ta có thể coi nó sẽ xảy ra trong một lần thực hiện phép thử, nếu trongmột lần lấy mẫu ta thấy g tnW thì giả thuyết Ho tỏ ra hợp lí,chưa có cơ sở bác bỏ
Ho Vì vậy ta có quy tắc kiểm định sau:
Từ đám đông ta lấy ra một mẫu cụ thể kích thước n: w=(x1,…,xn) và tính g tn
Nếu g tnW thì bác bỏ Ho chấp nhận H1
Nếu g tnW thì chưa có cơ sở bác bỏ Ho
1.4 Các loại sai lầm
Theo quy tắc kiểm định trên ta có thể mắc hai loại sai lầm như sau:
Sai lầm loại một là loại sai lầm bác bỏ giả thuyết Ho khí chính Ho đúng Ta
có xác suất mắc sai lầm loại một bằng α Giá tri α được gọi là mức ý nghĩa.
Sai lầm loai hai là sai lầm chấp nhận Ho khi chính nó sai.Nếu ký hiệu xác
suất mắc sai lầm loại hai là ß thì ta có
P G W H
2 Các trường hợp kiểm định
2.1.Kiểm định giả thuyết về kỳ vọng toán của một ĐLNN
Giả sử cần nghiên cứu một dấu hiệu X thể hiện trên một đám đông Kí hiệuE(X) = µ, Var(X) = σ2 , trong đó µ chưa biết, từ một cơ sở nào đó người ta tìmđược µ = µ0, nhưng nghi ngờ về điều này Với mức ý nghĩa α cho trước ta cần kiểmđịnh giả thuyết H0: µ = µ0
Trang 9Từ đám đông ta lấy ra mẫu : W = ( ,……, ) và tính được các đặc trưng
S’2 =
a) ĐLNN X trên đám đông có phân phối chuẩn đã biết.
b) ĐLNN X trên đám đông có phân phối chuẩn chưa biết.
c) Chưa biết quy luật phân phối xác suất của X nhưng n>30.
Khi n lớn, X có phân phối xấp xỉ chuẩn Mặt khác ta luôn có E X và
* Xây dựng tiêu chuẩn kiểm định (XDTCKĐ): U =
Nếu H0 đúng thì U~N(0,1) Xét những bài toán cụ thể sau:
Bài toán 1:
Với α cho trước ta có thể tìm được sao cho P(|U|> ) = α Ta có miền bácbỏ:
= {
Trang 102.2.Kiểm định giả thuyết về tỉ lệ của đám đông.
Giả sử một đám đông có tỉ lệ phần tử mang dấu hiệu A là p (p chính là xác
suất để rút ngẫu nhiên được một phần tử mang dấu hiệu A từ đám đông) Từ một cơ
sở nào đó người ta tìm được p=p₀ nhưng nghi ngờ về điều này Với mức ý nghĩa cần kiểm định giả thuyết H₀:p=p₀ Chọn từ đám đông một kích thước n Gọi f là tỉ
lệ phần tử mang dấu hiệu A trên mẫu Khi kích thước n đủ lớn thì
XDTCKĐ:
Trang 11
Trong đó q₀ = 1 -α1 p₀
Nếu H₀ đúng thì U N(0,1)
Bài toán 1: Với mức ý nghĩa cho trước ta tìm được phân vị chuẩn
sao cho P( > )= Vì khá bé, theo nguyên lý xác suất
nhỏ ta có miền bác bỏ = { : > }, trong đó:
Ví dụ: Ở một địa phương tỉ lệ mắc bệnh gan đã được xác định nhiều lần là 34%.Sau một đợt điều trị bằn một loại thuốc , người ta kiểm tra lại 120 người thấy 24người còn mắc bệnh gan Hỏi với mức ý nghĩa 5% tỉ lệ người mắc bệnh gan ở địaphương đó có thay đổi hay không?
Giải:
Gọi f là tỉ lệ người mắc bệnh gan trên mẫu
P là tỉ lệ người mắc bệnh gan trên đám đông
Trang 12Vói cho trước ta xác định được sao cho: P( > )=
Vì khá bé nên theo nguyên lý xác suất nhỏ ta có
={ : > }
Ta có = =1,96
Theo đề bài: f = =0,2 = =3,237
Bác bỏ H₀
Vậy với mức ý nghĩa 5% thì tỉ lệ người mắc bệnh gan ở địa phương đó có thay đổi
Bài toán 2: Với mức ý nghĩa cho trước ta tìm được phân vị chuẩn sao cho P(U> )= Lập luận tương tự bài toán 1 ta thu được miền bác bỏ
={ > }
Ví dụ:
Ngày 10/10/2006 tác giả của một bài báo viết : Ở Việt Nam có tới 90% các doanhnghiệp chưa quan tâm đến thương mại điện tử Có ý kiến cho rằng tỉ lệ trên thấphơn so với thực tế, Để kiểm tra lại người ta 120 doang nghiệp thấy có 115 doanhnghiệp chưa quan tâm đến lĩnh vực này, Với mức ý nghĩa 0,05 hãy cho nhận định
về vấn đề trên
Giải:
Gọi X là số doanh nghiệp chưa quan tâm đến thương mại điện tử
Trang 13f là tỉ lệ số doanh nghiệp chưa quan tâm đến thương mại điện tử trên mẫu
p là tỉ lệ số doanh nghiệp chưa quan tâm đến thương mại điện tử trên đám đông
Vói cho trước ta xác định được sao cho: P(U> )=
Vì khá bé nên theo nguyên lý xác suất nhỏ ta có
={ : > }
Ta có = = 1,65
Theo đề bài: f = = 0,9583 = = 2,1288
Bác bỏ H₀
Trang 14Vậy với mức ý nghĩa 0,05 thì ta nói rằng tỉ lệ các doanh nghiệp chưa quan tâmđến thương mại điện tử lớn hơn 90%
Bài toán 3: Với mức ý nghĩa cho trước ta tìm được phân vị chuẩn sao cho P(U<-α1 )= Lập luận tương tự bài toán 1 ta thu được miền bác bỏ
={ <-α1 }
Ví dụ: Điều tra 300 học sinh trung học ở Hà Nội thấy có 66 em bị cận thị Với mức
ý nghĩa 1% có thể nói rằng tỉ lệ học sinh trung học ở Hà Nội bị cận thị nhỏ hơn25% hay không?
Giải:
Gọi X là số học sinh trung học ở Hà Nội bị cận thị
f là tỉ lệ học sinh trung học ở Hà Nội bị cận thị trên mẫu
p là tỉ lệ học sinh trung học ở Hà Nội bị cận thị trên đám đông
Vói cho trước ta xác định được sao cho: P(U<-α1 )=
Vì khá bé nên theo nguyên lý xác suất nhỏ ta có
Trang 16PHẦN B : BÀI TẬP
I Đề bài
1 Với độ tin cậy 95% ước lượng điểm học phần trung bình môn lý thuyết xác suất
và thống kê toán của Đại học Thương Mại
2 Với mức ý nghĩa 5% kiểm định giả thuyết cho rằng trong mỗi lần thi tỷ lệ sinh
viên Đại học Thương Mại trượt môn lý thuyết xác suất và thống kê toán nhỏ hơn30%
II Giải bài tập
1 Câu 1: Với độ tin cậy 95% ước lượng điểm học phần trung bình môn lý thuyết
xác suất và thống kê toán của Đại học Thương Mại
Gọi X là điểm học phần của sinh viên ĐH thương mại
X là điểm học phần trung bình của sinh viên ĐH thương mại trên mẫu
là điểm học phần trung bình của sinh viên ĐH thương mại trên đám đông
Trang 21100 Hoàng Quỳnh Trang K46C1 8,4
Trang 22124 Trương Thị Dung K47A1 9,4
Trang 27Kết luận: với độ tin cậy 95%, thì điểm học phần trung bình của sinh viên trường
ĐH Thương Mại nằm trong khoảng:
(6.5375 – 0,2442 ; 6.5375 + 0,2442) = (6.2932 ;6.7817)
Câu 2.
Gọi X là điểm học phần của sinh viên ĐH thương mại
f là tỷ lệ sinh viên ĐH thương mại trượt môn lý thuyết xác suất và thống kêtoán trên mẫu
1.5763085
Trang 28p là tỷ lệ sinh viên ĐH thương mại trượt môn lý thuyết xác suất và thống kêtoán trên đám đông.
Với mức ý nghĩa 0,05 ta cần kiểm định giả thuyết