Lời mở đầuThống kê toán có thể định nghĩa một cách khái quát như là một khoa học, kỹ thuật hay nghệ thuật của việc rút ra thông tin từ viêc quan sát dữ liệu, nhằm giải quyết các bài toán
Trang 1Lời mở đầu
Thống kê toán có thể định nghĩa một cách khái quát như là một khoa học, kỹ thuật hay nghệ thuật của việc rút ra thông tin từ viêc quan sát dữ liệu, nhằm giải quyết các bài toán thực tế trong cuộc sống Việc rút ra thông tin đó có thể là kiểm định một giả thuyết khoa học hay ước lượng một đại lượng mà ta chưa biết hay dự đoán một sự kiện trong tương lai
Cùng với lý thuyết ước lượng, lý thuyết kiểm định các giả thuyết thống kê cũng
là một bộ phận quan trọng của thống kê toán Nó là phương tiện giúp ta giải quyết những bài toán nhìn từ góc độ khác liên quan đến dấu hiệu cần nghiên cứu trong tổng thể Vì không nghiên cứu trong đám đông nên ta không biết dạng phân phối xác suất của dấu hiệu X cần nghiên cứu trên đám đông hoặc có thể biết dạng phân phối của X nhưng chưa biết được một đại lượng đặc trưng nào
đó Ta có thể đưa ra các giả thuyết thống kê, đó là giả thuyết ta đang nghi ngờ và một giả thuyết trái với giả thuyết gốc Tiến hành công việc theo quy tắc hay thủ tục để từ một mẫu cụ thể cho phép ta đi đến quyết định chấp nhận hay bác bỏ một giả thuyết thống kê
Thống kê toán nói chung hay bài toán ước lượng hoặc kiểm định nói riêng có ứng dụng rất rộng rãi trong thực tế và đời sống Nó không chỉ giúp giải quyết các bài toán thực tế mà còn có thể giải quyết bài toán trong nghiên cứu khoa học Ngày nay theo xu thế phát triển của thời đại, những ứng dụng của ngành khoa học xác suất thống kê ngày càng trở nên quan trọng trong hầu hết các lĩnh vực Việc nghiên cứu các số liệu trở nên cần thiết hơn nhằm đưa ra những con số biết nói giúp chúng ta trong việc nhiên cứu từ đó đưa ra những điều chỉnh hợp lý Xã
Trang 2hội phát triển thì giáo dục cũng phát triển theo Sinh viên luôn là tầng lớp được
xã hội quan tâm nhất là tương lai của quốc gia Tầng lớp sinh viên được đánh giá rất cao trên các mặt đặc biệt là trình độ học vấn, sự hiểu biết Mỗi sinh viên không chỉ trang bị cho mình một kiến thức chuyên môn mà học có thể học nhiều chuyên ngành cùng một lúc Vì vậy nhóm 2 đã lựa chọn đề tài nghiên cứu về tỷ
lệ học văn bằng 2 của sinh viên đại học Thương Mại
Trang 3I Lý thuyết
A Ước lượng kỳ vọng toán của đại lượng ngẫu nhiên.
Để ước lượng kì vọng toán E(X)=μ của ĐLNN X,từ đám đông ta lấy ra mẫu ngẫu nhiên W=(X1,X2,X3,…,X n) Từ mẫu này tìm trung bình mẫu X và phương sai mẫu điều chỉnh S '2 Ta ước lượng μ thông qua X
Giả sử ĐLNN X có E(X)= μ chưa biết Cần ước lượng μ?
Lấy mẫu W= {X1,X2,X3,…,X n} =>X; S'2
Xét 3 trường hợp sau:
1 ĐLNN X phân phối theo quy luật chuẩn với σ2 đã biết
Vì X ~ N(μ,σ2) nên X N¿), khi đó:
Xây dụng thống kê: U =X−μ σ
√n ~ N(0,1) a) Khoảng tin cậy đối xứng ( lấy α1=α2= α2 )
Với độ tin cậy γ=1-α cho trước ta tìm được phân vị chuẩn u α
2 sao cho:
P(|U|<u α
2) =1- α=γ Thay biểu thức của U ta được:
P(|X −μ∨¿ σ
√n u α2
¿ =1-α=γ
P(X −ε<μ< X +ε¿ =1-α=γ Trong đó:
ε=√σ n u α2là sai số ước lượng
γ=1-α là độ tin cậy
(X −ε ; X +ε¿ là khoảng tin cậy ngẫu nhiên của μ
Trang 4Vậy khoảng tin cậy đối xứng của μ: (X − σ
√n u α2
; X+ σ
√n u α2) *Ta có những bài toán sau:
Bài toán 1: Biết kích thước mẫu n, biết độ tin cậy γ = 1 – α, tìm sai số ε ( hoặc
khoảng tin cậy )
Vì biết γ = 1 – α tra bảng ta tìm được u α
2, từ đó ta tìm được sai số ε=√σ n u α2 và độ tin cậy
Bài toán 2: Biết kích thước mẫu n và sai số ε, cần tìm độ tin cậy γ
Biết n và ε, ta tìm được u α
2.tra bảng tìm được α2 ,từ đó tìm được độ tin cậy
γ = 1 – α
Từ công thức tìm khoảng tin cậy ta thấy rằng sai số của ước lượng bằng 1 nửa
độ dài của khoảng tin cậy Vì vậy nếu biết khoảng tin cậy đối xứng (a,b) thì ta có thể tính được sai số của ước lượng theo công thức ε= b−a2
Bài toán 3: Biết độ tin cậy γ, biết sai số ε, cần tìm kích thước mẫu n
Biết γ = 1 – α, ta tìm được u α
2 Ta tìm được n= σ
2u α
2.2
ε2 .Đó chính là kích thước mẫu tối thiểu cần tìm
b) Khoảng tin cậy phải (lấy α1=0 và α2=α dùng để ước lượng giá trị tối thiểu của μ)
Với độ tin cậy γ=1-α ta tìm được phân vị chuẩn u α sao cho:
P(U<u α¿ =1-α=γ Thay biểu thức của U ta được:
P(X−μ σ
√n
<u α¿
=1-α=γ
Trang 5 P(X − σ
√n u α <μ¿ =1-α=γ Vậy khoảng tin cậy phải của μ là:(X − σ
√n u α;+∞) c) Khoảng tin cậy trái ( lấy α1=α và α2=0 dùng để ước lượng giá trị tối đa của μ)
Với độ tin cậy γ=1-α ta tìm được u αsao cho:
P(-u α<U) =1-α=γ Thay biểu thức của U ta được:
P(-u α<X−μ σ
√n ) =1-α=γ
P(μ<X + σ
√n u α) =1-α=γ Vậy khoảng tin cậy trái của μ là: (-∞;X + σ
√n u α)
2 ĐLNN X phân phối theo quy luật chuẩn với σ2 chưa biết
Vì X có phân phối chuẩn nên:
Xây dựng thống kê: T=X−μ S'
√n ~ Tn−1
a) Khoảng tin cậy đối xứng ( lấy α1=α2= α2 )
Với độ tin cậy γ=1-α cho trước ta tìm được phân vịt α
2
(n−1)
sao cho:
P(|T|<t α
2
(n−1)
) =1-α=γ Thay biểu thức của T vào công thức trên ta có:
P(|X −μ∨¿<√S n ' t α2
(n−1)
) =1-α =γ
P(X −ε<μ< X +ε¿ =1-α=γ
Trang 6Trong đó:
ε = √S n ' t α2
(n−1)
là sai số của ước lượng γ=1-α là độ tin cậy
(X −ε<μ< X +ε¿ là khoảng tin cậy ngẫu nhiên của μ
Vậy khoảng tin cậy đối xứng của μ: (X − S '
√n t α2
(n−1); X + S '
√n t α2
b) Khoảng tin cậy phải (lấy α1=0 và α2=α dùng để ước lượng giá trị tối thiểu của μ)
Với độ tin cậy γ=1- α tìm t (n−1) α sao cho:
P(T<t (n−1) α ) =1- α =γ Thay biểu thức của T vào ta được:
P(
X−μ
S '
√n <t (n−1) α ) =1-α =γ
P(X − S '
√n t α
(n−1)<μ) =1-α =γ Vậy khoảng tin cậy phải của μ là (X − S '
√n t α
c) Khoảng tin cậy trái ( lấy α1=α và α2=0 dùng để ước lượng giá trị tối đa của μ)
Với độ tin cậy γ=1-α cho trước tìm t (n−1) α sao cho:
P(-t (n−1) α <T ) =1-α =γ Thay biểu thức của T vào ta được:
P(-t (n−1) α <
X−μ
S '
√n ) =1-α =γ
P(μ<X + S '
√n t α
(n−1)) =1-α = γ
Trang 7Vậy khoảng tin cậy trái của μ là: (-∞;X + S '
√n t α
(n−1))
3 Chưa biết quy luật phân phối xác suất của X nhưng kích thước mẫu n>30 Khi n>30 thì X ~ N¿) do đó:
Xây dựng thống kê:U=X−μ σ
√n
≅
N(0,1)
Các bài toán và khoảng tin cậy đưa về trường hợp 1
B Ước lượng tỉ lệ
(ước lượng tham số p trong phân phối A(p) )
Xét một đám đông kích thước N,trong đó có M phần tử mang dấu hiệu A Kí hiệu tỉ lệ phần tử mang dấu hiệu A trên đám đông là p=M N Để ước lượng p từ đám đông ta lấy ra mẫu kích thước n Kí hiệu n A là số phần tử mang dấu hiệu A
có trong n phần tử lấy ra Khi đó f=n A
n là tỉ lệ phần tử mang dấu hiệu A trên mẫu
Ta sẽ dùng f để ước lượng p Khi n đủ lớn thì f ≅ N(p,pq n ), ở đây ta kí hiệu q=1
-p Vì vậy, ta có thống kê:
U=f −p
√pq
n
≅
N(0;1)
a) Khoảng tin cậy đối xứng ( lấy α1=α2= α2 )
Với độ tin cậy γ=1-α ta tìm được phân vị chuẩn u α
2 sao cho:
P(|U|<u α
2) ≈1-α =γ Thay biểu thức của U vào công thức trên ta có:
Trang 8n u α
2
¿ ≈1-α =γ
(f-ε <p< f+ε) ≈1-α =γ Trong đó: ε=√pq
n u α
2là sai số của ước lượng Nếu p chưa biết,n khá lớn để tính
ε ta lấy p≈f và q≈1-f, khi đó:
ε=√pq
n u α
2≈ √f (1−f )
n u α
2
Khoảng tin cậy đối xứng của p là (f-ε ; f+ε)
Độ tin cậy ước lượng là γ=1-α
Vậy khoảng tin cậy đối xứng của p là (f -√f (1−f )
n u α
2 ; f +√f (1−f )
n u α
2)
ε =√pq
n u α
2 ≈ √f (1−f )
n u α
2
U α
2
= ε√n
√pq ≈ ε√n
¿> α2=¿γ=1−α
Bài toán 3: Tìm n
n = pq (u α2
ε )
2
≈ f (1−f )(
u α
2
ε )
2
b) Khoảng tin cậy phải (lấy α1=0 và α2=α dùng để ước lượng giá trị tối thiểu của p)
Với độ tin cậy γ=1-α ta tìm được u α sao cho:
P(U<u α¿ ≈1-α=γ Thay biểu thức của U ta được:
Trang 9f −p
√pq
n <u α) ≈1-α=γ
P(f-√pq
n u α<p) ≈1-α=γ
Vì p chưa biết,n lớn ta lấy p≈f
Vậy khoảng tin cậy phải của p là:(f-√f (1−f )
n u α;+∞) c) Khoảng tin cậy trái ( lấy α1=α và α2=0 dùng để ước lượng giá trị tối đa của p)
Với độ tin cậy γ=1-α ta tìm được u α sao cho:
P(-u α <U¿ ≈1-α=γ Thay biểu thức của U ta được:
P(-u α < f − p
√pq
n ) ≈1-α=γ
P(p<f+√pq
n u α) ≈1-α=γ
Vì p chưa biết,n lớn ta lấy p≈f
Vậy khoảng tin cậy phải của p là:(-∞ ;f+√f (1−f )
n u α)
i Kiểm định giả thuyết về kì vọng toán của đại lượng ngẫu nhiên
1 ĐLNN X trên đám đông có phân phối chuẩn với σ2 đã biết
Với X có phân phối chuẩn nên: X N (μ, σ n2) XDTCKĐ:
U = X−μ0
σ
√n
Nếu H0 đúng thì U N( 0,1 )
Trang 10Xét những bài toán cụ thể sau:
Bài toán 1:
H0 : μ=μ0
H1: μ≠ μ0
Với α cho trước ta có thể tìm được u α
2 sao cho: P(|U|>u α
2) = α
Ta có miền bác bỏ: W α ={u tn:|u tn|>u α
2}
Trong đó: utn = x−μ σ 0
√n
Bài toán 2:
H0 : μ=μ0
H1: μ>μ0
Với α chi trước ta có thể tìm được u α sao cho: P(U> u α¿ = α
Ta có miền bác bỏ: W α ={u tn :u tn >u α}
Bài toán 3:
H0 : μ=μ0
H1: μ<μ0
Với α chi trước ta có thể tìm được u α sao cho: P(U<- u α¿ = α
Ta có miền bác bỏ: W α ={u tn :u tn ←u α}
2 ĐLNN X trên đám đông có phân phối chuẩn với σ2 chưa biết XDTCKĐ:
Trang 11X−μ0
S'
√n
Vì X có phân phối chuẩn, nếu Ho thì T T n−1
Bài toán 1:
H0 : μ=μ0
H1: μ≠ μ0
Với mức ý nghĩa α cho trước ta có thể tìm đượct α
2
(n−1)
sao cho:
P(|T|>t α
2
(n−1)) = α
Ta có miền bác bỏ W α ={t tn:|t tn|>t α
2
(n −1)
trong đó : ttn =x−μ S'
√n
Bài toán 2:
H0 : μ=μ0
H1: μ>μ0
Với mức ý nghĩa α cho trước ta có thể tìm đượct α
2
(n−1)
sao cho:
P(T >t α(n−1)) = α
Ta có miền bác bỏ W α ={t tn :t tn >t α(n−1)}
Bài toán 3:
H0 : μ=μ0
H1: μ<μ0
Với mức ý nghĩa α cho trước ta có thể tìm đượct α
2
(n−1)
sao cho:
P(T ←t(α n−1)) = α
Ta có miền bác bỏ W α ={t tn :t tn ←t α(n−1)}
Trang 123 Chưa biết quy luật phân phối xác suất của X nhưng kích thước mẫu n>3
Khi n> 30 thì X N (μ, σ2
n ) Ta vẫn dung TCKĐ:
U = X−μ σ 0
√n
Khi đó, nếu giả thuyết H0 đúng thì U sẽ xấp xỉ phân phối chuẩn N(0,1)
ii Kiểm định giả thiết tỷ lệ đám đông
Xét một đám đông có tỉ lệ mang dấu hiệu A là p, trong đó p chưa biết Từ một
cơ sở nào đó người ta tìm được p=p0, nhưng nghi ngờ về điều này Với mức ý nghĩa αcần kiểm định giả thuyết: H0: p = p0 Gọi f là tỉ lệ phần tử mang dấu hiệu
A trên mẫu ngẫu nhiên kích thước n f có phân phối xấp xỉ chuẩn:
f N¿) XDTCKĐ:
U = f − p0
√p0q0 n
trong đó q0 = 1-p0
Nếu H0 đúng thì U N( 0,1 )
Bài toán 1:
H0 : p= p0
H1: p≠ p0
Ta có miền bác bỏ: W α ={u tn:|u tn|>u α
2} trong đó u tn= f − p0
√p0q0 n
Bài toán 2:
Trang 13H0 : p= p0
H1: p> p0
Ta có miền bác bỏ: W α ={u tn :u tn >u α}
Bài toán 3:
H0 : p= p0
H1: p< p0
Ta có miền bác bỏ: W α ={u tn :u tn ←u α}
II BÀI TOÁN
Bảng phân phối thực nghiệm
1, Ước lượng tỉ lệ sinh viên của trường đại học Thương Mại có nguyện vọng học văn bằng 2
Gọi X là số sinh viên có nguyện vọng học văn bằng 2
Gọi f là tỉ lệ sinh viên có nguyện vọng học văn bằng 2 trên mẫu
Gọi p là tỉ lệ sinh viên có nguyện vọng học văn bằng 2 trên đám đông
Ta có n= 200 khá lớn nên f ≈ N( p, pq n )⇒U=
f −q
√pq
n ≈ N(0,1)
Ta tìm được phân vị uα/2sao cho P( lUl < uα/2)≈ 1-α
Trang 14Thay biểu thức U vào công thức trên ta có:
P(lf – pl <√pq
n uα/2) ≈1-α
P(f-ɛ <p< f+ɛ) ≈ 1-α
Trong đó: sai số ɛ=√pq
n uα/2
Vì p chưa biết, n=200 khá lớn nên ta lấy f = p=52/200=0.26
Ta có: q≈ 1−f =0.74 Mặt khác ta có 1−α=0,99 ⇒ α2=0,005
Tra bảng ta có u0,005=2,58
Vậy nên Ɛ=√0,26.0,74
200 .2,58=0.08
Thay số vào ta có: 0,26−0,08< p<0,26+0,08hay 0,18< p<0,34
Vây với độ tin cậy 99% ta có thể nói rằng tỉ lệ sinh viên đại học Thương Mại muốn học thêm văn bằng 2 nằm trong khoảng (0,18;0,34)
2, Khảo sát 200 sinh viên của ĐHTM thấy có 52 SV học văn bằng 2 được chia thành các mức điểm như sau:
Với mức ý nghĩa 5% có thể nói điểm trung bình của học sinh học văn bằng 2 là dưới 2.5 không?
Giải
i
Trang 153.5 7 24.5 85.75
Gọi X là số điểm của sinh viên học văn bằng 2
GọiX là số điểm trung bình của sinh viên học văn bằng 2 trên mẫu Gọi μlà số điểm trung bình của sinh viên học văn bằng 2 trên đám đông
Vì X có phân phối chuẩn nên X~(μ ; σ n2¿
Với mức ý nghĩa 5% cần kiểm định:{H0: μ=μ o( ¿ 2.5 )
H1: μ<μ0 }
XDTCKD: U=X−μ σ 0
√n
Nếu H0 đúng thì U~N(0;1) Khi đó ta tìm được phân vịu α sao cho:
P( U <−u α) = α
Vì α quá bé nên theo nguyên lí xác suất nhỏ ta có miền bác bỏ:
W α={u tn :u tn ←u α}
Trong đó: u tn=x−μ σ 0
√n
Tra bảng ta có u α =u0.05=1.65
Trung bình mẫu cụ thể:x= 1 n∑
i=1
k
x i=2.4615
Vì n>30 nên ta lấy σ ≈ s'
Trang 16s ' 2= 1n−1∑
i=1
k
¿¿) ⇨ s'=0.5589
Khi đó u tn=x−μ0
s '
√n =2.4615−2.50.5589
√52 = -0.4967 Suy ra u tn>- u α ∉W α nên ta chưa thể bác bỏ giả thuyết H0
Kết luận: với mức ý nghĩa α=0.05 ta chưa thể nói mức điểm trung bình của
SV học văn bằng 2 là dưới 2.5
III Ứng dụng, mở rộng liên hệ thực tế
Khi nghiên cứu nhóm 2 đã chọn ngẫu nhiên 200 bạn của trường để tiến hành nghiên cứu và có thể đưa ra kết luận chung cho toàn bộ sinh viên Thương Mại với độ tin cậy Đây là một nghiên cứu nhỏ nhưng có tính ứng dụng cao Hiện nay các doanh nghiệp đưa ra thông báo tuyển dụng thì trình độ chuyên môn là yếu tố quan trọng nhất Khi Việt Nam đã và đang trên con đường hội nhập thì cơ hội phát triển rất cao tuy nhiên cơ hội việc làm thì lại là một thách thức Hiện nay khi các cử nhân, kỹ sư ra trường họ đều đã có trong tay một lĩnh vực chuyên môn nhất định vì vậy nếu bạn có 2 tấm bằng thì cơ hội việc là của bạn sẽ tăng lên rất nhiều
IV Kết luận
Sau một thời gian làm việc tích cực nhóm đã thu thập được số liệu và bằng phương pháp thống kê toán được học dưới sự giảng dạy của giáo viên bộ môn, nhóm đã hoàn thành bài ước lượng của mình với kết quả về tỷ lệ học văn bằng 2
Trang 17của sinh viên ĐHTM là 0,18< p<0,34 với độ tin cậy là 0.99 và mức ý nghĩa là 5%thì sau khi kiểm định có thể thấy giả thuyết là không chính xác