tổng hợp lý thuyết xác suất và thống kê

Lời mở đầuThống kê toán có thể định nghĩa một cách khái quát như là một khoa học, kỹ thuật hay nghệ thuật của việc rút ra thông tin từ viêc quan sát dữ liệu, nhằm giải quyết các bài toán

Trang 1

Lời mở đầu

Thống kê toán có thể định nghĩa một cách khái quát như là một khoa học, kỹ thuật hay nghệ thuật của việc rút ra thông tin từ viêc quan sát dữ liệu, nhằm giải quyết các bài toán thực tế trong cuộc sống Việc rút ra thông tin đó có thể là kiểm định một giả thuyết khoa học hay ước lượng một đại lượng mà ta chưa biết hay dự đoán một sự kiện trong tương lai

Cùng với lý thuyết ước lượng, lý thuyết kiểm định các giả thuyết thống kê cũng

là một bộ phận quan trọng của thống kê toán Nó là phương tiện giúp ta giải quyết những bài toán nhìn từ góc độ khác liên quan đến dấu hiệu cần nghiên cứu trong tổng thể Vì không nghiên cứu trong đám đông nên ta không biết dạng phân phối xác suất của dấu hiệu X cần nghiên cứu trên đám đông hoặc có thể biết dạng phân phối của X nhưng chưa biết được một đại lượng đặc trưng nào

đó Ta có thể đưa ra các giả thuyết thống kê, đó là giả thuyết ta đang nghi ngờ và một giả thuyết trái với giả thuyết gốc Tiến hành công việc theo quy tắc hay thủ tục để từ một mẫu cụ thể cho phép ta đi đến quyết định chấp nhận hay bác bỏ một giả thuyết thống kê

Thống kê toán nói chung hay bài toán ước lượng hoặc kiểm định nói riêng có ứng dụng rất rộng rãi trong thực tế và đời sống Nó không chỉ giúp giải quyết các bài toán thực tế mà còn có thể giải quyết bài toán trong nghiên cứu khoa học Ngày nay theo xu thế phát triển của thời đại, những ứng dụng của ngành khoa học xác suất thống kê ngày càng trở nên quan trọng trong hầu hết các lĩnh vực Việc nghiên cứu các số liệu trở nên cần thiết hơn nhằm đưa ra những con số biết nói giúp chúng ta trong việc nhiên cứu từ đó đưa ra những điều chỉnh hợp lý Xã

Trang 2

hội phát triển thì giáo dục cũng phát triển theo Sinh viên luôn là tầng lớp được

xã hội quan tâm nhất là tương lai của quốc gia Tầng lớp sinh viên được đánh giá rất cao trên các mặt đặc biệt là trình độ học vấn, sự hiểu biết Mỗi sinh viên không chỉ trang bị cho mình một kiến thức chuyên môn mà học có thể học nhiều chuyên ngành cùng một lúc Vì vậy nhóm 2 đã lựa chọn đề tài nghiên cứu về tỷ

lệ học văn bằng 2 của sinh viên đại học Thương Mại

Trang 3

I Lý thuyết

A Ước lượng kỳ vọng toán của đại lượng ngẫu nhiên.

Để ước lượng kì vọng toán E(X)=μ của ĐLNN X,từ đám đông ta lấy ra mẫu ngẫu nhiên W=(X1,X2,X3,…,X n) Từ mẫu này tìm trung bình mẫu X và phương sai mẫu điều chỉnh S '2 Ta ước lượng μ thông qua X

Giả sử ĐLNN X có E(X)= μ chưa biết Cần ước lượng μ?

Lấy mẫu W= {X1,X2,X3,…,X n} =>X; S'2

Xét 3 trường hợp sau:

1 ĐLNN X phân phối theo quy luật chuẩn với σ2 đã biết

Vì X ~ N(μ,σ2) nên X N¿), khi đó:

Xây dụng thống kê: U =X−μ σ

√n ~ N(0,1) a) Khoảng tin cậy đối xứng ( lấy α1=α2= α2 )

Với độ tin cậy γ=1-α cho trước ta tìm được phân vị chuẩn u α

2 sao cho:

P(|U|<u α

2) =1- α=γ Thay biểu thức của U ta được:

P(|X −μ∨¿ σ

√n u α2

¿ =1-α=γ

 P(X −ε<μ< X +ε¿ =1-α=γ Trong đó:

ε=√σ n u α2là sai số ước lượng

γ=1-α là độ tin cậy

(X −ε ; X +ε¿ là khoảng tin cậy ngẫu nhiên của μ

Trang 4

Vậy khoảng tin cậy đối xứng của μ: (X − σ

√n u α2

; X+ σ

√n u α2) *Ta có những bài toán sau:

Bài toán 1: Biết kích thước mẫu n, biết độ tin cậy γ = 1 – α, tìm sai số ε ( hoặc

khoảng tin cậy )

Vì biết γ = 1 – α tra bảng ta tìm được u α

2, từ đó ta tìm được sai số ε=√σ n u α2 và độ tin cậy

Bài toán 2: Biết kích thước mẫu n và sai số ε, cần tìm độ tin cậy γ

Biết n và ε, ta tìm được u α

2.tra bảng tìm được α2 ,từ đó tìm được độ tin cậy

γ = 1 – α

Từ công thức tìm khoảng tin cậy ta thấy rằng sai số của ước lượng bằng 1 nửa

độ dài của khoảng tin cậy Vì vậy nếu biết khoảng tin cậy đối xứng (a,b) thì ta có thể tính được sai số của ước lượng theo công thức ε= b−a2

Bài toán 3: Biết độ tin cậy γ, biết sai số ε, cần tìm kích thước mẫu n

Biết γ = 1 – α, ta tìm được u α

2 Ta tìm được n= σ

2u α

2.2

ε2 .Đó chính là kích thước mẫu tối thiểu cần tìm

b) Khoảng tin cậy phải (lấy α1=0 và α2=α dùng để ước lượng giá trị tối thiểu của μ)

Với độ tin cậy γ=1-α ta tìm được phân vị chuẩn u α sao cho:

P(U<u α¿ =1-α=γ Thay biểu thức của U ta được:

P(X−μ σ

√n

<u α¿

=1-α=γ

Trang 5

 P(X − σ

√n u α <μ¿ =1-α=γ Vậy khoảng tin cậy phải của μ là:(X − σ

√n u α;+∞) c) Khoảng tin cậy trái ( lấy α1=α và α2=0 dùng để ước lượng giá trị tối đa của μ)

Với độ tin cậy γ=1-α ta tìm được u αsao cho:

P(-u α<U) =1-α=γ Thay biểu thức của U ta được:

P(-u α<X−μ σ

√n ) =1-α=γ

 P(μ<X + σ

√n u α) =1-α=γ Vậy khoảng tin cậy trái của μ là: (-∞;X + σ

√n u α)

2 ĐLNN X phân phối theo quy luật chuẩn với σ2 chưa biết

Vì X có phân phối chuẩn nên:

Xây dựng thống kê: T=X−μ S'

√n ~ Tn−1

a) Khoảng tin cậy đối xứng ( lấy α1=α2= α2 )

Với độ tin cậy γ=1-α cho trước ta tìm được phân vịt α

2

(n−1)

sao cho:

P(|T|<t α

2

(n−1)

) =1-α=γ Thay biểu thức của T vào công thức trên ta có:

P(|X −μ∨¿<√S n ' t α2

(n−1)

) =1-α =γ

P(X −ε<μ< X +ε¿ =1-α=γ

Trang 6

Trong đó:

ε = √S n ' t α2

(n−1)

là sai số của ước lượng γ=1-α là độ tin cậy

(X −ε<μ< X +ε¿ là khoảng tin cậy ngẫu nhiên của μ

Vậy khoảng tin cậy đối xứng của μ: (X − S '

√n t α2

(n−1); X + S '

√n t α2

b) Khoảng tin cậy phải (lấy α1=0 và α2=α dùng để ước lượng giá trị tối thiểu của μ)

Với độ tin cậy γ=1- α tìm t (n−1) α sao cho:

P(T<t (n−1) α ) =1- α =γ Thay biểu thức của T vào ta được:

P(

X−μ

S '

√n <t (n−1) α ) =1-α =γ

 P(X − S '

√n t α

(n−1)<μ) =1-α =γ Vậy khoảng tin cậy phải của μ là (X − S '

√n t α

c) Khoảng tin cậy trái ( lấy α1=α và α2=0 dùng để ước lượng giá trị tối đa của μ)

Với độ tin cậy γ=1-α cho trước tìm t (n−1) α sao cho:

P(-t (n−1) α <T ) =1-α =γ Thay biểu thức của T vào ta được:

P(-t (n−1) α <

X−μ

S '

√n ) =1-α =γ

 P(μ<X + S '

√n t α

(n−1)) =1-α = γ

Trang 7

Vậy khoảng tin cậy trái của μ là: (-∞;X + S '

√n t α

(n−1))

3 Chưa biết quy luật phân phối xác suất của X nhưng kích thước mẫu n>30 Khi n>30 thì X ~ N¿) do đó:

Xây dựng thống kê:U=X−μ σ

√n

≅

N(0,1)

Các bài toán và khoảng tin cậy đưa về trường hợp 1

B Ước lượng tỉ lệ

(ước lượng tham số p trong phân phối A(p) )

Xét một đám đông kích thước N,trong đó có M phần tử mang dấu hiệu A Kí hiệu tỉ lệ phần tử mang dấu hiệu A trên đám đông là p=M N Để ước lượng p từ đám đông ta lấy ra mẫu kích thước n Kí hiệu n A là số phần tử mang dấu hiệu A

có trong n phần tử lấy ra Khi đó f=n A

n là tỉ lệ phần tử mang dấu hiệu A trên mẫu

Ta sẽ dùng f để ước lượng p Khi n đủ lớn thì f ≅ N(p,pq n ), ở đây ta kí hiệu q=1

-p Vì vậy, ta có thống kê:

U=f −p

√pq

n

≅

N(0;1)

a) Khoảng tin cậy đối xứng ( lấy α1=α2= α2 )

Với độ tin cậy γ=1-α ta tìm được phân vị chuẩn u α

2 sao cho:

P(|U|<u α

2) ≈1-α =γ Thay biểu thức của U vào công thức trên ta có:

Trang 8

n u α

2

¿ ≈1-α =γ

 (f-ε <p< f+ε) ≈1-α =γ Trong đó: ε=√pq

n u α

2là sai số của ước lượng Nếu p chưa biết,n khá lớn để tính

ε ta lấy p≈f và q≈1-f, khi đó:

ε=√pq

n u α

2≈ √f (1−f )

n u α

2

Khoảng tin cậy đối xứng của p là (f-ε ; f+ε)

Độ tin cậy ước lượng là γ=1-α

Vậy khoảng tin cậy đối xứng của p là (f -√f (1−f )

n u α

2 ; f +√f (1−f )

n u α

2)

ε =√pq

n u α

2 ≈ √f (1−f )

n u α

2

U α

2

= ε√n

√pq ≈ ε√n

¿> α2=¿γ=1−α

Bài toán 3: Tìm n

n = pq (u α2

ε )

2

≈ f (1−f )(

u α

2

ε )

2

b) Khoảng tin cậy phải (lấy α1=0 và α2=α dùng để ước lượng giá trị tối thiểu của p)

Với độ tin cậy γ=1-α ta tìm được u α sao cho:

P(U<u α¿ ≈1-α=γ Thay biểu thức của U ta được:

Trang 9

f −p

√pq

n <u α) ≈1-α=γ

P(f-√pq

n u α<p) ≈1-α=γ

Vì p chưa biết,n lớn ta lấy p≈f

Vậy khoảng tin cậy phải của p là:(f-√f (1−f )

n u α;+∞) c) Khoảng tin cậy trái ( lấy α1=α và α2=0 dùng để ước lượng giá trị tối đa của p)

Với độ tin cậy γ=1-α ta tìm được u α sao cho:

P(-u α <U¿ ≈1-α=γ Thay biểu thức của U ta được:

P(-u α < f − p

√pq

n ) ≈1-α=γ

P(p<f+√pq

n u α) ≈1-α=γ

Vì p chưa biết,n lớn ta lấy p≈f

Vậy khoảng tin cậy phải của p là:(-∞ ;f+√f (1−f )

n u α)

i Kiểm định giả thuyết về kì vọng toán của đại lượng ngẫu nhiên

1 ĐLNN X trên đám đông có phân phối chuẩn với σ2 đã biết

Với X có phân phối chuẩn nên: X N (μ, σ n2) XDTCKĐ:

U = X−μ0

σ

√n

Nếu H0 đúng thì U N( 0,1 )

Trang 10

Xét những bài toán cụ thể sau:

Bài toán 1:

H0 : μ=μ0

H1: μ≠ μ0

Với α cho trước ta có thể tìm được u α

2 sao cho: P(|U|>u α

2) = α

Ta có miền bác bỏ: W α ={u tn:|u tn|>u α

2}

Trong đó: utn = x−μ σ 0

√n

Bài toán 2:

H0 : μ=μ0

H1: μ>μ0

Với α chi trước ta có thể tìm được u α sao cho: P(U> u α¿ = α

Ta có miền bác bỏ: W α ={u tn :u tn >u α}

Bài toán 3:

H0 : μ=μ0

H1: μ<μ0

Với α chi trước ta có thể tìm được u α sao cho: P(U<- u α¿ = α

Ta có miền bác bỏ: W α ={u tn :u tn ←u α}

2 ĐLNN X trên đám đông có phân phối chuẩn với σ2 chưa biết XDTCKĐ:

Trang 11

X−μ0

S'

√n

Vì X có phân phối chuẩn, nếu Ho thì T T n−1

Bài toán 1:

H0 : μ=μ0

H1: μ≠ μ0

Với mức ý nghĩa α cho trước ta có thể tìm đượct α

2

(n−1)

sao cho:

P(|T|>t α

2

(n−1)) = α

Ta có miền bác bỏ W α ={t tn:|t tn|>t α

2

(n −1)

trong đó : ttn =x−μ S'

√n

Bài toán 2:

H0 : μ=μ0

H1: μ>μ0

2

(n−1)

sao cho:

P(T >t α(n−1)) = α

Ta có miền bác bỏ W α ={t tn :t tn >t α(n−1)}

Bài toán 3:

H0 : μ=μ0

H1: μ<μ0

2

(n−1)

sao cho:

P(T ←t(α n−1)) = α

Ta có miền bác bỏ W α ={t tn :t tn ←t α(n−1)}

Trang 12

3 Chưa biết quy luật phân phối xác suất của X nhưng kích thước mẫu n>3

Khi n> 30 thì X N (μ, σ2

n ) Ta vẫn dung TCKĐ:

U = X−μ σ 0

√n

Khi đó, nếu giả thuyết H0 đúng thì U sẽ xấp xỉ phân phối chuẩn N(0,1)

ii Kiểm định giả thiết tỷ lệ đám đông

Xét một đám đông có tỉ lệ mang dấu hiệu A là p, trong đó p chưa biết Từ một

cơ sở nào đó người ta tìm được p=p0, nhưng nghi ngờ về điều này Với mức ý nghĩa αcần kiểm định giả thuyết: H0: p = p0 Gọi f là tỉ lệ phần tử mang dấu hiệu

A trên mẫu ngẫu nhiên kích thước n f có phân phối xấp xỉ chuẩn:

f N¿) XDTCKĐ:

U = f − p0

√p0q0 n

trong đó q0 = 1-p0

Nếu H0 đúng thì U N( 0,1 )

Bài toán 1:

H0 : p= p0

H1: p≠ p0

Ta có miền bác bỏ: W α ={u tn:|u tn|>u α

2} trong đó u tn= f − p0

√p0q0 n

Bài toán 2:

Trang 13

H0 : p= p0

H1: p> p0

Ta có miền bác bỏ: W α ={u tn :u tn >u α}

Bài toán 3:

H0 : p= p0

H1: p< p0

Ta có miền bác bỏ: W α ={u tn :u tn ←u α}

II BÀI TOÁN

Bảng phân phối thực nghiệm

1, Ước lượng tỉ lệ sinh viên của trường đại học Thương Mại có nguyện vọng học văn bằng 2

Gọi X là số sinh viên có nguyện vọng học văn bằng 2

Gọi f là tỉ lệ sinh viên có nguyện vọng học văn bằng 2 trên mẫu

Gọi p là tỉ lệ sinh viên có nguyện vọng học văn bằng 2 trên đám đông

Ta có n= 200 khá lớn nên f ≈ N( p, pq n )⇒U=

f −q

√pq

n ≈ N(0,1)

Ta tìm được phân vị uα/2sao cho P( lUl < uα/2)≈ 1-α

Trang 14

Thay biểu thức U vào công thức trên ta có:

P(lf – pl <√pq

n uα/2) ≈1-α

P(f-ɛ <p< f+ɛ) ≈ 1-α

Trong đó: sai số ɛ=√pq

n uα/2

Vì p chưa biết, n=200 khá lớn nên ta lấy f = p=52/200=0.26

Ta có: q≈ 1−f =0.74 Mặt khác ta có 1−α=0,99 ⇒ α2=0,005

Tra bảng ta có u0,005=2,58

Vậy nên Ɛ=√0,26.0,74

200 .2,58=0.08

Thay số vào ta có: 0,26−0,08< p<0,26+0,08hay 0,18< p<0,34

Vây với độ tin cậy 99% ta có thể nói rằng tỉ lệ sinh viên đại học Thương Mại muốn học thêm văn bằng 2 nằm trong khoảng (0,18;0,34)

2, Khảo sát 200 sinh viên của ĐHTM thấy có 52 SV học văn bằng 2 được chia thành các mức điểm như sau:

Với mức ý nghĩa 5% có thể nói điểm trung bình của học sinh học văn bằng 2 là dưới 2.5 không?

Giải

i

Trang 15

3.5 7 24.5 85.75

Gọi X là số điểm của sinh viên học văn bằng 2

GọiX là số điểm trung bình của sinh viên học văn bằng 2 trên mẫu Gọi μlà số điểm trung bình của sinh viên học văn bằng 2 trên đám đông

Vì X có phân phối chuẩn nên X~(μ ; σ n2¿

Với mức ý nghĩa 5% cần kiểm định:{H0: μ=μ o( ¿ 2.5 )

H1: μ<μ0 }

XDTCKD: U=X−μ σ 0

√n

Nếu H0 đúng thì U~N(0;1) Khi đó ta tìm được phân vịu α sao cho:

P( U <−u α) = α

Vì α quá bé nên theo nguyên lí xác suất nhỏ ta có miền bác bỏ:

W α={u tn :u tn ←u α}

Trong đó: u tn=x−μ σ 0

√n

Tra bảng ta có u α =u0.05=1.65

Trung bình mẫu cụ thể:x= 1 n∑

i=1

k

x i=2.4615

Vì n>30 nên ta lấy σ ≈ s'

Trang 16

s ' 2= 1n−1∑

i=1

k

¿¿) ⇨ s'=0.5589

Khi đó u tn=x−μ0

s '

√n =2.4615−2.50.5589

√52 = -0.4967 Suy ra u tn>- u α ∉W α nên ta chưa thể bác bỏ giả thuyết H0

Kết luận: với mức ý nghĩa α=0.05 ta chưa thể nói mức điểm trung bình của

SV học văn bằng 2 là dưới 2.5

III Ứng dụng, mở rộng liên hệ thực tế

Khi nghiên cứu nhóm 2 đã chọn ngẫu nhiên 200 bạn của trường để tiến hành nghiên cứu và có thể đưa ra kết luận chung cho toàn bộ sinh viên Thương Mại với độ tin cậy Đây là một nghiên cứu nhỏ nhưng có tính ứng dụng cao Hiện nay các doanh nghiệp đưa ra thông báo tuyển dụng thì trình độ chuyên môn là yếu tố quan trọng nhất Khi Việt Nam đã và đang trên con đường hội nhập thì cơ hội phát triển rất cao tuy nhiên cơ hội việc làm thì lại là một thách thức Hiện nay khi các cử nhân, kỹ sư ra trường họ đều đã có trong tay một lĩnh vực chuyên môn nhất định vì vậy nếu bạn có 2 tấm bằng thì cơ hội việc là của bạn sẽ tăng lên rất nhiều

IV Kết luận

Sau một thời gian làm việc tích cực nhóm đã thu thập được số liệu và bằng phương pháp thống kê toán được học dưới sự giảng dạy của giáo viên bộ môn, nhóm đã hoàn thành bài ước lượng của mình với kết quả về tỷ lệ học văn bằng 2

Trang 17

của sinh viên ĐHTM là 0,18< p<0,34 với độ tin cậy là 0.99 và mức ý nghĩa là 5%thì sau khi kiểm định có thể thấy giả thuyết là không chính xác

Định dạng
Số trang	17
Dung lượng	52,79 KB