Thấy được tầm quan trọng của tự học, nhóm chúng em đã quyết định chọn đề tài về ước lượng thời gian tự học trung bình một ngày của sinh viên trường ĐH Thương Mại và mong muốn đưa ra cái
Trang 1TRƯỜNG ĐẠI HỌC THƯƠNG MẠI
KHOA QUẢN TRỊ NHÂN LỰC
-
-BÀI THẢO LUẬN
LÝ THUYẾT XÁC SUẤT THỐNG KÊ TOÁN
Nhóm : 10
Lớp : 1999AMAT0111
Giáo viên hướng dẫn: Nguyễn Thị Hiên
Hà Nội, 11/2019
Trang 2Lời mở đầu
Ngày nay thống kê được sử dụng rộng rãi hơn nhiều so với xuất phát điểm Đầu tiên là phục vụ cho chính quyền hay chính phủ mà còn có các tổ chức và các
cá nhân sử dụng thống kê để phân tích dữ liệu và đưa ra các quyết định
Thống kê là một trong những công cụ quản lí vĩ mô quan trọng, cung cấp các thông tin thống kê trung thực, khách quan, chính xác, đầy đủ, kịp thời trong việc đánh giá, dự báo tình hình, hoạch định chiến lược, chính sách, xây dựng kế hoạch nhằm phát triển kinh tế - xã hội và đáp ứng nhu cầu thông tin thống kê của các tổ chức, cá nhân
Cùng với lý thuyết ước lượng, lý thuyết kiểm định các giả thuyết thống kê làmột bộ phận quan trọng của thống kê toán Nó là phương tiện giúp ta giải quyết những bài toán nhìn từ góc độ khác liên quan đến dấu hiệu cần nghiên cứu trong tổng thể
Trong quá trình học đại học, bài thảo luận về phần thống kê sẽ giúp chúng taphần nào áp dụng những công thức vào thực tiễn và từ đó đưa ra những kết luận khách quan mà những con số muốn nói đến Cụ thể hơn đó là công việc nghiên cứu
về “ thời gian tự học một ngày của sinh viên ĐH Thương Mại” được thực hiện bởi các thành viên nhóm 10
Trang Tử đã có câu nói rằng: “ Đời sống có hạn mà sự học thì vô hạn” Xã hội không ngừng thay đổi đồng nghĩa với việc chúng ta phải tiếp thu tinh hoa của nhân loại từng giây từng phút Nhưng một ngày chỉ có 24h, ngoài việc học trên giảng đường mà chúng ta còn phải dành cho bản thân thời gian để tự học Khối lượng kiến thức khổng lồ, thầy cô chỉ là những người định hướng cho sinh viên, điều đó đã càng chứng tỏ được tầm quan trọng của việc tự học Tự học giúp chúng
ta không chỉ hiểu và hiểu sâu bài giảng hơn mà khi tự học ta còn rèn được tính tự giác,học hỏi được tri thức mới từ những tri thức mà ta học
Thấy được tầm quan trọng của tự học, nhóm chúng em đã quyết định chọn
đề tài về ước lượng thời gian tự học trung bình một ngày của sinh viên trường ĐH Thương Mại và mong muốn đưa ra cái nhìn tổng quát về thời gian tự học trung bình thông qua số liệu thực tế mà nhóm chúng em thu thập và khảo sát được từ bạnsinh viên trong trường khóa 53, 54, 55
Trang 4Xét một ĐLNN X , ký hiệu chung cho các tham số của đám đông cần ước lượng là θ Có hai phương pháp ước lượng θ là ước lượng điểm và ước lượng bằngkhoảng tin cậy
Trong thực tế ta thường dùng khái niệm ước lượng điểm như khi nói: “ước lượng cho lạm phát là 6,5%”; “ước lượng mức tăng trưởng kinh tế là 8%”, nghĩa làchỉ dùng một con số duy nhất để ước lượng
Ước lượng điểm trong thống kê toán là tìm ra một giá trị, tính toán trên mẫu,
do đó tùy thuộc mẫu mà kết quả sẽ có thể khác nhau
Bước 1 : Lấy mẫu ngẫu nhiên : W= (X1,X2,…,Xn) với n khá lớn
Xây dựng thống kê : f(X1,X2,…,Xn) phù hợp với tham số θ
( Trong đó: θ là một hằng số còn là một ĐLNN )
Bước 2 : Lấy mẫu cụ thể w = (x1,x2,…,xn) tính toán được giá trị cụ thể của thống
kê f(x1,x2,…,xn)
Bước 3 : Lấy θ = làm ước lượng điểm cho tham số θ
được gọi là ước lượng điểm của θ
Cùng với 1 mẫu ngẫu nhiên có thể xây dựng nhiều thống kê θ* khác nhau để ước lượng tham số θ Vì vậy, ta cần lựa chọn thống kê tốt nhất để ước lượng cho tham số θ dựa vào các tiêu chuẩn sau:
a. Ước lượng không chệch
Trang 5Thống kê được gọi là ước lượng không chệch của θ nếu:
E() = θNgược lại nếu E() ≠ θ thì ta nói là ước lượng chệch của θ
Ta có : là ước lượng không chệch của
là ước lượng không chệch của Nếu là ước lượng chệch của θ thỏa mãn điều kiện:
Thì được gọi là ước lượng tiệm cận không chệch của θ
Nếu là ước lượng không chệch của θ và
Thì là ước lượng vững của θ
c. Ước lượng hiệu quả
Thống kê được gọi là ước lượng hiệu quả của θ của ĐLNN gốc X, nếu nó làước lượng không chệch và có phương sai nhỏ nhất so với mọi ước lượng không chệch khác được xây dựng trên cùng 1 mẫu
Ta có : là ước lượng hiệu quả của
Tần suất mẫu f là ước lượng hiệu quả của tỉ lệ đám đông pĐương nhiên, nếu và là hai ước lượng không chệch của θ mà thì sẽ ước lượng tốt hơn
Trang 61.2. Ước lượng bằng khoảng tin cậy
1.2.1. Khái niệm
Phương pháp ước lượng điểm nói trên tuy có ưu điểm là đơn giản, nhưng cũng có nhược điểm rất lớn là không cho biết sai số cũng như không chỉ ra được khả năng mắc sai lầm khi ước lượng là bao nhiêu Đặc biệt khi kích thước mẫu nhỏ, ước lượng điểm tìm được có thể sai lệch rất hiều so với tham số cần ước lượng, nói một cách khác sai số của ước lượng có thể rất lớn Phương pháp ước lượng bằng khoảng tin cậy khắc phục được những nhược điểm này
Giả sử cần ước lượng tham số θ của ĐLNN X trên 1 đám đông
Bước 1 : Ta lấy mẫu ngẫu nhiên : W= (X1,X2,…,Xn)
Xây dựng thống kê G= f(X1,X2,…,Xn, θ) sao cho quy luật phân phối của G hoàn toàn xác định
Bước 2 : Với xác suất ( thường 0,9 0,99) cho trước, xác định , thỏa mãn Từ
Theo nguyên lý xác suất lớn : Khoảng ( được gọi là khoảng tin cậy của
Xác suất gọi là độ tin cậy
gọi là độ dài của khoảng tin cậy
Bước 3 : Với mẫu cụ thể w = (x1,x2,…,xn)
Tính toán và kết luận khoảng tin cậy
Chú ý :
Trang 7- Xác suất mắc sai lầm trong ước lượng khoảng là
- Khi G có phân phối N(0,1) hoặc phân phối STUDENT nếu chọn ta có khoảng tin cậy ngắn nhất và đó là khoảng tin cậy đối xứng
- Để ước lượng giá trị tối thiểu cho ta chọn :
Đây là khoảng tin cậy phải
- Để ước lượng giá trị tối đa cho ta chọn :
Đây là khoảng tin cậy trái
1.2.2. Ước lượng kỳ vọng toán của ĐLNN
Bài toán : Xét ĐLNN X có E(X) , Var(X) với chưa biết
Ta xét bài toán này trong 3 trường hợp sau :
Trường hợp 1 : , với đã biết
Trường hợp 2 : Chưa biết quy luật phân phối của X, n 30
Trường hợp 3 : , với chưa biết, n 30
1.2.2.1. Xét trường hợp 1 : , với đã biết
Bước 1 : Vì nên
Xây dựng thống kê :
Bước 2 : Đưa ra khoảng tin cậy
a. Khoảng tin cậy đối xứng ( )
Với độ tin cậy ta có :
1. Nếu bài toán cho (1) P(
2. Nếu bài toán cho khoảng tin cậy của ( hoặc )
3. Từ công thức ta có thể gặp các bài toán sau :
Bài toán 1 : Cho n, Tìm
Bài toán 2: Cho n, Tìm
Trang 8=
Bài toán 3 : Cho Tìm n
b. Khoảng tin cậy phải ( Ước lượng
Với độ tin cậy ta tìm được phân vị sao cho :
Khoảng tin cậy phải của là :
c. Khoảng tin cậy trái Ước lượng
Với độ tin cậy ta tìm được phân vị sao cho :
Khoảng tin cậy trái của là :
1.2.2.2. Xét trường hợp 2 : Chưa biết QLPP của X,
Bước 1 : Vì nên
Xây dựng thống kê :
Bước 2,3 làm tương tự như trường hợp 1
• Chú ý : Nếu chưa biết, vì nên ta lấy
1.2.2.3. Xét trường hợp 3 : với chưa biết ,
Trang 91.2.3. Ước lượng tỷ lệ đám đông
Bài toán : Xét đám đông có tỷ lệ phần tử mang dấu hiệu A là p trong đó p chưa biết, cần ước lượng
Chọn mẫu kích thước n khá lớn Ta có tần suất mẫu :
1 Khoảng tin cậy đối xứng dùng để ước lượng và tính được
2 Khoảng tin cậy phải dùng để ước lượng
3 Khoảng tin cậy
1.2.4 Ước lượng phương sai của ĐLNN phân phối chuẩn
Bài toán: Xét ĐLNN X phân phối chuẩn có E(X)= µ và Var(X)= trong đó
chưa biết, cần ước lượng:
B1: Vì X N(), XDTK:
B2: Đưa ra khoảng tin cậy
a. Khoảng tin cậy hai phía của
Với độ tin cậy ta tìm được phân vị sao cho
Trang 10
) =
( < < ) =
Khoảng tin cậy hai phía của (
b. Khoảng tin cậy phải của ƯL
Với độ tin cậy ta tìm được phân vị sao cho: ) =
=
Khoảng tin cậy phải của :
( )
c. Khoảng tin cậy trái của ƯL
Với độ tin cậy ta tìm được phân vị sao cho: ) =
=
Khoảng tin cậy trái của
( 0;
Trang 112. Kiểm định giả thuyết thống kê
2.1.1. Giả thuyết thống kê
Như ta đã biết, vì không điều tra cả đám đông nên ta không biết dạng phân phối xác suất của dấu hiệu cần nghiên cứu X trên đám đông hoặc có thể biết dạng phân phối xác suất của X nhưng chưa biết số đặc trưng Ɵ nào đó của nó Ta có thể đưa ra những nhận xét khác nhau về các yếu tố chưa biết, đó là các giả thuyết thống kê
Khi nghiên cứu hai hay nhiều ĐLNN thể hiện trên cùng một đám đông hoặc trên những đám đông khác nhau, ta có thể đưa ra các nhận xét: các ĐLNN độc lập hay phụ thuộc hoặc các tham số của chúng có bằng nhau hay không, đó cũng là cácgiả thuyết thống kê Một cách ngắn gọn ta có thể đưa ra định nghĩa:
Định nghĩa: Giả thuyết về dạng phân phối xác suất của ĐLNN, về các tham
số đặc trưng của ĐLNN hoặc về tính độc lập của các ĐLNN được gọi là giả thuyết thống kê, kí hiệu là H0.
Giả thuyết H0 được đưa ra kiểm định gọi là giả thuyết gốc, đó là giả thuyết tađang nghi ngờ Một giả thuyết trái với giả thuyết gốc được gọi là đối thuyết, kí hiệu là H1 Ta quy ước khi đã chọn cặp giả thuyết H0 và H1 thì việc bác bỏ H0 tức là chấp nhận H1 và ngược lại H0 và H1 lập thành một cặp giả thuyết thống kê
Công việc tiến hành theo một quy tắc hay một thủ tục nào đó để từ một mẫu
cụ thể được lấy ra từ đám đông cho phép ta đi đến quyết định: chấp nhận hay bác
bỏ một giả thuyết thống kê được gọi là kiểm định giả thuyết thống kê
Nguyên lí xác suất nhỏ: “ Một biến cố có xác suất khá bé thì trong thực hành
ta có thể coi nó không xảy ra trong một lần thực hiện phép thử ”
2.1.2. Thủ tục kiểm định giả thuyết thống kê
Để kiểm định một giả thuyết thống kê H0 với đối thiết H1 ta tiến hành như sau:
B1: - Xây dựng cặp giả thuyết H0 /H1
- Xây dựng Tiêu chuẩn kiểm định (XDTCKĐ)
Lấy mẫu ngẫu nhiên W=(X1,X2,…,Xn)
XDTK: G = f(X1,X2,…,Xn,θ0); (θ0 là tham số liên quan H0)
Trang 12Sao cho nếu H0 đúng thì QLPPXS của G hoàn toàn xác định.
G được gọi là Tiêu chuẩn kiểm định
B2: Tìm miền bác bỏ Wα
Do QLPPXS của G hoàn toàn xác định nên với xác suất α khá bé cho trước (thường (0.005; 0.1)) ta tìm được miền Wα
P(G ϵ Wα/H0)= α
Theo NLXS nhỏ, vì α khá bé nên nếu H0 đúng ta có thể coi
biến cố (G ϵ Wα) không xảy ra trong một lần lấy mẫu cụ thể
Wα: Miền bác bỏ; α : mức ý nghĩa
B3: Lấy mẫu cụ thể, tính, kết luận theo Quy tắc kiểm định
• Lấy một mẫu cụ thể w = (x1,x2,…,xn) ta tính được:
+ Nếu gtn ɇ Wα: Chưa có cơ sở bác bỏ H0
2.1.3. Các loại sai lầm khi kiểm định
• Sai lầm loại 1: là sai lầm bác bỏ H0 khi H0 đúng
Xác suất mắc phải sai lầm loại 1:
P(G ϵ Wα/H0) = α
Trang 13• Sai lầm loại 2: là sai lầm chấp nhận H0 khi H0 sai.
Xác suất mắc phải sai lầm loại 2:
P(G ɇ Wα /H1) = β
Sai lầm loại một và sai lầm loại hai có quan hệ mật thiết với nhau: khi kích thước mẫu xác định, nếu giảm α thì β tăng và ngược lại Do đó không thể lấy α bé tùy ý được
Tuy nhiên với một TCKĐ xác định, một kích thước mẫu cho trước và mức ý nghĩa α xác định ta có thể tìm được miền Wα sao cho xác xuất mắc sai lầm loại hai
β bé nhất ( tức là lực kiểm định lớn nhất) Những miền bác bỏ mà ta sử dụng sau này đều làm cực tiểu sai lầm loại hai trong những điều kiện nói trên
• Chú ý: Với cùng một mẫu kích thước n thì không thể cùng một lúc giảm xác suất mắc hai loại sai lầm
2.2. Kiểm định giả thuyết về tham số của ĐLNN
2.2.1. Kiểm định giả thuyết về kì vọng toán của ĐLNN
Giả sử ta cần nghiên cứu một dấu hiệu X thể hiện trên một đám đông Kí hiệu E(X) = μ, Var(X) = ơ2, trong đó μ chưa biết Từ một cơ sở nào đó người ta tìm được μ = μ0, nhưng nghi ngờ về điều này Với mức ý nghĩa α cho trước ta cần kiểmđịnh giả thuyết H0: μ = μ0
Từ đám đông cho ta lấy mẫu: W = (X1, X2,…,Xn) và tính được các đặc trưng mẫu:
∑
=
= n
i i
X n
~
2
n N
Xây dựng tiêu chuẩn kiểm định (XDTCKĐ):
Trang 14n
X U
0
:
:
µµ
2
u U P
:
:
µµ
:
:
µµ
Trang 15:
:
µ µ
Ta có P-giá trị =
)(
:
:
µ µ
Ta có P-giá trị =
) ( U utn
P >
0 0
:
:
µ µ
Ta có P-giá trị =
) ( U utn
Trang 16- Nếu 0,01 ≤ P-giá trị < 0,05: Có cơ sở để bác bỏ H0.
- Nếu P-giá trị < 0,01: Có cơ sở chắc chắn để bác bỏ H0.
b) Cách thứ hai: Quy định trước mức ý nghĩa α
Tính P-giá trị rồi so sánh với
* Chú ý: Các công thức tìm P-giá trị trên còn được dùng cho các bài toán kiểm
định giả thuyết thống kê khác, trong đó có dùng tiêu chuẩn kiểm định U
2.2.1.2 ĐLNN X trên đám đông có phối chuẩn với σ
chưa biết:
S
X T
0
:
:
µ µ
Với mức ý nghĩa α
cho trước ta có thể tìm được
) 1 ( 2
Từ đó ta có miền bác bỏ:
Trang 17:
µ µ
Với mức ý nghĩa α
cho trước ta có thể tìm được
) 1 (n−
tα
sao cho:α
α =
> − ) ( T t(n 1 )
0 0
:
:
µ µ
Với mức ý nghĩa α
cho trước ta có thể tìm được
) 1 (n−
tα
sao cho:α
α =
−
< − ) ( T t(n 1 )
0
:
:
µ µ
Trang 18Ta có P-giá trị =
)(
2P T > t tn
Trong đó T~T(n-1) và
n s
:
:
µ µ
Ta có P-giá trị =
) ( T ttn
P >
0 0
:
:
µ µ
Ta có P-giá trị =
) ( T ttn
P <
* Chú ý: + Các công thức tìm P-giá trị trên còn được dùng cho các bài toán kiểm
định giả thuyết thống kê khác, trong đó có dùng tiêu chuẩn kiểm định T
Sau khi tìm được P-giá trị, việc kết luận được tiến hành như trong mục
II.1.1.
+ Khi ĐLNN có phân phối chuẩn, mặc dù
2
σ
chưa biết, nhưng nếu kích
thước mẫu n > 30 người ta thường dùng chuẩn U như trong mục II.1.1 Đến khi
2
n N
X ≅ µ σ
Ta vẫn dùng tiêu chuẩn kiểm định:
Trang 19X U
σµ0
−
=
Khi đó giả thuyết H0 đúng thì U sẽ xấp xỉ phân phối chuẩn N(0;1) Phần còn lại
tiến hành như mục II.1.1 ta cũng cần nhớ rằng: nếuσ
2 chưa biết, nhứng n>30 ta
có thể lấy σ ≈ s '
2.2.2 Kiểm định giả thuyết về tỷ lệ của đám đông
Bài toán: Xét đám đông có tỷ lệ phần tư mang dấu hiệu A
là p(p chính là xác suất để rút ngẫu nhiên được phần tử mang dấu hiệu A từ đám đông)
Từ cơ sở nào đó người ta đặt giả thuyết H0: p=p0 Chọn từ đám đông Nghi ngờ GT
trên với mức ý nghĩa α ta kiểm định 1 trong 3 bài toán sau:
~
n
pq p N f
q p
p f U
0 0 0
−
=
Nếu H0 đúng U~N(0;1)
B2:
Trang 202 p
p ≠ P [( U < uα/2) = α Wα = { utn : utn > uα/2}
2 0
2 p
p > P ( U > uα) = α Wα = { utn : utn > uα}
2 0
p f
u tn
0 0 0
2.2.3 Kiểm định giả thuyết về phương sai của ĐLNN phân phối
Bài toán: Xét ĐLNN X phân phối chuẩn với E(X)=μ,
Var(X)=σ2, σ2 chưa biết
Trang 21Từ cơ sở nào đó người ta đặt giả thuyết
2 0
2
0 : σ = σ
H
Nghi ngờ GT trên với
mức ý nghĩa α ta kiểm định 1 trong 3 bài toán sau:
0 0
:
:
σσ
0 0
:
:
σσ
0 0
:
:
σσ
2 σ
σ ≠ P [( χ < χ1−α/22(n−1))
α χ
χ > α = + ( 2 /22(n−1))]
) 1 ( 2 2 / 1 2
2 > n−
α
χ χ
2 0
Trang 222 0
2 σ
σ < ( χ2 < χ1−α2(n−1)) = α
tn tn
B3: Tính và kết luận theo quy tắc kiểm định
• Với mẫu cụ thể tính
2 0
2
2 ( 1 ) '
σ
s n
Trang 23PHẦN II: ÁP DỤNG VÀO BÀI TẬP NHÓM
Bài toán: Phỏng vấn 200 sinh viên trường Đại học Thương Mại về thời gian tự học
một ngày ta được bảng số liệu sau:
Thời gian tự học
xi
Từ 1h
0.5-Từ 1.5h
1h-Từ 2h
1.5-Từ 2.5h
2-Từ 3h
Trang 241
.1
i
i x
n n
x
( 546 200 1 , 52 ) 0 , 42171 199
1 )
(
1 )
'
1
2 2
k i
i
i x n x
n n
~
2
n N
Xây dựng thống kê:
)1
;0(
~
X U
Trang 25Thay U ta có:
γ σ
P
<=>
γ
σ µ
X n u
P
<=>
γ
σ µ
X n
u X P
05 0 95
0
1 − = = > =
γ
96 , 1
025 0
2
/ = U =
uα
09 0 200
6494 , 0
Trang 26=> Kết luận : Với độ tin cậy 95% có thể nói rằng thời gian tự học trung bình mộtngày của sinh viên trường Đại học Thương Mại nằm trong khoảng ( 1,43 ; 1,61 )
b) Với mức ý nghĩa 5% kiểm định giả thuyết cho rằng thời gian tự học trungbình một ngày của sinh viên trường Đại học Thương Mại là thấp hơn 2 giờ.Gọi X là thời gian tự học của sinh viên Đại học Thương Mại trong 1 ngày
Vì n=200>30 nên
),(
~
2
n N
X U
/σ
P ( < − ) = = > = tn : tn < −
Ta có:
52,1
i x
n n x
Trang 2742171 ,
0 )
(
1 )
'
(
1
2 2
k i
i
i x n x
n n
,10200
/6494,0
252,1/