Định nghĩa biến ngẫu nhiên liên tục Biến ngẫu nhiên X được gọi là biến ngẫu nhiên liên tục nếu hàm phân phối Fx của nó là hàm liên tục và tồn tại hàm số px sao cho... Biến ngẫu nhiên X
Trang 1MỤC LỤC
Trang LỜI NÓI ĐẦU 3
KIẾN THỨC CƠ SỞ 5
1.1 Khái niệm biến ngẫu nhiên 5
1.1.1 Định nghĩa biến ngẫu nhiên 5
1.1.2 Định nghĩa biến ngẫu nhiên rời rạc 5
1.1.3 Định nghĩa biến ngẫu nhiên liên tục 5
1.2 Các quy luật phân phối xác suất thường gặp 6
1.2.1 Quy luật không-một A(p) 6
1.2.2 Quy luật phân phối nhị thức B(n, p) 6
1.2.3 Quy luật phân phối xác suất của tần suất 6
1.2.4 Quy luật phân phối Poisson P() 7
1.2.5 Quy luật phân phối đều U[a,b] 7
1.2.6 Quy luật phân phối mũ 7
1.2.7 Quy luật phân phối chuẩn N(, 2) 8
1.2.8 Quy luật phân phối ‘‘khi bình phương’’ 2(n) 9
1.2.9 Quy luật phân phối Student T(n) 9
1.2.10 Quy luật phân phối Fisher F(n, m) 10
1.3 Khái niệm thống kê 10
1.3.1 Định nghĩa mẫu ngẫu nhiên 10
1.3.2 Định nghĩa thống kê 11
1.3.3 Giá trị quan sát của thống kê 11
1.3.4 Trung bình mẫu 11
1.3.5 Phương sai mẫuS2 12
1.3.6 Phương sai S*2 12
1.3.7 Tần suất mẫu 12
1.4 Các phân phối xác suất của một số thống kê 13
1.4.1 Phân phối xác suất của trung bình mẫu 13
1.4.2 Phân phối xác suất của phương sai mẫu 14
1.4.3 Phân phối Student T(n) 15
1.4.4 Phân phối Fisher 16
SỬ DỤNG EXCEL ĐỂ XỬ LÝ THỐNG KÊ MỘT SỐ BÀI TOÁN KINH TẾ XÃ HỘI 17
Trang 22.1 Ước lượng tham số Kiểm định giả thuyết thống kê Phân tích phương
sai ……… 17
2.1.1 Ước lượng tham số 17
2.1.2 Kiểm định giả thuyết thống kê 23
2.1.2.1.Kiểm định giả thuyết thống kê về giá trị trung bình 25
2.1.2.2.Kiểm định giả thuyết về phương sai 27
2.1.3 Phân tích phương sai 28
2.2 Ứng dụng Excel tính các đặc trưng thống kê của một số bài toán kinh tế xã hội 30
2.2.1 Ứng dụng vào ước lượng tham số 32
2.2.2 Ứng dụng vào kiểm định giả thuyết thống kê 35
2.2.3 Ứng dụng vào phân tích phương sai 38
KẾT LUẬN 42
TÀI LIỆU THAM KHẢO 43
Trang 3LỜI NÓI ĐẦU
Ước lượng tham số, kiểm định giả thuyết thống kê, phân tích phương sai
là một trong những phép so sánh có phạm vi ứng dụng rộng rãi trong nhiều lĩnh vực như khoa học tự nhiên, khoa học xã hội và đem lại hiệu quả trong sự phát triển của xã hội, nhất là lĩnh vực kinh tế
Trong thực tế, để giải quyết các bài toán kinh tế xã hội bằng cách tính thông thường sẽ gặp khó khăn vì thường các bài toán này có số liệu khá lớn và phức tạp
Như chúng ta đã biết có rất nhiều phần mềm nghiên cứu xử lý các nguồn
dữ liệu thống kê một cách nhanh chóng và đem lại hiệu suất cao như Statgraphics, Microsoft Excel…Đặc biệt từ những năm cuối thế kỷ XX, đầu thế
kỷ XXI công nghệ thông tin bùng nổ, ứng dụng của các phần mềm ngày càng được chú trọng Vì thế chức năng cải tiến phần mềm Excel cũng được các chuyên gia phần mềm nghiên cứu nhằm nâng cao độ chính xác của chức năng thống kê, điều đó sẽ giúp cho chúng ta có thể giải quyết các bài toán thống kê
có số liệu lớn, phức tạp được chính xác hơn
Hiện đã có thêm một số bài báo mới viết về việc xử lý các nguồn dữ liệu thống kê, tuy nhiên ở Việt Nam vẫn chưa đề cập đến những vấn đề chúng tôi đang tìm hiểu Trong khuôn khổ của bài luận văn này chúng tôi dựa vào bài báo của Guy Mélard và B.D McCullough sẽ tìm hiểu, và đi vào sử dụng phần mềm Excel với nhiều tính năng có thể xử lý các bài toán thống kê trong đó có các bài toán kinh tế xã hội mang tính thực tiễn cao
Luận văn gồm hai chương:
Chương 1 Kiến thức cơ sở
1.1 Khái niệm biến ngẫu nhiên
1.2 Các quy luật phân phối xác suất thường gặp
Trang 41.3 Khái niệm thống kê
1.4 Các phân phối xác suất của một số thống kê
Chương 2 Sử dụng Excel để xử lý thống kê một số bài toán kinh tế xã hội Đây là nội dung chính của luận văn, gồm các nội dung:
2.1 Ước lượng tham số Kiểm định giả thuyết thống kê Phân tích phương sai 2.2 Ứng dụng Excel tính các đặc trưng thống kê của một số bài toán kinh
tế xã hội
Luận văn được hoàn thành tại trường Đại học Vinh dưới sự hướng dẫn tận tình của thầy giáo TS Nguyễn Trung Hoà Tác giả xin được bày tỏ lòng biết ơn sâu sắc đến thầy giáo đã dành cho tác giả những sự quan tâm và giúp đỡ trong quá trình hoàn thành luận văn
Qua đây tác giả xin chân thành cảm ơn tới các thầy cô giáo trong khoa Toán và phòng Sau Đại học Trường Đại học Vinh, đặc biệt là các thầy cô giáo trong tổ Xác suất và Thống kê Toán học, cùng các bạn học viên cao học 18-Toán, những người đã quan tâm, giúp đỡ tạo điều kiện thuận lợi cho tác giả trong quá trình học tập và thực hiện luận văn này
Rất mong sự đóng góp chỉ bảo của các thầy cô giáo và bạn bè
Vinh, tháng 10 năm 2012
Tác giả
Trang 51.1 Khái niệm biến ngẫu nhiên
1.1.1 Định nghĩa biến ngẫu nhiên
Giả sử ( , ) , là không gian xác suất Khi đó ánh xạ
Biến ngẫu nhiên còn được gọi là đại lượng ngẫu nhiên
1.1.2 Định nghĩa biến ngẫu nhiên rời rạc
Một biến ngẫu nhiên gọi là biến ngẫu nhiên rời rạc nếu nó chỉ nhận một
số hữu hạn hoặc đếm được giá trị
1.1.3 Định nghĩa biến ngẫu nhiên liên tục
Biến ngẫu nhiên X được gọi là biến ngẫu nhiên liên tục nếu hàm phân phối F(x) của nó là hàm liên tục và tồn tại hàm số p(x) sao cho
Trang 61.2 Các quy luật phân phối xác suất thường gặp
1.2.1 Quy luật không-một A(p)
Định nghĩa Biến ngẫu nhiên X được gọi là tuân theo (có) quy luật 0-1
với tham số p nếu X là biến ngẫu nhiên rời rạc nhận một trong hai giá trị 0 hoặc
1 với xác suất tương ứng là 1- p và p Ký hiệu là X A(p)
Các tham số đặc trưng của A(p) là
, (1 )
D
1.2.2 Quy luật phân phối nhị thức B(n, p)
Định nghĩa Biến ngẫu nhiên X được gọi là tuân theo (có) quy luật phân
phối nhị thức với các tham số n (nguyên dương) và p (dương) nếu X là biến
ngẫu nhiên rời rạc nhận tập các giá trị là 0, 1, …, n với các xác suất
D np p
1.2.3 Quy luật phân phối xác suất của tần suất
Nếu trong n phép thử độc lập Bernulli ta thay việc đếm tần số n i bởi việc tính tần suất n i/n thì biến ngẫu nhiên X có quy luật phân phối nhị thức theo tỉ
lệ, còn gọi là quy luật phân phối xác suất của tần suất
Như vậy các tham số đặc trưng là
p
, (1 ) /
D p p n
Trang 7
1.2.4 Quy luật phân phối Poisson P()
Định nghĩa Biến ngẫu nhiên X được gọi là tuân theo (có) quy luật phân
phối Poisson với tham số (dương) nếu X là biến ngẫu nhiên rời rạc nhận tập
vô hạn các giá trị là 0 ; 1 ; 2 ; … ; n;… với các xác suất nhận giá trị i là
1.2.5 Quy luật phân phối đều U[a,b]
Định nghĩa Biến ngẫu nhiên X được gọi là tuân theo (có) quy luật phân phối
đều nếu hàm mật độ xác suất có dạng
f(x) =
1 , 0,
1.2.6 Quy luật phân phối mũ
Định nghĩa Biến ngẫu nhiên X được gọi là tuân theo (có) quy luật phân
phối mũ tham số > 0 nếu hàm mật độ của nó có dạng
Trang 81.2.7 Quy luật phân phối chuẩn N(, 2 )
Định nghĩa Biến ngẫu nhiên liên tục X nhận giá trị trong khoảng
(, ) được gọi là tuân theo quy luật phân phối chuẩn với các tham số và
1 2
ta nhận được biến ngẫu nhiên
U N(0, 1) Biến ngẫu nhiên U này được gọi là biến ngẫu nhiên có phân phối
1
2
Định nghĩa Giá trị tới hạn chuẩn mức , ký hiệu U , là giá trị của biến
ngẫu nhiên U N(0, 1) thoả mãn điều kiện
Trang 9P(U > U ) =
1.2.8 Quy luật phân phối ‘‘khi bình phương’’ 2(n)
Định nghĩa Biến ngẫu nhiên X được gọi là biến ngẫu nhiên tuân theo
quy luật phân phối ‘‘khi bình phương’’ với n bậc tự do nếu nó là tổng bình phương của n biến ngẫu nhiên độc lập, có cùng quy luật phân phối chuẩn hoá
Nghĩa là nếu n biến ngẫu nhiên độc lập, i N(0, 1) với i =1, 2, …,n và
= 2
1
n i i
( )n
thì X được gọi là biến ngẫu nhiên tuân theo quy luật phân phối ‘‘khi bình
phương’’ với n bậc tự do
Ký hiệu 2
( )n
2
là biến ngẫu nhiên liên tục nhận giá trị trong khoảng (0, )
Ý nghĩa quy luật phân phối ‘‘khi bình phương’’ Nếu 1, 2,…, n
là biến ngẫu nhiên độc lập, có phân phối chuẩn hoá thì
2 1
1.2.9 Quy luật phân phối Student T(n)
Định nghĩa Biến ngẫu nhiên T được gọi là tuân theo quy luật phân phối Student với n bậc tự do nếu nó là biểu thức sau của biến ngẫu nhiên
U T V n
Trong đó U là biến ngẫu nhiên có phân phối chuẩn hoá và V là biến
ngẫu nhiên tuân theo quy luật phân phối ‘‘khi bình phương’’ với n bậc tự do
Trang 10Ký hiệu T T n( )
T(n) là biến ngẫu nhiên liên tục nhận giá trị trong khoảng (, ) Hàm mật độ xác suất của nó khá phức tạp
1 2 2
1
1 ( , )
với a > 0, b > 0 được gọi là hàm Bêta
Các tham số đặc trưng của T T n( ) là
T 0,
2
n DT n
là hai biến ngẫu nhiên có phân phối
‘‘khi bình phương’’ với n, m bậc tự do thì biến ngẫu nhiên
2 2
/ /
n m
n F
, với m > 2,
2 2
1.3 Khái niệm thống kê
1.3.1 Định nghĩa mẫu ngẫu nhiên
Mẫu ngẫu nhiên kích thước n đối với một biến ngẫu nhiên X là tập hợp n biến
ngẫu nhiên , ,…, độc lập cùng phân phối xác suất với X, ký hiệu là
Trang 11W = (1, 2,…, n)
Biến ngẫu nhiên X được gọi là biến ngẫu nhiên gốc
Các biến ngẫu nhiên i ( i = 1,…, n ) được gọi là các bản sao của X
Thống kê cũng có quy luật phân phối xác suất nhất định và cũng có các
số đặc trưng như kỳ vọng, phương sai…
1.3.3 Giá trị quan sát của thống kê
Với một mẫu quan sát W = (1, 2,…, n), ta tính được một giá trị bằng số G qs = f(1, 2,…, n ) của thống kê G, giá trị này được gọi là giá trị quan sát của thống kê G hay còn gọi là một thể hiện của thống kê G
Trang 121.3.5 Phương sai mẫuS2
Định nghĩa Phưong sai mẫu là thống kê được xác định bởi biểu thức
2
S cũng là một biến ngẫu nhiên
Nếu X là biến ngẫu nhiên có phương sai 2
thì phương sai mẫu 2
S có kỳ vọng
Định nghĩa Phương sai *2
S là thống kê được xác định bởi biểu thức
S cũng là biến ngẫu nhiên
Nếu X là biến ngẫu nhiên có phương sai 2
thì phương sai *2
S có kỳ vọng
Trong đó k là số lần xuất hiện A, n kích thước mẫu
Nếu A là một biến cố nào đó với xác suất xuất hiện A là p
Các giá trị đặc trưng của tần suất mẫu là
Trang 131.4 Các phân phối xác suất của một số thống kê
1.4.1 Phân phối xác suất của trung bình mẫu
Phân phối mẫu quan trọng đầu tiên được xem xét là phân phối của thống
kê trung bình mẫu
Định lý Nếu các biến ngẫu nhiên 1, 2,…, n độc lập và có cùng phân phối theo quy luật chuẩn, thì mọi tổ hợp tuyến tính của chúng cũng có phân phối theo quy luật chuẩn
Chứng minh Trước hết ta nhắc lại:
Hàm đặc trưng của biến ngẫu nhiên X có phân phối chuẩn N( , 2
) là ( )t =
2 2 1 ( ) 2
Trang 14Nghĩa là hàm đặc trưng của biến ngẫu nhiên ( 1 + 2) có phân phối chuẩn N( 1 2, 2 2 2 2
)
Trường hợp n > 2, chứng minh hoàn toàn tương tự mọi tổ hợp tuyến tính của chúng cũng có phân phối theo quy luật chuẩn
Từ định lý trên ta có các kết luận sau:
Nếu biến ngẫu nhiên gốc X có quy luật phân phối chuẩn N( , 2
) thì
thống kê trung bình mẫu
1
1 n i i
có phân phối chuẩn hoá N(0, 1)
1.4.2 Phân phối xác suất của phương sai mẫu
G = 2
=
2 2
Trang 15cũng sẽ tuân theo quy luật ‘‘khi bình phương’’ với n bậc tự do
1.4.3 Phân phối Student T(n)
Định lý Giả sử các biến ngẫu nhiên 1, 2,…, n độc lập, có cùng phân
(n 1)S
~ 2
(n 1)
Khi đó thống kê
Trang 16có phân phối tuân theo quy luật Student với (n – 1) bậc tự do
1.4.4 Phân phối Fisher
Định lý 2
1
S , 2 2
S là phương sai của mẫu ngẫu nhiên X, Y có kích thước cỡ
n, m có phân phối chuẩn tương ứng N( 1, 2
theo quy luật phân phối Fisher với ( n – 1, m – 1) bậc tự do
Trang 17CHƯƠNG II
SỬ DỤNG EXCEL ĐỂ XỬ LÝ THỐNG KÊ MỘT SỐ BÀI
TOÁN KINH TẾ XÃ HỘI
Trong chương này trước hết chúng tôi tìm hiểu về khái niệm, các công thức cơ bản của ước lượng tham số, kiểm định giả thuyết thống kê và phân tích phương sai Sau đó sẽ lấy một số bài toán kinh tế xã hội mang tính thực tiễn cần giải quyết và xử lý các bài toán đó trên phần mềm Excel Từ đó đưa ra một số kết luận thống kê có ích
2.1 Ước lượng tham số Kiểm định giả thuyết thống kê Phân tích phương sai
2.1.1 Ước lượng tham số
Giả sử X là một biến ngẫu nhiên có tham số đặc trưng nào đó chưa biết
mà ta đang quan tâm Vấn đề đặt ra là : Căn cứ trên n giá trị 1, 2,…, n của
X đo được trên một mẫu kích thước n lấy ra từ tập hợp chính, cần tìm một giá trị gần đúng *
của tham số
Định nghĩa Hàm
G = *
( 1, 2,…, n) dùng để ước lượng tham số của biến ngẫu nhiên thông qua mẫu ngẫu nhiên W=(1, 2,…, n) được gọi là một hàm ước lượng của tham số
Việc lựa chọn một ước lượng nào là ‘‘tốt’’ được căn cứ trên các tiêu chuẩn dưới đây
Định nghĩa Ước lượng G = *
(1, 2,…, n ) được gọi là ước lượng không chệch của tham số nếu
E(G) =
Trang 18Tính chất không chệch có nghĩa là ước lượng G không có sai số hệ thống
Định nghĩa 3 Ước lượng G = *
(1, 2,…, n ) được gọi là ước lượng vững nếu với mọi 0
lim
nPG = 1
Tính chất vững đảm bảo cho ước lượng gần tuỳ ý với xác suất cao khi kích thước đủ lớn
Định nghĩa 4 Ước lượng G = *
(1, 2,…, n ) được gọi là ước lượng hiệu quả nếu G là ước lượng không chệch và có phương sai D(G) bé nhất trong
tất cả các ước lượng không chệch khác của cùng mẫu ngẫu nhiên
Định nghĩa 5 Giá trị quan sát của thống kê G theo n giá trị quan sát
được của mẫu ngẫu nhiên được gọi là ước lượng điểm cho
Giả sử X là biến ngẫu nhiên với EX = (chưa biết)
Nếu ta có một mẫu n giá trị 1, 2,…, n của X thì trung bình mẫu
1
1 n i i
n
sẽ được dùng làm ước lượng cho
Định lý Trung bình mẫu là ước lượng không chệch và vững cho kỳ vọng EX Chứng minh Ta có là giá trị quan sát của
1
1
.
n i i
Trang 19Chú ý Người ta đã chứng minh được trung bình mẫu là ước lượng hiệu
quả của EX
Giả sử X là biến ngẫu nhiên với DX = 2
2.1.1.1 Ước lượng bằng khoảng tin cậy
Định nghĩa Một khoảng với hai đầu mút ngẫu nhiên *
1
(1, 2,…, n)
và *
2
(1, 2,…, n ) (phụ thuộc vào n giá trị quan sát (1, 2,…, n) của X)
gọi là khoảng tin cậy cho tham số với độ tin cậy (1 - ) nếu với xác suất (1 - ) ta có nằm trong khoảng nói trên Tức là
P * 1
(1, 2,…, n) < < *
2
(1, 2,…, n ) = 1 - Như vậy xác suất để tham số không nằm trong khoảng ( *
1
(1,2,…, n), *
2
(1, 2,…, n)) chỉ bằng Khoảng ( *
Trang 20Rõ ràng với cùng một độ tin cậy thì khoảng tin cậy càng hẹp càng giúp chúng ta xác định chính xác được tham số cần tìm
2.1.1.2 Ước lượng khoảng đối với kỳ vọng của biến ngẫu nhiên
Giả sử biến ngẫu nhiên X tuân theo quy luật phân phối chuẩn với kỳ vọng chưa biết Ta cần phải ước lượng khoảng tin cậy của nó với độ tin cậy (1 - )
Trong bài toán thực tế, ta không biết phương sai của tập hợp chính thì có thể xấp xỉ bởi S
Ta thực hiện các bước sau:
S
Thì T có phân phối Student với (n – 1) bậc tự do, do đó với độ tin cậy cho
trước, ta luôn chọn được hai số 1 và 2 sao cho 1+2 = và từ đó xác định được các giá trị tới hạn T11 và T 2 sao cho
T(1 ,n1) T T(2 ,n1) 1
Trang 21S T
S T
n
Trong thực tế, từ biểu thức trên người ta chỉ sử dụng một số trường hợp đặc biệt sau:
Khoảng tin cậy đối xứng: Khi 1 = 2 =
Khoảng tin cậy bên phải Khi 1 = 0, 2 , thì T(1,n1) T0
Do đó khoảng tin cậy của kỳ vọng EX = là
( ,n 1) ;
S T
Nếu kích thước mẫu lớn thì ta có thể xấp xỉ bởi S
Ta thực hiện các bước sau: