1. Trang chủ
  2. » Luận Văn - Báo Cáo

Một số bài toán thống kê xử lý bằng excel luận văn thạc sĩ toán học

43 623 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 43
Dung lượng 438,19 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Định nghĩa biến ngẫu nhiên liên tục Biến ngẫu nhiên X được gọi là biến ngẫu nhiên liên tục nếu hàm phân phối Fx của nó là hàm liên tục và tồn tại hàm số px sao cho... Biến ngẫu nhiên X

Trang 1

MỤC LỤC

Trang LỜI NÓI ĐẦU 3

KIẾN THỨC CƠ SỞ 5

1.1 Khái niệm biến ngẫu nhiên 5

1.1.1 Định nghĩa biến ngẫu nhiên 5

1.1.2 Định nghĩa biến ngẫu nhiên rời rạc 5

1.1.3 Định nghĩa biến ngẫu nhiên liên tục 5

1.2 Các quy luật phân phối xác suất thường gặp 6

1.2.1 Quy luật không-một A(p) 6

1.2.2 Quy luật phân phối nhị thức B(n, p) 6

1.2.3 Quy luật phân phối xác suất của tần suất 6

1.2.4 Quy luật phân phối Poisson P() 7

1.2.5 Quy luật phân phối đều U[a,b] 7

1.2.6 Quy luật phân phối mũ 7

1.2.7 Quy luật phân phối chuẩn N(, 2) 8

1.2.8 Quy luật phân phối ‘‘khi bình phương’’ 2(n) 9

1.2.9 Quy luật phân phối Student T(n) 9

1.2.10 Quy luật phân phối Fisher F(n, m) 10

1.3 Khái niệm thống kê 10

1.3.1 Định nghĩa mẫu ngẫu nhiên 10

1.3.2 Định nghĩa thống kê 11

1.3.3 Giá trị quan sát của thống kê 11

1.3.4 Trung bình mẫu 11

1.3.5 Phương sai mẫuS2 12

1.3.6 Phương sai S*2 12

1.3.7 Tần suất mẫu 12

1.4 Các phân phối xác suất của một số thống kê 13

1.4.1 Phân phối xác suất của trung bình mẫu 13

1.4.2 Phân phối xác suất của phương sai mẫu 14

1.4.3 Phân phối Student T(n) 15

1.4.4 Phân phối Fisher 16

SỬ DỤNG EXCEL ĐỂ XỬ LÝ THỐNG KÊ MỘT SỐ BÀI TOÁN KINH TẾ XÃ HỘI 17

Trang 2

2.1 Ước lượng tham số Kiểm định giả thuyết thống kê Phân tích phương

sai ……… 17

2.1.1 Ước lượng tham số 17

2.1.2 Kiểm định giả thuyết thống kê 23

2.1.2.1.Kiểm định giả thuyết thống kê về giá trị trung bình 25

2.1.2.2.Kiểm định giả thuyết về phương sai 27

2.1.3 Phân tích phương sai 28

2.2 Ứng dụng Excel tính các đặc trưng thống kê của một số bài toán kinh tế xã hội 30

2.2.1 Ứng dụng vào ước lượng tham số 32

2.2.2 Ứng dụng vào kiểm định giả thuyết thống kê 35

2.2.3 Ứng dụng vào phân tích phương sai 38

KẾT LUẬN 42

TÀI LIỆU THAM KHẢO 43

Trang 3

LỜI NÓI ĐẦU

Ước lượng tham số, kiểm định giả thuyết thống kê, phân tích phương sai

là một trong những phép so sánh có phạm vi ứng dụng rộng rãi trong nhiều lĩnh vực như khoa học tự nhiên, khoa học xã hội và đem lại hiệu quả trong sự phát triển của xã hội, nhất là lĩnh vực kinh tế

Trong thực tế, để giải quyết các bài toán kinh tế xã hội bằng cách tính thông thường sẽ gặp khó khăn vì thường các bài toán này có số liệu khá lớn và phức tạp

Như chúng ta đã biết có rất nhiều phần mềm nghiên cứu xử lý các nguồn

dữ liệu thống kê một cách nhanh chóng và đem lại hiệu suất cao như Statgraphics, Microsoft Excel…Đặc biệt từ những năm cuối thế kỷ XX, đầu thế

kỷ XXI công nghệ thông tin bùng nổ, ứng dụng của các phần mềm ngày càng được chú trọng Vì thế chức năng cải tiến phần mềm Excel cũng được các chuyên gia phần mềm nghiên cứu nhằm nâng cao độ chính xác của chức năng thống kê, điều đó sẽ giúp cho chúng ta có thể giải quyết các bài toán thống kê

có số liệu lớn, phức tạp được chính xác hơn

Hiện đã có thêm một số bài báo mới viết về việc xử lý các nguồn dữ liệu thống kê, tuy nhiên ở Việt Nam vẫn chưa đề cập đến những vấn đề chúng tôi đang tìm hiểu Trong khuôn khổ của bài luận văn này chúng tôi dựa vào bài báo của Guy Mélard và B.D McCullough sẽ tìm hiểu, và đi vào sử dụng phần mềm Excel với nhiều tính năng có thể xử lý các bài toán thống kê trong đó có các bài toán kinh tế xã hội mang tính thực tiễn cao

Luận văn gồm hai chương:

Chương 1 Kiến thức cơ sở

1.1 Khái niệm biến ngẫu nhiên

1.2 Các quy luật phân phối xác suất thường gặp

Trang 4

1.3 Khái niệm thống kê

1.4 Các phân phối xác suất của một số thống kê

Chương 2 Sử dụng Excel để xử lý thống kê một số bài toán kinh tế xã hội Đây là nội dung chính của luận văn, gồm các nội dung:

2.1 Ước lượng tham số Kiểm định giả thuyết thống kê Phân tích phương sai 2.2 Ứng dụng Excel tính các đặc trưng thống kê của một số bài toán kinh

tế xã hội

Luận văn được hoàn thành tại trường Đại học Vinh dưới sự hướng dẫn tận tình của thầy giáo TS Nguyễn Trung Hoà Tác giả xin được bày tỏ lòng biết ơn sâu sắc đến thầy giáo đã dành cho tác giả những sự quan tâm và giúp đỡ trong quá trình hoàn thành luận văn

Qua đây tác giả xin chân thành cảm ơn tới các thầy cô giáo trong khoa Toán và phòng Sau Đại học Trường Đại học Vinh, đặc biệt là các thầy cô giáo trong tổ Xác suất và Thống kê Toán học, cùng các bạn học viên cao học 18-Toán, những người đã quan tâm, giúp đỡ tạo điều kiện thuận lợi cho tác giả trong quá trình học tập và thực hiện luận văn này

Rất mong sự đóng góp chỉ bảo của các thầy cô giáo và bạn bè

Vinh, tháng 10 năm 2012

Tác giả

Trang 5

1.1 Khái niệm biến ngẫu nhiên

1.1.1 Định nghĩa biến ngẫu nhiên

Giả sử ( ,   ) ,  là không gian xác suất Khi đó ánh xạ

Biến ngẫu nhiên còn được gọi là đại lượng ngẫu nhiên

1.1.2 Định nghĩa biến ngẫu nhiên rời rạc

Một biến ngẫu nhiên gọi là biến ngẫu nhiên rời rạc nếu nó chỉ nhận một

số hữu hạn hoặc đếm được giá trị

1.1.3 Định nghĩa biến ngẫu nhiên liên tục

Biến ngẫu nhiên X được gọi là biến ngẫu nhiên liên tục nếu hàm phân phối F(x) của nó là hàm liên tục và tồn tại hàm số p(x) sao cho

Trang 6

1.2 Các quy luật phân phối xác suất thường gặp

1.2.1 Quy luật không-một A(p)

Định nghĩa Biến ngẫu nhiên X được gọi là tuân theo (có) quy luật 0-1

với tham số p nếu X là biến ngẫu nhiên rời rạc nhận một trong hai giá trị 0 hoặc

1 với xác suất tương ứng là 1- p và p Ký hiệu là X  A(p)

Các tham số đặc trưng của A(p) là

  , (1 )

D    

1.2.2 Quy luật phân phối nhị thức B(n, p)

Định nghĩa Biến ngẫu nhiên X được gọi là tuân theo (có) quy luật phân

phối nhị thức với các tham số n (nguyên dương) và p (dương) nếu X là biến

ngẫu nhiên rời rạc nhận tập các giá trị là 0, 1, …, n với các xác suất

D npp

1.2.3 Quy luật phân phối xác suất của tần suất

Nếu trong n phép thử độc lập Bernulli ta thay việc đếm tần số n i bởi việc tính tần suất n i/n thì biến ngẫu nhiên X có quy luật phân phối nhị thức theo tỉ

lệ, còn gọi là quy luật phân phối xác suất của tần suất

Như vậy các tham số đặc trưng là

p

  , (1 ) /

D  pp n

Trang 7

1.2.4 Quy luật phân phối Poisson P()

Định nghĩa Biến ngẫu nhiên X được gọi là tuân theo (có) quy luật phân

phối Poisson với tham số  (dương) nếu X là biến ngẫu nhiên rời rạc nhận tập

vô hạn các giá trị là 0 ; 1 ; 2 ; … ; n;… với các xác suất nhận giá trị i là

1.2.5 Quy luật phân phối đều U[a,b]

Định nghĩa Biến ngẫu nhiên X được gọi là tuân theo (có) quy luật phân phối

đều nếu hàm mật độ xác suất có dạng

f(x) =

1 , 0,

1.2.6 Quy luật phân phối mũ

Định nghĩa Biến ngẫu nhiên X được gọi là tuân theo (có) quy luật phân

phối mũ tham số  > 0 nếu hàm mật độ của nó có dạng

Trang 8

1.2.7 Quy luật phân phối chuẩn N(, 2 )

Định nghĩa Biến ngẫu nhiên liên tục X nhận giá trị trong khoảng

(, ) được gọi là tuân theo quy luật phân phối chuẩn với các tham số 

1 2

 ta nhận được biến ngẫu nhiên

U  N(0, 1) Biến ngẫu nhiên U này được gọi là biến ngẫu nhiên có phân phối

1

2

Định nghĩa Giá trị tới hạn chuẩn mức , ký hiệu U , là giá trị của biến

ngẫu nhiên U  N(0, 1) thoả mãn điều kiện

Trang 9

P(U > U ) =

1.2.8 Quy luật phân phối ‘‘khi bình phương’’ 2(n)

Định nghĩa Biến ngẫu nhiên X được gọi là biến ngẫu nhiên tuân theo

quy luật phân phối ‘‘khi bình phương’’ với n bậc tự do nếu nó là tổng bình phương của n biến ngẫu nhiên độc lập, có cùng quy luật phân phối chuẩn hoá

Nghĩa là nếu n biến ngẫu nhiên độc lập, i N(0, 1) với i =1, 2, …,n và

 = 2

1

n i i

( )n

thì X được gọi là biến ngẫu nhiên tuân theo quy luật phân phối ‘‘khi bình

phương’’ với n bậc tự do

Ký hiệu   2

( )n

2

là biến ngẫu nhiên liên tục nhận giá trị trong khoảng (0,  )

Ý nghĩa quy luật phân phối ‘‘khi bình phương’’ Nếu 1, 2,…, n

là biến ngẫu nhiên độc lập, có phân phối chuẩn hoá thì

2 1

1.2.9 Quy luật phân phối Student T(n)

Định nghĩa Biến ngẫu nhiên T được gọi là tuân theo quy luật phân phối Student với n bậc tự do nếu nó là biểu thức sau của biến ngẫu nhiên

U T V n

Trong đó U là biến ngẫu nhiên có phân phối chuẩn hoá và V là biến

ngẫu nhiên tuân theo quy luật phân phối ‘‘khi bình phương’’ với n bậc tự do

Trang 10

Ký hiệu TT n( )

T(n) là biến ngẫu nhiên liên tục nhận giá trị trong khoảng (, ) Hàm mật độ xác suất của nó khá phức tạp

1 2 2

1

1 ( , )

    với a > 0, b > 0 được gọi là hàm Bêta

Các tham số đặc trưng của TT n( ) là

 T 0,

2

n DT n

là hai biến ngẫu nhiên có phân phối

‘‘khi bình phương’’ với n, m bậc tự do thì biến ngẫu nhiên

2 2

/ /

n m

n F

 

, với m > 2,

2 2

1.3 Khái niệm thống kê

1.3.1 Định nghĩa mẫu ngẫu nhiên

Mẫu ngẫu nhiên kích thước n đối với một biến ngẫu nhiên X là tập hợp n biến

ngẫu nhiên  ,  ,…,  độc lập cùng phân phối xác suất với X, ký hiệu là

Trang 11

W = (1, 2,…, n)

Biến ngẫu nhiên X được gọi là biến ngẫu nhiên gốc

Các biến ngẫu nhiên i ( i = 1,…, n ) được gọi là các bản sao của X

Thống kê cũng có quy luật phân phối xác suất nhất định và cũng có các

số đặc trưng như kỳ vọng, phương sai…

1.3.3 Giá trị quan sát của thống kê

Với một mẫu quan sát W = (1, 2,…, n), ta tính được một giá trị bằng số G qs = f(1, 2,…, n ) của thống kê G, giá trị này được gọi là giá trị quan sát của thống kê G hay còn gọi là một thể hiện của thống kê G

Trang 12

1.3.5 Phương sai mẫuS2

Định nghĩa Phưong sai mẫu là thống kê được xác định bởi biểu thức

  

2

S cũng là một biến ngẫu nhiên

Nếu X là biến ngẫu nhiên có phương sai 2

thì phương sai mẫu 2

S có kỳ vọng

Định nghĩa Phương sai *2

S là thống kê được xác định bởi biểu thức

S cũng là biến ngẫu nhiên

Nếu X là biến ngẫu nhiên có phương sai 2

thì phương sai *2

S có kỳ vọng

Trong đó k là số lần xuất hiện A, n kích thước mẫu

Nếu A là một biến cố nào đó với xác suất xuất hiện A là p

Các giá trị đặc trưng của tần suất mẫu là

Trang 13

1.4 Các phân phối xác suất của một số thống kê

1.4.1 Phân phối xác suất của trung bình mẫu

Phân phối mẫu quan trọng đầu tiên được xem xét là phân phối của thống

kê trung bình mẫu 

Định lý Nếu các biến ngẫu nhiên 1, 2,…, n độc lập và có cùng phân phối theo quy luật chuẩn, thì mọi tổ hợp tuyến tính của chúng cũng có phân phối theo quy luật chuẩn

Chứng minh Trước hết ta nhắc lại:

Hàm đặc trưng của biến ngẫu nhiên X có phân phối chuẩn N( , 2

) là ( )t =

2 2 1 ( ) 2

Trang 14

Nghĩa là hàm đặc trưng của biến ngẫu nhiên ( 1 + 2) có phân phối chuẩn N(  1  2, 2 2 2 2

   )

Trường hợp n > 2, chứng minh hoàn toàn tương tự mọi tổ hợp tuyến tính của chúng cũng có phân phối theo quy luật chuẩn

Từ định lý trên ta có các kết luận sau:

Nếu biến ngẫu nhiên gốc X có quy luật phân phối chuẩn N( , 2

) thì

thống kê trung bình mẫu

1

1 n i i

có phân phối chuẩn hoá N(0, 1)

1.4.2 Phân phối xác suất của phương sai mẫu

G = 2

=

2 2

Trang 15

cũng sẽ tuân theo quy luật ‘‘khi bình phương’’ với n bậc tự do

1.4.3 Phân phối Student T(n)

Định lý Giả sử các biến ngẫu nhiên 1, 2,…, n độc lập, có cùng phân

(n 1)S

 ~ 2

(n 1)

 Khi đó thống kê

Trang 16

có phân phối tuân theo quy luật Student với (n – 1) bậc tự do

1.4.4 Phân phối Fisher

Định lý 2

1

S , 2 2

S là phương sai của mẫu ngẫu nhiên X, Y có kích thước cỡ

n, m có phân phối chuẩn tương ứng N( 1, 2

theo quy luật phân phối Fisher với ( n – 1, m – 1) bậc tự do

Trang 17

CHƯƠNG II

SỬ DỤNG EXCEL ĐỂ XỬ LÝ THỐNG KÊ MỘT SỐ BÀI

TOÁN KINH TẾ XÃ HỘI

Trong chương này trước hết chúng tôi tìm hiểu về khái niệm, các công thức cơ bản của ước lượng tham số, kiểm định giả thuyết thống kê và phân tích phương sai Sau đó sẽ lấy một số bài toán kinh tế xã hội mang tính thực tiễn cần giải quyết và xử lý các bài toán đó trên phần mềm Excel Từ đó đưa ra một số kết luận thống kê có ích

2.1 Ước lượng tham số Kiểm định giả thuyết thống kê Phân tích phương sai

2.1.1 Ước lượng tham số

Giả sử X là một biến ngẫu nhiên có tham số đặc trưng nào đó chưa biết

mà ta đang quan tâm Vấn đề đặt ra là : Căn cứ trên n giá trị 1,  2,…, n của

X đo được trên một mẫu kích thước n lấy ra từ tập hợp chính, cần tìm một giá trị gần đúng *

của tham số

Định nghĩa Hàm

G = *

( 1,  2,…, n) dùng để ước lượng tham số của biến ngẫu nhiên thông qua mẫu ngẫu nhiên W=(1, 2,…, n) được gọi là một hàm ước lượng của tham số

Việc lựa chọn một ước lượng nào là ‘‘tốt’’ được căn cứ trên các tiêu chuẩn dưới đây

Định nghĩa Ước lượng G = *

(1, 2,…, n ) được gọi là ước lượng không chệch của tham số  nếu

E(G) = 

Trang 18

Tính chất không chệch có nghĩa là ước lượng G không có sai số hệ thống

Định nghĩa 3 Ước lượng G = *

(1, 2,…, n ) được gọi là ước lượng vững nếu với mọi   0

lim

nPG = 1

Tính chất vững đảm bảo cho ước lượng gần tuỳ ý với xác suất cao khi kích thước đủ lớn

Định nghĩa 4 Ước lượng G = *

(1, 2,…, n ) được gọi là ước lượng hiệu quả nếu G là ước lượng không chệch và có phương sai D(G) bé nhất trong

tất cả các ước lượng không chệch khác của cùng mẫu ngẫu nhiên

Định nghĩa 5 Giá trị quan sát của thống kê G theo n giá trị quan sát

được của mẫu ngẫu nhiên được gọi là ước lượng điểm cho 

Giả sử X là biến ngẫu nhiên với EX = (chưa biết)

Nếu ta có một mẫu n giá trị 1, 2,…, n của X thì trung bình mẫu

1

1 n i i

n

  

sẽ được dùng làm ước lượng cho

Định lý Trung bình mẫu là ước lượng không chệch và vững cho kỳ vọng EX Chứng minh Ta có  là giá trị quan sát của

1

1

.

n i i

     

Trang 19

Chú ý Người ta đã chứng minh được trung bình mẫu là ước lượng hiệu

quả của EX

Giả sử X là biến ngẫu nhiên với DX = 2

2.1.1.1 Ước lượng bằng khoảng tin cậy

Định nghĩa Một khoảng với hai đầu mút ngẫu nhiên *

1

(1, 2,…, n)

và *

2

(1, 2,…, n ) (phụ thuộc vào n giá trị quan sát (1, 2,…, n) của X)

gọi là khoảng tin cậy cho tham số  với độ tin cậy (1 - ) nếu với xác suất (1 - ) ta có nằm trong khoảng nói trên Tức là

P  * 1

(1, 2,…, n) < < *

2

(1, 2,…, n ) = 1 - Như vậy xác suất để tham số không nằm trong khoảng ( *

1

(1,2,…, n), *

2

(1, 2,…, n)) chỉ bằng Khoảng ( *

Trang 20

Rõ ràng với cùng một độ tin cậy thì khoảng tin cậy càng hẹp càng giúp chúng ta xác định chính xác được tham số cần tìm

2.1.1.2 Ước lượng khoảng đối với kỳ vọng của biến ngẫu nhiên

Giả sử biến ngẫu nhiên X tuân theo quy luật phân phối chuẩn với kỳ vọng chưa biết Ta cần phải ước lượng khoảng tin cậy của nó với độ tin cậy (1 - )

Trong bài toán thực tế, ta không biết phương sai của tập hợp chính thì có thể xấp xỉ  bởi S

Ta thực hiện các bước sau:

S

Thì T có phân phối Student với (n – 1) bậc tự do, do đó với độ tin cậy cho

trước, ta luôn chọn được hai số 1 và 2 sao cho 1+2 = và từ đó xác định được các giá trị tới hạn T11 và T 2 sao cho

T(1 ,n1) T T(2 ,n1) 1

Trang 21

S T

S T

n 

 Trong thực tế, từ biểu thức trên người ta chỉ sử dụng một số trường hợp đặc biệt sau:

Khoảng tin cậy đối xứng: Khi 1 = 2 =

Khoảng tin cậy bên phải Khi 1 = 0, 2  , thì T(1,n1) T0  

Do đó khoảng tin cậy của kỳ vọng EX =

( ,n 1) ;

S T

Nếu kích thước mẫu lớn thì ta có thể xấp xỉ  bởi S

Ta thực hiện các bước sau:

Ngày đăng: 15/12/2015, 12:13

HÌNH ẢNH LIÊN QUAN

BẢNG ANOVA - Một số bài toán thống kê xử lý bằng excel  luận văn thạc sĩ toán học
BẢNG ANOVA (Trang 30)

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w