1. Trang chủ
  2. » Giáo án - Bài giảng

KIỂM ĐỊNH GIẢ THIẾT

21 95 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 21
Dung lượng 833,99 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Nguyễn Thống19 KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH VỚI PHÂN PHỐI Phân phối Student bậc tự do df df  tăng  Phân phối Student  Phân phối chuẩn Phân phối Student được áp dụng thay thế phân

Trang 1

PGS TS Nguyễn Thống

1

Khoa Kinh tế & Quản trị Kinh doanh

Giảng viên: PGS TS NGUYỄN THỐNG

E-mail : nguyenthong@hcmut.edu.vn or nthong56@yahoo.fr

NỘI DUNG MÔN HỌC

Chương 1: Thống kê mô tả & Phân phối xác

suất cơ bản (ôn).

Chương 2: Kiểm định giả thuyết thống kê

Chương 3: Hồi quy tuyến tính (HQTT) đơn.

Chương 4: Hồi quy tuyến tính bội.

Chương 5: Hồi quy tuyến tính với biến giả & giả

tuyến tính.

Chương 6: Đánh giá chất lượng hồi quy.

Chương 7: Phân tích chuỗi thời gian.

Chương 8: Giới thiệu phần mềm SPSS áp dụng

cho HQTT & Chuỗi thời gian

 Được sử dụng khi phải đưa ra các

kết luận liên quan đến các biến ở

dạng xác suất.

 Ví dụ: So sánh 2 giá trị của biến

liên tục  Xác suất để 2 biến này BẰNG

1 p(t) e

so với một quy luật xác suất DỰ KIẾN.

Bước 1 : Thành lập giả thiết H0 và phản giả thiết H1.

Bước 2 : Đề xuất ngưỡng chấp nhận của kiểm định

Bước 3 : Chọn lựa tham số thống kê thích hợp cho

Trang 2

Dùng phân phối chuẩn

 Dùng phân phối Student

Ví dụ Kết quả công bố của cơ quan

quản lý lao động về lương trung bình

theo giờ của các khu công nghiệp là

15000đ/giờ Giả thiết giá trị TB tuân

theo phân phối chuẩn.

Để kiểm định, lấy mẫu ngẫu nhiên 60

người, kết quả tính có X tb =14000đ/giờ,

Độ lệch chuẩn giá trị trung bình của mẫu có kích thước n

Độ lệch chuẩn tập hợp mẹ (hoặc mẫu khảo sát)

Trang 3

PGS TS Nguyễn Thống

13

Từ đó:

 a=1012,14

Ngồi ra từ số liệu mẫu ta thấy:

 Giả thiết H0 được chấp nhận.

Kết luận: Với mức độ rủi ro là 5% (độ tin

cậy 95%) ta cĩ thể kết luận giá trị lương

trung bình là 15000đ/h.

n

* 96 , 1 96 , 1

HCM cơng bố lương TB của cơng

giá trị TB với độ tin cậy 95%.

KINH TẾ LƯỢNG

Chương 2: Kiểm định giả thuyết thống kê

PGS TS Nguyễn Thống

15

cơng bố lương TB của SV ra

trường sau 1 năm là 8Tr./tháng.

Khảo sát 160 SV cho thấy lương

TB là 8.6Tr./tháng và cĩ độ lệch

chuẩn là 3.1Tr./tháng.

Kiểm định sự khác biệt giữa kết

quả cơng bố và khảo sát với mức

9

; 15 X c

5 2

; 5 4 X b

4

; 15 X a

X X X

9 0

; 2 X c

02 0

; 5 0 X b

4 0

; 1 X a

X X X

phụ thuộc khơng những vào

thuộc vào độ lệch chuẩn  của nĩ.

Trang 4

PGS TS Nguyễn Thống

19

KIỂM ĐỊNH GIÁ TRỊ

TRUNG BÌNH VỚI PHÂN PHỐI

Phân phối

Student bậc

tự do df

df  tăng  Phân phối Student 

Phân phối chuẩn

Phân phối Student được áp dụng

thay thế phân phối chuẩn trong kiểm định giá trị trung bình khi:

 Mẫu cĩ kích thước bé (n < 30);

 Phân phối mẹ là phân phối

chuẩn nhưng độ lệch chuẩn  khơng biết.

Để kiểm định kết quả này, người ta lấy một mẫu ngẫu nhiên n =16 gia đình

là 4000$.

Hãy kiểm định kết quả công bố với độ rũi

ro là =5% (độ tin cậy 95%).

Trang 5

Ngồi ra từ số liệu mẫu ta thấy:

 Giả thiết H0 được chấp nhận.

Kết luận: Với một độ tin cậy 95% (hay với mức độ

rủi ro là 5%) ta cĩ thể nĩi là thu nhập bình

quân của dân thành phố A là 15000$.

B ài tập 1 : Tương tự bài trên với n=26 và giá trị độ

Bài tập 2 Cơ quan thống kê thành phố

A cho biết thu nhập trung bình của

nhân viên Văn phịng doanh nghiệp

vừa và nhỏ là 3600$/năm.

Để kiểm định kết quả này, người ta lấy

một mẫu ngẫu nhiên n =16 gia đình

300$.

Hãy kiểm định kết quả công bố với độ rũi

ro là =5% (độ tin cậy 95%).

PGS TS Nguyễn Thống

28

KIỂM ĐỊNH GIẢ THIẾT

VỀ SỰ SAI BIỆT CỦA GIÁ TRỊ TRUNG BÌNH VÀ 0

VỚI PHÂN PHỐI STUDENT.

Hãy kiểm định sự sai biệt của giá trị trung bình nói trên và giá trị 0 với độ rũi ro là 5% (độ tin cậy 95%).

Trang 6

Kết luận : Với độ tin cậy 95%, giá trị X là

khác 0 theo quan điểm thống kê.

1

H 065 1 5 , 1

kiểm định giá trị TB của 1 biến

(Kiểm định xem gía trị X là KHÁC 0 hay BẰNG 0 theo quan điểm thống kê).

vào:

 Bản thân giá trị TB tính ra

 Độ lệch chuẩn của biến thống

kê nghiên cứu.

Trang 7

PGS TS Nguyễn Thống

37

Ví dụ : Khảo sát một mẫu thống kê có

kích thước n=10, cho thấy giá trị

trung bình là x tb =10 và độ lệch

chuẩn là s=6 Với rũi ro 5%, so sánh

giá trị trung bình nêu trên với 0.

6

* 262 2 262

Bài tập 5: Tương tự bài trên với n=12 và s=15.

VỚI PHÂN PHỐI STUDENT

Trang 8

PGS TS Nguyễn Thống

43

ĐẶT VẤN ĐỀ

Trong thực hành, khi nghiên cứu giá

trị trung bình của một biến thống

kê ta cần xem xét sự sai biệt của 2

giá trị này có nghĩa (khác 0) hay

Hãy đánh giá cĩ sự KHÁC nhau về

lương TB của 2 Cơng ty với độ

biệt giữa 2 giá trị trung bình.

H1 :  CÓ sự khác biệt giữa 2 giá

trị trung bình.

a X

X1 2 

a X

X X

Ước lượng độ lệch chuẩn của tập hợp mẹ:

Độ lệch chuẩn của biến thống kê là hiệu 2 giá trị trung bình, theo lý thuyết thống kê:

2 n n

s ) 1 n ( s ) 1 n (

21

2222112

X

n

1 n

12

 Kết luận:

a a

&

: sanh

Trang 9

PGS TS Nguyễn Thống

49

Bài tập: Để xác định giá trị ma sát trong

trung bình của một tầng địa chất, người

ta tiến hành lấy mẫu và thí nghiệm hai

lần khác nhau.

Lần 1: n 1 =16 có  1 =22,3 0 và  1 =2 0

Lần 2: n 2 =12 có  2 =24,0 0 và  2 =1.8 0

Hãy kiểm định giả thiết về sự khác biệt

của 2 giá trị  trên với độ rũi ro = 5%.

biệt giữa 2 giá trị trung bình.

H1 :  CÓ sự khác biệt giữa 2 giá

trị trung bình.

a X

X1 2 

a X

X X

Ước lượng độ lệch chuẩn của tập hợp mẹ:

Độ lệch chuẩn của biến thống kê là hiệu 2 giá

trị trung bình, theo lý thuyết thống kê:

68 3

2 n n

s ) 1 n ( s ) 1 n (

21

2222112

n

1 n

1

21X

1 XX

Trang 10

PGS TS Nguyễn Thống

55

Đặt vấn đề : Xét một đại lượng là

tổng các giá trị bình phương Mỗi

giá trị bình phương là một biến

thống kế.

 Trong một số trường hợp ta cần

kiểm định xem một đại lượng này

BẰNG zero hay KHƠNG theo quan

Hàm mật độ xác suất  2 được sử dụng để

kiểm định các biến thống kê có dạng là

một TỔNG BÌNH PHƯƠNG.

p

20

Dạng hàm mật độ xác suất 2 với bậc tự do df

e(%,df)

H0 2= 0

H1 2> 0 S= = Pr( 2> e)

Ví dụ 1 : Kiểm định sự phù hợp (bài tốn 1D)

Một nhà cung cấp tủ lạnh phân chia vùng kinh

doanh ra làm 4 khu vực Người ta muốn kiểm

tra xem số tủ lạnh bán ra cĩ bằng nhau ở 4 khu

vực này hay khơng.

Để kiểm tra giả thiết này, người ta lấy một mẫu

ngẫu nhiên gồm 40 hồ sơ khách hàng đã mua

KHƠNG cĩ sự khác biệt về doanh số của

4 khu vực (H0)

10 10 (=40/4)

10 10 40

0 e2

i 1,4 e

f f

4 f

Để đánh giá cĩ sự khác biệt hay khơng, ta sẽ

so sánh với giá trị lý thuyết:

Nếu : : kết luận cĩ sự khác biệt ở các khu A, B, C, D

Nếu : : kết luận khơng cĩ sự khác biệt ở các khu A, B, C, D

Trong đĩ được xác định từ phân phối

cĩ bậc tự do dl=k-m-1 và ngưỡng rủi ro α (thường là 5%).

(k=4  số khu vực khảo sát, số tham số tính từ

số liệu mẫu khảo sát)



2 e 2

2 e

e2

7 81

 ,

2 e 2

4  

Trang 11

PGS TS Nguyễn Thống

61

Bài tập 1 : Một Tổng cơng ty kinh doanh

điện máy tại 5 khu vực Nhằm đánh giá

doanh số của 5 khu người ta lấy ngẫu

nhiên 100 hố đơn trong quá khứ và cĩ

kết quả sau Hãy kiểm định với ngưỡng

rũi ro 5% xem cĩ sự khác nhau doanh thu

giữa các khu Kết luận cĩ nên giảm số

khu vực kinh doanh?

KIỂM ĐỊNH VỚI  2 (bài tốn 2D)

Ví dụ Người ta muốn kiểm tra xem

cĩ liên hệ hay khơng giữa số

người mua sản phẩm & giới

tính Kết quả ghi nhận trình bày

trong bảng sau Kiểm định giả

thiết với độ tin cậy 99% (rũi ro

Số liệu bảng trên cĩ ý nghiã là yếu tố giới tính

và quyết định mua sắm là ĐỘC LẬP nhau

Trang 12

PGS TS Nguyễn Thống

67

Bậc tự do (mảng 2D): dl = (r - 1)(k -1) = (2 -1)(2 -1) = 1

Với r, k số phân loại cho mỗi biến xét.

Với = 1% và dl =1, tra từ bảng phân phối 2, ta có:

Kết luận: Với độ tin cậy là 99%, ta có thể kết luận

quyết định mua sắm và giới tính là KHÔNG ĐỘC

LẬP

8 27 f

f f

i e

2eo2

KIỂM ĐỊNH VỚI  2 (bài tốn 2D)

Bài tập 1 Một cửa hàng bán đĩa nhạc

khảo sát 200 khách hàng một cách

ngẫu nhiên để đánh giá xem có sự liên

quan hay không giữa tuổi tác & giới

tính đối với người đi mua nhạc với độ

KIỂM ĐỊNH VỚI  2 (bài tốn 2D)

Hãy kiểm định giả thiết với rũi ro =5%

Thời gian \ Số con nuơi >=3 <3

Hãy kiểm định giả thuyết với rũi ro =5%.

Lương (tr./năm)

Thương mại Dịch vụ Tự do Tổng

Trang 13

PGS TS Nguyễn Thống

73

Bài tập 5 Một thăm dò về thu nhập hàng tháng

được thực hiện trên 3 loại đối tượng khác Kiểm

tra xem có sự khác biệt lương trong các lĩnh

Kết luận: Với độ rũi ro =5%, ta có thể nói là

lương nhận được của các đối tượng nghiên

cứu thì độc lập với 3 loại ngành nghề ở trên

 

e

2eo2

a Xác định số sự cố trung bình ( thông số  trong phân phối Poisson) Giá trị này sẽ được dùng để kiểm định giả thiết là số lượng sự cố thì phân bố theo một phân phối Poisson.

c Kiểm định giả thiết là số lượng sự cố xảy ra tuân theo phân phối Poisson với độ rũi ro =5%.

(Xem bảng tra phân phối Poisson ở sau)

Trang 14

Số lần quan sát (f0)

b Số lần sự cố lý thuyết được tính từ bảng tra

phân phối Poisson với  = 3,2 và n = 40 cho ta:

) h / co _ su ( 2 , 3 40 128 x x

Do đó:  ta chấp nhận H0.

Kết luận: Với độ rủi ro  = 5%, số lượng sự cố trong 1h, xảy ra trong nhà máy là tuân theo p/phối Poisson có =3,2.

675 , 0

Kiểm định với độ tin cậy 90%.

Trang 15

Số lần quan sát (f0)

nạn trung bình X tính trên 1000 người

đàn ông trên một giờ Số liệu này lấy từ

một mẫu gồm 50 Xí nghiệp trên cùng một

ngành.

Từ số liệu tính được giá trị trung bình Xtb=

2,32 và độ lệch chuẩn của tập hợp mẹ ước

lượng từ mẫu là s = 0,42.

Kiểm định giả thiết là phân phối này tuân

theo một phân phối chuẩn với độ rũi ro

Số liệu quan sát được:

Số tai nạn trung bình X (nghìn người/giờ)

Số Xí nghiệp được quan sát

Tính giá trị Xác định số Xí nghiệp lý thuyết từ 50 Xí nghiệp.

Giá trị biến chuẩn tương ứng, t

Xác suất cho từng khoảng(p)

Số Xí nghiệp lý thuyết

1,45  1,75 -2,07  -1,36 0,085 4,5 1,75  2,05 -1,36  -0,64 0,17 8,5 2,05  2,35 -0,64  0,07 0,27 13,5 2,35  2,65 0,07  0,79 0,26 13,0 2,65  2,95 0,79  1,50 0,15 7,0 2,95  3,25 1,50  2,24 0,065 3,5

Trang 16

PGS TS Nguyễn Thống

91

(*) giá trị biên lấy chính là giá trị trung bình các biên

ở số liệu ban đầu.

(**) với , s = 0,42 và x=1.45 ta có t=-2.07:

(***) Tra từ bảng phân phối chuẩn.

Ta có:

Ta thấy: : giả thiết H0 được chấp nhận.

Kết luận : Với độ rũi ro =5%, số lượng tai nạn trong

các Xí nghiệp quan trắc (dựa vào số tai nạn trung

bình xảy ra) tuân theo quy luật phân phối chuẩn có

giá trị TB là 2,32 và độ lệch chuẩn s = 0,42.

x  2 32 ,

s x

 2 07 1 . 45 0

Bài tập : Để đánh giá chất lượng đề

thi của một mơn học người ta

muốn kiểm định xem điểm kết

quả thi của thí sinh cĩ tuân theo

một phân phối chuẩn? Hãy kiểm

định với độ tin cậy 95% Số liệu

xem sau (giá trị TB & độ lệch

chuẩn ước lượng từ mẫu).

PGS TS Nguyễn Thống

94

KIỂM ĐỊNH THỐNG KÊ CỦA GIÁ TRỊ LÀ TỶ SỐ 2 TỔNG CÁC BÌNH

PHƯƠNG BIẾN THỐNG KÊ

VỚI HÀM PHÂN PHỐI XÁC SUẤT FISHER

(xem bảng tra sau)

KINH TẾ LƯỢNG

Chương 2: Kiểm định giả thuyết thống kê

PGS TS Nguyễn Thống

95

 ĐÂY LÀ KIỂM ĐỊNH XEM XÉT GIÁ TRỊ BIẾN F

LÀ TỶ SỐ GIỮA 2 ĐẠI LƯỢNG THỐNG KÊ:

BẬC TỰ DO CỦA A & B

 MỖI ĐẠI LƯỢNG THỐNG KÊ LÀ TỔNG CỦA CÁC BÌNH PHƯƠNG CỦA CÁC GIÁ TRỊ THỐNG KÊ.

21

) ( B

) ( A ) , ( F

Trang 17

PGS TS Nguyễn Thống

97

Kiểm định giá trị F khác 0 với

phân phối Fisher

0

p

H 0

(đại lượng kiểm tra=0)

H 1 (đại lượng kiểm tra khác 0)

Với mức rũi ro 5%, hãy kiểm định giá trị F

khác 0 hay bằng 0 theo quan điểm thống

Bài tập 2 : Xét đại lượng thống kê F là tỷ số

của hai đại lượng thống kê với mỗi đại

lượng là tổng các giá trị bình phương:

A=50 với bậc tự do là 5 và B cĩ giá trị là

20 với bậc tự do là 8.

Với mức rũi ro 5%, hãy kiểm định giá trị F

so với 0 theo quan điểm thống kê.

 Kiểm định giá trị tổng các bình phương của đại lượng thống kê khác 0 dùng kiểm định với phân phối 2.

 Kiểm định giá trị là tỷ số của 2 đại lượng là tổng các bình phương của đại lượng thống kê khác 0  dùng kiểm định với phân phối Fisher  F test.

Trang 18

PGS TS Nguyễn Thống

103

Phân phối Chuẩn

t α=Pr(X>t)

Phân phối Student

t0

0 p

t

Trang 19

0

p

H 0

(đại lượng kiểm tra=0)

H 1 (đại lượng kiểm tra khác 0)

Trang 20

PGS TS Nguyễn Thống

115

DẠNG TỔNG QUÁT PHÂN PHỐI POISSON

(Biến rời rạc)

Ngày đăng: 20/09/2017, 22:57

TỪ KHÓA LIÊN QUAN

w