1. Trang chủ
  2. » Mẫu Slide

Bài giảng lý thuyết xác suất và thông kê toán chương 8 kiểm định giả thiết thống kê

97 635 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 97
Dung lượng 3 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Việc tìm ra kết luận bác bỏ hay chấp nhận một giả thiết gọi làø kiểm định giả thiết thống kê.. Dựa vào số liệu của một mẫu điều tra về năng suất lúa của tỉnh này và qui tắc kiểm định để

Trang 1

1- Giả thiết thống kê:

I- CÁC KHÁI NIỆM

Trang 2

Việc tìm ra kết luận bác bỏ hay chấp nhận một giả thiết gọi làø

kiểm định giả thiết thống kê

Giả thiết thống kê là những giả thiết nói về các tham số, phân phối xác suất, tính đôc lập của các đại lượng ngẫu nhiên

Trang 3

Thí dụ: Trong một báo cáo nói rằng: năng suất lúa trung bình của tỉnh Y năm 2013 là 6,8 tấn/ha thì có thể coi đó là một giả thiết thống kê, giả thiết này nói về một tham số (kỳ vọng toán) của đ.l.n.n biểu thị năng suất lúa của

biểu thị năng suất lúa của tỉnh này

Trang 4

Dựa vào số liệu của một mẫu điều tra về năng suất lúa của tỉnh này và qui tắc kiểm định để đưa ra một kết luận là bác bỏ hay chấp nhận giả thiết trên.

Trang 5

Khi đặt giả thiết thống kê cần lưu ý:

Giả thiết đặt ra sao cho khi Giả thiết đặt ra sao cho khi

chấp nhận hoặc bác bỏ nó sẽ có tác dụng trả lời được câu hỏi mà bài toán thực tế đặt ra.

Trang 6

Giả thiết đặt ra thường mang Giả thiết đặt ra thường mang

nghĩa :”không khác nhau”, hoặc

“khác mà không có ý nghĩa” hoặc “bằng nhau”.

Trang 7

Giả thiết đặt ra như vậy gọi là giả thiết cần kiểm định (Hay giả thiết không - null hypothesis) ký hiệu

là H 0

Một mệnh đề đối lập với H 0 gọi là giả thiết đối và được ký hiệu là

H 1

Trang 8

(Vì miền bác bỏ nằm về hai phía của miền chấp nhận)

Trang 10

Giả thiết đối dạng:   0 thường được áp dụng khi ta chưa biết rõ trong thực tế > 0 hay < 0

Nhưng nếu bằng kinh nghiệm hoặc qua phân tích ta biết được chiều hướng là  > 0 thì ta có thể đặt giả thiết đối dạng: > 0

Trang 11

Hoặc ta biết được chiều hướng là

< 0 thì ta có thể đặt giả thiết đối dạng: < 0

Nếu kiểm định giả thiết với giả thiết đối có dạng: H 1 :  > 0 ; hoặc

H 1 : < 0 ; thì được gọi là kiểm định giả thiết một phía

Trang 13

Nếu giả thiết đối có dạng

Trang 15

Nếu giả thiết đối có dạng

Trang 16

Nhiệm vụ của lý thuyết kiểm định giả thiết thống kê là: Bằng thực nghiệm (thông qua mẫu cụ thể) kiểm tra tính đúng (sai) của giả thiết H 0

Trang 17

2- Mức ý nghĩa, miền bác bỏ

Với bé tùy ý có thể tìm được miền W mà P(Z W) = 

Miền W được gọi là miền bác bỏ

giả thiết H 0

Trang 18

tùy thuộc vào tầm quan trọng của vấn đề kiểm định Trong thực tế thường chọn  trong

khoảng (1%; 5%) được gọi là

mức ý nghĩa của kiểm định

Trang 19

Nếu z W thì ta bác bỏ giả thiết

H 0 thừa nhận H 1

Nếu z W thì ta chấp nhận H 0 .

* Lưu ý: Khi nói “chấp nhận H 0 ” điều đó không có nghĩa là giả thiết

H 0 là đúng mà chỉ có nghĩa là với số liệu của mẫu ta chưa đủ cơ sở (chưa đủ bằng chứng) để bác bỏ H 0

Trang 20

Trong thực hành nên nói rằng:

“có thể chấp nhận H0” hoặc

“chưa có cơ sở để bác bỏ H0

3- Sai lầm loại 1 và sai lầm loại 2

a- Sai lầm loại 1:

Là sai lầm mắc phải khi ta bác bỏ một giả thiết H 0 trong khi thực tế thì giả thiết H 0 đúng.

Trang 21

Xác suất mắc phải sai lầm loại 1 chính là mức ý nghĩa 

Trang 22

b- Sai lầm loại 2:

Là sai lầm mắc phải khi ta chấp nhận giả thiết H 0 trong khi thực tế thì giả thiết H 0 sai.

Xác suất mắc phải sai lầm loại 2 là xác suất để Z nhận giá trị không thuộc miền bác bỏ W khi H 0 sai (tức

H 1 đúng) P(Z  W/H 1 ) = 

Trang 23

Các trường hợp có thể xảy ra khi tiến hành kiểm định giả thiết thống kê cho

ở bảng sau:

Trang 24

Có 2 cách khống chế khả năng mắc phải sai lầm:

Cách thứ nhất: Ta ấn định trước

mức xác suất sai lầm loại 1 và sai lầm loại 2 rồi tính toán tìm một mẫu có kích thước nhỏ nhất ứng với 2 mức xác suất sai lầm này.

Trang 25

Cách thứ hai: Ta ấn định trước xác suất sai lầm loại 1 (tức cho trước mức ý nghĩa ) chọn miền

bác bỏ W sao cho có xác suất sai lầm loại 2 cực tiểu Các miền bác bỏ W trong giáo trình này thỏa mãn yêu cầu đó

Trang 26

Chú ý: bác bỏ hay chấp nhận một bác bỏ hay chấp nhận một

giả thiết tùy thuộc vào giá trị thực nghiệm của tiêu chuẩn Z và mức ý nghĩa Kiểm định giả thiết thống kê chỉ là một qui tắc giúp ta kết luận một vấn đề nào đó mà bài toán thực tế đặt ra sao cho kết luận đó có khả năng mắc phải sai lầm nhỏ

Trang 27

Giả sử trung bình của tổng thể (cũng chính là kỳ vọng toán của đ.l.n.n X) là  ( chưa biết) Cần

kiểm định giả thiết:

H 0 : = m 0 ; H 1 :   m 0

II- KIỂM ĐỊNH GIẢ THIẾT VỀ TRUNG BÌNH TỔNG THỂ

Trang 28

Để kiểm định giả thiết trên ta tiến hành lấy mẫu kích thức n và xét các trường hợp sau:

1- Trường hợp n 30 (hoặc n < 30 nhưng X có phân phối chuẩn); 2

đã biết.

Trường hợp này ta chọn thống kê:

Trang 29

Z =

n /

m

làm tiêu chuẩn kiểm định.

Nếu giả thiết H 0 đúng thì

Z  N(0, 1)

Với mức ý nghĩa , chọn miền bác bỏ giả thiết H 0 : W = z : z > z/2

Trang 30

Trong đó z/2 là giá trị của Z

Z  N(0, 1) thoả mãn: z/2 > 0

P( Z > z/2 ) = 

Trên đồ thị, miền bác bỏ Wđược minh họa như sau:

Trang 32

Để xác định z/2 ta tra bảng hàm Laplace ở phần phụ lục hoặc dùng hàm NORMSINV trong Excel

Trang 33

Như vậy xác suất để giá trị của Z rơi vào miền bác bỏ là , tức xác

suất để Z rơi vào miền chấp nhận sẽ là 1 nhỏ, nên xác suất để Z rơi vào miền chấp nhận sẽ lớn

Trang 34

Nghĩa là: nếu giả thiết H 0 đúng thì có thể coi rằng hầu hết các giá trị của Z sẽ rơi vào miền chấp nhận Còn nếu giá trị của Z rơi vào miền bác bỏ có nghĩa là ta đã tìm được

“bằng chứng” để chứng tỏ giả thiết H 0 là không đúng và vì thế ta bác bỏ giả thiết đó.

Trang 35

Từ đó ta có qui tắc quyết định khi tiến hành kiểm định giả thiết H 0 trong trường hợp này như sau:

Lấy mẫu kích thước n, từ mẫu Lấy mẫu kích thước n, từ mẫu

cụ thể này tính:

z = x m 0n

Trang 36

Với mức ý nghĩa Với mức ý nghĩa cho trước , xác định z/2

Nếu Nếu z> z/2 thì bác bỏ giả

thiết H 0 , chấp nhận H 1

Nếu z  z/2 thì có thể chấp nhận giả thiết H 0

Trang 37

Từ việc chấp nhận (hay bác bỏ) H 0

ta suy ra kết luận cuối cùng theo yêu cầu của bài toán thực tế.

2- Trường hợp n 30 ; 2 chưa biết

Chọn:

S

) m X

làm tiêu chuẩn kiểm định.

Trang 38

Nếu H 0 đúng thì Z N(0, 1), do đó miền bác bỏ giả thiết H 0 và qui tắc quyết định trong trường hợp này giốngï như trường hợp 1 Chỉ khác là giá trị z được tính theo công thức:

n s

m

x

Trang 39

3- Trường hợp n < 30, 2 chưa biết,

X có phân phối chuẩn

Chọn:

n S

) m X

T = làm tiêu chuẩn kiểm định.

Trang 40

Nếu H 0 đúng thì T có phân phối Student với n1 bậc tự do.

Miền bác bỏ:

W = t : t > t/2

Trong đó t/2 là giá trị của T

T  T(n-1) thoả mãn: t/2 > 0 và

P(T > t/2 ) =

Trang 41

t/2 được xác định bằng cách tra bảng phân phối Student với bậc tự do n1 hoặc dùng hàm TINV trong Excel

Từ đó ta có qui tắc quyết định khi tiến hành kiểm định giả thiết H 0 trong trường hợp này như sau:

Trang 42

Lấy mẫu kích thước n, từ mẫu Lấy mẫu kích thước n, từ mẫu

cụ thể này tính:

S

) m X

Với mức ý nghĩa Với mức ý nghĩa cho trước ,

xác định t/2

Trang 43

Nếu t> t/2 , thì bác bỏ giả thiết H 0 , chấp nhận H 1

Nếu t  t/2 , thì có thể chấp nhận giả thiết H 0

Từ việc chấp nhận (hay bác bỏ)

H 0 ta suy ra kết luận cuối cùng theo yêu cầu của bài toán thực tế.

Trang 44

Chú ý: Trường hợp bác bỏ giả thiết H 0

* Nếu x < m 0 thì có thể kết luận

< m 0

* Nếu x > m 0 thì có thể kết luận

> m 0

Trang 45

Nếu kiểm định giả thiết:

H 0 : = m 0 ; H 1 :  > m0

Thì qui tắc kiểm định ở bước 2 và

3 thay đổi như sau:

Dùng z Dùng z thay cho z/2

Nếu z > z thì bác bỏ H 0

Nếu z z thì có thể chấp nhận H 0

Trang 47

Nếu kiểm định giả thiết:

H 0 : = m 0 ; H 1 : < m 0

Thì qui tắc kiểm định ở bước 2 và

3 thay đổi như sau:

Dùng z thay cho z/2

Nếu z < -z thì bác bỏ H 0

Nếu z > -z thì có thể chấp nhận H 0

Trang 49

Thí dụ

Thí dụ: Trọng lượng của các bao gạo

do một máy đóng bao sản xuất là đại lượng ngẫu nhiên có phân phối chuẩn với trọng lượng trung bình theo qui định là 50 kg

Để xem máy đóng bao làm việc có bình thường không người ta cân thử

50 bao và tính được:

x = 49,72 kg; s = 0,5 kg

Trang 50

Với mức ý nghĩa = 1%, hãy cho kết luận về tình hình làm việc của máy đóng bao đó?

Giải: Gọi là trọng lượng trung bình thực tế của những bao gạo do máy sản xuất ( chưa biết) Đặt giả thiết:

H 0 : = 50 ; H 1 : < 50

Trang 51

Trường hợp này kích thước mẫu

n = 50 > 30 ;  2 chưa biết

z = = 50 3,96

5 , 0

) 50 72

, 49

Với mức ý nghĩa = 1%, thì:

z = z 0,01 = 2,326

Trang 52

Vì z = -3,96 < -2,326

Tức zW nên ta bác bỏ giả thiết

H 0 Tức là máy đóng bao làm việc không bình thường Nói cụ thể hơn, máy đã sản xuất ra những bao gạo có trọng lượng trung bình thấp hơn 50 kg.

x

Trang 53

Giả sử tỷ lệ các phần tử có tính chất A của tổng thể là p (p chưa biết) Ta cần kiểm định giả thiết:

H 0 : p = p 0 ; H 1 : p p 0

với mức ý nghĩa .

III- KIỂM ĐỊNH GIẢ THIẾT

VỀ TỶ LỆ TỔNG THỂ

Trang 54

Để kiểm định giả thiết trên, ta lấy mẫu kích thước n khá lớn và áp dụng qui tắc quyết định như

sau:

+ Từ mẫu cụ thể tính f rồi tính:

) p

1 ( p

n )

p f

( z

0 0

0

Trang 55

+ Với cho trước , xác định z/2

+ Nếu z > z/2 thì ta bác bỏ H 0.

Nếu z   z/2 thì ta có thể chấp nhận H 0

Từ việc chấp nhận (hay bác bỏ) H 0

ta suy ra kết luận cuối cùng theo yêu cầu của bài toán thực tế.

Trang 56

Chú ý: Trường hợp bác bỏ giả thiết H 0

Nếu f < p 0 thì có thể kết luận

p < p 0

Nếu f > p 0 thì có thể kết luận

p > p 0

Trang 57

Nếu kiểm định giả thiết:

H 0 : p = p 0 ; H 1 : p > p 0

Thì qui tắc kiểm định ở bước 2 và

3 thay đổi như sau:

Dùng Dùng z thay cho z/2

Nếu z > z thì bác bỏ H 0

Nếu z z thì có thể chấp nhận H 0

Trang 58

Nếu kiểm định giả thiết:

H 0 : p = p 0 ; H 1 : p < p 0

Thì qui tắc kiểm định ở bước 2 và

3 thay đổi như sau:

Dùng z thay cho z/2

Nếu z < -z thì bác bỏ H 0

Nếu z > -z thì có thể chấp nhận H 0

Trang 59

Thí dụ: : Tỷ lệ phế phẩm của một nhà máy trước đây là 5% Sau khi tiến hành một cải tiến kỹ thuật, người ta kiểm tra 400 sản phẩm thì thấy có 16 phế phẩm

Với mức ý nghĩa = 2%, hãy kết luận xem việc cải tiến kỹ thuật có làm giảm tỷ lệ phế phẩm hay không ?

Trang 60

Giải: Gọi p là tỷ lệ phế phẩm của nhà máy sau khi cải tiến kỹ thuật Ta cần kiểm định giả thiết

Trang 61

z = =  0,92

) 05 ,

0 1

( 05 ,

0

400 )

05 ,

0 04

, 0

Trang 62

IV- KIỂM ĐỊNH GIẢ THIẾT VỀ

PHÂN PHỐI XÁC SUẤT CỦA ĐẠI

LƯỢNG NGẪU NHIÊN

Giả sử chưa biết phân phối xác suất của đại lượng ngẫu nhiên X,

ta cần kiểm định giả thiết:

Trang 63

H 0 : X có phân phối xác suất nào đó.

H 1 : X không có phân phối xác suất nói trên.

Ký hiệu: P i = P(X = x i )

hoặc P i = P(x i  X  x i+1 )

Trang 64

Thực hiện n phép thử độc lập đối với đ.l.n.n X Tần số lý thuyết của biến cố (X = x i ) sẽ là nP i Tần số thực tế là n i Hiệu (n i nP i ) 2 có thể dùng làm cơ sở để xét xem phân phối xác suất của X có phải như giả thiết H 0 đã nêu ra hay không.

Trang 65

K Pearson đã chọn thống kê:

i

nP

) nP n

(

làm tiêu chuẩn kiểm định.

Với n khá lớn có thể coi 2 có phân phối “Chi bình phương” với (k r 1) bậc tự do

Trang 66

Trong đó r là số các tham số chưa biết đối với phân phối xác suất của X theo H 0

Miền bác bỏ giả thiết H 0 với mức

ý nghĩa  là:

W =  2 :2   2 

Trang 67

Trong đó 2 là giá trị của đại lượng ngẫu nhiên 2 với (k r 1) bậc tự do thoả mãn điều kiện:

Trang 68

miền bác bỏ

miền chấp nhận

+ +

0

Trang 69

Qui tắc quyết định:

+ Lấy mẫu kích thước n, từ mẫu này ta có được các giá trị quan sát

x i (i = 1, 2, , k) hoặc các khoảng (x i ; x i+1 ).

Theo giả thiết H 0 , ta tính

P i = P(X = x i )

hoặc P i = P( x i < X < x i+1 )

Trang 70

2

nP

) nP n

(

n i là tần số thực tế của x i hoặc của khoảng (x i ; x i+1 )

+ Với mức ý nghĩa , tra bảng phân

phối “chi –bình phương” (bậc tự do

kr 1) để tìm giá trị  2

Trang 71

r là số các tham số chưa biết của phân phối xác suất theo giả thiết

H 0 )

+ Nếu  2 > thì bác bỏ H 0

+ Nếu 2 thì có thể chấp nhận H 0

Trang 72

Từ việc chấp nhận (hay bác bỏ

H 0 ) ta suy ra kết luận cuối cùng mà bài toán thực tế yêu cầu.

Trang 73

Thí dụ:

Sản phẩm được sản xuất ra trên Sản phẩm được sản xuất ra trên

một dây chuyền tự động được đóng gói một cách ngẫu nhiên theo qui cách: 3 sản phẩm/hộp Tiến hành kiểm tra 200 hộp ta được kết quả:

Trang 74

Với mức ý nghĩa 5%, có thể xem số sản phẩm loại I có trong một hộp là đại lượng ngẫu nhiên có phân phối nhị thức hay không?

Trang 75

p chưa biết p được ước lượng là:

(50 + 201 + 1252 + 50 3)/600 = 0,7

Giải: Gọi X là số sản phẩm loại I có trong một hộp Ta cần KĐ giả thiết: H 0 : X  B(3, p)

Để tính 2 ta lập bảng tính như sau:

Trang 76

2 = 28,81 > 2 0,05 (2) = 5,99

Bác bỏ giả thiết H 0

X không có phân phối nhị thức.

Đọc bài tập: 8.14

Trang 77

Giả sử quan sát đồng thời hai dấu hiệu A và B trên cùng một phần tử

V- KIỂM ĐỊNH GIẢ THIẾT VỀ TÍNH ĐỘC LẬP CỦA HAI DẤU HIỆU

Trang 78

Dấu hiệu A có các dấu hiệu thành phần là:

A 1 , A 2 , , A h

Dấu hiệu B có các dấu hiệu thành phần là:

B 1 , B 2 , , B k

Trang 79

Cần kiểm định giả thiết

Cần kiểm định giả thiết:

H 0 : A và B độc lập

H 1 : A và B không độc lập.

Lấy mẫu kích thước n và trình bày kết quả quan sát dưới dạng bảng sau:

Trang 80

A h n h1 n h2 n 1k n h Toång m 1 m 2 m k n

Trang 82

n ij (i = 1, ,h; j =1,…,k) là tổng số phần tử mang dấu hiệu thành phần A i và B j

Gọi C i là biến cố chọn được phần tử mang dấu hiệu A i

Trang 83

D j là biến cố chọn được phần tử mang dấu hiệu B j

Khi n khá lớn, theo định nghĩa thống kê về xác suất ta có:

n

m )

D ( P

; n

n )

C ( P

; n

n )

D C

(

P i jij ii jj

Trang 84

Nếu H 0 đúng, tức A, B độc lập thì các dấu hiệu A i , B j cũng độc lập

Do đó:

P(C i D j ) = P(C i )P(D j ) Tức là:

n

m

n

n n

Trang 85

Qui tắc quyết định:

+ Lấy mẫu kích thước n, từ mẫu

k

1 j

n

j i

2 ij ij

m n

) n

(

Trang 86

+ Với mức ý nghĩa đã cho, tra bảng 2 với bậc tự do (k-1)(h-1) để tìm

(hoặc dùng hàm CHIINV trong Excel)

2

Trang 90

Với mức ý nghĩa = 0,05, hãy kết luận mẫu hàng có ảnh hưởng đến ý thích của khách hàng hay không.

Trang 91

Giải: :

H 0 : Mẫu hàng (dấu hiệu A) độc lập (không ảnh hưởng) đến ý thích của khách hàng (dấu hiệu B).

H 1 : Mẫu hàng không độc lập (có ảnh hưởng) đến ý thích của khách hàng.

Trang 92

115 127 58

Trang 93

35 100

115

025353 ,

1 100

58

19

Trang 94

1 j

Trang 95

= 9,488

2 05 ,

nên ta chấp nhận giả thiết H 0

tức mẫu hàng không ảnh hưởng đến ý thích của khách hàng

Trang 96

Tổng kết chương 8

Tổng kết chương 8

của 2 dấu hiệu

Kiểm định tham số

Kiểm định phi th.số

Cơ sở LT

Cơ sở LT Qui tắc q/định

Qui tắc q/định

Kết luận

Trang 97

Bài tập:

8.4; 8.5; 8.21; 8.23; 8.25; 8.26; 8.27; 8.28.

Hết chương 8

Ngày đăng: 04/12/2016, 23:15

HÌNH ẢNH LIÊN QUAN

Bảng  phân  phối  Student  với  bậc  tự  do  n - Bài giảng lý thuyết xác suất và thông kê toán chương 8 kiểm định giả thiết thống kê
ng phân phối Student với bậc tự do n (Trang 41)
Bảng sau: - Bài giảng lý thuyết xác suất và thông kê toán chương 8 kiểm định giả thiết thống kê
Bảng sau (Trang 79)
Bảng    2 2   với  bậc  tự  do  (k-1)(h-1)    với  bậc  tự  do  (k-1)(h-1)  để tìm - Bài giảng lý thuyết xác suất và thông kê toán chương 8 kiểm định giả thiết thống kê
ng   2 2 với bậc tự do (k-1)(h-1) với bậc tự do (k-1)(h-1) để tìm (Trang 86)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm