Những giả định này, có thể đúng hoặc có thể sai, được gọi là giả thuyết thống kê và thường là những nhận định về phân phối xác xuất của tổng thể, nghĩa là những nhận định về các tham số
Trang 1CHƯƠNG 7 KIỂM ĐỊNH GIẢ THUYẾT TK 8.1 Khái niệm:
Để có những quyết định về vấn đề nghiên cứu, điều hữu ích là chúng ta phải có những giả định hoặc dự đoán về tổng thể Những giả định
này, có thể đúng hoặc có thể sai, được gọi là giả thuyết thống kê và thường là những nhận định về phân phối xác xuất của tổng thể, nghĩa là những nhận định về các tham số của tổng thể
Trang 2Ví dụ
1 Một nhà SX kẹo cho rằng trung bình mỗi
hộp kẹo (1 kg) có 100 viên kẹo ? Để kiểm tra
điều này, chọn ngẫu nhiên những hộp kẹo để đếm và tính toán
Trang 32 Một nhà Quản trị marketing muốn kiểm tra
giả định doanh thu của Cty tăng trung bình ít nhất 5% sau đợt quảng cáo? Ông ta kiểm tra giả định bằng cách liệt kê doanh thu trước và sau chiến dịch quảng cáo để tính toán
Nói cách khác, kiểm định giả thuyết là dựa vào thông tin mẫu để đưa ra kết luận - bác bỏ hay chấp nhận về các giả thuyết v ề tổng thể
Trang 48.2 Các loại giả thuyết trong thống kê
Giả thuyết Ho
Gọi là tham số (như số trung bình, tỉ
lệ, phương sai) của tổng thể chung chưa
thuyết về với giá trị o cụ thể nào đó trong trường hợp giả thuyết có giá trị đơn, và muốn đánh giá xem giả thuyết đó đúng hay sai,
Trang 5nghĩa là ta cần kiểm định giả thuyết:
Trang 6Giả thuyết H1
Giả thuyết H1 là kết quả ngược của
trong các trường hợp kiểm định như sau:
Trang 7Trường hợp kiểm định hai bên
H 0 : = 0
H 1 : 0
Ví dụ 1 :
Một hãng SX vỏ xe hơi, lấy 1 mẫu ngẫu
nhiên 100 vỏ xe Người quản trị SX cần biết: Tuổi thọ trung bình của loại vỏ xe được sản xuất có tương đương với 25.000 dặm không.
Trang 8Để trả lời, người ta đặt ra giả thuyết như sau
H 0 : x = 25.000 dặm
H 1 : x 25.000 dặm
Tiếp theo là kiểm định để chấp nhận
Trang 9Trường hợp kiểm định một bên
Bên trái: H 0 : ≥ 0
H 1 : < 0
Bên phải: H 0 : 0
H 1 : > 0
Trang 10Ví dụ:
````````
`````` Người ta muốn biết tuổi trung bình của
sinh viên trong trường đại học có phải là 21 hay không? Giả thuyết được đặt ra là: H0 : X = 21
Trang 118.3 Sai lầm loại 1 và sai lầm loại 2
Khi kiểm định một giả thuyết thống kê, chúng ta có thể phạm những sai lầm như sau: Dựa trên những thông tin từ mẫu chúng ta có thể loại bỏ một giả thuyết mà thực ra giả thuyết này đúng, hoặc nhận một giả thuyết trong khi thực sự giả
Trang 12Như vậy, sai lầm loại 1 là sai lầm
thuyết này đúng ở mức ý nghĩa nào
việc mắc sai lầm loại 1) Xác suất
phải được định trước khi nghiên cứu
Trong thực tế các mức có ý nghĩa là
0,05; 0,02; và 0,01 thường hay được
chọn
Trang 13Ví dụ:
Với mức ý nghĩa 0,05; chúng ta chỉ
có 5% “May mắn” là bỏ giả thuyết H0
khi thực sự H0 đúng
Nói cách khác, ta có thể tin cậy tới 95%
là ta đã quyết định đúng Trong trường hợp
này, chúng ta nói là giả thuyết đã được loại bỏ với mức ý nghĩa 5%, chúng ta có thể quyết định sai với xác suất tối đa 0,05.
Trang 14Sai lầm loại 2 là loại sai lầm của việc
Nếu xác suất của việc quyết định chấp
sai là (1 - ).
Trang 15
Sai lầm loại I giống như sai lầm của 1 quan tòa khi kết án nhầm người vô tội, còn sai lầm loại II thì tương tự như sai lầm khi “tha bổng kẻ có tội”.
Trong XH văn minh, kết án nhầm
người vô tội là 1 sai lầm nghiêm trọng hơn nhiều so với sai lầm tha bổng kẻ có tội Trong bài toán kiểm định giả thuyết cũng vậy Ta coi sai lầm loại I là nghiêm trọng hơn sai lầm loại II
Trang 16Tóm tắt các loại sai lầm và xác suất xảy ra khi
kiểm định giả thuyết
Quyết định đúng Xác suất: 1- ß (1-ß) gọi là giá
Trang 178.4 Kiểm định giả thuyết về trung bình tổng thể
thể chưa biết Ta cần kiểm tra giả
trước)
H1 : 0
độc lập, với mức ý nghĩa , ta đưa ra quy tắc chấp nhận hay bác bỏ giả thuyết trên
Trang 18a/ n 30; 2 đã biết , ta tính giá trị
Trang 19Qui tắc quyết định: Bác bỏ H0 với mức ý nghĩa , nếu :
Tức là: | Z | > Z/2 ta bác bỏ giả thuyết
Ngược lại: | Z | < Z/2 ta chấp nhận giả thuyết
Với Z có phân phối chuẩn.
Trang 20Neáu 2 chöa bieát, ta thay 2 = S2 (phöông sai maãu hieäu chænh)
Trang 21Từ trường hợp tổng quát kiểm định hai đuôi trên đây, ta có thể suy ra trường hợp một đuôi.
Chẳng hạn, Kiểm định một đuôi bên trái, ta có giả thuyết
H 0 : = 0 (Hoặc H 0 : ≥ 0 )
H 1 : < 0
Trang 22H 0 sẽ bị bác bỏ nếu: 0
/
X
Z n
Trang 23Ki m ñ nh m t ñuoâi beân ph i ểm ñịnh một ñuoâi beân phải ịnh một ñuoâi beân phải ột ñuoâi beân phải ải
H0: μ = μ0 Hoặc H0: μ ≤ μ0
H1: μ > μ0 (Vì miền bác bỏ nằm về phía bên phải của miền chấp nhận )
H 0 sẽ bị bác bỏ nếu:
0/
X
Z n
Trang 25Tóm tắt các trường hợp tổng quát cho 2 dạng
kiểm định “ hai đuôi” và “một đuôi”
Trang 26Ví du:
Thống kê trong năm trước cho thấy rằng một người Mỹ đi du lịch ở Châu Âu trong vòng 3 tuần chi tiêu trung bình
1010 USD cho mua sắm Một cuộc
nghiên cứu dự định tiến hành cuối năm nay để xác định xem có sự thay đổi gì trong việc tiêu tiền cho mua sắm khi du lịch của người Mỹ hay không?
Trang 271 Hãy phát biểu giả thuyết H0 và H1
2 Giả sử điều tra 50 khách du lịch cho
thấy số tiền họ tiêu trung bình là 1090 USD, với độ lệch chuẩn là 300 USD Với mức ý nghĩa = 0,01, Hãy nhận định xem có sự thay đổi về sự tiêu tiền khi du lịch ở Châu Âu của người Mỹ hay không
Trang 281010
1090
Trang 29Với mức ý nghĩa 0,01; tra bảng
Z/2 = Z0,005 = 2,58
Vì | Z | < Z/2 (1,89 < 2,58 ) nên ta không có đủ
cơ sở để kết luận là có sự thay đổi
Trang 30Ví dụ 2
Một nhóm nghiên cứu công bố rằng trung bình một người vào siêu thị A tiêu hết 140
ngàn đồng Chọn ngẫu nhiên 50 hóa đơn của
người mua hàng ta tính được số tiền trung bình họ tiêu là 154 ngàn đồng với độ lệch tiêu chuẩn là 62 ngàn đồng Với mức ý nghĩa 0,02 hãy nhận định xem công bố của nhóm nghiên cứu có đúng hay không?
sinh viên thực hiện tính & đưa ra kết luận
Trang 31b/ n < 30, có phân phối chuẩn, 2 đã biết, ta làm giống như trường hợp n > 30 và
2 đã biết
X
c/ n < 30, có phân phối chuẩn,
2 - chưa biết, ta tính giá trị kiểm định:
Trang 32Ba dạng tổng quát của kiểm định trong trường
hợp trên (điều kiện) như sau
Trang 33Ví dụ
Giả sử thời gian các cuộc gọi có phân phối chuẩn Để nghiên cứu thời gian trung bình của một cuộc gọi điện thoại, một mẫu ngẫu nhiên gồm 40 cuộc điện thoại được chọn Số liệu về
thời gian gọi mỗi cuộc điện thoại cho
trong bảng sau (đ/v: giây)
Trang 35Một nghiên cứu của ngành bưu điện cho rằng thời gian trung bình của một cuộc gọi là 47 giây Với mức ý nghĩa 2% kết quả nghiên cứu của ngành bưu điện là chấp nhận được không?
Trang 36
Ví dụ
Một Cty sản xuất pin tuyên bố rằng pin
của họ có tuổi thọ trung bình là 21,5 giờ Một
cơ quan kiểm tra chất lượng kiểm tra 6 cặp pin của công ty và thu được số liệu sau đây về tuổi thọ c a 6 cặp pin này là: 19; 18; 22; 20; ủa 6 cặp pin này là: 19; 18; 22; 20; 16; 25.
Kết quả này có xác nhận là quảng cáo của Cty là đúng hay không? Với mức ý nghĩa được chọn là = 0,05
Trang 38Tra bảng phân bố Student với n-1 bậc tự
do ta tìm được:
t 5,0,05/2 = 2,571 Vì | t | < t 5,/2 nên chưa có cơ
sở bác bỏ H 0
Trang 39
Ví dụ: Một cuộc nghiên cứu trước đây kết luận rằng những thanh niên trưởng thành đã dành trung bình 18 giờ/tuần cho các hoạt động giải trí Một nhà nghiên cứu muốn kiểm định thông báo này và đã chọn ngẫu nhiên 10 thanh niên trưởng thành và hỏi họ thời gian mà họ đã sử dụng cho các hoạt động giải trí/ tuần Dữ liệu được thu thập như sau (giờ):
Trang 4014 25 22 38 16
26 19 23 41 33Giả sử thời gian sử dụng cho các hoạt độnggiải trí tuân theo quy luật chuẩn Mức ý nghĩa 0,05 có thể kết luận lời thông báo trước đây là đúng hay không?
(đáp án: t = -2,262 và 2,262;
test statistic: t = 2,692; bác bỏ H 0 )
Trang 41Ví dụ
Một qui trình SX quả bóng bàn nếu
SX trên một dây chuyền chính xác thì trọng lượng của các quả bóng bàn có phân phối chuẩn Với = 5g và độ lệch chuẩn = 0,1 g Quản đốc nhà máy nhận định rằng có một sự tăng lên về trọng lượng trung bình của các quả bóng được SX ra, với độ lệch chuẩn không thay đổi
Trang 42Một mẫu ngẫu nhiên gồm 16 quả bóng đã được chọn để kiểm tra tính được trung bình bằng 5,038g Kiểm định giả thuyết H0 cho rằng trung bình toàn bộ các quả bóng bàn được SX của nhà máy có trọng lượng t i đa là 5g ở mức ý ối đa là 5g ở mức ý nghĩa 5% và 10%
1/ Đặt giả thuyết
H0 : = 0 5
H : > 5
Trang 43Với mức ý nghĩa 0,1:
Z = 1,52 > Z 0,1 =1,28 => Bác bỏ giả thuyết
Trang 44Xuất hiện ở đây mức ý nghĩa nhỏ nhất nào của giữa 0,05 và 0,1 thì giả thuyết
H0 bị bác bỏ, giá trị tại mức đó được gọi là giá trị P.
Z - trong kiểm định bằng 1,52 Như
vậy giả định giả thuyết Ho bị bác bỏ ở bất cứ giá trị nào của mà ở đó Z nhỏ hơn 1,52
P(Z < Z = 1,52 )
Trang 45Cụ thể tìm giá trị P trong trường hợp
nầy như sau
Z = 1,52 P(z =1,52) = 0,4357
= 0,5 - P(Z =1,52) = 0,5 - 0,4357 = 0,0643
Hay = 6,43 %
Trang 46iều này cho ta suy luận rằng giả thuyết
Điều này cho ta suy luận rằng giả thuyết
H0 có thể bác bỏ ở bất kỳ giá trị nào lớn hơn 6,43%, bởi vì khi > 6,43% thì
Zα 1,52 nằm trong vùng bác bỏ giả ≤ 1,52 nằm trong vùng bác bỏ giả thuyết H0.
10% 6,43% 5%
1,28 1,52 1,6450
Trang 47Tĩm lại, thay vì kiểm định giả thuyết với một giá trị α định trước thì nhiều nhà nghiên cứu cho rằng ta nên định rõ giả thuyết H0 và giả thuyết đối H1, sau đĩ thu thập số liệu mẫu và xác định mức độ khẳng định việc bác bỏ giả thuyết H0 Mức
độ khẳng định này thường được gọi là giá trị P ( P- value) của kiểm định - tức là mức
ý nghĩa nhỏ nhất của α để giả thuyết H 0 bị bác bỏ.
Trang 488.5 Kiểm định giả thuyết về tỷ lệ tổng thể
Trong nhiều vấn đề thực tế, chúng ta cần kiểm định giả thuyết về tỷ lệ của các
phần tử trong một tổng thể lớn Gọi P;
lần lượt là tỷ lệ các đơn vị có một tính chất nào đó mà ta quan tâm trong tổng thể và trong mẫu
p
Trang 49• Với mẫu lớn n 40 , phân phối của tỷ lệ mẫu được xem như chuẩn và kiểm định giả thuyết về p được thực hiện như sau:
Chu y : ch n phân phối sử dụng: ọn phân phối sử dụng:
l n, b i v y, chúng ta sử dụng ớn, bởi vậy, chúng ta sử dụng ởi vậy, chúng ta sử dụng ậy, chúng ta sử dụng Normal distribution để kiểm nh v định về ề p.
Trang 50Có 3 trường hợp kiểm định
Z =
n
p
p p
p
/ 1
ˆ
0 0
Trang 51Ví dụ, Người ta biết gần đúng là cứ 10 người có sử dụng ĐTDĐ thì 1 người thích
sử dụng ĐTDĐ của hãng A SX Sau khi làm chiến dịch Q/cáo cho ĐTDĐ của hãng
A, người ta khảo sát một mẫu n=200 người có dùng ĐTDĐ để biết ảnh hưởng của Q/cáo Kết quả có 26 người sử dụng ĐTDĐ của hãng A SX Dữ kiện trên có đủ cho ta kết luận là có sự gia tăng về tỉ lệ những người sử dụng ĐTDĐ do hãng A với mức ý nghĩa 0,05
Trang 520,13 0,10
1, 41 (0,10.0,90) / 200
Trang 53Ví dụ : Tờ báo “TT” thông báo rằng có 25% học sinh phổ thông trung học là
độc giả thường xuyên Một mẫu ngẫu
nhiên gồm 200 học sinh PTTH cho thấy có 45 em đọc báo đó thường xuyên Kiểm định tính chính xác của thông báo trên với mức ý nghĩa 0,05
Trang 54Rõ ràng nên chọn
Trang 55Ví dụ 3
Một công ty SX bánh kẹo tuyên bố rằng 2/3 số trẻ em thích ăn bánh của công ty Một mẫu gồm 100 trẻ em được hỏi, có
55 em tỏ ra thích bánh của công ty Với mức ý nghĩa 5%, số liệu trên có chứng tỏ là tuyên bố của công ty là hơi quá đáng hay không?
(H0: P = 2/3, đối thuyết H1: P < 2/3)
Trang 568.6.KIỂM ĐỊNH GIẢ THUYẾT VỀ PHƯƠNG
SAI TỔNG THỂ
Giả sử ta có một mẫu gồm n giá trị quan sát (phần tử) được chọn ngẫu nhiên từ một tổng thể có phân phối
trị cụ thể nào đó của phương sai cần
kiểm định và kiểm định ở mức ý nghĩa
được thực hiện như sau:
Trang 57Đuôi phải Đuôi trái 2 đuôi
H H
H H
2 0
( 1)
n S
Trang 58Quy tắc bác bỏ H 0 với mức ý nghĩa , nếu:
Trang 59Ví dụ: Để đạt tiêu chuẩn đã đặt ra cho mức độ tạp chất trong sản phẩm chất hoá học là phương sai không vượt quá 4% Một mẫu ngẫu nhiên gồm 20 sản phẩm có phương sai mẫu 5,62% trong phần trăm mức độ của tạp chất Hãy
10% rằng phương sai chung của tổng thể không vượt quá 4%
Trang 601 Giả thuyết:
2 Kiểm định:
2
2 1
: :
2 0
26,695 4
Trang 613 Tra bảng
4 Ở mức ý nghĩa 10%, số liệu không đủ
bằng chứng để bác bỏ giả thuyết H0 cho rằng phương sai chung của phần trăm mức độ tạp chất tối đa là 4%
Trang 628.7.KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ
KHÁC BIỆT CỦA HAI TRUNG BÌNH TỔNG
THỂ1/ Kiểm định dựa trên sự phối hợp từng cặp
Giả sử một mẫu gồm n cặp quan sát được chọn ngẫu nhiên từ 2 tổng thể X và Y: (x1,y1), (x2,y2), …, (xn,yn)
Gọi là trung bình của X và Y và x , y
Trang 63và Sd là trung bình và độ lệch chuẩn của n khác biệt (xi - yi) Giả sử phân phối
của các sự khác biệt giữa X và Y trong tổng thể là chuẩn, kiểm định giả thuyết về sự khác biệt giữa được thực hiện như sau:
D0 là giá trị cho trước Khi muốn kiểm định , ta đặt D0 = 0
Trang 64d D t
Trang 65Trường hợp kiểm định một bên ta có:
Giả thuyết Bác bỏ H 0 khi
Trang 66Ví dụ
Để xác định hiệu quả của việc áp dụng chế độ ăn kiêng đặc biệt trong việc làm giảm huyết áp 7 người tình nguyện đã được chọn để thử nghiệm chế độ ăn kiêng này trong 6 tuần lể Kết quả được ghi nhận qua bảng sau:
Trang 67Trước Sau Chênh lệch, d i d 2
Trang 68► Giá trị và S d được tính như sau:
► Độ lệch chuẩn của
2
2 2
Trang 69Buớc 1: Giả thuyết:
H0:
H1:
Bước 2: Chọn phân phối:
Mẫu nhỏ, và chưa biết, ta dùng phân phối Student
Bước 3: Xác định vùng chấp nhận H 0 :
Kiểm tra 2 đuôi: α/2 = 0,05/2 = 0,025
n-1 = 7 – 1 = 6 Tra bảng Student:
Trang 70tn-1,α/2= 2,447
Tính giá trị kiểm định:
Vì 1,226 < 2,447 nên không có cơ sở để
bác bỏ H0 Tức là chưa có sự khác biệt
đáng kể giữa chế độ ăn kiêng áp dụng với
việc làm giảm huyết áp
Trang 71Ví dụ
Một Cty muốn biết nếu dự một khóa học
“Ngh thu t giao ti p” có thể tăng doanh số ệ thuật giao tiếp” có thể tăng doanh số ật giao tiếp” có thể tăng doanh số ếp” có thể tăng doanh số bán của nhân viên.? Công ty gửi 6 nhân viên dự khoá học trên Dữ liệu bảng dưới đây cho biết doanh số bán trong 1 tuần của mỗi người trước và sau khi dự khoá học
Trang 72Sử dụng mức ý nghĩa 1%, doanh số bán trung bình trong 1 tuần của tất cả nhân viên bán hàng có tăng lên khi dự khoá học
Đặt giả thuyết:
Trang 732/ Kiểm định dựa trên mẫu n.nhiên độc
lập: Gọi nx , ny là các mẫu được chọn ngẫu nhiên độc lập từ hai tổng thể có phân phối chuẩn X và Y (trường hợp mẫu lớn), có
Trung bình tương ứng là:
Và phương sai tương ứng là:
Và trung bình mẫu tương ứng là:
Trang 74Ta cần kiểm định giả thuyết:
2
y x
x y
x y Dz
Trang 75Giả thuyết Bác bỏ H 0 khi:
Trang 76Ví dụ: Người ta tiến hành 1 cuộc nghiên cứu để so sánh mức lương trung bình của phụ nữ với mức lương trung bình của nam giới trong
1 cty lớn Một mẫu ngẫu nhiên gồm 100 phụ nữ có mức lương trung bình 7,23 trđ/tháng với độ lệch tiêu chuẩn là 1,64 trđ/tháng
Một mẫu ngẫu nhiên gồm 75 nam có mức lương trung bình là 8,06 trđ/tháng