3.2 Giả định Assumptions: Các giả định quan trọng trong phép ước lượng cũng quan trọng trong KĐGT, bao gồm: phân phối bình thường của dân số, phương sai bằng nhau, mẫu độc lập... Số TK
Trang 1CHƯƠNG 1: NHỮNG LÝ LUẬN CƠ BẢN
VỀ QUẢN TRỊ TIÊU THỤ HÀNG HOÁ
TRONG DOANH NGHIỆP
Trang 2KIỂM ĐỊNH GIẢ THUYẾT
(Hypothesis Testing)
I GIỚI THIỆU
Cũng giống như phép ước lượng, mục đích của kiểm định giả thuyết (KĐGT) nhằm giúp đạt được một kết luận liên quan đến 1 dân số bằng cách khảo sát 1 mẫu rút ra từ dân số đó
1 Khái niệm cơ bản
Một giả thuyết (hypothesis) có thể được định nghĩa là một phát biểu về một hoặc nhiều
dân số
Giả thuyết thường liên quan với các thông số của những dân số được phát biểu đến Bằng
Trang 3cách KĐGT người ta xác định được là các phát biểu này có phù hợp với số liệu có sẵn
hay không
2 Loại giả thuyết: có hai loại giả thuyết: giả thuyết nghiên cứu và giả thuyết thống
kê
Giả thuyết nghiên cứu là sự ức đoán hoặc giả định thúc đẩy việc nghiên cứu Giả
thuyết nghiên cứu dẫn trực tiếp đến giả thuyết thống kê
Giả thuyết thống kê là những giả thuyết được phát biểu sao cho chúng có thể được
lượng giá bằng những kỹ thuật thống kê thích hợp
3 Các bước KĐGT: phương pháp chín bước
3.1 Số liệu (Data) : Bản chất của số liệu làm cơ sở cho phương pháp kiểm định phải
được
biết rõ
3.2 Giả định (Assumptions): Các giả định quan trọng trong phép ước lượng cũng quan
trọng trong KĐGT, bao gồm: phân phối bình thường của dân số, phương sai bằng nhau, mẫu độc lập
Trang 43.3 Giả thuyết (Hypothesis): Trong KĐGT có 2 giả thuyết thống kê,
Giả thuyết trống (Null hypothesis): là giả thuyết cần được kiểm định Ký hiệu
từ chối, chúng ta nói rằng số liệu để tiến hành kiểm định không cung cấp đủ bằng
chứng để đưa đến sự từ chối Nếu tiến trình kiểm định đưa đến sự từ chối, chúng
ta nói
rằng số liệu hiện có không thích hợp với H0, nhưng lại thích hợp với 1 số giả thuyết
Trang 5khác
Giả thuyết thay thế (Alternative hypothesis): ký hiệu HA, là 1 phát biểu về điều chúng ta sẽ tin là đúng nếu số liệu của mẫu làm cho ta phải từ chối H0 Thông thường, giả thuyết thay thế và giả thuyết nghiên cứu giống nhau
Qui tắc phát biểu giả thuyết thống kê
+ Kết quả mà ta hi vọng hoặc mong muốn có được từ phép kiểm thường được đặt
trong HA
+ H0 phải bao gồm 1 phát biểu về đẳng thức (= , , )
+ H0 là giả thuyết cần được kiểm định
+ H0 và HA được xem là hai tập hợp phụ của nhau
Thí dụ:
Giả sử chúng ta muốn trả lời câu hỏi:
Có thể kết luận là trung bình dân số không bằng 50 không?
Trang 63.4 Số thống kê kiểm định (Test Statistic): là các số thống kê có thể tính được từ số
liệu của mẫu Số thống kê kiểm định (số TKKĐ) đóng vai trò “ra quyết định”, vì
quyết định từ chối hoặc không từ chối tùy thuộc vào độ lớn của số TKKĐ Một thí
dụ của số TKKĐ là đại lượng
Trang 7
Số TK kiểm định =
3.5 Phân phối của số TKKĐ (Distribution of the Test Statistic): cần phải cho biết rõ
3.6 Qui tắc quyết định (Decision Rule): Tất cả các giá trị mà số TKKĐ có thể giả
định là những điểm nằm trên trục hoành của đồ thị phân phối số TKKĐ và được chia
làm 2 nhóm : một nhóm cấu tạo nên vùng từ chối, và nhóm kia cấu tạo nên vùng
không từ chối Các giá trị của số TKKĐ cấu tạo nên vùng từ chối là những giá trị ít có
khả năng xảy ra nếu H0 đúng
Qui tắc quyết định bảo ta :
Trang 8+ Từ chối H 0 nếu giá trị của số TKKĐ tính được từ mẫu là 1 trong những giá trị nằm trong
vùng từ chối
trị nằm
trong vùng không từ chối
Ngưỡng có ý nghĩa thống kê (Significance Level): quyết định xem giá trị nào nằm
trong vùng từ chối và giá trị nào nằm trong vùng không từ chối được thực hiện dựa
trên cơ sở của ngưỡng có ý nghĩa thống kê mong muốn, ký hiệu là
biểu thị diện tích nằm dưới đường cong của phân phối số TKKĐ, phía trên các giá
trị cấu tạo nên vùng từ chối nằm trên trục hoành
Ngưỡng có ý nghĩa thống kê là một xác suất, và thực tế, là xác suất để từ chối
một H 0 khi nó đúng
Trang 9Vì từ chối H0 khi nó đúng là một sai lầm, và trong thực tế chúng ta muốn xác suất xảy
ra sai lầm này nhỏ Giá trị của thường được chọn là 0,01 0,05 0,10
Loại sai lầm (Types of Errors): Sai lầm phạm phải trong việc từ chối H0 khi nó
đúng được gọi là Sai lầm loại I (type I error) Sai lầm loại II (type II error) là sai lầm
phạm phải trong việc không từ chối H0 khi nó sai Xác suất của việc phạm phải sai
lầm loại II được ký hiệu bằng
Trang 103.7 Tính số TKKĐ (Calculation of the Test Statistic): Từ số liệu của mẫu, tính 1 giá trị
của
số TKKĐ và so nó với các vùng từ chối và không từ chối đã được chỉ rõ
3.8 Quyết định thống kê (Statistical Decision) : bao gồm việc từ chối hoặc không từ
giá trị của số TKKĐ nằn trong vùng không từ chối
3.9 Kết luận (Conclusion) : Nếu H0 bị từ chối, chúng ta kết luận là HA đúng Nếu H0
không bị từ chối, chúng ta kết luận là H0 có thể đúng
4 Mục đích của Kiểm Định Giả Thuyết
Mục đích của KĐGT là nhằm giúp cho các CBYT phụ trách quản trị, lâm
Trang 11sàng và cộng đồng ra được các quyết định (dựa trên các quyết định mang tính thống kê) Nếu H0 bị từ chối, CBYT có thể đưa ra những quyết định phù hợp với HA Nếu
H0 không bị từ chối, quyết định đưa ra có thể sẽ không theo HA, hoặc quyết định phải thu thập
thêm số liệu (để nghiên cứu tiếp) Cần lưu ý là kết quả của phép kiểm thống kê chỉ là
1 phần bằng chứng có ảnh hưởng đến quyết định đề ra Quyết định mang tính thống kê không nên được xem là cái gì xác quyết mà cần được cân nhắc cùng với các thông tin sát hợp khác hiện có
II KĐGT VỀ MỘT TRUNG BÌNH DÂN SỐ
1 Lấy mẫu từ các dân số PP Bình thường
Thí dụ: Tuổi của 1 dân số PP Bình thường với phương sai bằng 20 Có thể kết
luận là tuổi trung bình của dân số này không phải là 30 không, nếu lấy mẫu ngẫu nhiên đơn giản n = 10 và tính được trung bình mẫu là 27?
Có thể kết luận là tuổi trung bình của dân số không phải là 30 nếu chúng ta có thể từ chối giả thuyết trống về trung bình dân số bằng 30
a/ Số liệu: Mẫu ngẫu nhiên đơn giản n = 10 x = 27
b/ Giả định: Mẫu được rút ra từ dân số PP Bình thường với 2
= 20
Trang 12e/ Phân phối của số TKKĐ
PP của số TKKĐ sẽ là PP Bình thường chuẩn nếu H0 đúng
f/ Qui tắc quyết định: Từ chối H0 nếu giá trị tính được của số TKKĐ nằm trong vùng từ chối, và không từ chối H0 nếu giá trị tính được của số TKKĐ nằm trong vùng không từ chối
Cách xác định vùng từ chối và vùng không từ chối: H 0 sẽ sai nếu 30 hoặc 30 Như vậy, các giá trị đủ nhỏ (so với 30) hoặc đủ lớn (so với 30) của số TKKĐ sẽ giúp chúng ta từ chối H 0 , và chính các giá trị này cấu tạo nên vùng từ chối Giá trị như thế
Trang 13nào sẽ được xem là đủ nhỏ hoặc đủ lớn? Câu trả lời tùy thuộc vào ngưỡng có ý nghĩa
thống kê (xác suất của việc phạm sai lầm loại I) mà chúng ta đã chọn
Xác suất để từ chối H 0 khi nó đúng đã chọn là = 0,05 Vì vùng từ chối trong trường hợp này bao gồm 2 phần: 1 phần chứa các giá trị đủ lớn, và 2 phần chứa các giá trị đủ nhỏ nên sẽ được chia làm 2 /2 = 0,025 là xác suất đi kèm với các giá trị đủ lớn,
và /2 = 0,025 là xác suất đi kèm với các giá trị đủ nhỏ
Giá trị tới hạn (Critical value) của số TKKĐ
trị lớn bằng hoặc lớn hơn nó là 0,025
Nói cách khác, giá trị nào của z nằm ở phía bên phải nơi chiếm 0,025 diện tích dưới đường cong PP Bình thường chuẩn?
Giá trị của z nằm ở phía bên phải nơi chiếm phần diện tích 0,025 dưới đường cong
PP Bình thường chuẩn cũng là giá trị chiếm phần diện tích 0,975 (giữa giá trị này và
–) Tra bảng để có giá trị này bằng 1,96
Tương tự, tra bảng để tìm thấy giá trị –1,96, là giá trị của số TKKĐ nhỏ đến mức khi
H o đúng thì xác suất để tìm được giá trị nhỏ bằng hoặc nhỏ hơn (giá trị này) bằng 0,025
Trang 14Vùng từ chối như vậy sẽ bao gồm tất cả các giá trị lớn bằng hoặc lớn hơn 1,96, hoặc
nhỏ bằng hoặc nhỏ hơn –1,96 Vùng không từ chối bao gồm tất cả các giá trị nằm
giữa 1,96
và –1,96
Chúng ta có thể phát biểu qui tắc quyết cho phép kiểm này như sau: Từ chối H 0 nếu giá trị tính được của số TKKĐ 1,96 hoặc –1,96 Ngoài ra, không từ chối H 0
Giá trị của số TKKĐ phân cách vùng từ chối và vùng không từ chối được gọi là giá trị
tới hạn của số TKKĐ, và vùng từ chối đôi khi còn gọi là vùng tới hạn
Trang 15-2,12 -1,96 0 1,96 z
g/ Tính số TKKĐ
10/20
30
27
=
4142,1
i/ Kết luận: Trung bình dân số không bằng 30
Giá trị p (p values):
Thay vì nói rằng giá trị quan sát được của số TKKĐ có ý nghĩa hoặc không có ý nghĩa thống kê, chúng ta có thể cho biết xác suất cụ thể của việc tìm được 1 giá trị lớn bằng hoặc lớn hơn giá trị của số TKKĐ (nếu H0 đúng) Đó là phát biểu về giá trị p Trong
thí dụ trên, giá trị p = 0,034 và có nghĩa là xác suất để tìm thấy 1 giá trị lớn bằng hoặc
lớn hơn 2,12 theo cả 2 hướng, khi H0 đúng, bằng 0,034 Giá trị 0,034 được tính sau
Trang 16khi tra bảng và là xác suất để tìm thấy 1 giá trị z 2,12 (bằng 0,017) hoặc 1 giá trị
z –2,12 (bằng 0,017) khi H0 đúng p =0,017 + 0,017 = 0,0340
Định nghĩa: Giá trị p của 1 phép kiểm định giả thuyết là xác suất để tìm thấy, khi H0
đúng, một giá trị của số TKKĐ lớn bằng hoặc lớn hơn (theo hướng thích hợp) giá trị (của số TKKĐ) tính được
Giá trị p của 1 phép kiểm cũng có thể được xem là giá trị nhỏ nhất của mà theo đó
H0 có thể bị từ chối Vì qua thí dụ trên, với p = 0,034, chúng ta có thể chọn giá trị của
nhỏ bằng 0,034 và vẫn có thể từ chối H0 Nếu chọn < 0,034, chúng ta không chắc
Phép kiểm định giả thuyết 1 đuôi (One-sided Hypothesis Tests)
Phép KĐGT có thể là một đuôi khi tất cả vùng từ chối nằm về 1 phía (1 đuôi) của đường biểu diễn phân phối
Trang 17Thí dụ: (như thí dụ trên nhưng với kết luận muốn tìm là 30) Bài giải sau đây chỉ
trình bày những điểm khác giữa 2 thí dụ
c/ Giả thuyết:
f/ Qui tắc quyết định: Với = 0,05 Việc xác định vùng từ chối và giá trị tới hạn nằm
ở lý luận như sau : các giá trị đủ nhỏ sẽ gây từ chối H 0 , như vậy vùng từ chối sẽ chứa
Tra bảng thấy giá trị của z nằm ở phía bên trái nơi chiếm phần diện tích 0,05 dưới đường cong PP Bình thường chuẩn là –1,645 Qui tắc quyết định : từ chối H 0 nếu giá trị tính được của số TKKĐ nhỏ hơn hoặc bằng –1,645
Trang 18
-2,12 -1,645 0 z
h/ Quyết định thống kê: Từ chối H 0 vì –2,12 < –1,645 p = 0,017 < 0,05
i/ Kết luận : Trung bình dân số <30
Giá trị p: trong trường hợp này bằng 0,017, vì khi H0 đúng, P(z –2,12) =
0,017
2 Lấy mẫu từ dân số PP Không bình thường + 2 không biết + n nhỏ
Thí dụ: Chọn ngẫu nhiên 1 mẫu n =14 người, đo BMI, x = 30,5 s = 10,6392
Có thể kết luận là BMI trung bình của dân số chọn mẫu không phải là 35 không?
Trang 19a/ Số liệu: Số đo BMI của 14 người với x = 30,5
b/ Giả định: 1 Số đo BMI trong dân số này PP Bình thường,
2 Phương sai không biết
3 Mẫu ngẫu nhiên đơn giản
e/ Phân phối của số TKKĐ:
Số TKKĐ phân phối theo t với n–1 = 14 – 1 = 13 df nếu H0 đúng
Trang 20f/ Qui tắc quyết định: Với = 0,05, phép kiểm 2 đuôi với mỗi đuôi bằng /2 =
0,025
Giá trị t nằm ở phía bên trái và bên phải của diện tích 0,025 là 2,1604 và –2,1604
Từ chối H0 nếu giá trị tính được của số TKKĐ lớn hơn hoặc bằng 2,1604 hoặc nhỏ
Trang 21g/ Tính số TKKĐ
14 / 6392 , 10
35 5 ,
30
=
8434,2
5,4
= –1,58
h/ Quyết định thống kê: Không từ chối H0 vì –1,58 nằm trong vùng không từ chối
0,05 < p (t –1,58) < 0,10
i/ Kết luận: Trung bình dân số có thể bằng 35
Giá trị p: trong trường hợp này tra bảng chỉ có thể xác định giá trị p bằng 1 khoảng
Với độ tự do bằng 13, tìm thấy: –1,58 < –1,350 t0,90: 0,10
Khi H0 đúng, xác suất để tìm được một giá trị của t –1,58 bằng 0,05 < P(t –1,58) < 0,10
Vì đây là phép kiểm 2 đuôi nên phải nhân hai, như vậy 0,10 < p < 0,20
III KĐGT VỀ HIỆU CỦA 2 TRUNG BÌNH DÂN SỐ
Trang 22KĐGT về hiệu của 2 trung bình dân số rất thường được dùng để định rõ xem có
thể kết luận được là 2 trung bình dân số này không bằng nhau hay không Giả
thuyết liên quan đến trường hợp so sánh này thường được thiết lập như sau:
H0: 1 – 2 = 0 HA: 1 – 2 0 (1 2)
H0: 1 – 2 0 HA: 1 – 2 0 (1 2)
H0: 1 – 2 0 HA: 1 – 2 0 (1 2)
1 Lấy mẫu từ các dân số PP Bình thường + các 2 biết
Thí dụ chứng minh: Các nhà nghiên cứu muốn biết xem số liệu mà họ đã thu
thập có cung cấp đủ bằng chứng để kết luận là có sự khác biệt về nồng độ uric acid/HT giữa trẻ bình thừơng và trẻ có H/C Down không Số liệu bao gồm kết quả nồng độ trung bình uric acid/HT của một mẫu gồm 12 trẻ có H/C Down là x1 = 4,5/100 ml và của một mẫu khác gồm 15 trẻ bình thường là x2 = 3,4/100 ml Được
Trang 23b Giả định: Số liệu bao gồm 2 mẫu ngẫu nhiên đơn giản độc lập với nhau rút ra từ 2
1
= 1 (dân số trẻ có H/C Down) và 2
2
= 1,5 (dân số trẻ bình thường)
2 1
0 2 1 2
(
n n
x x
e PP của số TKKĐ: khi H 0 đúng, số TKKĐ sẽ PP Bình thường chuẩn
f Qui tắc quyết định: Đặt = 0,05 Các giá trị tới hạn của z là 1,96 Từ chối H 0
trừ phi
– 1,96 < z tínhđược < 1,96
g Tính số TKKĐ
Trang 24z =
15
5 , 1 12 1
0 ) 4 , 3 5 , 4 (
1,1
= 2,57
h Quyết định thống kê: Từ chối H 0 vì 2,57 > 1,96
i Kết luận: Hai trung bình dân số này không bằng nhau Giá trị p = 0,0102
2 Lấy mẫu từ các dân số PP Không Bình thường
Lấy mẫu lớn để áp dụng Lý thuyết giới hạn trung tâm và PP Bình thường
chuẩn
3 Lấy mẫu từ các dân số PP Bình thường + các 2 không được biết nhưng giả
định được là bằng nhau + các n nhỏ
Thí dụ chứng minh: Một nhà nghiên cứu muốn khảo sát bản chất của sự hủy
hoại phổi ở phổi của người hút thuốc lá xảy ra trước khi phát triển khí phế thủng nặng
Có 3 chỉ số để đo và số đo càng lớn chứng tỏ tổn thương phổi càng nặng Một chỉ số
đo được ở
Trang 251 mẫu 16 người hút thuốc lá cho x S = 17,5 sS = 4,4711
1 mẫu 9 người không hút thuốc lá cho x NS = 12,4 sNS = 4,8492
Nhà nghiên cứu muốn kết luận (dựa trên cơ sở các số liệu này) là nói chung, người hút thuốc lá bị tổn thương phổi nặng hơn người không hút theo chỉ số này
a Số liệu: (Xem đề bài)
b Giả định: Số liệu bao gồm 2 mẫu ngẫu nhiên đơn giản độc lập rút ra từ 1 dân số
bao gồm người hút thuốc lá và dân số kia bao gồm người không hút thuốc lá Số đo chỉ số hủy hoại phổi ở cả 2 dân số đều PP gần như bình thường Phương sai của 2 dân số không được biết nhưng được giả định là bằng nhau
1
2
0
)(
)(
n
s n s
x x t
p p
NS s NS
Trang 26e PP của số TKKĐ: Khi H 0 đúng, số TKKĐ sẽ có PP t với (n 1 + n 2 – 2) độ tự do
f Qui tắc quyết định: Đặt = 0,05 Giá trị tới hạn của t là + 1,7139 (vì cần các số dương để phủ định H 0 ) Từ chối H 0 trừ phi số TKKĐ tính được < 1,7139
)8492,4(8)4711,4(
2165 , 21
0 ) 4 , 12 5 , 17 (
Trang 27thương nặng hơn người không hút 0,01 > p > 0,005 (vì 2,500 < 2,6573 < 2,8073)
1
2
0 2 1 2
(
n
s n s
x x
p p
với các giá trị tới hạn được tính bằng
trường hợp hai đuôi
2 1
2 2 1 1 ) 2 / 1 ( '
w w
t w t w t