Bài giảng Thống kê kinh doanh: Chương 6 Kiểm định giả thuyết thống kê, được biên soạn gồm các nội dung chính sau: Bài toán kiểm định; Kiểm định giả thuyết về trung bình của tổng thể; Kiểm định giả thuyết về tỷ lệ. Mời các bạn cùng tham khảo!
Trang 1(Business Statistics)
Chương 6.
Kiểm định giả thuyết thống kê
1
Trang 2CHƯƠNG VI KIỂM ĐỊNH GIẢ
THUYẾT THỐNG KÊ
VI.1 Bài toán kiểm định
VI.2 Kiểm định giả thuyết về
trung bình của tổng thể
VI.3 Kiểm định giả thuyết về tỷ lệ
2
Trang 3VI.1 BÀI TOÁN KIỂM ĐỊNH
1 Khái niệm
Các đặc trưng của mẫu ngoài việc sử dụng để ước lượng các đặc trưng của tổng thể còn được dùng để đánh giá xem một giả thuyết nào đó của tổng thể là đúng hay sai Việc tìm ra kết luận để bác bỏ hay chấp nhận một giả thuyết được gọi là kiểm định giả thuyết.
Ví dụ 6.1 Một nhà sản xuất cho rằng khối lượng trung bình của một gói mì là 75 gam Để kiểm tra điều này đúng hay sai, chọn ngẫu nhiên một số gói mì để kiểm tra và tính toán.
Ví dụ 6.2 Một xí nghiệp cho rằng tỉ lệ phế phẩm trong kho hàng là 5% Để kiểm tra điều này đúng hay sai, chọn ngẫu
Trang 42 Giả thuyết H0 và giả thuyết H1
Giả sử tổng thể có đặc trưng θ chưa biết Với giátrị cụ thể θ0 cho trước nào đó, ta cần kiểm địnhgiả thuyết H0: θ = θ0
Giả thuyết H1 là kết quả ngược lại của giảthuyết H0 Nếu H1 đúng thì H0 sai và ngược lại
H1 còn được gọi là giả thuyết đối (đối thuyết)
Vậy cặp giả thuyết H0 và H1 được thể hiện trongtrường hợp kiểm định sau đây
H0: θ = θ0; H1: θ ≠ θ0
Ví dụ 6.3 Ở Ví dụ 6.1 ta có thể đặt giả thuyết:
H0: θ = 75; H1: θ ≠ 75 4
Trang 53 Sai lầm loại một, sai lầm loại hai
Vì chỉ dựa trên một mẫu để kết luận các giá trị của tổng thể nên ta có thể phạm sai lầm khi đưa ra kết luận về giả thuyết H0 Các sai lầm đó là:
a) Sai lầm loại một: Giả thuyết H0 đúng nhưng ta bác bỏ nó.
b) Sai lầm loại hai: Giả thuyết H0 sai nhưng ta chấp nhận nó.
Khi kiểm định, người ta mong muốn khả năng mắc sai lầm loại một không vượt quá một số α cho trước, nghĩa
là xác suất bác bỏ H0 khi nó đúng là α thì xác suất chấp nhận nó là 1–α Ta gọi α là mức ý nghĩa của kiểm định.
Trong một bài toán kiểm định, nếu khả năng phạm sai lầm loại một giảm thì khả năng phạm sai lầm loại hai lại tăng lên Do đó người ta thường chọn α trong khoảng từ 1% đến 10%.
5
Trang 6 Mức ý nghĩa nhỏ nhất đó gọi là giá trị p Giá trị p được xem như một “ mức ý nghĩa tiêu chuẩn/chính xác ”, gắn liền với từng trường hợp cụ thể Do vậy, thay
vì định trước mức ý nghĩa α , người ta thường xác định giá trị p (Khi việc tính toán được thực hiện bằng các chương trình xử lí dữ liệu thì kết quả tính được bằng máy tính luôn thể hiện giá trị p).
6
Trang 7 Ví dụ 6.4 Một hãng sản xuất lốp xe ô tô tuyên bố sản phẩm của hãng có thể sử dụng 100.000 km , độ lệch tiêu chuẩn bằng 12.000 km Một công ty vận tải mua 64 lốp xe, sau một thời gian sử dụng thấy
độ bền trung bình là 98.500 km.
a) Hãy phát biểu giả thuyết H0, H1?
b) Sai lầm loại I trong bài toán này là gì? Hãy nêu một hậu quả có thể của sai lầm này?
c) Sai lầm loại II trong bài toán này là gì? Hãy nêu một hậu quả có thể của sai lầm này?
7VI.1 BÀI TOÁN KIỂM ĐỊNH
Trang 85 Các bước cần thực hiện trong bài toán kiểmđịnh giả thuyết
Một bài toán kiểm định giả thuyết bao gồm 5 bước sau đây:
Bước 1 Thiết lập giả thuyết H0 và H1.
Bước 2 Tính giá trị kiểm định (Mỗi loại kiểm định có công thức riêng nhằm đánh giá giả thuyết.)
Bước 3 Chọn mức ý nghĩa α và xác định miền bác bỏ
giả thuyết (nếu giá trị kiểm định nằm trong miền này thì H0
bị bác bỏ).
Bước 4 Đưa ra kết luận về mặt thống kê , nghĩa là ở một mức ý nghĩa α nào đó ta sẽ bác bỏ hay chấp nhận giả thuyết H0.
Bước 5 Kết luận cuối cùng về nội dung bài toán nhằm trả lời một cách rõ ràng câu hỏi mà bài toán đặt ra (không
Trang 9VI.2 KIỂM ĐỊNH GIẢ THUYẾT VỀ TRUNG
BÌNH CỦA TỔNG THỂ
1 Bài toán kiểm định trung bình trên một mẫu
Giả sử ta có một mẫu gồm n quan sát đượcchọn từ tổng thể Gọi lần lượt là trungbình, phương sai của tổng thể; trung bình,phương sai mẫu hiệu chỉnh Ta cần kiểm địnhgiả thuyết:
là một giá trị cụ thể với mức ý nghĩa α cho trước.Khi đó việc kiểm định được thực hiện như sau:
9
Trang 101 Bài toán kiểm định trung bình trên một mẫu
a) Trường hợp đã biết phương sai của tổng thể
Giá trị kiểm định được tính bởi công thức:
Quy tắc quyết định: Bác bỏ H0 ở mức ý nghĩa
nếu:
(ngược lại ta “chấp nhận” H0 ở mức ý nghĩa )
Ta nhận thấy có mối quan hệ giữa ước lượng
và kiểm định giả thuyết, cụ thể, giả thuyết H0 bịbác bỏ với mức ý nghĩa khi và chỉ khi khoảngước lượng (với độ tin cậy ) của μ không
Trang 11Ví dụ 6.5 Một máy đóng mì gói tự động quy định khối lượng trung bình là 75 gam , độ lệch tiêu chuẩn là 15 gam Sau một thời gian sản xuất, kiểm tra 80 gói ta có khối lượng trung bình mỗi gói là 72 gam Hãy kết luận về tình hình sản xuất với
mức ý nghĩa 5% Tìm giá trị p (p-value).
Giải Tổng thể là toàn bộ số gói mì do máy đó đóng gói Theo quy định thì khối lượng trung bình của mỗi gói phải
là 75 gam, nhưng trên thực tế thì khối lượng trung bình là
μ chưa biết Ta có giả thuyết:
(đúng như quy định) Nếu giả thuyết đúng thì tình hình sản xuất bình thường Nếu giả thuyết sai thì tình hình sản xuất không bình
thường Ta cần kiểm định giả thuyết đó ở mức ý nghĩa 5% 11
a) Trường hợp đã biết phương sai của tổng thể
Trang 12 Theo đề bài ta có và phương sai của tổng thể
đã biết, do đó giá trị kiểm định:
Từ mức ý nghĩa , tra bảng hàm số Laplace, ta có
Trang 13 Ví dụ 6.6 Một hãng sản xuất lốp xe ô tô tuyên
bố sản phẩm của hãng có thể sử dụng 100.000
km, độ lệch tiêu chuẩn bằng 12.000 km Mộtcông ty vận tải mua 64 lốp xe, sau một thời gian
sử dụng thấy độ bền trung bình là 98.500 km
Hãy kết luận về tuyên bố của hãng sản xuất lốp
xe với mức ý nghĩa 5%
13
1 Bài toán kiểm định trung bình trên một mẫu
a) Trường hợp đã biết phương sai của tổng thể
Trang 141 Bài toán kiểm định trung bình trên một mẫu
b) Trường hợp chưa biết phương sai của tổng thể
- Với mẫu có kích thước n ≥ 30 thì
và quy tắc quyết định
như trường hợp đã biết phương sai của tổng thể.
- Với mẫu có kích thước n < 30 và tổng thể có phân phối chuẩn thì giá trị kiểm định:
Quy tắc quyết định: Bác bỏ H0 ở mức ý nghĩa α
nếu trong đó có phân phối Student Chú ý Trong tất cả các trường hợp, khi giả thuyết
đã bị bác bỏ (tức là ) thì:
Với ta kết luận μ > μ0; với thì μ < μ0 14
Trang 151 Bài toán kiểm định trung bình trên một mẫub) Trường hợp chưa biết phương sai của tổng thể
Ví dụ 6.7 Một nhà máy sản xuất đèn chụp hìnhcho biết tuổi thọ trung bình của sản phẩm là 100giờ Người ta chọn ngẫu nhiên 15 bóng thửnghiệm thấy tuổi thọ trung bình là 99,7 giờ,
phương sai mẫu hiệu chỉnh là 0,15
Giả sử tuổi thọ của đèn có phân phối chuẩn Chokết luận về tình hình sản xuất của nhà máy vớimức ý nghĩa 1%
15
Trang 161 Bài toán kiểm định trung bình trên một mẫub) Trường hợp chưa biết phương sai của tổng thể
Trang 172 Kiểm định trung bình của tổng thể trên hai mẫu
Mẫu phối hợp từng cặp (không độc lập, xem tài liệu).
Giả sử ta có hai mẫu được chọn ngẫu nhiên, độc lập từ hai tổng thể có phân phối chuẩn là X và Y Gọi nx, ny là kích thước của hai mẫu tương ứng và
lần lượt là trung bình của tổng thể, phương sai của tổng thể, trung bình mẫu, phương sai mẫu hiệu chỉnh tương ứng với hai mẫu đó.
Ta cần kiểm định giả thuyết:
với mức ý nghĩa α LƯU Ý: Phần kiểm định trung bình của tổng
thể trên hai mẫu là phần đọc thêm trong học kỳ này.
Trang 182 Kiểm định trung bình của tổng thể trên hai mẫu
a) Trường hợp đã biết phương sai của hai tổng thể thì giá trị kiểm định:
b) Trường hợp chưa biết phương sai của hai tổng thể
phương sai mẫu hiệu chỉnh trong công thức trên, nghĩa là:
18
Trang 192 Kiểm định trung bình của tổng thể trên hai mẫu
Trường hợp a) và b) nguyên tắc bác bỏ như sau:
Trong trường hợp giả thuyết bị bác bỏ ,
* Nếu thì ta kết luận ;
* Nếu thì ta kết luận
Giả thuyết Bác bỏ H0 khi
19
Trang 202 Kiểm định trung bình của tổng thể trên hai mẫu
b) Trường hợp chưa biết phương sai của hai tổng thể
Ví dụ 6.8 Một trại chăn nuôi chọn một giống gà để tiến hành nghiên cứu hiệu quả của hai loại thức ăn
A và B Sau một thời gian nuôi thử nghiệm người ta chọn 50 con gà nuôi bằng thức ăn A thì thấy khối lượng trung bình là 2,2 kg , độ lệch mẫu hiệu chỉnh là
1,25 kg Chọn 40 con gà nuôi bằng thức ăn B thì thấy khối lượng trung bình 1,2 kg , độ lệch mẫu hiệu chỉnh
1,02 kg Hãy đánh giá hiệu quả của hai loại thức ăn
đó với mức ý nghĩa 1%.
20
Trang 212 Kiểm định trung bình của tổng thể trên hai mẫu
21
Trang 22Ví dụ 6.8 Giải: (tiếp theo)
A lớn hơn so với nuôi bằng thức ăn B Vậy thức ăn
A có hiệu quả hơn (ở mức ý nghĩa 1%)
22
Trang 232 Kiểm định trung bình của tổng thể trên hai mẫu
Ví dụ 6.9 Nghiên cứu về hai nhãn hiệu pin X và
Y Chọn ngẫu nhiên mỗi loại 100 pin, kết quảghi nhận được như sau Pin X có thời gian sửdụng trung bình là 308 phút, độ lệch mẫu hiệuchỉnh là 54 phút Đối vối pin Y các chỉ số tươngứng là 286 và 40 phút
Có ý kiến cho rằng thời gian sử dụng trungbình của pin X lớn hơn pin Y Với mức ý nghĩa
= 0,01 bạn có nhận xét gì về ý kiến trên?
23
Trang 242 Kiểm định trung bình của tổng thể trên hai mẫu
hoặc thì giá trị kiểm định:
trong đó
Quy tắc bác bỏ như sau:
Giả thuyết Bác bỏ H0 khi
24
Trang 252 Kiểm định trung bình của tổng thể trên hai mẫu c) Trường hợp chưa biết phương sai của tổng thể mà
hoặc
Ví dụ 6.10 Ban lãnh đạo của một công ty cho rằng doanh số bán hàng tăng lên sau khi thực hiện các biện pháp khuyến mãi Chọn ngẫu nhiên 13 tuần trước đợt khuyến mãi và 14 tuần sau đợt khuyến mãi Doanh
số trung bình và độ lệch mẫu hiệu chỉnh trước đợt khuyến mãi là 1234 và 324 triệu đồng Còn sau đợt khuyến mãi , các con số này lần lượt là 1864 và 289
triệu đồng Hãy kiểm định ý kiến trên với = 0,05.
25
Trang 262 Kiểm định trung bình của tổng thể trên hai mẫu c) Trường hợp chưa biết phương sai của tổng thể mà
hoặc
Ví dụ 6.10 Giải: Gọi lần lượt là doanh số trung bình sau và trước khi thực hiện các biện pháp khuyến mãi Ta đặt giả thuyết:
Nếu giả thuyết H0 đúng thì đợt khuyến mãi không làm tăng doanh thu Nếu giả thuyết H0 sai thì CT khuyến mãi
có tác động Ta kiểm định giả thuyết ở mức ý nghĩa 5%.
26
Trang 27Ví dụ 6.10 Giải (tiếp theo):
Đề bài:
Ta có:
Do đó giá trị kiểm định:
sau khi áp dụng các biện pháp khuyến mãi đã tăng lên
Trang 282 Kiểm định trung bình của tổng thể trên hai mẫu c) Trường hợp chưa biết phương sai của tổng thể mà
Ví dụ 6.11 Cho hai tổng thể có phân phối chuẩn.
Mẫu ngẫu nhiên 15 đơn vị chọn từ tổng thể thứ nhất có giá trị trung bình là 100 , độ lệch mẫu hiệu chỉnh là 5 Mẫu ngẫu nhiên 10 đơn vị chọn từ tổng thể thứ hai có các kết quả tương ứng là 110 và 3 Với = 5%, hãy kiểm định giả thuyết cho rằng trung bình của hai tổng thể này bằng nhau.
28
Trang 30V.3 KIỂM ĐỊNH GIẢ THUYẾT VỀ TỈ LỆ
1 Bài toán kiểm định tỉ lệ tổng thể trên một mẫu
Giả sử tổng thể có hai loại phần tử, một trong hai loại có tính chất A nào đó Tỉ lệ phần tử có tính chất A là P chưa biết Giả sử ta có mẫu với kích thước n ≥ 30 Gọi là tỉ lệ phần tử của mẫu có tính chất A Kiểm định giả thuyết về P với mức ý nghĩa α cho trước được thực hiện như sau.
Đặt giả thuyết:
(p0 là 1 giá trị cho trước)
30
Trang 311 Bài toán kiểm định tỉ lệ tổng thể trên một mẫu
Tính giá trị kiểm định:
Quy tắc bác bỏ: được tóm tắt trong bảng sau
Lưu ý Trong trường hợp bác bỏ giả thuyết
, nghĩa là đã có thì:
Với ta kết luậnVới ta kết luận
Giả thuyết Bác bỏ H0 khi
31
Trang 32V.3 KIỂM ĐỊNH GIẢ THUYẾT VỀ TỈ LỆ
1 Bài toán kiểm định tỉ lệ tổng thể trên một mẫu
Ví dụ 6.12 Theo báo cáo, tỉ lệ hàng phế phẩmtrong kho là 10% Kiểm tra ngẫu nhiên 100 sảnphẩm thấy có 8 phế phẩm
Hỏi báo cáo trên có đáng tin cậy ở mức ý nghĩa5% không?
32
Trang 331 Bài toán kiểm định tỉ lệ tổng thể trên một mẫu
Ví dụ 6.12 Giải: Gọi P là tỉ lệ phế phẩm trong kho hàng, P chưa biết Ta kiểm tra giả thuyết:
với = 5%
Ta có kích thước mẫu n = 100, tỉ lệ mẫu = 0,08 Tra bảng hàm số Laplace ta thấy:
Tính giá trị kiểm định, ta được:
Vì nên ta chấp nhận H0, tức báo cáo đáng tin.
33
= -0,6667
𝟎
Trang 341 Bài toán kiểm định tỉ lệ tổng thể trên một mẫu
Ví dụ 6.13 Trước đây tỉ lệ phế phẩm của một nhà máy
là 5% Năm nay người ta áp dụng một biện pháp kĩ thuật mới để sản xuất Sau một thời gian, kiểm tra 800 sản phẩm thì thấy có 24 phế phẩm Với mức ý nghĩa 1%, hãy đánh giá hiệu quả của biện pháp kĩ thuật đó.
Ví dụ 6.14 Giả sử sản phẩm của một công ty sản xuất lốp xe ôtô đã chiếm được 42% thị trường Trước sự cạnh tranh của các đối thủ và điều kiện thay đổi môi trường kinh doanh, ban lãnh đạo công ty nghi ngờ thị trường của công ty đang bị giảm sút Kiểm tra ngẫu nhiên 550 ô tô trên đường, kết quả cho thấy có 219 xe sử dụng lốp của công ty Có thể kết luận gì về điều nghi ngờ trên với mức ý
Trang 352 Kiểm định tỉ lệ tổng thể trên hai mẫu
Giả sử ta có 2 mẫu được chọn ngẫu nhiên, độc lập từ hai tổng thể X và Y Gọi là kích thước hai mẫu
.
tương ứng là tỉ lệ phần tử có tính chất A của hai tổng thể và mẫu tương ứng Ta cần kiểm định giả thuyết:
với mức ý nghĩa α cho trước.
Công thức tính giá trị kiểm định:
trong đó là tỉ lệ chung cho cả hai mẫu, được tính bởi công thức:
35
Trang 362 Kiểm định tỉ lệ tổng thể trên hai mẫu
Quy tắc kiểm định như trường hợp một mẫu
Chú ý Trong trường hợp bác bỏ , nghĩa
Trang 372 Kiểm định tỉ lệ tổng thể trên hai mẫu
Ví dụ 6.15 Chọn ngẫu nhiên 200 em bé sống ở
thành phố thì thấy có 20 em béo phì Chọn 220
em sống ở nông thôn thấy có 5 em béo phì
Hãy kiểm định giả thuyết cho rằng tỉ lệ trẻ embéo phì ở thành phố và nông thôn là như nhauvới mức ý nghĩa 5%
37
Trang 382 Kiểm định tỉ lệ tổng thể trên hai mẫu
Ví dụ 6.15 Giải: Gọi Px, Py lần lượt là tỉ lệ trẻ em béo phì ở thành phố và nông thôn Ta đặt giả thuyết:
Ta kiểm định giả thuyết ở mức ý nghĩa 5%.
Trang 39CỦNG CỐ KIẾN THỨC CHƯƠNG 6
BÀI TOÁN KIỂM ĐỊNH:
Các bước của bài toán kiểm định.
KIỂM ĐỊNH GIẢ THUYẾT VỀ TRUNG BÌNHCỦA TỔNG THỂ:
1 Trên một mẫu: có 3 trường hợp.
2 Trên hai mẫu: có 3 trường hợp (đọc thêm)
KIỂM ĐỊNH GIẢ THUYẾT VỀ TỈ LỆ:
1 Trên một mẫu: có 1 trường hợp.
2 Trên hai mẫu: có 1 trường hợp (đọc thêm)
39