Giả sử ước lượng thu nhập trung bình hàng năm của hộ gia đình này được trên mẫu gồm 80 hộ gia đình, và dựa trên các nghiên cứu trong quá khứ, độ lệch chuẩn của tổng thể được biết là σ=30
Trang 2MỤC LỤC TÓM TẮT
THỐNG KÊ TRONG Kinh tế và kinh doanh
LỜI NÓI ĐẦU 3
CHƯƠNG 8: ƯỚC LƯỢNG KHOẢNG 4
8.1 Trung bình tổng thể: biết σ 4
8.2 Trung bình tổng thể: chưa biết σ 5
8.3 Tỷ lệ tổng thể 7
CHƯƠNG 9: KIỂM ĐỊNH GIẢ THUYẾT 9
9.1 Phát triển giả thuyết KHÔNG và giả thuyết ĐỐI. 9
9.2 Sai lầm loại I và loại II (đọc thêm) 10
9.3 Trung bình tổng thể: Trường hợp σ đã biết 10
9.4 Trung bình tổng thể: Trường hợp σ chưa biết 13
9.5 Tỷ lệ tổng thể 15
CHƯƠNG 10: SUY DIỄN THỐNG KÊ CHO TRUNG BÌNH VÀ TỶ LỆ CỦA HAI TỔNG THỂ 16
10.1 Suy diễn về chênh lệch giữa trung bình của hai tổng thể khi σ1 và σ2 đã biết 16
10.2 Suy diễn về chênh lệch giữa trung bình của hai tổng thể khi σ1 và σ2 chưa biết 19
10.3 Suy diễn về chênh lệch trung bình giữa hai tổng thể: mẫu theo cặp 19
10.4 Suy diễn về chênh lệch giữa hai tỷ lệ tổng thể 22
TÀI LIỆU THAM KHẢO 23
Trang 3LỜI NÓI ĐẦU
Xin chào mọi người, mình là Nguyễn Phước Hưng IBC13-K4 đại diện nhóm thực hiện khóa học này Lời đầu tiên mình xin gửi lời cám ơn đến tất cả các bạn đã ủng hộ khóa Tổng ôn toán cao cấp vừa qua cũng như các bạn chỉ vừa mới biết đến mình ở khóa Thống kê này Trong niềm hân hoan ấy, mình xin gửi đến quý độc giả khóa Tổng ôn Thống kê trong Kinh tế và Kinh doanh với nhiệt huyết của chàng trai tuổi đôi mươi Trong tập tài liê ̣u này, mình đã tóm tắt toàn bộ kiến thức cũng như các bài tập tình huống vận dụng Minh hi vọng tài liệu này sẽ giúp ích được cho bạn, từ
đó vào được chuyên ngành mình mong muốn
Trong quá trình biên soạn, do kiến thức còn hạn hẹp và thời gian thực hiện không được nhiều nên tài liệu không tránh khỏi nhiều sai sót hạn chế nhỏ về giọng nói, cách quay, độ phân giải khi up lên, … Mặc dù đã cố gắng thiết kế tính toán một cách chi tiết mạch lạc, các thông số đôi khi còn
mang tính lý thuyết chưa thực tế Chúng tôi mong có sự góp ý và sửa chữa để “quyển sách tự
chế” này có tính khả thi và hiệu quả hơn, sẽ giúp được nhiều hơn cho các khóa sau UEH Mọi ý
kiến đóng góp, các bạn vui lòng gửi về: phuochung26010401@gmail.com
Cám ơn các bạn K44 đã tin tưởng và tiếp tục gắn bó với mình trong khóa học này
Trang 4CHƯƠNG 8: ƯỚC LƯỢNG KHOẢNG
8.1 Trung bình tổng thể: biết σ
Sai số biên và ước lượng khoảng
Ước lượng khoảng có thể được tính bằng cách cộng trừ sai số biên vào ước lượng điểm
Ước lượng điểm ± Sai số biên
Sai số biên được tính = [Độ 𝑙ệ𝑐ℎ 𝑐ℎ𝑢ẩ𝑛 𝑐ủ𝑎 𝑡ổ𝑛𝑔 𝑡ℎể 𝛔
𝒛𝜶/𝟐: là giá trị z cung cấp diện tích α/2 trong đuôi phải của phân phối xác suất
chuẩn chuẩn hóa
Trang 52 Trung tâm nghiên cứu chất lượng quốc gia tại ĐHQG TPHCM đo lường hàng quý ý kiến của sinh viên các trường về các sản phẩm và cách thức phục vụ của cănteen trường
ở các khu A, B Một khảo sát gồm 10 chủ tiệm đã cho thấy trung bình mẫu chỉ số hài lòng của sinh viên là 71 Dữ liệu quá khứ cho biết độ lệch chuẩn của tổng thể của chỉ
số tương đối ổn định là σ=5
a Nhà nghiên cứu cần giả định gì nếu muốn sai số biên được mong muốn
b Sử dụng độ tin cậy 95%, sai số biên là bao nhiêu
c Sai số biên là bao nhiêu nếu mong muốn độ tin cậy 99%?
3 Tạp chí XamxicungJack báo cáo rằng thu nhập trung bình hộ gia đình hằng nam của các
độc giả của họ là 119.155 USD Giả sử ước lượng thu nhập trung bình hàng năm của
hộ gia đình này được trên mẫu gồm 80 hộ gia đình, và dựa trên các nghiên cứu trong quá khứ, độ lệch chuẩn của tổng thể được biết là σ=30.000 USD
Xây dựng ước lượng khoảng tin cậy (90; 95; 99 %) cho trung bình tổng thể
Điều gì sẽ xảy ra đối với độ rộng của khoảng tin cậy khi độ tin cậy gia tăng
8.2 Trung bình tổng thể: chưa biết σ
Nếu ước lượng của độ lệch chuẩn tổng thể σ không thể được xây dựng trước khi lấy mẫu,
chúng ta sử dụng độ lệch chuẩn mẫu s để ước lượng s
Trong trường hợp này, ước lượng khoảng của μ dựa trên phân phối t Student
Phân phối t có đặc trưng là phụ thuộc vào một tham số đã biết là bậc tự do
Ước lượng khoảng
x±𝒕𝜶/𝟐 𝒔
√𝒏
Với: 1-α = hệ số tin cậy
𝑡𝛼/2= giá trị t cung cấp 1 diện tích α/2 trong đuôi phải của phân phối t với n-1 bậc tự do
s= độ lệch chuẩn mẫu
Ví dụ: Một phóng viên của một tờ báo sinh viên đang viết một bài báo về chi phí thuê
phòng ở ngoài trường Một mẫu 16 căn hộ tiện dụng trong vòng nửa dặm xung quanh trường cho trung bình mẫu là 750 USD/tháng và độ lệch chuẩn mẫu là 55 USD
Trang 6Hãy xây dựng một khoảng tin cậy ước lượng 95% của số tiền thuê trung bình mỗi tháng cho tổng thể các căn hộ tiện dụng trong vòng nửa dặm xung quanh trường Chúng ta sẽ giả định tổng thể này có phân phối chuẩn
TÓM TẮT THỦ TỤC ƯỚC LƯỢNG KHOẢNG CHO TRUNG BÌNH TỔNG THỂ (TRANG 384)
Ví dụ:
1 Tìm các giá trị t cho mỗi trường hợp sau:
a Diện tích đuôi phải của 0.025 với bậc tự do 12
b Diện tích đuôi trái của 0.05 với bậc tự do 50
c Diện tích đuôi phải của 0.01 với bậc tự do 30
d Diện tích 90% nằm giữa 2 giá trị t với bậc tự do 25
e Diện tích 95% nằm giữa 2 giá trị t với bậc tự do 45
2 Dữ liệu mẫu sau từ một tổng thể phân phối chuẩn: 10, 8, 12, 15, 13, 11, 6, 5 Hãy ước lượng khoảng tin cậy 95% của trung bình tổng thể
Ứng dụng:
3 Một lần tình cờ ăn may, Jack đổi đời nhờ trúng Vietlot Sau khi đóng thuế và các chi phí khác, chàng trai trẻ tuổi 20 này ôm về 20 tỉ Với đam mê làm chủ từ nhỏ, thế là anh chàng này lập tức mở liền 27 chuỗi thức ăn nhanh khu vực TPHCM và lân cận Bình Dương Trong mỗi lần ghé mua, khách hàng đi qua quầy Teamlambieng (mua hàng không cần xuống xe) và đặt thức ăn Thời gian từ lúc cầm bảng thực đơn đến khi đơn hàng phục vụ xong được ghi nhận Thời gian được tính bằng phút của 27 cuộc dừng để mua hàng như sau
Trang 73 Tiêu thụ đồ uống có cồn bởi phụ nữ trẻ trong độ tuổi uống rượi ngày càng tăng ở Anh,
Mỹ và châu Âu Dữ liệu dưới đây chỉ ra một mẫu 20 phụ nữ trẻ
Ví dụ: Nên chọn mẫu lớn cỡ nào để cung cấp một khoảng tin cậy 95% với sai số biên là
10? Giả sử độ lệch chuẩn của tổng thể là 40
Ví dụ: Trong một chiến dịch tranh cử hiện nay, PSI đã tìm thấy 220 cử tri đã đăng ký, trong
số 500 cử tri liên lạc được, ưa thích 1 ứng cử viên cụ thể PSI muốn xây dựng 1 ước lượng khoảng 95% của tỷ lệ tổng thể các cử tri đã đăng ký ưa thích ứng cử viên
Xác định cỡ mẫu cho ước lượng khoảng của Tỷ lệ tổng thể (Đọc thêm trang 393-394) đọc thêm về Giá trị sơ khởi)
Trang 8Ví dụ:
1 Một mẫu ngẫu nhiên tiếp tục đơn giản gồm 800 phần tử tính ra tỷ lệ mẫu 𝑝̅= 0.7
Cung cấp 1 khoảng tin cậy (90%; 95%) cho tỷ lệ tổng thể
2 Theo báo cáo từ một nguồn nội bộ, phần lớn các công ty ở Việt Nam báo cáo lợi nhuận cao hơn dự kiến Jack rất bức xúc vì sự việc trên nên ra quyết định thực hiện một cuộc tổng điều tra bất ngờ một mẫu gồm 162 công ty random cho thấy 104 công ty cao hơn dự kiến,
29 bằng với dự kiến và 29 thấp hơn dự kiến
a Ước lượng điểm của tỷ lệ những ước lượng thấp hơn dự kiến là bao nhiêu?
b Xác định sai số biên và cung cấp khoảng tin cậy 95% cho tỷ lệ cao hơn dự kiến?
c Mẫu lớn cỡ nào là cần thiết nếu sai số biên mong muốn là 0.05?
Tổng hợp
1 Một vấn đề nhứt nhối cũng đã bị Jack phơi bày trong chương này đó chính là Cha mẹ quá bận rộn với công việc của mình mà không dành nhiều sự quan tâm cho con gái Jack đi dọc trên các tuyến đường Thành phố, hỏi tận 369 cha mẹ làm việc thì tìm thấy 200 người rơi vào trình trạng trên chỉ vì chạy theo đồng tiền hay đơn giản là cam kết công việc quan trọng hơn
Hãy giúp Jack ước lượng tỷ lệ tổng thể mấy ông bà mà làm việc bỏ bê con cái là bao nhiêu? Với độ tin cậy 95%
2 “Mẹ chồng nàng dâu” luôn là vấn đề nan giải từ xưa nay Thế nhưng trong những năm gần
đây lại phát sinh thêm một trào lưu mới lại khiến các chàng trai mệt mỏi hơn “Giữa Game
và Em, anh chọn một đi” Biết Jack là một người nghiện game từ nhỏ Jack, một ngày đẹp
trời trời xui đất khiến, cô bạn gái của Jack lại tiếp tục thực hiện một cuộc khảo sát đối với
1677 anh bạn chẻ (khu vực TPHCM) thì có đến 74% bạn chẻ nói sẽ khó bỏ game Chỉ có 48% bạn chẻ nói sẽ khó bỏ bạn gái
a Xây dựng khoảng tin cậy 95% cho tỷ lệ các anh bạn chẻ cho rằng sẽ khó bỏ game
b Xây dựng khoảng tin cậy 99% cho tỷ lệ các anh bạn chẻ cho rằng sẽ khó bỏ gệ
3 Công ty sản xuất xe máy Yamaha dự định đưa ra thị trường loại xe gắn máy tay ga kiểu dáng mới chủ yếu dành cho phụ nữ … Phòng Marketing đã chọn ngẫu nhiên 200 người phụ nữ có ý muốn mua xe tay ga trong vòng 12 tháng tới để thăm dò ý kiến về khuynh hướng chọn màu sắc xe Sau khi được cho xem các hình xe mẫu với hai nhóm tông màu
Trang 9sắc xe khác nhau, các khách hàng tiềm năng đã cho biết lựa chọn của họ, các kết quả thu thập được tóm tắt trong bảng sau:
Nhạt, sáng Đậm, tối
Hãy ước lượng tỷ lệ nữ nói chung thích tông màu sắt nhạt sáng, với độ tin cậy 95%
Ý nghĩa của kết quả nghiên cứu này đối với việc quyết định màu xe cho loại tay ga mới này như thế nào
CHƯƠNG 9: KIỂM ĐỊNH GIẢ THUYẾT
9.1 Phát triển giả thuyết KHÔNG và giả thuyết ĐỐI
Kiểm định giả thuyết: có thể được sử dụng để xác định xem khi nào một phát biểu về giá trị của một tham số tổng thể nên hoặc không nên bị bác bỏ
Giả thuyết không: giả thuyết được giả định ban đầu là đúng trong quy trình kiểm định giả thuyết, không có gì bất thường (kí hiệu H 0 ) (Vd: tuyên bố của nhà sản xuất, của giám đốc …)
Giả thuyết đối: là giả thuyết có nội dung đối lập với giả thuyết không, là điều mà kiểm định đang cố gắng chứng minh, giả thuyết được kết luận là đúng khi giả thuyết H0 bị bác bỏ (kí hiệu H a ) (Hoài nghi, cần kiểm định, nghiên cứu)
Cẩn thận trong cách thiết lập các giả thuyết trên một cách hợp lý
Trang 103 Một loại thuốc mới được phát triển với mục tiêu làm giảm huyết áp hơn loại thuốc hiện hành
4 Nhãn hiệu trên vỏ chai nước giải khát tuyên bố chai nước có chứa ít nhất 67.6 ounces chất lỏng
5 Một dây chuyền sản xuất được thiết kế để đổ bột giặt vào hộp với khối lượng trung bình là
32 ounce Một mẫu các hộp bột giặt được chọn đình kỳ và đem cân để xác định xem có xảy
ra trường hợp đổ quá nhiều hoặc quá ít hay không Nếu mẫu dữ liệu đưa đến kết luận đổ quá nhiều hoặc quá ít, dây chuyền sản xuất sẽ bị ngưng lại và điều chỉnh
Thiết lập giả thuyết không và giả thuyết đối cho trường hợp khác
Đưa ra kết luận và quyết định khi H0 không thể bị bác bỏ; có thể bị bác bỏ
CHÚ Ý 3 TRƯỜNG HỢP KIỂM ĐỊNH GIẢ THUYẾT SẼ GẮN BÓ VỚI CÁC BẠN XUYÊN SUỐT 2 CHƯƠNG 9 10
Kiểm định phía trái Kiểm định phía phải Kiểm định hai phía
Việc lựa chọn H 0 và H a không hiển nhiên và cần phải cân nhắc cẩn thận để lựa chọn dạng
đúng đắn Đặc biệt, hãy nhớ rằng phần đẳng thức trong biểu thức (≤, ≥, =) luôn xuất hiện
trong giả thuyết không
9.2 Sai lầm loại I và loại II (đọc thêm)
Điều kiện tổng thể Kết luận H0 đúng (μ≤12) H0 sai (μ>12)
Chấp nhận H0
(Kết luận μ≤12)
Kết luận đúng Sai lầm loại II
Bác bỏ H0 (Kết luận μ>12) Sai lầm loại I Kết luận sai
Trước khi sang mục 9.3, chúng ta cần chú ý khái niệm “Mức ý nghĩa” (kí hiệu là α) là xác suất
phạm sai lầm I với việc bác bỏ H0 khi giả thuyết không là đúng với dấu đẳng thức và người ra quyết định thường chọn α là 0,05 và 0,01
9.3 Trung bình tổng thể: Trường hợp σ đã biết (Vô phần quan trọng)
Các bước kiểm định giả thuyết
Trang 111 Phát triển giả thuyết không và giả thuyết đối
a Tính giá trị thống kê kiểm định
b Gia trị p là bao nhiêu
c Với α= 0.05, ta kết luận gì?
d Quy tắc bác bỏ theo phương pháp tới hạn ra sao? Kết luận
2 Xét kiểm định giả thuyết sau
H0: μ≤25
Trang 12Ha: μ>25 Mẫu gồm 40 quan sát cho trung bình mẫu 26.4 Độ lệch chuẩn tổng thể là 6
Câu hỏi tương tự câu 1 nhưng với α= 0.01
Ứng dụng:
1 Những người nộp hồ sơ xin hoàn thuế liên bang nhận được khoảng hoàn thuế trung bình là
1056 USD Xét tổng thể những người nộp hồ sơ cuối cùng trong vòng 5 ngày cuối kỳ hoàn thuế
a Một nhà nghiên cứu cho rằng những người nộp hồ sơ trong năm ngày cuối trung bình nhận được khoản hoàn thuế thấp hơn những người nộp hồ sơ sớm Phát triển giả thuyết hợp lý sao cho khi bác bỏ H0 sẽ ủng hộ lập luận của nhà nghiên cứu
b Với mẫu gồm 400 người nộp hồ sơ hoàn thuế (5 ngày cuối) khoản tiền hoàn thuế trung bình
là 910 USD Dựa trên kinh nghiệm trước đây, độ lệch chuẩn tổng thể là 1600 USD Gía trị của p là bao nhiêu
c Với α=0.05, ta kết luận gì
d Thực hiện quy trình kiểm định theo pp tới hạn
2 Ries là một công ty nghiên cứu thị trường tại bang New York, theo dõi chi phí thuê nhà ở
Mỹ Trong năm 2002, giá thuê nhà trung bình trên cả nước là 895 USD một tháng Gỉa định rằng độ lệch chuẩn hợp lý là σ=225 USD Một mẫu gồm giá thuê nhà của 180 căn nhà trên
cả nước, được lưu trong tập tin tên RentalRates cho biết giá trung bình mẫu là 915 USD Mẫu dữ liệu này có cho phép công ty kết luận rằng giá thuê nhà trung bình tổng thể lớp hơn mức giá vào năm 2002 hay không
a Phát biểu giả thuyết không và đối
b Gía trị p
c Với α=0.01, ta kết luận gì
d Kiểm định theo pp tới hạn Theo bạn vào lúc này, Ries nên làm gì
Kiểm định hai phía:
Giả thuyết
Kiểm định hai phía
H0: μ=μ0
Trang 13a Tính giá trị thống kê kiểm định
b Gia trị p là bao nhiêu
a Thiết lập giả thuyết cho bài tập này
b Mẫu gồm 120 khách hàng cho thời gian trung bình chờ là 8.5 phút Gỉa sử σ=3.2 phút Tính giá trị p
Trang 14𝒔/√𝒏
Kiểm định phía trái, phía phải, hai phía tương tự như trường hợp đã biết σ
Thống kê kiểm định này có phân phối t với n-1 bậc tự do
Vào ví dụ luôn:
1 Xét kiểm định giả thuyết sau:
H0: μ≤45
Ha: μ>45 Một mẫu gồm 36 quan sát cho trung bình mẫu là 44 và độ lệch chuẩn của mẫu s=5.2
a Tính giá trị thống kê kiểm định
b Dùng bảng phân phối t để ước lượng giá trị p là bao nhiêu
c Với α= 0.01, ta kết luận gì?
d Quy tắc bác bỏ theo phương pháp tới hạn ra sao? Kết luận
2 Xét kiểm định giả thuyết sau:
H0: μ=100
Ha: μ≠100 Một mẫu gồm 65 quan sát Xác định giá trị p và đưa ra kết luận cho các trường hợp sau Sử dụng α=0.05
và độ lệch chuẩn của mẫu là 1.400 USD
a Thiết lập giả thuyết kiểm định phù hợp
b Tính giá trị của p?
c Với α=0.05, ta kết luận được gì
Trang 152 Lượng sữa tiêu thụ BQĐN hằng năm là 21.6 gallon Bạn tin rằng lượng sữa tiêu thụ tại Mỹ cao hơn và muốn tìm bằng chứng ủng hộ ý kiến của mình Một mẫu gồm 16 người sống tại thành phố Webster tại Mỹ cho thấy lượng tiêu thụ sữa trung bình hằng năm là 24.1gallon với độ lệch chuẩn s=4.8
a Đăt giả thuyết kiểm định để quyết định xem lượng sữa tiêu thụ hằng năm trung bình tại thành phố có cao hơn mức trung bình toàn quốc hay không
b Với α=0.05, kiểm định xem có khát biệt thật sự không Ta kết luận được gì
Trang 16Ứng dụng:
1 Trong một bài báo tạp chí Business Week công bố thông tin về thói quen ngủ của người
Mỹ Bài báo cho rằng ngủ không đủ giấc gây ra nhiều vấn đề, trong đó có tai nạn giao thông Năm mươi mốt phần tram tài xế thừa nhận đã từng buồn ngủ khi lái xe Một người nghiên cứu cho rằng vấn đề này nghiêm trọng hơn đối với công nhân làm ca đêm
a Thiết lập giả thuyết để xác định xem tỷ lệ công nhân làm đêm thừa nhận buồn ngủ khi lái xe có cao hơn 51% hay không
b Mẫu gồm 500 công nhân làm ca đêm trong đó đã xác định những người thừa nhận lái
xe buồn ngủ Tính tỷ lệ mẫu? Gía trị p
c Với α=0.01, ta kết luận gì?
CHƯƠNG 10: SUY DIỄN THỐNG KÊ CHO TRUNG BÌNH VÀ TỶ LỆ CỦA HAI TỔNG THỂ
10.1 Suy diễn về chênh lệch giữa trung bình của hai tổng thể khi σ1 và σ2 đã biết
Ước lượng khoảng của µ 1 - µ 2
Kiểm định giả thiết về µ 1 - µ 2
Gọi μ1 là trung bình của tổng thể 1 và μ2 là trung bình của tổng thể 2
Sự chênh lệch giữa hai trung bình tổng thể là μ 1 – μ 2
Vấn đề đặt ra cho anh em mình là ước lượng μ1 – μ2, bắt đầu từ việc ta chọn mẫu ngẫu nhiên kích thước n1 từ tổng thể 1, mẫu ngẫu nhiên kích thước n2 từ tổng thể 2
Bước tiếp theo ta tính được 𝑥̅1 là trung bình của mẫu 1 và 𝑥̅2 là trung bình của mẫu 2 Ước lượng điểm của sự chênh lệch giữa hai trung bình tổng thể 1và 2: 𝒙̅1 - 𝒙 2