5 Khi xác định số đơn vị mẫu điều tra để ước lượng số trung bình, nếu không biết phương sai của tổng thể chung thì có thể: a Lấy phương sai lớn nhất trong các lần điều tra trước b Lấy
Trang 1BÀI TẬP THỐNG KÊ KHOA HỌC RA QUYẾT ĐỊNH
BÀI LÀM
Câu 1: Lý thuyết (2đ)
A Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
.Đ 1) Điều tra chọn mẫu là một trường hợp vận dụng quy luật số lớn
Trong điều tra chọn mẫu, luôn tồn tại các sai số ngẫu nhiên và loại sai số này chịu sự chi phối của quy luật số lớn Tức là, nếu điều tra càng nhiều đơn vị thì các sai lêch ngẫu nhiên sẽ có khả năng bu trừ, triệt tiêu nhau làm cho sai số chung càng nhỏ đi Vì thế, có thể nói điều tra chọn mẫu là một trường hợp vận dụng quy luật số lớn.
.S 2) Tốc độ phát triển trung bình là trung bình cộng của các tốc độ phát triển liên hoàn
Tốc độ phát triển trung bình phải là trung bình nhân của các tốc độ phát triển liên hoàn bởi vì các chi số này có gốc so sánh khác nhau và có quan hệ tích số với nhau.
.Đ 3) Liên hệ tương quan là mối liên hệ không hoàn toàn chặt chẽ
Sự thay đổi của tiêu thức nguyên nhân không hoàn toàn quyết định sự thay đổi của tiêu thức kết quả Mỗi giá trị của tiêu thức nguyên nhân sẽ có nhiều giá trị sẽ có nhiều giá trị của tiêu thức kết quả.
.Đ 4) Nghiên cứu sự biến động của số trung bình qua thời gian cho thấy xu hướng phát triển của hiện tượng
Số trung bình trong thống kê là mức độ biểu hiện trị số đại biểu theo một tiêu thức nào đó của một tổng thê bao gồm nhiều đơn vị cung loại Các đơn vị trong tổng thể thường cung mang một số đặc điểm chung nhất, nhưng chúng cũng có nhiều đặc điểm riêng biệt Khi nghiên cứu thống kê, ta phải tìm một mức độ có tính chất đại biểu nhất, có khả năng khái quát đặc điểm chung của cả tổng thể Đó chính là số trung bình Số trung bình có đặc điểm san bằng mọi chênh lệch giữa các đơn vị về trị số của tiêu thức nghiên cứu.
Trang 2Sự biến động của số trung bình qua thời gian có thể cho ta thấy được xu hướng phát triển cơ bản của hiện tượng số lớn, tức là của đại bộ phận các đơn vị tổng thể, trong khi từng đơn vị cá biệt không thể giúp ta thấy rõ điều đó.
.S 5) Xác định tổ chứa Mốt chỉ cần dựa vào tần số của các tổ
Trường hợp tổng quát, việc xác định tổ có Mốt phải được dựa vào mật độ phân phối Trường hợp khoảng cách tổ của dãy số là đều nhau thì chi cần dựa vào tần số của các tổ để xác định tổ chứa Mốt và đây chi là trường hợp đặc biệt.
B Chọn phương án trả lời đúng nhất:
1) Hệ số hồi quy phản ánh:
a) Ảnh hưởng của tất cả các tiêu thức nguyên nhân đến tiêu thức kết quả
b) Ảnh hưởng của tiêu thức nguyên nhân đang nghiên cứu đến tiêu thức kết quả.
c) Chiều hướng của mối liên hệ tương quan
d) Cả a), b)
e) Cả a), c)
2) Đại lượng nào phản ánh chiều hướng của mối liên hệ tương quan:
a) Hệ số tương quan.
b) Hệ số chặn (b0 )
c) Hệ số hồi quy (b1 )
d) Cả a), b)
e) Cả a), c)
f) Cả a), b), c)
3) Ước lượng là:
Trang 3b) Từ các tham số của tổng thể chung suy luận cho các tham số của tổng thể mẫu.
c) Từ các tham số của tổng thể mẫu suy luận cho các tham số tương ứng của tổng thể chung.
d) Cả a), b)
e) Cả a), c)
f) Cả a), b), c)
4) Những loại sai số có thể xẩy ra trong điều tra chọn mẫu là:
a) Sai số do ghi chép
b) Sai số do số lượng đơn vị không đủ lớn
c) Sai số do mẫu được chọn không ngẫu nhiên
d) Cả a), b)
e) Cả a), b), c).
5) Khi xác định số đơn vị mẫu điều tra để ước lượng số trung bình, nếu không biết phương sai của tổng thể chung thì có thể:
a) Lấy phương sai lớn nhất trong các lần điều tra trước
b) Lấy phương sai nhỏ nhất trong các lần điều tra trước
c) Lấy phương sai trung bình trong các lần điều tra trước
d) Cả a và b
e) Cả a, b, c
Câu 2 (1,5 đ)
Một doanh nghiệp muốn ước lượng trung bình năng suất một giờ công là bao nhiêu sản phẩm Một mẫu gồm 60 công nhân được chọn ngẫu nhiên cho thấy năng suất trung bình một giờ công là 30 sản phẩm với độ lệch tiêu chuẩn là 5
Trang 41 Tìm khoảng ước lượng cho năng suất trung bình một giờ công của công nhân doanh nghiệp trên độ tin cậy là 95%
2 Nếu ông chủ doanh nghiệp đặt ra tiêu chuẩn là sẽ sa thải những công nhân có mức năng suất một giờ công thấp hơn 25 sản phẩm thì liệu việc sa thải này có xảy ra không?
Lời giải:
Đây là trường hợp ước lượng số trung bình của tổng thể chung khi đã biết số trung bình của tổng thể mẫu lớn và chưa biết phương sai của tổng thể chung Các tham số của tổng thể mẫu là:
Số đơn vị tổng thể mẫu: n = 60
Số trung bình: = 30
Độ lệch chuẩn của tổng thể mẫu: S = 5
trung bình của tổng thể chung
Với = 1 - 0,95 = 0,05 → = 0,025 Tra bảng A2 ta được t 0,025;59 = 2,001
Thay các giá trị của tham số vào công thức trên ta được khoảng ước lượng cho năng suất trung bình trên mỗi giờ công của công nhân doanh nghiệp trên với độ tin cậy 95% như sau:
28,708
2 Từ kết quả khoảng ước lượng năng suất trung bình tính được ở phần 1 với độ tin cậy 95%,
ta thấy năng suất trung bình của công nhân nằm trong khoảng từ 28,708 sản phẩm đến
Trang 531,292 sản phẩm Do đó, không có công nhân nào có năng suất trung bình dưới 25 sản phẩm trên mỗi giờ công Vì vậy, việc sa thải sẽ không xảy ra
Câu 3 (1,5đ)
Doanh nghiệp sản xuất xe máy PS xây dựng hai phương án sản xuất một loại sản phẩm Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay không người ta tiến hành sản xuất thử và thu được kết quả sau: (triệu đồng/sản phẩm)
Phương án 1: 24 27 25 29 23 26 28 30 32 34 38 26
Phương án 2: 26 32 35 38 35 26 30 28 24 26
Cho rằng chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn Với độ tin cậy 95% hãy rút ra kết luận về hai phương án trên
Lời giải:
Bài toán này yêu cầu kiểm định hai giá trị trung bình của hai tổng thể chung phân phối theo quy luật chuẩn, trường hợp chưa biết phương sai, mẫu nhỏ (n1 = 12 và n2 = 10, < 30) Theo đầu bài, ta cần kiểm định hai phía
Giả thiết H0: 1 = 2
Giả thiết H1: 1 ≠ 2
Tiêu chuẩn kiểm định là thống kê t:
t = (5.6)
S2 là giá trị chung của hai phương sai mẫu và xác định theo công thức:
S2 = [(n1 – 1) + (n2 – 1) ] / (n1 + n2 – 2) (5.7)
Trang 6Các phương sai mẫu được xác định bằng công thức: S2=
Từ các giá trị đơn vị của phương án 1, ta tính được: 1 = 28,5; 213 và = 19,3636
Từ các giá trị đơn vị của phương án 2, ta tính được: 2 = 30; 206 và = 22,8889
Thay vào (5.7) ta tính được: S2 = [(12 – 1).19,3636 + (10 – 1).22,8889] / (12 + 10 – 2) = 20,95
Thay vào (5.6) ta tính được t = -0,7654
Với mức ý nghĩa của kiểm định = 1 – 0,95 = 0,05, ta tra bảng A2 tìm giá trị của ; (n1 + n2 – 2) được
giá trị 2,086 Vì < ; (n1 + n2 – 2) nên ta chấp nhận giả thiết H0
Kết luận: Chi phí trung bình của hai phương án sản xuất xe máy PS là như nhau.
Câu 4 (2,5đ)
Dưới đây là dữ liệu về khối lượng sản phẩm thép trong 30 tháng gần đây của một nhà máy (đơn vị: triệu tấn)
1 Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf)
2 Xây dựng bảng tần số phân bố với 5 tổ có khoảng cách tổ bằng nhau
3 Vẽ đồ thị tần số và cho nhận xét sơ bộ về khối lượng sản phẩm thép trong 30 tháng nói trên
Trang 74 Tính khối lượng sản phẩm thép trung bình 1 tháng từ tài liệu điều tra và từ bảng phân bố tần
số So sánh kết quả và giải thích
L ời giải:
1 Dữ liệu sau khi sắp xếp lại từ nhỏ nhất đến lớn nhất như sau:
3,0 3,0 3,7 3,8 4,0 4,5 4,7 4,7 4,8 4,9 5,0 5,1 5,2 5,3 5,7 6,0 6,0 6,1 6,1 6,4 6,4
6,5 6,6 7,0 7,0 7,0 7,2 7,3 7,5 7,8
Giá trị nhỏ nhất: Xmin = 3,0 Giá trị lớn nhất: Xmax = 7,8
Biêu diên t p hợp số li u băng biêu đô thân lá:â ê
2 Xây dựng bảng tần số phân bố với 5 tổ có khoảng cách tổ bằng nhau
Với số tổ n = 5, giá trị khoảng cách tổ được xác định bằng công thức
h = (Xmax – Xmin) / n = (7,8 – 3,0) / 5 = 0,96
Số thứ tự tổ
Lượng biến (x i )
Tần số (f i )
Tần suất (d i = f i / )
Tần số tích lũy (S i )
Trang 8Tổ 5 6,84 – 7,80 7 0,2333 30
3 Vẽ biểu đồ tần số hình cột (Histogram):
Đồ thị tần số tích lũy (Ogive):
Trang 9Nhận xét: Khối lượng sản phẩm thép sản xuất trong 30 tháng gần đây tập trung nhiều ở mức
năng suất cao, từ mức trên 5,88 đến 7,80 triệu tấn/tháng.
4 Từ số liệu điều tra, khối lượng sản phẩm thép trung bình 1 tháng:
= / n = 168,3 / 30 = 5,61 triệu tấn
Từ bảng phân bố tần số, tính khối lượng sản phẩm thép trung bình 1 tháng:
Số thứ tự tổ
Lượng biến (x i )
Giá trị giữa (
)
Tần số (f i )
Giá trị gia quyền (f i )
Trang 10Tổ 5 6,84 – 7,80 7,32 7 51,24
So sánh kết quả tính từ 2 phương pháp là khác nhau Nguyên nhân là do khi tính theo bảng tần số phân phối ta đã gặp sai số khi phân tổ và tính giá trị trung bình tổ Vì vậy, tính theo phương pháp này kém chính xác hơn.
Câu 5 (2,5đ)
Một công ty đã tiến hành một bài kiểm tra cho các nhân viên bán hàng khi tuyển dụng Giám đốc bán hàng rất quan tâm đến khả năng dựa trên kết quả kiêm tra này đê dự đoán kết quả bán hàng Bảng
dữ liệu dưới đây chỉ ra kết quả bán hàng trung bình hàng ngày của 10 nhân viên được chọn ra ngẫu nhiên và điêm kiêm tra của họ:(đơn vị tính DT: triệu đông)
1 Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên hệ giữa điểm kiểm tra và doanh thu tuần, phân tích mối liên hệ này qua các tham số của mô hình và kiểm định các tham số
2 Hãy đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên (qua hệ số tương quan và hệ số xác định)
3 Kiểm định xem liệu giữa điểm kiểm tra và doanh thu ngày thực sự có mối liên hệ tương quan tuyến tính không?
4 Giám đốc quyết định chỉ nhận những người có mức doanh thu tối thiểu là 15 triệu Một người
có điểm kiểm tra là 6 liệu có được nhận không với độ tin cậy 95%
Lời giải:
Trang 111 Ký hiệu doanh thu ngày là y – tiêu thức kết quả, điểm kiểm tra là x – tiêu thức nguyên nhân.
Ta cần xác định phương trình hồi quy truyến tính dạng: = + x
Trong đó: là hệ số tự do, phản ánh không phụ thuộc vào x
là hệ sô góc, phản ánh sự thay đổi của khi x thay đổi một đơn vị
Để xác định các hệ số trên, ta cần lập bảng tính các tham số , , , ∑ như sau:
Phương sai: = - = 52,1 – (7,1)2 = 1,69
= - = 365,7 – (18,1)2 = 38,09
Trang 12Các hệ số: = ( - ) / = (136,2 – 7,1 * 18,1) / 1,69 = 4,55029
= - = 18,1 – 4,55029 * 7,1 = -14,2071
Phương trình hồi quy tuyến tính: = -14,2071 + 4,55029 x
Phương trình cho biết khi điểm kiểm tra của ứng viên nhân viên bán hàng tăng 1 điểm, doanh
thu ngày của ứng viên đó tăng thêm 4,55029 triệu đồng
Sử dụng phần mềm excel để tính toán hồi quy, ta cũng có các kết quả tương ứng như sau:
SUMMARY OUTPUT
Regression Statistics
Adjusted R
ANOVA
Coefficients
Standard
Lower
-6.2391421
Trang 13
2 Đánh giá cường độ của mối liên hệ thông qua hệ số tương quan r, xác định bằng công thức:
r = ( - ) / ( x y) = (136,2 – 7,1 * 18,1) / ( * ) = 0,9584677
Kết luận: hệ số tương quan r có giá trị dương gần 1 nên giữa x và y có mối liên hệ tương quan tuyến tính thuận và chặt chẽ.
Đánh giá sự phù hợp của mô hình thông qua hệ số xác định r2 = 0,91866 hay 91,866%
Hệ số xác định cho thấy 91,866% sự thay đổi của y được giải thích bởi mô hình ta vừa xác lập ở trên.
3 Kiểm định xem giữa các tiêu thức x và y thực sự có mối liên hệ tương quan tuyến tính hay
không Dùng tiêu chuẩn kiểm định T-Student để kiểm định hệ số hồi quy 1 Cặp giả thiết
không và giả thiết đối là: H0: 1 = 0 (có mối liên hệ tương quan tuyến tính)
H1: 1 0 (không có mối liên hệ tương quan tuyến tính)
Tiêu chuẩn kiểm định: t = (b1 - 1) / Sb1 trong đó, Sb1 là sai số chuẩn của hệ số b1:
Sb1 = Với n - 2 bậc tự do
là sai số chuẩn của mô hình: =
Trang 1415 6 13,0947 1,2100 3,6303
Thay vào các công thức trên ta được: = = 1,9679
S b1 = 1,9679 / = 0,4787
Từ đó, chuẩn kiểm định t = 4,55029 / 0,4787 = 9,5055
Với độ tin cậy 95%, tức là /2 = 0,025 Tra bảng A2 ta được t /2;n-2 = t0,025; 8 = 2,306
Do = 9,5055 > t0,025; 8 nên giả thiết H0 bị bác bỏ
Kết luận: Giữa các tiêu thức không thực sự có mối liên hệ tương quan tuyến tính.
4 Ta phải ước lượng khoảng tin cậy của dự đoán dựa vào mô hình hồi quy
Ước lượng khoảng tin cậy cho yx (trung bình của tổng thể chung với một giá trị xi nào đó):
Trang 15t /2;n-2
Ta đã có từ kết quả của các phần trước:
t /2;n-2 = t0,025; 8 = 2,306
= 1,9679
= 10
= 6
= 7,1
= -14,2071 + 4,55029 * 6 = 13,0946
= 16,9
Thay các giá trị trên vào công thức ước lượng ta được:
13,0946 – 2,306 * 1,9679 * 0,4142 yx 13,0946 + 2,306 * 1,9679 * 0,4142
11,2148 yx 14,9742
Kết quả ước lượng khoảng tin cậy trên cho thấy: Với yêu cầu mức doanh thu ngày của ứng viên tối thiểu là 15 triệu đồng thì người có điểm kiểm tra là 6 không thể được nhận vào làm việc.