Sai: Bởi vì mô hình hồi quy tuyến tính của tổng thể mẫu có dạng Y^= b0+b1*Xi trong đó b0 tham số tự do, dùng để ước lượng tổng thể chung.. 3 Phương sai là chỉ tiêu tương đối cho phép so
Trang 1Lớp: GaMBA01.N06
Họ tên: Nguyễn Minh Hùng
BÀI TẬP CÁ NHÂN: THỐNG KÊ KHOA HỌC VÀ RA QUYẾT ĐỊNH
CÂU 1:
A Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1) Tham số tự do (b0) phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả
Sai: Bởi vì mô hình hồi quy tuyến tính của tổng thể mẫu có dạng Y^= b0+b1*Xi trong đó b0 tham
số tự do, dùng để ước lượng tổng thể chung b1 phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức nguyên nhân đang nghiên cứu đến tiêu thức kết quả
2) Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ nghịch với phương sai của tổng thể chung đó
Sai: Quan hệ tỷ lệ thuận mới đúng, phương sai có trị số càng nhỏ thì tổng thể nghiên cứu càng
đồng đều, khoảng tin cậy càng hẹp
3) Phương sai là chỉ tiêu tương đối cho phép so sánh độ biến thiên của tiêu thức nghiên cứu của hai hiện tượng cùng loại và có số trung bình không bằng nhau
Đúng: Bởi vì phương sai là thước đo quan trọng của độ biến thiến và cho biết độ biến thiên
xung quanh số trung bình của các lượng biến Các chỉ tiêu để để đo độ biến thiên bao gồm: Khoảng biến thiên; Phương sai; Độ lệch chuẩn; Hệ số biến thiên
4) Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối
Đúng Bởi vì tần số là đơn vị được phân phối vào trong mỗi tổ, biểu hiện bằng số tuyệt đối, tần
suất biểu hiện bằng số tương đối
5) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu
Sai Bởi vì tiêu thức thống kê là đặc điểm của đơn vị tổng thể được chọn ra để nghiên cứu tuỳ
theo mục đích nghiên cứu khác nhau
Trang 21) Phân tích dãy số thời gian có tác dụng:
δ a) Phân tích đặc điểm biến động của hiện tượng qua thời gian
ε b) Biểu hiện xu hướng và tính quy luật của sự biến động
φ c) Là cơ sở để phân tích kết cấu của hiện tượng
γ d) Cả a), b).
η e) Cả b), c)
f) Cả a), b), c)
2) Đại lượng nào không phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả:
a) Hệ số tương quan
b) Hệ số chặn (b 0 )
c) Hệ số hồi quy (b1 )
d) Cả a), b)
ι e) Cả a), c)
3) Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
a) Độ tin cậy của ước lượng
b) Độ đồng đều của tổng thể chung
c) Tiêu thức nghiên cứu
d) Cả a), b)
e) Cả a), b), c).
4) Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng khác loại:
a) Độ lệch tiêu chuẩn
b) Khoảng biến thiên
c) Khoảng tứ phân vị
d) Hệ số biến thiên
ϕ e) Cả a), c)
κ f) Cả a), d)
5) Biểu đồ hình cột (Histograms) có đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện khoảng cách tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
Trang 3CÂU 2:
Một doanh nghiệp muốn ước lượng trung bình một giờ một công nhân hoàn thành được bao nhiêu sản phẩm để đặt định mức Giám đốc nhà máy muốn xây dựng khoảng ước lượng
có sai số bằng 1,5 sản phẩm và độ tin cậy là 95%, Theo kinh nghiệm của ông ta độ lệch tiêu chuẩn về năng suất trong một giờ là 8 sản phẩm Hãy tính số công nhân cần được điều tra để đặt định mức
Giả sử sau khi chọn mẫu (với cỡ mẫu được tính ở trên) số sản phẩm trung bình mà họ hoàn thành trong 1 giờ là 45 với độ lệch tiêu chuẩn là 7,5 Hãy ước lượng năng suất trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%
Giải Tính số công nhân cần được điều tra để đặt định mức
Áp dụng công thức: n = Z2 σ2/Error2
Với:
+ Sai số Error = 1.5
+ σ = 8
+ ( 1-α) =95% α= 5% = 0.05, α/2 = 0.025, Az = 1-α/2 = 1-0.025=0.975, tra bảng Az tìm được Zα/2 = 1.96
Thay vào (1): n = Z2 σ2/Error2 = 1.962.82/1.52 = 109.27~ 110 người
Ước lượng năng suất trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%
- Gọi µ là năng suất trung bình của toàn bộ công nhân trong một giờ
- µ phân phối chuẩn
Đây là bài toán ướng lượng µ khi đã biết phương sai tổng thể
n =110
σ = 7.5
Zα/2 = 1.96
Áp dụng: XX̅ - Zα/2*(σ/√n) ≤ µ≤ XX̅ + Zα/2*(σ/√n) thay số
45 – 1.96*(7.5/√110) ≤ µ≤ 45 + 1.96*(7.5/√110)
43.60 ≤ µ≤ 46.40
KL: Với mẫu đã cho và độ tin cậy 95% năng suất trung bình của toàn bộ công nhân trong một
giờ nằm trong khoảng 43.6 đến 46.4 sản phẩm
Trang 4Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản phẩm Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay không người ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn Với độ tin cậy 95% hãy rút
ra kết luận về hai phương án trên
Giải
Kết quả tính toán trong Excel của bộ số liệu đã cho được kết quả
t-Test: Two-Sample Assuming Equal Variances
Pooled Variance 18.9477
Hypothesized Mean Difference 0
P(T<=t) one-tail 0.158684
t Critical one-tail 1.699127
P(T<=t) two-tail 0.317369
t Critical two-tail 2.04523
Kết luận :
Căn cứ vào kết quả của bộ số liệu ta thấy chi phí sx trung bình của phương P/A1 là 29.46 ngàn đồng còn chi phí sx trung bình của P/A2 là 27.87 ngàn đồng, vậy chi phí sx trung bình của 2 phương án là có sự khác nhau Giả sử các yếu tố khác của cả hai phương án là như nhau thì P/A2 hiệu quả hơn do sử dụng được chi phí thấp, ngoài ra trong bộ số liệu trên thì số quan sát của P/A2 là 16 nhiều hơn P/A1 nên độ tin cậy cao hơn
Trên thực tế, nếu chỉ căn cứ vào chi phí sản xuất trung bình không thôi thì sẽ không thể kết luận phương án nào tốt hơn hoặc nên chọn phương án nào là tối ưu
Trang 5CÂU 4:
Dưới đây là dữ liệu về khối lượng than khai thác được trong 50 tháng gần đây của một nhà máy (đơn vị: triệu tấn):
1 Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf)
2 Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu trên
3 Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
4 Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra và từ bảng phân bố tần số So sánh kết quả và giải thích
Giải
1 Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf).
50
Trang 6STT Khối lượng than khai thác ( triệu tấn ) Trị số giữa Xi ( fi số tháng ) Tần suất Xi*fi
1 Từ 3 đến dưới 4 3.5 4 14.00
2 Từ 4 đến dưới 5 4.5 8 36.00
3 Từ 5 đến dưới 6 5.5 10 55.00
4 Từ 6 đến dưới 7 6.5 15 97.50
5 Từ 7 đến dưới 8 7.5 11 82.50
6 Từ 8 đến dưới 9 8.5 0 -
7 Từ 9 đến dưới 10 9.5 0 -
8 Từ 10 đến dưới 11 10.5 0 -
9 Từ 11 đến dưới 12 11.5 1 11.50
10 Từ 12 đến dưới 13 12.5 1 12.50
3 Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
Căn cứ vào bộ số liệu khai thác than trong 50 tháng, sau khi sắp xếp biểu đồ thân lá ta dễ dàng nhận thấy có 2 dữ liệu đột biến 11, 12 tấn tuy nhiên tần suất xuất hiện lại ít có 1 lần Sản lượng khai thác chủ yếu nằm trong khoảng 4-7 tấn Riêng lượng khai thác than trong khoảng
8-10 là không thấy
4 Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra và
từ bảng phân bố tần số So sánh kết quả và giải thích.
Số liệu than trung bình khai thác được trong 1 tháng từ tài liệu điều tra : 303.3/50 =6.066 triệu tấn/ tháng
Số liệu than trung bình khai thác được trong 1 tháng tính theo bảng tần số : 309/50 = 6.18 triệu tấn/ tháng
Từ kết quả ta nhận thấy số liệu than trung bình khai thacs trong 1 tháng là có sự khác nhau Theo bản tần số thì KL than khai thác trung bình 1 tháng là cao hơn Sự khác nhau này là do có
sự trênh lệch giữa trung bình thật của từng tổ khác với trị số giữa
Trang 7CÂU 5:
Một hãng trong lĩnh vực kinh doanh dầu gội đầu thực hiện một thử nghiệm để đánh giá mức độ ảnh hưởng của quảng cáo đối với doanh thu Hãng cho phép tăng chi phí quảng cáo trên 5 vùng khác nhau của đất nước so với mức của năm trước và ghi chép lại mức độ thay đổi của doanh thu ở các vùng như sau:
1 Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ này qua các tham số của mô hình
2 Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối liên hệ tương quan tuyến tính không?
3 Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên
4 Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 7% với độ tin cậy 90%
Giải
1 Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ này qua các tham số của mô hình.
Với bộ số liệu đã cho ta chạy hàm hồi quy trong excel thu được bảng kết quả sau độ tin cậy 95%:
% tăng chi phí quảng cáo
(X)
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.93907
R Square 0.88185
Adjusted R
Square 0.86497
Standard Error 0.51149
Trang 8Residual 7 1.831349206 0.261621315
Coefficient
s Standard Error t Stat P-value Lower 95%
Upper 95%
Lower 95.0%
Upper 95.0%
Intercept 0.9749 0.3887 2.5078 0.0405 0.0557 1.8941 0.0557 1.8941
% Tăng chi phí
quảng cáo 0.6587 0.0911 7.2281 0.0002 0.4432 0.8742 0.4432 0.8742
- Phương trình hồi quy tuyến tính: Y^ = 0.9749 + 0.6587 Xi
- Phân tích mối liên hệ qua các tham số của mô hình:
Ý nghía:
b0 = 0.9749 là phân trăm tăng lên của doanh thu tối thiểu kể cả khi chi phí quảng cáo Xi =0
b1 = 0.6587 nghĩa là khi chi phí tăng thêm 1% thi doanh thu tăng tương ứng khoảng 0.6587 %
2 Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối liên hệ tương quan tuyến tính không?
Kiểm định cặp giả thuyết:
Ho: β1 = 0 (không có mối quan hệ tuyến tính)
H1: β1 # 0 (có mối quan hệ tuyến tính
Tiêu chuẩn kiểm định: t = b1/Sb1 = 0.6587/0,0911 = 7,23
với mức α = 0.0002 < 0.05 như vậy t thuộc miền bác bỏ, bác bỏ Ho chấp nhận H1 Vậy có mối quan hệ tuyến tính giữa % tăng chi phí quảng cáo và % tăng doanh thu
3 Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.
Đánh giá cường độ của mối liên hệ bằng hệ số tương quan bội R Hệ số tương quan R=
0.93907 > 0 và lớn hơn 0.9 nên có thể nói mối quan hệ giữa giữa % tăng chi phí quảng cáo và
% tăng doanh thu rất chặt chẽ và đây là mối liên hệ thuận
Đánh giá sự phù hợp của mô hình bằng hệ số xác định R 2 Hệ số xác đinh R2 = 0.88185 mặc
dù R2 < 0.9 nhưng vẫn ở mức khá cao, mô hình hồi quy trên là có phù hợp và ý nghĩa đến 88.185%
4 Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo
là 7% với độ tin cậy 90%.
Trang 9(1-α) =90% -> α = 10% = 0.1; α/2 = 0.05
n = 9 => n-2=7, tra bảng ta có tα/2; (n-2) = 1.894
Dự đoán điểm khi X = 7 => Y^i = 0.9749 + 0.6587 *7 = 5.5858 (%)
Sai số chuẩn của mô hình Syx = 0.51149
Thay số:
= 5.5858 +/- 1.894*0.51149* SQRT(1 +1/9 + (7- 3.833)2/ 31.5) = +/-1.1583
Cận dưới = 5.5858 - 1.1583 = 4.4275 ~ 4.43
Cận trên = 5.5858 + 1.1583 = 6.7440 ~ 6.75
Kết luận: Với độ tin cậy 90%, khi tỷ lệ % tăng chi phí quảng cáo là 7% thì tỷ lệ % tăng doanh thu
sẽ nằm trong khoảng từ 4.43% đến 6.75%
STT
% Tăng chi phí quảng cáo
% Tăng doanh thu
∑( Xi -XX̅ )^2
3 6 4.5 4.694
4 4 3.5 0.028
5 3.5 3 0.111
6 5.5 5 2.778
7 3 2.5 0.694
8 2.5 2 1.778
9 7 6 10.028
Tài liệu tham khảo:
- Giáo trình thống kê doanh nghiệp
- Slide bài giảng giáo viên
∑
=
−
−
− +
+
⋅
⋅
i
i
i yx
n i
X X
X X
n S
t Y
1
2
2 2
; 2 /
1 1 ˆ
α