Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu: => Sai: vì theo định nghĩa tiêu thức thống kê là đặc điểm của từng đơn vị tổng thể được chọn ra để nghiên cứu tuỳ theo mục đ
Trang 1THÔNG TIN CÁ NHÂN
BÀI TẬP CÁ NHÂN MÔN THỐNG KÊ VÀ KHOA HỌC RA QUYẾT ĐỊNH
Câu 1: Lý thuyết:
A Trả lời đúng (Đ), sai (S) cho các câu hỏi sau và giải thích tại sao?
1 Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu:
=> Sai: vì theo định nghĩa tiêu thức thống kê là đặc điểm của từng đơn vị tổng thể được chọn ra để nghiên cứu tuỳ theo mục đích nghiên cứu khác nhau Vì vậy, tiêu thức thống kê không phản ánh đặc điểm của tổng thể nghiên cứu
2 Tần suất biểu hiện bằng số tuyệt đối:
=> Sai: vì tần suất được biểu hiện bằng số tương đối (đơn vị tính là lần hoặc %), biểu hiện tỷ trọng của từng tổ trong tổng thể
3 Hệ số biến thiên là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức nghiên cứu của hai hiện tượng khác loại:s
=> Đúng: vì hệ số biến thiên được biểu hiện bằng con số tương đối, nên có thể dung để so sánh giữa các tiêu thức khác nhau, như so sánh hệ số biến thiên về năng suất lao động với hệ số biến thiên của tiền lương với hệ số biến thiên của tỷ lệ hoàn thành định mức sản xuất…
4 Khoảng tin cậy cho tham số của tổng thể chung tỷ lệ thuận với phương sai của tổng thể:
=> Đúng: vì khoảng tin cậy được tính theo công thức:
n Z
x n
Z
α
−
Trang 2Ứng với một độ tin cậy nhất định (Z không đổi), khi phương sai tăng làm tăng khoảng tin cậy
5 Liên hệ tương quan là mối liên hệ không biểu hiện rõ trên từng đơn vị cá biệt:
=> Đúng: vì các mối liên hệ tương quan là các mối liên hệ không hoàn toàn chặt chẽ, không được biểu hiện một cách rõ rang trên từng đơn vị cá biệt Do đó, để phản ánh mối liên hệ tương quan thì phải nghiên cứu hiện tượng số lớn - tức là thu thập tài liệu về tiêu thức nguyên nhân và tiêu thức kết quả của nhiều đơn vị
B Chọn phương án trả lời đúng nhất
1 Các phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng nhằm:
a) Sắp xếp dãy số theo thứ tự tăng (hoặc giảm) dần
b) Đảm bảo tính chất so sánh được giữa các mức độ trong dãy số
*c) Loại bỏ tác động của các yếu tố ngẫu nhiên.
d) Không có điều nào ở trên
2 Các biện pháp hạn chế sai số chọn mẫu:
a) Tăng số đơn vị tổng thể mẫu
*b) Sử dụng phương pháp chọn mẫu thích hợp
c) Giảm phương sai tổng thể chung
d) Cả a, c
e) Cả a,b
f) Cả a, b, c
3 Ưu điểm của Mốt là:
a) San bằng chênh mọi chênh lệch giữa các lượng biến
*b) Không chịu ảnh hưởng của các biến đột xuất.
c) Kém nhạy bén với sự biến động của tiêu thức
d) cả a, b
e) cả a,b,c
4 Tổng thể nào dưới đây là tổng thể bộc lộ:
a) Tổng thể những người yêu thích dân ca
b) Tổng thể những người làm ăn phi pháp
*c) Tổng thể doanh nghiệp quốc doanh ở một địa phương.
d) cả a,b
Trang 3e) cả a,b,c.
5 Biểu đồ hình cột (Histograms) có đặc điểm:
a) Giữa các cột không có khoảng cách
b) Độ rộng của cột biểu hiện giá trị giữa của mỗi tổ
c) Chiều cao của mỗi cột biểu thị tần số
d) cả a,b đều đúng
*e) Cả a, c đều đúng.
f) Cả a,b,c đều đúng
Câu 2 (1,5đ)
1 Tóm tắt nội dung đề bài:
σ = 6 sản phẩm
Error = +/- 1sản phẩm
Độ tin cậy: 95%
a Tính số công nhân cần được điều tra để đặt định mức (n) ?
= 35
σ = 6,5
n = 100
b Ước lượng năng suất trung bình một giờ của toàn bộ công nhân với
độ tin cậy 95%
2 Lời giải:
a Tính số công nhân cần được điều tra để đặt định mức:
Theo công thức chọn cỡ mẫu, ta có: 2
2 2 Error
Z
Trong đó:
+ σ =6 (theo kinh nghiệm của ông Giám đốc)
+ Error = +/-1
Với độ tin cậy là 95%, tra bảng Z (với A(Zα/2 ) = 0.975 (2 phía), ta có Z =1.960
Trang 4Thay vào công thức, ta được: 138,2976
1
6 96 1
2
2 2
=
=
n=139
=> Như vậy số công nhân cần được điều tra để đặt định mức là 139 người.
b Ước lượng năng suất trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%
Gọi μ là năng suất trung bình một giờ của công nhân trong nhà máy
Sử dụng ước lượng khoảng trung bình μ với độ tin cậy 95% trong trường hợp mẫu lớn (n=139>30) và chưa biết phương sai σ Bởi vậy, ta sử dụng công thức sau:
n
s t
x n
s t
x −α/2;(n−1) ≤µ≤ + α/2;(n−1)
Trong đó:
x= 35; s=6.5; n=139
Tra bảng t, với số bậc tự do = 138, α=5%(2 phía) ta có t = 1.977
Thay số vào công thức ta được: 36.09 (sp) ≤ μ ≤ 39.13 (sp)
=> Như vậy với độ tin cậy 95%, năng suất lao động trung bình μ trong 1 giờ lao động nằm trong khoảng từ 36 sản phẩm đến 39 sản phẩm.
Câu 3 (1,5đ)
1 Tóm tắt nội dung đề bài:
N1 =800, Ps1 = 0,25
N2 =1000, Ps2 = 0,295
2 Lời giải:
Gọi P1: Tỷ lệ những người yêu thích mùi hương cũ
Gọi P2: Tỷ lệ những người ưa thích mùi hương mới
Đặt giả thiết:
H0: P1 ≥ P2
H1: P1 < P2.
Trang 5Bài toán kiểm định hai tỷ lệ - kiểm định Z (với mẫu đủ lớn theo điều kiên n 1* p s1 ;
n 2* p s2 >5, và n 1* (1-p s1 ); n 2* (1-p s2 )>5).
Theo công thức:
+
−
−
=
2 1
1 1 ) 1 (
2 1
n n P P
P P Z
s s
s s
Trong đó: Ps1 = 200/800 = 0.25; Ps2 = 295/1000 = 0.295
2 1
2 1
2 1
2
n n
n n
n n
p n p
n
+
= +
+
Thay số vào công thức trên ta có:
=> Z= -2.1246, tra bảng Z ta được 1-α=0.9832, α = 0.0168 =1.68%
Do đây là kiểm định trái do đó nếu ứng với một mức tin cậy nào đó tra bảng Z mà
Zα>-2.1246, ta bác bỏ H0, chấp nhận H1 tức là tỷ lệ số người yêu thích mùi hương
mới lớn hơn số người yêu thích mùi hương cũ)
=>Kết luận: với độ tin cậy < 98.32%, có đủ căn cứ để nói rằng tỷ lệ người yêu
thích mùi huơng mới lớn hơn tỷ lệ người yêu thích mùi hương cũ
Câu 4 (2,5đ):
1 Phân tích tình hình biến động thời vụ về lượng khách du lịch quốc tế của Công
ty qua chỉ số thời vụ (giản đơn) từ đó đề xuất những kiến nghị thích hợp.
Từ số liệu khách đã cho ta tính được bảng sau:
Năm
Tháng
Lượng khách trung bình tháng Yi
Chỉ số thời vụ Ii
Trang 63 50 55 49 55 52 52,20 1,2429
Lượng
khách
trung
bình
năm
40.416
7
43.583 3
41.083 3
43.166 7
41.750 0
Tổng
lượng
khách
năm
Từ chỉ số thời vụ Ii có nhận xét sau:
Nhìn chung số lượng khách tập trung tăng vào 6 tháng đầu năm (có chỉ số
I i >1) Đặc biệt, số lượng khách du lịch tập trung tăng từ tháng 1 đến tháng 3
(tăng mạnh nhất trong tháng 2 và 3)
Kể từ tháng 7 đến tháng 11, số lượng khách du lịch có xu hướng suy giảm trong thời gian 6 tháng cuối năm (có chỉ số Ii<1) Sang tháng 12, lượng khách lại bắt đầu tăng lên Vì vậy, công ty nên chuẩn bị sẵn các chương trình
du lịch cho khách hàng từ trước tháng 12, tập trung mọi nguồn lực (nhân lực, nâng cấp cơ sở vật chất kỹ thuật ) cho hoạt động của công ty từ tháng
12 đến tháng 3 năm sau Bên cạnh đó Công ty cần đưa ra những chính sách
khuyến mãi (giảm giá, quà tặng ) nhằm cân bằng và thu hút thêm lượng
khách du lịch trong các tháng cuối năm
2 Xác định hàm xu thế tuyến tính biểu diễn xu hướng biến động của số lượng khách du lịch quốc tế qua các năm tại Công ty nói trên
Dùng phương pháp hồi quy tuyến tính với biến phụ thuộc:
+ Gọi Y: là Tổng số khách năm
Trang 7+ Gọi t: là thời gian.
Ta có kết quả sau:
Năm Lượng khách Gọi thời gian là biến t
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,263744
R Square 0,069561
Adjusted R
Standard
ANOVA
Significanc
e F
0,22428
5 0,668125
325,033
3
Coefficient s
Standard
Upper 95%
Intercept 495,9 18,90864 26,22611 0,000122 435,7242
556,075
8
X Variable 1 2,7 5,701169471
0,47358
7 0,66812
5 -15,4437 20,84368
Trang 8Như vậy, căn cứ vào dữ liệu trên, ta có hàm xu thế tuyến tính biểu diễn xu hướng biến động của lượng khách du lịch của công ty qua các năm như sau:
Y = 495.9 + 2.7X
3 Dự đoán lượng khách của Công ty theo các tháng năm 2009 với độ tin cậy 95%
Để dự đoán lượng khách của Công ty theo các tháng năm 2009, trước hết ta phải làm bài toán ngoại suy hàm xu thế cho lượng khách năm 2009 (Y2009) với độ tin cậy 95%
Ta có công thức:
p ) 2 n ,(
2 / L
n p
) 2 n ,(
2
/
L
yˆ + − α − ≤ ≤ + + α −
) 1 (
1 2 3
1 1
2
−
− + +
+
=
n n
L n n
S
S p yt
Trong đó Syt=18.028609 (kết quả tra trong bảng kết quả hồi quy)
Y 2009 =459.5+2.7*6=512.1.
N = 5, L=1, tính được Sp = 26.126
Tra bảng t với số bậc tự do 3, mức ý nghĩa 5% (2 phía), ta có t = 3.182
Từ đó ta ước lượng được lượng khách năm 2009 với mức tin cậy 95% nằm trong khoảng từ: 429 khách đến 596 khách
Chia khoảng ước lượng trên cho 12 tháng, sau đó nhân với chỉ số thời vụ Ii ta có bảng ước lượng hàng tháng như sau (làm tròn):
Tháng
Y
Dự đoán lượng khách hàng tháng năm 2009
Dự đoán khoảng – Cận dưới
Dự đoán khoảng – Cận trên
Trang 99 0,7714 33 28 38
Câu 5 (2,5đ):
1 Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ này qua các tham số của mô hình
Ta gọi: Y là % tăng doanh thu và X là % tăng quảng cáo
Y là biến phụ thuộc vào biến độc lập X Từ số liệu đã qua sử dụng hồi quy trong Exel ta có bảng :
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9594595
R Square 0.9205625
Adjusted R
Standard
ANOVA
Significan
ce F
3.40608108
1
3.40608108
1
34.7655172
4
0.0097388
9
0.29391891
9
0.09797297
3
Coefficien ts
Standard
Lower 95%
Intercept 1.8648649
0.29560328
2
6.30867442
8
0.00804830
1
0.9241232
9
X Variable 1 0.4797297 0.08136212 5.89622907 0.00973888 0.2207991
Trang 106 9 3
Theo dữ liệu trên, ta có phương trình hồi quy tuyến tính biểu hiện mối liên hệ giữa
% tăng doanh thu và % tăng chi phí quảng cáo như sau:
Y=1.86486 + 0.47973X.
2 Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự
có mối liên hệ tương quan tuyến tính không?
Để kiểm định giả thiết bài ra, ta đặt cặp giả thiết sau:
H0: β1=0 (không có mối liên hệ tương quan)
H1: β1≠0 (có mối liên hệ tương quan)
Dựa vào bảng kết quả hồi quy, với biến X ta có t = 6.30867, Mức ý nghĩa = 0.00974≈1%, tức là với độ tin cậy 99% có thể nói rằng % tăng doanh thu có mối liên hệ tuyến tính với % tăng quảng cáo
3 Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên (qua hệ số tương quan và hệ số xác định)
Hệ số tương quan (R2 =0,921) có nghĩa rằng với mẫu đã cho thì 92,1% sự thay đổi trong % tăng doanh thu được giải thích bởi % tăng chi phí quảng cáo
Hệ số xác định (Multiple R = 95,9%) điều này chỉ rõ mối liên hệ tương quan giữa
% tăng chi phí quảng cáo và % tăng doanh thu là rất chặt chẽ
4 Hãy ước lượng tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5% với xác suất tin cậy 95%
Ta phải ước lượng giá trị Y, khi X=5% với độ tin cậy là 95% Ta có công thức khoảng tin cậy là khoảng:
( ) ( )
∑
=
−
−
− +
+
⋅
⋅
i i
i yx
n
i
X X
X X n S
t
Y
1
2
2 2
;
2
/
1 1 ˆ
α
Trang 11Ta có Y5%= 1.85486+0.47973*5= 4.2635%.
Syx=0.313006 (tra trong bảng kết quả hồi quy=Standard Error)
n=5, X = 3.2
Tra bảng t với số bậc tự do =3, mức ý nghĩa 5% (2 phía) ta có t = 3.182
Thay số vào công thức ta tính được khoảng tin cậy của Y5% từ: 3.071% đến 5.4499%
Kết luận: Với độ tin cậy 95%, khi chi phí quảng cáo tăng 5% thì doanh thu tăng
trong khoảng từ 3.071% đến 5.4499%
Tài liệu tham khảo:
1 Giáo trình Thống kê và khoa học ra quyết định Trường Đại học Griggs
Hà Nội, ngày 18 tháng 4 năm 2009
Người làm bài
ĐẶNG TÀI HÂN