1.Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu: -Trả lời: Đúng Đ -Giải thích: Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu vì: Tiêu thức thống kê là đặc đ
Trang 1Câu 1: Lý thuyết:
I.Trả lời đúng (Đ), sai (S) cho các câu hỏi sau và giải thích tại sao?
1.Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu:
-Trả lời: Đúng (Đ)
-Giải thích: Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu vì: Tiêu thức
thống kê là đặc điểm của từng đơn vị tổng thể được chọn ra để nghiên cứu tùy theo
mục đích nghiên cứu khác nhau Tiêu thức thống kê có thể phân theo 3 loại (tùy theo phản ánh đặc điểm về nội dung của đơn vị tổng thể) gồm: (i) Tiêu thức thuộc tính (tiêu thức giới tính, nghề nghiệp…); (ii) tiêu thức số lượng (số nhân khẩu trong gia đình, năng suất lao động…); (iii) tiêu thức thay phiên (nam, nữ) Trong đó, đơn vị tổng thể là các đơn vị (hoặc phần tử) cấu thành nên tổng thể
2.Tần suất biểu hiện bằng số tuyệt đối:
-Trả lời: Sai (S)
-Giải thích: Tần suất được biểu hiện bằng số tương đối với đơn vị tính là lần hoặc % và
được ký hiệu bằng di (di= fi / Σfi)
3.Hệ số biến thiên là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức nghiên cứu của hai hiện tượng khác loại:
-Trả lời: Đúng (Đ)
-Giải thích: Hệ số biến thiên được biểu hiện bằng số tương đối có được từ so sánh giữa
độ lệch tiêu chuẩn và trung bình cộng Hệ số biến thiện có thể dùng để so sánh giữa các tiêu thức khác nhau như so sánh hệ số biến thiên về năng suất lao động với hệ số biến thiên về tiền lương…Do đó, hệ số biến thiên là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức nghiên cứu của hai hiện tượng khác loại
4.Khoảng tin cậy cho tham số của tổng thể chung tỷ lệ thuận với phương sai của tổng thể:
-Trả lời: Đúng (Đ).
-Giải thích: Khoảng tin cậy được tính theo công thức:
n Z
x n
Z
α α
Theo đó, ứng với một độ tin cậy nhất định (Z không đổi), khi phương sai tăng sẽ làm tăng khoảng tin cậy Do đó, khoảng tin cậy cho tham số của tổng thể chung tỷ lệ thuận với phương sai của tổng thể
5.Liên hệ tương quan là mối liên hệ không biểu hiện rõ trên từng đơn vị cá biệt:
-Trả lời: Đúng (Đ)
-Giải thích: Liên hệ tương quan là mối liên hệ không hoàn toàn chặt chẽ giữa tiêu thức
nguyên nhân (biến độc lập) và tiêu thức kết quả (biến phụ thuộc): cứ mỗi giá trị của tiêu thức nguyên nhân sẽ có nhiều giá trị tương ứng của tiêu thức kết quả Các mối liên hệ này
Trang 2là mối liên hệ không hoàn toàn chặt chẽ, không được biểu hiện một cách rõ ràng trên từng đơn vị cá biệt
II.Chọn phương án trả lời đúng nhất:
1.Các phương án biểu hiện xu hướng phát triển cơ bản của hiện tượng nhằm:
a.Sắp xếp dãy số theo thứ tự tằng (hoặc giảm) dần
b.Đảm bảo tính chất so sánh được giữa các mức độ trong dãy số
c.Loại bỏ tác động của các yếu tố ngẫu nhiên
d.Không có điều nào ở trên
=> Phương án lựa chọn: c Loại bỏ tác động của các yếu tố ngẫu nhiên
2.Các biện pháp hạn chế sai số chọn mẫu:
a.Tăng số đơn vị tổng thể mẫu
b.Sử dụng phương pháp chọn mẫu thích hợp
c.Giảm phương sai tổng thể chung
d.Cả a,c
e.Cả a,b
f.Cả a, b, c
=> Phương án lựa chọn: b Sử dụng phương pháp chọn mẫu thích hợp.
3.Ưu điểm của mode:
a.San bằng mọi chênh lệch giữa các lượng biến
b.Không chịu ảnh hưởng của các biến đột xuất
c.Kém nhạy bén với sự biến động của tiêu thức
d.Cả a,b
e.Cả a, b, c
=> Phương án lựa chọn: b Không chịu ảnh hưởng của các biến đột xuất.
4.Tổng thể nào dưới đây là tổng thể bộc lộ
a.Tổng thể những người yêu thích dân ca
b.Tổng thể những người làm ăn phi pháp
c.Tổng thể doanh nghiệp quốc doanh ở một địa phương
d.Cả a,b
e.Cả a, b, c
=> Phương án lựa chọn: c Tổng thể doanh nghiệp quốc doanh ở một địa phương 5.Biểu đồ hình cột (histograms) có đặc điểm:
a.Giữa các cột không có khoảng cách
b.Độ rộng của cột biểu hiện giá trị giữa của mỗi tổ
c.Chiều cao của mỗi cột biểu thị tần số
d.Cả a, b đều đúng
e.Cả a, c đều đúng
f.Cả a, b, c đều đúng
=> Phương án lựa chọn: e Cả a, c đều đúng.
Câu 2:
Ta có công thức chọn cỡ mẫu:
2
2 2 Error
Z
Trong đó:
Trang 3σ =6 (theo kinh nghiệm)
Error = +/-1
Với độ tin cậy là 95%, tra bảng Z (với A(Z)=0.975 (2 phía)), ta có Z=1.96
Thay vào công thức: n=138.287, làm tròn lên chọn cỡ mẫu: n=139
Gọi μ là năng suất trung bình một giờ của công nhân tại nhà máy
Với dữ liệu bài đã cho ta phải ước lượng khoảng trung bình μ với độ tin cậy 95% trong trường hợp mẫu lớn (n=139>30) và chưa biết phương sai σ Theo đó, ta sử dụng công thức :
n
s t
x n
s t
x − α/2;(n−1) ≤ µ ≤ + α/2;(n−1)
Trong đó:
X=35; s=6.5; n=139
Tra bảng t, với số bậc tự do=138, α=5%(2 phía) => t=1.977
Thay số vào công thức: 36.09 sp≤μ≤39.13sp
Kết luận: Với độ tin cậy 95%, năng suất lao động trung bình μ nằm trong khoảng từ 36.09
sp đến 39.13 sp.
Câu 3:
Gọi p1: Tỷ lệ những người yêu thích mùi hương cũ
Gọi p2: Tỷ lệ những người ưa thích mùi hương mới
Đặt giả thiết:
H0: p1≥p2
H1: p1<p2.
Bài toán kiểm định hai tỷ lệ- kiểm định Z (với mẫu đủ lớn theo điều kiên n1*ps1; n2*ps2>5, và
n1*(1-ps1); n2*(1-ps2)>5)
Ta có công thức:
−
−
=
2 1
1 1 ) 1 (
2 1
n n p p
p p Z
s s
s s
Trang 4Trong đó: Ps1=200/800=0.25; Ps2=295/1000=0.295.
2 1
2 1
2 1
2
n n
n
n n
n
p n p
n
+
+
= +
+
Thay dữ liệu vào công thức trên:
Z= -2.1246, tra bảng Z được kết quả 1-α=0.9832, α=0.0168=1.68%
Vì đây là kiểm định trái do đó nếu ứng với một mức tin cậy nào đó tra bảng Z mà Zα>-2.1246, ta bác bỏ H0, chấp nhận H1( tỷ lệ số người yêu thích mùi hương mới lớn hơn số người yêu thích mùi hương cũ)
Kết luận : Với độ tin cậy <98.32%, ta có đủ cơ sở để nói rằng tỷ lệ người yêu thích mùi
huơng mới lớn hơn tỷ lệ người yêu thích mùi hương cũ.
Câu 4
1 Phân tích tình hình biến động thời vụ về lượng khách du lịch quốc tế của Công ty qua chỉ số thờI vụ (giản đơn) để đề xuất những kiến nghị thích hợp:
Với số liệu khách hàng đã cho ta tính được bảng sau:
Lượng khách trung bình tháng Yi
Chỉ số thời vụ Ii
Trang 5Lượng
khách
trung
bình
năm
40.4167 43.5833 41.0833 43.1667 41.75
Tổng
lượng
khách
năm
Lượng
khách
trung
bình 6
năm
Từ chỉ số thời vụ Ii, ta có nhận xét sau:
Số lượng khách du lịch tập trung vào 6 tháng đầu năm (có chỉ số Ii>1), lượng khách du lịch có xu hướng suy giảm trong thời gian 6 tháng cuối năm (có chỉ số Ii<1) Do đó, công ty cần phải có các chính sách khuyến mãi định kỳ nhằm cân bằng lượng khách du lịch trong các tháng
2 Xác định hàm xu thế tuyến tính biểu diễn xu hướng biến động của số lượng khách du
lịch quốc tế qua các năm tại Công ty:
Sử dụng phương pháp hồi quy tuyến tính với biến phụ thuộc Y: Tổng số khách năm, X: mã năm,
có kết quả sau:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.26374432
R Square 0.06956107
Adjusted R Square -0.2405852
Standard Error 18.0286809
Observations 5
ANOVA
df SS MS F Significance F
Regression 1 72.9 72.9 0.224285 0.668125
Trang 6Residual 3 975.1 325.033
Coefficients Standard Error t Stat P-value Lower 95%
Intercept 495.9 18.90864 26.2261 0.000122 435.7243
X Variable 1 2.7 5.7011695 0.47359 0.668125 -15.44367
Với số liệu thống kê cho thấy có rất ít mối tương quan giữa số lượng khách hàng năm và số năm,
tuy nhiên do đề bài không yêu cầu kiểm định nên ta có hàm sau: Y i = 495.9+2.7*X i
3 Dự đoán lượng khách của Công ty theo các tháng năm 2009 với độ tin cậy 95%:
Muốn dự đoán lượng khách trung bình hàng tháng của công ty năm 2009, ta phải làm bài toán ngoại suy hàm xu thế cho lượng khách năm 2009 (Y2009) với độ tin cậy 95%
Ta có công thức:
p ) 2 n ,(
2 / L
n p
) 2 n ,(
2 /
L
n t S Y ˆ yˆ t S
yˆ + − α − ≤ ≤ + + α −
) 1 n
( n
1 L 2 n 3 n
1 1 S
−
− +
+ +
=
Trong đó: Syt=18.028609 (kết quả tra trong bảng kết quả hồi quy)
Y2009=459.5+2.7*6=512.1
n=5, L=1, tính được Sp=26.126
Tra bảng t với số bậc tự do 3, mức ý nghĩa 5% (2 phía), ta có t=3.182
Từ đó, ta ước lượng được lượng khách năm 2009 với mức tin cậy 95% nằm trong khoảng từ: 428.9669 khách đến 595.233 khách
Chia khoảng ước lượng trên cho 12 tháng, sau đó nhân với chỉ số thời vụ Ii ta có bảng ước lượng hàng tháng như sau (làm tròn):
khách trung bình
Chỉ số thời
vụ Ii
Trang 7tháng Yi
1 48.2000 1.1476
2 53.4000 1.2714 54.2582 45 63
3 52.2000 1.2429 53.0389 44 62
4 49.0000 1.1667 49.7875 42 58
5 49.6000 1.1810 50.3971 42 59
6 42.0000 1.0000 42.6750 36 50
7 40.2000 0.9571 40.8461 34 47
8 37.4000 0.8905 38.0011 32 44
9 32.4000 0.7714 32.9207 28 38
10 32.2000 0.7667 32.7175 27 38
11 31.8000 0.7571 32.3111 27 38
12 35.6000 0.8476 36.1721 30 42
Câu 5:
Gọi Y: % tăng doanh thu
Gọi X:% tăng quảng cáo
Y là biến phụ thuộc vào biến độc lập X Từ số liệu đã qua sử dụng hồi quy trong Exel ta có bảng: SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9594595
Adjusted R Square 0.8940833
Standard Error 0.3130063
ANOVA
Trang 8Regression 1 3.406081081 3.406081081 34.76551724 0.00973889
Coefficients Standard Error t Stat P-value Lower 95%
Intercept 1.8648649 0.295603282 6.308674428 0.008048301 0.92412329
X Variable 1 0.4797297 0.081362126 5.89622907 0.009738889 0.22079913
1 Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên hệ
giữa % tăng doanh thu và % tăng chi phí quảng cáo như sau:
Y=1.86486+0.47973*X
Kết luận: Khi % tăng chi phí quảng cáo là 1% sẽ làm tăng doanh thu 0,47973% (Trong điều kiện các yếu tố khác không đổI)
2 Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối liên hệ tương quan tuyến tính không:
Để kiểm định giả thiết bài ra, ta đặt cặp giả thiết sau:
H0: β1=0 (không có mối liên hệ tương quan)
H1: β1≠0 (có mối liên hệ tương quan)
Dựa vào bảng kết quả hồi quy, với biến X ta có t=6.30867, Mức ý nghĩa=0.00974≈1%, tức là với
độ tin cậy 99% có thể nói rằng % tăng doanh thu có mối liên hệ tuyến tính với % tăng quảng cáo
3 Đánh giá cường độ của mốI quan hệ và sự phù hợp của mô hình trên (qua hệ số tương quan và hệ số xác định):
Hệ số tương quan (R2 =0,921) có nghĩa rằng với mẫu đã cho thì 92,1% sự thay đổi trong % tăng doanh thu được giải thích bởi % tăng chi phí quảng cáo
4 Hãy ước lượng tỷ lệ % doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5% vớI xác suất tin cậy 95%:
Hệ số xác định (Multiple R = 95,9%) điều này chỉ rõ mối liên hệ tương quan giữa % tăng chi phí quảng cáo và % tăng doanh thu là rất chặt chẽ
Ta phải ước lượng giá trị Y, khi X=5% với độ tin cậy là 95%, sử dụng công thức khoảng tin cậy
là khoảng:
( ) ( )
∑
=
−
−
− +
+
⋅
⋅
i i
i yx
n
i
X X
X X n S
t
Y
1
2
2 2
;
2
/
1 1 ˆ
α
Trang 9Ta có Y5%= 1.85486+0.47973*5= 4.2635%.
Syx=0.313006 (tra trong bảng kết quả hồi quy=Standard Error)
n=5,X = 3.2
Tra bảng t với số bậc tự do =3, mức ý nghĩa 5% (2 phía) ta có t=3.182
Thay số vào công thức trên, tính được khoảng tin cậy của Y5% từ: 3.071% đến 5.4499%
Kết luận: Với độ tin cậy 95%, khi chi phí quảng cáo tăng 5% thì doanh thu tăng trong
khoảng từ 3.071% đến 5.4499%.