Câu này sai, vì theo các khái niệm thường dùng trong thống kê: “Tiêu thức thống kê là đặc điểm của từng đơn vị tổng thể được chọn ra để nghiên cứu tuỳ theo mục đích nghiên cứu khác nhau”
Trang 1Bài tập cá nhân môn th ống kê
Câu 1:
A Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
S 1) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu
Câu này sai, vì theo các khái niệm thường dùng trong thống kê: “Tiêu thức thống kê là đặc điểm của từng đơn vị tổng thể được chọn ra để nghiên cứu tuỳ theo mục đích nghiên cứu khác nhau” Như vậy tiêu thức thống kê chỉ đặc điểm của các đơn vị cấu
thành nên tổng thể, chứ không phải tổng thể
S 2) Tần suất biểu hiện bằng số tuyệt đối
Câu này sai, vì tần suất là tỷ lệ kết cấu của tổng tần số, biểu hiện bằng số lần hoặc phần trăm – là những số tương đối
Đ 3) Hệ số biến thiên là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức nghiên cứu của hai hiện tượng khác loại
Câu này đúng, vì hệ số biến thiên là chỉ tiêu so sánh độ biến thiên tiêu thức của các hiện tượng cùng loại và khác loại, là số tương đối (%) rút ra từ sự so sánh giữa độ lệch tuyệt đối bình quân hoặc độ lệch chuẩn với số bình quân cộng
Đ 4) Khoảng tin cậy cho tham số của tổng thể chung tỷ lệ thuận với phương sai của tổng thể
Câu này đúng khoảng tin cậy được tính theo công thức: X ± Z (Trong đó X là trung bình của tham số trong tổng thể chung)
Theo công thức thấy: Khi σ tăng trong khi X và n không đổi, khoảng tin cậy của tham
số của tổng thể chung tăng
Đ… 5) Liên hệ tương quan là mối liên hệ không biểu hiện rõ trên từng đơn vị cá biệt
Trang 2Câu này đúng, vì các mối liên hệ tương quan là các mối liên hệ không hoàn toàn chặt chẽ, không được biểu hiện một cách rõ ràng trên từng đơn vị cá biệt Do đó, để phản ảnh mối liên hệ tương quan thì phải nghiên cứu hiện tượng số lớn - tức là thu thập tài liệu về tiêu thức nguyên nhân và tiêu thức kết quả của nhiều đơn vị
B Chọn phương án trả lời đúng nhất:
1) Các phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng nhằm: a) Sắp xếp dãy số theo thứ tự tăng (hoặc giảm) dần
b) Đảm bảo tính chất so sánh được giữa các mức độ trong dãy số
Chọn c) Loại bỏ tác động của các yếu tố ngẫu nhiên.
d) Không có điều nào ở trên
2) Các biện pháp hạn chế sai số chọn mẫu:
a) Tăng số đơn vị tổng thể mẫu
b) Sử dụng phương pháp chọn mẫu thích hợp
c) Giảm phương sai của tổng thể chung
d) Cả a), c)
e) Cả a), b)
Chọn f) Cả a), b), c).
3) Ưu điểm của Mốt là:
a) San bằng chênh mọi chênh lệch giữa các lượng biến
Chọn b) Không chịu ảnh hưởng của các lượng biến đột xuất.
c) Kém nhậy bén với sự biến động của tiêu thức
d) Cả a), b)
δ e) Cả a), b), c)
4) Tổng thể nào dưới đây là tổng thể bộc lộ:
a) Tổng thể những người yêu thích dân ca
b) Tổng thể những người làm ăn phi pháp
Chọn c) Tổng thể các doanh nghiệp quốc doanh ở một địa phương.
Trang 3d) Cả a) và b).
e) Cả a), b) và c)
5) Biểu đồ hình cột (Histograms) có đặc điểm:
a) Giữa các cột không có khoảng cách
b) Độ rộng của cột biểu hiện trị số giữa của mỗi tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả a) và c) đều đúng
Chọn f) Cả a), b) và c) đều đúng
Câu 2
Một doanh nghiệp muốn ước lượng trung bình một giờ một công nhân hoàn thành được bao nhiêu sản phẩm để đặt định mức Giám đốc nhà máy muốn xây dựng khoảng ước lượng có sai số bằng 1 sản phẩm và độ tin cậy là 95%, Theo kinh nghiệm của ông ta độ lệch tiêu chuẩn về năng suất trong một giờ là 6 sản phẩm Hãy tính số công nhân cần được điều tra để đặt định mức
Giả sử sau khi chọn mẫu (với cỡ mẫu được tính ở trên) số sản phẩm trung bình mà họ hoàn thành trong 1 giờ là 35 với độ lệch tiêu chuẩn là 6,5 Hãy ước lượng năng suất trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%
a. Xác định cỡ mẫu:
Có: σ =6; Error = 1; Độ tin cậy: 95%
Áp dụng công thức chọn mẫu n =( Z 2 x σ 2 )/Error 2
Với độ tin cậy là 95%, ta có 1-α = 0.975
Tra bảng Z ta có Z=1.96
Thay vào công thức tính được: n=138,287, làm tròn n=139
b Với mẫu đã chọn ước lượng năng suất lao động trung bình một giờ của toàn bộ công nhân.
Trang 4ta có: = 35; σ = 6; S = 6,5; n = 139; Z /2 = 1,96
Như vậy nếu gọi µ là năng suất lao động trung bình một giờ của toàn bộ công nhân ta
áp dụng công thức:
– Z /2 * ≤ µ + Z /2 *
Thay dữ liệu có ở trên, có:
34,0025 ≤µ≤35,9975
Như vậy với mẫu đã cho và độ tin cậy là 95% thì năng suất lao động trung bình cho một giờ của toàn bộ công nhân nằm trong khoảng từ 34,0025 đến 35,9975 sản phẩm
Câu 3
Công ty B&G đang nghiên cứu việc đưa vào một công thức mới để thay đổi mùi hương của dầu gội đầu Với công thức cũ khi cho 800 người dùng thử thì có 200 người
-ưa thích nó Với công thức mới, khi cho 1000 người khác dùng thử thì có 295 người tỏ
ra ưa thích nó Liệu có thể kết luận công thức mới đưa vào làm tăng tỷ lệ những người
ưa thích mùi mới không? Với mức ý nghĩa α là bao nhiêu?
Từ dữ kiện đầu bài, ta có:
N1 =800, Ps1 = 200/800 = 0,25
N2 =1000, Ps2 = 295/1000= 0,295
vì n1*ps1; n2*ps2>5, và n1*(1-ps1); n2*(1-ps2)>5) nên thực hiện kiểm định tỷ lệ Z
Xác định cặp giả thiết
Ho: P2- P1≤ 0
H1: P2- P1 >0
Dùng tiêu chuẩn kiểm định Z Theo công thức:
Trang 5
+
−
−
=
2 1
1 1 ) 1
(
2 1
n n p p
p p
Z
s s
s s
2 1
2 1
2 1
2
n n
n n
n n
p n p
n
s
+
+
= +
+
ps=(200+295)/(800+1000)=0.275
Thay số vào công thức trên ta có:
Z= -2.1246, tra bảng Z ta được 1-α=0.9832, α=0.0168=1.68%
Vì đây là kiểm định phải do đó Z có thể nằm trong miền giả thiết hoặc là miền bác bỏ
Kết luận:
Với mẫu đã cho nếu mức ý nghĩa α ≥ 1,68% thì Z nằm trong miền giả thiết, chưa đủ căn cứ bác bỏ, nói khác chưa đủ căn cứ để nói rằng công thức mới đưa vào làm tăng tỷ
lệ người ưa thích
Với mẫu đã cho nếu mức ý nghĩa α < 1,68% thì Z nằm trong miền bác bỏ, bác bỏ Ho chấp nhận H1 tức là công thức mới đưa vào làm tăng tỷ lệ người ưa thích
Câu 4
Có tài liệu về lượng khách du lịch quốc tế của một công ty du lịch như sau:
Đơn vị: ngàn lượt khách
Năm
Trang 610 31 29 35 34 32
1 Phân tích tình hình biến động thời vụ về lượng khách du lịch quốc tế của Công ty qua chỉ số thời vụ (giản đơn) từ đó đề xuất những kiến nghị thích hợp.
Đặt:
y lượng khách bình quân từng năm
yt lượng khách bình quan từng tháng tính chung cho 5 năm
It Tỷ lệ khách bình quân mỗi tháng, so với tỷ lệ khách bình quân của từng tháng tính chung cho 5 năm
Năm
tháng
_
Tổng
lượng
Như vậy, lượng khách du lịch tăng từ tháng 1 đến tháng 3, sau đó giảm dần từ tháng 4 đến tháng 11 Sang tháng 12, lượng khách lại bắt đầu tăng lên Với chu kỳ như vậy,
Trang 7công ty nên chuẩn bị sẵn các chương trình từ trước tháng 12, đồng thời tập trung
nguồn lực cho hoạt động từ tháng 12 đến tháng 3 năm sau
2 Xác định hàm xu thế tuyến tính biểu diễn xu hướng biến động của số lượng khách
du lịch quốc tế qua các năm tại Công ty nói trên.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.263744
R Square 0.069561
Adjusted R
Square -0.24059
Standard Error 18.02868
ANOVA
Df SS MS F
Significance F
Coefficients
Standard Error t Stat P-value Lower 95%
Upper 95%
Lower 95.0%
Intercept 495.9 18.90864 26.22611 0.000122 435.7242 556.0758 435.7242
X Variable 1 2.7 5.701169471 0.473587 0.668125 -15.4437 20.84368 -15.4437
Ta có hàm xu thế tuyến tính biểu diễn xu hướng biến động của lượng khách du lịch của công ty qua các năm như sau:
Y = 495.9 + 2.7X
Trang 83 Dự đoán lượng khách của Công ty theo các tháng năm 2009 với độ tin cậy 95%.
Theo công thức:
p ) 2 n ,(
2 / L
n p
) 2 n ,(
2 /
L
yˆ + − α − ≤ ≤ + + α −
) 1 n
( n
1 L 2 n 3 n
1 1 S
−
− +
+ +
=
Để tính Sp ta đã biết: Syt=18.028609; Y2009=459.5+2.7*6=512.1; n=5, L=1
Thay vào công thức tính được Sp=26.126
Tra bảng t với số bậc tự do 3, mức ý nghĩa 5%, ta có t=3.182
Tính được lượng khách năm 2009 với mức tin cậy 95% nằm trong khoảng từ: 428.9669 khách đến 595.233 khách
Từ kết quả trên, ta có bảng ước lượng hàng tháng như sau
:
trung bình tháng
Chỉ số thời
Trang 9Câu 5
Một hãng trong lĩnh vực kinh doanh nước ngọt thực hiện một thử nghiệm để đánh giá mức độ ảnh hưởng của quảng cáo đối với doanh thu Hãng cho phép tăng chi phí quảng cáo trên 5 vùng khác nhau của đất nước so với mức của năm trước và ghi chép lại mức độ thay đổi của doanh thu ở các vùng Thông tin ghi chép được nh sau:
1. Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ này qua các tham số của mô hình.
Gọi X là % tăng chi phí quảng cáo
Gọi Y là % tăng doanh thu
Theo đề bài ta có
Sử dụng phân tích hồi quy ta có số liệu sau đây:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,959
R Square 0,921
Adjusted R Square 0,894
Standard Error 0,313
Observations 5
ANOVA
Df SS MS F Significance F
Regression 1 3,40608
3,406
08
34,765
52 0,00974 Residual 3 0,29392
0,097
97
Trang 10Total 4 3,7
Coefficient
s Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 1,86486 0,29560
6,308
67
0,008
05 0,92412 2,80561
X Variable 1 0,47973 0,08136
5,896
23
0,009
74 0,22080 0,73866
Ta có phương trình hồi quy tuyến tính biểu hiện mối liên hệ giữa % tăng chi phí
quảng cáo và % tăng doanh thu như sau:
Y=1.86486+0.47973*X Như vậy, khi % tăng chi phí quảng cáo là 1% thì làm tăng doanh thu khoảng
0,48% (Với điều kiện các yếu tố khác không đổi)
2 Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự
có mối liên hệ tương quan tuyến tính không?
Để kiểm định giả thiết bài ra, ta đặt cặp giả thiết sau:
H0: β1=0 (không có mối liên hệ tương quan)
H1: β1≠0 (có mối liên hệ tương quan)
Dựa vào bảng kết quả hồi quy, với biến X ta có t=6.30867, Mức ý
nghĩa=0.00974≈1%, tức là với độ tin cậy 99% có thể nói rằng % tăng doanh thu có
mối liên hệ tuyến tính với % tăng quảng cáo
3 Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên (qua hệ số
tương quan và hệ số xác định).
Theo bảng hồi quy ta có
Hệ số tương quan (R2 =0,921) có nghĩa rằng với mẫu đã cho thì 92,1% sự thay đổi
trong % tăng doanh thu được giải thích bởi % tăng chi phí quảng cáo
Hệ số xác định (Multiple R = 95,9%) điều này chỉ rõ mối liên hệ tương quan giữa
% tăng chi phí quảng cáo và % tăng doanh thu là rất chặt chẽ
Trang 114 Ước lượng tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5% với xác suất tin cậy là 95%
X =5 thay vào công hàm hồi quy trên ta có
Y =1,865+0,48*5 = 4,265
Như vậy khi % tăng chi phí quảng cáo là 5% thì % tăng doanh thu là 4,625% với độ tin cậy 95%