Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu Đúng, tiêu thức thống kê phản ánh đặc điểm của từng tổng thể nghiên cứu tùy theo từng mục đích nghiên cứu1. Hệ số biến thiên
Trang 1Bài tập cá nhân Môn: Thống kê và khoa học ra quyết định
Câu 1: Lý thuyết
A Trả lời đúng (Đ), sai (S) cho các câu hỏi sau và giải thích tại sao?
1 Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu
Đúng, tiêu thức thống kê phản ánh đặc điểm của từng tổng thể nghiên cứu tùy theo từng mục đích nghiên cứu Tiêu thức thống kê có thể gồm các loại: tiêu thức thuộc tính (giới tính, nghề nghiệp, ngành nghề kinh tế), tiêu thức số lượng (số nhân khẩu, tiền lương, ), tiêu thức thay phiên (nam, nữ )
2 Tần suất biểu hiện bằng số tuyệt đối
Sai, tần suất được biểu hiện bằng số tương đối (đơn vị tính là lần hoặc %)
3 Hệ số biến thiên là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức nghiên cứu của hai hiện tượng khác loại
Đúng, hệ số biến thiên là chỉ tiêu tương đối có được từ so sánh giữa độ lệch tiêu chuẩn và trung bình cộng Hệ số biến thiên có thể so sánh giữa các tiêu thức khác nhau, ví dụ người
ta có thể so sánh hệ số biến thiên của tiêu thức doanh thu và quảng cáo
4 Khoảng tin cậy cho tham số của tổng thể chung tỷ lệ thuận với phương sai của tổng thể Đúng, khoảng tin cậy được tính theo công thức:
X ± Z (Trong đó X là trung bình của tham số trong tổng thể chung)
Khi σ tăng trong khi X và n không đổi, khoảng tin cậy của tham số của tổng thể chung tăng
5 Liên hệ tương quan là mối liên hệ không biểu hiện rõ trên từng đơn vị cá biệt
Đúng, liên hệ tương quan tương quan làm mối liên hệ không hoàn toàn chặt chẽ giữa biến nguyên nhân và biến kết quả, mối liên hệ tương quan không biểu hiện rõ trên từng đơn vị
cá biệt
1 Các phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng nhằm:
a, Sắp xếp dãy số theo thứ tự tăng (hoặc giảm) dần
Trang 2b, Đảm bảo tính chất so sánh được giữa các mức độ trong dãy số
c, Loại bỏ tác động của các yếu tố ngẫu nhiên
*d, Không có điều nào ở trên
2 Các biện pháp hạn chế sai số chọn mẫu
a, Tăng số đơn vị tổng thể mẫu
*b, Sử dụng phương pháp chọn mẫu thích hợp
c, Giảm phương sai tổng thể chung
d, Cả a, c
e, cả a,b
f, cả a, b, c
3 ưu điểm của Mốt là:
a, San bằng chênh mọi chênh lệch giữa các lượng biến
*b, Không chịu ảnh hưởng của các biến đột xuất
c, Kém nhạy bén với sự biến động của tiêu thức
d, cả a, b
e, cả a,b,c
4 Tổng thể nào dưới đây là tổng thể bộc lộ
a, Tổng thể những người yêu thích dân ca
b, Tổng thể những người làm ăn phi pháp
*c, tổng thể doanh nghiệp quốc doanh ở một địa phương
d, cả a,b
e, cả a,b,c
5 Biểu đồ hình cột (histograms) có đặc điểm
a, Giữa các cột không có khoảng cách
b, Độ rộng của cột biểu hiện giá trị giữa của mỗi tổ
c, Chiều cao của mỗi cột biểu thị tần số
Trang 3d, cả a,b đều đúng
*e, cả a, c đều đúng
f, cả a,b,c đều đúng
Câu 2
1 Tóm tắt đề bài
- σ =6
- Error = 1
- Độ tin cậy: 95%
- Tìm n?
Ta có
n ≥( Z2
α/2 x σ2)/Error2
Thay số ta có n ≥ (1,962x 62)/12 = 138,29
Như vậy ta có thể chọn kích cỡ mẫu là 140
2 Gọi µ là năng suất lao động trung bình một giờ của toàn bộ công nhân
ta đã biết:
= 35
S = 6,5 (độ lệch chuẩn của tổng thể mẫu)
n = 140
ta đi ước lượng µ khi đã biết S
Ta có
Thay số ta có
35-1,661*6,5/11,83 ≤ µ ≤ 35+1,661*6,5/11,83
34,08 ≤µ≤ 35,91
Kết luận: Như vậy mẫu đã cho với độ tin cậy là 95% thì năng suất lao động trung bình cho
một giờ của toàn bộ công nhân nằm trong khoảng từ 34,08 đến 35,91 sản phẩm
Trang 4Câu 3
Tóm tắt đề bài:
n1 =800, Ps1 = 0,25
n2 =1000, Ps2 = 0,295
ta thấy do N1*Ps1 và N2*Ps2 đều lớn hơn 5 do vậy ta dùng tiêu chuẩn kiểm định Z
Xác định cặp giả thiết
H0: 1 - µ2≤ 0
H1: µ1 - µ2 > 0
Dùng tiêu chuẩn kiểm định Z ta có
Z =
p=
như vậy Z = -2,12464
do kiểm định cặp giả thiết trên là kiểm định phải nên Z có thể nằm trong miền bác bỏ, cũng
có thể nằm trong miền giải thiết
ta thấy 2,124 ≈Z0,9832
Kết luận: Với mẫu đã cho nếu mức ý nghĩa α ≥ 1,68% thì Z nằm trong miền bác bỏ,chưa có
đủ căn cứ để nói rằng dàu gội đầu mùi mới có tỷ lệ lớn hơn mùi cũ
Với mẫu đã cho nếu mức ý nghĩa α < 1,68% thì Z nằm trong miền giả thiết, có đủ căn cứ để nói rằng dàu gội đầu mùi mới có tỷ lệ ưa thích lớn hơn mùi cũ
Câu 4
1 Phân tích biến động thời vụ về lượng khách du lịch quốc tế
Trang 5năm/tháng 2004 2005 2006 2007 2008 ∑Yi Ȳi chỉ số mùa vụ
TB theo
Theo bảng trên ta thấy từ tháng 6-12 chỉ số mùa vụ nhỏ hơn 1, hay đây là thời điểm lượng khách du lịch ít, công ty nên có thể:
- Đào tạo, cử đi đào tạo nâng cao nghiệp vụ chuyên môn cho đội ngũ cán bộ, nhân viên của mình phục vụ tốt hơn cho công việc
- Cử người khảo sát, tìm hiểu, mở rộng thị trường mới
- Khuyến khích cán bộ nhân viên nghỉ phép trong giai đoạn này
- Sửa chữa, trang thiết bị, văn phòng
2 Xác định xu thế tuyến tihcs biểu diễn xu hướng biến động qua các năm
Gọi Ti là biến thời gian của các năm, sử dụng phương pháp hồi quy theo dữ liệu trên ta có
Trang 6SUMMARY OUTPUT
Regression Statistics
Adjusted R
ANOVA
Coefficients Standard Er- ror t Stat P-value Lower 95% Upper 95%
Như vậy ta có thể xác định hàm xu thế lượng khách du lịch qua các năm theo hàm sau:
Ŷ = 495,9 + 2,7Ti
3 Dự đoán lượng khách của Công ty theo các tháng năm 2009 với độ tin cậy 95%
Lượng khách của Công ty dự đoán theo các tháng năm 2009 được xác định theo công thức
Trong đó:
Trong đó :
Syt: là sai số của mô hình (theo phương pháp hồi quy trên Syt = 18)
Trang 7n =6
L = 1
Thay số ta có bảng dự đoán lượng khách du lịch ở trên như sau:
Năm 2009 Chỉ số thời vụ Dự đoán điểm Dự đoán khoảng
Cận dưới Cận trên
1 1,148 49,242 - 19,136 117,620
2 1,271 54,555 - 13,823 122,933
3 1,243 53,329 - 15,049 121,707
4 1,167 50,060 - 18,318 118,438
5 1,181 50,673 - 17,705 119,051
6 1,000 42,908 - 25,470 111,286
7 0,957 41,069 - 27,309 109,447
8 0,890 38,209 - 30,169 106,587
9 0,771 33,101 - 35,277 101,479
10 0,767 32,896 - 35,482 101,274
11 0,757 32,488 - 35,890 100,866
12 0,848 36,370 - 32,008 104,748
Câu 5
Gọi X là % tăng chi phí quảng cáo
Gọi Y là % tăng doanh thu
Theo đề bài ta có
Sử dụng phân tích hồi quy ta có số liệu sau đây:
SUMMARY OUTPUT
Regression Statistics
Adjusted R Square 0,894
Trang 8Observations 5
ANOVA
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 1,86486 0,29560 6,30867 0,00805 0,92412 2,80561
X Variable 1 0,47973 0,08136 5,89623 0,00974 0,22080 0,73866
1 Với dữ liệu trên ta có Phương trình hồi quy tuyến tính biểu hiện mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu như sau:
Y = 1,865+0,48X
Như vậy, khi % tăng chi phí quảng cáo là 1% thì làm tăng doanh thu khoảng 0,48% (Với điều kiện các yếu tố khác không đổi)
2 Theo số liệu trên ta thấy hàm hồi quy với kiểm định F =34,76 (α=0,00974), hoặc với kiểm định T ta thấy T =5,89623 (α=0,00974) luôn nằm trong miền bác bỏ Tức là bác bỏ giả thiết Ho, chấp nhận H1: Chi phí quảng cáo và doanh thu có mối liên hệ tuyến tính với nhau
Hơn nữa theo bảng trên ta thấy với tổng thể chung (độ tin cậy 95%) giá trị của X nằm trong khoảng
0,22 1≤X≤0,738
Như vậy đủ cơ sở để kết luận giữa X và Y có mối liên hệ tương quan tuyến tính Hay % tăng của chi phí quảng cáo và % tăng doanh thu có mối liên hệ tương quan tuyến tính
3 Theo bảng hồi quy ta có
Hệ số tương quan (R2 =0,921) có nghĩa rằng với mẫu đã cho thì 92,1% sự thay đổi trong
% tăng doanh thu được giải thích bởi % tăng chi phí quảng cáo
Hệ số xác định (Multiple R = 95,9%) điều này chỉ rõ mối liên hệ tương quan giữa % tăng chi phí quảng cáo và % tăng doanh thu là rất chặt chẽ
4 ước lượng tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5% với xác suất tin cậy là 95%
Trang 9X =5 thay vào công hàm hồi quy trên ta có
Y =1,865+0,48*5 = 4,265
Khoảng tin cậy của Ŷ như sau:
Syx=0.313006 ,n=5,X = 3,2
Tra bảng t với số bậc tự do =3, mức ý nghĩa 5% (2 phía) ta có t=3.182
3.071% ≤Y≤ 5.4499%
Kết luận: Với độ tin cậy 95%, khi chi phí quảng cáo tăng 5% thì doanh thu tăng trong khoảng từ 3,071% đến 5,45%