3 Độ lệch chuẩn là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức nghiên cứu của hai hiện tượng khác loại Đúng, vì: Hệ số biến thiên là chỉ tiêu tương đối có được từ so s
Trang 1BÀI TẬP CÁ NHÂN
Môn học: THỐNG KÊ TRONG KINH DOANH Học viên: Nguyễn Ngọc Vinh
Lớp : GaMBA01.M0709
Trang 2Câu 1: Lý thuyết (2đ)
A Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu
Đúng, vì: Nghiên cứu thống kê phải dựa vào đặc điểm của mỗi đơn vị tổng thể Tùy
theo mục đích nghiên cứu, một số đặc điểm của đơn vị tổng thể được chọn ra để nghiên cứu Tiêu thức thống kê có thể gồm các loại: tiêu thức thuộc tính (giới tính, nghề nghiệp, ngành nghề kinh tế), tiêu thức số lượng (số nhân khẩu, tiền lương, ), tiêu thức thay phiên (nam, nữ )
2) Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối.
Đúng, vì: Tần số tích luỹ là tổng các tần số (số lần) về dữ liệu trong khoảng dữ liệu đó, ví
dụ: Tần số: 5 trong khoảng dữ liệu từ 10 đến dưới 20; Tần số: 5 trong khoảng dữ liệu từ 20 đến dưới 30 Như vậy tần số tích luỹ trong trường hợp này sẽ là 10 (số tuyệt đối)
3) Độ lệch chuẩn là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức nghiên cứu của hai hiện tượng khác loại
Đúng, vì: Hệ số biến thiên là chỉ tiêu tương đối có được từ so sánh giữa độ lệch tiêu
chuẩn và trung bình cộng Hệ số biến thiên có thể so sánh giữa các tiêu thức khác nhau,
ví dụ người ta có thể so sánh hệ số biến thiên của tiêu thức doanh thu và sản lượng
4) Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ nghịch với phương sai của tổng thể chung đó
Sai, vì khoảng tin cậy cho giá trị trung bình của một tổng thể chung tỷ lệ thuận với tổng
thể chung đó
5) Hệ số hồi quy (b 1 ) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả
Đúng, vì: phân tích hồi quy được sử dụng để dự đoán: Một mô hình thống kê được sử
dụng để dự đoán giá trị của một biến phụ thuộc hoặc biến kết quả dựa trên những giá trị của ít nhất 1 biến độc lập hay biến nguyên nhân
B Chọn phương án trả lời đúng nhất
1) Phân tích dãy số thời gian có tác dụng:
δ a) Phân tích đặc điểm biến động của hiện tượng qua thời gian
ε b) Biểu hiện xu hướng và tính quy luật của sự biến động
φ c) Là cơ sở để dự đoán mức độ tương lai của hiện tượng
Trang 3γ d) Cả a), b).
η e) Cả b), c)
f) Cả a), b), c) (đúng)
2) Đại lượng nào phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả:
a) Hệ số tương quan
b) Hệ số chặn (b0 )
c) Hệ số hồi quy (b 1 ) (đúng)
d) Cả a), b)
ι e) Cả a), c)
3) Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
a) Độ tin cậy của ước lượng
b) Độ đồng đều của tổng thể chung (đúng)
c) Phương pháp chọn mẫu
d) Cả a), b), c)
e) Không yếu tố nào cả
4) Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng khác loại:
a) Độ lệch tiêu chuẩn (đúng)
b) Khoảng biến thiên
c) Khoảng tứ phân vị
d) Hệ số biến thiên
ϕ e) Cả a), c)
κ f) Cả a), d)
5) Biểu đồ hình cột (Histograms) không phải là đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện khoảng cách tổ
c) Chiều cao của cột biểu thị tần số (đúng)
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
Câu 2 (1,5 đ)
Trang 4Một doanh nghiệp muốn ước lượng trung bình một giờ một công nhân hoàn thành được bao nhiêu sản phẩm để đặt định mức Giám đốc nhà máy muốn xây dựng khoảng ước lượng có sai số bằng 1 sản phẩm và độ tin cậy là 95%, Theo kinh nghiệm của ông ta độ lệch tiêu chuẩn về năng suất trong một giờ là 6 sản phẩm Hãy tính số công nhân cần được điều tra để đặt định mức
Giả sử sau khi chọn mẫu (với cỡ mẫu được tính ở trên) số sản phẩm trung bình
mà họ hoàn thành trong 1 giờ là 35 với độ lệch tiêu chuẩn là 6,5 Hãy ước lượng năng suất trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%
Bài làm
2 2
Error
Z
Trong đó:
σ =6 (theo kinh nghiệm)
Error = +/-1
Với độ tin cậy là 95%, tra bảng Z (với A(Z)=0.975 (2 phía)), ta có Z=1.96
Thay vào công thức: n=138.287, làm tròn lên chọn cỡ mẫu: n=139
Gọi μ là năng suất trung bình một giờ của công nhân trong nhà máy
Trường hợp bài đã cho ta phải ước lượng khoảng trung bình μ với độ tin cậy 95% trong trường hợp mẫu lớn (n=139>30) và chưa biết phương sai σ Do đó ta sử dụng công thức sau:
n
s t
x n
s t
x − α/2;(n−1) ≤ µ ≤ + α/2;(n−1)
Trong đó:
−
X =35; s=6.5; n=139
Tra bảng t, với số bậc tự do=138, α=5%(2 phía) ta có t=1.977
Thay số vào công thức ta được: 36.09 sp≤μ≤39.13sp
Như vậy với độ tin cậy 95%, năng suất lao động trung bình μ nằm trong khoảng từ 36.09 - 39.13 sản phẩm
Câu 3 (1,5đ)
Trang 5Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản phẩm Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay không người ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
Phương án 1: 22 32 36 38 35 26 30 28 24 28 26 34
Phương án 2: 21 27 28 29 23 26 28 30 32 34 38 25 36 28 Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn Với độ tin cậy 95% hãy rút ra kết luận về hai phương án trên
Bài làm
Gọi µ1 là chi phí sản xuất sản phẩm của phương án 1.
Gọi µ2 là chi phí sản xuất sản phẩm của phương án 2.
⇒ cặp giả thiết kiểm định { 0 : 1 2
2 1 :
1 µ µ
µ
Η
≠ Η
(µ =1 µ2: chi phí sản xuất sản phẩm của phương án 1 bằng phương án 2
: 2
µ ≠ chi phí sản xuất sản phẩm của phương án 1 khác phương án 2).
22 21 t-Test: Two-Sample Assuming Equal Variances
Difference
0
26 38 P(T<=t) one-tail
34 25 t Critical one-tail
36 P(T<=t) two-tail
28 t Critical two-tail 2.064
Thông tin trong bảng: Χ1 =29.92; Χ2 =28.93; 2
1
S = 25.90; 2
2
S = 22.84; n1=12;
=
2
n 14;
=
t 0.863; 2 =
p
S 22.24; df =24.
Trang 6Đây là trường hợp kiểm định giá trị trung bình khi chưa biết phương sai, mẫu nhỏ (n<30), có tổng thể chung phân bố chuẩn Kiểm định t bằng công thức:
(
) 2 1 ( ) (
2 1 2
2 1
n n S
t
p +
−
− Χ
− Χ
(trong đó: µ1−µ2=0) (***)
Thay S p2 =22.24
vào công thức (***) ta có:
855 1 ) 14
1 12
1 (
* 24 22
84 22 90
+
−
=
t
Theo đầu bài cho: độ tin cậy 95% ⇔ α= 0,05;
df =n1+n2-2 = 12+14-2 = 24
Tra bảng với tα =0,05 (hai phía); n = 24 ta có t = ± 2,064
Với t (tính toán) = 1.855 so với t (tra bảng): –2,064 < 1.855 < +2,064.
- Ra quyết định: không bác bỏ với α = 0,05.
Kết luận: không có đủ cơ sở với giả thiết độ tin cậy 95%, chi phí sản xuất sản phẩm
của phương án 1 so với phương án 2 là khác nhau
Câu 4 (2,5đ)
Dưới đây là dữ liệu về khối lượng than khai thác được trong 30 tháng gần đây của một nhà máy (đơn vị: triệu tấn):
1 Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf)
2 Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu trên
3 Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
4 Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra
và từ bảng phân bố tần số So sánh kết quả và giải thích
Bài làm
24 22 2
14 12
84 22
* ) 1 14 ( 90 25
* ) 1 12 ( 2
) 1 ( )
1
(
2 1
2 2 2 2 1 1
− +
− +
−
=
− +
− +
−
=
n n
S n S
n
S p
Trang 71 Biểu diễn dữ liệu trên bằng bằng biểu đồ thân lá:
Thân Lá
2 Xây dựng bảng tần số phân bố với 5 tổ có khoảng cách tổ bằng nhau.
Tổ
Trị số
Tần suất (%)
Tần số tích lũy
Tần suất tích lũy (%)
3.Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
Trong bộ dữ liệu trên ta có xuất hiện dữ liệu đột xuất Đó là dữ liệu tổ từ 6 tấn đến dưới 7 tấn đem lại sản lượng than sản xuất của nhà máy lớn nhất với tần số 8, tương ứng với tần suất 27.59% Để tăng sản phẩm than khai thác trong thời gian tới, nhà máy nên tập trung vào tổ từ 6 tấn đến dưới 7 tấn và muốn giảm sản phẩm than thì nhà máy nên tập trung vào tổ từ 3 tấn đến dưới 4 tấn
4 Tính khối lượng sản phẩm thép trung bình 1 tháng từ tài liệu điều tra và từ bảng phân bố tần số So sánh kết quả và giải thích.
a) Từ tài liệu điều tra:
4933 , 5 30
8 164
=
=
= ∑
n
x
X i
b) Từ bảng phân bố tần số:
517 , 5 30
51 165
=
=
=
∑
∑
i
i i
f
f x X
Trang 8Kết luận: So sánh 2 kết quả tính toán ở trên ta thấy, tính theo phân bố tần số có kết quả
cao hơn và không chính xác so với khi tính giá trị trung bình theo số liệu điều tra Lý do:
Tổ TB thật (SL điều tra) Trị số giữa (SL theo bảng phấn
bổ tần số)
Như vậy, trong 5 tổ có 1 tổ (từ 4 tấn đến dưới 5 tấn) có trị số giữa nhỏ hơn trung bình thật; 4 tổ còn lại có trị số giữa lớn hơn trung bình thật trong từng tổ Do vậy, làm sản lượng than trung bình 1 tháng tính từ bảng phân bố tần số lớn hơn sản lượng than trung bình 1 tháng dựa trên số liệu điều tra ban đầu Vậy, số liệu điều tra ban đầu chính xác hơn
Câu 5 (2,5đ)
Một hãng trong lĩnh vực kinh doanh dầu gội đầu thực hiện một thử nghiệm để đánh giá mức độ ảnh hưởng của quảng cáo đối với doanh thu Hãng cho phép tăng chi phí quảng cáo trên 5 vùng khác nhau của đất nước so với mức của năm trước và ghi chép lại mức độ thay đổi của doanh thu ở các vùng như sau:
1 Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên
hệ này qua các tham số của mô hình
2 Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự
có mối liên hệ tương quan tuyến tính không?
3 Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên
4 Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5,5% với độ tin cậy 90%
Trang 9Bài làm
Gọi X là % tăng chi phí quảng cáo
Gọi Y là % tăng doanh thu
Theo đề bài ta có
1 Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối
liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ
này qua các tham số của mô hình.
Sử dụng phân tích hồi quy ta có số liệu sau đây:
SUMMARY
OUTPUT
Regression Statistics
Multiple R 0.97696742
R Square 0.95446533
Adjusted R Square 0.93928711
Standard Error 0.18684194
Observations 5
ANOVA
Df SS MS F Significance F
Regression 1 2.19527027 2.19527027 62.88387097 0.004181592
Residual 3 0.10472973 0.03490991
Total 4 2.3
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 2.06756757 0.176453579 11.7173456 0.001335707 1.506013527 2.629121609 1.50601353 2.629121609
X Variable 1 0.38513514 0.048567249 7.92993512 0.004181592 0.230572472 0.539697798 0.23057247 0.539697798
Với dữ liệu trên ta có Phương trình hồi quy tuyến tính biểu hiện mối liên hệ giữa %
tăng chi phí quảng cáo và % tăng doanh thu như sau:
Y = 2,068 + 0,385X Như vậy, khi % tăng chi phí quảng cáo là 1% thì làm tăng doanh thu khoảng 0,39%
(Với điều kiện các yếu tố khác không đổi)
2.Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự
có mối liên hệ tương quan tuyến tính không?
Trang 10Đặt giả thiết:
tính.
Ta dùng tiêu chuẩn T-student để kiểm định Ta đã thấy t stat bằng: 7.929
với mức ý nghĩa α bằng: 0.004
Sai số chuẩn của mô hình: 0.176
Kết luận:Bác bỏ giả thiết H0, chấp nhận giả thiết H1 Chi phí quảng cáo và doanh thu có mối quan hệ tương quan tuyến tính.
(qua hệ số tương quan và hệ số xác định)
đổi trong % tăng doanh thu được giải thích bởi % tăng chi phí quảng cáo.
Hệ số xác định (Multiple R = 0.98% ) điều này chỉ rõ mối liên hệ tương quan giữa % tăng chi phí quảng cáo và % tăng doanh thu là rất chặt chẽ.
4.Ước lượng tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5,5% với xác suất tin cậy là 95%
X =5,5 thay vào công hàm hồi quy trên ta có
Y = 2,068 + 0,385*5,5 = 13.4915
Khi % tăng chi phí quảng cáo là 5,5% -> tăng doanh thu là 13,492 % với độ tin cậy 95%.