1 Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu.. Đ Giải thích: Tiêu thức thống kê là khái niệm chỉ đặc điểm của đơn vị tổng thể, mỗi đơn vị tổng thể có nhiều tiêu thức kh
Trang 1BÀI TẬP CÁ NHÂN Môn: Thống kê và khoa học ra quyết định Học viên: Mai Thị Phương Thảo - Lớp M0809
Bài làm:
Câu 1: Lý thuyết (2đ)
A Trả lời đúng (Đ) sai (S) các câu hỏi sau và giải thích tại sao?
1) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu (Đ)
Giải thích: Tiêu thức thống kê là khái niệm chỉ đặc điểm của đơn vị tổng thể,
mỗi đơn vị tổng thể có nhiều tiêu thức khác nhau, tuỳ theo mục đích nghiên cứu người ta sẽ chọn ra một số tiêu thức nhất định để làm nội dụng điều tra, tổng hợp và phân tích thống kê Mỗi tiêu thức thống kê chỉ phản ánh một đặc điểm của từng đơn vị tổng thể được chọn ra từ tổng thể nghiên cứu, chứ không phản ánh toàn bộ đặc điểm của cả tổng thể nghiên cứu
2) Tần số trong bảng phân bố tần số biểu hiện bằng giá trị tuyệt đối (Đ)
Giải thích: Tần số được biểu hiện bằng số tuyệt đối còn tần suất mới được biểu
hiện bằng số tương đối với đơn vị tính là (%) Trong phân tích thống kê tần số cho phép chúng ta xác nhận một trị số nhất định trong một tổng thể nên tần số biểu hiện bằng số tuyệt đối
3) Độ lệch chuẩn là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức nghiên cứu của hai thiện tượng khác loại (S)
Giải thích: Độ lệch chuẩn là một trong các chỉ tiêu so sánh độ biến thiên của
hiện tượng cùng loại và số trung bình bằng nhau Đối với các hiện tượng khác loại hoặc các hiện tượng cùng loại không bằng nhau người ta dùng hệ số biến thiên để so sánh
Trang 24) Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ nghịch với phương sai của tổng thể chung đó (S)
Giải thích: Ta có công thức:
Theo công thức trên, phương sai của tổng thể chung càng nhỏ dẫn đến khoảng tin cậy cho tham số của tổng thể chung càng nhỏ nên nếu nói khoảng tin cậy của tổng thể chung tỷ lệ nghịch với phương sai của tổng thể chung đó là sai
5) Hệ số hồi quy (b1) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả (Đ)
Giải thích: Hệ số hồi quy b1 phản ánh ảnh hưởng của nhân tố đang nghiên cứu tới biến kết quả Cụ thể mỗi khi biến giải thích thay đổi (tăng lên) 1 đơn vị thì biến kết quả thay đổi (tăng lên) b1 đơn vị và ngược lại Như vậy hệ số hồi quy (b1) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả là đúng
B Chọn phương án trả lới đúng nhất (Câu trả lời đúng là câu màu xanh ) 1) Phân tích dãy số thời gian có tác dụng:
δ a) Phân tích đặc điểm biến động của hiện tượng qua thời gian
ε b) Biểu hiện xu hướng và tính quy luật của sự biến động
φ c) Là cơ sở để dự đoán mức độ tương lai của hiện tượng
γ d) Cả a), b)
η e) Cả b), c)
f) Cả a), b), c)
2) Đại lượng nào phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả:
n Z x n
Z
α
α / 2 ≤ ≤ + / 2
−
Trang 3a) Hệ số tương quan.
b) Hệ số chặn (b0 )
c) Hệ số hồi quy (b1 )
d) Cả a), b)
ϕ
3) Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
a) Độ tin cậy của ước lượng
b) Độ đồng đều của tổng thể chung
c) Phương pháp chọn mẫu
d) Cả a), b), c)
e) Không yếu tố nào cả
4) Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng khác loại:
a) Độ lệch tiêu chuẩn
b) Khoảng biến thiên
c) Khoảng tứ phân vị
d) Hệ số biến thiên
κ e) Cả a), c)
λ f) Cả a), d)
5) Biểu đồ hình cột (Histograms) không có đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện khoảng cách tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
Trang 4f) Cả a), b) và c) đều đúng
Câu 2: Bài giải:
a) Gọi độ lệch chuẩn của tổng thể chung σ = 6, Error =1,
Công thức xác định cỡ mẫu như sau:
Theo đề bài: độ tin cậy 95% nên α = 0,05 => α/2 = 0,025.
tra bảng ta có Z(α/2) = 1.960
Thay vào ta có cỡ mẫu cần tìm là:
→ n = 22 2
1
6 960 ,
b) Với n tính được bằng 138, x = 35 Gọi µ là số sản phẩm trung bình
một giờ một công nhân làm được.
Tổng thể chung có phân phối chuẩn, chưa biết phương sai của tổng thể
chung và s là độ lệch chuẩn của tổng thể mẫu thì s = 6,5.
Khoảng tin cậy được xác định theo công thức:
Với độ tin cậy 1-α = 95%, ta có α/2 = 0,025 và n - 1 =137, ta có t =1.978.
Thay vào công thức, ta có:
hay 33,906 < µ < 36,094
2
2 2
Error
Z
n
s t
x n
s t
x − α/2;(n−1) ≤ µ ≤ + α/2;(n−1)
138
5 , 6 978
, 1 35
138
5 , 6 978
, 1
Trang 5Kết luận: Với mẫu 138 đã điều tra trên, với độ tin cậy 95% thì năng suất lao động trung bình µ nằm trong khoảng từ 33,906 - 36,094 sản phẩm/giờ.
Câu 3: Bài giải:
Phương án 1(X1): 25 32 35 38 35 26 30 28 24 28 26 30 Phương án 2(X2): 20 27 25 29 23 26 28 30 32 34 38
25 30 28
Ta có:
Phương án 1:
∑
=
=
=
= n
i i
i f x n
x
1
12
357 1
i
i
x −x (x i−x)2
=
n
i i i
f x
1
=
n
i 1
(xi - x )2 = 173,5
∑
=
=
−
=
−
−
i
i x x n
S
1
2 2
1 12
5 , 173 )
( 1 1
Trang 6S1 = 15, 77 3,97=
Phương án 2:
2
1
28, 21 14
n
i i i
n =
i
i
x −x (x i−x)2
=
=
n
i i i
f x
1
=
=
−
n i
i x x
1
2 258,804 )
(
908 , 19 13
804 , 258 )
( 1
1
2
−
=
x x n
i
462 , 4 908 , 19
S
Phương án 1 Phương án 2
Do số quan sát ít, mẫu nhỏ nên ta sử dụng kiểm định t
Với độ tin cậy 95% → α = 0,05 thì t 2
2 / 2
1 +n −
n
α = t240.025 = 2,064
Trang 7Cặp giả thiết:
≠
= 2 1 1
2 1 0
:
:
µ µ
µ µ
H H
Ta có:
Phương sai S2
P =
) 1 ( ) 1 (
) 1 ( ) 1 (
2 1
2 2 2
2 1 1
− +
−
− +
−
n n
s n s n
=
2 14 12
462 , 4
* 13 97 , 3
*
− +
=> Sp = 2
p
S = 4,244
t =
2 1
2 1
1 1
n n S
X X
+
−
=
14
1 12
1 244 , 4
21 , 28 75 , 29
+
−
= 0,922
Vì t < 2,064 nên chưa đủ cơ sở bác bỏ giả thiết H0
K
ết luận: Với độ tin cậy 95% và kết quả thu được từ 2 phương án, chưa đủ cơ sở để bác
bỏ rằng chi phí trung bình theo hai phương án sản xuất có khác nhau
Câu 4: Bài giải:
1 - Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá:
Xếp thứ tự thấp đến cao theo khối lượng than khai thác:
3,0; 3,7; 3,8; 4,5; 4,5; 4,7; 4,7; 4,8; 4,9; 5,1; 5,2; 5,3; 5,3; 5,7; 6,0
6,1; 6,1; 6,2; 6,4; 6,4; 6,5; 6,6; 7,0; 7,2; 7,3; 7,3; 7,5; 7,8; 7,9; 12,3
Tập hợp số liệu theo biểu đồ thân lá
Thân Lá Tần số
Trang 812 3 <1>
2 - Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu :
Khoảng biến thiên H =
10
0 3 3 ,
12 −
= 0,93 Khoảng cách tổ bằng nhau h i =1
Giới hạn tổ: 3, 4, 5, 6, 7, 8, 9, 10, 11, 12
Ta có bảng phân bố như sau:
i
d (%)
Tần số tích lũy
i
Tổng n = 30 100
3 - Giá trị đột xuất:
Căn cứ vào biểu đồ thân lá và tần số phân bổ ta thấy trong bộ dữ liệu về
lượng than khai thác được trong 30 tháng có một giá trị đột xuất là 12,3 triệu tấn
4 - Khối lượng than trung bình trong 1 tháng:
a - Khối lượng than trung bình trong 1 tháng từ tài liệu điều tra:
1
5,99 30
n i i
n =
= ∑ = = (tấn)
Trang 9b - Khối lượng than trung bình trong 1 tháng từ bảng phân bổ tần suất là:
181
6, 03 30
i i
x f X
n
=∑ = = (tấn)
Căn cứ vào kết quả thu được ta thấy khối lượng than trung bình trong tháng tính theo bảng phân bổ tần suất có kết quả chính xác hơn vì loại được sai
số do kết quả đột biến gây ra.
Câu 5: Bài giải:
Căn cứ vào các dữ liệu của đề bài ta có bảng các giá trị sau:
QC (X)
% tăng doanh thu (Y)
Trung
Ứng dụng phần mềm ta có được những kết quả sau:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.976967
R Square 0.954465
Adjusted R Square 0.939287
Observations 5
Trang 10Regression 1 2.195270 2.195270 62.883871 0.004182
Residual 3 0.104730 0.034910
Total 4 2.3
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% 95.0% Lower Upper 95.0%
Intercept 2.0676 0.176454 11.717346 0.001336 1.506014 2.629122 1.506014 2.629122
1 Phương trình hồi quy tuyến tính: biểu hiện mối liên hệ giữa % tăng chi phí
quảng cáo và % tăng doanh thu, phân tích mối liên hệ này qua các tham số của
mô hình
Ŷ = b0 + b1X = (2,0676 + 0,3851X) (b0 = 2,0678; b1 = 0,3851)
có ý nghĩa: Mỗi khi quảng cáo tăng thêm 1% thì mô hình dự doán cho thấy
rằng doanh thu sẽ tăng thêm 0,3851%
2 Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu
thực sự có mối liên hệ tương quan tuyến tính không.
Giả thiết rằng:
H0 : b1 = 0 (% tăng chi phí quảng cáo không ảnh hưởng đến % tăng doanh
thu)
H1 : b1 ≠ 0 (% tăng chi phí quảng cáo ảnh hưởng đến % tăng doanh thu)
Tiêu chuẩn kiểm định: 1 1
1
( )
b
b t
s
β
−
=
Sai số chuẩn của hệ số:
yx 1
2 1
0,0486
i i
S S
=
−
∑
suy ra (0,3581 0)
7,930
0, 0486
t = − =
Với độ tin cậy là 95% => α = 0,05 => α/2 = 0,0025 => tα/2 ;n-2 = t0,025; 3 = 3,182
t tướng ứng với α = 0,0042 < 0,025 thuộc miền bác bỏ nên bác bỏ H0 , chấp
nhận H1
Kết luận: Có mối liên hệ tương quan tuyến tính giữa % tăng chi phí quảng
cáo và đến % tăng doanh thu.
3 Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.
Trang 11Để đánh giá cường độ của mối liên hệ, sử dụng hệ số tương quan R
Trong đó:
7205 , 1 96 , 2 96
, 2 5
8 , 14 )
x
i x
n
x x
σ σ
6782 , 0 46 , 0 46
, 0 5
3 , 2 )
2
=
=
⇒
=
=
−
y
i y
n
y y
σ σ
Thay số ta có
Kết luận: R = 0,9769 nằm trong khoảng giá trị từ -1 đến 1 và rất gần 1 cho
thấy mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu là rất chặt chẽ và đây là mối quan hệ thuận
4 Ước tính tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5% với độ tin cậy 90%.
Dự đoán tỷ lệ % tăng doanh thu nếu tỷ lệ % chi phí quảng cáo lên 5% ta sử dụng công thức:
Ŷ1 ± tα/2 ;n-2 Syx
2
2 1
1
i n i i
=
− +
−
tα/2 ;n-2 = t0,025; 3 = 3,182
Syx = 0,1868 ; n = 5 ; X =3, 2
Ŷ1 = (2,0676+0,3851*5) = 3,993 Sai số dự đoán: tα/2 ;n-2 Syx
2
2 1
1
i n i i
=
− +
−
Ta có khoảng μyx : (3,993 – 0,285) ≤ Ŷ1 ≤ (3,993 + 0,285)
x i
i
i i
b y y x x
y y x x R
σ
σ 1 2
−
−
−
−
=
∑
∑
∑
9769 , 0 6782 , 0
7205 , 1 3851 ,
=
R
Trang 123,709% ≤ Ŷ1 ≤ 4,278%
Vậy khi chi phí tăng 5% thì dự doán doanh thu nằm trong khoảng:
3,709% ≤ Ŷ 1 ≤ 4,278% với độ tin cậy 90%.
TÀI LIỆU THAM KHẢO
Giáo trình Thống kê và khoa học ra quyết định của ĐH Griggs