Đúng Vì tiêu thức thống kê chỉ đặc điểm của đơn vị tổng thể, mỗi đơn vị tổng thể có nhiều tiêu thức khác nhau, mỗi tiêu thức lại phản ánh một đặc điểm của từng đơn vị tổng thể đợc chọn r
Trang 1Bài tập cá nhân
Môn học: Thống kê và Khoa học ra quyết định
Họ và tên: Nguyễn Văn Thành – SN 1980
Lớp: M08.09
Câu I:
A Trả lời đúng (Đ) sai (S) các câu hỏi sau và giải thích tại sao?
1.1 Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu (Đúng)
Vì tiêu thức thống kê chỉ đặc điểm của đơn vị tổng thể, mỗi đơn
vị tổng thể có nhiều tiêu thức khác nhau, mỗi tiêu thức lại phản ánh một đặc điểm của từng đơn vị tổng thể đợc chọn ra từ tổng thể nghiên cứu, tiêu thức thống kê không phản ánh toàn bộ đặc điểm của cả tổng thể nghiên cứu
1.2 Tần số trong bảng phân bố tần số biểu hiện bằng giá trị tuyệt
đối (Đúng)
Vì tần suất biểu hiện bằng số tơng đối % còn tần số thì biểu hiện bằng số tuyệt đối Tần số dùng để xác nhận một trị số nhất định trong tổng thể vì vậy nó biểu hiện bằng số tuyệt đối
1.3 Độ lệch chuẩn là chỉ tiêu tơng đối cho phép so sánh độ biến thiên về tiêu thức nghiên cứu của hai hiện tợng khác loại (Sai)
Độ lệch chuẩn là một trong các chỉ tiêu so sánh độ biến thiên của hiện tợng cùng loại và số trung bình bằng nhau Còn các hiện tợng khác loại hoặc các hiện tợng cùng loại không bằng nhau thì đợc dùng hệ số biến thiên
Trang 21.4 Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ nghịch với phơng sai của tổng thể chung đó (Sai)
Vì Theo công thức
n Z x n
Z
2 / 2
của tổng thể chung càng nhỏ dẫn đến khoảng tin cậy cho tham số của tổng thể chung càng nhỏ nên khoảng tin cậy của tổng thể chung
tỷ lệ nghịch với phơng sai của tổng thể chung là sai
1.5 Hệ số hồi quy (b1) phản ánh chiều hớng và mức độ ảnh hởng của tiêu thức nguyên nhân đến tiêu thức kết quả (Đúng)
Vì khi biến giải thích thay đổi 1 đơn vị thì biến kết quả thay đổi
b1 đơn vị và ngợc lại Nên b1 phản ánh chiều hớng và mức độ ảnh hởng của tiêu thức nguyên nhân đến tiêu thức kết quả
B Chọn phơng án trả lời đúng nhất:
1> phân tích dãy số thời gian có tác dụng:
a) Phân tích đặc điểm biến động của hiện tợng qua thời gian b) Biểu hiện xu hớng và tính quy luật của sự biến động
c) Là cơ sở để dự đoán mức độ tơng lai của hiện tợng
d) Cả a), b)
e) Cả b), c)
f) Cả a), b), c).
2> Đại lợng nào phản ánh mức độ ảnh hởng của tiêu thức nguyên nhân đến tiêu thức kết quả:
a) Hệ số tơng quan
b) Hệ số chặn (b0)
d) Cả a), b)
Trang 3e) Cả a), c).
3> Các yếu tố ảnh hởng đến số lợng đơn vị tổng thể mẫu:
a) Độ tin cậy của ớc lợng
b) Độ đồng đều của tổng thể chung
c) Phơng pháp chọn mẫu
d) Cả a), b), c)
e) Không yếu tố nào cả
4> Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tợng khác loại:
a) Độ lệch tiêu chuẩn
b) Khoảng biến thiên
c) Khoảng tứ phân vị
d) Hệ số biến thiên
e) Cả a), c)
f) Cả a), d)
5> Biểu đồ hình cột (Histograms) không có đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện khoảng cách tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
Câu II:
a> Đặt độ lệch chuẩn của tổng thể chung là δ = 6 ; Error = 1
Trang 4Ta có công thức cỡ mẫu: n = 2 22
Error
Z δ
Độ tin cậy 95% -> α =0,05⇒α/2=0,025
Tra bảng Z = (α/ 2) = 1.960
Với các số liệu trên 138
1
6 960 , 1
2
2 2
=
=
b> Đặt à là số sản phẩm trung bình một giờ một công nhân làm đợc
S là độ lệch chuẩn của tổng thể mẫu
Theo câu (a) ta có n = 138
x= 35 s = 6,5
Ta có công thức tính khoảng tin cậy:
n
S t
x n
S
t
x− α/2(n−1) ≤à ≤ + α/2(n−1)
Thay các số liệu vào công thức: n= 138 n-1 = 137; độ tin cậy 1-α
= 95% α/2=0,025; t = 1.978.
138
5 , 6 978 , 1 35 138
5 , 6 978 , 1
35− ≤à ≤ + 33,906≤à ≤36,094
* Vậy : Điều tra nghiên cứu 138 mẫu công nhân với độ tin cậy
95% thì: năng suất lao động trung bình à khoảng từ 33,906 36,094
Câu III: * Theo bài ra ta có:
Trang 5> Ph¬ng ¸n 1:
25 32 35 38 35 26 30 28 24 28 26 30
29,75
12
357
1∑ = =
= x i f i n x
i
n = 12
∑
=
=
n
i 1
357 ( )2 173,5
1
=
−
∑
=
x x
n i i
1 12
5 , 173 )
( 1
1
2
−
=
−
−
−
x x n
n i
S1 = 15,77 =3,97
> Ph¬ng ¸n 2 (X2):
20 27 25 29 23 26 28 30 32 34 38 25
30 28
14
395 1
1
=
n i i
i f x n x
i
Trang 620 1 20 -8,21 67,404
n = 14
395
1
=
∑
n
f
1
=
−
∑
=
x x
n
13
804 , 258 )
( 1
1
2
−
=
x x n
i i
S2 = 19,91=4,46
* Ta có bảng sau:
Phơng án 1 Phơng án 2
Theo dữ liệu đề bài ta dùng kiểm định t là phù hợp
Trang 7α =0,05 24 2,064
025 , 0
2 2 / 2
1 + − =t =
t n n
α
* Ta có cặp giả thiết::
≠
= 2 1 1
2 1 0
:
:
à à
à à
H H
1 14 1 12
46 , 4
* 13 97 , 3
* 11 )
1 ( ) 1 (
) 1 ( ) 1
2 1
2 2 2
2 1 1
− +
−
+
=
− +
−
− +
−
=
n n
s n s n
S p
S p = S p2 =4,24
14
1 12
1 24 , 4
21 , 28 75 , 29 1 1
2 1
2
+
−
= +
−
=
n n S
X X t
* Vậy t = 0,921 < 2,064 kết quả thu đợc từ 2 phơng án cha đủ cơ
sở để bác bỏ chi phí trung bình theo hai phơng án sản xuất là khác nhau với độ tin cậy 95%
Câu IV:
a> Tập hợp số liệu đợc biểu diễn theo sơ đồ thân lá nh sau:
* Sắp xếp thứ tự từ thấp đến cao: 3,0; 3,7; 3,8; 4,5; 4,5; 4,7; 4,7;
4,8; 4,9; 5,1; 5,2; 5,3; 5,3; 5,7; 6,0; 6,1; 6,1; 6,2; 6,4; 6,4; 6,5; 6,6; 7,0; 7,2; 7,3; 7,3; 7,5; 7,8; 7,9; 12,3
* Bảng biểu thân lá:
Thâ
b> Bảng tần số phân bố:
Trang 8* Ta có: Khoảng biến thiên: H = 0,93
10
0 , 3 3 ,
12 − = Khoảng cách tổ: h i =1 Giới hạn tổ: 3, 4, 5, 6, 7, 8, 9,
10, 11, 12
i
(%)
1
d
Tần số tích lũy S i
Tần số tích lũy %
9 tấn – 10
10 tấn – 11
11 tấn – 12
12 tấn – 13
c> Giá trị đột xuất: Nhìn vào biểu đồ thân lá ta thấy số liệu đột xuất là: 12,3
d > Khối lợng than trung bình trong 1 tháng:
* Khối lợng than trung bình từ dữ liệu điều tra:
99 , 5 30
8 , 179 1
1
=
=
= ∑
=
n
i
i
x
n
* Khối lợng than trung bình dựa vào bảng phân phối tần suất:
03 , 6 30
181
= ∑
=
n
X
n
Vậy hai kết quả khác nhau do khối lợng than trung bình từ dữ liệu
điều tra không chính xác bằng kết quả dựa vào bảng phân phối tần suất vì nó loại đợc số liệu do đột biến
Trang 9C©u V:
* Theo bµi ra ta cã b¶ng sè liÖu sau:
N 0
% t¨ng chi phÝ
QC (X)
% t¨ng doanh
Trung
* Sö dông b¶ng tÝnh Excel ta cã:
SUMMARY OUTPUT
Regression Statistics
ANOVA
Significa nce F
62.88387
1
0.00418
2
Coefficient s
Standard Error t Stat P-value
Lower 95%
Upper 95%
Lower 95.0%
Upper 95.0%
1.50601
4 2.629122 1.506014 2.629122
1> X©y dùng m« h×nh håi quy tuyÕn tÝnh biÓu hiÖn mèi quan hÖ
gi÷a % t¨ng chi phÝ qu¶ng c¸o vµ % t¨ng trëng doanh thu:
Trang 10Phơng trình hồi quy có dạng:
% tăng doanh thu = b0 + b1 % tăng chi phí quảng cáo
b1 = 0,3851; b0 = 2,067 Vậy phương trình hồi quy tuyến tính có dạng:
) 3851 , 0
; 0678 , 2 (b0 = b1=
Ŷ = b0 + b1X = (2,0676 + 0,3851X)
) 3851 , 0
;
0678
,
2
(b0 = b1=
Giải thích ý nghĩa:
Khi quảng cáo tăng thêm 1% thì doanh thu tăng 0,385%
2> Kiểm định xem liệu % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối liên hệ tơng quan tuyến tính không:
* Ta kiểm định cặp giả thiết:
0 : 1
0 b =
H (chi phí quảng cáo tăng % không ảnh hởng đến % tăng
doanh thu)
0 : 1
1 b ≠
H (chi phí quảng cáo tăng % ảnh hởng đến % tăng doanh thu)
Ta lựa chọn tiêu chuẩn kiểm định T:
1
1
(
b
s
b
t= −β
0,0486
) (
1
−
=
∑
=
n
yx b
X X
S S
7,930
0486 , 0
) 0 3581 , 0 ( − =
=
t
Ta lại có độ tin cậy 95% => α =0,05 => α/2=0,0025
=> tα/2;n−2=t0,025;3 =3,182
α =0,0042<0,025 bác bỏ H0
Vậy ta kết luận % tăng chi phí quảng cáo có ảnh hởng đến tăng % doanh thu
3> Đánh giá cờng độ của mối liên hệ và sự phù hợp của mô hình:
* Ta dùng hệ số tơng quan R theo công thức sau:
Trang 11x i
i
i
y y x
x
y y x x R
σ
σ 1 2
) (
) )(
(
=
−
−
−
−
=
5
8 , 14 ) ( 2
x
i x
n
x x
σ σ
5
3 , 2 ) ( 2
y
i y
n
y y
σ σ
6782 , 0
7205 , 1 3851 ,
=
R
* Theo kết quả tính toán trên với R = 0,977 rất gần 1 cho thấy
giữa % tăng chi phí quảng cáo và % tăng doanh thu có mối quan hệ rất chặt chẽ với nhau
4> Ước tính dự đoán tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5% với độ tin cậy 90%:
* Dựa vào công thức ớc lợng khoảng tin cậy cho sau ta có:
∑
=
−
−
− +
i i
i yx
n
X X
X X n S t
Y
1
2
; 2 / 1
) (
) (
1 ˆ
α
182 , 3
3
; 025 , 0 2
;
2
/ − =t =
tα n
2 , 3
; 5
; 1868 ,
0 = =
S yx
933 , 3 ) 5
* 3851 , 0 0676 , 2
(
ˆ
Y
285 , 0 ) (
) (
1
1
2
2 2
;
2
−
− +
∑
=
i i
i yx
n
X X
X X n S
tα
) 285 , 0 993 , 3 ( ˆ ) 285 , 0 993 , 3 ( − ≤ 1≤ +
yx
à
3,709%≤Yˆ1≤4,278%
* Vậy với độ tin cậy 90% nếu chi phí quảng cáo tăng 5% thì dự
đoán doanh thu nằm trong khoảng: 3,709%≤Yˆ1≤4,278%