Vì liên hệ tương quan giữa hai chỉ tiêu là mối liên hệ ước tính từ một tập chuỗi các cặp quan sát của hai chỉ tiêu này, chứ không phải trên từng đơn vị cá biệt.. Mối quan hệ ràng buộc lẫ
Trang 1CHƯƠNG TRÌNH ĐÀO TẠO THẠC SĨ QUẢN TRỊ KINH DOANH QUỐC TẾ
LỚP GaMBA.X0410 BÀI TẬP CÁ NHÂN Môn THỐNG KÊ VÀ KHOA HỌC RA QUYẾT ĐỊNH
DÀNH CHO NHÀ QUẢN LÝ
Kính gửi: Quản lý lớp GaMBA.X0410
Giảng viên bộ môn
Người thực hiện: Phan Thị Ngọc Yến.
BÀI LÀM
Câu 1 Lý thuyết
1 Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
a Liên hệ tương quan là mối liên hệ biểu hiện rõ trên từng đơn vị cá biệt.
Trả lời: Sai
Vì liên hệ tương quan giữa hai chỉ tiêu là mối liên hệ ước tính từ một tập chuỗi các cặp quan sát của hai chỉ tiêu này, chứ không phải trên từng đơn vị
cá biệt
Mối quan hệ ràng buộc lẫn nhau giữa hai hay nhiều đại lượng hay biến số, trong đó sự biến động của một hay nhiều đại lượng này sẽ dẫn đến sự chi phối của đại lượng kia Trong đó mối liên hệ giữa hai đại lượng là tương quan đơn
và mối liên hệ giữa ba đại lượng trở lên là tương quan bội hay tương quan nhiều chiều Liên hệ tương quan giữa các đại lượng được phát hiện và đo lường bằng các phương pháp đồ thị; lập bảng tương quan; xây dựng các hàm
số tương quan; tính toán các hệ số tương quan
b Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối.
Trả lời: Đúng.
Tần số là số lần xuất hiện của các lượng biến nên luôn luôn là một số tuyêt đối, còn tần suất được biểu hiện bằng số tương đối với đơn vị tính là lần hoặc
% Tổng của các tần số sẽ phải đúng tổng số quan sát
c. Phương sai cho phép so sánh độ biến thiên của tiêu thức nghiên cứu của hai hiện tượng khác loại.
Trả lời: Sai.
Vì muốn so sánh độ biến thiên của hai hiện tượng khác loại, chúng ta phải sử dụng Hệ số biến thiên được tính bằng tỷ số giữa độ lệch chuẩn với giá trị bình quân Bởi nếu so sánh giữa các phương sai của các hiện tượng khác loại, thì phương sai của những hiện tượng có giá trị quan sát lớn hơn có thể sẽ lớn hơn
về trị tuyệt đối, nhưng về quy mô biến thiên tương đối so với giá trị bình quân thì có thể lại nhỏ hơn
Các chỉ tiêu khác nhau sẽ có quy luật phân phối và độ biến thiên khác nhau, tức là có phương sai khác nhau Và do vậy, mỗi chỉ tiêu tính ra sẽ có một cỡ
Trang 2mẫu riêng (mặc dù yêu cầu về độ tin cậy (φt) của các chỉ tiêu điều tra như t) của các chỉ tiêu điều tra như nhau) Nói cách khác, có bao nhiêu chỉ tiêu điều tra thì phải tính bấy nhiêu cỡ mẫu, sau đó sẽ chọn ra cỡ mẫu lớn nhất dùng chung cho điều tra tất cả các chỉ tiêu Với nhiều cỡ mẫu đòi hỏi phải tính nhiều phương sai nên công việc tính toán càng trở nên phức tạp, tốn nhiều công sức, khó thực hiện
Hệ số biến thiên được biểu hiện bằng số tương đối có được từ so sánh giữa độ lệch tiêu chuẩn và trung bình cộng Hệ số biến thiên có thể dùng để so sánh giữa các tiêu thức khác nhau của hai hiện tượng khác nhau nhưng có liên quan
d Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ nghịch với phương sai của tổng thể chung đó
Trả lời: Sai
Vì khoảng tin cậy được tính theo công thức: x Z n x Z n
/ 2 / 2
Ứng với một độ tin cậy nhất định (Z không đổi), khi phương sai tăng sẽ làm tăng khoảng tin cậy Vì vậy, khoảng tin cậy cho tham số của tổng thể chung
tỷ lệ thuận với phương sai của tổng thể
e. Hệ số hồi quy (b 1 ) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả
Trả lời: Đúng
Do Hệ số hồi quy (b1) là hệ số góc, cho biết giá trị trung bình của biến phụ thuộc Y sẽ thay đổi (tăng or giảm) bao nhiêu đơn vị khi giá trị của biến độc lập X tăng 1 đơn vị với điều kiện các yếu tố khác không thay đổi
2 Chọn phương án trả lời đúng nhất:
1) Phân tích dãy số thời gian có tác dụng:
a) Phân tích đặc điểm biến động của hiện tượng qua thời gian.
b) Biểu hiện xu hướng và tính quy luật của sự biến động
c) Là cơ sở để dự đoán mức độ tương lai của hiện tượng.
d) Cả a), b).
e) Cả b), c).
f) Cả a), b), c).
Đáp án F
2) Đại lượng nào phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả:
a) Hệ số tương quan.
b) Hệ số chặn (b0)
c) Hệ số hồi quy (b 1 ).
d) Cả a), b).
e) Cả a), c).
Đáp án C.
3) Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
a) Độ tin cậy của ước lượng.
Trang 3c) Phương pháp chọn mẫu.
d) Cả a), b), c).
e) Không yếu tố nào cả
Đáp án D.
4) Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng khác loại:
a) Độ lệch tiêu chuẩn
b) Khoảng biến thiên
c) Khoảng tứ phân vị
d) Hệ số biến thiên
e) Cả a), c)
f) Cả a), d)
Đáp án F
5) Biểu đồ hình cột (Histograms) không phải là đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện khoảng cách tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng.
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
Đáp án D.
Câu 2
Một phương pháp bán hàng mới theo đơn đặt hàng đang được xem xét để đánh giá tính hiệu quả của nó Phỏng vấn ngẫu nhiên 30 khách hàng được bán hàng theo phương pháp mới và ghi lại số ngày từ khi đặt hàng đến khi giao hàng như sau:
8
5
3
9
4
6 5 10 7 6
6 7 6 4 8
9 6 6 4 5
7 6 7 5 4
6 7 4 7 3 Hãy ước lượng số ngày trung bình từ khi đặt hàng đến khi giao hàng khi bán hàng theo phương pháp mới với xác suất tin cậy 95% Hãy kết luận
về hiệu quả của phương pháp bán hàng mới so với phương pháp cũ Biết rằng phương pháp bán hàng cũ có số ngày trung bình từ khi đặt hàng đến khi giao hàng là 7 ngày
Bài giải.
Số ngày giao hàng
Standard Error 0,3216
Standard Deviation 1,7617
Sample Variance 3,1034
Trang 4Minimum 3
1 Ước lượng khoảng tin cậy:
Do số mẫu quan sát là 30, nên ta chọn công thức ước lượng khoảng tin cậy như sau:
Với:
Z/2=1,959964 (xác định bằng hàm NORMSDIST trong Excel)
1,7617
* 96 , 1 6 30
1,7617
*
96
,
1
5,3696 6,6304
||xx=x0,630391
x=0,630391 (tính toán bằng hàm CONFIDENCE trong Excel)
Do đó, với độ tin cậy 95%, số ngày bình quân từ khi đặt hàng đến giao hàng là 5,3696 đến 6,6304 ngày
µ0 = 7 ngày nằm ngoài khoảng tin cậy
2 Ki ểm định số ngày trung bình từ khi đặt hàng đến khi giao hàng
Cặp giả thiết kiểm định là: H0: µ0 = 7 ngày
H1: µ0 < 7 ngày Với:
x = 6 ngày
S x = 1,7617 ngày
µ0 = 7 ngày
n = 30
α=1-95%=5%;
Z =
n
x
0
=
30 1,7617
7
6
= -3,10913
3 Xác định miền bác bỏ hay chấp nhận H 0 :
Z = -3,10913< - Zα = - Z2,5%= - 1,959964 (xác định bằng hàm NORMSDIST trong Excel)
Bác bỏ với =5% Với mẫu đã điều tra đủ cơ sở để bác bỏ H0, không chấp nhận H0 (có nghĩa là µ < 7 ngày)
4 Xác định p-value.
P-value/2=P(T<-3,10913)=P(T>3,10913)= 0,00209 (bằng cách dùng hàm TDIST trong Excel)
P-value= 0,004181=0,42%
Giả thiết H0 sẽ bị bác bỏ ở bất kỳ giá trị nào của 0,42%
Với =5%>0,42%, giả thiết H0 bị bác bỏ và chấp nhận giải thiết H1
Trang 55 Kết luận:
Với mức ý nghĩa 5%, có thể kết luận rằng số ngày trung bình từ khi đặt
hàng đến khi giao hàng nhỏ hơn 7 ngày
Câu 3
Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản phẩm Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay không người ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
P/A
1
2
5
3
2 35
3
8 35 26 30
2
8 24 28 26
3
4 28 27 26
P/A
2
2
0
2 7
25 2 9
23 26 28 3
0
32 34 38 2
5
30 24 27 28
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn Với độ tin cậy 95% hãy rút ra kết luận về hai phương án trên
Lời giải
Standard Error 1,112127 Standard Error 1,098768
Standard Deviation 4,307247 Standard Deviation 4,395073
Sample Variance S12 18,55238 Sample Variance S22 19,31667
1 Giá trị bình quân:
Phương án 1 là 29,47 còn của Phương án 2 là 27,88
2 Phương sai mẫu hiệu chỉnh:
Phương án 1 là 18,55 còn Phương án 2 là 19,32
Do cỡ mẫu nhỏ hơn 30 nên chúng ta phải sử dụng kiểm định đối với mẫu nhỏ
3 Chúng ta tiến hành kiểm định xem chi phí trung bình của hai
phương án có thực sự khác nhau không.
Cặp giả thiết kiểm định là: H0: 1 = 2
H1: 1 ≠ 2
4 Ước lượng kết hợp của phương sai tổng thể được tính:
1 12 2 22 2
1 2
2
p
s
n n
= (15-1)*18,5515 16(162-1)*19,32
=18,9477
5 Giá trị thống kê t được xác định như sau:
2 1 1 1
) (
n n s
X X
=
2 1 2
2 1 1 1
*
) (
n n s
X X
p
16
1 15
1
* 18,9477
) 27,875
-29,46667 (
= 1,017416
Trang 6Giá trị ngưỡng của thống kê t với số bậc tự do là n1+n2-2=15+16-2=29 và mức
ý nghĩa =1-95%=5%; /2=2,5%; tra hàm TINV trong Excel
t/2; n1+n2-2= t2,5%; 29= 2,363846
6 Xác định miền bác bỏ hay chấp nhận H 0 :
t=1,017416 < t/2; n1+n2-2= 2,363846
Chấp nhận giải thiết H0
7 Xác định p-value.
P-value/2=P(T<-2,363846)=P(T>2,363846)= 0,16310829 (bằng cách dùng hàm TDIST trong Excel)
P-value= 0,326217=32,62% > 5%
Giả thiết H0 sẽ bị bác bỏ ở bất kỳ giá trị nào của 32,62%
Với =5%<32,62%, ta chấp nhận giả thiết H0
8 Kết luận:
Với mức ý nghĩa 5%, có thể kết luận rằng chi phí trung bình theo hai phương án là tương đương nhau
Câu 4.
Có tài liệu về doanh thu của một doanh nghiệp trong 10 năm như sau: Năm Doanh thu (tỷ đồng)
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
25 26 28 32 35 40 42 50 51 54
1 Xác định hàm xu thế tuyến tính biểu diễn xu hướng biến động của doanh thu qua thời gian.
Năm t Doanh thu (tỷ đồng)
Đặt Phương trình hồi quy có dạng:
Trang 7Trong đó:
Yi: Doanh thu (tỷ đồng) - biến phụ thuộc;
Xi: Số năm t - là biến độc lập;
Sử dụng Excel hồi quy bằng hàm Regression, trong đó hồi quy biến phụ thuộc
Yi, và các biến độc lập là Xi Ta có bảng hồi quy sau:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,988855
Adjusted R Square 0,975063
Standard Error 1,702494
ANOVA
Regression 1 1022,912 1022,912 352,9127 6,66E-08 Residual 8 23,18788 2,898485
Coefficient s
Standar
d Error t Stat P-value
Lower 95%
Upper 95%
Intercept 18,93333 1,163025 16,27939 2,04E-07 16,25139 21,61527
t 3,521212 0,187438 18,78597 6,66E-08 3,088978 3,953446
Kết quả Phương trình hồi quy có dạng:
Y i = 18,93333+ 3,5212*X i
b1 = 3,5212: Khi thời gian tăng thêm 1 năm thì mô hình dự đoán tăng
khoảng 3,5212 (tỷ đồng)
Kiểm định mối liên hệ tuyến tính giữa biến độc lập X i là thời gian với Y i
là Doanh thu:
Cặp giả thiết kiểm định là: H0: β1 = 0 ( Không có mối liên hệ tuyến tính)
H1: β1 ≠ 0 (Có mối liên hệ tuyến tính)
Tra bảng kết qủa t -Stat cho biến độc lập Xi ta được t- Stat = 18,78597
Sử dụng hàm TINV trong Excel tra t α/2;n-2 = t2,5%;8 = 2,75152
Trang 8 Xét t - Stat >tα/2;n-2 , thuộc miền bác bỏ, nên bác bỏ giả thiết H0, chấp nhận giả thiết H1
Kết luận: Có mối liên hệ tuyến tính ý nghĩa giữa thời gian và Doanh thu.
Xác định các hệ số hồi quy cho tổng thể chung và giải thích ý nghĩa.
Từ bảng tính Regression Statistics trong Excel (cột Lower 95% và Upper 95%), ta có ước lượng các hệ số hồi qui của tổng thể chung:
β1: Với mức tin cậy 95%, khoảng tin cậy cho độ dốc β1 là (3,088978; 3,953446), không bao gồm 0
Vậy có mối liên hệ tuyến tính ý nghĩa giữa thời gian và Doanh thu
Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình.
Hệ số xác định:
R2 = 0,977834, Nghĩa là 97,7834% sự thay đổi trong Doanh thu là do ảnh hưởng của nhân tố thời gian
Hệ số tương quan:
R = 0,975063 Nên giữa Yi, Doanh thu, và biến Xi thời gian có mối quan
hệ tương quan tuyến tính thuận và rất chặt chẽ
2 Xác định sai số của mô hình và dự đoán doanh thu năm 2011 dựa vào mô hình trên với xác suất tin cậy 95%.
i i
i yx
n i
X X
X X n S
t Y
1
2
2
* 2
;
1 1
ˆ
Trong đó:
Yˆ i =Yˆ 11 = 18,93333+ 3,5212*11= 57,66666667
Syx=1,702494 (tra trong bảng kết quả hồi quy=Standard Error);
n=10,
i =11
t α;n-2 = t5%;8 = 2,3060
X
X i =(11-5,5)2=30,25
n
i
X
1
2 =82,5 Thay số vào công thức tính được khoảng tin cậy của Yˆ 11 là:
57,66667±4,754571
Tương đương: 57,66667-4,754571< Yˆ 11<57,66667+4,754571
Hay: 52,9121 < Yˆ 11<62,4212
Kết luận: Với độ tin cậy 95%, doanh thu sẽ tăng trong khoảng từ (52,9121;
62,4212)
Câu 5.
Dưới đây là dữ liệu về khối lượng sản phẩm thép trong 30 tháng gần đây của một nhà máy (đơn vị: triệu tấn)
Trang 95,2 4,5 7,8 6,0 6,5 4,7
1 Xây dựng biểu đồ thân lá và bảng tần số phân bố với 5 tổ có khoảng cách tổ bằng nhau
2 Tính trung bình từ dãy số liệu ban đầu và từ bảng phân bố tần số So sánh kết quả và giải thích sự khác nhau (nếu có)
Lời giải
1 Xây dựng biểu đồ thân lá và bảng tần số phân bố với 5 tổ có khoảng cách tổ bằng nhau.
Biểu đồ thân lá
Xây dựng bảng tần số phân bố với 5 tổ có khoảng cách tổ bằng nhau
h = (7,9 – 3,0)/5 = 0,98
Bin Frequenc
y
Cumulative %
Trang 106,92 7 75,86%
2 Tính trung bình từ dãy số liệu ban đầu và từ bảng phân bố tần số So sánh kết quả và giải thích sự khác nhau
Bảng tần số phân bố
Khối lượng sản
phẩm
Trị số giữa (x i )
Tần số (f i )
Tần suất Tích (x i f i )
Giá trị trung bình từ dãy số liệu ban đầu là
30
1
xi / n =5,693333 Giá trị trung bình tính theo bảng phân bố tần số:
x2 = ∑ xifi/∑fi = 173,0/30= 5,7667
3 Nhận xét:
Một nửa số liệu nhỏ hơn trung bình của khoảng tổ mà nếu ta lấy số trung bình tính sẽ ra kết quả lớn hơn
Trung bình tính theo bảng phân bố tần số Lớn hơn Giá trị trung bình Từ các số liệu đầu tiên, lý do là trọng số của Từ 6 đến dưới 7 và Từ 7 đến dưới 8 là 26,67% và 23,33% (tương đương 50%) trong khi phần lá của chúng đa phần nằm dưới 0,5
Tài liệu tham khảo.
Bài giảng môn Thống kê và Khoa học Quyết định - của Chương trình Đào tạo Thạc sỹ QTKD Quốc tế – Đại học Griggs Hoa Kỳ
Tài liệu Thống kê trong Kinh doanh - của Chương trình Đào tạo Thạc sỹ QTKD Quốc tế – Đại học Griggs Hoa Kỳ
Giáo trình Nguyên lý thống kê Kinh tế - của Trưởng Đại học Kinh tế Thành phố Hồ Chí Minh