Hãy tính trung bình mẫu: Từ số liệu ban đầu, gọi X là trung bình mẫu cần tìm, theo các công thức tính toán trung bình mẫu, với hai giá trị cận dưới và cận trên của khoảng tin cậy, ta có
Trang 1BÀI TẬP CÁ NHÂN
THỐNG KÊ TRONG KINH DOANH & QUYẾT ĐỊNH CỦA NHÀ QUẢN LÝ
Họ và tên: Hoàng Hồng Hạnh
Giảng viên: Ts Nguyễn Mạnh Thế
Trang 2BÀI TẬP CÁ NHÂN Trả lời các câu hỏi sau đây, giải thích rõ cách làm
1 Diện tích nằm dưới đường mật độ của phân phối chuẩn hóa và giữa hai điểm 0 và –1.75:
Sử dụng chương trình Megastat, mật độ phân phối chuẩn giữa hai điểm 0 và -1,75 được thể hiện theo hình vẽ dưới đây:
Như vậy, diện tích phần nằm dưới đường mật độ của phân phối chuẩn hóa và giữa hai điểm 0 và –1.75 có thể xác định theo giá trị cận dưới hoặc cận trên sẽ bằng:
0,5000 – 0,0401 = 0,9599 – 0,5 = 0,4599
2 Chỉ số IQ có phân phối chuẩn với trung bình là 100 và độ lệch chuẩn là 16 Gọi chỉ số IQ
là 1 biến ngẫu nhiên X, tính P (68 < X < 132):
Tương tự, sử dụng công cụ MegaStat, ta có thể biểu diễn tính toán theo hình vẽ dưới đây:
Trang 3Khi đó xác suất cũng là diện tích giới hạn bởi đường mật độ, trục hoành và các đường x=68, x=132
Theo kết quả chạy mô hình ta có:
P (68 < X < 132) = 0,9772 – 0,0228 = 0,9544
3 Nếu độ tin cậy giảm đi, khoảng tin cậy sẽ rộng hơn hay hẹp lại?
Độ tin cậy của một mô tả thống kê được xác định bằng chỉ số 1-α Khi độ tin cậy giảm đi tương ứng với giá trị của α tăng lên
Khoảng tin của một ước lượng thông thường có dạng:
( ) ( )2
1
2 /
2 /
n Z X
n Z X
σ
σ α
α
− +
Trong công thức xác định khoảng tin cậy của ước lượng, bên cạnh các chỉ số độ lệch chuẩn σ và quy mô mẫu n là những yếu tố được cố định Ta thấy khoảng tin cậy còn phụ thuộc vào biến số
Zα/2
Ứng với trường hợp độ tin cậy giảm, mức ý nghĩa thống kê α tăng lên thì giá trị Zα/2 sẽ giảm đi Như vậy, độ rộng của khoảng tin cậy sẽ bị co hẹp lại
Kết luận lại: Khi
4 Giả sử khoảng tin cậy cho trung bình tổng thể là từ 62.84 đến 69.46 Biết σ = 6.50 và kích thước mẫu n=100 Hãy tính trung bình mẫu:
Từ số liệu ban đầu, gọi X là trung bình mẫu cần tìm, theo các công thức tính toán trung bình mẫu, với hai giá trị cận dưới và cận trên của khoảng tin cậy, ta có hệ phương trình sau:
( ) ( )2 84
62
1 46
69
2 /
2 /
=
−
= +
n Z X
n Z X
σ
σ α α
Thực ra, trong công thức này, chúng ta không cần các giả thiết về độ lệch chuẩn và kích thức
mẫu Từ hệ phương trình vừa lập, ta có 2 X = 69,46+62,84 = 132,30 hay X = 66,15
5 Giá trị p-value nào sau đây sẽ dẫn đến việc bác bỏ giả thiết H0 nếu α= 0.05?
a 0.150 b 0.100 c 0.051 d 0.025
Ta có giả thiết H0 bị bác bỏ khi có một giá trị p-value nhỏ hơn mức ý nghĩa thống kê Như vậy, đáp án d với p-value = 0.025 sẽ dẫn tới việc bác bỏ giả thiết H0 với mức ý nghĩa α= 0.05
Trang 4Hoàn thành các bài tập sau đây
Bài 1
Một phương pháp bán hàng mới theo đơn đặt hàng đang được xem xét Để đánh giá tính hiệu quả của nó xét về mặt thời gian người ta phỏng vấn ngẫu nhiên 30 khách hàng đư ợc bán hàng theo phương pháp mới và ghi lại số ngày từ khi đặt hàng đến khi giao hàng như sau:
9
5
3
9
4
6 5 10 7 6
8 7 6 5 8
9 6 6 4 5
7 6 7 5 4
6 7 4 7 3
Hãy ước lượng số ngày trung bình từ khi đặt hàng đến khi giao hàng khi bán hàng theo phương pháp mới với độ tin cậy 95% Hãy kết luận về hiệu quả của phương pháp bán hàng mới
so với phương pháp cũ Biết rằng phương pháp bán hàng cũ có số ngày trung bình từ khi đặt hàng đến khi giao hàng là 7,5 ngày
Bài làm
Ta sử dụng công cụ thống kê Megastat với hai chức năng Descriptive Statistic và vẽ đồ thị hộp ria mèo, ta sẽ thu được kết quả sau:
Descriptive statistics
# 1
confidence interval 95.% lower 5.456
confidence interval 95.% upper 6.810
Trang 56,81 ngày (95% upper) nhỏ hơn so với giá trị 7,5 ngày của phương pháp cũ Như vậy, phương pháp mới có hiệu quả hơn so với phương pháp cũ
Bài 2
Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản phẩm Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay không người ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
Phương án 1: 25 32 35 38 35 26 30 28 24 28 26 30
Phương án 2: 20 27 25 29 23 26 28 30 32 34 38 25 30 28 Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn Với mức ý nghĩa 5% hãy rút ra kết luận về hai phương án trên
Bài làm
Sử dụng phần mềm MegaStat để chạy các dữ liệu đã có với hai chức năng mô tả thống
kê và vẽ đồ thị hộp ria mèo, ta có:
Descriptive statistics
Trang 6Từ sơ đồ hộp ria mèo, ta có thể thấy chưa thể kết luận ngay về chi phí hai phương án, do khoảng tin cậy cho chí phí sản xuất của phương án B có phần nằm trong và cũng có phần nằm ngoài khoảng tin cậy của chi phí sản xuất phương án A
Ta sẽ có thêm kiểm định để xác định mối liên hệ giữa chi phí sản xuất của hai phương án này:
Gọi X là chi phí sản xuất của phương án 1
Gọi Y là chi phí sản xuất của phương án 2
Ta có các giả thuyết kiểm định sau:
Ho: µx = µy
H1: µx # µy
Bên cạnh phần mềm MegaStat, trong excel cũng đã tích hợp sẵn các công cụ phân tích
dữ liệu, ta cũng có thể sử dụng các tools này Cụ thể, do số mẫu của hai ước lượng X và Y là không tương đồng, ta sẽ dùng hàm Tool/Data/Analysis/ t-Test: Two-Sample Assuming Unequal Variances
Kết quả chạy mô hình như sau:
Variable 1 Variable 2
Hypothesized Mean Difference 0
P(T<=t) one-tail 0.197722414
t Critical one-tail 1.710882067
P(T<=t) two-tail 0.395444828
t Critical two-tail 2.063898547
Từ bảng excel ta có:
Trang 7Giá trị kiểm định t =
) 1 1 (
2 1
2
n n S
Y X
p +
−
=
) 14
1 12
1 ( 438 20
21 , 28 75 , 29
+
−
= 0.8659
Với α = 0,05; bậc tự do df = 24 ta có: t0,05,24 = 1.711
| t | = 0.8659 < tα;n1+n2-2 = 1.711 nên không có cơ sở bác bỏ giả thiết H0 Nói cách khác, chưa đủ
cơ sở để khẳng định sự khác biệt về chi phí sản xuất giữa hai phương án
Bài 3: Một loại thuốc chữa bệnh chứa bình quân 247 parts per million (ppm) của một loại hoá
chất xác định Nếu mức độ tập trung lớn hơn 247 ppm, loại thuốc này có thể gây ra một số phản ứng phụ; nếu mức độ tập trung nhỏ hơn 247 ppm, loại thuốc này có thể sẽ không có hiệu quả Nhà sản xuất muốn kiểm tra xem liệu mức độ tập trung bình quân trong một lô hàng lớn có đạt mức 247 ppm yêu cầu hay không Một mẫu ngẫu nhiên gồm 60 đơn vị được kiểm nghiệm và người ta thấy rằng trung bình mẫu là 250 ppm và độ lệch chuẩn của mẫu là 12 ppm
Bài làm
a Hãy kiểm định rằng mức độ tập trung bình quân trong toàn bộ lô hàng là 247 ppm với mức ý nghĩa α = 0.05 Thực hiện điều đó với α=0.01
Mức độ tập trung trung bình quy định của hóa chất trong thuốc là µ0 = 247 ppm
Mức độ tập trung trung bình thực tế sản xuất là µ chưa biết
Ta đặt giả thuyết: Ho: µ = µ0 = 247
H1: µ # µ0 = 247 Đây là kiểm định hai bên, biết σ, với mẫu lớn (n=60)
Kiểm tra giả thuyết: n = 60 > 30; σ = 12
Giá trị kiểm định: Z =
n
X
δµ0
−
Z =
60
12
247
250−
Z = 1,936
Với trường hợp α = 0,05 Zα/2 = Z0,025 = 2,000 (tra bảng phân phối Student)
Như vậy Z < Zα/2 = Z0,025 = 2,000 nên ta không thể bác bỏ giả thuyết H0, tức mức độ tập trung bình quân vẫn đảm bảo ở mức 247 ppm
Với trường hợp α = 0,01 Zα/2 = Z0,005 = 2,66
Tương tự, Z < Zα/2 = Z0,005 = 2,660 nên ta không thể bác bỏ giả thuyết H0, tức mức độ tập trung
Trang 8b Kết luận của bạn như thế nào? Bạn có quyết định gì đối với lô hàng này? Nếu lô hàng đã được bảo đảm rằng nó chứa đựng mức độ tập trung bình quân là 247 ppm, quyết định của bạn sẽ như thế nào căn cứ vào việc kiểm định giả thiết thống kê?
Từ các kết quả tính toán ta thấy rằng, khi mức độ tin cậy của số liệu thống kê càng cao thì giả thuyết H0 càng được đảm bảo hay mức độ tập trung của hóa chất vẫn được kiểm soát trong mức cho phép Lúc này, sản phẩm thuốc vẫn đạt mức độ yêu cầu, sau khi kiểm tra bằng các thống kê, nếu là nhà sản xuất chúng ta có thể tiếp tục duy trì dây chuyền với lô sản phẩm để đưa ra thị trường
Tuy nhiên chúng ta cũng thấy rằng, nếu như độ tin cậy giảm đi, hay chỉ số α tăng lên, khi đó giá trị Zα/2 giảm đi Mặt khác, nếu quy mô mẫu lớn hơn thì chúng ta cũng sẽ có bậc tự do của ước lượng tăng lên, khi đó giá trị Zα/2 cũng giảm đi
Như vậy, ứng với hai trường hợp khi quy mô mẫu tăng lên cùng với độ tin cậy giảm, hoàn toàn
có thể dẫn đến trường hợp Z tính toán lớn hơn giá trị Z kiểm định (do hai giá trị đang ở mức tiệm cận (ứng với trường hợp α= 5%) hay giả thuyết H0 bị bác bỏ Lúc này lô sản phẩm có thể gây tác dụng phụ hoặc không có tác dụng
Với vai trò của nhà sản xuất, lúc này cần lấy thêm nhiều mẫu thống kê và tính toán lại số liệu để đảm bảo an toàn cho sản phẩm và thương hiệu của đơn vị trước khi đưa sản phẩm ra thị trường
Bài 4: Gần đây, một nhóm nghiên cứu đã tập trung vào vấn đề dự đoán thị phần của nhà sản
xuất bằng cách sử dụng thông tin về chất lượng sản phẩm của họ Giả sử rằng các số liệu sau là thị phần đã có tính theo đơn vị phần trăm (%) (Y) và chất lượng sản phẩm theo thang điểm
0-100 được xác định bởi một quy trình định giá khách quan (X)
X: 27, 39, 73, 66, 33, 43, 47, 55, 60, 68, 70, 75, 82
Y: 2, 3, 10, 9, 4, 6, 5, 8, 7, 9, 10, 13, 12
Bài làm
a Ước lượng hồi quy
Ta thấy rằng, phần lớn các trường hợp khi chất lượng sản phẩm tăng lên ta cũng thấy thị phần sản phẩm được cải thiện nên hai biến số chất lượng và thị phần có thể có mối quan hệ tuyến tính với nhau
Ta có thể biểu diễn qua đồ thị để xem xét dạng tương quan:
Trang 9Qua đồ thị ta thấy rằng, các điểm giá trị có dạng một đường thẳng, hay phương trình hồi quy sẽ
có dạng: y = b0 + b1x
Ta sẽ sử dụng công cụ excel để xác định thêm các hệ số của phương trình này
Sử dụng công cụ Excel ta có:
Regression Statistics
Multiple R 0.9655174
R Square 0.9322239
Adjusted R Square 0.9260625
Standard Error 0.9394203
ANOVA
Significance F
Regression 1
133.523 2
133.523 2
151.299
2 9.01873E-08
9.70761
7 0.882511
143.230
8
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept -3.34566561 0.916426209 -3.65077 0.003816 -5.3627061 -1.32862512
X Variable 1 0.190370803 0.01547683 12.30037 9.02E-08 0.15630653 0.22443508
Từ bảng excel ta có b0 = -3,346; b1= 0,19
Thay vào trong phương trình hồi quy ban đầu ta có:
Trang 10Với hệ số b1 = 0,19 > 0 nên có thể thấy rằng chất lượng sản phẩm tỷ lệ thuận với thị phần của sản phẩm Hệ số b1 = 0,19 có nghĩa là khi chất lượng của sản phẩm được ghi nhận tăng 1 điểm trên thang đánh giá theo thang điểm 100 thì thị phần của sản phẩm trên thị trường tăng lên tương ứng là 0.19%
Với P-value = 9.02.E-08 hay nói cách khác P-value < mức ý nghĩa α hay mô hình có ý nghĩa thống kê
b Kiểm định mối liên hệ giữa X và Y
Ta có cặp giả thiết cần kiểm định là:
H0: β1 = 0 (không có mối liên hệ giữa chất lượng sản phẩm và thị phần)
H1: β1 ≠ 0 (có mối liên hệ giữa chất lượng sản phẩm và thị phần) Với mức ý nghĩa: α = 0.05
Tiêu chuẩn kiểm định: 1 0.00155.19 12,2
1
=
=
=
b
S
b t
Với n =13; α=0.05; tra bảng phân phối chuẩn t => tn-2, α /2 = t11,0.025 = 2.201
Như vậy: t = 12,2 > t11,0.025 = 2.201=> Bác bỏ H0 nhận H1
Kết luận:
Với mức ý nghĩa α = 5%, thực sự có mối liện hệ giữa chất lượng sản phẩm và thị phần của sản phẩm đó
c R2 và ý nghĩa
Ta có: R2 = 0,9322 hay 93,22% sự thay đổi của thị phần sản phẩm trên thị trường được giải thích bằng mô hình tuyến tính giữa hai biến số là chất lượng sản phẩm và thị phần
Ta cũng có thêm giá trị R tương quan = 0,9655 > 0 nên tương quan này là tương quan thuận Giá trị R xấp xỉ 1 nên mối tương quan là rất chặt chẽ
TÀI LIỆU THAM KHẢO
1 Giáo trình thống kê trong kinh doanh – Chương trình Đào tạo Thạc sỹ Quản trị Kinh doanh Quốc tế Griggs
2 Giáo trình Nguyên lý Thống kê Kinh tế ứng dụng trong kinh doanh và kinh tế - Nhà xuất bản Thống kê 2010
3 Bài giản Thông kê trong kinh doanh- Ts- Nguyễn Mạnh Thế