Hoàn thành các bài tập sau đây: Bài 1: Gọi µ là số ngày trung bình từ khi đặt hàng đến khi giao hàng của phương pháp bán hàng mới Đây là bài toán ước lượng trung bình của tổng thể chung
Trang 1BÀI TẬP CÁ NHÂN MÔN HỌC: THỐNG KÊ TRONG KINH DOANH
Họ và tên: Bùi Anh Dũng
Lớp: GaMBA.M0211
Môn: Thống kê trong kinh doanh
BÀI LÀM
I Trả lời các câu hỏi sau đây, giải thích rõ cách làm:
1 Diện tích nằm dưới đường mật độ của phân phối chuẩn hóa và giữa hai điểm 0
và -1.75 là:
Ta có: P (-1.75<Z<0)= F(0) – F(-1.75)
F(-1.75)= P (-∞<Z1.75)
Tra bảng A1 ta có: F(0) = 0.5; F(-1.75)= 0.9599
⇒ P (-1.75<Z<0)= 0.9599-0.5=0.4599
2 Chỉ số IQ có phân phối chuẩn với trung bình là 100 và độ lệch chuẩn là 16 Gọi chỉ số IQ là 1 biến ngẫu nhiên X, tính P (68<X<132):
Trang 2Sử dụng phần mềm MegaStat trong excel ta sẽ có biểu diễn của xác suất này như sau:
Sử dụng công thức tính toán xác suất ngẫu nhiên để X nhận giá trị trong khoảng (a, b):
P (a < X < b) = ( )) ( ))
σ
µ ϕ σ
µ
ϕ b− − a−
Theo đề bài ta có: a = 68; b = 132; µ = 100; σ = 16
P (a < X < b) = )
16
100 68 ( ) 16
100 132
ϕ
P (68 < X <132) = ϕ ( 2 ) − ϕ ( − 2 )
Sử dụng hàm normsdist trong excel ta có:
P (68 < X <132) = normsdist (2) – normsdist (-2) = 0,97725 – 0,02275= 0,9545
3 Nếu độ tin cậy giảm đi, khoảng tin cậy sẽ rộng hơn hay hẹp hơn?
Nếu độ tin cậy giảm đi khoảng tin cậy sẽ hẹp hơn
Khoảng tin cậy thông thường được xác định theo công thức:
n
Z
α / 2
±
Trong đó n là quy mô mẫu, σ là độ lệch chuẩn
Trang 3Theo đó khi độ lệch chuẩn và quy mô mẫu đã cho, khi độ tin cậy giảm đi hay (1-α) giảm đi hoặc α tăng lên
Khi α tăng lên thì Zα/2 giảm đi, hay khoảng tin cậy của sẽ hẹp lại
4 Giả sử khoảng tin cậy cho trung bình tổng thể là từ 62.84 đến 69.46 Biết σ
=6.5 và kích thước mẫu n=100 Hãy tính trung bình mẫu
Khoảng tin cậy cho trung bình tổng thể từ 62.84 đến 69.46 Như vậy ta có:
6.62
2
X Z
Z
n
X Z
n
σ α
σ α
−
−
Thay số liệu vào ta có X− =69.46 3.31 66.15− =
Vậy trung bình mẫu là 66.15
5 Giá trị p-value nào sau đây sẽ dẫn đến việc bác bỏ giả thiết H0nếuα = 0.05
a: 0.150 b: 0.100 c: 0.051 d: 0.025
Vì: Nếu p-value≤ α bác bỏ giả thiết H 0
Nếu p-value ≥ α không bác bỏ giả thiết H0
Vậy việc bác bỏ giả thiết H0 khi có giá trị p-value = 0.025 ≤ α = 0.05
II Hoàn thành các bài tập sau đây:
Bài 1:
Gọi µ là số ngày trung bình từ khi đặt hàng đến khi giao hàng của phương pháp bán hàng mới
Đây là bài toán ước lượng trung bình của tổng thể chung khi chưa biết độ lệch của tổng thể chung và tổng thể chung có phân bố chuẩn (mẫu ngẫu nhiên n = 30)
Từ số liệu bài ra, sử dụng công cụ excel: Tool/Data/Analysis/Descriptive Statistics, ta có:
Trang 4Số ngày
Standard Deviation 1.81
Qua bảng ta có:
Giá trị trung bình _
X = 6,13
Độ lệch tiêu chuẩn s = 1.81 Ước lượng trung bình của tổng thể chung theo công thức
X t / 2,n 1 S
n
α
µ = ±− − Tra bảng tα/2, n-1= 2.045
Thay các số liệu vào công thức 6.13 2.045.1.81
30
µ = ±
Ta có 5.45 ≤ µ ≤ 6.8ngày
Kết luận: Với mẫu đã điều tra với độ tin cậy 95% thì số ngày trung bình từ khi đặt hàng đến khi giao hàng
5.45 ≤ µ ≤ 6.8ngày
So với phương pháp bán hàng cũ có số ngày trung bình từ khi đặt hàng đến khi giao hàng là 7.5 ngày thì phương pháp bán hàng mới tốt hơn vì nó nhỏ hơn 7.5 ngày
Bài 2:
Gọi µ là chi phí trung bình của phương án sản xuất 1;
Trang 5µ2 là chi phí trung bình của phương án sản xuất 2.
Giả thiết: H0: µ1 = µ2 (chi phí trung bình của phương án 1 giống phương án 2 )
H1: µ1 ≠ µ2 (chi phí trung bình của phương án 1 khác phương án 2 ) Đây là bài toán ước lượng trung bình của tổng thể chung khi chưa biết độ lệch tiêu chuẩn của tổng thể chung và tổng thể có phân phối chuẩn, trong trường hợp mẫu nhỏ (n1=12; n2=14, đều < 30) Do đó chọn tiêu chuẩn kiểm định là t
Tính t theo công thức:
t =
2 1
2 1
1 1
n n S
X X
+
−
Thiết lập bảng tính Excel đối với các dữ liệubài cho:
t-Test: Two-Sample Assuming Equal Variances
Sau khi chạy mô hình ta có kết quả như sau:
Hypothesized Mean
P(T<=t) one-tail
0.1982294
3
t Critical one-tail 1.7109
P(T<=t) two-tail
0.3964588
7
t Critical two-tail
2.0638985
5
Trang 6Từ bảng trên ta có:
S1 = 19,841; S2 = 20,951
Sp2 = [(n1 – 1) + (n2 – 1) ] / (n1 + n2 – 2)
Thay số
Sp2=[(12 – 1).19,8412 + (14 – 1).20,9512]/(12 + 14 – 2) = 418,19
Sp= 20,442
Thay vào công thức tính t, ta có t = 0.8634
Với độ tin cậy 95%, với = 0,05 →α/2 = 0,025,
Tra bảng t ta có: ; (n1 + n2 – 2) = 2,064
t tương ứng với α = 0, 396 > 0,025 → như vậy t không thuộc miền bác bỏ→ chưa đủ cơ sở để bác bỏ giả thiết H0
Ta có thể kết luận: Với mẫu đã điều tra, ở ý nghĩa 5% chưa đủ cơ sở để nói rằng hai phương án có chi phí sản xuất trung bình khác nhau
Bài 3:
a Hãy kiểm định rằng mức độ tập trung bình quân trong toàn bộ lô hàng là 247ppm với mức ý nghĩa α= 0.05 Thực hiện điều đó với α= 0.01
Theo đề bài ta có: δ = 12 ; H0 = 247; H1 ≠ 247; n = 60
Ta cần kiểm tra giả thuyết:
H0: µ = µ0 = 247 ppm
H1: µ ≠ µ0 ≠ 247 ppm
Ta có
/
X z
n
µ µ
σ
−
−
= =
0 0
250 247
1.94
X
Z
n
µ σ
−
Z0.05 = 1.65
Trang 70 0
250 247
1.94
X
t
n
µ σ
−
Bác bỏ H0 nếu t0 > 1
/2
n
tα−
Không bác bỏ H0 nếu t0 < 1
/2
n
tα−
t0= 1.94>1.67 vậy bác bỏ H0 tức là thông tin từ mẫu không đảm bảo được chất
lượng đạt 247ppm
Kiểm định bằng p-value
Hypothesis Test: Mean vs Hypothesized Value
250.00 hypothesized value
247.00 mean Data
12.00 std dev
1.55 std error
60 n -1.94 z
0.0528 p-value (two-tailed)
243.96 confidence interval 95.% lower
250.04 confidence interval 95.% upper
3.04 margin of error
Kiểm định rằng mức độ tập trung bình quân trong toàn bộ lô hàng là 247 ppm với mức ý nghĩa α = 0,01
Dựa vào α ta tìm Zα/2 = Z0.01/2 = Z0.005 = 2.66
→ -2.66 < 1.94 < 2.66 → Không thể bác bỏ giả thuyết H0, tức là thông tin từ mẫu đảm bảo được chất lượng đạt 247ppm
b.Như ta đã thấy từ các kết quả kiểm định, với các giả thiết độ tin cậy là 95% và 99% tương ứng với α là 5% và 1%, chúng ta đều thấy rằng mức độ tập trung bình quân của hóa chất trong thuốc là nằm trong giới hạn cho phép Như vậy, nhà sản xuất sau khi kiểm định các mẫu thuộc lô hàng này hoàn toàn có thể yên tâm về độ an toàn đối
Trang 8với hóa chất quy định trong thuốc Nhà sản xuất có thể sản xuất đại trà đối với lô hàng này
Tuy nhiên ta cũng cần lưu ý một điểm, với độ tin cậy là 5% ta có Zα/2 = Z0,025 = 2,000 gần tương đương với giá trị Z kiểm định Hay nói cách khác nếu α lớn hơn 5% hoàn toàn có trường hợp giá trị Z tính toán lớn hơn giá trị Z tra bảng Khi đó, có cơ sở
để bác bỏ giả thiết H0 và nhận giả thiết H1 Lúc đó để đảm bảo an toàn cho người dùng, nhà sản xuất có thể phải tạm dừng sản xuất lô hàng và tiêu hủy các sản phẩm đã sản xuất để đảm bảo uy tín và chất lượng
Bài 4:
a Hãy ước lượng mối quan hệ hồi quy tuyến tính giữa thị phần và chất lượng sản phẩm Kết luận?
Gọi: Chất lượng sản phẩm là X
Thị phần của sản phẩm là Y
Theo bài ra ta có phương trình
Phương trình tổng quát: Yi = b0 + b1Xi
Ta sẽ sử dụng công cụ excel để xác định thêm các hệ số của phương trình này
Sử dụng công cụ Excel ta có:
Regression Statistics
Adjusted R
ANOVA
Trang 9Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Từ bảng Excel ta có: b1 = 0.19
b0 = - 3.346
⇔Phương trình hồi quy: Y = -3.346 + 0.19X
Với hệ số b1 = 0,19 > 0 nên có thể thấy rằng chất lượng sản phẩm tỷ lệ thuận với thị phần của sản phẩm Hệ số b1 = 0,19 có nghĩa là khi chất lượng của sản phẩm được ghi nhận tăng 1 điểm trên thang đánh giá theo thang điểm 100 thì thị phần của sản phẩm trên thị trường tăng lên tương ứng là 0.19%
Với P-value = 9.02.10-8 hay nói cách khác P-value < mức ý nghĩa α hay mô hình
có ý nghĩa thống kê
b Kiểm định mối liên hệ giữa X và Y
Ta có cặp giả thiết cần kiểm định là:
H0: β1 = 0 (không có mối liên hệ giữa chất lượng sản phẩm và thị phần)
H1: β1 ≠ 0 (có mối liên hệ giữa chất lượng sản phẩm và thị phần) Với mức ý nghĩa: α = 0.05
Tiêu chuẩn kiểm định: 1 0.00155.19 12,26
1
=
=
=
b S
b t
Với n =13; α=0.05; tra bảng phân phối chuẩn t => tn-2, α /2 = t11,0.025 = 2.201
Như vậy: t = 12,26 > t11,0.025 = 2.201 => Bác bỏ H0 nhận H1
Kết luận: Với giả thiết độ tin cậy là 95% kết quả từ bảng excel cho ta thấy có mối liên hệ tuyến tính ý nghĩa giữa chất lượng sản phẩm và thị phần
Kiểm định β1:
β 1= b1 ± tα/2;n-2 x Sb1
Với b1= 0.19
tα/2;n-2= 2.201
S = 0,0155
Trang 10Thay vào công thức ta được : 0.16 β1 0.22
Kết luận: Một khi thị phần tăng thêm 1% thì chất lượng sản phẩm sẽ tăng lên khoảng từ 0.16 đến 0.22 với độ tin cậy 95%
c Cho biết hệ số R2 và giải thích ý nghĩa của nó
R2 là hệ số xác định đo lường phần biến thiên của Y có thể được giải thích bởi biến độc lập X R2 có giá trị từ 0 đến 100% (hay 1)
Giá trị R2 càng cao là một dấu hiệu cho thấy mối liên hệ giữa hai biến số thị phần
và chất lượng sản phẩm càng chặt chẽ
Ta có công thức :
Theo kết quả bảng Excel cho thấy R2 = 0,9322, tức là 93.22% sự thay đổi của chất lượng sản phẩm được giải thích trong mô hình trên với thị phần.R = 0,9655 chứng
tỏ mối quan hệ giữa chất lượng sản phẩm và thị phần là mối tương quan thuận và rất chặt chẽ
TÀI LIỆU THAM KHẢO
1 Giáo trình thống kê trong kinh doanh – Chương trình Đào tạo Thạc sỹ Quản trị Kinh doanh Quốc tế Griggs
2 Giáo trình Nguyên lý Thống kê Kinh tế ứng dụng trong kinh doanh và kinh tế -Nhà xuất bản Thống kê 2010
2 SSR R
SST
=