Để đánh giá tính hiệu quả của nó xét về mặt thòi gian người ta phỏng vấn ngẫu nhiên 30 khách hàng được bán hàng theo phương pháp mới và ghi lại số ngày từ khi đặt hàng đến khi giao hàng
Trang 1MÔN HỌC THỐNG KÊ TRONG KINH DOANH
BÀI TẬP HẾT MÔN
Lớp : GaMBA.M0211
Bài làm:
I Trả lời các câu hỏi sau và giải thích rõ cách làm:
1 Diện tích nằm dưới đường mật độ của phân phối chuẩn hóa và giữa hai điểm 0 và – 1,75 là:
Trả lời: Theo đầu bài đây là phân phối chuẩn hóa nên sẽ có dạng Z~N(0, 1) Vì
vậy, diện tích nằm dưới đường mật độ giữa hai điểm là:
P(a < Z < b); → ta sẽ được xác suất hay diện tích nằm dưới đường cong giữa hai điểm – 1,75 và 0 là:
P(-1,75 < Z < 0)
= P( - ∞ < Z < 0) – P(Z < -1,75) (1)
Ta có P(Z < -1,75) = 1 – P(Z < 1,75)
Tra bảng A.1 ta có P( - ∞ < Z < 0) = 0,5 và P(Z < 1,75) = 0,9599
Thay vào phương trình (1) = 0,5 – (1 – 0,9599) = 0,4599
Vậy diện tích nằm dưới đường mật độ của phân phối chuẩn hóa và giữa hai điểm (-1.75) và (0) là 0,4599
Đồ thị minh họa:
Trang 22 Chỉ số IQ có phân phối chuẩn với trung bình là 100 và độ lệch chuẩn là
16 Gọi chỉ số IQ là một biến ngẫu nhiên X, tính P (68<X<132):
Trả lời: Ta có thể làm theo hai cách
Cách 1: Sử dụng phần mềm Mega Stat->Probability->Normal distribution trên Excel, ta có kết quả như sau:
Normal distribution
P(lower)
P(up
mea n
std.d ev
Vậy P= 1- P(lower) -P(upper)
P = 1-0.228-0.228
P = 0.9544
Cách 2: có thể tính toán và tra bảng như sau:
σ
µ
−
X
Trang 3Ta có: P(68<X<132) = P( < < ) = P(-2<Z<2)⇒ Tra bảng phân phối chuẩn bảng 2 với Z=2 ta có P(-2 < Z <2) = 0.4772 x 2=0.9544
Vậy P(68<X<132) = 0.9544
Đồ thị minh họa
3 Nếu độ tin cậy giảm đi, khoảng tin cậy sẽ rộng hơn hay hẹp lại?
Ta có: Giá trị cận trên của khoảng tin cậy = X + Z α /2
Giá trị cận dưới của khoảng tin cậy = X - Z α /2
Độ rộng của khoảng tin cậy = Cận trên – Cận dưới
= X + Z α /2 - X - Z α /2
= 2*Z α /2
Trang 4Nếu độ tin cậy = (1 - α) giảm đi (↓) có nghĩa là giá trị α tăng lên (↑) ⇒ Diện tích phần bên phải tăng lên, đồng nghĩa với giá trị α/2 tăng lên (↑) ⇒ Giá trị Z α /2
co lại (↓) ⇒ Độ rộng của khoảng tin cậy hẹp lại
Kết luận: Nếu độ tin cậy giảm đi, khoảng tin cậy sẽ hẹp lại
4 Giả sử khoảng tin cậy cho trung bình tổng thể là từ 62,84 đến 69,46 Biết σ = 6,5 và kích thước mẫu n= 100 Hãy tính trung bình mẫu
n
σ
đến X - Zα/2 n
σ
Theo đầu bài ra ta có:
X - Zα/2
n
σ =
X + Zα/2
100
5 6
= 69.46 (1)
X - Zα/2
n
σ =X - Zα/2
100
5 6
= 62.84 (2)
5 6
= 6.62 → Zα/2 = 5.0923 Thay Zα/2 = 5.0923 vào (1) ta được X + 5.0923 100
5 6
= 69.46 → X = 66.15
→ Trung bình mẫu = 66.15
6,5 và kích thước mẫu n= 100 thì giá trị trung bình mẫu là 66.15
Trang 55 Giá trị p-value nào sau đây sẽ dẫn đến việc bác bỏ giả thiết Ho nếu α = 0.05
a = 0.15 b = 0.1 c = 0.051 d = 0.025
Trả lời: để bác bỏ giả thiết Ho, ta dùng phương pháp kiểm định giả thiết bằng Pvalue
Bác bỏ Ho nếu to > tα/2
P-value = P (t> to) So sánh Pvalue và α
Nếu Pvalue <= α → Bác bỏ Ho
Nếu Pvalue > α → Không bác bỏ Ho
giá trị p-value = 0.025 sẽ dẫn đến việc bác bỏ giả thiết H0
Kết luận: Giá trị p-value = 0.025 sẽ dẫn đến việc bác bỏ giả thiết H0 nếu α= 0.05
II Hoàn thành các bài tập:
Bài 1: Một phương pháp bán hàng mới theo đơn đặt hàng đang được xem xét.
Để đánh giá tính hiệu quả của nó xét về mặt thòi gian người ta phỏng vấn ngẫu nhiên 30 khách hàng được bán hàng theo phương pháp mới và ghi lại số ngày từ khi đặt hàng đến khi giao hàng như sau:
Hãy ước lượng số ngày trung bình từ khi đặt hàng đến khi giao hàng khi bán theo phương pháp mới với độ tin cậy 95% Hãy kết luận về hiệu quả của phương pháp bán hàng mới so với phương pháp bán hàng cũ Biết rằng phương pháp bán
Trang 6hàng cũ có số ngày có số ngày trung bình từ khi đặt hàng đến khi giao hàng là 7,5 ngày
Giải:
1 Hãy ước lượng số ngày trung bình từ khi đặt hàng đến khi giao hàng khi bán theo phương pháp mới với độ tin cậy 95%
* Sử dụng công cụ MegaStat → Descriptive statistics để xác định khoảng biến
thiên, tứ phân vị, trung bình, trung vị, phương sai và độ lệch chuẩn, ta được kết quả sau:
Số ngày
sample standard
Trang 7Mô tả thống kê:
Ta có số mẫu là 30, khoảng biến thiên là 7; khoảng tứ phân vị là 2; giá trị trung bình mẫu là 6.13 và trung vị là 6; độ lệch chuẩn mẫu là 1.81; mod là 6 và không có giá trị ngoại lai Trung vị và trung bình sản lượng tiêu thụ tại các cửa hàng là tương đồng cho thấy đây là biến phân phối đối xứng
Nhìn vào biểu đồ Boxplot ta thấy hai hộp tương đương nhau (hay nói cách khác hai hộp cân xứng) nên giả thiết là phân phối đối xứng được thỏa mãn Ta có
Để ước lượng khoảng tin cậy 95% số ngày trung bình từ khi đặt hàng đến khi giao hàng theo phương pháp mới, áp dụng công thức:
X - tα/2,n-1 n
S
≤µ ≤
X + tα/2,n-1 n
S
Ta có: X = 6.13
tα/2,n-1 = t0.025, 29, tra bảng A.2 ta được t0.025, 29 = 2.045
S = 1.81
81 1
81 1
5.45 ≤µ ≤ 6.81
* Ta cũng có thể sử dụng công cụ MegaStat → Confidence interval/Sample size
→ Confidence interval – mean để xác định khoảng tin cây 95% cho trung bình
sản lượng tiêu thụ tại các cửa hàng, được kết quả như sau:
Trang 895% confidence level 6.133333333 mean
1.814374279 std dev
30 n 2.045 t (df = 29) 0.6775 half-width 6.8108 upper confidence limit 5.4558 lower confidence limit
Ta thấy cả hai phương pháp đều cho kết quả giống nhau Như vậy, với 95%
độ tin cậy, ta có thể nói: có 95% tự tin để nói rằng số ngày thực hiện các đơn đặt hàng trung bình sẽ nằm trong khoảng từ 5.45 đến 6.81 ngày
2 Hãy kết luận về hiệu quả của phương pháp bán hàng mới so với phương pháp bán hàng cũ Biết rằng phương pháp bán hàng cũ có số ngày có số ngày trung bình
từ khi đặt hàng đến khi giao hàng là 7,5 ngày
Theo bài ra ta có số ngày trung bình từ khi đặt hàng đến khi giao hàng theo phương pháp bán hàng cũ là 7.5 ngày
Theo tính toán ở trên ta có số ngày trung bình từ khi đặt hàng đến khi giao hàng theo phương pháp bán hàng mới là 6.13 ngày Khoảng tin cậy cho µ từ 5.4558 đến 6.8108 ngày
Ta có thể biểu diễn khoảng tin cậy dưới dạng (6.13 +_ 0.6775) Khoảng tin cậy nằm dưới 7.5 ngày nên ta có thể khẳng định trong thực tế cách làm mới hiệu quả hơn cách làm cũ
Bài 2:
Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản phẩm Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay không người ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng) Phương án 1: 25 32 35 38 35 26 30 28 24 28 26 30
Trang 9Phương án 2: 20 27 25 29 23 26 28 30 32 34 38 25 30 28 Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn Với mức ý nghĩa 5% hãy rút ra kết luận về hai phương án trên
Giải:
Sử dụng công cụ MegaStat → Descriptive statistics để xác định khoảng biến
thiên, tứ phân vị, trung bình, trung vị, phương sai và độ lệch chuẩn của hai phương
án, ta được kết quả sau:
sample standard
Trang 10So sánh hai phương án:
+ Về giá trị trung bình (mean): nhìn vào bảng dữ liệu trên, ta thấy giá trị
trung bình của phương án 1 là 29.75 và của phương án 2 là 28.21 <=> chênh lệch
+ Về độ lệch chuẩn (sample standard deviation): độ lệch chuẩn của phương
không đáng kể (0.13), chứng tỏ độ phân tán trong hai phương án là tương đương nhau
+ Đồ thị hộp ria mèo (Box plot) cho thấy cả hai phương án đều là biến phân
phối đối xứng → Giả thiết về phân phối chuẩn là hợp lý, hay nói cách khác giả thiết về tính đối xứng theo đầu bài ra được đảm bảo
+ Giá trị ngoại lai (high outliers): Phương án 2 có một giá trị ngoại lai là 38.
Như vậy, có thể nhận xét qua thống kê mô tả là trung bình chi phí sản xuất sản phẩm của cả hai phương án là gần như nhau
Để có thể đánh giá một cách chính xác hơn, ta loại giá trị ngoại lai ra khỏi
dãy dữ liệu rồi tiến hành phân tích: Sử dụng công cụ MegaStat → Descriptive statistics, ta được kết quả sau:
sample standard
Trang 11maximum 38 34
Với cách tính toán loại bỏ giá trị ngoại lai của phương án 2, thống kê mô tả cũng cho ta kết quả không khác nhiều so với khi chưa loại bỏ giá trị ngoại lai Tiến hành kiểm định giả thiết cho cả 2 trường hợp (chưa loại bỏ và đã loại bỏ giá trị ngoại lai của phương án 2), với giả thiết:
+ H0 : µ1 =µ2 (Không có sự khác biệt giữa 2 phương án)
+ H1 : µ1≠µ2 (Có sự khác biệt giữa 2 phương án)
Trang 12Sử dụng công cụ Megastat → Hypothesis Teste → Compare Two Independent Group → t-test (pooled variance), ta được kết quả của cả hai trường hợp như sau:
Trường hợp chưa loại bỏ giá trị ngoại
lai
24 df
1.536 difference (PA1 - PA2)
20.442 pooled variance
4.521 pooled std dev
1.779 standard error of difference
0 hypothesized difference
0.86 t
0.3965 p-value (two-tailed)
Trường hợp đã loại bỏ giá trị ngoại lai
23 df 2.288 difference (PA1 - PA2) 16.847 pooled variance
4.105 pooled std dev
1.643
standard error of difference
0 hypothesized difference
1.39 t 0.177 p-value (two-tailed)
Tiếp tục sử dụng công cụ Megastat → Hypothesis Teste → Compare Two Independent Group → t-test (unequal variance), ta được kết quả của cả hai
trường hợp như sau:
Trường hợp chưa loại bỏ giá trị ngoại
lai
Trường hợp đã loại bỏ giá trị ngoại
lai
29.75
28.2
1 mean
29.7
4.45 4.58
std
Trang 131.77
5
standard error of
standard error of difference
0
hypothesized
hypothesized difference
Kiểm định này cả hai trường hợp cũng cho P-value > α = 0.05 → chưa bác
bỏ H0 có nghĩa là H 0 =µ1 = µ2
Kết luận: với mức ý nghĩa α = 0.05 thì trung bình chi phí sản xuất của phương án 1
và phương án 2 là như nhau
Bài 3:
Một loại thuốc chữa bệnh chứa bình quân 247 parts per million (ppm) của một loại hoá chất xác định Nếu hàm lượng lớn hơn 247 ppm, loại thuốc này có thể gây ra một số phản ứng phụ; nếu hàm lượng nhỏ hơn 247 ppm, loại thuốc này có thể sẽ không có hiệu quả Nhà sản xuất muốn kiểm tra xem liệu hàm lượng bình quân trong một lô hàng lớn có đạt mức 247 ppm yêu cầu hay không Một mẫu ngẫu nhiên gồm 60 đơn vị được kiểm nghiệm và người ta thấy rằng trung bình mẫu là
250 ppm và độ lệch chuẩn của mẫu là 12 ppm
a Hãy kiểm định rằng hàm lượng bình quân trong toàn bộ lô hàng là 247 ppm với mức ý nghĩa α = 0.05 Thực hiện điều đó với α =0.1
b Kết luận của bạn như thế nào? Bạn có quyết định gì đối với lô hàng này? Nếu
lô hàng đã được bảo đảm rằng nó chứa đựng mức độ tập trung bình quân là 247
Trang 14ppm, quyết định của bạn sẽ như thế nào căn cứ vào việc kiểm định giả thiết thống kê?
Giải:
a Kiểm định giả thiết thống kê
Biến chúng ta cần quan tâm là hàm lượng hóa chất cho loại thuốc?
Theo bài ra: n= 60 = 250 µ0 =247 σ =12
H1: µ ≠ 247 ppm Tính thống kê kiểm định:
t0 =
n
x
σµ0
−
= 1.936
Bác bỏ Ho nếu to > tn-1
α/2 = t59
0.25 ≈ 2 hoặc to < - tn-1
α/2 = - t59
0.25 ≈ - 2
bác bỏ Ho Chấp nhận Ho = 247
Kết luận: với mức ý nghĩa 5% ta có thể kết luận rằng lô hàng đã đạt chất lượng theo yêu cầu kỹ thuật là mức độ tập trung hàm lượng thuốc đạt 247 ppm Căn cứ vào kiểm định thống kê, nhà sản xuất thì có thể quyết định đưa ra thị trường tiêu thụ lô hàng đó
Nếu α =0.1 → bác bỏ Ho nếu to > tn-1
α/2 ≈ 1.671 hoặc to < - tn-1
α/2 ≈ - 1.671
Như vậy, với mức ý nghĩa 10% ta có thể kết luận rằng với kiểm định thống kê lô hàng chưa đạt chất lượng theo yêu cầu là mức độ tập trung đạt 247 ppm nên chưa
Trang 15thể đưa lô hàng đó ra bán trên thị trường Nhà sản xuất cần phải có phương pháp khác để kiểm tra lại mức độ tập trung ppm của lô hàng đó trước khi quyết định có nên đưa lô hàng đó ra thị trường hay không
b Căn cứ vào kiểm định giả thiết thống kê ở trên, các quyết định được đưa ra
:
Với 60 đơn vị được kiểm nghiệm, qua số liệu tính toán ở trên, ta đi đến quyết định như sau:
- Với mức ý nghĩa α = 0.05 - tương ứng độ tin cậy = 95%, có thể kết luận rằng lô hàng đảm bảo hàm lượng bình quân là 247ppm => có thể xuất bán ra ngoài thị trường được
- Với mức ý nghĩa α = 0.0576 trở lên - tương ứng độ tin cậy < 94,23%, khi đó α > p-value (=0.0576), ta kết luận lô hàng chưa đảm bảo chất lượng do sản phẩm chưa đạt hàm lượng bình quân 247ppm => cần có biện pháp xử lý trước khi xuất bán ra thị trường
Bài 4 :
Gần đây, một nhóm nghiên cứu đã tập trung vào vấn đề dự đoán thị phần của nhà sản xuất bằng cách sử dụng thông tin về chất lượng sản phẩm của họ Giả sử rằng các số liệu sau là thị phần đã có tính theo đơn vị phần trăm (%) (Y) và chất lượng sản phẩm theo thang điểm 0-100 được xác định bởi một quy trình định giá khách quan (X)
Y: 2, 3, 10, 9, 4, 6, 5, 8, 7, 9, 10, 13, 12
a Hãy ước lượng mối quan hệ hồi quy tuyến tính đơn giữa thị phần và chất lượng sản phẩm Kết luận?
b Kiểm định sự tồn tại mối liên hệ tương quan tuyến tính giữa X và Y
c Cho biết hệ số R2 và giải thích ý nghĩa của nó
Trang 16Câu a: Sử dụng công cụ MegaStat → Descriptive statistics để xác định khoảng
biến thiên, tứ phân vị, trung bình, trung vị, phương sai và độ lệch chuẩn của biến thị phần, ta được kết quả sau:
Thị phần (%)
sample standard
Số liệu trên cho thấy số lượng mẫu các cửa hàng đặt tại trung tâm là 13, trung bình
là 7.54 và trung vị là 8 với độ lệch chuẩn 3.41, mod = 10 và không có giá trị ngoại lai Trung vị và trung bình của lượng bán hàng tại các cửa hàng trung tâm là tương đồng cho thấy đây là biến phân phối đối xứng Tương tự, biểu đồ Boxplot cũng cho
Trang 17- Hàm hồi quy trong đó biến phụ thuộc là thị phần, biến độc lập là chất lượng sản phẩm sẽ có dạng như sau:
Y = β0 + β1 X1
Sử dụng công cụ MegaStat → Correlation/Regression → Scatterplot ta được đồ
thị hồi quy tuyến tính sau:
Hàm hồi quy xác định được là:
Y = -3.057 + 0.187*X (1)
X là chất lượng sản phẩm Các số liệu trên được giải thích như sau:
- Hàm hồi quy có dấu của từng biến là dấu (+) cho biết X tăng → Y tăng, phù hợp với lý thuyết
- β0 = -3.057 cho biết khi biến X > 16 thì biến Y mới có ý nghĩa
thể, nếu chất lượng sản phẩm tăng 1 đơn vị → thị phần tăng 0.187%
Trang 18- Với R² = 0.922 cho thấy 92.2% sự thay đổi của thị phần được giải thích bằng
yếu tố chất lượng sản phẩm, nó còn cho thấy mối liên hệ tương quan giữa chất lượng sản phẩm và % thị phần sản phẩm là rất chặt chẽ
Câu b.
Kiểm tra biến chất lượng sản phẩm có ảnh hưởng đến thị phần sản phẩm hay không với mức ý nghĩa 5%:
- Giả thiết:
phẩm)
Sử dụng công cụ MegaStat → Correlation/Regression → Regression Analysis với dữ liệu đã cho ta được kết quả sau:
Std Error 0.995 Dep Var Thị phần (%)
ANOVA table
128.332
1
129.5
3 2.00E-07
Regression output
confidence interval variables
coefficient
s
std
error
t
95%
lower
95% upper
Chất lượng
định giả thiết trên có thể kết luận với mức ý nghĩa 5%, biến X có ý nghĩa với biến
Trang 19Y hay yếu tố chất lượng sản phẩm càng tăng thì thị phần sản phẩm càng tăng Khi
X tăng 1 đơn vị thì Y tăng lên trong khoảng từ 0.1505 đến 0.2227
Kết luận: Quan hệ tuyến tính giữa biến X và biến Y là quan hệ cùng chiều
Câu c.
R2
biến đổi của yếu tố chất lượng sản phẩm (92,2% yếu tố chất lượng sản phẩm quyết định đến sự thay đổi của thị phần) còn 7.8% còn lại phụ thuộc vào các yếu tố khác như thị hiếu người tiêu dùng, công tác phát triển và xây dựng thương hiệu, mẫu mã sản phẩm Ta cũng có thể nói cách khác là: có 92,2% của thay đổi trong thị phần phụ thuộc vào yếu tố chất lượng sản phẩm
Nguồn tài liệu:
1 Giáo trình Thống kê trong kinh doanh – Chương trình đào tạo Thạc sỹ Quản trị Kinh doanh quốc tế – Đại học Griggs (Hoa Kỳ)
2 Giáo trình “Nguyên lý thống kê kinh tế” – Trường Đại học kinh tế Thành phố Hồ Chí Minh – Bộ môn Lý thuyết thống kê – thống kê kinh tế, chủ biên:
Hà Văn Sơn
3 Slide Giáo trình Thống kê trong kinh doanh - Chương trình đào tạo Thạc sỹ Quản trị Kinh doanh – Đại học Griggs (Hoa Kỳ)