2 Nói, tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối là đúng Bởi, một bảng tần số phân bổ và tần số tích lũy gồm các thành phần chủ yếu sau: - Thành phần thứ nhất là lượn
Trang 1BÀI TẬP CÁ NHÂN:
Môn: Thống kê trong kinh doanh
Họ và tên: Võ Thị Minh Sinh
CÂU 1:
A Trả lời đúng (Đ), sai (S) cho các câu hỏi sau và giải thích tại sao?
1) Nói, tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu là sai
Bởi, tiêu thức thống kê là đặc điểm của từng đơn vị tổng thể được chọn ra để nghiên cứu tuỳ theo mục đích nghiên cứu khác nhau Còn đặc điểm của tổng thể nghiên cứu gọi là chỉ tiêu thống kê
2) Nói, tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối là đúng
Bởi, một bảng tần số phân bổ và tần số tích lũy gồm các thành phần chủ yếu sau:
- Thành phần thứ nhất là lượng biến: Lượng biến là các trị số nói lên biểu hiện cụ thể của
tiêu thức số lượng, thường được ký hiệu là Xi
- Thành phần thứ hai của dãy số lượng biến là tần số Tần số thường được ký hiệu bằng Fi Tần số là số đơn vị được phân phối vào trong mỗi tổ, tức là số lần một lượng biến nhận một trị số nhất định trong một tổng thể Nói cách khác nó là số lần xuất hiện của lượng biến, ứng với mỗi lượng biến Xi có tần số Fi Số đơn vị hay số lần xuất hiện là những số tuyệt đối 3) Nói, phương sai cho phép so sánh độ biến thiên của tiêu thức nghiên cứu của hai hiện
tượng khác loại là sai.
Bởi, phương sai là chỉ tiêu cho biết độ biến thiên xung quanh trị số trung bình của các lượng biến Dùng để so sánh độ biến thiên của các hiện tượng cùng loại và có số trung bình bằng nhau Bởi vậy nó không thể cho phép so sánh độ biến thiên của tiêu thức nghiên cứu của hai hiện tượng khác loại
4) Nói, khoảng tin cậy cho giá trị trung bình của một tổng thể chung tỷ lệ nghịch với
phương sai của tổng thể chung đó là đúng.
Bởi, phương sai có trị số càng nhỏ thì tổng thể nghiên cứu càng đồng đều, tính chất đại biểu của số bình quân càng cao và khoảng tin cậy càng lớn và ngược lại Bởi vậy khoảng tin cậy cho giá trị trung bình của một tổng thể chung tỷ lệ nghịch với phương sai của tổng thể chung đó
tới biến kết quả Cụ thể mối khi biến nguyên nhân X thay đổi (tăng lên) 1 đơn vị thì biến kết quả Y thay đổi (tăng lên) b1 đơn vị
Trang 2B Chọn phương án trả lời đúng nhất:
1) Đại lượng nào phản ánh chiều hướng của mối liên hệ tương quan:
a) Hệ số tương quan
b) Hệ số chặn (b0 )
c) Hệ số hồi quy (b 1 ).
d) Cả a), b)
e) Cả a), c)
f) Cả a), b), c)
2) Ưu điểm của Mốt là:
a) San bằng mọi chênh lệch giữa các lượng biến
b) Không chịu ảnh hưởng của các lượng biến đột xuất.
c) Kém nhậy bén với sự biến động của tiêu thức
d) Cả a), b)
e) Cả a), b), c)
3) Các phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng nhằm:
a) Sắp xếp dãy số theo thứ tự tăng (hoặc giảm) dần
b) Đảm bảo tính chất so sánh được giữa các mức độ trong dãy số
c) Loại bỏ tác động của các yếu tố ngẫu nhiên.
d) Không có điều nào ở trên
4) Biểu đồ hình cột (Histograms) có đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện độ rộng của mỗi tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
5) Các biện pháp hạn chế sai số chọn mẫu:
a) Tăng số đơn vị tổng thể mẫu
b) Sử dụng phương pháp chọn mẫu thích hợp
c) Giảm phương sai của tổng thể chung
d) Cả a), c)
e) Cả a), b).
f) Cả a), b), c)
Trang 3CÂU 2:
1 Tính số công nhân cần được điều tra để đặt định mức.
Đây là trường hợp xác định cỡ mẫu đối với số trung bình
σ = 6 ; Error = ± 1 ; Gọi n là số công nhân cần được điều tra, ta có :
2
2 2
Error
Z
Với độ tin cậy 95%, tra bảng Z ta được: Z = 1,645 Thay vào công thức trên ta được:
n = 1,6452
* 62 / 12 = 97,42 ≈ 98 (công nhân)
Để đặt định mức năng suất, với khoảng ước lượng có sai số bằng 1 và độ tin cậy là 95%, số công nhân cần được điều tra ít nhất phải là 98
2 Ước lượng năng suất trung bình một giờ của toàn bộ công nhân.
Giả thiết: tổng thể chung (năng suất trung bình một giờ một người của mọi công nhân trong doanh nghiệp) là phân phối chuẩn
a) Ước lượng năng suất trung bình một giờ của toàn bộ công nhân với độ lệch tiêu chuẩn của tổng thể chung là 6 :
n = 98
σ = 6
Ta có công thức: X - zα /2 *
n
σ
≤ μ ≤ X + zα /2 *
n
σ
công thức trên ta có :
35 – 1,960 *
98
6
≤ μ ≤ X + zα /2 *
n
σ
b) Ước lượng năng suất trung bình một giờ của toàn bộ công nhân với độ lệch tiêu chuẩn tổng thể mẫu là 6,5:
n = 98
s = 6,5
Ta có công thức: X - tα /2,n-1 *
n
s
≤ μ ≤ X + tα /2,n-1 *
n s
công thức trên ta có :
35 – 1,985 *
98
5 , 6
≤ μ ≤ 35 + 1,985 *
98
5 , 6
Kết hợp a) và b) ta có :
Kết luận: Với mẫu đã điều tra, ở độ tin cậy 95% có thể nói năng suất trung bình một
giờ của toàn bộ công nhân sẽ từ 33,8 sản phẩm đến 36,2 sản phẩm
Trang 4CÂU 3:
Gọi :
n1, X1là số học sinh, điểm trung bình của các học sinh nhóm 1 n1=25; X1= 8,1
n2, X2là số học sinh, điểm trung bình của các học sinh nhóm 2 n2=20; X2=7,8
S1, S2 là độ lệch tiêu chuẩn về điểm của các học sinh nhóm 1, nhóm 2 S1= 0,7; S2=0,6
) 1 ( ) 1 (
) 1 ( ) 1 (
2 1
2 2 2
2 1 1 2
− +
−
− +
−
=
n n
S n S n
) 1 20 ( ) 1 25 (
6 , 0 ) 1 20 ( 7 , 0 ) 1 25
− +
−
− +
−
= 0,4326 Giả thiết cần kiểm định là : H0 : μ1 = μ2
H1 : μ1 ≠ μ2
Đây là trường hợp kiểm định so sánh hai trung bình của hai tổng thể chung với hai mẫu độc lập, mẫu nhỏ (n1,n2<30), tiêu chuẩn kiểm định sẽ là:
Với α = 0,05; t( α /2;n1+n2-2)= t(0,025;43)= ±2,0165
Vậy giá trị kiểm định không nằm trong vùng bác bỏ
Kết luận: Với mẫu điều tra ở mức ý nghĩa 0,05 chưa đủ cơ sở để nói rằng hai phương pháp dạy học trên có kết quả học tập như nhau Như vậy cũng chưa đủ cơ sở để nói rằng hai phương pháp dạy học trên có kết quả học tập khác nhau
CÂU 4:
1 Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf).
* Sắp xếp dữ liệu từ bé nhất đến lớn nhất:
3; 3,3; 3,7; 3,8; 4,5; 4,5; 4,7; 4,7; 4,8; 4,9; 5,1; 5,2; 5,3; 5,3; 5,7; 6,0; 6,1; 6,1; 6,2; 6,4; 6,4; 6,5; 6,6; 7,0; 7,2; 7,3; 7,3; 7,5; 7,8; 7,9
* Biểu diễn bằng biểu đồ thân lá (Stem and leaf).:
Phần thân Phần lá
3 0,3 0,3 0,7 0,8
4 0,5 0,5 0,7 0,7 0,8 0,9
5 0,1 0,2 0,3 0,3 0,7
Trang 56 0,0 0,1 0,1 0,2 0,4 0,4 0,5 0,6
7 0,0 0,2 0,3 0,3 0,5 0,8 0,9
2 Xây dựng bảng tần số phân tổ với 5 tổ có khoảng cách tổ bằng nhau.
* Tìm khoảng biến thiên: 7,9 – 3,0 = 4,9
* Chọn số tổ: 5
* Tính khoảng cách tổ (độ rộng): 4,9/5 = 0,98 làm tròn lên = 1
* Xác định giới hạn tổ: 3, 4, 5, 6, 7, 8
* Tính trị số giữa: 3,5; 4,5; 5,5; 6,5; 7,5
* Đếm số quan sát và đưa vào các tổ
* Từ các dữ liệu trên ta có Bảng tần số phân bổ sau:
Khối lượng sản phẩm
thép (triệu tấn)
Số tháng có khối lượng sản phẩm thép tương ứng
3.Vẽ đồ thị tần số và cho nhận xét sơ bộ về khối lượng sản phẩm thép trong 30 tháng nói trên.
Trang 6Nhận xét: Trong 30 tháng trên, có 8 tháng nhà máy sản xuất sản phẩm thép đạt từ 6 đến dưới
7 triệu tấn (trị số giữa theo đồ thị là 6,5 triệu tấn) Số tháng có khối lượng sản phẩm thép cao
là 7 tháng đạt từ 7 đến dưới 8 triệu tấn (trị số giữa theo đồ thị là 7,5 triệu tấn)
Chỉ có 4 tháng khối lượng thép giảm (từ 3 đến dưới 4 triệu tấn một tháng), nhìn vào bảng phân bổ tần số ta thấy những tháng nhà máy có khối lượng thép đạt cao chiếm đa số trong tổng số 30 tháng
4 Tính khối lượng sản phẩm thép trung bình từ tài liệu điều tra và từ bảng phân bổ tần số So sánh kết quả và giải thích:
* Tính khối lượng sản phẩm thép trung bình từ tài liệu điều tra:
Từ tài liệu điều tra, ta có khối lượng sản phẩm thép trung bình là:
* Tính khối lượng sản phẩm thép trung bình từ bảng phân bổ tần số:
Khối lượng sản phẩm
thép (triệu tấn)
Số tháng có khối lượng sản phẩm thép tương ứng (Fi)
Trị số giữa
Từ bảng phân bổ tần số, ta có khối lượng sản phẩm thép trung bình là:
x2 = ∑Fi*Xi /∑ Fi = 173/30 = 5,76666 ≈ 5,767 triệu tấn/tháng
* So sánh kết quả và giải thích:
bình tính từ dữ liệu ban đầu nhỏ hơn khối lượng sản phẩm thép tính từ bảng phân bổ tần số Nguyên nhân: Nhìn vào sơ đồ thân lá ta thấy:
Có 1 tổ có khối lượng sản phẩm thép trung bình bằng trị số giữa
Có 3 tổ có khối lượng sản phẩm thép trung bình nhỏ hơn trị số giữa
Có 1 tổ có khối lượng sản phẩm thép trung bình lớn hơn trị số giữa
Vì vậy, số trung bình tính ra từ trị số giữa lớn hơn dữ liệu ban đầu Trường hợp này tính từ
dữ liệu ban đầu chính xác hơn
Trang 7CÂU 5:
Thử nghiệm của hãng là đánh giá mức độ ảnh hưởng của quảng cáo đối với doanh thu Như vậy ở đây biến nguyên nhân là % tăng chi phí quảng cáo, ta gọi là X, biến kết quả ở đây là % tăng doanh thu, ta gọi là Y, dữ liệu nghiên cứu thử nghiệm trên 5 vùng như sau:
Vùng % tăng chi phí
quảng cao(X)
% tăng Doanh thu (Y) (Xi - Xi)^2
Xi = 3,2
1.Từ dữ liệu trên, xây dựng mô hình hồi quy tuyến tính để biểu hiện mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu:
Vận dụng kỹ thuật phân tích REGRRESION của Exel có được kết quả trên bảng tính sau: SUMMARY OUTPUT
Regression Statistics
Adjusted R
ANOVA
Coefficient Standard t Stat P-value Lower 95% Upper
Trang 8s Error 95%
% tang Chi phi
1 Xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ này qua các tham số của
mô hình.
Phương trình hồi quy tuyến tính có dạng: Y∧i =b0+b1X i, trong đó:
∧
i
i
0
đến mức tăng doanh thu;
1
Từ dữ liệu đã cho, qua thao tác trên Exel ta có:
Coefficients
Vậy, phương trình hồi quy biểu hiện mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu là (lấy tròn số):
ŷi = 1,865 + 0,480* xi
tăng khoảng 0,480 đơn vị Có nghĩa, mỗi khi % tăng chi phí quảng cáo tăng lên 1 đơn vị thì
mô hình dự đoán rằng % tăng doanh thu mong đợi sẽ tăng khoảng 0,480 đơn vị
2.Kiểm định liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối liên quan tuyến tính hay không:
* Cặp giả thiết cần kiểm định là:
Từ kết quả Exel cũng như công thức tính ta có :
Tiêu chuẩn kiểm định:
1
1 1
b
S
b
t = −β
=
−
=
n i i
yx b
X X
S S
1
1
)
Trang 9Ra quyết định bác bỏ H0 nhận H1
Kết luận: thực sự có mối liên hệ tương quan tuyến tính giữa % tăng chi phí quảng cáo và % tăng doanh thu
β1= b1 ± tn-2 * Sb1
Với số bậc tự do là 3(n-2 = 5-2=3), lấy số liệu từ bảng tính ta có:
Lower 95% Upper 95%
0,2208 ≤ β1 ≤ 0,7387
Vậy ta nói mỗi khi % tăng chi phí quảng cáo tăng lên 1 đơn vị thì thì doanh thu nói chung tăng lên khoảng từ 0,2208 đến 0,7387 %
Sai số của mô hình:
Qua thao tác trên Exel ta có:
Regression Statistics
3.Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên:
Hệ số xác định dùng để đánh giá sự phù hợp của mô hình:
r2 = SSR/SST
SST: Tổng bình phương chung
SSR: Tổng bình phương được giải thích bằng hồi quy
∑(yi – ŷ)
Syx = (n-2)
Trang 10Giải thích: 92,06% sự thay đổi của % tăng doanh thu (Y) được giải thích bởi % tăng chi phí
b) Đánh giá cường độ của mối liên hệ:
Đánh giá cường độ của mối liên hệ qua mối tương quan:
r = + 0,9595 (vì b1 dương) > 0,9
Vậy ta kết luận rằng mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu là mối liên hệ tương quan tuyến tính thuận và rất chặt chẽ
4 Dự đoán tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5% với xác suất tin cậy 95%:
a) Dự đoán giá trị trung bình của tỷ lệ % tăng doanh thu:
- Gọi Y∧ là giá trị trung bình của tỷ lệ % tăng doanh thu khi tỷ lệ tăng chi phí quảng cáo
là 5% Ta có:
∑
=
−
∧
∧
−
− +
±
i i
i yx
n i
X X
X X n S t Y Y
1
2
2 )
2 (
) (
) (
1
(1)
= 1,8648 + 0,47973 × 5% = 4,2635 (%)
- Tra bảng ta có tn-2= t3= 3,182
=
2 5
1
) (X i X
i
14,8 Thay các giá trị vào biểu thức (1) ta có :
=
− +
±
=
∧
8 , 14
) 2 , 3 5 ( 5
1 313 , 0
* 182 , 3 265 ,
3,6189 ≤Y∧ ≤ 4,9082 (đơn vị tính %)
Kết luận: Nếu tỷ lệ tăng chi phí quảng cáo là 5% thì giá trị trung bình của tỷ lệ % tăng
doanh thu sẽ khoảng từ 3,62% đến 4,91% với độ tin cậy 95%
b) Dự đoán cho điểm cá biệt:
Ta có:
∑
=
−
∧
∧
−
− +
+
±
i i
i yx
n i
X X
X X n
S t Y Y
1
2
2 )
2 (
) (
) (
1 1
(2)
- Với các giá trị đã có được ở trên, thay vào biểu thức (2) ta được:
∧
Trang 113,0771 ≤Y∧ ≤ 5,4499
Kết luận: Nếu tỷ lệ tăng chi phí quảng cáo là 5% thì tỷ lệ % tăng doanh thu sẽ khoảng
từ 3,08% đến 5,45% với độ tin cậy 95%