b Đảm bảo tính chất so sánh được giữa các mức độ trong dãy số.. Đ Vì nó biểu hiện số đơn vị được phân phối vào trong mỗi tổ, là số lần một lượng biến nhận một giá trị nhất định trong một
Trang 1BÀI TẬP CÁ NHÂN MÔN HỌC: THỐNG KÊ TRONG KINH DOANH
KHÓA HỌC: GaMBA01.X01 Học viên: Nguyễn Thanh Tùng - Lớp GaMBA01.X01_Nhóm 2
Câu 1: Đề bài
A Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1, Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu.
2, Tần số biểu hiện bằng số tuyệt đối.
3, Độ lệch chuẩn là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức
nghiên cứu của hai hiện tượng khác loại
4, Khoảng tin cậy cho tham số của tổng thể chung tỷ lệ nghịch với phương sai của
tổng thể
5, Phương pháp dãy số bình quân trượt không nên dùng trong dãy số có biến động
thời vụ
B Chọn phương án trả lời đúng nhất:
1, Các phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng nhằm:
a) Sắp xếp dãy số theo thứ tự tăng (hoặc giảm) dần
b) Đảm bảo tính chất so sánh được giữa các mức độ trong dãy số
c) Loại bỏ tác động của các yếu tố ngẫu nhiên
d) Không có điều nào ở trên
2, Ưu điểm của Mốt là:
a) San bằng mọi chênh lệch giữa các lượng biến
Trang 2b) Không chịu ảnh hưởng của các lượng biến đột xuất.
c) Kém nhậy bén với sự biến động của tiêu thức
d) Cả a), b)
e) Cả a), b), c)
3, Đại lượng nào phản ánh chiều hướng của mối liên hệ tương quan:
a) Hệ số tương quan
b) Hệ số chặn (b0 )
c) Hệ số hồi quy (b1 )
d) Cả a), b)
e) Cả a), c)
f) Cả a), b), c)
4, Biểu đồ hình cột (Histograms) có đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện độ rộng của mỗi tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
5, Các biện pháp hạn chế sai số chọn mẫu:
a) Tăng số đơn vị tổng thể mẫu
b) Sử dụng phương pháp chọn mẫu thích hợp
c) Giảm phương sai của tổng thể chung
d) Cả a), c)
e) Cả a), b)
f) Cả a), b), c)
Trang 3Trả lời:
A Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1 , Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu (Đ)
Vì nghiên cứu thống kê phải dựa trên đặc điểm của từng đơn vị tổng thể được chọn ra
để nghiên cứu tuỳ vào từng mục đích mà người nghiên cứu muốn có
Ví dụ: Tiêu thức thuộc tính như: giới tính, nghề nghiệp, dân tộc,… Tiêu thức số lượng như: Số nhân khẩu trong gia đình, tiền lương tháng của mỗi người lao động,
2 , Tần số biểu hiện bằng số tuyệt đối (Đ)
Vì nó biểu hiện số đơn vị được phân phối vào trong mỗi tổ, là số lần một lượng biến nhận một giá trị nhất định trong một tổng thể Nếu tần số biểu hiện bằng số tương đối thì gọi là tần suất
3 , Độ lệch chuẩn là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức nghiên cứu của hai hiện tượng khác loại (S)
Độ lệch chuẩn là một đại lượng thống kê mô tả dùng để đo mức độ phân tán của một tập hợp dữ liệu đã được lập thành bảng tần số Khi hai tập dữ liệu có cùng giá trị trung bình cộng, tập nào có độ lệch chuẩn lớn hơn là tập có dữ liệu biến thiên nhiều hơn Trong trường hợp hai tập dữ liệu có giá trị trung bình cộng không bằng nhau, thì việc
so sánh độ lệch chuẩn của chúng không có ý nghĩa
4 , Khoảng tin cậy cho tham số của tổng thể chung tỷ lệ nghịch với phương sai của tổng thể (Đ)
Phương sai của tổng thể chung:
Σ(xi – μ)2
σ 2 =
N
Trang 4Khoảng tin cậy:
n
Z
x n
Z
α α
2
−
5 , Phương pháp dãy số bình quân trượt không nên dùng trong dãy số có biến động thời
vụ (Đ)
Số bình quân trượt sử dụng để san bằng dãy số có nhiều biến động ngẫu nhiên Số bình quân trượt càng được tính từ nhiều mức độ thì càng có tác dụng san bằng ảnh hưởng của các yếu tố ngẫu nhiên, nhưng đồng thời làm cho số lượng các mức độ của dãy số bình quân trượt càng giảm, do đó ảnh hưởng đến việc biểu hiện xu hướng phát triển của hiện tượng Phương pháp này làm trơn nhẵn sự biến động thực tế nên không dùng với dãy số biến động thời vụ
B Chọn phương án trả lời đúng nhất.
1 , Các phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng nhằm:
d) Không có điều nào ở trên
2 , Ưu điểm của Mốt là:
b) Không chịu ảnh hưởng của các lượng biến đột xuất.
3 , Đại lượng nào phản ánh chiều hướng của mối liên hệ tương quan:
e) Cả a), c)
4 , Biểu đồ hình cột (Histograms) có đặc điểm:
e) Cả b) và c) đều đúng.
5, Các biện pháp hạn chế sai số chọn mẫu:
d) Cả a), c).
Trang 5Câu 2: Đề bài
Một doanh nghiệp muốn ước lượng trung bình một giờ một công nhân hoàn thành
được bao nhiêu sản phẩm để đặt định mức Giám đốc nhà máy muốn xây dựng khoảng ước lượng có sai số bằng 1 sản phẩm và độ tin cậy là 95%, Theo kinh nghiệm của ông
ta độ lệch tiêu chuẩn về năng suất trong một giờ là 6 sản phẩm Hãy tính số công nhân cần được điều tra để đặt định mức
Giả sử sau khi chọn mẫu (với cỡ mẫu được tính ở trên) số sản phẩm trung bình mà họ hoàn thành trong 1 giờ là 35 với độ lệch tiêu chuẩn là 6,5 Hãy ước lượng năng suất trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%
Trả lời:
Ta có công thức tính cỡ mẫu đối với số trung bình:
Z 2 σ 2
n =
Error 2
Theo đề bài cho ta có sai số Error = 1
Độ tin cậy = (1 – α) % = 95% → α = 5%
Độ lệch tiêu chuẩn về năng suất trong 1h là 6 sản phẩm tức là σ = 6
Tra bảng Z ta được Zα/2 = 1,96
Thay vào công thức trên ta có:
Z 2σ2 1,962 * 6 2
n = = = 138,298 ≈ 139
Error2 12
Vậy số công nhân cần được điều tra để đặt định mức là 139 công nhân
Với mẫu được chọn là 139 công nhân, theo đề bài cho ta có:
• Số sản phẩm trung bình mà họ hoàn thành trong 1h là 35 hay X = 35;
Trang 6• Độ lệch tiêu chuẩn σ = 6,5.
• Phương sai đối với tổng thể mẫu S2:
∑ (xi - x)2 6,52
S2 = = = 0,306 → S = 0,553
n - 1 139 – 1
• Ta gọi μ là năng suất trung bình 1h của toàn bộ công nhân.
• Khoảng ước lượng như sau:
S S
X - tα/2; (n-1) ≤ µ ≤ X + tα/2; (n-1)
√n √n
• Độ tin cậy = (1 – α) % = 95% → α = 5%, ta tra bảng t 0,025;(138) = 1,978 Thay vào ta được:
0,553 0,553
35 - 1,978 ≤ µ ≤ 35 + 1,978
11,789 11,789
→ 34,907 ≤ μ ≤ 35,093
Vậy, ước lượng năng suất trung bình một giờ của toàn bộ công nhân là
34,907 ≤ μ ≤ 35,093.
Trang 7Câu 3: Đề bài
Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản phẩm
Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay không người ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
Phương án 1: 25 32 35 38 35 26 30 28 24 28 26 30
Phương án 2: 20 27 25 29 23 26 28 30 32 34 38 25 30 28 Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn Với độ tin cậy 95% hãy rút ra kết luận về hai phương án trên
Trả lời:
Theo đề bài ta có: Hai tổng thể trên phân phối theo quy luật chuẩn; chưa biết phương sai của tổng thể chung; mẫu nhỏ n1 và n2 đều <30
Ta gọi μ1 - Chi phí trung bình sản xuất theo phương án 1
μ2 - Chi phí trung bình sản xuất theo phương án 2
H0: μ1 = μ2
Ta cần kiểm định giả thiết:
H1: μ1 ≠ μ2
Tiêu chuẩn kiểm định được chọn là thống kê t:
X1 – X2
t =
S2 S2
n1 n2
Trong đó: S2 là giá trị chung của hai phương sai mẫu S1 2 và S2 2
(n1 - 1)S1 2 + (n2 -1)S2 2
S2 =
n1 + n2 – 2
Trang 8Phương án 1:
Số
lần
Chi phí
(xi) Xi - X (Xi – X)2
Ta có X1 = 357 / 12 = 29,75
∑ (xi –X1)2 218,25
Tính được S12 = = = 19,841
n1 - 1 11
Trang 9
Phương án 2:
Số
lần
Chi phí
(xi) Xi - X
(Xi – X)2
Ta có X2 = 395 / 14 = 28,214
∑ (xi –X2)2 272,36
Tính được S22 = = = 20,951
n2 - 1 13
Trang 10(12 – 1)*19,84 + ( 14 – 1) * 20,95
Vậy S2 = = 20,442
12 + 14 – 2
29,75 – 28,214 1,54
Thay S2 vào ta tính được t = = = 0,864
20,442 20,442 1,779
12 14
Kiểm định hai phía: với mức ý nghĩa của kiểm định α theo đề bài,
độ tin cậy = (1 – α) % = 95% → α = 5%, ta tra bảng tìm giá trị của t α/2; (n1 + n2 – 2) →
t 0,025 (12 + 14 – 2) = 2,064
Ta thấy rằng │t │< t α/2; (n1 + n2 – 2) → chấp nhận giả thiết H0, bác bỏ giả thiết H1
Kết luận: Chi phí trung bình của hai phương án như nhau.
Câu 4: Đề bài
Dưới đây là dữ liệu về khối lượng than khai thác được trong 30 tháng gần đây của một nhà máy (đơn vị: triệu tấn):
1 Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf)
2 Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu trên
3 Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
Trang 114 Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra
và từ bảng phân bố tần số So sánh kết quả và giải thích
Trả lời:
1, Biểu diễn bằng sơ đồ thân lá (Stem and leaf):
Ta sắp xếp lại số liệu về khối lượng than khai thác được trong 30 tháng theo thứ tự tăng dần:
3 3,7 3,8 4,5 4,5 4,7 4,7 4,8 4,9 5,1 5,2 5,3 5,3 5,7 6
6,1 6,1 6,2 6,4 6,4 6,5 6,6 7 7,2 7,3 7,3 7,5 7,8 7,9 12,3 Thân Lá 3 0 7 8
4 5 5 7 7 8 9
5 1 2 3 3 7
6 0 1 1 2 4 4 5 6
7 0 2 3 3 5 8 9
8
9
10
11
12 3
2, Xây dựng bảng phân bố tần số phù hợp với bộ dữ liệu trên:
Lựa chọn tiêu thức phân tổ là tiêu thức số lượng: Khối lượng than khai thác
Khoảng biến thiên: 12,3 – 3 = 9,3
Chọn số tổ: 5
Khoảng cách tổ: 9,3/5 = 1,86 ≈ 2
Căn cứ vào các dữ liệu ở trên ta xây dựng bảng phân bố tần số như sau:
Trang 12Khối lượng
(triệu tấn)
Trị số giữa
(triệu tấn)
Tần số
(số tháng)
Tần suất
(%)
3, Xem xét bộ dữ liệu trên có dữ liệu đột xuất không:
Dựa vào bộ dữ liệu trên với sơ đồ thân lá và bảng tần số phân bố ta thấy dữ liệu 12,3 (triệu tấn) là dữ liệu đột xuất, vì:
Ở sơ đồ thân lá, ta thấy khối lượng than khai thác phổ biến nhất là từ 6 đến dưới 8 triệu tấn, còn lại là ở dưới mức này và chỉ có 1 tháng có khối lượng than khai thác lên đến 12,3 triệu tấn
Ở bảng phân bố tần số, ta thấy có tới 29/30 tháng (chiếm 96,67%) có khối lượng than khai thác nằm trong khoảng từ 3 đến dưới 9 triệu tấn, sự phân bố tập trung ở khoảng đầu trong đó phần chiếm tỷ trọng lớn nhất là số tháng có khối lượng than khai thác từ 5 đến dưới 7 triệu tấn (chiếm 43,33%) Đặc biệt chỉ có một tháng có khối lượng than khai thác là 12,3 triệu tấn ( chiếm 3,33%)
Vậy qua phân tích trên, ta thấy dữ liệu 12,3 (triệu tấn) là dữ liệu đột xuất
Trang 134, Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra và từ bảng phân bố tần số So sánh kết quả và giải thích.
Từ tài liệu điều tra ban đầu ta tính được:
Tổng khối lượng than khai thác của 30 tháng là: ∑30
1
i
x = 179,8 (triệu tấn)
∑301 x i 179,8
Khối lượng than khai thác trung bình 1 tháng là: X = =
30 30
= 5,993 (triệu tấn).
Từ bảng phân bố tần số ta có:
Khối lượng
(triệu tấn)
Trị số giữa
( fi )
Tần số
( Xi )
Tần số phân bổ
( fi * X i )
182
Khối lượng than khai thác trung bình 1 tháng là: X = = 6,067 (triệu tấn).
30
So sánh khối lượng khai thác than trung bình 1 tháng trong thực tế thấp hơn giá trị tính
từ bảng phân bổ tần số Những lỗi trong tính trung bình từ bảng phân bổ tần số là không thể thiếu và đó là giới hạn khi đánh giá giá trị tổng thể từ mẫu tổng thể
Câu 5: Đề bài
Trang 14Một hãng trong lĩnh vực kinh doanh dầu gội đầu thực hiện một thử nghiệm để đánh giá mức độ ảnh hưởng của quảng cáo đối với doanh thu Hãng cho phép tăng chi phí quảng cáo trên 5 vùng khác nhau của đất nước so với mức của năm trước và ghi chép lại mức độ thay đổi của doanh thu ở các vùng như sau:
1 Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ này qua các tham số của mô hình
2 Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối liên hệ tương quan tuyến tính không?
3 Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên
4 Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo
là 5% với xác suất tin cậy 90%
Trả lời:
1, Xác định phương trình hồi quy:
Vẽ biểu đồ xem xét mối liên hệ:
Nhìn trên biểu đồ ta thấy đồ thị có mối liên hệ tuyến tính - đường thẳng đi lên,
→ Phương trình hồi quy có dạng: Y = b0 + b1 X
Tính toán các tham số, sử dụng phương pháp bình phương nhỏ nhất:
0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5
Trang 15STT X Y XY X 2 Y 2
Giải hệ phương trình: ∑ y = b0*n + b1*∑x
∑ xy = b0*∑x + b1*∑x2
Từ dữ liệu ở bảng trên, thay số vào phương trình ta được:
16,5 = 5b0 +16b1 b0 = 2,068
58,5 = 16b0 + 66b1 b1 = 0,385
Vậy ta có phương trình hồi quy: Y = 2,068 + 0,385X.
Ta cũng có thể dùng Excel, hồi quy bằng hàm Regression, ta có được bảng sau:
SUMMARY OUTPUT
Regression Statistics
ANOVA
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
Trang 16Phương trình hồi quy: Y = 2,068 + 0,385X.
Giải thích ý nghĩa các tham số:
b0 = 2.068: Phản ánh ảnh hưởng của tất cả các nhân tố khác ngoài nhân tố % tăng chi phí quảng cáo ảnh hướng tới % tăng doanh thu
b1 = 0,385: Phản ánh ảnh hưởng của % tăng chi phí quảng cáo tới % tăng doanh thu
Cụ thể mỗi khi % chi phí quảng cáo tăng lên 1 đơn vị thì % tăng doanh thu tăng lên 0,385 đơn vị
2, Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực
sự có mối liên hệ tương quan tuyến tính không?
Để thử nghiệm các giả thiết trong tất cả các yêu cầu, ta thiết lập cặp thử nghiệm giả thiết như sau:
Cặp giả thiết kiểm định: H0: β1 = 0 ( Không có mối liên hệ tuyến tính)
H1: β1 ≠ 0 ( Có mối liên hệ tuyến tính)
Tiêu chuẩn kiểm định:
bl S
b
t = 1 −β1 Từ Excel ta thấy t = 7,929
Khoảng tin cậy 95% → α = 5% Tra bảng t → t(α/2; n-2) = t(0,025; 3) = 3,182
Qua so sánh ta có t > t(α/2; n-2) → chấp nhận H0 bác bỏ H1
3, Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.
Ta thấy SST = 2,3 mối liên hệ của Y quanh giá trị trung bình Y
SSR = 2.1953, mối liên hệ giữa X và Y tương đối chặt chẽ
SSE = 0,1047 nhỏ, chứng tỏ các nhân tố khác tới Y rất nhỏ
Sự phù hợp của mô hình r2 = SSR/SST = 0,954, hay tra bảng Excel r2 = 0,954
Trang 1795% sự thay đổi về % tăng doanh thu có thể được giải thích bằng sự thay đổi về
% tăng chi phí quảng cáo
4, Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5% với xác suất tin cậy 90%.
∑
=
−
∧
−
− +
+
×
×
i
y n
i
X Xi
X Xi n
S
t
Y
1
2
2 2
1 1
χ
Syx = 0,187 với X = 5%
i
Y∧ = 2,068 + 0,385*5 = 3,993
X = 3,2 → tra bảng t ta có t(α/2; n-2) = 2.353
Vậy khoảng tin cậy là:
24 3 5
1 1 353 2 993 3
1 1
1
2
2
−
− +
+
×
×
±
∑
=
−
∧
n i
y n
i
X Xi
X Xi n
S
t