Luật số lớn cũng chỉ ra rằng, khi ta chọn ngẫu nhiên các giá trị trong một dãy các giá trị, kích thước dãy mẫu thử càng lớn thì các đặc trưng thống kê của mẫu thử càng chinh xác với các
Trang 1BÀI TẬP CÁ NHÂN Môn học: Thống kê trong kinh doanh Học viên: Nguyễn Đức Bình Lớp: GAMBA 01.X0210
Câu 1:
A Trả lời đúng (Đ), sai (S) và giải thích tại sao?
1 Xác định tổng thể thống kê là để xem tổng thể đó là đồng chất hay không đồng
chất
Câu này sai vì xác định tổng thể thống kê nhằm đưa ra giới hạn về phạm vi
nghiên cứu cho người nghiên cứu
2 Điều tra chọn mẫu là một trường hợp vận dụng quy luật số lớn
Câu này đúng vì mẫu càng lớn thì càng chính xác Luật số lớn cũng chỉ ra rằng,
khi ta chọn ngẫu nhiên các giá trị trong một dãy các giá trị, kích thước dãy mẫu thử càng lớn thì các đặc trưng thống kê của mẫu thử càng chinh xác với các đặc trưng thống
kê của quần thể
3 Tốc độ phát triển trung bình là trung bình cộng của các tốc độ phát triển liên
hoàn
Câu này sai vì tốc độ phát triển trung bình được tính theo công thức số bình
quân nhân, thường dùng với các biến số có quan hệ tích
4 Nghiên cứu sự biến động của số trung bình qua thời gian cho thấy xu hướng
phát triển của hiện tượng
Câu này đúng vì số bình quân được dùng để nghiên cứu các quá trình biến động
qua thời gian, nhất là các quá trình sản xuất Sự biến động của số bình quân qua thời gian có thể cho thấy được xu hướng phát triển cơ bản của hiện tượng số lớn, tức là của đại bộ phận các đơn vị tổng thể, trong khi từng đơn vị cá biệt không thể giúp ta thấy rõ điều này Qua dãy số thời gian có thể phân tích đặc điểm biến động của hiện tượng qua thời gian, phân tích tính quy luật của sự phát triển hiện tượng bằng các mô hình Trên
cơ sở nhận thức đặc điểm và tính quy luật biến động của hiện tượng có thể thực hiện các dự đoán cho mức độ của hiện tượng trong tương lai
5 Liên hệ tương quan là mối liên hệ không hoàn toàn chặt chẽ
Trang 2Câu này đúng vì cứ mỗi giá trị của tiêu thức nguyên nhân cho ta nhiều giá trị
của tiêu thức kết quả
B Chọn các phương án trả lời đúng:
1 Ước lượng là: (Phương án (c) là phương án đúng).
c) Từ các tham số của tổng thể mẫu suy luận cho các tham số tương ứng của tổng thể chung
2 Những loại sai số có thể xảy ra trong điều tra chọn mẫu là: (cả 3 phương án (a), (b), (c) đều đúng).
a) Sai số do ghi chép
b) Sai số do số lượng đơn vị không đủ lớn
c) Sai số do mẫu được chọn không ngẫu nhiên
3 Khi xác định số đơn vị mẫu điều tra để ước lượng số trung bình, nếu không
biết phương sai của tổng thể chung thì có thể: (Phương án (a) là phương án đúng).
a) Lấy phương sai lớn nhất trong các lần điều tra trước
4 Hệ số hồi quy phản ánh: (Phương án (b) là phương án đúng).
(b) Ảnh hưởng của tiêu thức nguyên nhân đang nghiên cứu đến tiêu thức kết quả
5 Đại lượng nào phản ánh chiều hướng của mối liên hệ tương quan: (Phương án
(a) là phương án đúng).
a) Hệ số tương quan
Câu 2: Một doanh nghiệp muốn ước lượng trung bình năng suất một giờ công là
bao nhiêu sản phẩm Một mẫu gồm 60 công nhân được chọn ngẫu nhiên cho thấy năng suất trung bình một giờ công là 30 sản phẩm với độ lệch tiêu chuẩn là 5
1) Tìm khoảng ước lượng cho năng suất trung bình một giờ công của công nhân doanh nghiệp trên độ tin cậy là 95%
2) Nếu ông chủ doanh nghiệp đặt ra tiêu chuẩn là sẽ sa thải những công nhân có mức năng suất một giờ công thấp hơn 25 sản phẩm thì liệu việc sa thải này có xảy ra không:
Tóm tắt đầu bài:
n = 60 công nhân = 60 (CN)
X = 30 sản phẩm /công nhân = 30 (SP/CN)
S = 5
Giải: α – 1 = 95% = 0,95 => α = 0,005 => α/2 = 0,025
Trang 31: Tìm khoảng ước lượng cho năng suất trung bình một giờ của công nhân doanh
nghiệp trên độ tin cậy là 95% Vì chưa biết phương sai tổng thể chung, mẫu lớn do đó
để ước lượng cho năng xuất trung bình của tổng thể chung ta áp dụng công thức: |µ| ≤ X ± t α/2;(n-1) * s/√n
Tra bảng t α/2;(n-1) = 2.001
Thay số: |µ| ≤ 30 ± 2001 x 5/√60
|µ| ≤ 30 ± 1,29164
⇔ 28,7084 Sp/h ≤ |µ| ≤ 31,29164 Sp/h
Kết luận: Vậy với độ tin cậy là 95%, năng suất lao động trung bình 01 giờ công
lao động của 01 công nhân trong doanh nghiệp nằm trong khoảng từ 28.7084 sản phẩm đến 31.29164 sản phẩm
2 Nếu ông chủ doanh nghiệp đặt ra tiêu chuẩn là sẽ sa thải những công nhân có
mức năng suất một giờ công thấp hơn 25 sản phẩm thì việc sa thải này sẽ không xảy ra
vì năng suất lao động của công nhân hiện tại nằm trong khoảng từ 28,7084 sản phẩm đến 31,29164 sản phẩm đều cao hơn mức năng suất lao động định sa thải
Câu 3: Doanh nghiệp sản xuất xe máy PS xây dựng hai phương án sản xuất một
loại sản hay không người ta tiến hành sản xuất thử và thu được kết quả như sau : (triệu đồng/sản phẩm)
Phương án 1 : 24 27 25 29 23 26 28 30 32 34 38 26
Phương án 2 : 26 32 35 38 35 26 30 28 24 26
Cho rằng chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn Với độ tin cậy 95% hãy rút ra kết luận về hai phương án trên
Bài làm
Chi phí trung bình của hai phương án sản xuất (triệu đồng/sản phẩm)
Đây là bài toán về kiểm định giả thiết nên chúng ta sẽ phải thực hiện theo các bước tiến hành kiểm định
Ta đặt giả thiết: H0 µ1 = µ2
H1 µ1 # µ2 Trong đó: µ1 là chi phí trung bình của phương án 1
Trang 4µ2 là chi phí trung bình của phương án 2
Sử dụng Excel ta xác định được một số mức độ điển hình trong thống kê như sau:
28.300 0
Sample Variance
12.8106
Confidence Level(95.0%) 2.2741 Confidence Level(95.0%) 2.0801
Từ kết quả có được qua sử dụng Excel, ta có một số dữ liệu của hai phương án sản xuất như sau:
Phương án 1 Phương án 2
Trang 5X2 28.30
Nhận định, đây là trường hợp kiểm định khi biết trung bình mẫu và phương sai mẫu; phân phối theo quy luật chuẩn; n1 và n2 < 30; Tiêu chuẩn kiểm định được chọn là thống kê t:
Áp dụng công thức tính t:
trong đó: s2 là giá trị chung của hai phương sai mẫu s1 và s2, ta có:
) 1 (
) 1 (
) 1 (
) 1 (
2 1
2 2 2
2 1 1
2
− +
−
− +
−
=
n n
s n
s n
s
= ((12-1)12.81 + (10-1)8.46)/(12+10-2) = 10.8525 Thay s2 vào công thức t ta có:
ttt = (28.0833-28.300)/sqrt(10.8525/12+10.8525/10)
ttt = - 0.1536 Với mức ý nghĩa α = 0.05 ta có: t (0.05, n1+n2-2) = t (0.05, 20) = 1.725
Vì ttt = 0.1536 < 1.725 = t (0.5, n1+n2-2), do đó không đủ cơ sở để bác bỏ H0
Kết luận: Do X1 < X2 => µ1 < µ2 Với các mẫu đã cho, độ tin cậy 95% ta có thể nói có căn cứ để cho rằng chi phí trung bình của phương án 2 cao hơn chi phí trung bình của phương án 1
Câu 4: Dưới đây là dữ liệu về khối lượng than khai thác được trong 30 tháng gần
đây của một nhà máy (đơn vị: triệu tấn):
1 Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf)
2 Xây dựng bảng tần số phân bổ với 5 tổ có khoảng cách bằng nhau
2
2
1
2
2 1
s s
n n
x x
t
+
−
=
Trang 63 Vẽ đồ thị tần số và cho nhận xét sơ bộ về khối lượng sản phẩm thép trong 30 tháng nói trên
4 Tính khối lượng sản phẩm thép trung bình 1 tháng từ tài liệu điều tra và từ bảng phân bố tần số So sánh kết quả và giải thích
Bài làm
1 Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf).
Từ số liệu bài ra, ta sắp xếp lại các dữ liệu về khối lượng sản phẩm thép theo mức
độ tăng dần như sau:
3.0 3.7 3.8 4.0 4.0 4.5 4.7 4.7 4.8 4.9 5.0 5.0 5.1 5.2 5.3 5.7 6.0 6.0 6.1 6.1 6.4 6.4 6.5 6.6 7.0 7.0 7.2 7.3 7.5 7.8
Ta có biểu đồ thân lá như sau:
Biểu đồ thân lá cho ta thấy tần số xuất hiện của các biến khi được chia khoảng
2 Xây dựng bảng tần số phân bổ với 5 tổ có khoảng cách bằng nhau:
Ta có: Số tổ = 5 ; khoảng cách tổ = 0,96
Từ đầu bài ta có bảng sau:
fi
Tần suất (%)
Tần số tích luỹ
Tần suất tích luỹ
%
Trang 7Tổng 30 100
3 Vẽ đồ thị tần số và cho nhận xét sơ bộ về khối lượng sản phẩm thép trong 30
tháng nói trên:
Ta thực hiện phân tổ theo tiêu thức khối lượng sản phẩm thép:
Khoảng cách tổ = (Xmax – Xmin)/5 = (7.8 – 3.0)/5 = 0.96
Từ đó ta xác định được miền bin như sau:
Bin 3.96 4.92 5.88 6.84 7.8 8.76
Sử dụng Excel vẽ đồ thị tần số ta được:
Bin
Frequenc y
Cumulativ
Frequenc y
Cumulativ
e %
Trang 8Ta thấy đồ thị thể hiện, trong 30 tháng gần đây, khối lượng sản phẩm thép trong khoảng 6.84 tấn đến 7.8 tấn chiếm tỷ trọng cao nhất (26.67%), sau đó là khoảng từ 4.92 tấn đến 5.88 tấn ( 23.33%) và thấp nhất là khoảng từ 3.96 tấn đến 4.92 tấn ( 10%)
4 Tính khối lượng sản phẩm thép trung bình 1 tháng từ tài liệu điều tra và từ
bảng phân bố tần số:
Khối lượng thép trung bình 1 tháng từ tài liệu điều tra:
STT
Khối lượng SP
Khối lượng SP
(X)
Trang 915 5.3 30 7.8
x = 167.3 / 30 = 5.576 (triệu tấn)
Khối lượng thép trung bình 1 tháng từ bảng phân bố tần số:
STT Khối lượng thép (triệu tấn)
Trị số giữa Xi (triệu tấn)
Tần số fi (số tháng)
Tần suất (Xi*fi)
=> x = 172.0 / 30 = 5.733 (triệu tấn)
Giải thích: Kết quả trung bình tính theo phân bổ tần số có kết quả cao hơn so với
phương pháp tính trung bình từ tài liệu điều tra Độ chính xác của phương pháp tính từ bảng phân bố tấn số cao hơn tính từ bảng điều tra do có tính đến tần số phân bố Sở dĩ
có sự chênh lệch số lượng sản phẩm giữa tài liệu điều tra và bảng phân bố tần số là do chênh lệch của trị số giữa với trung bình thật của từng tổ
Câu 5:
1 Gọi doanh thu ngày là y, điểm kiểm tra là x Xác định phương trình hồi quy truyến tính:
= + x
Để xác định các hệ số, lập bảng tính sau:
Trang 109 27 9 243 81 729
Ta tính được: = - = 52,1 – (7,1)2 = 1,69
= - = 362,3 – (18,3)2 = 27,41
= ( - ) / = (136,0 – 7,1 x 18,3) / 1,69 = 3,59
= - = 18,3 – 3,59 x 7,1 = -7,19
Phương trình hồi quy tuyến tính: = -7,19 + 3,59 x
Kết luận: Phương trình cho biết khi điểm kiểm tra của ứng viên nhân viên bán
hàng tăng 1 điểm, doanh thu ngày của ứng viên đó tăng thêm 3,59 triệu đồng
2 Đánh giá cường độ của mối liên hệ bằng hệ số tương quan r:
r = ( - ) / ( x y) = (136,0 – 7,1 * 18,3) / (sqrt(1,69) *sqrt(27,41)) = 0,898
Kết luận: hệ số tương quan r có giá trị gần 1 nên giữa x và y có mối liên hệ
tương quan tuyến tính chặt chẽ
Đánh giá sự phù hợp của mô hình bằng hệ số xác định r2 = 0,898 hay 89,8%
Hệ số xác định cho biết 89,8% sự thay đổi của y được giải thích bởi mô hình vừa xác lập
3 Cặp giả thiết: H0: 1 = 0 (có mối liên hệ tương quan tuyến tính)
H1: 1 0 (không có mối liên hệ tương quan tuyến tính) Tiêu chuẩn kiểm định: t = (b1 - 1) / Sb1 trong đó, Sb1 là sai số chuẩn của hệ số b1:
S b1 =
là sai số chuẩn của mô hình: =
Sb1 = 1,97 / = 0,48
Từ đó, chuẩn kiểm định t = 4,55 / 0,48 = 9,48
Với độ tin cậy 95%, tức là /2 = 0,025 Tra bảng A2 ta được tα/2;n-2 = t0.025;8= 2,306
Trang 11Do = 9,48 > t0.025;8 nên bác bỏ H0.
Kết luận: Giữa các tiêu thức không thực sự có mối liên hệ tương quan tuyến tính
4 Ước lượng khoảng tin cậy cho yx:
Trong đó:
tα/2;n-2 = t0.025;8= 2,306
= 1,97
= 10
= 6
= 7,1
= -14,2 + 4,55 x 6 = 13,09
= 16,9
Thay các giá trị này vào công thức ước lượng được:
13,09 – 2,306 x 1,97 x 0,41 yx 13,09 + 2,306 x 1,97 x 0,41
11,21 yx 14,97
5 Kết luận: vì Giám đốc chỉ nhận người có mức Doanh thu tối thiểu là 15 triệu
đồng nên tại x= 6, ymin= 15 doanh thu nhỏ hơn mức doanh thu tối thiểu do vậy Người
có điểm kiểm tra đạt 6 điểm không được nhận vào làm việc