Tốc độ tăng giảm trung bình được tính theo công thức số bình quân nhân; trong khí đó trung bình của các lượng tăng giảm tuyệt đối liên hoàn lại được tính theo số bình quân cộng.. Vì: Từ
Trang 1BÀI TẬP CÁ NHÂN MÔN THỐNG KÊ Học viên: Lê Văn Hinh
Lớp: GaMBA01.M04
Câu 1: Lý thuyết (2đ)
A. Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1) Xác định tổng thể thống kê là để xem tổng thể đó là tiềm ẩn hay bộc lộ
Sai, vì: Xác định tổng thể thống kê là để đưa ra giới hạn về phạm vi cho người nghiên cứu Tính “bộc lộ” hay “tiềm ẩn” chỉ là chỉ là tiêu chí để phân loại tổng thể thống kê căn cứ vào
sự nhận biết các đơn vị trong tổng thể
2) Tốc độ tăng (giảm) trung bình là trung chính là trung bình của các lượng tăng (giảm) tuyệt đối liên hoàn
Sai vì : Tốc độ tăng (giảm) trung bình phản ánh tốc độ tăng ( giảm) đại diện cho các tốc độ tăng (giảm) liên hoàn Tốc độ tăng (giảm) trung bình được tính theo công thức số bình quân nhân; trong khí đó trung bình của các lượng tăng (giảm) tuyệt đối liên hoàn lại được tính theo số bình quân cộng
3) Liên hệ tương quan là mối liên hệ không hoàn toàn chặt chẽ
Đúng vì: Liên hệ tương quan là mối liên hệ không hoàn toàn chặt chẽ giữa tiêu thức nguyên nhân và tiêu thức kết quả: cứ mỗi giá trị của tiêu thức nguyên nhân sẽ có nhiều giá trị tương ứng của tiêu thức kết quả Các mối liên hệ này có mối liên hệ không hoàn toàn chặt chẽ 4) Tần suất biểu hiện bằng số tương đối
Đúng Vì: Tần suất được biểu hiện bằng số tương đối, việc sử dụng số tương đối trong thống kê giúp cho việc mô tả, phân tích các kết cấu, quan hệ so sánh, của các hiện tượng trong nghiên cứu có tính khái quát hơn
5) Trung bình tính tài liệu ban đầu không chính xác bằng từ dãy số phân tổ (bảng phân bổ tần số)
Sai Vì: Từ tài liệu ban đầu, sau khi phân tổ theo một tiêu thức số lượng nào đó, các đơn vị trong tổng thể được phân phối vào trong các tổ và ta sẽ có một phân bố thống kê theo tiêu thức đó và dược biểu diễn thành bảng phân bổ tần số
Trang 2B Chọn phương án trả lời đúng nhất:
1.Ước lượng là:
a.Việc tính toán các tham số của tổng thể mẫu
b.Từ các tham số của tổng thể chung suy luận cho các tham số của tổng thể mẫu
c.Từ các tham số của tổng thể mẫu suy luận cho các tham số tương ứng của tổng thể chung
d.Cả a và b
e.Cả a và c
f.Cả a, b, c
Chọn : c
2.Các phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng nhằm:
a Sắp xếp dãy số theo thứ tự tăng (hoặc giảm) dần
b Đảm bảo tính chất so sánh được giữa các mức độ trong dãy số
c.Loại bỏ tác động của các yếu tố ngẫu nhiên
d.Không có điều kiện nào ở trên
Chọn: c
3.Đại lượng nào phản ánh chiều hướng của mối liên hệ tương quan:
a Hệ số tương quan
b Hệ số chặn (b0)
c Hệ số hồi quy (b1)
d Cả a và b
e Cả a và c
f Cả a, b, c
Chọn : a
4.Biểu đồ hình cột (Histograms) có đặc điểm:
a Giữa các cột có khoảng cách.
b Độ rộng của cột biểu thị độ rộng của mỗi tổ
c Chiều cao của cột biểu thị tần số
d Cả a và b đều đúng.
e Cả b và c đều đúng.
f Cả a, b, c đều đúng.
Chọn : e
5.Muốn giảm sai số chọn mẫu, ta có thể:
a Tăng số đơn vị tổng thể mẫu
b Giảm phương sai của tổng thể chung
c Sử dụng phương pháp chọn mẫu thích hợp
d Cả a và c
e Cả a và b
f Cả a, b và c
Chọn: d
Câu 2 (1,5 đ)
Trang 3Một nhà xuất bản muốn ước lượng trung bình một giờ một nhân viên đánh máy được bao nhiêu trang giấy Mẫu gồm 50 nhân viên được chọn ngẫu nhiên cho thấy số trang trung bình mà họ đánh được là 32 với độ lệch chuẩn là 6
1 Tìm khoảng ước lượng cho số trang trung bình mà một nhân viên nhà xuất bản đánh máy được trong một ngày với xác suất tin cậy là 99%
2 Nếu một người quản lý lao động đặt ra tiêu chuẩn là chỉ tuyển thêm những người có
số trang đánh máy ít nhất là 35 có nên không ?
Bài làm
1.Theo bài ra ta có :n = 50 nhân viên ; Ẍ = 32 trang , s = 6
Xác suất tin cậy là 99% 1- = 99% => =1% ( kiểm định 2 phía)
Trường hợp chưa biết phương sai tổng thể chung, mẫu lớn, áp dụng công thức:
n
s t
x n
s t
x /2;(n1) /2;(n1)
n- 1 = 50 – 1 = 49
t /2;(n-1) n-1) = 2,68
29.77234,278 trang/nhân viên
Với xác suất tin cậy là 99% số trang trung bình mà một nhân viên của nhà xuất bản đánh máy được trong một ngày là từ 29,7 đến 34,2 trang
2.Nếu một người quản lý lao động đặt ra tiêu chuẩn là chỉ tuyển thêm những người có số trang đánh máy ít nhất là 35 là không nên vì kết quả ở trên cho thấy trung bình 1 nhân viên đánh máy được tối đa 34,2 trang trong một ngày
Câu 3 (1,5đ)
Tại một doanh nghiệp người ta xây dựng 2 phương án sản xuất một loại sản phẩm
Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay không người
ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
Phương án 1: 25 32 35 38 35 26 30 28 24 28 26 30
Phương án 2: 20 27 25 29 23 26 28 30 32 34 38 25 30 28 Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn Với độ tin cậy 95% hãy rút ra kết luận về hai phương án trên
Trang 4Mean 29.75 Mean 28.2143
Standard Error 1.28585 Standard Error 1.2233
Standard Deviation 4.45431 Standard Deviation 4.57718
Sample Variance 19.8409 Sample Variance 20.9505
Kurtosis -0.7534 Kurtosis 0.63358
Skewness 0.55408 Skewness 0.39472
Gọi µ1 là chi phí trung bình của phương án sản xuất1 ;
µ2 là chi phí trung bình của phương án sản xuất 2
Cặp giả thiết cần kiểm định là : H0: 1 = 2
H1:
Đây là kiểm định giá trị trung bình của hai tổng thể chung khi chưa biết phương sai của hai tổng thể chung 1 và 2 trong trường hợp mẫu nhỏ ( n1 =12; n2 = 14, đều < 30) Do
đó, tiêu chuẩn kiểm định được chọn là thống kê t
Ta có giá trị chung của hai phương sai mẫu (Sp) :
(n1 – 1)S12+ (n2 -1) S22 11*19,841 + 13 *20,951
Sp2 = =
(n1- 1)+ (n2 -1) 11 + 13
Sp2 = 20,4417 Sp = 4,521
Tính toán tiêu chuẩn kiểm định với mức ý nghĩa α = 0.05:
29,75 – 28,21
ttính toán =
4,521* 1 / 12 1 / 14
ttính toán = 0,8661
Có mức ý nghĩa α = 0.05 => α/2 = 0,025
df = (12+14) - 2 = 24
Tra bảng kiểm định t có giá trị tới hạn t α/2; n1+n2-2 = t 0,025, 24 = 2,064
Trang 5Vậy │tt t│= 0,8661 < t 0,025, 24 = 2,064
=> Chấp nhận giả thiết Ho, tức là chi phí trung bình của hai phương án là không khác nhau
Kết luận: Với mức ý nghĩa 0,05 kết quả kiểm định thống kê cho thấy chi phí trung bình
của hai phương án là giống nhau
Câu 4 (2,5đ)
D ư i ây l d li u v kh i l à dữ liệu về khối lượng sản phẩm thép trong 30 tháng gần đây ữ liệu về khối lượng sản phẩm thép trong 30 tháng gần đây ệu về khối lượng sản phẩm thép trong 30 tháng gần đây ề khối lượng sản phẩm thép trong 30 tháng gần đây ối lượng sản phẩm thép trong 30 tháng gần đây ượng sản phẩm thép trong 30 tháng gần đây ng s n ph m thép trong 30 tháng g n ây ản phẩm thép trong 30 tháng gần đây ẩm thép trong 30 tháng gần đây ần đây
c a m t nh máy ( ủa một nhà máy (đơn vị: triệu tấn) ột nhà máy (đơn vị: triệu tấn) à dữ liệu về khối lượng sản phẩm thép trong 30 tháng gần đây ơn vị: triệu tấn) n v : tri u t n) ị: triệu tấn) ệu về khối lượng sản phẩm thép trong 30 tháng gần đây ấn)
6,4 3,3 5,3 4,5 7,9 6,2
1 Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf)
2 Xây dựng bảng tần số phân bố với 5 tổ có khoảng cách tổ bằng nhau
3 Vẽ đồ thị tần số và cho nhận xét sơ bộ về khối lượng sản phẩm thép trong 30 tháng nói trên
4 Tính khối lượng sản phẩm thép trung bình 1 tháng từ tài liệu điều tra và từ bảng phân bố tần số So sánh kết quả và giải thích
Bài làm
1.Bi u ểu đồ thân lá: ồ thân lá: thân lá:
2.Xây dựng bảng tần số phân bổ với 5 tổ có khoảng cách tổ bằng nhau:
Ta có khoảng cách tổ :
Xmax - Xmin 7,9 - 3,0
h = - = - = 0,98
n 5
Ta lập được bảng tần số phân bổ với 5 tổ cách đều nhau như sau :
Trang 6Tổ Trung bình tổ Số lượng Tần số phân bố Tần số tích lũy 3,00 - 3,98 3,49 4 13% 13%
3,98 - 4,96 4,47 6 20% 33%
4,96 - 5,94 5,45 5 17% 50%
5,84 - 6,92 6,43 8 27% 77%
6,92 - 7,9 7,71 7 23% 100%
Tổng cộng 30 100%
3.Vẽ đồ thị tần số và cho nhận xét về khối lượng sản phẩm thép trong 30 tháng nói trên
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
120.00%
0
1
2
3
4
5
6
7
8
9
Frequency Cumulative %
Nhận xét : Khối lượng sản phẩm thép của nhà máy trong 30 tháng lại đây thấp nhất là 3,0
triệu tấn, cao nhất là 7,9 triệu tấn Trong đó khối lượng sản phẩm thép từ 3,0 triệu tấn đến dưới 4,0 triệu tấn có tần suất nhỏ nhất và từ 6,0 đến dưới 7,0 có tần suất là lớn nhất
4.Tính khối lượng sản phẩm thép trung bình 1 tháng từ tài liệu điều tra và từ bảng phân bố tần số So sánh kết quả và giải thích
- Theo s li u i u tra thì kh i l ối lượng sản phẩm thép trong 30 tháng gần đây ệu về khối lượng sản phẩm thép trong 30 tháng gần đây ề khối lượng sản phẩm thép trong 30 tháng gần đây ối lượng sản phẩm thép trong 30 tháng gần đây ượng sản phẩm thép trong 30 tháng gần đây ng thép trung bình 1 tháng l : à dữ liệu về khối lượng sản phẩm thép trong 30 tháng gần đây
6,4 3,3 5,3 4,5 7,9 6,2
Trang 7TB = (7,3 + 4,9 + 6,6 + 4,7 +6,4 + 4,7 + 5,3 + 7,2 + 4,5 + 3,3 +6,1 +6,1 + 3,7 +7,8 +5,3 + 7,5 + 4,8 +7,0 + 6,0 + 4,5 + 5,7 + 5,1 + 3,8 + 6,5 + 7,9 + 6,4 + 7,3 + 3,0 + 5,2 + 6,2)/30 = 170,8/30
TB = 170,8/30 = 5,693 triệu tấn
- Theo cách tính từ bảng phân bố tần số thì khối lượng thép trung bình tháng là:
Tổ Trung bình tổ (X
i) Số lượng (fi) Xi* fi
3,00 - 3,98 3,49 4 13,96
3,98 - 4,96 4,47 6 26,82
4,96 - 5,94 5,45 5 27,25
5,84 - 6,92 6,43 8 51,44
6,92 - 7,9 7,71 7 51,87
TB = 171,34/30 = 5,711 triệu tấn
Nhận xét:Với kết quả tính toán trên cho thấy khối lượng sản phẩm thép trung bình 1 tháng
được tính theo bảng phẩn bổ tần số cao hơn so với cách tính trực tiếp từ số liệu điều tra Do
đó có thể thấy theo cách tính từ bảng phân bổ tần số không chính xác vì khi ta tính trung bình tổ đã xuất hiện 1 lần sai số
Câu 5: Một công ty đã tiến hành một bài kiểm tra cho các nhân viên bán hàng khi tuyển
dụng Giám đốc bán hàng rất quan tâm đến khả năng dựa trên kết quả kiểm tra này để dự đoán kết quả bán hàng Bảng dữ liệu dưới đây chỉ ra kết quả bán hàng trung bình hàng ngày của 10 nhân viên được chọn ra ngẫu nhiên và điểm kiểm tra của họ:(đơn vị tính DT: triệu đồng)
Doanh thu ngày 24 15 28 10 12 16 12 13 27 18 Điểm kiểm tra 8.5 7.5 8.5 5.5 6.0 8.5 6.0 6.5 8.5 8.0
1 Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên
hệ giữa điểm kiểm tra và doanh thu tuần, phân tích mối liên hệ này qua các tham số của mô hình
2 Hãy đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên (qua hệ số tương quan và hệ số xác định)
3 Kiểm định xem liệu giữa điểm kiểm tra và doanh thu ngày thực sự có mối liên hệ tương quan tuyến tính không?
4 Giám đốc quyết định chỉ nhận những người có mức doanh thu tối thiểu là 20 triệu Một người có điểm kiểm tra là 7 liệu có được nhận không với xác suất tin cậy 95%
Bài làm:
1 Xác định một phương trình hồi quy tuyến tính
Trang 81tuần có 7 ngày: Như vậy ta có bảng mô tả quan hệ giữa doanh thu bán hàng theo tuần với điểm kiểm tra của chính nhân viên đó Đơn vị tính DT triệu đồng
Doanh thu tuần 168 105 196 70 84 112 84 91 189 126 Điểm kiểm tra 8,5 7,5 8,5 5,5 6,0 8,5 6,0 6,5 8,5 8,0 Gọi Xi là ký hiệu điểm kiểm khi được tuyển dụng của nhân viên thứ i; và Yi là doanh thu bán hàng theo tuần của nhân viên thứ i
Phương trình hồi quy tuyến tính có dạng Y = b0 + b1X
Để xác định tham số tự do b0 và độ dốc b1, phương pháp được sử dụng là phương pháp bình phương nhỏ nhất
Ta có hệ phương trình: y = b0 + b1x
x.y = b0 x + b1x2
Lập bảng và giải hệ phương trình trên, tìm giá trị các tham số b0 và b1
Sử dụng các số liệu tính toán bằng bộ công cụ Excel để tính toán các tham số Với các
số liệu đã cho, ta có bảng số liệu tính toán được như sau:
SUMMARY
OUTPUT
Regression
Statistics
Multiple R 0.8450
R Square 0.7140
Adjusted R
Square 0.6782
Standard
Error 26.0885
Observations 10.0000
ANOVA
e F
Regression 1 13,591.6128 13,591.6128 19.9697 0.0021
Residual 8 5,444.8872 680.6109
Total 9 19,036.5000
Trang 9s Standard Error t Stat value P- Lower 95% Upper 95%
Intercept (110.4991) 52.7883 (2.0932) 0.0697 (232.2291) 11.2310
X Variable 1 31.7006 7.0938 4.4687 0.0021 15.3422 48.0590 Phương trình hồi quy mô tả quan hệ x;y được viết: Yi= -110,499 + 31,7 Xi
Hay có thế viết là : Ŷ = 31,7 X- 110,499
Phân tích mối quan hệ X, Y qua mô hình hồi quy tuyến tính
+ Hệ số b0 là tham số tự do, trong phương trình trên b0 = - 110,499 thể hiện sự ảnh của các nhân tố khác, ngoại trừ trình độ, năng lực của nhân viên bán hàng (thông qua điểm kiểm tra đánh giá khi tuyển dụng) Giá trị b0 = -110,499 cũng cho thấy rằng, doanh nghiệp phải tuyển dụng những nhân viên bán hàng có một trình độ (thông qua điểm đánh giá khi tuyển dụng) nhất định thì mới đảm bảo có doanh thu
+ Hệ số b1 là tham số hồi quy, phản ánh ảnh hưởng của biến độc lập (Xi) đến giá trị của biến phụ thuộc (Yi) Hệ số b1 > 0 phản ánh sự ảnh hưởng của biến x và y là đồng biến Trong bài này, b1 = 31,7 phản ánh rằng, nếu trình độ của nhân viên bán hàng thông qua chỉ
số điểm khi tuyển dụng tăng lên 1 (điểm) thì doanh thu tuần sẽ tăng thêm 31,7 (triệu đồng);
2 Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên (qua hệ số tương quan và hệ số xác định).
- Đánh giá cường độ của mối quan hệ trong mô hình hồi quy tuyến tính thông qua
hệ số tương quan (r)
r 0,8: tương quan mạnh;
r= 0,4 0,8 : tương quan trung bình;
r 0,4: tương quan yếu
Từ bảng số liệu trên, ta thấy giá trị của hệ số tương quan : r = 0,845
Như vậy, với r = 0,845 cho ta thấy mối liên hệ giữa trình độ của nhân viên bán hàng thông qua điểm đánh giá đầu vào với doanh thu bán hàng là rất chặt chẽ
- Đánh giá sự phù hợp của mô hình:
Theo số liệu đã được tính ở trên, ta có r2 = 0,714;
Như vậy thông qua hệ số r2 = 0,714 cho biết, mô hình hồi quy đã xây dựng trên giải thích được 71,4% sự thay đổi của doanh thu bán hàng khi trình độ nhân viên (được tính theo điểm đánh giá) thay đổi
3.Kiểm định xem liệu giữa điểm kiểm tra và doanh thu ngày thực sự có mối liên
hệ tương quan tuyến tính không?
Do chưa biết phương sai của tổng thể chung 2, mẫu nhỏ (n<30), nên dùng tiêu chuẩn kiểm định T-Student để kiểm định hệ số hồi quy b1
+ Cặp giả thiết kiểm định là:
Ho: b1 = 0 ( x,y không có mối liên hệ tuyến tính)
H1: b1 ≠ 0 ( x,y có mối liên hệ tuyến tính)
+ Tiêu chuẩn kiểm định: t = (b1- b1)/Sb1 và df = n-1
- Tiến hành kiểm định:
Trang 10Tra bảng t, với mức ý nghĩa = 5%, và số bậc tự do df = n-1=9, ta có trị số t giới hạn
là t/2;n-1 = 2,262
Dùng kết quả tính toán từ bộ công cụ tính sẵn trong Excel, ta có:
tkđ = (b1- b1)/Sb1 = 31,7006/7,0938 = 4,4687
Như vậy, tkđ> t/2;n-1 ; tkđ thuộc miền bác bỏ
quyết định: Bác bỏ Ho, chấp nhận H1
Kết luận: Với số liệu điều tra, tại mức ý nghĩa = 5% ( độ tin cậy 95%), có bằng
chứng cho thấy mối quan hệ x,y là quan hệ tuyến tính.Như vậy giữa trình độ của các nhân viên bán hàng thông qua chỉ số điểm đánh giá khi thi tuyển dụng vào công ty có quan hệ tuyến tính với doanh thu bán hàng tương ứng của các nhân viên
4.Giám đốc quyết định chỉ nhận những người có mức doanh thu tối thiểu là 20
triệu Một người có điểm kiểm tra là 7 liệu có được nhận không với xác suất tin cậy 95%.
Từ phương trình hồi quy : Ŷ = 31,7 X- 110,499
Với Xi=7; Ta có Yi = 111,401
- Để tính ước lượng khoảng cho thu nhập của nhân viên, từ bảng số liệu ban đầu, ta có bảng tính:
STT Yi Xi (Xi - Ẍ) (Xi - Ẍ)2
Ẍ= 7.35 + Để ước lượng khoảng doanh thu trung bình của những người có điểm kiểm tra bằng 7 (Xi=7) ,
Áp dụng theo công thức :