3 Phương sai là chỉ tiêu tương đối cho phép so sánh độ biến thiên của tiêu thức nghiên cứu của hai hiện tượng cùng loại và có số trung bình không bằng nhau.. Sai, Vì phương sai là số b
Trang 1MÔN: THỐNG KÊ KHOA HỌC VÀ RA QUYẾT ĐỊNH
BÀI TẬP CÁ NHÂN Học viên: Vũ Hồng Thắng Lớp: GaMBA01.N06
Câu 1: Lý thuyết (2đ)
A Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1) Tham số tự do (b0) phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả
Sai, Vì tham số b 0 phản ánh hệ số chặn hệ số chặn của β 0, không phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả
2) Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ nghịch với phương sai của tổng thể chung đó
Sai, Vì khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ thuận với phương sai của tổng thể chung.
3) Phương sai là chỉ tiêu tương đối cho phép so sánh độ biến thiên của tiêu thức nghiên cứu của hai hiện tượng cùng loại và có số trung bình không bằng nhau
Sai, Vì phương sai là số bình quân cộng của bình phương các độ lệch giữa các lượng biến với số bình quân cộng của các lượng biến đó
4) Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối
Đúng Vì tấn số là số lần xuất hiện của các giá trị quan sát được của biến ngẫu nhiên trong khối dữ liệu.
5) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu
Trang 2 Sai Vì tiêu thức thống kê phản ánh đặc điểm của các đơn vị tổng thể chứ không phải đặc điểm của tổng thể nghiên cứu.
B Chọn phương án trả lời đúng nhất:
1) Phân tích dãy số thời gian có tác dụng:
d a) Phân tích đặc điểm biến động của hiện tượng qua thời gian
e b) Biểu hiện xu hướng và tính quy luật của sự biến động
f c) Là cơ sở để phân tích kết cấu của hiện tượng
d) Cả a), b)
g e) Cả b), c)
f) Cả a), b), c)
2) Đại lượng nào không phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả:
a) Hệ số tương quan
b) Hệ số chặn (b0 )
c) Hệ số hồi quy (b1 )
d) Cả a), b)
h e) Cả a), c)
3) Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
a) Độ tin cậy của ước lượng
b) Độ đồng đều của tổng thể chung
c) Tiêu thức nghiên cứu
Trang 3d) Cả a), b).
e) Cả a), b), c)
4) Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng khác loại:
a) Độ lệch tiêu chuẩn
b) Khoảng biến thiên
c) Khoảng tứ phân vị
d) Hệ số biến thiên
i e) Cả a), c)
j f) Cả a), d)
5) Biểu đồ hình cột (Histograms) có đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện khoảng cách tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
(Note: Phần bôi chữ màu tím là những câu trả lời đúng nhất)
Câu 2 (1,5 đ)
Một doanh nghiệp muốn ước lượng trung bình một giờ một công nhân hoàn thành được bao nhiêu sản phẩm để đặt định mức Giám đốc nhà máy muốn xây dựng khoảng ước lượng có sai số bằng 1,5 sản phẩm và độ tin cậy là 95%, Theo kinh nghiệm của ông ta
độ lệch tiêu chuẩn về năng suất trong một giờ là 8 sản phẩm Hãy tính số công nhân cần được điều tra để đặt định mức
Trang 4Giả sử sau khi chọn mẫu (với cỡ mẫu được tính ở trên) số sản phẩm trung bình mà họ hoàn thành trong 1 giờ là 45 với độ lệch tiêu chuẩn là 7,5 Hãy ước lượng năng suất trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%
Bài làm:
a Tính số công nhân cần được điều tra để đặt định mức
Theo bài ra ta có:
Er = 1,5 sản phẩm
σ = 8 sản phẩm/h
Để xác định số công nhân cần được điều tra để đặt định mức (n), ta áp dụng công thức:
(*)
Với độ tin cậy 95% khoảng tin cậy 1 - /2 = 1 - 0.05/2 = 0,975
Mặt khác: Z/2 = 1,960 (tra bảng)
Thay vào công thức (*) ta được: n = 110 (đã làm tròn lên)
Vậy ta đưa ra kết luận: Với độ tin cậy 95% và sai số bằng 1,5 sản phẩm thì số công nhân cần được điều tra để đặt định mức là 110
công nhân
b Ước lượng năng suất trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%
Ta có : X - Zα/2
n
< µ < X + Zα/2
n
Trang 5 45 - 1,96
109
5 , 7
< µ < 45 + 1.96
109
5 , 7
43,592 < µ < 46,408
Kết luận: Với độ tin cậy 95%, năng suất trung bình một giờ của toàn bộ công nhân ước lượng vào khoảng (43,592; 46,408)
Câu 3 (1,5đ)
Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản phẩm Để đánh giá xem chi phí trung bình theo hai phư -ơng án ấy có khác nhau hay không người ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn Với độ tin cậy 95% hãy rút ra kết luận về hai phương án trên Bài làm
Chi phí trung bình và trung vị của 2 phương án là:
- Phương án 1:
29, 46 15
Me= 28
- Phương án 2
27,8 16
Me=27
Trang 6Nhận xét: Phương án 1 có chi phí sản xuất trung bình C1 nhỏ hơn trung vị Me, điều đó cho thấy trong 15 mẫu sản phẩm thử thì số sản phẩm có chi phí sản xuất lớn hơn chi phí sản xuất trung bình chiếm đa số
Mặt khác, C1>C2 chi phí sản xuất trung bình của phương án 1 lớn hơn của phương án 2 do vậy nhà sản xuất nên chọn phương án 2
để tiến hành sản xuất
Câu 4 (2,5đ)
Dưới đây là dữ liệu về khối lượng than khai thác được trong 50 tháng gần đây của một nhà máy (đơn vị: triệu tấn):
1.Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf)
2.Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu trên
3.Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
4.Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra và từ bảng phân bố tần số So sánh kết quả
và giải thích
Bài làm:
Trang 71 Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf)
2 Bảng tần số phân bố:
i
Stem (Thân/ Đơn vị: Triệu tấn)
Leaf (Lá/ Đơn vị: Trăm nghìn tấn)
3, 0 0 7 8
4, 5 5 5 7 7 7 8 9
5, 1 2 2 3 3 3 4 5 7 7
6, 0 1 1 1 1 1 2 2 2 4 4 4 4 5 6
7, 0 0 2 2 3 3 5 5 5 8 9
11, 5
12, 3
Trang 85,2 2
i
f
3 Sử dụng đồ thị hộp ria mèo, ta đưa ra kết luận: Bảng dữ liệu có 2 dữ liệu đột xuất là hai mức sản lượng 11,5 và 12,3 có giá trị lớn đột xuất so với giá trị sản lượng các tháng khác
Trang 94 Dùng hàm Descriptive Statistics trong Excel ta có được
Sản lượng
(bao gồm cả biến đột xuất)
Sản lượng
(Không bao gồm biến đột xuất)
a Khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra
Khi chưa loại bỏ biến đột xuất: 303,3/50 = 6,066 triệu tấn.
Khi đã loại bỏ biến đột xuất: 279,5/48 = 5,823 triệu tấn
Trang 10b Khối lượng than trung bình khai thác được trong 1 tháng từ bảng phân bổ tần số:
Tổ
Khi chưa bỏ biến đột xuất Khi bỏ biến đột xuất
Trị số giữa Xi
Tần số fi
Xi*fi
Trị số giữa Xi
Tần số fi
Xi*fi
Khi chưa loại bỏ biến đột xuất là 6,254 triệu tấn.
Khi đã loại bỏ biến đột xuất là 5,774 triệu tấn.
Nhận xét:
Hai kết quả trên khác nhau do việc áp dụng hai cách tính, kết quả từ tài liệu điều tra là bình quân cộng số liệu thực tế, kết quả
từ bảng phân bổ tần số tính theo tần số và trị số giữa của mỗi tổ, trị số giữa này chịu ảnh hưởng của dữ liệu đột xuất trong bản thân tổ
Trang 11của mình đồng thời cũng chịu ảnh hưởng của dữ liệu đột xuất với tổ khác Do đó, tích số của trị số giữa và tần số không phản ánh đúng thực tế tổng khối lượng khai thác của cả tổ, vì vậy sẽ có khác biệt với kết quả theo cách tính từ tài liệu điều tra
Câu 5 (2,5đ)
Một hãng trong lĩnh vực kinh doanh dầu gội đầu thực hiện một thử nghiệm để đánh giá mức độ ảnh hưởng của quảng cáo đối với doanh thu Hãng cho phép tăng chi phí quảng cáo trên 5 vùng khác nhau của đất nước so với mức của năm trước và ghi chép lại mức độ thay đổi của doanh thu ở các vùng như sau:
1 Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ này qua các tham số của mô hình
2 Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối liên hệ tương quan tuyến tính không?
3 Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên
4 Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 7% với độ tin cậy 90%.
Bài làm:
1 Gọi y là biến tăng doanh thu, x là biến tăng chi phí quảng cáo, n = 9, ta lập bảng dữ liệu tổng hợp như sau:
% tăng chi phí quảng cáo(x)
% tăng doanh thu (y)
Trang 121 2
Cho chạy hàm Regression trong Excel ta có
SUMMARY OUTPUT
Regression Statistics
Trang 13df SS MS F Significance F
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%
% tăng chi phí quảng
Vậy phương trình hồi quy tuyến tính để biểu hiện mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu là:
Ŷ = 0,975 + 0,659X
Tham số tự do bo = 0,975: cho thấy ảnh hưởng của các yếu tố khác ngoài chi phí quảng cáo có tác động đến doanh thu, tức
là khi các yếu tố khác (ngoài chi phí quảng cáo) tăng 1% thì doanh thu tăng lên 0,9748 %
Tham số b1 =0,6587 cho thấy khi chi phí quảng cáo tăng 1% thì doanh thu sẽ tăng 0,6587%, tức là chúng có mối quan hệ
tỷ lệ thuận với nhau
2 Để kiểm định mối liên hệ tương quan tuyến tính giữa % tăng phí quảng cáo và % tăng doanh thu thực sự có mối quan hệ tương
quan tuyến tính không, ta tính R (hệ số tương quan):
Ta tính các đại lượng sau:
Trang 142
3,5 9
1, 72 9
x
y
x x
n
y y
n
d
d
0,9442
x y
x y R
d d
Kết luận: Vậy giữa % tăng chi phí quảng cáo và % tăng doanh thu có mối liên hệ tương quan tuyến tính.
3 Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên
+ Cường độ của mối liên hệ: Vì R= 0,9442>0 và gần tới 1 chứng tỏ mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu
là tương quan tuyến tính thuận và tương đối chặt chẽ
+ Sự phù hợp của mô hình: Sai số của mô hình: Syx = 0,511 (phần Cho chạy hàm Regression trong Excel ở ý 1 câu 5) ; Và R2 = 0.891 (89,1%) Mô hình là phù hợp với lý thuyết kinh tế vì khi không có quảng cáo vẫn có thể bán được sản phẩm nhưng khi tăng chi phí quảng cáo lên thì doanh thu cũng tăng lên đáng kể
4 Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 7% với độ tin cậy 90%
Với độ tin cậy là 90% α = 10%; α/2 =5%
df = n – 2 = 7
Tra bảng tα/2, n-2 về hai phía t5%, 7 = 1,894
Trang 15Ta cần ước lượng khoảng tin cậy cho một giá trị cá biệt của Ŷi tại một giá trị cá biệt của Xi, áp dụng công thức:
Với tỷ lệ % tăng chi phí quảng cáo là 7%, ta có :
Ŷ = 0,975 + 0,659X thì ta có Yi = 5,586
Ta có phương sai mẫu Syx = 0.511 (phần Cho chạy hàm Regression trong Excel ở ý 1 câu 5)
Và trung bình mẫu:
(Xi X)^ 2= 31,5 Vậy sai số dự đoán của mô hình là:
= 1,158
Cận dưới là :
= 5,586- 1,158 = 4,428
833 , 3 9
5 , 34
X X
i i
i yx
n i
X X
X X n S
t Y
1
2
2 2
; 2 /
1 1
ˆ
i i
i yx
n
X X
X X n S
t
1
2
2 2
; 2 /
1 1
i
i yx
n i
X X
X X n S
t
Y
2
2 2
; 2 /
1 1 ˆ
Trang 16 Cận trên:
= 5,586+ 1,158 = 6,744
Kết luận: Với độ tin cậy là 90%, khi tỷ lệ % tăng chi phí quảng cáo là 7%, thì tỷ lệ % tăng doanh thu sẽ nằm trong khoảng từ 4,428%
đến 6,744%
i i
i yx
n i
X X
X X n S
t Y
1
2
2 2
; 2 /
1 1 ˆ