Đáp án môn Nguyên lý thống kê thông tin đến các bạn với 20 bài tập và đáp án trả lời, cụ thể là phân tích hồi quy và tương quan, phân tích dãy số thời gian, bài tập chỉ số.
Trang 1ĐÁP ÁN
Bài 2
Bài tập 1
Sắp xếp số liệu theo thứ tự từ nhỏ đến lớn, xác định được Xmax = 145, Xmin = 50
Với khoảng cách tổ bằng nhau và bằng 10, bảng tần số phân bố được xây dựng như sau:
Năng lượng tiêu dùng
a) Tổ đầu tiên bắt đầu từ 6 – 8 Biết khoảng cách các tổ bằng nhau và bằng 2, dãy số phân phối
được xây dựng như sau:
Lượng sắt dung nạp trong 24 giờ (mg) Số người
b) Biết hàm lượng sắt cho phép dung nạp hàng ngày của phụ nữ dưới 51 tuổi là không vượt quá
18mg Vậy với mẫu ở trên, tỷ lệ phần trăm số phụ nữ đã dung nạp quá mức lượng sắt cho
phép (tức có x ≥ 18) là:
(8 + 1)/45 = 0,2 (tức 20%)
Trang 2Đáp án – Nguyên lý thống kê
Bài tập 3
Sắp xếp số liệu theo thứ tự từ nhỏ đến lớn ta có: Xmax = 100, Xmin = 34
a) Với khoảng cách tổ bằng nhau và bằng 10, bảng tần số phân bố như sau:
Điểm Tần số (số sinh viên) Tần suất (lần) Tần số tích luỹ
0.15 0.4
0.2
30-40 40-50 50-60 60-70 70-80 80-90 90-100
(Lưu ý: có thể sử dụng biểu đồ hình cột hoặc biểu đồ hình tròn đều được)
c) Đồ thị tần số
0 1 2 3 4 5 6 7 8 9
Trang 3Đồ thị tần số tích luỹ
0 5 10 15 20 25
f
Trang 40 0.2
Hà Nội Hải Dương Thái Nguyên
c) Vẽ biểu đồ hình bánh (pie chart) cho tần suất
Thái Nguyên, 0.077Hải Dương,
0.154
Hà Nội, 0.269 Lai Châu, 0.038
Cao Bằng, 0.423
Nam Định, 0.038
Thái Nguyên Hải Dương
Hà Nội Lai Châu Cao Bằng Nam Định
Trang 5NSLĐ (sản phẩm) (x i ) Số công nhân (f i ) x i f i Tần số tích luỹ
c) Tính Mốt về năng suất lao động của công nhân toàn phân xưởng
Đây là dãy số phân tổ không có khoảng cách tổ, khi đó M0 là lượng biến của tổ có tần số lớn nhất (fmax = 8), vậy M0 = 39 sản phẩm
d) Tính trung vị về năng suất lao động của công nhân toàn phân xưởng
Trung vị là lượng biến của đơn vị đứng ở vị trí chính giữa trong dãy số lượng biến Có 30 công nhân, vậy vị trí chính giữa là 15 và 16
Tính tần số tích lũy để xác định vị trí thứ 15 và 16, đó là tổ có lượng biến bằng 39
Trang 6a) Bảng tần số phân bố được xây dựng như sau:
Trang 7Tính tuổi trung bình từ tài liệu phân tổ:
i i i
1 2 n 03/ 02 04 / 03 05/ 04 06 / 05 07 / 06 08/ 07
x x x x x x x x x x 1,0336(lần) hay 103,36% b) Tính tốc độ phát triển bình quân về lợi nhuận của doanh nghiệp trong giai đoạn 1998 – 2008
Xuất phát từ mối liên hệ:
Tổng thời gian sản xuất Thời gian hao phí bình quân =
Tổng số sản phẩm sản xuất
Trang 8 x : thời gian hao phí bình quân để sản xuất 1 sản phẩm (phút)
xi: mức thời gian hao phí để sản xuất 1 sản phẩm của từng phân xưởng (phút)
fi: số sản phẩm được sản xuất ra của từng phân xưởng (sản phẩm)
Mi: tổng thời gian lao động của từng phân xưởng (phút)
Thay số vào công thức trên ta có:
1 khách bình quân = Tổng số khách phục vụ Thời gian phục vụ 1 khách bình quân của 3 cửa hàng nói trên được tính theo công thức:
x : thời gian bình quân để phục vụ 1 khách của 3 cửa hàng (phút)
xi: mức thời gian phục vụ 1 khách của từng cửa hàng (phút)
fi: số khách được phục vụ của từng cửa hàng (người)
Mi: tổng thời gian phục vụ khách của từng cửa hàng (phút)
Thay số vào công thức trên ta có:
Xuất phát từ mối liên hệ: Doanh thu = Giá bán lượng tiêu thụ
a) Tính giá bán đơn vị bình quân của 3 mặt hàng trên trong quý I
Quý I Mặt hàng Doanh thu
(nghìn đồng) M i (nghìn đồng) x Giá bán đơn vị i
Lượng hàng tiêu thụ (sản phẩm)
Trang 9i i i
(sản phẩm) f i
Giá bán đơn vị (nghìn đồng) x i
Doanh thu (nghìn đồng)
Quý I Phân xưởng Giá trị sản xuất
(triệu đồng) M i
% hoàn thành kế hoạch về GTSX x i
Giá trị sản xuất
KH (triệu đồng)
fi = M i /x i
Tỷ trọng giá trị sản xuất từng phân xưởng (%)
M 1.358,95x
b) Tính tỷ lệ phần trăm hoàn thành kế hoạch về GTSX của toàn doanh nghiệp trong quý II
Quý II Phân xưởng Kế hoạch về GTSX
(triệu đồng) f i
% hoàn thành kế hoạch về GTSX x i
Giá trị sản xuất (triệu đồng)
M i = x i f i
Tỷ trọng giá trị sản xuất từng phân xưởng (%)
A 520 108 561,6 34,31
B 500 105 525,0 32,08
C 500 110 550,0 33,61
Trang 10Đáp án – Nguyên lý thống kê _
i i i
Khi tính nên đổi tỷ lệ % hoàn thành kế hoạch về đơn vị lần để đảm bảo ý nghĩa kinh tế của các chỉ
tiêu liên quan
Khi tính tỷ trọng, tính theo giá trị sản xuất thực tế
b) Khoảng biến thiên về thu nhập của lao động trong doanh nghiệp:
R = xmax – xmin = 8,2 – 4,7 = 3,5 (triệu đồng) c) Độ lệch tuyệt đối bình quân về thu nhập của lao động trong doanh nghiệp:
Trang 11e) Độ lệch tiêu chuẩn về thu nhập của lao động trong doanh nghiệp:
2 0, 49 0,7
(triệu đồng) f) Hệ số biến thiên về thu nhập của lao động trong doanh nghiệp:
0,7
6,68x
Phương sai Độ lệch tiêu chuẩn
(nghìn đồng)
Hệ số biến thiên (%)
x > Me > M0, dãy số có phân phối chuẩn lệch phải
Vậy số hộ gia đình có mức thu nhập lớn hơn mức thu nhập bình quân sẽ chiếm thiểu số
Trang 12i 1
x113
i 1
x241
Người Nga: không tính Mốt cho trường hợp này vì có nhiều Mốt
d) So sánh độ phân tán về lượng tiêu dùng cá của hai nhóm người trên
Tính phương sai về lượng tiêu dùng cá
Người Đức:
2 2
Trang 13Người Nga:
2 2
Người Nga: V 29, 29 0,3367
16,07x
Trang 14a) Vẽ đồ thị biểu diễn mối liên hệ
b) Mô hình hồi quy biểu diễn mối liên hệ giữa thu nhập khả dụng và chi cho lương thực thực phẩm của các hộ gia đình nói trên có dạng: ˆy = bx 0 + b1x
Hộ
gia đình
Thu nhập khả dụng (triệu đồng) x
Chi cho lương thực thực phẩm (triệu đồng) y xy x
c) Thay giá trị x = 25 vào mô hình ở trên, ta tính được giá trị dự đoán :
Trang 15Sinh viên Thời gian tự học
b) Để đánh giá mức độ chặt chẽ của mối liên hệ trên, ta tính hệ số tương quan:
2 x
Đây là mối liên hệ tương quan tuyến tính nghịch và tương đối chặt chẽ
c) Để xác định xem phương trình trên có phù hợp hay không, tính hệ số xác định:
r2 = (–0,79)2 = 0,6241
Có nghĩa là 62,41% sự thay đổi của điểm thi được giải thích bởi mô hình nói trên Vì vậy,
có thể sử dụng được mô hình này
Bài tập 4
a) Để xác định xem khi chiều cao tăng thêm 1 cm thì cân nặng thay đổi như thế nào, ta tính hệ số
hồi quy b1 trong mô hình hồi quy tuyến tính biểu diễn ảnh hưởng của chiều cao tới cân nặng
Trang 16Vậy khi chiều cao tăng thêm 1cm thì cân nặng tăng thêm 0,092 kg
b) Để đánh giá mức độ chặt chẽ của mối liên hệ trên, ta tính hệ số tương quan:
2 x
x
Nhiên liệu tiêu thụ (triệu đồng)
b) Có cơ sở cho rằng, hệ số hồi quy trong phương trình biểu diễn mối liên hệ giữa GTSX và
lượng nhiên liệu tiêu thụ là bằng 0 Khi đó, ta thực hiện kiểm định cặp giả thiết sau:
H0: 1 = 0 (GTSX không có mối liên hệ với lượng nhiên liệu tiêu thụ)
H1: 1 ≠ 0 (có mối liên hệ tuyến tính giữa GTSX với lượng nhiên liệu tiêu thụ)
Trang 17Chúng ta thực hiện kiểm định giả thiết trên với mức ý nghĩa = 0,05
Khi đó giá trị tới hạn là ±tα/2 = ±t0,025, với độ tự do là n – 2 = 6 – 2 = 4, tra bảng ta xác định
được giá trị tới hạn ±t0,025 = ± 2,776
Từ mẫu đã cho, tính tiêu chuẩn kiểm định t:
1 e 2
t
134.383,33(x x)
ˆ(y y ) 89,374
Vậy giá trị ttính = 1,418 < t0,025, df = 4 = 2,776, với mẫu ở trên và mức ý nghĩa = 0,05, chưa
có cơ sở bác bỏ H0 Vì vậy, không nên dùng GTSX để dự đoán giá trị của lượng nhiên liệu
tiêu thụ
Bài tập 6
a) Phương trình hồi quy tuyến tính biểu diễn ảnh hưởng của số lần xem hay đọc quảng cáo đến
số lon Coca Cola mua có dạng: ˆy = bx 0 + b1x
Các tham số b0, b1 được tính theo phương pháp bình phương nhỏ nhất – OLS
Số lần xem hay đọc quảng cáo – x Số lon đã mua – y xy x 2 y 2
b) Đánh giá trình độ chặt chẽ của mối liên hệ:
2 x
Trang 18Đáp án – Nguyên lý thống kê
c) Với điều nghi ngờ ở trên, thực hiện kiểm định cặp giả thiết sau:
H0: = 0 (số quảng cáo đã đọc hay xem và số lon Coca Cola đã mua không có mối liên hệ tuyến tính)
H1: > 0 (số quảng cáo đã đọc hay xem có mối liên hệ tương quan tuyến tính thuận với số lon Coca Cola đã mua)
Với mức ý nghĩa α = 0,05, độ tự do df = n – 2 = 8 – 2 = 6, giá trị tới hạn tra bảng t0,05,df = 6 = 1,943
Từ mẫu đã cho, tính tiêu chuẩn kiểm định t:
Ta thấy t > tα = 1,943, với mẫu đã cho và mức ý nghĩa α = 0,05, bác bỏ giả thiết H0
Vậy có cơ sở để kết luận rằng, giữa số quảng cáo đã đọc hay xem có mối liên hệ tương quan tuyến tính thuận với số lon Coca Cola đã mua
Vậy khi tuổi tăng thêm 1 thì nhịp tim sẽ giảm đi 1,14 lần/phút
c) Để xác định xem có thể dùng tuổi để dự đoán nhịp tim hay không (tức là giữa tuổi và nhịp tim có tồn tại mối liên hệ tuyến tính hay không), ta kiểm định cặp giả thiết sau :
H0: 1 = 0 (tuổi không có mối liên hệ với nhịp tim)
H1: 1 ≠ 0 (có mối liên hệ tuyến tính giữa tuổi và nhịp tim)
Với mức ý nghĩa α = 0,05, độ tự do là n – 2 = 10 – 2 = 8, tra bảng ta xác định được giá trị tới hạn ±t0,025 = ±2,306
Trang 19Từ mẫu đã cho, tính tiêu chuẩn kiểm định t:
1 e 2
t
425,6(x x)
ˆ(y y ) 88, 498
Vậy ta có: t > ±t0,025, bác bỏ giả thiết H0
Với mẫu đã cho và mức ý nghĩa α = 0,05, kết luận rằng: có thể dùng tuổi để dự đoán nhịp tim của một người nào đó
Số hành khách trên 100 dặm – y xy x 2 y 2
c) Kiểm định cặp giả thiết sau:
H0: = 0 (giá vé và số hành khách trên 100 dặm không có mối liên hệ tuyến tính)
H1: < 0 (giá vé có mối liên hệ tương quan tuyến tính nghịch với số hành khách trên
100 dặm)
Trang 20Ta thấy t > tα = 1,943, bác bỏ giả thiết H0
Với mẫu đã cho và mức ý nghĩa α = 0,05, kết luận rằng: giữa giá vé xe buýt và số lượng hành
khách là có mối liên hệ tương quan tuyến tính âm
Bài tập 9
a) Phương trình: yˆx= b0 + b1x
Các tham số b0, b1 được tính theo phương pháp bình phương nhỏ nhất – OLS
Chi phí quản lý phải trả
b) Khi x = 50, ˆy50 80,38 6, 49 50 244,12 (triệu đồng)
c) Tính sai số tiêu chuẩn của mô hình dự đoán trên
2 x e
ˆ(y y ) 837,56
Trang 21Bài tập 10
a) Để vẽ được đường hồi quy lý thuyết, trước hết xác định mô hình hồi quy phản ánh mối liên hệ trên:
Phương trình: ˆy = bx 0 + b1x
Các tham số b0, b1 được tính theo phương pháp bình phương nhỏ nhất – OLS
Mức lương khởi điểm
(triệu đồng) y
Điểm trung bình học đại học – x xy x 2 y 2 ˆy x (y - y ) ˆx 2
b) Tính hệ số tương quan:
2 x
Đây là mối liên hệ tương quan thuận và tương đối chặt chẽ
c) Với điểm trung bình bằng 8, tức x = 8, mức lương khởi điểm dự đoán là:
8
ˆy 1, 43 0,63 8 3,61 (triệu đồng) d) Tính sai số tiêu chuẩn của mô hình dự đoán trên
2 x e
ˆ(y y ) 0,35
Trang 22Đáp án – Nguyên lý thống kê
Năm Lợi nhuận (tỷ đồng) δ i
(tỷ đồng)
t i (%)
a i (%)
g i (tỷ đồng)
a) Tính số lao động bình quân trong quý I/2009 của doanh nghiệp
Áp dụng công thức tính mức độ bình quân theo thời gian trong trường hợp dãy số thời điểm
có các mức độ tại các thời điểm có khoảng cách thời gian bằng nhau:
b) Tính năng suất lao động bình quân một công nhân trong quý I/2009
Áp dụng công thức tính mức độ bình quân theo thời gian của dãy số thời kỳ, ta có:
n i
Trang 23a) Tính giá trị tồn kho bình quân của từng tháng trong quý II/2009
Tháng 4, 5 được tính bằng bình quân mức độ đầu và cuối tháng
2003 – 2008:
5 5
08/ 03 08/ 03
t T 1,857 1,1318 (lần) (hay 113,18%)
Trang 24lương năm 2006 của doanh nghiệp là 22.000 triệu đồng
Trước hết tính tốc độ phát triển liên hoàn: i
i
i 1
Tt
T
Tính tổng quỹ lương khi biết y06 = 22.000
Cuối cùng tính giá trị tuyệt đối của 1% tốc độ tăng (giảm) liên hoàn (Kết quả tính như ở bảng trên)
a) Nhìn vào dãy số thời gian ở trên, ta thấy đây là dãy số có cùng xu hướng và có các lượng
tăng (giảm) tuyệt đối liên hoàn xấp xỉ nhau, do đó, dạng hàm xu thế là tuyến tính và có dạng:
Trang 25a0 = y – a1t= 139,25 – 15,07 4,5 = 71,44 Vậy hàm xu thế có dạng: ˆyt 71, 44 15,07t
ˆy 208 1,114 232,71 hay 233 người
2 10
ˆy 208 1,114 258,13 hay 259 người
Dựa vào hàm xu thế: ˆyt 71, 44 15,07t
t
ˆy 8,09 1,68
Trang 26Đáp án – Nguyên lý thống kê
b) Dự đoán năm 2009:
6 09
ˆy 8,09 1,68 181,89 (nghìn USD)
Bài tập 8
a) g08 = y07/100 = 3 (tỷ đồng) Vậy y07 = 300 (tỷ đồng)
Tính tốc độ phát triển liên hoàn sau đó tính được chỉ tiêu doanh thu trong giai đoạn
2003 – 2008 biết doanh thu năm 2007 là 300 tỷ đồng Kết quả như ở bảng:
c) Dự đoán doanh thu của doanh nghiệp trong năm 2009 và 2010:
y
I 100y
Trang 27Kết quả tính toán như ở bảng:
Số khách thuê phòng (lượt khách) Năm
Quý I Quý II Quý III Quý IV Tổng
j 1 ij i
yˆy
yij: số bệnh nhân nhập viện thực tế của quý i (i = 1, 4 ) thuộc năm j (j = 1, 4 )
ij
ˆy : số bệnh nhân nhập viên theo lý thuyết của quý i (i = 1, 4 ) thuộc năm j (j = 1, 4 ) được tính
từ hàm xu thế
m: số năm nghiên cứu (m = 4)
Trước hết, xác định hàm xu thế tuyến tính biểu diễn sự biến động về số bệnh nhân nhập viện
theo thời gian: ˆy = at 0+ a1t
Sau khi sắp xếp lại số liệu theo thứ tự thời gian, ta có bảng số liệu:
Trang 28ˆy 3, 4776 0,0644tThay các giá trị của t vào hàm xu thế ở trên để tính được số bệnh nhân nhập viện theo lý thuyết
Kết quả tính toán như ở bảng sau:
Mức độ thực tế (triệu đồng) y ij
Mức độ lý thuyết (triệu đồng) ˆ y ij ˆ
ij ij
b) Dự đoán số bệnh nhân nhập viện cho các quý của năm 2009
Mô hình dự đoán: ˆyt f t Ii
pip
100 (%)
Trang 29Kết quả tính như ở bảng sau:
p 1
Doanh số (triệu đồng)
p 1 q 1
Chỉ số đơn về giá tháng 12
so với tháng 11 (%) i p
p 1 q 1 /i p (triệu đồng)
b) Xuất phát từ mối liên hệ: Doanh thu = Giá bán × Lượng hàng tiêu thụ
Ta có thể tính được chỉ số tổng hợp về giá của 3 loại tivi trên
Theo dữ liệu bài cho, có thể tính được chỉ số tổng hợp về giá của Paasche khi biết chỉ số đơn
về giá và doanh thu bán hàng ở kỳ nghiên cứu:
P p
pip
100 (%) Kết quả tính toán được cho ở bảng sau:
q o
Giá bán (nghìn đồng)
p 1
Chỉ số đơn về giá ngày 1/12
so với 15/3 (%)i p
b) Xuất phát từ mối liên hệ: giá trị cổ phiếu nắm giữ = giá cổ phiếu × khối lượng cổ phiếu nắm giữ
Chỉ số tổng hợp về giá của 3 loại cổ phiếu trên được tính theo công thức của Laspeyres:
1 0 L
Như vậy, sự thay đổi về giá bán chung của 3 mã cổ phiếu trên làm cho tổng giá trị cổ phiếu
ngày 1/12 bằng 98,03% so với ngày 15/3, tức giảm 1,97% tương đương một lượng tuyệt đối
là: ∆ = 637.200 – 650.000 = –12.800 nghìn đồng
Trang 30Đáp án – Nguyên lý thống kê
Bài tập 3
Xuất phát từ mối liên hệ: sản lượng (NT) = NSLĐ bình quân (N) × số công nhân (T)
a) Tính chỉ số tổng hợp về NSLĐ bình quân của Laspeyres và Paasche
Chỉ số đơn về NSLĐ = 100 + tốc độ tăng (giảm) về NSLĐ (%)
Sản lượng (tấn) Loại khoáng
về NSLĐ bình quân cuả quý II
so với quý I
Chỉ số đơn
về NSLĐ bình quân của quý II
so với quý I (%) i N
c) Biến động về sản lượng của 3 loại khoáng sản giữa hai quý do ảnh hưởng biến động của
NSLĐ bình quân khi số công nhân vẫn giữ nguyên như ở quý I là:
N N T1 0 N T0 0 9.536,35 9.250 286,35
Bài tập 4
Xuất phát từ mối liên hệ: Chi phí sản xuất (CPSX) (zp) = Giá thành (z) × sản lượng sản xuất (p)
Chỉ số đơn về giá thành = 100 + tốc độ tăng (giảm) về giá thành (%)
Chỉ số đơn về CPSX = 100 + tốc độ tăng (giảm) về CPSX (%)
CPSX quý I = CPSX quý II/Chỉ số đơn về CPSX quý II so với quý I
a) Tính chỉ số tổng hợp về giá thành của Laspeyres và Paasche
Trang 31z 1 q 1
Tỷ lệ % tăng (giảm) giá thành quý II
so với quý I
Tỷ lệ % tăng (giảm) CPSX quý II
so với quý I
Chỉ số giá thành quý II
so với quý I (%) i z
Chỉ số CPSX quý II
so với quý I (%) i zq
z 0 q 0
(triệu đồng)
104,03% = 102,06% 101,93%
(+4,03%) (+2,06%) (+1,93%) Biến động tuyệt đối: 9.841 – 9.459,88 = (9.841 – 9.642,82) + (9.642,82 – 9.459,88)