1. Trang chủ
  2. » Thể loại khác

Bài tập thống kê ra quyết định số (183)

10 36 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 10
Dung lượng 3,16 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

5 Hệ số hồi quy b1 phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả.. Chọn phương án trả lời đúng nhất: 1 Phân tích dãy số thời gian có tác dụng:

Trang 1

Học viên: Lê Quý Tuyển

BÀI TẬP CÁ NHÂN THỐNG KÊ VÀ KHOA HỌC QUYẾT ĐỊNH

Câu 1: Lý thuyết

A Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?

1) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu

Sai: Vì tiêu thức thống kê phản ánh đặc điểm của từng đơn vị tổng thể để nghiên cứu tùy

theo các mục đích nghiên cứu khác nhau

2) Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối

Sai: Vì trong bảng phân bố tần số dữ liệu biểu hiện bằng số tuyệt đối gọi là tần suất.

3) Độ lệch chuẩn là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức nghiên cứu của hai hiện tượng khác loại

Sai: Vì độ lệch chuẩn là chỉ tiêu hoàn thiện nhất và chỉ dùng để so sánh độ biến thiên của các

hiện tượng cùng loại

4) Khoảng tin cậy cho tham số nào đó của tổng thể chung tỷ lệ nghịch với phương sai của tổng thể chung đó

Sai: Vì phương sai có trị số càng nhỏ thì tổng thể nghiên cứu càng đồng đều, khoảng tin cậy

càng hẹp và có quan hệ thuận

5) Hệ số hồi quy (b1) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả

Đúng: Vì hệ số hồi quy (b1) phản ánh ảnh hưởng của tiêu thức nguyên nhân đang nghiên cứu

đến tiêu thức kết quả

B Chọn phương án trả lời đúng nhất:

1) Phân tích dãy số thời gian có tác dụng:

a) Phân tích đặc điểm biến động của hiện tượng qua thời gian

b) Biểu hiện xu hướng và tính quy luật của sự biến động

c) Là cơ sở để dự đoán mức độ tương lai của hiện tượng

d) cả a), b)

e) cả b), c)

f) cả a), b), c)

2) Đại lượng nào phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả: a) Hệ số tương quan

b) Hệ số chặn (b0)

c) Hệ số hồi quy (b 1 )

d) cả a), b)

e) cả a), c)

Trang 2

3) Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:

a) Độ tin cậy của ước lượng

b) Độ đồng đều của tổng thể chung

c) Phương pháp chọn mẫu

d) cả a), b), c).

e) Không có yếu tố nào

4) Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng khác loại:

a) Độ lệch tiêu chuẩn

b) Khoảng biến thiên

c) Khoảng tứ phân vị

d) Hệ số biến thiên.

e) Cả a), c)

f) Cả a), d)

5 Biểu đồ hình cột (Histograms) không có đặc điểm:

a) Giữa các cột có khoảng cách.

b) Độ rộng của cột biểu hiện khoảng cách tổ

c) Chiều cao của cột biểu thị tần số

d) Cả a) và b) đều đúng

e) Cả b) và c) đều đúng

f) Cả a), b) và c) đều đúng

Câu 2:

Một doanh nghiệp muốn ước lượng trung bình một giờ một công nhân hoàn thành được bao nhiêu sản phẩm để đặt định mức Giám đốc nhà máy muốn xây dựng khoảng ước lượng có sai số bằng 1 sản phẩm và độ tin cậy là 95%, Theo kinh nghiệm của ông ta độ lệch tiêu chuẩn về năng suất trong một giờ là 6 sản phẩm Hãy tính số công nhân cần được điều tra để đặt định mức

Giả sử sau khi chọn mẫu (với cỡ mẫu được tính ở trên) số sản phẩm trung bình mà họ hoàn thành trong 1 giờ là 35 với độ lệch tiêu chuẩn là 6,5 Hãy ước lượng năng suất trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%

Bài làm

* Số công nhân cần điều tra để đạt định mức

Theo đề bài cho ta có:

Trang 3

Độ lệch chuẩn của tổng thể chung: σ = 6

Độ lệch chuẩn của tổng thể mẫu: s = 6.5 Năng suất trung bình = 35 sản phẩm,

Độ tin cậy: (1 - α) = 95% → α = 5% = 0.05

Số công nhân cần được điều tra để đạt định mức: đây là bài toán xác định cỡ mẫu đối với trung bình, có công thức tính như sau:

Khoảng tin cậy (1 - α/2) = 1-0.05/2 = 0.975, tra bảng Z(α/2) = 1.960

Thay vào công thức trên ta được:

Kết luận: Với khoảng ước lượng có sai số bằng 1 sản phẩm và độ tin cậy 95% , thì số công

nhân cần điều tra để đạt định mức là 139

* Ước lượng năng suất trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%

Gọi µ là năng suất trung bình một giờ của toàn bộ công nhân;

Trường hợp này có cỡ mẫu lớn, ta chưa biết mức độ phân bố của mẫu đã cho là chuẩn hay không chuẩn; ta áp dụng công thức:

Tra bảng t = (n-1) = 138 bậc tự do (không có) nên ta lấy bình quân của 120 và 150 bậc tự do,

cột 2; 5% về 2 phía ta có:

<=>

Kết luận: Năng suất trung bình một giờ của toàn bộ công nhân nằm trong khoảng từ 34 đến

37 sản phẩm (với độ tin cậy 95%)

Câu 3:

Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản phẩm Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay không người ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng)

Trang 4

Phương án 1: 22 32 36 38 35 26 30 28 24 28 26 34

Phương án 2: 21 27 28 29 23 26 28 30 32 34 38 25 36 28

Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn Với độ tin cậy 95% hãy rút ra kết luận về hai phương án trên

Bài làm

Ta gọi µ1 và µ2 là chi phí trung bình của phương án 1 và phương án 2

Cặp giải thiết cần kiểm định:

Ho: µ1 = µ2 (phương án 1 giống phương án 2) H1: µ1 ≠ µ2 (phương án 1 khác phương án 2)

Trường hợp này ta cần so sánh 2 trung bình của 2 tổng thể chung với 2 mẫu độc lập, khi chưa biết phương sai của tổng thể chung σ1, σ2, mẫu nhỏ n1, n2 < 30

Tiêu chuẩn kiểm định được chọn là t, 2 phía

Số mẫu n1 = 12, n2 = 14

Trung bình = (22+32+36+38+35+26+30+28+24+28+26+34)/12 = 29.92

Trung bình = (21+27+28+29+23+26+28+30+32+34+38+25+36+28)/14 = 28.93

t-Test: Two-Sample Assuming Equal Variances

Phương án 1 Phương án 2

Kiểm định t với phương sai chung:

Trang 5

Do µ1 = µ2 = 0; từ bảng trên ta có

Phương sai chung:

) 1 ( ) 1 (

2 1

2 2 2

2 1 1

2

− +

− +

=

n n

S n

S n

SP

Phương sai của phương án 1: = = 25.90

Phương sai của phương án 2: = = 22.8

Thay số vào công thức ta đươc: S P2= 24.244 ⇒ t = 0.510

Với khoảng tin cậy (1-α) = 95% → α = 0.05 Tra bảng tα, n1+n2 -2 = t0.05, 24 = ±2.064 Với giá trị tính toán được ⇒ t không thuộc miền bác bỏ Do vậy chưa đủ cơ sở bác bỏ Ho,

Kết luận: Ta có thể nói rằng chưa có đủ cơ sở (bằng chứng để chứng minh) chi phí trung bình của

hai phương án đã cho có khác nhau hay không (với độ tin cậy 95%)

Câu 4:

Dưới đây là dữ liệu về khối lượng than khai thác được trong 30 tháng gần đây của một nhà máy (đơn vị: triệu tấn):

1 Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf)

2 Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu trên

3 Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?

4 Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra và từ bảng phân

bố tần số So sánh kết quả và giải thích

Bài làm:

1 Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (stem and leaf)

Trang 6

Theo đầu bài đã cho ta có dữ liệu được sắp xếp theo thứ tự tăng dần như sau: (đơn vị:triệu tấn)

3.0 3.7 3.8 4.5 4.5 4.7 4.7 4.8 4.9 5.1 5.2 5.3 5.3 5.7 6.0

6.1 6.1 6.2 6.4 6.4 6.5 6.6 7.0 7.2 7.3 7.3 7.5 7.8 7.9 12.3

Ta có sơ đồ thân lá:

2 Xây dựng bảng tần số phân bổ với 10 tổ có khoảng cách tổ bằng nhau:

Khoảng biến thiên = 12.3 – 3.0 = 9.3

Khoảng cách tổ bằng nhau hi = 1 (9.3/10 = 0.93 làm tròn).

Giới hạn tổ: 3,4,5,6,7,8,9,10,11,12,13

fi

Tần suất

di (%)

Tần số tích luỹ

Tần suất tích luỹ (%

Trang 7

Nhận xét: Với dữ liệu đề bài đã cho ta có khối lượng than khai thác được của nhà máy trong

tháng khoảng từ 6 tấn đến dưới 7 tấn chiếm tỷ trọng lớn nhất 26.67%; tiếp theo sau là khoảng từ 7 tấn đến dưới 8 tấn chiếm tỷ trọng 23.33% Riêng hối lượng trong khoảng 8 tấn đến dưới 11 tấn là không có

3 Trong bộ dữ liệu trên có dữ liệu đột xuất không và có là giá trị nào?

Để biết được bộ dự liệu trên có dữ liệu đột xuất không thì ta dùng đồ thị hộp Ria mèo để xác định

Ta có khoảng tứ phân vị:

⇒ Q1 = 4.75

⇒ Q3 = 7.1 Khoảng tứ phân vị: IQR = Q3-Q1=7.1-4.75= 2.35 ⇒ 1.5IQR= 3.525 ⇒3IQR =7.05

Trung vị của bộ dữ liệu (Me): là trị số ở vị trí giữa của bộ dữ liệu (n=30 chẵn nên trung vị là bình quân của 2 số đứng ở giữa) là: Me= 6.05 triệu tấn

Ta có biểu đồ hộp ria mèo (box plot) của dữ liệu

Nhìn từ bộ dữ liệu ở trên ta thấy có một giá trị: 12.3 là giá trị thuộc

khoảng: 10.625 <12.3 < 14.15 nên ta nghi ngờ đó là giá trị đột xuất

4 Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra và từ bảng phân bố tần số So sánh kết quả và giải thích.

* Khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra

= 179.8/30 = 5.99 tấn (khi chưa loại bỏ biến đột xuất) = 167.5/29 = 5.78 tấn (khi loại bỏ biến đột xuất)

* Khối lượng than trung bình trong 1 tháng từ bảng phân bố tần số:

= 181/30 = 6.03 tấn (khi chưa loại bỏ biến đột xuất) = 169.5/29 = 5.84 tấn (khi loại bỏ biến đột xuất)

Nghi ngờ

là lượng biến đột xuất

Q1=4.75 Me=6.05 Q3=7.1 10.625 1.225

Lượng biến đột xuất 14.15

Trang 8

Nhận xét : Từ kết quả trung bình trong 1 tháng tính theo phân bổ tần số có kết quả cao hơn so

với phương pháp tính trung bình từ tài liệu điều tra Do vậy độ chính xác của phương pháp tính

từ bảng phân bố tấn số cao hơn tính từ bảng điều tra do có tính đến phân bổ tần số

Câu 5:

Một hãng trong lĩnh vực kinh doanh dầu gội đầu thực hiện một thử nghiệm để đánh giá mức

độ ảnh hưởng của quảng cáo đối với doanh thu Hãng cho phép tăng chi phí quảng cáo trên 5 vùng khác nhau của đất nước so với mức của năm trước và ghi chép lại mức độ thay đổi của doanh thu ở các vùng như sau:

1 Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ này qua các tham số của mô hình

2 Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối liên hệ tương quan tuyến tính không?

3 Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên

4 Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5.5% với xác suất tin cậy 90%

Bài làm

Một hãng kinh doanh trong lĩnh vực gội đầu thực hiện thử nghiệm để đánh giá mức độ ảnh hưởng của quảng cáo đối với doanh thu; Vì vậy biến tiêu thức nguyên nhân là tỷ lệ % tăng chi phí quảng cáo (ký hiệu là X), biến tiêu thức kết quả là tỷ lệ % tăng doanh thu (ký hiệu là Y)

Từ đầu bài ta có bảng dữ liệu:

1 Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên hệ giữa

% tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ này qua các tham số của

mô hình.

Ta có mô hình hàm hồi quy tuyến tính cho mẫu có dạng : Ŷi = b0 + b1Xi

Sử dụng hàm thống kê trong excell (từ dữ liệu dã cho) ta có bảng kết quả sau:

SUMMARY OUTPUT

Regression Statistics

Trang 9

R Square 0.954

ANOVA

Signifi cance F

62.88

Coefficients

Standard Error t Stat

P-value

Lower 95%

Uppe

r 95%

Lowe r 90.0

%

Uppe r 90.0

%

11.71

% tăng chi phí

Ta có được mô hình hàm hồi quy tuyến tính cho mẫu như sau: Ŷi = 2.068 + 0.385 Xi

Mối liên hệ: Từ hàm hồi quy tương quan của tổng thể mẫu cho ta thấy được rằng khi chi phí

quảng cáo tăng thêm 1% thì dự đoán doanh thu tăng thêm 0.385% (từ mô hình tổng thể mẫu nghiên

cứu)

2 Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối liên

hệ tương quan tuyến tính không?

Theo tiêu chuẩn kiểm định T-student để kiểm định hệ số hồi quy β1 để xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối liên hệ tương quan tuyến tính không

Kiểm định mối liên hệ theo cặp giả thiết là:

H0: β1 = 0 (% tăng chi phí quảng cáo không ảnh hưởng đến % tăng doanh thu)

H1: β1 ≠ 0 (% tăng chi phí quảng cáo có ảnh hưởng đến % tăng doanh thu)

Theo bảng phân tích số liệu ở trên ta có tα = 7.93 tương ứng với α = 0.004 < 0.1 do đó bác bỏ giả thiết Ho; có nghĩa là % tăng chi phí quảng cáo có ảnh hưởng đến % tăng doanh thu của các công

ty trong mẫu đã được điều tra với độ tin cậy 90%

Trang 10

2 Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.

Theo câu 1 ta có giá trị R = 0.977 (Multiple R) tiến gần đến 1, mang giá trị dương cho thấy được

có mối liên quan là rất chặt chẽ với nhau là giữa % tăng chi phí quảng cáo và % tăng doanh thu có mối liên hệ tỷ lệ thuận

Từ trên ta có giá trị R2 = 0.954 (R Square) hay tương ứng 95,4%; cho thấy 95,4% sự thay đổi %

tỷ lệ tăng doanh thu được giải thích bởi mô hình trên trong mối liên hệ với tỷ lệ tăng chi phí cho quảng cáo

3 Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5,5% với

độ tin cậy 90%.

Ta cần ước lượnng khoảng tin cậy cho một giá trị cá biệt của Ŷi tại một giá trị cá biệt của Xi

Từ công thức: ;n-2

Ta có với tỷ lệ % tăng chi phí quảng cáo là 5.5% (hay Xi = 5.5) thay vào mô hình Ŷi = 2.068 + 0.385 Xi ta được Yi = 4.186 Ta sử dụng kiểm định T-student với độ tin cậy 90% ; tra bảng tα/n-2 về hai phía ta có tα/2 n-2 = 2.353

Từ kết quả tính toán ở câu 1 khi đó có phương sai mẫu Syx = 0.187;

Trung bình mẫu:

Ta có sai số của mô hình là :

Từ đó ta có cận dưới là :

- ;n-2 = 4.186 – 0.208 = 3.978 Cận trên:

Kết luận: Nếu tỷ lệ tăng chi phí cho quảng cáo là 5.5% thì tỷ lệ % tăng doanh thu sẽ nằm trong

khoảng (3.978% đến 4.394%) với độ tin cậy là 90%

2 3 5

16

= ∑X X

Ngày đăng: 29/08/2017, 16:08

TỪ KHÓA LIÊN QUAN

w