1. Trang chủ
  2. » Kinh Doanh - Tiếp Thị

Bài tập về xác suất thống kê ra quyết định quản lý

24 148 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 24
Dung lượng 667 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

BÀI TẬP VỀ XÁC SUẤT THỐNG KÊ RA QUYẾT ĐỊNH QUẢN LÝĐề tài: nghiên c u v t l ng i dân t vong vì các b nh liên quan n tim Đ ứu về tỷ lệ người dân tử vong vì các bệnh liên quan đến tim ề tỷ

Trang 1

BÀI TẬP VỀ XÁC SUẤT THỐNG KÊ RA QUYẾT ĐỊNH QUẢN LÝ

Đề tài:

nghiên c u v t l ng i dân t vong vì các b nh liên quan n tim

Đ ứu về tỷ lệ người dân tử vong vì các bệnh liên quan đến tim ề tỷ lệ người dân tử vong vì các bệnh liên quan đến tim ỷ lệ người dân tử vong vì các bệnh liên quan đến tim ệ người dân tử vong vì các bệnh liên quan đến tim ười dân tử vong vì các bệnh liên quan đến tim ử vong vì các bệnh liên quan đến tim ệ người dân tử vong vì các bệnh liên quan đến tim đến tim

m ch, m t nhóm nghiên c u t i 1 tr ứu về tỷ lệ người dân tử vong vì các bệnh liên quan đến tim ười dân tử vong vì các bệnh liên quan đến tim ng Đ i h c c a M ã thu th p s li u ọc của Mỹ đã thu thập số liệu ủa Mỹ đã thu thập số liệu ỹ đã thu thập số liệu đ ập số liệu ố liệu ệ người dân tử vong vì các bệnh liên quan đến tim

t i các Bang trên to n n àn nước Mỹ về số người tử vong và một số số liệu về kinh ước Mỹ về số người tử vong và một số số liệu về kinh c M v s ng ỹ đã thu thập số liệu ề tỷ lệ người dân tử vong vì các bệnh liên quan đến tim ố liệu ười dân tử vong vì các bệnh liên quan đến tim ử vong vì các bệnh liên quan đến tim i t vong v m t s s li u v kinh àn nước Mỹ về số người tử vong và một số số liệu về kinh ố liệu ố liệu ệ người dân tử vong vì các bệnh liên quan đến tim ề tỷ lệ người dân tử vong vì các bệnh liên quan đến tim

t xã h i liên quan B ng s li u ến tim ảng số liệu được cho dưới đây: ố liệu ệ người dân tử vong vì các bệnh liên quan đến tim được cho dưới đây: c cho d ước Mỹ về số người tử vong và một số số liệu về kinh đ i ây:

State Số người

chết Tuổi 65

Thu nhập

Trang 2

- Tuổi 65: Phần trăm dân số từ 65 tuổi trở lên

- Thu nhập: Thu nhập bình quân tính bằng nghìn đô la

- Tỷ lệ da mầu: phần trăm dân số là người da mầu

- Vùng: Các bang được chia thành 2 vùng nghiên cứu là Vùng 1 và Vùng 2

Hãy sử dụng các số liệu trên đây để trả lời các câu hỏi sau:

1 Sử dụng các mô tả thống kê thích hợp để nhận xét về các biến trong số liệu trên

2 Sử dụng đồ thị thích hợp và hệ số tương quan để nhận xét về mối quan hệ giữa sốlượng người chết do các bệnh liên quan đến tim mạch với từng biến còn lại Từ đó

có nhận định nếu thiết lập mô hình hồi quy tuyến tính với biến phụ thuộc là số ngườichết thì biến nào trong số các biến còn lại ở trên có thể ảnh hưởng đến biến phụthuộc (không cần phân biệt vùng)

Trang 3

3 Hãy ước lượng khoảng tin cậy cho số người chết trung bình cho các bang ở vùng

a Giải thích ý nghĩa của các hệ số hồi quy và hệ số R2

b Dùng kiểm định thích hợp cho biết những biến độc lập nào có ảnh hưởng vàkhông ảnh hưởng đến biến phụ thuộc? Từ đó có thể đưa ra nhận định gì về các yếu

tố có thể tác động đến tỷ lên người chết do các bệnh tim mạch Liệu còn có các yếu

tố nào khác có thể ảnh hưởng đến tỷ lệ người chết này?

c Dùng kiểm định F cho biết liệu mô hình có ý nghĩa hay không? Nếu ý nghĩa củakết quả nhận được

d Hãy dự báo tỷ lệ người chết ở 1 bang có các biến độc lập lần lượt là:

15% từ 65 tuổi trở lên, 25000usd thu nhập trung bình, 4% da màu

Giải thích ý nghĩa kết quả nhận được

Trang 4

Qua bảng trên ta thấy:

- Số lượng các bang được nghiên cứu là: 50 bang

- Số lượng người chết vì các bệnh liên quan đến tim mạch ở một bang của Mỹ trungbình là 259 người trong 100.000 dân Số lượng người chết vì các bệnh liên quan đến timmạch trung vị là 265.100 Như vậy, có 50% số bang được nghiên cứu có Số lượng ngườichết vì các bệnh liên quan đến tim mạch thấp hơn 265.1 người và 50% số bang đượcnghiên cứu có Số lượng người chết vì các bệnh liên quan đến tim mạch lớn hơn 265.1người Số lượng người chết vì các bệnh liên quan đến tim mạch trung bình ở một bangxấp xỉ trung vị cho thấy mẫu nghiên cứu có phân phối khá cân xứng

- Độ lệch chuẩn mẫu là: 56.496 cho thấy độ lệch của phân phối

- Một số bang có Số lượng người chết vì các bệnh liên quan đến tim mạch như nhaunhưng Số lượng người chết vì các bệnh liên quan đến tim mạch phổ biến nhất (có tần sốlớn nhất) là 226 người trong 100.000 dân Số lượng người chết vì các bệnh liên quan đếntim mạch ở một bang thấp nhất là: 90.9 người trong 100.000 dân Số lượng người chết vìcác bệnh liên quan đến tim mạch ở một bang cao nhất là: 377.5 trong 100.000 dân.Khoảng biến thiên thực tế là 286.6

Biểu đồ thể hiện tần suất của Số lượng người chết vì các bệnh liên quan đến tim mạch ở một bang của Mỹ

Từ phần mền Megastat/Frequency Distribution/Quantitative, ta nhập số liệu số ngườichết vào bảng, từ đó ta có bảng số liệu sau:

Trang 5

Frequency Distribution - Quantitative

lowe

r

uppe r

midpoin t

widt h

frequenc y

percen t

frequenc y

percen t

Đồ thị phân bố tần số của biến Số người chết khá cân đối, tập trung ở giữa Tuynhiên, độ lệch (Sknewness) của biểu đồ là -0.482 < 0 chỉ ra rằng phân phối có hướnglệch trái

Trang 6

1.2 Phần trăm dân số từ 65 tuổi trở lên

Từ phần mềm Magastat/Descriptive Statistics Ta nhập số liệu phần dân số từ 65tuổi trở lên, từ đó ta có bảng số liệu như sau :

Qua bảng trên ta thấy:

- Số lượng các bang được nghiên cứu là: 50 bang

- Phần trăm dân số từ 65 tuổi trở lên ở một bang của Mỹ trung bình là 12.538% Phầntrăm dân số từ 65 tuổi trở lên ở một bang của Mỹ trung vị là 12.75% Như vậy, có 50%

số bang được nghiên cứu có Phần trăm dân số từ 65 tuổi trở lên ở một bang của Mỹ thấphơn 12.75% và 50% số bang được nghiên cứu có Phần trăm dân số từ 65 tuổi trở lên ởmột bang của Mỹ lớn hơn 12.75% Phần trăm dân số từ 65 tuổi trở lên ở một bang của

Mỹ ở một bang xấp xỉ trung vị cho thấy mẫu nghiên cứu có phân phối khá cân xứng

- Độ lệch chuẩn mẫu là: 1.905% cho thấy độ lệch của phân phối

- Một số bang có Phần trăm dân số từ 65 tuổi trở lên như nhau nhưng Phần trăm dân

số từ 65 tuổi trở lên ở một bang của Mỹ phổ biến nhất (có tần số lớn nhất) là 12.1% Phầntrăm dân số từ 65 tuổi trở lên ở một bang của Mỹ thấp nhất là: 5.7% Phần trăm dân số từ

Trang 7

65 tuổi trở lên ở một bang của Mỹ cao nhất là: 17.6% Khoảng biến thiên thực tế là11.9%

Biểu đồ thể hiện tần suất của Phần trăm dân số từ 65 tuổi trở lên ở một bang của Mỹ

Frequency Distribution - Quantitative

lowe

r

uppe r

midpoin t

widt h

frequenc y

percen t

frequenc y

percen t

Kết luận: Dựa vào kết quả điều tra, chính quyền có thể xem xét xây dựng các

chính sách ưu đãi dành cho người già như xây dựng thêm các bệnh viện, viện dưỡng lão

để đảm bảo người già được chăm sóc sức khỏe tốt nhất hoặc xây dựng mức phân bổ cácquỹ phúc lợi dành cho người già tại các bang cho phù hợp với tỷ lệ người già hiện tại …

Trang 8

Đồ thị phân bố tần số của biến Phần trăm dân số từ 65 tuổi trở lên khá cân đối, tậptrung ở giữa Tuy nhiên, độ lệch (Sknewness) của biểu đồ là -0.741 < 0 chỉ ra rằng phânphối có hướng lệch trái hơn lệch phải.

1.3 Thu nhập bình quân của người dân tính bằng nghìn USD

Từ phần mền Megastat/Descriptive statistics Sau đó ta nhập dữ liệu thu nhập vào bảng,

từ đó ta có bảng số liệu sau

Descriptive statistics

Thu nhập

Trang 9

Qua bảng trên ta thấy:

- Số lượng các bang được nghiên cứu là: 50 bang

- Thu nhập bình quân của người dân ở một bang của Mỹ trung bình là 28.824 nghìnUSD Thu nhập bình quân của người dân ở một bang của Mỹ trung vị là 27.85 nghìnUSD Như vậy, có 50% số bang được nghiên cứu có Thu nhập bình quân của người dânthấp hơn 27.85 nghìn USD và 50% số bang được nghiên cứu có Thu nhập bình quân củangười dân lớn hơn 27.85 nghìn USD Thu nhập bình quân của người dân trung bình ởmột bang xấp xỉ trung vị cho thấy mẫu nghiên cứu có phân phối khá cân xứng

- Độ lệch chuẩn mẫu là: 6.19 cho thấy độ lệch của phân phối

- Thu nhập bình quân của người dân ở mỗi bang của Mỹ là khác nhau (không cógiá trị phổ biến) Thu nhập bình quân của người dân ở một bang thấp nhất là: 20.993nghìn USD Thu nhập bình quân của người dân ở một bang cao nhất là: 59.685 nghìnUSD Khoảng biến thiên thực tế là 38.692 nghìn USD

Biểu đồ thể hiện tần suất của Thu nhập bình quân của người dân ở một bang của Mỹ

Frequency Distribution - Quantitative

Thu nhập

cumulative lowe

r

uppe r

midpoin t

widt h

frequenc y

percen t

frequenc y

percen t

Trang 10

Kết luận: Dựa vào kết quả điều tra, chính quyền có thể xem xét áp dụng mức phí

dịch vụ công khác nhau phù hợp với mức thu nhập bình quân tại các bang hoặc đưa rachính sách về viện phí và chi phí khác liên quan tới chữa bệnh phù hợp …

Đồ thị phân bố tần số của biến Thu nhập bình quân có xu hướng tập trung ở giữa.Tuy nhiên có một số vùng có thu nhập cao hơn hẳn các vùng còn lại, mức thu nhập từ56.000 – 60.000 USD

Trang 11

1.4 Phần trăm dân số là người da màu.

Từ phần mềm Megastat/Descriptive statistics, sau đó ta nhập số liệu tỷ lệ da màuvào bảng, từ đó ta có bảng số liệu như sau :

Qua bảng trên ta thấy:

- Số lượng các bang được nghiên cứu là: 50 bang

- Phần trăm dân số là người da màu ở một bang của Mỹ trung bình là 9.9% Phầntrăm dân số là người da màu ở một bang của Mỹ trung vị là 6.75% Như vậy, có 50% sốbang được nghiên cứu có Phần trăm dân số là người da màu thấp hơn 6.75% và 50% sốbang được nghiên cứu có Phần trăm dân số là người da màu lớn hơn 6.75% Phần trămdân số từ 65 tuổi trở lên ở một bang của Mỹ ở một bang lớn hơn trung vị cho thấy mẫunghiên cứu có phân phối lệch phải

- Độ lệch chuẩn mẫu là: 9.58% cho thấy độ lệch của phân phối

- Một số bang có Phần trăm dân số là người da màu như nhau nhưng Phần trăm dân

số là người da màu phổ biến nhất (có tần số lớn nhất) là 3.5% Phần trăm dân số là người

Trang 12

da màu ở một bang của Mỹ thấp nhất là: 0.3% Phần trăm dân số là người da màu ở mộtbang của Mỹ cao nhất là: 36.3% Khoảng biến thiên thực tế là 36%

Biểu đồ thể hiện tần suất của Thu nhập bình quân của người dân ở một bang của Mỹ

Frequency Distribution - Quantitative

lowe

r

uppe r

midpoin t

widt h

frequenc y

percen

t

frequenc y

percen t

Căn cứ vào bảng phân bố tần suất ở trên, ta thấy: Phần trăm dân số là người da màu

ở mỗi bang của Mỹ phổ biến là từ 0 – 20% (chiếm tỷ lệ 86%) Trong đó, các bang cóPhần trăm dân số là người da màu từ 0 – 5% chiếm tỷ lệ cao nhất đạt 42%

Kết luận: Dựa vào kết quả điều tra, chính quyền có thể xem xét áp dụng chính

sách phúc lợi, ưu tiên cho người da màu

Trang 13

Đồ thị phân bố tần số của biến Phần trăm dân số là người da màu có dạng phân phối lệchtrái

2 Sử dụng đồ thị và hệ số tương quan để nhận xét mối quan hệ giữa số lượng người chết do các bệnh liên quan đến tim mạch với các biến còn lại:

2.1 Đồ thị mối quan hệ giữa Số lượng người chết do các bệnh liên quan đến tim mạch với Phần trăm dân số từ 65 tuổi trở lên

Từ phần mền Megastat/ Correlation/ Regession/ Scatter Plot Sau đó ta nhập số liệu sốngười chết và phần trăm dân số từ 65 tuổi trở lên vào bảng, ta có bảng số liệu sau

Trang 14

Căn cứ vào đồ thị trên, ta thấy: Đồ thị phân tán có dạng tuyến tính Do đó, Giữa Sốlượng người chết do các bệnh liên quan đến tim mạch với Phần trăm dân số từ 65 tuổitrở lên có mối quan hệ tỷ lệ thuận với nhau

2.2 Đồ thị mối quan hệ giữa Số lượng người chết do các bệnh liên quan đến tim mạch với Thu nhập bình quân của người dân

Từ phần mền Megastat/ Correlation/ Regession/ Scatter Plot Sau đó ta nhập sốliệu số người chết và thu nhập vào bảng, ta có bảng số liệu sau

Căn cứ vào đồ thị trên, ta thấy: Đồ thị phân tán không có dạng tuyến tính Do đó,Giữa Số lượng người chết do các bệnh liên quan đến tim mạch với Thu nhập bình quânkhông có mối quan hệ với nhau

1.3 Đồ thị mối quan hệ giữa Số lượng người chết do các bệnh liên quan đến tim mạch với Phần trăm dân số là người da màu

Từ phần mền Megastat/ Correlation/ Regession/ Scatter Plot Sau đó ta nhập sốliệu số người chết và phần trăm dân số là người da màu vào bảng, ta có bảng số liệu sau

Trang 15

Căn cứ vào đồ thị trên, ta thấy: Đồ thị phân tán có dạng tuyến tính -> Giữa Số lượngngười chết do các bệnh liên quan đến tim mạch với Tỷ lệ da màu có mối quan hệ vớinhau

Hệ số tương quan giữa các biến

T ph n m n Megastat/Correlation/Regresion/Correlation Matrix, sau ó ta ề tỷ lệ người dân tử vong vì các bệnh liên quan đến tim đ đư a

to n b d li u s ng àn nước Mỹ về số người tử vong và một số số liệu về kinh ệ người dân tử vong vì các bệnh liên quan đến tim ố liệu ười dân tử vong vì các bệnh liên quan đến tim i ch t, tu i 65, thu nh p, t l da m u v o b ng, ta có ến tim ổi 65, thu nhập, tỷ lệ da màu vào bảng, ta có ập số liệu ỷ lệ người dân tử vong vì các bệnh liên quan đến tim ệ người dân tử vong vì các bệnh liên quan đến tim àn nước Mỹ về số người tử vong và một số số liệu về kinh àn nước Mỹ về số người tử vong và một số số liệu về kinh ảng số liệu được cho dưới đây:

b ng k t qu nh sau: ảng số liệu được cho dưới đây: ến tim ảng số liệu được cho dưới đây: ư

Correlation Matrix

Số người

Thu nhập

Tỷ lệ da màu

Căn cứ vào bảng trên ta thấy:

- Tương quan giữa Số người chết và Phần trăm dân số từ 65 tuổi trở lên là 0.788

- Tương quan giữa Số người chết và Thu nhập bình quân là -0.044

- Tương quan giữa Số người chết và Phần trăm dân số là người da màu là 0.312

Trang 16

Như vậy, Phần trăm dân số từ 65 tuổi trở lên có ảnh hưởng lớn nhất đến sự thay đổicủa Số lượng người chết vì các bệnh liên quan đến tim mạch, sau đó đến Phần trăm dân

số là người da màu Thu nhập bình quân không ảnh hưởng đến Số lượng người chết vìcác bệnh liên quan đến tim mạch

3 Ước lượng khoảng tin cậy cho Số người chết trung bình cho các bang ở Vùng 1 và Vùng 2

3.1 Số người chết trung bình cho các bang ở Vùng 1

a Mô tả thống kê cơ bản của Số người chết tại các bang ở Vùng 1

Từ phần mền Megastat/Descriptive statistics Sau đó ta nhập số liệu, số ngườichết ở vùng 1 vào bảng, từ đó ta có bảng số liệu như sau:

b Ước lượng Số người chết trung bình cho các bang ở Vùng 1

Từ số liệu ở bảng trên, ta sử dụng Phần mền Megastat/Confidence interval –mean, nhập số liệu vào bảng, ta có bảng số liệu sau:

Confidence interval - mean

95% confidence level257.138 mean

57.981 std dev

2.060 t (df = 25)23.419 half-width280.557 upper confidence limit

Trang 17

233.719 lower confidence limit

Căn cứ vào kết quả trên, chúng ta có thể ước lượng được khoảng tin cậy của Số

người chết do các bệnh liên quan đến tim mạch trung bình tại các bang Vùng 1 là nằmtrong khoảng (233.719; 280.557) Nói cách khác, chúng ta có thể ước đoán rằng 95% sốbang ở Vùng 1 có Số người chết do các bệnh liên quan đến tim mạch nằm trong khoảng

từ 233,7 đến 280,6 người trong số 100.000 dân

3.2 Số người chết trung bình cho các bang ở Vùng 2

Làm tương tự như câu trên ta có

a Mô t th ng kê c b n c a S ng ảng số liệu được cho dưới đây: ố liệu ơ bản của Số người chết tại các bang ở Vùng 2 ảng số liệu được cho dưới đây: ủa Mỹ đã thu thập số liệu ố liệu ười dân tử vong vì các bệnh liên quan đến tim i ch t t i các bang Vùng 2 ến tim ở Vùng 2.

b Ước lượng Số người chết trung bình cho các bang ở Vùng 2.

Confidence interval - mean

Trang 18

Khoảng tin cậy của Số người chết do các bệnh liên quan đến tim mạch trung bình

tại các bang Vùng 2 là nằm trong khoảng (237.266; 284.576) Nói cách khác, chúng ta

có thể ước đoán rằng 95% số bang ở Vùng 2 có Số người chết do các bệnh liên quanđến tim mạch nằm trong khoảng từ 237,3 đến 284,6 người trong số 100.000 dân

4.1 So sánh Số người chết trung bình cho các bang ở Vùng 1 và Vùng 2

Từ phần mền Megastat/Hypothesis tets/Compare Two Independent Groups Sau

đó ta nhập số liệu số người chết vùng 1 và vùng 2 vào bảng, sau đó ta có bảng số liệusau:

Hypothesis Test: Independent Groups (t-test, pooled variance)

4.2 So sánh Thu nhập bình quân của người dân các bang ở Vùng 1 và Vùng 2

Ta làm tương tự như phần 4.2 ta có kết quả như sau:

Hypothesis Test: Independent Groups (t-test, pooled variance)Thu nhập Group 1 Group 2

Ngày đăng: 02/01/2018, 11:30

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w