1. Trang chủ
  2. » Tất cả

BTL-môn-XSTK-Copy

21 3 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 21
Dung lượng 539,05 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

3 Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 98% A.. Một kết quả kiểm tra các bệnh nhân đau mắt hột được cho trong bảng sau: Hãy nhận xé

Trang 1

ĐẠI HỌC QUỐC GIA ĐẠI HỌC BÁCH KHOA TP.HCM

Trang 2

ĐẠI HỌC QUỐC GIA ĐẠI HỌC BÁCH KHOA TP.HCM

Trang 3

Đề tài 8 – Nhóm 08 Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ

liệu đó cho các yêu cầu sau:

1)Thực hiện phương pháp phân tổ dữ liệu (A)

2)Vẽ đồ thị phân phối tần số và đa giác tần số (A)

3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 98% (A)

4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị

5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không

Bài 2: Điểm đánh giá của 20 người dùng thử về 2 loại sản phẩm đậu phộng trước và sau cải tiến

được thu thập trên thang điểm 10 như sau:

Trang 4

Bài 4: Bệnh đau mắt hột được chia làm 4 thời kỳ T1, T2, T3 và T4 Một kết quả kiểm tra các

bệnh nhân đau mắt hột được cho trong bảng sau:

Hãy nhận xét xem tình hình đau mắt hột ( cơ cấu phân bố 4 mức độ) ở 3 địa phương trên có

giống nhau hay không, sử dụng mức ý nghĩa 1%

Bài 5: Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi

quy tuyến tính đơn Thực hiện các yêu cầu: 1) Tìm hệ số tương quan giữa X,Y 2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ

Trang 5

- Sử dụng Excel: Để phân tổ A, ta chọn Data → Data analysis → Histogram

Trang 6

- Ta sẽ thu đc bảng ghi lại tần số và % tích lũy như sau:

Nhịp tim(nhịp/phút)

Sốngười % Tích lũy

Trang 7

40-60 60-80 80-100 >100 0

2 4 6 8 10 12 14 16

2 4 6 8 10

Trang 8

Đa giác phân phối tần số (Insert → Area → chọn kiểu đồ thị)

- Tính các đặc trưng và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cây là 98%

o Chọn Data → Data analysis → Descriptive Statistics, nhập vài Input Range vùng dữ liệu được sắp xếp theo cột

- Ta được bảng kết quả

Trang 9

- Giá trị trung bình chính là Mean 83,175

b Bảng định tính B:

- Lấy ngẫu nhiên kết quả khám bệnh của 150 bệnh nhân bị tăng nhịp tim so với mức bình thường, khảo sát nguyên nhân gây ra tình trạng này, thu được kết quả theo bảng sau:

Bị stress, căng thẳng, suy nhược thần kinh 41

Sử dụng các chất kích thích, cà phê, thức ăn giàu chất béo 32

Có các bệnh liên quan đến tim mạch 10

- Để tính tỉ lệ %, ta làm như sau: Nhập vào C2: =B2/$B$9, copy cho các ô còn lại

Trang 11

Có các bệnh liên quan đến tim mạch

Đang sử dụng các loại thuốc khác

Người cao tuổi

Di truyền

Đồ thị hình tròn biểu diễn phân phối tần số

- Kiểm định dữ liệu A và B có phù hợp với 1 phân bố xác suất nào đó hay không?

a Dữ kiện (A):

Nhịp tim(nhịp/phút) Số người % Tích lũy

o GTKĐ H : o Mẫu phù hợp với phân phối chuẩn

o GT đối H1: Mẫu không phù hợp với phân phối chuẩn

Trang 12

- Vì đây là bài toán sử dụng hai mẫu không độc lập, các mẫu có sự liên hệ với nhau, cụ

thể như việc đánh giá mức độ hiệu quả trước và sau khi cải tiến 1 sản phẩm → Bài toán kiểm định giả thiết của 2 trung bình tổng thể với các mẫu phụ thuộc.

- Ta sẽ bác bỏ Ho trong những trường hợp sau:

o Đối với kiểm định 2 phía: t Stat < - t Critical two-tail hoặc t Stat > t Critical

two-tail

o Đối với kiểm định 1 phía bên phải: t Stat > t Critical one-tail

o Đối với kiểm định 1 phía bên trái: t Stat < - t Critical one-tail

Trang 13

2 Các bước thực hiện:

- Nhập bảng dữ liệu vào Excel

- Chọn Data → Data Analysis → t-test: Paired Two Sample for Means → chọn vùng

số liệu từ bảng dữ liêu, chọn là mức ý nghĩa → OK

3 Kết quả và kiểm định : Sử dụng Excel

o Từ các giá trị tính được, ta thấy: t Stat = - 0,557 không thuộc Ws

→ Do đó ta không bác bỏ H → Việc cải tiến đối với hạt thứ nhất là có hiệu quả.o

Trang 14

o Từ các giá trị tính được, ta thấy: t Stat 2,3434thuộc Ws

o Giá trị P cần tìm là P = 0,0438

→ Do đó ta bác bỏ H → Việc cải tiến đối với hạt thứ nhất là chưa hiệu quả.o

BÀI 3:

1 Cơ sơ lý thuyết :

- Đây là bài toán phân tích phương sai 2 yếu tố, ở mỗi yếu tố có sự lặp lại k lần thí

nghiệm, cụ thể vào mùa khô chúng ta đo lương saponin cho 3 thời điểm: đầu mùa, giữa mùa, cuối mùa Tương tự như vào mùa mưa cũng lặp lại việc đo cho 3 thời

điểm

- Kiểm định: Ta đưa ra 3 giả thiết:

o Giả thiết 1: Giá trị trung bình các giá trị qua sát được theo yếu tố nguyên nhânthứ nhất (cột) là bằng nhau

o Giả thiết 2: Giá trị trung bình các giá trị qua sát được theo yếu tố nguyên nhânthứ hai (hàng) là bằng nhau

o Giả thiết 3: Có sự tương tác qua lại giữa yếu tố thứ nhất (cột) và thứ hai (hàng)

j 1

SSA ck  x  x MSA = r−1 SSA F R=MSA

MSE

Trang 15

Sai số (r-1)(c-1) SSE = SST – (SSA + SSB +

SSAB) MSE = rc(k−1) SSE

- Nhập số liệu vào bảng Excel

- Chọn Data → Data Analysis → Anova: Two-Factor with Replication → Chọn các dòng, cột trong bảng số liệu, chọn alpha là mức ý nghĩa: 0,02, chọn Rows per Sample

o Giả thiết 2: giá trị trung bình của hàm lượng saponin theo từng mùa là giống nhau

o Giả thiết 3: có sự tương tác qua lại giữa 2 yếu tố vùng mà mùa

- GT đối H1: Hai yếu tố không tương tác với nhau

Trang 16

- Kết quả tính toán từ excel thu được như sau:

- Để kiểm định các giả thiết Ho và H1 ta dựa vào bảng ANOVA, với các giá trị Fqs (F) và

F0,05 (F crit)

Trang 17

- Trong bài này F ( 164,8696) F( 5,516)C    → Bác bỏ giả thiết 1 → Lượng saponin trung bình của từng vùng là khác nhau trong cùng 1 mùa

F (R 2,7826) F( 7,1877)  → chấp nhận giả thiết 2→ Lương saponin

là trong 1 mùa là giống nhau trong cùng 1 vùng

F ( 0,6956) F( 5,5163)1    → Chấp nhận giả thiết 3 → Yếu tố vùng miền và mùa ảnh hưởng đến lượng saponin

BÀI 4:

1 Cơ sở lý thuyết:

- Giả thiết kiểm định Ho: X, Y độc lập

Giả thiết đối H1: X, Y không độc lập

- Gọi X là mức độ đau mắt hột; Y là địa phương sinh sống

- Giả thiết kiểm định:

o H0 : X,Y độc lập

Trang 19

- Để tính hệ số tương quan ta chọn Data → Data analysis → Regression, xuất hiện bảng,

ta khai báo như sau:

o Input Y Range: Chọn vùng ‘Lượng Cholesterol’

o Input X Range: Chọn vùng ‘Độ tuổi’

Trang 20

- Kết quả thu được sẽ hiển thị trong bảng SUMMARY OUTPUT, trong đó hệ số tương

quan (Multiple R) là 0,874984069

- Để tìm đường hồi quy tuyến tính, ta sử dụng bảng kết quả thứ 3

- Ta thấy giá trị ghi là Intercept chính là A, giá trị ghi ‘Độ tuổi (X)’ chính là giá trị B Vậy đường hồi quy tuyến tính sẽ có dạng là: y = 0,0481x + 1,5179

- Kiểm định: Hệ số hồi quy

o GTKĐ Ho: B=0 GT đối H1: B≠0

o Miền bác bỏ: Ws = tn 2; /2  ;  2,12;

o t Stat = 7,229 → thuộc Ws

→ Bác bỏ Ho, hệ số hồi quy có ý nghĩa (B≠0)

- Kiểm định sự phụ thuộc tuyến tính của Y theo X:

o GTKĐ Ho: “X và Y không có quan hệ tuyến tính”

o GT đối H1: “X và Y có quan hệ tuyến tính”

o Ta có được số liệu của F từ bảng ANOVA

o F = 52,2585 > 2,12*e-6 → Bác bỏ Ho → Vậy X và Y có quan hệ tuyến tính

Trang 21

- Nếu ta click chọn ô ‘Line Fit Plots’ trong bảng Regression, sẽ thu được đồ thị biểu diễn đường hồi quy tuyến tính như hình trên Đường màu cam chính là đường hồi quytuyến tính của Y theo X, những điểm màu xanh chính là tọa độ của các điểm

Ngày đăng: 10/07/2019, 19:20

w