1. Trang chủ
  2. » Công Nghệ Thông Tin

thống kê trong ms excel rất hay

22 388 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 22
Dung lượng 561,27 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

thống kê trong ms excel

Trang 1

Đại học Quốc Gia TP HCM ĐẠI HỌC BÁCH KHOA -oOo - Chương trình Kỹ sư CLC Việt - Pháp

Trang 2

TP.HCM 06/2010

Trang 3

BÀI I: Trình bày lại ví dụ 3.4 trang 161 và ví dụ 4.2 trang 171 Giáo Trình XSTK 2009.

Ví dụ 3.4: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:

Phân tích phương sai ba yếu tố:

- Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của 3 yếu tố trên các giá trị quan sát

G (yếu tố A:i=1 r, yếu tố B: j=1 r, yếu tố C: k=1 r)

- Mô hình: khi nghiên cứu ảnh hưởng của 2 yếu tố, mỗi yếu tố có n mức thì người ta dùng mô hình hình vuông la tinh n×n Ví dụ:

Trang 4

Trắc nghiệm:

Giả thiết H0: μ1 =μ2= …μk ⇔ “Các giá trị trung bình bằng nhau”

H1: μi ≠μj ⇔ “Có ít nhất 2 giá trị trung bình khác nhau”

ir

T

T r

1 2

2

2 MSR=

2

=

r i

kr

T

T r

1 2

2

2 MSF=

SSE=SST-(SSF+SSR+SSC)

MSE=

) 2 )(

1 (rr

2

∑∑∑

Trang 5

Chọn ô C7 và nhập biểu thức = SUM(B3:E3)

Chọn ô D7 và nhập biểu thức = SUM(B4:E4)

Chọn ô E7 và nhập biểu thức = SUM(B5:E5)

Tính Tj: Chọn ô b8 và nhập biểu thức =SUM(B2:B5)

Dùng con trỏ kéo kí hiệu từ điền từ ô B8 đến ô E8

Tính Tk: Chọn ô B9 và nhập biểu thức = SUM(B2, C5,D4,E3)

Chọn ô C9 và nhập biểu thức = SUM(B3, C2,D5,E4)

Chọn ô D9 và nhập biểu thức = SUM(B4, C3,D2,E5)

Chọn ô E9 và nhập biểu thức = SUM(B5, C4,D3,E2)

Tính T: Chọn ô B10 và nhập biểu thức =SUM(B2:E5)

Tính các giá trị của ô G: Chọn ô G và nhập biểu thức =SUMSQ(B7:E7)

Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9

Trang 6

Ví dụ 4.2 : Người ta dùng ba mức nhiệt độ gồm 105, 120, 135 o C kết hợp với ba khoảng thời gian là

15, 30, 60 phút để thực hiện một phản ứng tổng hợp Các hiệu suất của các phản ứng (%) được trình bày trong bảng sau :

Thời gian (phút)

BÀI LÀM

1/ Cơ sở lý thuyết:

Đây là một bài toán hồi quy tuyến tính đa tham số, trong đó, Y (hiệu suất) liên quan đến hai biến số X1 (thời gian), X2 ( nhiệt độ)

Sau khi tìm các giá trị thống kê, ta sẽ có hai phần trắc nghiệm hồi quy gồm :

- Trắc nghiệm t: so sánh giá trị t với giá trị t0,05, bậc tự do là γ = N-k-1 (k là số biến) (tra bảng Student)Kiểm định các giả thuyết: H0: “ Các hệ số hồi quy không có ý nghĩa”

H1:”Có ít nhất vài hệ số hồi quy có ý nghĩa”

- Trắc nghiệm F: so sánh giá trị F với giá trị F0,05, bậc tự do là n1=1, n2=N-k-1 (tra bảng Fisher)

Kiểm định các giả thuyết: H0: “Phương trình hồi quy không thích hợp”

H1: “Phương trình hồi quy thích hợp”

2/ Áp dụng Excel:

Nhập bảng dữ liệu:

Dữ liệu bắt buộc phải được nhập theo cột

Trang 7

Sử dụng công cụ Regression:

Vào Data > Data Analysis Chọn mục Regression

Trong cửa sổ Regression, nhập vào các dữ liệu sau: Input Y range (phạm vi biến số Y)

Input X range (phạm vi biến số X)

Labels (nhãn dữ liệu)

Confidence Level (mức tin cậy)

Ouput Range (tọa độ đầu ra)

Một vài tùy chọn khác: Line Fit Plots ( đường hồi quy), Residual Plots ( biểu thức sai số)

8

Trang 8

1 Phương trình hồi quy của Y theo X1

Phương trình hồi quy : Y = 2.7367 +0.04454X1 (R2=0.2139, S=1.8112); N=9; k=1;

t0=t Stat(Intercept)=2.129 < t0,05(7)=2.365 (hay P value=0.0708 > α=0.05)

Phương trình hồi quy của Y theo X2

Phương trình hồi quy: Y = -11.1411 +0.12856X2 (R2=0.7638; S=0.9929);N=9; k=1;

t0= t Stat(Intercept) =3.4178 > t0,05(7)=2.365 (hay P value=0.0112 < α=0.05)

Phương trình hồi quy của Y theo X1 và X2

Phương trình hồi quy : Y = -12.7 + 0.0445X1 + 0.1286X2 (R2=0.9777; S=0.3297); N=9; k=2;

t0= t Stat(Intercept) =1.1016 > t0,05(6)=2.447 (hay P value=0.000026 < α=0.05)

Trang 9

Để dự đoán hiệu suất của phản ứng bằng phương pháp hồi quy

Y = -12.7 + 0.0445X1 + 0.1286X2 , ta thay các giá trị X1, X2, thì sẽ được kết quả

X1=50, X2=115 :

Chọn ô bất kỳ, nhập vào công thức =B66+B67*50+B68*115

Vậy với X1=50, X2=115, Y= 4.310873016

10

Trang 10

BÀI II : Lập bảng ANOVA cho bảng số liệu sau đây:

12 16 12 14 26

19 20 18 9 22 19

34 29 31 19 26

19 21 17 14

Giả thiết H o có bị bác bỏ ở mức 5% hay không?

BÀI LÀM 1/ Cơ sở lý thuyết:

Để kiểm định giả thiết Ho cĩ bị bác bỏ ở mức 5% hay khơng, ta phải thực hiện phép phân tích phương sai (phân tích phương sai 1 yếu tố)

-Khái niệm thống kê:

+Phép phân tích phương sai được dùng trong các trắc nghiệm để so sánh các giá trị trung bình của hai hay nhiều mẫu được lấy từ các phân số.Đây cĩ thể được xem như phần mở rộng của trắc nghiệm t hay

z (so sánh hai giá trị trung bình)

+Mục đích của sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của một yếu tố(nhân tạo hay tự nhiên) nào đĩ đến các giá trị quan sát,Yi,(i=1,2,… ,k)

Trang 11

k i i

T T SSF

+Giả thiết: H0:µ µ1 = 2 = µk ⇔”Các giá trị trung bình bằng nhau”

H1:µ µij ⇔”Ít nhất có hai giá trị trung bình khác nhau”

Nhấp chuột đơn lệnh tools và lệnh Data Analysis

Chọn chương trình “Anova:single factor” trong hộp thoại Data analysis rồi nhấp nút OK

Trong hộp thoại “Anova:single factor” lần lượt ấn định: Phạm vi đầu (Input range)

Cách sắp xếp theo hang hay cột (Group by) Nhấn dữ liệu (Labels in Fisrt Row/Column)

12

Trang 12

Kết quả:

Kết quả và biện luận: F=5.814789 > F0,05=3.238872

⇒Vậy: Bác bỏ giả thuyết H0

Trang 13

BÀI III : Một nhà tâm lý học muốn nghiên cứu ảnh hưởng của quê quán đối thời gian cần thiết (tính bằng phút) để một sinh viên có thế trả lời một câu đố 4 bốn nhóm sinh viên từ 4 vùng khác nhau (nội thành, ngoại thành, thị trấn, nông thôn) được khảo sát với kết quả thu được như sau:

Phân tích sự ảnh hưởng của quê quán đến thời gian cần thiết để sinh viên trả lời câu hỏi (Chỉ duy nhất 1 yếu tố quê quán) => Chọn phân tích phương sai 1 yếu tố

-Khái niệm thống kê:

+Phép phân tích phương sai được dùng trong các trắc nghiệm để so sánh các giá trị trung bình của hai hay nhiều mẫu được lấy từ các phân số.Đây cĩ thể được xem như phần mở rộng của trắc nghiệm t hay

z (so sánh hai giá trị trung bình)

+Mục đích của sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của một yếu tố(nhân tạo hay tự nhiên) nào đĩ đến các giá trị quan sát,Yi,(i=1,2,… ,k)

1

k i i

T T SSF

MSE

=

14

Trang 14

+Giả thiết: H0:µ µ1 = 2 = µk ⇔”Các giá trị trung bình bằng nhau”

H1:µ µij ⇔”Ít nhất có hai giá trị trung bình khác nhau”

Nhấp chuột đơn lệnh tools và lệnh Data Analysis

Chọn chương trình “Anova:single factor” trong hộp thoại Data analysis rồi nhấp nút OK

Trong hộp thoại “Anova:single factor” lần lượt ấn định: Phạm vi đầu(input range)

Cách sắp xếp theo hang hay cột(group by) Nhấn dữ liệu(Labels in Fisrt Row/Column)

Trang 15

Kết quả:

Kết quả và biện luận: F=1.027069 < Fc=3.410534 =>Chấp nhận giả thiết H

⇒Vậy quê quán khong ảnh hưởng đến thời gian trả lời câu hỏi của sinh viên

16

Trang 16

BÀI IV : Tính tỷ số tương quan của Y đối với X và hệ số xác định của tập số liệu sau đây:

(X, Y) = (15, 13), (25, 22), (10, 6), (15, 17), (20, 21), (10, 10), (20,

25), (25, 18), (30, 14), (30, 10) Có nhận xét gì về mối quan hệ

giữa X và Y?

BÀI LÀM 1/ Cơ sở lí thuyết:

Phân tích tương quan – Khái niệm thống kê:

Hệ số tương quan Pearson:

σ σ

ρ

Y X Y

X

Y X COV ( , )

) (

) (

N i

n

i i i YY

XX

XY

Y Y X

X

Y X

S S

S

i i

Y X

R

2 2

1

) (

) (

))(

Phân tích hồi quy – Khái niệm thống kê:

Phép phân tích hồi quy tuyến tính (liner regression) hay được áp dụng trong khoa học ví dụ, đường hồi quy (regression line / line of best fit) thường dung để dự đốn tuổi thọ hay hạn dùng của thuốc

Phương trình hồi quy cĩ thể được ước tính bằng phương pháp bình phương cực tiểu (least square

Y X Y

i

Y - biến số phụ thuộc (dependent/response variable)

X - biến số độc lập (independent/predictor variable)

B0 và B – các hệ số hồi quy (regression coefficients)

Bảng anova

phương

Bình phương trung bình

− )2

Trang 17

Giá trị thống kê:

Giá trị R-bình phương (R-square):

R=SSR/SST (100R2: % của biến đổi trên Y được giải thích bởi X)

Độ lệch chuẩn (Standard error):

i

=2

Yi N

(Sự phân tán của dữ liệu càng ít thì giá trị của S càng gần zero)

Trắc nghiệm thống kê:

Đối với một phương trình hồi quy, YX = B0 + BX, ý nghĩa thống kê của các số Bi (B0 hay B) được đánh giá bằng trắc nghiệm t (phân phối Student) trong khi tính chất thích hợp của phương trình YX = f(x) được đánh giá bằng trắc nghiệm F (phân bố Fischer)

Trắc nghiệm t

Giả thiết: H0: Bi=0 “Hệ số hồi quy không có ý nghĩa”

H0: Bi<>0 “Hệ số hồi quy có ý nghĩa”

X

S S

n n

B i

2 2

2 2

Giả thiết: H0: Bi=0 “Phương trình hồi quy không thích hợp”

H0: Bi<>0 “Phương trình hồi quy thích hợp”

Trang 18

Áp dụng “Correlation” tính hệ số tương quan:

Trên thanh công cụ chọn Tools-> Data Analysis

Chọn “Correlation” rồi Ok

Nhập đầu vào (input range)

Cách sắp xếp theo hàng / cột (group by),ở đây ta chon theo hàng

Nhập đầu ra (output range)

Nhấn ENTER

Á

p dụng “Regresson” tìm sự tương quan tuyến tính:

Trên thanh công cụ chon Tools-> Data Analysis

Chọn “Regresson” rồi Ok

Nhập đầu vào biến Y (input Y range)

Nhập đầu vào biến X (input X range)

Nhãn dữ liệu (label)

Mức tin cậy (confidence lever)

Nhập đầu ra (output range)

Đường hồi quy (line fit plot)

Biểu thức sai số (residuals plots)

Nhấn ENTER

Trang 19

Ta được kết quả:

Kết luận:Hệ số hồi quy A: t0= 1,8 < t0,05=2,776, chấp nhận H0 (hệ số A có ý nghĩa)

Hệ số hồi quy B: t0= 0,955 < t0,05=2,776, chấp nhận H0 (hệ số B có ý nghĩa)

Phương trình hồi quy Y= 10,4+0,26 X thích hợp

⇒Vậy 2 biến X, Y có tương quan tuyến tính

20

Trang 20

BÀI V : Theo dõi số học sinh đến lớp muộn của năm trường PTTH vào các ngày khác nhau trong tuần người ta thu được số liệu về số lượng học sinh trung bình đến lớp muộn của các trường đó vào một ngày tiêu biểu trong tuần như sau:

Ngày trong tuần

Trường PTTH

Thứ hai Thứ tư Thứ sáu Thứ bảy

5 4 4 4

4 5 3 4

5 3 4 3

7 2 5 2 Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của các trường Có sự khác biệt gì về số lượng học sinh đến lớp muộn vào các ngày khác nhau trong tuần?

BÀI LÀM

1/ Cơ sở lý thuyết:

Phân tích phương sai hai yếu tố (khơng lặp)

Khái niệm thống kê

Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Yij (i=1.2…r: yếu

tố A; j=1.2…c: yếu tố B)

Mơ hình

Yếu tố A

cộng

Trung bình

Yếu tố B

(cột)

Sai số

r-1(r-1)(c-1)

j

j rc

T

1

2

MSB=

1

r SSB

FC=

MSE MSF

Trang 21

Trắc nghiệm:

Giả thiết: H0: μ1 = μ2= …=μk ⇔ “Các giá trị trung bình bằng nhau”

H1: μi ≠ μj ⇔ “Có ít nhất 2 giá trị trung bình khác nhau”

Giá trị thống kê: FR=MSE MSB và FC=MSF MSE

Biện luận: Nếu FR < Fa[b-1,(k-1)(b-1)] => chấp nhận H0 (yếu tố A)

Nếu FC < Fa[k-1,(k-1)(b-1)] => chấp nhận H0 (yếu tố B)

2/ Áp dụng Excel:

Nhập bảng dữ liệu:

Áp dụng bảng Anova: Factor Without Replication:Vào Tools > Data Analysis Chọn mục Anova: Two-Factor Without Replication

Two-Xuất hiện bảng:

22

Trang 22

OK > ta được kết quả:

Kết quả và biện luận: FR=2.036 < F0.05=3.863 => chấp nhận giả thiết H0 (trường)

FC=0.107 < F0.05=3.863 => chấp nhận giả thiết H0 (ngày trong tuần)

⇒Vậy số lượng học sinh đến lớp muộn không khác nhau giữa các trường cũng như các ngày trong tuần

HẾT

Ngày đăng: 25/05/2014, 08:57

HÌNH ẢNH LIÊN QUAN

Bảng Anova: - thống kê trong ms excel rất hay
ng Anova: (Trang 11)
Bảng Anova: - thống kê trong ms excel rất hay
ng Anova: (Trang 13)
Bảng anova - thống kê trong ms excel rất hay
Bảng anova (Trang 16)
Bảng Anova - thống kê trong ms excel rất hay
ng Anova (Trang 20)

TỪ KHÓA LIÊN QUAN

w