1. Trang chủ
  2. » Công Nghệ Thông Tin

EXCEL TRONG THỐNG KÊ

45 270 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 45
Dung lượng 2,16 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Theo dõi số khách hàng mua các loại giày này trong 5 ngày, người quản lí thu được bảng số liệu sau hãy so sánh lượng tiêu thụ trung bình của 3 loại giày nói trên... Bài 3Tính tỉ số tương

Trang 1

MS – EXCEL TRONG

THỐNG KÊ

Trang 3

nhau về cơ cấu sử dụng các phương tiện giao thông đi làm trong 2 nhóm công nhân nam và nữ hay không?

Trang 4

• Ta muốn kiểm định giả thuyết sau

H0: π1 = π2 = … = πk ( các phân bố này là như nhau trên các tập hợp chính Hi )

Trang 5

Chú ý rằng H0 tương đương với hệ đẳng thức sau:

CƠ SỞ LÝ THUYẾT

Trang 6

Mẫu Tính

ij 0j

k

1 j

ij

n

Trang 7

Nếu H0 đúng và các TSLT không nhỏ hơn 5 thì T sẽ có

phân bố xấp xỉ phân bố χ2 với (k-1)(r-1) bậc tự do

Miền bác bỏ có dạng T > c , ở đó c được tìm từ điều kiện P{T > c} = α

Vậy c là phân vị mức α của phân bố χ2 với (k-1)(r-1) bậc

) n

(n T

n : TSQS

n

.n

n p

n n

: TSLT

2 k

1 j

ij

i0 0j

* i 0j

* ij

CƠ SỞ LÝ THUYẾT

Trang 8

Trong MS-EXCEL có hàm CHITEST:

c

1

2 ij ij

E

) E (O

O ij : tần số thực nghiệm của ô thuôc hàng i và cột j

E ij : tần số lý thuyết của ô thuộc hàng i với cột j, r: số hàng và c: số cột

• P(X > χ 2 ) ≥ α ⇒ chấp nhận giả thiết Ho

• P(X > χ 2 ) < α ⇒ loại bỏ giả thiết Ho

CƠ SỞ LÝ THUYẾT

Trang 9

THUẬT TOÁN

Trang 11

Cơ cấu sử dụng phương tiện giao thông

đi làm trong hai nhóm công nhân nam và

nữ là khác nhau

Trang 12

Bài 2

Một cửa hàng lớn có bán 3 loại giày A, B và C Theo dõi số khách hàng mua các loại giày này trong 5 ngày, người quản lí thu được bảng số liệu sau

hãy so sánh lượng tiêu thụ trung bình của 3 loại giày nói trên

Trang 13

Giả sử {x 11 ,x 21 ,…,x n11 } là một mẫu có kích thước n 1 rút ra từ tập hợp chính các giá trị của X 1 ; {x 12 ,x 22 ,…,x n22 } là một mẫu kích thước rút ra từ tập hợp chính các giá trị của X 2 ,…, {x 1k ,x 2k ,

…,xnkk} là một mẫu kích thước nk rút ra từ tập hợp các giá trị của Xk

i

n n

=

= k

1 i k

T T

n

T

x =

CƠ SỞ LÝ THUYẾT

Trang 14

Tổng

cộng

SSE = SST - SSF n-k

Sai số

k-1

Yếu tố

Giá trị thống kê

Bình phương trung bình Tổng số bình phương

2

i

2 i

n

T n

T SSF

n

1 j

2 2

n

n

T Y

SST

1 k

SSF MSF

=

k n

SSE MSE

Trang 15

Nếu giả thiết H0 đúng thì tỷ số sẽ có phân bố Fisher với bậc tự do là (k – 1, n – k ).

Thành thử giả thiết Ho sẽ bị bác bỏ ở mức ý nghĩa α của phân bố Fisher với bậc tự do ( k – 1, n – k )

Phương pháp kiểm định trên được gọi là phân tích

phương sai một nhân tố

MSE

MSF

F =

CƠ SỞ LÝ THUYẾT

Trang 16

THUẬT TOÁN

- Nhập bảng số liệu như hình vẽ

- Chọn Tools/ Data Analysis/ Anova: Single Factor

Trang 19

H0 : “Lượng tiêu thụ trung bình của ba loại giày nói trên là như nhau”

Trang 20

Bài 3

Tính tỉ số tương quan của Y đối với X và hệ số xác định của tập số liệu sau đây:

Có nhận xét gì về mối quan hệ giữa X và Y?

Trang 21

CƠ SỞ LÝ THUYẾT

• Hai biến số ngẫu nhiên Y và X có thể liên quan tuyến tính,

có khuynh hướng tuyến tính hoặc không có liên quan

• Để đo mức độ phụ thuộc tuyến tính giữa 2 ĐLNN X và Y, người ta đưa ra khái niệm hệ số tương quan

• Hệ số tương quan lý thuyết của X và Y, ký hiệu ρ được

định nghĩa bởi công thức sau

là giá trị trung bình và độ lệch tiêu chuẩn của X

là giá trị trung bình và độ lệch tiêu chuẩn của Y

Y X

Y

Xσ σ

) μ )(Y

μ

E(X

Y Y

X X

σ , μ

σ , μ

Trang 22

1 i

2 i

2 i

n

1 i

i i

XY XX

XY

)y(y

)x(x

)y)(y

x(x

SS

Sr

• Chúng ta có bài toán ước lượng và kiểm định hệ số tương quan ρ căn cứ trên một mẫu quan sát (x1, y1) (x2, y2) , … , (xn,

• Đại lượng sau đây được sử dụng như một ước lượng cho ρ

r được gọi là hệ số tương quan

Để tính toán thuận lợi, r có thể viết dưới dạng

CƠ SỞ LÝ THUYẾT

2 ) y (

2 y n

2 ) x (

2 x n

y) x)(

( xy)

Trang 23

• Tỉ số tương quan đuợc lý giải như là tỉ lệ biến động của Y do có sự phụ thuộc tuyến tính của Y vào X

• Hệ số xác định là bình phương của hệ số tương quan,

kí hiệu: r2

• Hệ số xác định r là tỉ lệ biến động của Y do có sự phụ thuộc tuyến tính của Y vào X

CƠ SỞ LÝ THUYẾT

Trang 24

CƠ SỞ LÝ THUYẾT

Trang 25

- Nhập bảng số liệu như hình vẽ

- Chọn Tools/ Data Analysis/ Correlation

THUẬT TOÁN

Trang 27

Hệ số

tương quan r

Trang 28

Tỷ số tương quan của Y đối với X

Trang 30

Bài 4

Bảng sau đây cho ta một mẫu gồm 11 quan sát (xi, yi) từ tập hợp chính các giá trị của cặp đại lượng ngẫu nhiên (X,Y)

a Tìm đường hồi quy của Y đối với X

b Tính sai số tiêu chuẩn của đường hồi quy

c Tính tỉ số F để kiểm định sự đúng đắn của giả thiết:

Có hồi quy tuyến tính của Y theo X

Trang 31

• X,Y là hai ĐLNN Nếu Y có quan hệ tuyến tính theo

X, ta nói Y có hồi quy tuyến tính theo X

• Đây là phương trình hồi quy tuyến tính của Y theo X

∀ β0 , β: Hệ số hồi quy lý thuyết

(trong đó X là biến độc lập, Y là biến phụ thuộc)

βx β

y = 0 +

CƠ SỞ LÝ THUYẾT

Trang 32

Một mẫu kích thước n đồng thời về X, Y có dạng bảng số liệu sau đây, gọi là bảng tương quan mẫu

.y

n n

1 )

x /X

Y (

1 j

i ij i

Trang 33

Phương trình hồi quy tuyến tính

• Bài toán đặt ra là ước lượng các hệ số hồi quy lý thuyết

β0 , β trên mẫu quan sát (x1, y1) ,…, (xn, yn)

• Dựa vào phương pháp bình phương cực tiểu, ta sẽ tìm được giá trị ước lượng tương ứng là B0 và B

• Đuờng hồi quy tuyến tính mẫu Y theo X có phương

trình y = B0 + Bx gần với đường hồi quy mẫu Y theo X nhất, sao cho (B, B0) là điểm cực tiểu của hàm:

• Ý nghĩa: Dự báo giá trị Y khi biết X = x0

n B

, (

CƠ SỞ LÝ THUYẾT

Trang 34

Phương trình hồi quy mẫu Y theo X

Trong đó:

Bx B

x a y

B s

y x

xy B

(x )

i x Y , i

(x (x i+1 , Y x i+1 )

) 1 ,

1

(i = k

CƠ SỞ LÝ THUYẾT

Trang 35

2 ) Y i

SSE MSE

=

CƠ SỞ LÝ THUYẾT

Trang 36

Trắc nghiệm t

• Giả thuyết:

H0: β I = 0 “Hệ số hồi quy không có ý nghĩa”

“Hệ số hồi quy có ý nghĩa”

n 2

n

2 n

i i

) X (X

S S

S

B S

β

B t

0 β

:

CƠ SỞ LÝ THUYẾT

Trang 37

Trắc nghiệm F

• Giả thuyết:

H 0 : β I = 0 “Phương trình hồi quy không thích hợp”

“Phương trình hồi quy thích hợp”

:

CƠ SỞ LÝ THUYẾT

Trang 38

Ngoài việc ước lượng các hệ số hồi quy, ta còn quan tâm đến ước lượng σ 2 ,

σ 2 là một con số đo sự phân tán của Y xung quanh đường thẳng hồi quy

Ước lượng σ 2 đuợc cho theo công thức sau:

xung quanh đường thẳng hồi quy.

2 0 i

i

2 Y.X (y Bx B )

2n

1s

Dạng khác của công thức trên là:

2 n

y B

xy B

y

2 2

Trang 39

THUẬT TOÁN

- Nhập bảng số liệu như hình vẽ

- Chọn Tools/ Data Analysis/ Regression

Trang 41

Sai số tiêu chuẩn

B o B

Trang 42

Nói một cách khác, phương trình hồi quy này thích hợp

⇒ Có hồi quy tuyến tính của Y theo X

Trang 43

29 , 0 2895 ,

0 0838 ,

0

0838 ,

0 2

11

88 , 0

* 739 , 1 7193 ,

1

* 548 , 1 8856 ,

1 2

7193 ,

1

8856 ,

1

88 ,

0

739 , 1 548

, 1 11

.

0

2 2

xy B

y s

xy

y

y

B B

n

Thuật toán tính sai số tiêu

chuẩn

Trang 45

 Đường hồi quy: y = 1,55x – 1,74

 Sai số tiêu chuẩn của đường hồi quy: 0,29

 F = 12,64

 X và Y có mối quan hệ tuyến tính với nhau

KẾT LUẬN

Ngày đăng: 14/04/2018, 15:10

TỪ KHÓA LIÊN QUAN

w