1. Trang chủ
  2. » Giáo án - Bài giảng

CAO HỌC BÀI GIẢNG PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC 5

73 656 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 73
Dung lượng 752,26 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

CAO HỌC BÀI GIẢNG PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC . HỆ THỐNG KIẾN THỨC CAO HỌC BÀI GIẢNG PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC , LÝ THUYẾT VỀ CAO HỌC BÀI GIẢNG PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC . TỔNG QUÁT VỀ CAO HỌC BÀI GIẢNG PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC

Trang 1

NHP 1

Chương V: Xử lý dữ liệu

•Nguyen Hung Phong

Chương 5: Xử lý dữ liệu

I Các đại lượng đo lường độ phân tán

II Ước lượng thơng số đám đơng từ mẩu

III Một số phép kiểm định cơ bản

IV Phân tích nhân tố

V Phân tích tương quan bằng hàm tương

quan

VI Kiểm tra các giả định của hàm tương quan

VII.Các phép kiểm định phi tham số

(non-parametric tests)

Sử dụng các cơng cụ thống kê trong phân tích

Mục tiêu và kiểu của các câu hỏi nghiên cứu

So sánh nhĩm

Thống kê mơ

tả (v.d trung

Trang 2

N Xi

1) / (

N Xi

1 2 2

/

1 2

2 =∑ − −

=

n i

n X Xi s

2σ2

) , ( µ σ2

I Các đại lượng đo lường độ phân tán

Ps

Pp

N P

P p p

P p

) 1 (

Trang 3

• Phân phối lệch trái (negative skew, left-skewed) khi đuôi phía trái

• Phân phối lệch phải (positive sknew, right-skewed) khi đuôi phía

phải dài hơn, và phần lớn số liệu tập trung ở phía trái của phân

phối

• Khi lệch phải, giá trị sknewness dương; khi lệch trái, giá trị

skewness âm Độ càng lớn thì giá trị sknewness càng lớn hơn 0.

• Với phân phối chuẩn, độ lệch gần như nhận giá trị 0 Tuy nhiên khi

giá trị này nằm trong khỏang -1 cho đến =1, chúng ta vẫn chấp

nhận phân phối xấp xĩ phân phối chuẩn

– Độ nhọn (kurtosis) đo lường mức độ nhọn hay bẹt của phân

phối so với phân phối bình thường (có độ nhọn bằng 0)

Phân phối có dạng nhọn khi giá trị kurtosis dương và có

dạng bẹt khi giá trị kurtosis âm

– Với phân phối bình thường, giá trị của độ lệch và độ nhọn

bằng 0 Căn cứ trên tỷ số giữa giá trị skewness và kurtosis

và sai số chuẩn của nó, ta có thể đánh giá phân phối có bình

thường hay không (khi tỷ số này nhỏ hơn -2 và lớn hơn +2,

phân phối là không bình thường).

Trang 4

NHP 10

Kỷ thuật chuyển đổi về phân phối chuẩn

Giảm độ lệch âm Dùng biến X2hoặc X3

Giảm độ lệch dương LogX

(X)1/2

1/X1/X2

Kéo dài các đuơi của

II Ước lượng thông số đám đông

II.1.1 Ước lượng trung

bình đám đông

– Chuyển phân phối

chuẩn tổng quát trở về

phân phối chuẩn một

đơn vị với biến ngẩu

nhiên

– Tìm xác xuất P sao

cho:

– Đối với phân phối

chuẩn một đơn vị, ta

X

X Z

P

) 1 ( ) ( − Zα/2≤ Z ≤ + Zα/2 = − α

P

30

n

Trang 5

NHP 13

II Ước lượng thông số đám đông

Như vậy, chúng ta sẽ có :

Hay:

Suy ra:

Ở đây, ta có:

2 / 2

2 2

n n X

σ = = =

II Ước lượng thông số đám đông

II.1.2 Ước lượng trung

bình đám đông

– Chuyển phân phối

chuẩn tổng quát trở về

phân phối t

– Tìm xác xuất P sao

cho:

– Đối với phân phối t

(phân phối student), ta

X

X t

P

) 1 ( ) ,

( − tα/2 (n−1)≤ t ≤ + tα/2(n−1) = − α

P

n<30

II Ước lượng thông số đám đông

Như vậy, chúng ta sẽ có :

Hay:

Suy ra:

Ở đây, ta có:

)1(2/)

1(2/ , − ≤ ≤ + −

) 1 ( 2 / )

1 ( 2 / , − ≤ − ≤+ , −

X n X

t

X − α2,(−1) σ ≤ µ ≤ + σ2,(−1) σ

2 2 2

2 2

n n X

σ = = =

Trang 6

NHP 16

II Ước lượng thông số đám đông

S P

p

s P P Z

– Chuyển phân phối

tổng quát về phân

phối chuẩn

– Tỷ lệ đám đông sẽ

nằm trong khoảng

p

s P P t

σ

=

II.2.1 Ước lượng tỷ lệ đám đông(Khi n nhỏhơn 30 phần tử)

– Chuyển phân phối

tổng quát về phân

phối student (t)

– Tỷ lệ đám đông sẽ

nằm trong khoảng

S

s p s n P P

n

P − α2,(−1) σ ≤ ≤ +σ2,(−1) σ

III Một số phép kiểm định giả thuyết

III.1 Kiểm định trung bình và tỷ lệ đám đông

Mục đích

Phát hiện xem các giá trị trung bình/tỷ lệ của đám đông

có sự thay đổi hay không

Phương pháp tiến hành

– Lấy mẩu từ đám đông sau đó tính trung bình hoặc tỷ

lệ mẩu

– Sử dụng trung bình hoặc tỷ lệ mẩu để kiểm định có sự

thay đổi về trung bình và tỷ lệ đám đông hay không

Trang 7

NHP 19

Các kỹ thuật kiểm định cơ bản

Các kỹ thuật kiểm định dùng theo loại dữ liệu và trắc nghiệm

Thang đo One-sample

Case

Two-Samples Tests k-Samples Tests

Related Samples Independent Samples

Related Samples Independent Samples

two Cochran Q - χ2for

k-samples Ordinal - Kolmogorov-

-Median test Mann- Whitney U

- Smirnov Wald- Wolfowitz

Kolmogorov Friedman two-way ANOVA

- Median extension Wallis one- way ANOVA Interval and Ratio - T-test - T-test for

paired samples

- T-test -

Repeated-measured ANOVA

- One-way ANOVA

- N-way ANOVA

Sai lầm trong kiểm định

Quyết định Bản chất của giả thuyết Ho

Chấp nhận H0 Quyết định

đúng

Sai lầm loại II (Beta)

Từ chối H0 Sai lầm loại I

(alpha)

Quyết định đúng

Giá trị xác suất (p Values)

• Giá trị p value được so sánh với mức ý nghĩa

(significant level - α), và dựa trên kết quả này để

bác bỏ hay không bác bỏ giả thiết

• Nếu giá trị p value nhỏ hơn mức ý nghĩa, giả

thiết bị bác bỏ (p value < α, bác bỏ giả thiết H0)

• Nếu giá trị p value bằng hoặc lớn hơn mức ý

nghĩa, không bác bỏ giả thiết Ho(p value > α,

không bác bỏ giả thiết H0)

Trang 8

NHP 22

Kiểm định ý nghĩa: các kiểu kiểm định

• Có hai loại: parametric (tham số) và

nonparametric (phi tham số)

– Parametric tests là công cụ mạnh vì xử lý các

dữ liệu dạng scale (interval, ratio)

– Nonparametric tests là công cụ xử lý các dữ

liệu dạng nominal và ordinal

Kiểm định ý nghĩa: các kiểu kiểm định

• Parametric tests đòi hỏi một số giả định:

– Các quan sát phải độc lập với nhau

– Các quan sát phải được rút ra từ các đám

đông có phân phối chuẩn

– Các nhóm trong đám đông phải có phương

sai tương đương

– Các biến phải có quan hệ tuyến tính

– Thang đo phải ở dạng scale để các tính toán

có thể thực hiện được

Kiểm định ý nghĩa: các kiểu kiểm định

• Nonparametric tests ít đòi hỏi các giả định:

– Không đòi hỏi các quan sát phải được rút ra từ các

đám đông có phân phối chuẩn

– Không đòi hỏi các nhóm phải có phương sai tương

đương

– Là cách duy nhất để xử lý dữ liệu danh xưng

(nominal)

– Là cách đúng đắn để xử lý dữ liệu với thang đo thứ

tự (ordinal), mặc dù parametric có thể áp dụng được

– Dễ hiểu và dễ sử dụng

Trang 9

X Z

σµ

=Trình tự

X tt

X t

σ

µ

=

– Bước 1: Thiết lập giả thuyết

– Bước 2: Chọn alpha

– Bước 3: Xác định phép kiểm

định (Z hoặc t) trong trường

hợp kiểm định trung bình

III.1 Kiểm định trung bình và tỷ lệ đám

đông

Trong trường hợp kiểm

định tỷ lệ đám đông,

chúng ta sẽ xác định

Ztthoặc tttnhư sau

S

p

p s tt

P P Z

σ

=

S P

p s tt

P P t

Bước 4: xác định giá trị

Z tthoặc tttcó nằm trong

vùng chấp nhận hay

không

Chấp nhận H 0 nếu

Từ chối H 0 , chấp nhận H 1, nếu

Tương tự trong trường hợp kiểm

định t, ta chấp nhận Honếu

] , [ Zα / 2 Zα 2

Ztt∈ −

] , [ Zα/2 Zα2

Ztt∉ −

] , [ − /2,(−1) 2,(−1)

] , [ − /2,(−1) 2,(−1)

Trang 10

NHP 28

Ví dụ: µ=6.5, lấy mẩu với n=9, tính

được giá trị trung bình là 7

1 One-Sample T Test

Analyze  Compare Means  One-Sample T Test

Ví dụ: µ=6.5, lấy mẩu với n=9, tính

được giá trị trung bình là 7

Trường hợp áp dụng:

– Khi đám đông được phân ra thành 2 hay nhiều nhóm

– Chúng ta muốn xác định các trung bình/tỷ lệ đám

đông có khác biệt hay không

– Dựa vào mẩu chúng ta sẽ tìm được hai trung bình/tỷ

lệ và sử dụng chúng để kiểm định cho trung bình/tỷ lệ

đám đông

Trang 11

Bước 1: Xác định giả thuyết

Bước 2: Chọn alpha

Bước 3: Xác định Ztthoặc ttt

(kiểm định 2 trung bình)

)(:

)(:

2 1 2 1 1

2 1 2 1

p p p p o

P P H

P P H

=

=µµµµ

)11)(

(

)(

2 1 2

2 2 1 2 2 1

2 2 2 1 2 2 1

n n n n

X X t

n n

X X Z

tt tt

++

=+

=

σσ

σσ

III.2 Kiểm định sự khác biệt giửa hai trung

bình, tỷ lệ

Nếu kiểm định sự khác biệt giửa hai tỷ lệ chúng ta

sẽ xác định giá trị Ztttheo cách sau

2 1 2 2 1 1

2

2 1

2 1

.

) 1 1 )(

1 (

n n n P n P p

n n p p

P P Z

s s

s s tt

• Bước 4: Khẳng định hay

bác bỏ giả thuyết

• Chấp nhận Honếu

• Từ chối Honếu

] ,

Ztt∈ −

] ,

Ztt∉ −

Trang 12

NHP 34

Ví dụ

• Ví dụ 3 Số liệu điều tra sử dụng xe máy

– Giả thiết Ho: tuổi trung bình của người sử

dụng xe máy nam và nữ là như nhau

– Giả thuyết H1: Có sự khác biệt về độ tuổi sử

Trang 13

P values (Sig (2-tailed)) cao hơn α = 0.05 rất nhiều

Ta chấp nhận giả thiết và diễn giải là không có sự khác biệt về tuổi

trung bình giữa người sử dụng xe máy là Nam và Nữ

Independent Samples Test

95% Confidence Interval of the Difference t-test for Equality of Means

Phân tích anova một chiều

• Giả sử chúng ta phân nhóm đám đông theo một tiêu thức phân loại

gồm k nhóm (j)

• Tiến hành lấy k mẫu với cở mẫu của một nhóm i nào đó là ni

• Giá trị của một quan sát i thuộc nhóm j sẽ được tính như sau:

• X ij = µ + αj+ εij Trong đó:

• µ: là trung bình tổng thể (trung bình của k nhóm)

• αj : giá trị tác động của nhóm j vào trung bình tổng thể

• εij : sai số

• Giả định εijcó phân phối chuẩn một đơn vị

• Hai thông số cần ước tính là µ và αj : ước tính theo phương pháp

tổng bình phương các sai lệch là nhỏ nhất

• Đối với mẫu: x ij=x+(x jx)+(x ijx j)

Trang 14

Phân tích anova một chiều

• Tổng biến thiên (SST):

• Tổng biến thiên giữa các nhĩm(SSB)

• Tổng biến thiên trong phạm vi nhĩm (SSW)

2

1 1

)(x x SST

i

n

i k j

j x x n SSB

1

2

) (

2

1 1

)( j k

j n

i

ij x x SSW

III.3 Kiểm định sự khác biệt giửa nhiều

trung bình (ANOVA một chiều)

• Bước 1: Thiết lập giả

thuyết

• Bước 2: Chọn alpha

Bước 3: Xác định giá trị

k j j j

tt i

k n x x

k x x n F

1 1

2 1 2)/(

)(

)1/(

)(

III.3 Kiểm định sự khác biệt giửa nhiều

trung bình (ANOVA một chiều)

• Bước 4: So sánh giửa Ftt

với Ftc

• Nếu Fttnhỏ hơn Ftc,

chúng ta chấp nhận Ho,

nếu ngược lại, chúng ta từ

chối Ho

• K: số nhóm

• n: tổng số phần tử lấy ra

từ k mẩu, số phần tử của

mỗi mẩu là nj

( 1 ) , ( ) , k n k

tc F

Trang 15

NHP 43

Ví dụ áp dụng: Anova

• Ví dụ 5 Số liệu điều tra sử dụng xe máy

• Giả thiết: Không có sự khác biệt giữa các người sử

dụng xe máy ở các nhóm tuổi khác nhau về số ngày

sử dụng bình quân trong tháng

5 One-Way ANOVA (Parametric Test)

Analyze  Compare Means  One-Way ANOVA…

Kết luận: bác bỏ giả thiết;

Phát biểu rằng có sự khác biệt giữa các người sử dụng xe máy ở các

nhóm tuổi khác nhau về số ngày sử dụng bình quân trong tháng

Trang 16

NHP 46

Kiểm định ANOVA hai chiều (two- way

anova) với khối ngẫu nhiên

• Trường hợp áp dụng:

– Khi có hai biến độc lập và một biến phụ thuộc

– Tìm kiếm có sự khác biệt của biến phụ thuộc theo

tiêu thức phân nhóm của biến độc lập

– Một biến độc lập đóng vai trò là biến phân nhóm

(category) biến còn lại có thể xem như biến ngoại lai

– Không xem xét sự tương tác giữa hai biến độc lập

(phân tích thử nghiệm khối ngẫu nhiên-randomized

block design)

– Trong mô hình khối ngẫu nhiên các mẫu được chọn

theo các cặp tương xứng

Kiểm định ANOVA hai chiều (two- way

anova) với khối ngẫu nhiên

• Ví dụ: Hiệu ứng của quảng cáo tại điểm bán hàng (POP:

point of purchase advertisng) lên doanh thu của cửa

hàng: nếu xem diện tích của cửa hàng là một biến can

thiệp/ngoại lai có thể tạo nên sự khác biệt của doanh thu

là một mô hình thử nghiệm khối ngẫu nhiên

• Cách thử nghiệm: trong mỗi nhóm/khối kích thước cửa

hàng (giả sử có 6 nhóm) chọn ngẫu nhiên 3 cửa hàng,

mỗi cửa hàng được trưng bày một kiểu POP (có 3 kiểu

POP)

• Tổng số quan sát sẽ là 18 cửa hàng, sô 1lie65u về

doanh số của 18 cửa hàng phân theo POP và khối như

sau

Kiểm định ANOVA hai chiều (two- way

anova) với khối ngẫu nhiên

Trang 17

NHP 49

Kiểm định ANOVA hai chiều (two- way

anova) với khối ngẫu nhiên

• Các giả định

– Phương sai của các nhóm phải bằng nhau

(dùng Levene test để kiểm định giả thuyết

này)

– Biến phụ thuộc phải có phân phối chuẩn

– Các quan sát phải độc lập với nhau

Kiểm định ANOVA hai chiều (two- way

anova) với khối ngẫu nhiên

TB theo

nhóm

TB tổng thể

• Giá trị của một quan sát của đám đông(yij)

• Giá trị quan sát của mẫu (yij)

• Ta có thể biến đổi đẳng thức (2) thành (3) và (4)

) 1 (

ij j i ij

) 2 (

ij j i

ij y

) 3 )(

( ) ( )

y

yij= + i− + j− + ijij+

) 4 )(

( ) ( )

(

)

( yijy = yiy + yjy + yijyiyj+ y

Trang 18

Kiểm định ANOVA hai chiều (two- way

anova) với khối ngẫu nhiên

2 1

) (y y k

k i

G = ∑ −

=

2 1

) (y y h

h j

SS SS

SS

k i h j ij E

B G

T = + + = ∑ ∑ −

= =

•Biến thiên giữa các nhóm

•Biến thiên giữa các khối

•Sai số

•Tổng biến thiên

Kiểm định ANOVA hai chiều (two- way

anova) với khối ngẫu nhiên

MS G G

1

=

h SS

MS B B

) 1 )(

1 ( − −

=

h k SS

MS E E

E G MS MS

E B MS

Kiểm định ANOVA hai chiều (two- way

anova) với khối ngẫu nhiên

h j k i H

H

µµµ

µ

µµµ

•Giả thuyết Ho

•Giả thuyết H1 : Có ít nhất hai trung bình theo nhóm và

theo khối khác nhau

α ), 1 )(

1 ( ), 1 ( − − −

= k k h

E

G F MS

MS F

•Từ chối H01 nếu

•Từ chối H02 nếu

α ), 1 )(

1 ( ), 1 ( − − −

= h k h E

B F MS MS F

Trang 19

Kiểm định ANOVA hai chiều (two- way

anova) với khối ngẫu nhiên

• Trình tự xữ lý trên SPSS

– Vào analyze, general linear models, univariate: nhập

biến phụ thuộc vào “dependent list” và hai biến độc

lập vào “fixed factor”

– Vào “model”, chọn “custom”: đưa biến phụ thuộc và

biến ngoại lai (từ factors and covariates) vào “model”,

nhấp chuột để thay “interaction” bằng “main effects”

– Chọn “continue”, chọn “option”, vào “descriptive

statistics” và “homogeneity tests” sau đó nhấp vào

“continue”, và “ok”

Kiểm định ANOVA n chiều (two- way

anova): thử nghiệm thừa số

• Giả sử chúng ta có hai xử lý thực nghiệm A & B

Xử lý A có a mức và xử lý B có b mức

• Mô hình này sẽ có a.b mức xử lý kết hợp

• Nếu chúng ta thực hiện đo lường lặp lại

(replicated measure)cho các nhóm mẫu khác

nhau với số lần lập lại là r: AB(a.b:r)

• Cách thức phân tích cũng tương tự như trường

hợp hai biến, nhưng tương tác giữa hai cách xử

lý sẽ xuất hiện ở đây

Kiểm định ANOVA n chiều (two- way

anova): thử nghiệm thừa số

• Ví dụ: chúng ta thử nghiệm 3 dạng POP (POP1,

POP2, POP3) và 5 kiểu bao bì PK (PK1, PK2,

….,PK5): đây là thử nghiệm thừa số 3x5

• Chúng ta chọn 1 cửa hàng cho mỗi cách xử lý

kết hợp, như vậy chúng ta cần 15 cửa hàng cho

một lần thử nghiệm, và thực hiện lặp lại 3 lần,

cho nên tổng số quan sát sẽ là 45

• Dạng này là thử nghiệm lặp lại và đo lường cho

3 cửa hàng khác nhau gọi là đo lường lặp lại

Trang 20

Kiểm định ANOVA n chiều (two- way anova): thử nghiệm thừa số

Kiểu bao bì

PK (tác động

2)

126.50

120.00 122.00

129.50 129.00

125.39

122.50

117.50

120.00

126.50

127.00

122.89

132.50

123.00

124.50

128.50

127.50

128.06

122.00

119.00 120.50 119.00

120.50 118.00

119.89

118.00

121.00

122.00 122.00

126.00 126.00

122.61

TB POP 124.60 121.00 125.70 TB tổng thể:

123.77

Kiểm định ANOVA hai chiều (two- way

anova): thử nghiệm thừa số

Xử lý

1 Y 111 y 112… y 11r Y 211 y 212 … y 21r ……….

Y a11 y a12 y a1r 2 Y 121 y 122… y 12r Y 221 y 222… y 22r ………

……… Y a21 y a22 y a2r … ……

……….

………

………

……….

………

….………….

b Y1b1 y1b2… y1br Y2b1 y2b2… y2br ………

Yab1 yab2 yabr

Kiểm định ANOVA hai chiều (two- way anova):

thử nghiệm thừa số

• Giá trị một quan sát (yijr)

• Đẳng thức (1) có thể biến đổi thành đẳng thức (2) và (3)

Như vậy tổng biến thiên sẽ bao gồm bốn bộ phận: biến thiên

giữa các nhóm i, j, biến thiên của tương tác, và biến thiên của

các sai lệch

) 1 ( )

( i j ij ijr

i i

ijr y

) 2 )(

( ) (

) (

)

(i j ij i j ijr ij

ijr y y y y y y y y y y y

) 3 )(

( ) (

) (

)

(

)

( yijry = yiy + yjy + yijyiyj+ y + yijryij

Trang 21

Kiểm định ANOVA n chiều (two- way

anova): thử nghiệm thừa số

Các biến thiên Bậc tự do

(abr-1)(a-1)(b-1)(a-1)(b-1)ab(r-1)

Bảng Anova hai chiều:ab:r

Loại biến thiên Tổng Bậc tự do Trung bình F

Giữa các xử lý A SSA (a-1)

SS

MS=

b-1

B B

SS

MS =

(a-1)(b-1)

I I

SS

MS =

ab-1

M M

SS

MS =

ab(r-1)

E E

M S

M E

M S

Kiểm định ANOVA n chiều (two- way

anova): thử nghiệm thừa số

• Trình tự xữ lý trên SPSS

– Vào analyze, general linear models, univariate: nhập

biến phụ thuộc vào “dependent list” và hai biến độc

lập vào “fixed factor”

– Vào “model”, chọn “custom”: đưa biến phụ thuộc và

biến ngoại lai (từ factors and covariates) vào “model”,

chọn “ interaction” là “full factorial”

– Chọn “continue”, chọn “option”, vào “descriptive

statistics” và “homogeneity tests” sau đó nhấp vào

“continue”, và “ok”

Trang 22

NHP 64

Kiểm định ANOVA hai chiều (two- way anova)

có tính đến tương tác giữa hai biến độc lập

• Trình tự xữ lý trên SPSS

– Vào lệnh analize, chọn general linear model,

sau đó chọn univariate

– Nhập biến độc lập vào ô dependent variable

– Nhập lần lượt hai biến độc lập vào “Fixed

factor”

– Select option và click vào: descriptive,

estimates of effect size, và homogeneity tests

– Nhấp chuột vào “continue” và sau đó nhấp

“ok”

IV Mô hình EFA

• EFA là phương pháp giúp chúng ta đánh

giá được giá trị hội tụ và giá trị phân biệt

của đo lường

• EFA giúp chúng ta rút gọn một tập hợp k

biến quan sát thành một tập hợp f biến

các yếu tố có ý nghĩa hơn (f < k)

• Dịch chuyển các items đo lường một biến

này sang biến khác

Mô hình EFA một nhân tố

(Phương sai của biến đo lường)

• Tìm mối quan hệ giữa 3 đại lượng trong

mô hình

– Phương sai của biến đo lường: var(Xi)

– Hiệp phương sai giữa nhân tố Fivà biến đo

lường Xi: Cov(Fi, Xi)

– Hiệp phương sai giữa hai biến đo lường Xivà

Xj: Cov (Xi, Xj)

Trang 23

I Mô hình EFA một nhân tố

U 1

U 2

U k

1δ2δ

I Mô hình EFA một nhân tố

(Phương sai của biến đo lường)

• Giả định 1: biến đo

lường Xibao gồm hai

Cov(F,Ui)=cov(F,Uj) = cov(Ui,Uj) = 0

Mô hình EFA một nhân tố

(phương sai của biến đo lường)

• Quan hệ giữa biến Xivới phần chung và

riêng được tính như sau

Trang 24

Mô hình EFA một nhân tố

(Phương sai của biến đo lường)

• Phương sai của biến

var( Xi) = λi var( ) F + δi var( Ui) 2 + λ δi iCo v( , F Ui)

Mô hình EFA một nhân tố

(phương sai của biến đo lường)

Hi2nói lên phần phương sai của biến quan

sát Xiđược giải thích bởi F, và Hi2càng lớn

thì phần riêng sẽ càng nhỏ cho nên biến Xi

càng đóng góp nhiều cho biến F

Mô hình EFA một nhân tố

Như vậy: trong EFA một nhân tố, trọng số nhân tố chính là hệ số

tương quan giữa nhân tố đó với biến đo lường X i

Trang 25

Mô hình EFA một nhân tố

Như vậy: nếu hệ số tương quan giữa hai biến đó lường X i , X j càng lớn

thì trọng số nhân tố của hai biến này càng lớn Do đó hai biến này đo

lường tốt cho yếu tố F (factor)

Mô hình EFA hai nhân tố độc lập

X 1

X 2

X k

.

Mô hình EFA hai nhân tố độc lập

• Khái quát về mô hình:gồm

phần chung cho F 1 và F 2 và

phần riêng U 1 của X i

• Giả định: F1và F2độc lập, và

chúng cũng độc lập với các

phần riêng của các biến X i

• Các biến có phân phối chuẩn

Trang 26

Mô hình EFA hai nhân tố độc lập

Mô hình EFA hai nhân tố độc lập

Nếu F 1 và X i là các biến thuộc N(0,1), chúng ta có

Cov(F 1 ,X i )=Corr(F 1 ,X i ) và Var(F 1 )=1, do đó

( , i) ( , i)

Cov F X = Corr F X = λ

Mô hình EFA hai nhân tố độc lập

Như vậy trong mô hình EFA với hai yếu tố độc lập thì trọng số

nhân tố giữa F i và X i vẫn là hệ số tương quan giữa F i và X i

Trang 27

Mô hình EFA hai nhân tố độc lập

Cov X X Cov F F Cov F F Cov F U

Cov F F Cov F F Cov F U

Cov U F Cov U F Cov U U

Căn cứ vào các giả định ban đầu, chúng ta có:

Cov(F i ,F j )=Cov(F i ,U j )=Cov(U i ,U j )=o; và var(F 1 )=var(F 2 )=1,

cov(X i ,X j )=corr(X i ,X j ) Vì vậy:

i1 1 1 i2 2 2

( i, j) j ( ) j ( )

Cov X X =λ λVar F +λ λ Var F

i1 1 i2 2( i, j) ( i, j) j j

Cov X X =Corr X X =λ λ +λ λ

Mô hình EFA hai nhân tố độc lập

Tương tự như mô hình EFA một nhân tố, trong mô hình hai

nhân tố độc lập, hệ số tương quan giữa hai biến X i , X j là

tổng của tích hai trọng số λ i1 và λ ji của X i và X j trên từng

Trang 28

Mô hình hai nhân tố có tương quan

Cov F U =Cov F U =Cov U U =

Các biến X i , U i , F i là những biến thuộc

N(0,1)

III Mô hình hai nhân tố có tương quan

(Phương sai của Xi)

Var X Var F Var F Var U

Cov F F Cov FU Cov F U

III Mô hình hai nhân tố có tương quan

(Phương sai của Xi)

Trang 29

III Mô hình hai nhân tố có tương quan

(Hiệp phương sai của Fi và Xi)

Như vậy hệ số tương quan của biến X i với F i bao gồm không chỉ

trọng số nhân tố giữa X i và F i mà còn thành phần tương quan của

Cov X X Cov F F Cov F F Cov F U

Cov F F Cov F F Cov F U

Cov U F Cov U F Cov U U

III Mô hình hai nhân tố có tương quan

(Hiệp phương sai của Fi và Xi)

i1 1 1 i2 2 2 i1 2 i2 1 1 2

( i, j) jvar( ) j ( ) ( j j) ( , )

Cov X X =λ λ F +λ λ Var F +λ λ +λ λ Cov F F

Do F 1 và F 2 thuộc N(0,1) và cov(F i ,F j )=cor(F i ,F j ), chúng ta có

1 2 i1 1 i2 2 i1 2 i2 1

Trang 30

Ma trận EFA

• Hai ma trận đánh giá thang đo

– Ma trận các trọng số nhân tố (factor pattern matrix)

– Ma trận các hệ số tương quan (factor structure

matrix)

• Khi các nhân tố (factor) không có quan hệ với

nhau thì trọng số nhân tố giữa một nhân tố (Fi)

và một biến đo lường (Xi) là hệ số tương quan

giữa hai biến đó

• Trọng số nhân tố thể hiện sự tác động của khái

niệm nghiên cứu vào biến đo lường

Ma trận EFA

• Biến đo lường biểu diển ở dạng tổ hợp tuyến tính của

phần chung và phần riêng, Giả sử chúng ta có 2 nhân

tố và k biến đo lường

Trang 31

Các phép trích nhân tố cơ bản

• Hai mô hình chính: Mô hình nhân tố chung

(CFM-Common factor model) và mô hình thành

phần chính (PCA-principal components

analysis)

• PCA: phần chung (communality) đưa vào ban

đầu cho các biến đo lường bằng 1 (Đưa 100%

phương sai của biến đo lường Xivào phân tích)

Mục tiêu trích được nhiều nhất phương sai các

biến

• CFM: chọn phần chung đưa vào nhỏ hơn 1 và

cô lập phần riêng Mục tiêu giải thích tốt nhất

hiệp phương sai giữa các biến

Xác định số lượng nhân tố (factor)

• Ba phương pháp xác định số lượng nhân tố

– Tiêu chí eigenvalue: số lượng nhân tố dừng lại ở

nhân tố có eigenvalue tối thiểu bằng 1

– Tiêu chí điển gãy: dựa vào đường biểu diển số nhân

tố (trục hoành) và giá trị của eigenvalue (trục

tung).Điểm gãy là điểm tại đó đường biểu diển của

eigenvalue (bằng với số nhân tố) thay đổi độ dốc đột

ngột

– Chọn trước số lượng nhân tố: khẳng định số lượng

nhân tố trước dựa vào lý thuyết

Chọn phép quay nhân tố

• Quay vuông góc (varimax): sau khi quay,

trục của các nhân tố vẫn ở vị trí vuông góc

với nhau

• Quay không vuông góc(Promax): trục của

các nhân tố không còn vuông góc với

nhau.Trọng số nhân tố của các biến đo

lường sẽ tối đa ở trục nhân tố chúng đo

lường và tối thiểu ở trục còn lại

Trang 32

Điều kiện sử dụng EFA

• Nếu hệ số tương quan giữa các biến đo

lường nhỏ (nhỏ hơn 0.3) sử dụng EFA

không phù hợp (Hair et al, 2006)

• Dùng các phép kiểm định

– Kiểm định Barlett xem xét ma trận tương

quan có phải là ma trận đơn vị hay không(là

ma trận có hệ số tương quan giữa các biến

bằng 0, và đường chéo bằng 1) Nếu giá trị p

nhỏ hơn 5%, chúng ta sẽ bác giả thuyết H0

(ma trận là ma trận đơn vị)

Điều kiện sử dụng EFA

• Dùng các phép kiểm định

– Kiểm định KMO (Keiser-Meyer-Olkin)

• KMO là chỉ số so sánh độ lớn của hệ số tương

quan của hai biến Xivà Xjso với tổng hệ sô tương

quan (gồm hệ số tương quan giữa hai biến và hệ

số tương quan riêng phần-partial correlation)

• KMO càng gần 1 thì càng tốt.Tối thiểu KMO phải

lớn hơn 0.5, mức chấp nhận nên từ 0.6 trở lên

Điều kiện sử dụng EFA

Trang 33

Phân tích nhân tố (EFA)

• Mục đích

– Làm giãm biến

– Dịch chuyển các yếu tố thành phần/biến quan

sát từ nhân tố này sang nhân tố khác

– Nhấn vào mục descriptive trên hộp thoại để xác định

các tham số thống kê mô tả Sau đó nhấn continue

– Nhấn vào mục Extraction chọn phương pháp phân

tích là “Principal components” và phần extract với

“eigenvalue” over 1

– Nhấn mục Rotation: Chọn phương pháp “varimax”

– Nhấn mục Score, chọn phương pháp “regression”

• Kết quả sẽ hiển thị trên phần mềm SPSS

IV Phaân tích nhaân tố (factor

analysis)

• Phân tích kết quả:

– Dựa vào biểu “Total Variance explained”: số nhân tố

rút ra phải có giá trị eigenvalue lớn hơn 1

– Biểu “Rotated component matrix” cho biết yếu tố

thành phần nào đo lường được nhân tố nào: những

yếu tố thành phần nào có hệ số tải nhân tố lớn trong

nhân tố nào thì nó sẽ đo lường nhân tố đó

– Hệ số tải nhân tố (factor loading) là hệ số tương quan

đơn giửa các yếu tố thành phần và các nhân tố

Trang 34

NHP 100

IV Kiểm định Chi bình phương

• So sánh với Chi-bình

phương tiêu chuẩn

• Chúng ta chấp nhận giả

thuyết Hokhi ( )

2

) ( 1 , 2

k n k alpha

tt≤χ − −

χ

V Hàm tương quan

• V.1 Hệ số tương quan và sơ đồ phân tán

• V.2 Hàm tương quan đơn biến

• V.3 Hàm tương quan đa biến

V.1 Sơ đồ phân tán và hệ số tương

quan

• Sơ đồ phân tán thể hiện mối quan hệ

giửa hai biến

–Phân tích hệ số tương quan dùng để đo

lường mối quan hệ đồng hành giửa hai

biến.

– Hệ số tương quan không thể hiện mối

quan hệ nhân quả.

Trang 36

NHP 106

V.1 Hệ số tương quan

• Hệ số tương quan của đám đông ký

hiệu là ρ (rho) thể hiện sự đồng hành

của hai biến.

• Hệ số tương quan của mẩu r dùng ước

lượng cho rho và nó thể hiện tương

quan tuyến tính dựa trên các phần tử

quan sát được từ mẩu.

(continued)

V.1 Đặc điểm của ρ and r

• Không có đơn vị đo lường

• Biến động trong phạm vi -1 và1

– Càng gần -1, mối quan hệ nghịch biến càng

x

y

x

Ngày đăng: 27/10/2014, 22:38

HÌNH ẢNH LIÊN QUAN

Bảng Anova hai chiều:ab:r - CAO HỌC  BÀI GIẢNG PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC 5
ng Anova hai chiều:ab:r (Trang 21)
Hình phi tuyến - CAO HỌC  BÀI GIẢNG PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC 5
Hình phi tuyến (Trang 55)
Hình phi tuyến - CAO HỌC  BÀI GIẢNG PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC 5
Hình phi tuyến (Trang 55)
Bảng tính - CAO HỌC  BÀI GIẢNG PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC 5
Bảng t ính (Trang 66)

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w