CAO HỌC BÀI GIẢNG PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC . HỆ THỐNG KIẾN THỨC CAO HỌC BÀI GIẢNG PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC , LÝ THUYẾT VỀ CAO HỌC BÀI GIẢNG PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC . TỔNG QUÁT VỀ CAO HỌC BÀI GIẢNG PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC
Trang 1NHP 1
Chương V: Xử lý dữ liệu
•Nguyen Hung Phong
Chương 5: Xử lý dữ liệu
I Các đại lượng đo lường độ phân tán
II Ước lượng thơng số đám đơng từ mẩu
III Một số phép kiểm định cơ bản
IV Phân tích nhân tố
V Phân tích tương quan bằng hàm tương
quan
VI Kiểm tra các giả định của hàm tương quan
VII.Các phép kiểm định phi tham số
(non-parametric tests)
Sử dụng các cơng cụ thống kê trong phân tích
Mục tiêu và kiểu của các câu hỏi nghiên cứu
So sánh nhĩm
Thống kê mơ
tả (v.d trung
Trang 2N Xi
1) / (
N Xi
1 2 2
/
1 2
2 =∑ − −
=
n i
n X Xi s
2σ2
) , ( µ σ2
I Các đại lượng đo lường độ phân tán
Ps
Pp
N P
P p p
P p
) 1 (
Trang 3• Phân phối lệch trái (negative skew, left-skewed) khi đuôi phía trái
• Phân phối lệch phải (positive sknew, right-skewed) khi đuôi phía
phải dài hơn, và phần lớn số liệu tập trung ở phía trái của phân
phối
• Khi lệch phải, giá trị sknewness dương; khi lệch trái, giá trị
skewness âm Độ càng lớn thì giá trị sknewness càng lớn hơn 0.
• Với phân phối chuẩn, độ lệch gần như nhận giá trị 0 Tuy nhiên khi
giá trị này nằm trong khỏang -1 cho đến =1, chúng ta vẫn chấp
nhận phân phối xấp xĩ phân phối chuẩn
– Độ nhọn (kurtosis) đo lường mức độ nhọn hay bẹt của phân
phối so với phân phối bình thường (có độ nhọn bằng 0)
Phân phối có dạng nhọn khi giá trị kurtosis dương và có
dạng bẹt khi giá trị kurtosis âm
– Với phân phối bình thường, giá trị của độ lệch và độ nhọn
bằng 0 Căn cứ trên tỷ số giữa giá trị skewness và kurtosis
và sai số chuẩn của nó, ta có thể đánh giá phân phối có bình
thường hay không (khi tỷ số này nhỏ hơn -2 và lớn hơn +2,
phân phối là không bình thường).
Trang 4NHP 10
Kỷ thuật chuyển đổi về phân phối chuẩn
Giảm độ lệch âm Dùng biến X2hoặc X3
Giảm độ lệch dương LogX
(X)1/2
1/X1/X2
Kéo dài các đuơi của
II Ước lượng thông số đám đông
II.1.1 Ước lượng trung
bình đám đông
– Chuyển phân phối
chuẩn tổng quát trở về
phân phối chuẩn một
đơn vị với biến ngẩu
nhiên
– Tìm xác xuất P sao
cho:
– Đối với phân phối
chuẩn một đơn vị, ta
có
X
X Z
P
) 1 ( ) ( − Zα/2≤ Z ≤ + Zα/2 = − α
P
30
≥
n
Trang 5NHP 13
II Ước lượng thông số đám đông
Như vậy, chúng ta sẽ có :
Hay:
Suy ra:
Ở đây, ta có:
2 / 2
2 2
n n X
σ = = =
II Ước lượng thông số đám đông
II.1.2 Ước lượng trung
bình đám đông
– Chuyển phân phối
chuẩn tổng quát trở về
phân phối t
– Tìm xác xuất P sao
cho:
– Đối với phân phối t
(phân phối student), ta
có
X
X t
P
) 1 ( ) ,
( − tα/2 (n−1)≤ t ≤ + tα/2(n−1) = − α
P
n<30
II Ước lượng thông số đám đông
Như vậy, chúng ta sẽ có :
Hay:
Suy ra:
Ở đây, ta có:
)1(2/)
1(2/ , − ≤ ≤ + −
) 1 ( 2 / )
1 ( 2 / , − ≤ − ≤+ , −
X n X
t
X − α2,(−1) σ ≤ µ ≤ + σ2,(−1) σ
2 2 2
2 2
n n X
σ = = =
Trang 6NHP 16
II Ước lượng thông số đám đông
S P
p
s P P Z
– Chuyển phân phối
tổng quát về phân
phối chuẩn
– Tỷ lệ đám đông sẽ
nằm trong khoảng
p
s P P t
σ
−
=
II.2.1 Ước lượng tỷ lệ đám đông(Khi n nhỏhơn 30 phần tử)
– Chuyển phân phối
tổng quát về phân
phối student (t)
– Tỷ lệ đám đông sẽ
nằm trong khoảng
S
s p s n P P
n
P − α2,(−1) σ ≤ ≤ +σ2,(−1) σ
III Một số phép kiểm định giả thuyết
III.1 Kiểm định trung bình và tỷ lệ đám đông
Mục đích
Phát hiện xem các giá trị trung bình/tỷ lệ của đám đông
có sự thay đổi hay không
Phương pháp tiến hành
– Lấy mẩu từ đám đông sau đó tính trung bình hoặc tỷ
lệ mẩu
– Sử dụng trung bình hoặc tỷ lệ mẩu để kiểm định có sự
thay đổi về trung bình và tỷ lệ đám đông hay không
Trang 7NHP 19
Các kỹ thuật kiểm định cơ bản
Các kỹ thuật kiểm định dùng theo loại dữ liệu và trắc nghiệm
Thang đo One-sample
Case
Two-Samples Tests k-Samples Tests
Related Samples Independent Samples
Related Samples Independent Samples
two Cochran Q - χ2for
k-samples Ordinal - Kolmogorov-
-Median test Mann- Whitney U
- Smirnov Wald- Wolfowitz
Kolmogorov Friedman two-way ANOVA
- Median extension Wallis one- way ANOVA Interval and Ratio - T-test - T-test for
paired samples
- T-test -
Repeated-measured ANOVA
- One-way ANOVA
- N-way ANOVA
Sai lầm trong kiểm định
Quyết định Bản chất của giả thuyết Ho
Chấp nhận H0 Quyết định
đúng
Sai lầm loại II (Beta)
Từ chối H0 Sai lầm loại I
(alpha)
Quyết định đúng
Giá trị xác suất (p Values)
• Giá trị p value được so sánh với mức ý nghĩa
(significant level - α), và dựa trên kết quả này để
bác bỏ hay không bác bỏ giả thiết
• Nếu giá trị p value nhỏ hơn mức ý nghĩa, giả
thiết bị bác bỏ (p value < α, bác bỏ giả thiết H0)
• Nếu giá trị p value bằng hoặc lớn hơn mức ý
nghĩa, không bác bỏ giả thiết Ho(p value > α,
không bác bỏ giả thiết H0)
Trang 8NHP 22
Kiểm định ý nghĩa: các kiểu kiểm định
• Có hai loại: parametric (tham số) và
nonparametric (phi tham số)
– Parametric tests là công cụ mạnh vì xử lý các
dữ liệu dạng scale (interval, ratio)
– Nonparametric tests là công cụ xử lý các dữ
liệu dạng nominal và ordinal
Kiểm định ý nghĩa: các kiểu kiểm định
• Parametric tests đòi hỏi một số giả định:
– Các quan sát phải độc lập với nhau
– Các quan sát phải được rút ra từ các đám
đông có phân phối chuẩn
– Các nhóm trong đám đông phải có phương
sai tương đương
– Các biến phải có quan hệ tuyến tính
– Thang đo phải ở dạng scale để các tính toán
có thể thực hiện được
Kiểm định ý nghĩa: các kiểu kiểm định
• Nonparametric tests ít đòi hỏi các giả định:
– Không đòi hỏi các quan sát phải được rút ra từ các
đám đông có phân phối chuẩn
– Không đòi hỏi các nhóm phải có phương sai tương
đương
– Là cách duy nhất để xử lý dữ liệu danh xưng
(nominal)
– Là cách đúng đắn để xử lý dữ liệu với thang đo thứ
tự (ordinal), mặc dù parametric có thể áp dụng được
– Dễ hiểu và dễ sử dụng
Trang 9X Z
σµ
−
=Trình tự
X tt
X t
σ
µ
=
– Bước 1: Thiết lập giả thuyết
– Bước 2: Chọn alpha
– Bước 3: Xác định phép kiểm
định (Z hoặc t) trong trường
hợp kiểm định trung bình
III.1 Kiểm định trung bình và tỷ lệ đám
đông
Trong trường hợp kiểm
định tỷ lệ đám đông,
chúng ta sẽ xác định
Ztthoặc tttnhư sau
S
p
p s tt
P P Z
σ
−
=
S P
p s tt
P P t
Bước 4: xác định giá trị
Z tthoặc tttcó nằm trong
vùng chấp nhận hay
không
Chấp nhận H 0 nếu
Từ chối H 0 , chấp nhận H 1, nếu
Tương tự trong trường hợp kiểm
định t, ta chấp nhận Honếu
] , [ Zα / 2 Zα 2
Ztt∈ −
] , [ Zα/2 Zα2
Ztt∉ −
] , [ − /2,(−1) 2,(−1)
] , [ − /2,(−1) 2,(−1)
Trang 10NHP 28
Ví dụ: µ=6.5, lấy mẩu với n=9, tính
được giá trị trung bình là 7
1 One-Sample T Test
Analyze Compare Means One-Sample T Test
Ví dụ: µ=6.5, lấy mẩu với n=9, tính
được giá trị trung bình là 7
Trường hợp áp dụng:
– Khi đám đông được phân ra thành 2 hay nhiều nhóm
– Chúng ta muốn xác định các trung bình/tỷ lệ đám
đông có khác biệt hay không
– Dựa vào mẩu chúng ta sẽ tìm được hai trung bình/tỷ
lệ và sử dụng chúng để kiểm định cho trung bình/tỷ lệ
đám đông
Trang 11Bước 1: Xác định giả thuyết
Bước 2: Chọn alpha
Bước 3: Xác định Ztthoặc ttt
(kiểm định 2 trung bình)
)(:
)(:
2 1 2 1 1
2 1 2 1
p p p p o
P P H
P P H
≠
≠
=
=µµµµ
)11)(
(
)(
2 1 2
2 2 1 2 2 1
2 2 2 1 2 2 1
n n n n
X X t
n n
X X Z
tt tt
++
−
=+
−
=
σσ
σσ
III.2 Kiểm định sự khác biệt giửa hai trung
bình, tỷ lệ
Nếu kiểm định sự khác biệt giửa hai tỷ lệ chúng ta
sẽ xác định giá trị Ztttheo cách sau
2 1 2 2 1 1
2
2 1
2 1
.
) 1 1 )(
1 (
n n n P n P p
n n p p
P P Z
s s
s s tt
• Bước 4: Khẳng định hay
bác bỏ giả thuyết
• Chấp nhận Honếu
• Từ chối Honếu
] ,
Ztt∈ −
] ,
Ztt∉ −
Trang 12NHP 34
Ví dụ
• Ví dụ 3 Số liệu điều tra sử dụng xe máy
– Giả thiết Ho: tuổi trung bình của người sử
dụng xe máy nam và nữ là như nhau
– Giả thuyết H1: Có sự khác biệt về độ tuổi sử
Trang 13P values (Sig (2-tailed)) cao hơn α = 0.05 rất nhiều
Ta chấp nhận giả thiết và diễn giải là không có sự khác biệt về tuổi
trung bình giữa người sử dụng xe máy là Nam và Nữ
Independent Samples Test
95% Confidence Interval of the Difference t-test for Equality of Means
Phân tích anova một chiều
• Giả sử chúng ta phân nhóm đám đông theo một tiêu thức phân loại
gồm k nhóm (j)
• Tiến hành lấy k mẫu với cở mẫu của một nhóm i nào đó là ni
• Giá trị của một quan sát i thuộc nhóm j sẽ được tính như sau:
• X ij = µ + αj+ εij Trong đó:
• µ: là trung bình tổng thể (trung bình của k nhóm)
• αj : giá trị tác động của nhóm j vào trung bình tổng thể
• εij : sai số
• Giả định εijcó phân phối chuẩn một đơn vị
• Hai thông số cần ước tính là µ và αj : ước tính theo phương pháp
tổng bình phương các sai lệch là nhỏ nhất
• Đối với mẫu: x ij=x+(x j−x)+(x ij−x j)
Trang 14Phân tích anova một chiều
• Tổng biến thiên (SST):
• Tổng biến thiên giữa các nhĩm(SSB)
• Tổng biến thiên trong phạm vi nhĩm (SSW)
2
1 1
)(x x SST
i
n
i k j
j x x n SSB
1
2
) (
2
1 1
)( j k
j n
i
ij x x SSW
III.3 Kiểm định sự khác biệt giửa nhiều
trung bình (ANOVA một chiều)
• Bước 1: Thiết lập giả
thuyết
• Bước 2: Chọn alpha
Bước 3: Xác định giá trị
k j j j
tt i
k n x x
k x x n F
1 1
2 1 2)/(
)(
)1/(
)(
III.3 Kiểm định sự khác biệt giửa nhiều
trung bình (ANOVA một chiều)
• Bước 4: So sánh giửa Ftt
với Ftc
• Nếu Fttnhỏ hơn Ftc,
chúng ta chấp nhận Ho,
nếu ngược lại, chúng ta từ
chối Ho
• K: số nhóm
• n: tổng số phần tử lấy ra
từ k mẩu, số phần tử của
mỗi mẩu là nj
( 1 ) , ( ) , k n k
tc F
Trang 15NHP 43
Ví dụ áp dụng: Anova
• Ví dụ 5 Số liệu điều tra sử dụng xe máy
• Giả thiết: Không có sự khác biệt giữa các người sử
dụng xe máy ở các nhóm tuổi khác nhau về số ngày
sử dụng bình quân trong tháng
5 One-Way ANOVA (Parametric Test)
Analyze Compare Means One-Way ANOVA…
Kết luận: bác bỏ giả thiết;
Phát biểu rằng có sự khác biệt giữa các người sử dụng xe máy ở các
nhóm tuổi khác nhau về số ngày sử dụng bình quân trong tháng
Trang 16NHP 46
Kiểm định ANOVA hai chiều (two- way
anova) với khối ngẫu nhiên
• Trường hợp áp dụng:
– Khi có hai biến độc lập và một biến phụ thuộc
– Tìm kiếm có sự khác biệt của biến phụ thuộc theo
tiêu thức phân nhóm của biến độc lập
– Một biến độc lập đóng vai trò là biến phân nhóm
(category) biến còn lại có thể xem như biến ngoại lai
– Không xem xét sự tương tác giữa hai biến độc lập
(phân tích thử nghiệm khối ngẫu nhiên-randomized
block design)
– Trong mô hình khối ngẫu nhiên các mẫu được chọn
theo các cặp tương xứng
Kiểm định ANOVA hai chiều (two- way
anova) với khối ngẫu nhiên
• Ví dụ: Hiệu ứng của quảng cáo tại điểm bán hàng (POP:
point of purchase advertisng) lên doanh thu của cửa
hàng: nếu xem diện tích của cửa hàng là một biến can
thiệp/ngoại lai có thể tạo nên sự khác biệt của doanh thu
là một mô hình thử nghiệm khối ngẫu nhiên
• Cách thử nghiệm: trong mỗi nhóm/khối kích thước cửa
hàng (giả sử có 6 nhóm) chọn ngẫu nhiên 3 cửa hàng,
mỗi cửa hàng được trưng bày một kiểu POP (có 3 kiểu
POP)
• Tổng số quan sát sẽ là 18 cửa hàng, sô 1lie65u về
doanh số của 18 cửa hàng phân theo POP và khối như
sau
Kiểm định ANOVA hai chiều (two- way
anova) với khối ngẫu nhiên
Trang 17NHP 49
Kiểm định ANOVA hai chiều (two- way
anova) với khối ngẫu nhiên
• Các giả định
– Phương sai của các nhóm phải bằng nhau
(dùng Levene test để kiểm định giả thuyết
này)
– Biến phụ thuộc phải có phân phối chuẩn
– Các quan sát phải độc lập với nhau
Kiểm định ANOVA hai chiều (two- way
anova) với khối ngẫu nhiên
TB theo
nhóm
TB tổng thể
• Giá trị của một quan sát của đám đông(yij)
• Giá trị quan sát của mẫu (yij)
• Ta có thể biến đổi đẳng thức (2) thành (3) và (4)
) 1 (
ij j i ij
) 2 (
ij j i
ij y
) 3 )(
( ) ( )
y
yij= + i− + j− + ij− i− j+
) 4 )(
( ) ( )
(
)
( yij− y = yi− y + yj− y + yij− yi− yj+ y
Trang 18Kiểm định ANOVA hai chiều (two- way
anova) với khối ngẫu nhiên
2 1
) (y y k
k i
G = ∑ −
=
2 1
) (y y h
h j
SS SS
SS
k i h j ij E
B G
T = + + = ∑ ∑ −
= =
•Biến thiên giữa các nhóm
•Biến thiên giữa các khối
•Sai số
•Tổng biến thiên
Kiểm định ANOVA hai chiều (two- way
anova) với khối ngẫu nhiên
MS G G
1
−
=
h SS
MS B B
) 1 )(
1 ( − −
=
h k SS
MS E E
E G MS MS
E B MS
Kiểm định ANOVA hai chiều (two- way
anova) với khối ngẫu nhiên
h j k i H
H
µµµ
µ
µµµ
•Giả thuyết Ho
•Giả thuyết H1 : Có ít nhất hai trung bình theo nhóm và
theo khối khác nhau
α ), 1 )(
1 ( ), 1 ( − − −
〉
= k k h
E
G F MS
MS F
•Từ chối H01 nếu
•Từ chối H02 nếu
α ), 1 )(
1 ( ), 1 ( − − −
〉
= h k h E
B F MS MS F
Trang 19Kiểm định ANOVA hai chiều (two- way
anova) với khối ngẫu nhiên
• Trình tự xữ lý trên SPSS
– Vào analyze, general linear models, univariate: nhập
biến phụ thuộc vào “dependent list” và hai biến độc
lập vào “fixed factor”
– Vào “model”, chọn “custom”: đưa biến phụ thuộc và
biến ngoại lai (từ factors and covariates) vào “model”,
nhấp chuột để thay “interaction” bằng “main effects”
– Chọn “continue”, chọn “option”, vào “descriptive
statistics” và “homogeneity tests” sau đó nhấp vào
“continue”, và “ok”
Kiểm định ANOVA n chiều (two- way
anova): thử nghiệm thừa số
• Giả sử chúng ta có hai xử lý thực nghiệm A & B
Xử lý A có a mức và xử lý B có b mức
• Mô hình này sẽ có a.b mức xử lý kết hợp
• Nếu chúng ta thực hiện đo lường lặp lại
(replicated measure)cho các nhóm mẫu khác
nhau với số lần lập lại là r: AB(a.b:r)
• Cách thức phân tích cũng tương tự như trường
hợp hai biến, nhưng tương tác giữa hai cách xử
lý sẽ xuất hiện ở đây
Kiểm định ANOVA n chiều (two- way
anova): thử nghiệm thừa số
• Ví dụ: chúng ta thử nghiệm 3 dạng POP (POP1,
POP2, POP3) và 5 kiểu bao bì PK (PK1, PK2,
….,PK5): đây là thử nghiệm thừa số 3x5
• Chúng ta chọn 1 cửa hàng cho mỗi cách xử lý
kết hợp, như vậy chúng ta cần 15 cửa hàng cho
một lần thử nghiệm, và thực hiện lặp lại 3 lần,
cho nên tổng số quan sát sẽ là 45
• Dạng này là thử nghiệm lặp lại và đo lường cho
3 cửa hàng khác nhau gọi là đo lường lặp lại
Trang 20Kiểm định ANOVA n chiều (two- way anova): thử nghiệm thừa số
Kiểu bao bì
PK (tác động
2)
126.50
120.00 122.00
129.50 129.00
125.39
122.50
117.50
120.00
126.50
127.00
122.89
132.50
123.00
124.50
128.50
127.50
128.06
122.00
119.00 120.50 119.00
120.50 118.00
119.89
118.00
121.00
122.00 122.00
126.00 126.00
122.61
TB POP 124.60 121.00 125.70 TB tổng thể:
123.77
Kiểm định ANOVA hai chiều (two- way
anova): thử nghiệm thừa số
Xử lý
1 Y 111 y 112… y 11r Y 211 y 212 … y 21r ……….
Y a11 y a12 y a1r 2 Y 121 y 122… y 12r Y 221 y 222… y 22r ………
……… Y a21 y a22 y a2r … ……
……….
………
………
……….
………
….………….
b Y1b1 y1b2… y1br Y2b1 y2b2… y2br ………
…
Yab1 yab2 yabr
Kiểm định ANOVA hai chiều (two- way anova):
thử nghiệm thừa số
• Giá trị một quan sát (yijr)
• Đẳng thức (1) có thể biến đổi thành đẳng thức (2) và (3)
• Như vậy tổng biến thiên sẽ bao gồm bốn bộ phận: biến thiên
giữa các nhóm i, j, biến thiên của tương tác, và biến thiên của
các sai lệch
) 1 ( )
( i j ij ijr
i i
ijr y
) 2 )(
( ) (
) (
)
(i j ij i j ijr ij
ijr y y y y y y y y y y y
) 3 )(
( ) (
) (
)
(
)
( yijr− y = yi− y + yj− y + yij− yi− yj+ y + yijr− yij
Trang 21Kiểm định ANOVA n chiều (two- way
anova): thử nghiệm thừa số
Các biến thiên Bậc tự do
(abr-1)(a-1)(b-1)(a-1)(b-1)ab(r-1)
Bảng Anova hai chiều:ab:r
Loại biến thiên Tổng Bậc tự do Trung bình F
Giữa các xử lý A SSA (a-1)
SS
MS=
b-1
B B
SS
MS =
(a-1)(b-1)
I I
SS
MS =
ab-1
M M
SS
MS =
ab(r-1)
E E
M S
M E
M S
Kiểm định ANOVA n chiều (two- way
anova): thử nghiệm thừa số
• Trình tự xữ lý trên SPSS
– Vào analyze, general linear models, univariate: nhập
biến phụ thuộc vào “dependent list” và hai biến độc
lập vào “fixed factor”
– Vào “model”, chọn “custom”: đưa biến phụ thuộc và
biến ngoại lai (từ factors and covariates) vào “model”,
chọn “ interaction” là “full factorial”
– Chọn “continue”, chọn “option”, vào “descriptive
statistics” và “homogeneity tests” sau đó nhấp vào
“continue”, và “ok”
Trang 22NHP 64
Kiểm định ANOVA hai chiều (two- way anova)
có tính đến tương tác giữa hai biến độc lập
• Trình tự xữ lý trên SPSS
– Vào lệnh analize, chọn general linear model,
sau đó chọn univariate
– Nhập biến độc lập vào ô dependent variable
– Nhập lần lượt hai biến độc lập vào “Fixed
factor”
– Select option và click vào: descriptive,
estimates of effect size, và homogeneity tests
– Nhấp chuột vào “continue” và sau đó nhấp
“ok”
IV Mô hình EFA
• EFA là phương pháp giúp chúng ta đánh
giá được giá trị hội tụ và giá trị phân biệt
của đo lường
• EFA giúp chúng ta rút gọn một tập hợp k
biến quan sát thành một tập hợp f biến
các yếu tố có ý nghĩa hơn (f < k)
• Dịch chuyển các items đo lường một biến
này sang biến khác
Mô hình EFA một nhân tố
(Phương sai của biến đo lường)
• Tìm mối quan hệ giữa 3 đại lượng trong
mô hình
– Phương sai của biến đo lường: var(Xi)
– Hiệp phương sai giữa nhân tố Fivà biến đo
lường Xi: Cov(Fi, Xi)
– Hiệp phương sai giữa hai biến đo lường Xivà
Xj: Cov (Xi, Xj)
Trang 23I Mô hình EFA một nhân tố
U 1
U 2
U k
1λ
2λ
3λ
1δ2δ
3δ
I Mô hình EFA một nhân tố
(Phương sai của biến đo lường)
• Giả định 1: biến đo
lường Xibao gồm hai
Cov(F,Ui)=cov(F,Uj) = cov(Ui,Uj) = 0
Mô hình EFA một nhân tố
(phương sai của biến đo lường)
• Quan hệ giữa biến Xivới phần chung và
riêng được tính như sau
Trang 24Mô hình EFA một nhân tố
(Phương sai của biến đo lường)
• Phương sai của biến
var( Xi) = λi var( ) F + δi var( Ui) 2 + λ δi iCo v( , F Ui)
Mô hình EFA một nhân tố
(phương sai của biến đo lường)
Hi2nói lên phần phương sai của biến quan
sát Xiđược giải thích bởi F, và Hi2càng lớn
thì phần riêng sẽ càng nhỏ cho nên biến Xi
càng đóng góp nhiều cho biến F
Mô hình EFA một nhân tố
Như vậy: trong EFA một nhân tố, trọng số nhân tố chính là hệ số
tương quan giữa nhân tố đó với biến đo lường X i
Trang 25Mô hình EFA một nhân tố
Như vậy: nếu hệ số tương quan giữa hai biến đó lường X i , X j càng lớn
thì trọng số nhân tố của hai biến này càng lớn Do đó hai biến này đo
lường tốt cho yếu tố F (factor)
Mô hình EFA hai nhân tố độc lập
X 1
X 2
X k
.
3δ
Mô hình EFA hai nhân tố độc lập
• Khái quát về mô hình:gồm
phần chung cho F 1 và F 2 và
phần riêng U 1 của X i
• Giả định: F1và F2độc lập, và
chúng cũng độc lập với các
phần riêng của các biến X i
• Các biến có phân phối chuẩn
Trang 26Mô hình EFA hai nhân tố độc lập
Mô hình EFA hai nhân tố độc lập
Nếu F 1 và X i là các biến thuộc N(0,1), chúng ta có
Cov(F 1 ,X i )=Corr(F 1 ,X i ) và Var(F 1 )=1, do đó
( , i) ( , i)
Cov F X = Corr F X = λ
Mô hình EFA hai nhân tố độc lập
Như vậy trong mô hình EFA với hai yếu tố độc lập thì trọng số
nhân tố giữa F i và X i vẫn là hệ số tương quan giữa F i và X i
Trang 27Mô hình EFA hai nhân tố độc lập
Cov X X Cov F F Cov F F Cov F U
Cov F F Cov F F Cov F U
Cov U F Cov U F Cov U U
Căn cứ vào các giả định ban đầu, chúng ta có:
Cov(F i ,F j )=Cov(F i ,U j )=Cov(U i ,U j )=o; và var(F 1 )=var(F 2 )=1,
cov(X i ,X j )=corr(X i ,X j ) Vì vậy:
i1 1 1 i2 2 2
( i, j) j ( ) j ( )
Cov X X =λ λVar F +λ λ Var F
i1 1 i2 2( i, j) ( i, j) j j
Cov X X =Corr X X =λ λ +λ λ
Mô hình EFA hai nhân tố độc lập
Tương tự như mô hình EFA một nhân tố, trong mô hình hai
nhân tố độc lập, hệ số tương quan giữa hai biến X i , X j là
tổng của tích hai trọng số λ i1 và λ ji của X i và X j trên từng
2δ
3δ
Trang 28Mô hình hai nhân tố có tương quan
Cov F U =Cov F U =Cov U U =
Các biến X i , U i , F i là những biến thuộc
N(0,1)
III Mô hình hai nhân tố có tương quan
(Phương sai của Xi)
Var X Var F Var F Var U
Cov F F Cov FU Cov F U
III Mô hình hai nhân tố có tương quan
(Phương sai của Xi)
Trang 29III Mô hình hai nhân tố có tương quan
(Hiệp phương sai của Fi và Xi)
Như vậy hệ số tương quan của biến X i với F i bao gồm không chỉ
trọng số nhân tố giữa X i và F i mà còn thành phần tương quan của
Cov X X Cov F F Cov F F Cov F U
Cov F F Cov F F Cov F U
Cov U F Cov U F Cov U U
III Mô hình hai nhân tố có tương quan
(Hiệp phương sai của Fi và Xi)
i1 1 1 i2 2 2 i1 2 i2 1 1 2
( i, j) jvar( ) j ( ) ( j j) ( , )
Cov X X =λ λ F +λ λ Var F +λ λ +λ λ Cov F F
Do F 1 và F 2 thuộc N(0,1) và cov(F i ,F j )=cor(F i ,F j ), chúng ta có
1 2 i1 1 i2 2 i1 2 i2 1
Trang 30Ma trận EFA
• Hai ma trận đánh giá thang đo
– Ma trận các trọng số nhân tố (factor pattern matrix)
– Ma trận các hệ số tương quan (factor structure
matrix)
• Khi các nhân tố (factor) không có quan hệ với
nhau thì trọng số nhân tố giữa một nhân tố (Fi)
và một biến đo lường (Xi) là hệ số tương quan
giữa hai biến đó
• Trọng số nhân tố thể hiện sự tác động của khái
niệm nghiên cứu vào biến đo lường
Ma trận EFA
• Biến đo lường biểu diển ở dạng tổ hợp tuyến tính của
phần chung và phần riêng, Giả sử chúng ta có 2 nhân
tố và k biến đo lường
Trang 31Các phép trích nhân tố cơ bản
• Hai mô hình chính: Mô hình nhân tố chung
(CFM-Common factor model) và mô hình thành
phần chính (PCA-principal components
analysis)
• PCA: phần chung (communality) đưa vào ban
đầu cho các biến đo lường bằng 1 (Đưa 100%
phương sai của biến đo lường Xivào phân tích)
Mục tiêu trích được nhiều nhất phương sai các
biến
• CFM: chọn phần chung đưa vào nhỏ hơn 1 và
cô lập phần riêng Mục tiêu giải thích tốt nhất
hiệp phương sai giữa các biến
Xác định số lượng nhân tố (factor)
• Ba phương pháp xác định số lượng nhân tố
– Tiêu chí eigenvalue: số lượng nhân tố dừng lại ở
nhân tố có eigenvalue tối thiểu bằng 1
– Tiêu chí điển gãy: dựa vào đường biểu diển số nhân
tố (trục hoành) và giá trị của eigenvalue (trục
tung).Điểm gãy là điểm tại đó đường biểu diển của
eigenvalue (bằng với số nhân tố) thay đổi độ dốc đột
ngột
– Chọn trước số lượng nhân tố: khẳng định số lượng
nhân tố trước dựa vào lý thuyết
Chọn phép quay nhân tố
• Quay vuông góc (varimax): sau khi quay,
trục của các nhân tố vẫn ở vị trí vuông góc
với nhau
• Quay không vuông góc(Promax): trục của
các nhân tố không còn vuông góc với
nhau.Trọng số nhân tố của các biến đo
lường sẽ tối đa ở trục nhân tố chúng đo
lường và tối thiểu ở trục còn lại
Trang 32Điều kiện sử dụng EFA
• Nếu hệ số tương quan giữa các biến đo
lường nhỏ (nhỏ hơn 0.3) sử dụng EFA
không phù hợp (Hair et al, 2006)
• Dùng các phép kiểm định
– Kiểm định Barlett xem xét ma trận tương
quan có phải là ma trận đơn vị hay không(là
ma trận có hệ số tương quan giữa các biến
bằng 0, và đường chéo bằng 1) Nếu giá trị p
nhỏ hơn 5%, chúng ta sẽ bác giả thuyết H0
(ma trận là ma trận đơn vị)
Điều kiện sử dụng EFA
• Dùng các phép kiểm định
– Kiểm định KMO (Keiser-Meyer-Olkin)
• KMO là chỉ số so sánh độ lớn của hệ số tương
quan của hai biến Xivà Xjso với tổng hệ sô tương
quan (gồm hệ số tương quan giữa hai biến và hệ
số tương quan riêng phần-partial correlation)
• KMO càng gần 1 thì càng tốt.Tối thiểu KMO phải
lớn hơn 0.5, mức chấp nhận nên từ 0.6 trở lên
Điều kiện sử dụng EFA
Trang 33Phân tích nhân tố (EFA)
• Mục đích
– Làm giãm biến
– Dịch chuyển các yếu tố thành phần/biến quan
sát từ nhân tố này sang nhân tố khác
– Nhấn vào mục descriptive trên hộp thoại để xác định
các tham số thống kê mô tả Sau đó nhấn continue
– Nhấn vào mục Extraction chọn phương pháp phân
tích là “Principal components” và phần extract với
“eigenvalue” over 1
– Nhấn mục Rotation: Chọn phương pháp “varimax”
– Nhấn mục Score, chọn phương pháp “regression”
• Kết quả sẽ hiển thị trên phần mềm SPSS
IV Phaân tích nhaân tố (factor
analysis)
• Phân tích kết quả:
– Dựa vào biểu “Total Variance explained”: số nhân tố
rút ra phải có giá trị eigenvalue lớn hơn 1
– Biểu “Rotated component matrix” cho biết yếu tố
thành phần nào đo lường được nhân tố nào: những
yếu tố thành phần nào có hệ số tải nhân tố lớn trong
nhân tố nào thì nó sẽ đo lường nhân tố đó
– Hệ số tải nhân tố (factor loading) là hệ số tương quan
đơn giửa các yếu tố thành phần và các nhân tố
Trang 34NHP 100
IV Kiểm định Chi bình phương
• So sánh với Chi-bình
phương tiêu chuẩn
• Chúng ta chấp nhận giả
thuyết Hokhi ( )
2
) ( 1 , 2
k n k alpha
tt≤χ − −
χ
V Hàm tương quan
• V.1 Hệ số tương quan và sơ đồ phân tán
• V.2 Hàm tương quan đơn biến
• V.3 Hàm tương quan đa biến
V.1 Sơ đồ phân tán và hệ số tương
quan
• Sơ đồ phân tán thể hiện mối quan hệ
giửa hai biến
–Phân tích hệ số tương quan dùng để đo
lường mối quan hệ đồng hành giửa hai
biến.
– Hệ số tương quan không thể hiện mối
quan hệ nhân quả.
Trang 36NHP 106
V.1 Hệ số tương quan
• Hệ số tương quan của đám đông ký
hiệu là ρ (rho) thể hiện sự đồng hành
của hai biến.
• Hệ số tương quan của mẩu r dùng ước
lượng cho rho và nó thể hiện tương
quan tuyến tính dựa trên các phần tử
quan sát được từ mẩu.
(continued)
V.1 Đặc điểm của ρ and r
• Không có đơn vị đo lường
• Biến động trong phạm vi -1 và1
– Càng gần -1, mối quan hệ nghịch biến càng
x
y
x