BÀI TẬP XỬ LÝ SỐ LIỆUCâu 1 : Kiểm định EFA lần lượt cho các biến OC, PV, MP .............................................................................. 31.1 Với thành phần văn hóa tổ chức OC ................................................................................................ 31.2 Thành phần hệ thống giá trị của quản trị gia (PV) : .......................................................................... 71.3 . Thành phần thực tiễn quản trị MP .................................................................................................. 101.4 Thành phần kết quả hoạt động P : ................................................................................................ 132. Thực hiện kiểm tra độ tin cậy của đo lường bằng hệ số Cronbach Alpha ............................................... 13Câu 3: Thực hiện phân tích Anova một chiều để tìm sự khác biệt của các biến tìm ẩn trong mô hình với nàyvới các tiêu thức phân loại: OWN, POS, Age, EXP. ...................................................................................... 163.1 Kiểm định sự khác biệt về hình thức sở hữu OWN ........................................................................... 163.2 Kiểm định sự khác biệt về cấp bậc quản lý ( POS ) : ........................................................................ 183.3 Kiểm định sự khác biệt về độ tuổi quản trị gia ( Age ) : .................................................................... 183.4 Kiểm định sự khác biệt về kinh nghiệm quản lý ( EXP ) : .................................................................. 19C âu 4 : Xây dựng hàm tương quan tuyến tính giữa P và các biến độc lập vừa khám phá thông qua phântích nhân tốEFA ....................................................................................................................................... 21Câu 5 : Kiểm định giả thuyết : .................................................................................................................... 22 Kiểm định phù hợp với tập mẫu : .................................................................................................. 22 Kiểm định sự phù hợp với tổng thể : ............................................................................................. 22 Kiểm tra hiện tượng đa cộng tuyến : ............................................................................................. 22 Kiểm tra c ác sai lệch ngẫu nhiên ( phần dư ) có phân phối chuẩn: ................................................ 22 Kiểm tra phương sai của các sai lệch ngẫu nhiên không thay đổi ( xuất hiện hiện tượngHeteroskedascity ) : ............................................................................................................................... 24 Kiểm tra quan hệ giữa X và Y là quan hệ tuyến tính : .................................................................... 24 Kiểm tra gi ả đ ịnh về tính độc lập của sai số ( không có tương quan giữa các phần dư ) : ............ 24X ây dựng mô hình : ............................................................................................................................... 25BÀI TẬP MÔN PPNCKH GVHD : TS. Nguyễn Hùng PhongĐoàn Thị Hoàng Giang – Đêm 4 – K22 Trang 2Câu 6: Xây dựng hàm tương quan với biến giả Dummy. Biến giả được chọn là biến loại hình doanhnghiệp, trong đó doanh nghiệp nhà nước chọn làm biến cơ sở. ................................................................ 25Mã hóa biến Dummy .............................................................................................................................. 25Hàm tương quan với biến giả Dummy. .................................................................................................. 26Kiểm định giả thuyết hàm tương quan : ................................................................................................ 27 Kiểm định phù hợp với tập mẫu : .............................................................................................. 27 Kiểm định phù hợp với tổng thể : .............................................................................................. 27 Kiểm tra hiện tượng đa cộng tuyến : ........................................................................................ 28 Kiểm tra c ác sai lệch ngẫu nhiên ( phần dư ) có phân phối chuẩn: ............................................ 28 Kiểm tra quan hệ giữa X và Y là quan hệ tuyến tính : ................................................................ 29 Kiểm tra giả định về tính độc lập của sai số ( không có tương quan giữa các phần dư ) : .......... 29X ây dựng mô hình : ............................................................................................................................... 30
Trang 1BÀI TẬP XỬ LÝ SỐ LIỆU
Câu 1 : Kiểm định EFA lần lượt cho các biến OC, PV, MP 3
1.1 Với thành phần văn hóa tổ chức OC 3
1.2 Thành phần hệ thống giá trị của quản trị gia (PV) : 7
1.3 Thành phần thực tiễn quản trị MP 10
1.4 Thành phần kết quả hoạt động P : 13
2 Thực hiện kiểm tra độ tin cậy của đo lường bằng hệ số Cronbach Alpha 13
Câu 3: Thực hiện phân tích Anova một chiều để tìm sự khác biệt của các biến tìm ẩn trong mô hình với này với các tiêu thức phân loại: OWN, POS, Age, EXP 16
3.1 Kiểm định sự khác biệt về hình thức sở hữu OWN 16
3.2 Kiểm định sự khác biệt về cấp bậc quản lý ( POS ) : 18
3.3 Kiểm định sự khác biệt về độ tuổi quản trị gia ( Age ) : 18
3.4 Kiểm định sự khác biệt về kinh nghiệm quản lý ( EXP ) : 19
C âu 4 : Xây dựng hàm tương quan tuyến tính giữa P và các biến độc lập vừa khám phá thông qua phân tích nhân tố/EFA 21
Câu 5 : Kiểm định giả thuyết : 22
- Kiểm định phù hợp với tập mẫu : 22
- Kiểm định sự phù hợp với tổng thể : 22
- Kiểm tra hiện tượng đa cộng tuyến : 22
- Kiểm tra c ác sai lệch ngẫu nhiên ( phần dư ) có phân phối chuẩn: 22
- Kiểm tra phương sai của các sai lệch ngẫu nhiên không thay đổi ( xuất hiện hiện tượng Heteroskedascity ) : 24
- Kiểm tra quan hệ giữa X và Y là quan hệ tuyến tính : 24
- Kiểm tra gi ả đ ịnh về tính độc lập của sai số ( không có tương quan giữa các phần dư ) : 24
X ây dựng mô hình : 25
Trang 2Câu 6: Xây dựng hàm tương quan với biến giả Dummy Biến giả được chọn là biến loại hình doanh
nghiệp, trong đó doanh nghiệp nhà nước chọn làm biến cơ sở 25
Mã hóa biến Dummy 25
Hàm tương quan với biến giả Dummy 26
Kiểm định giả thuyết hàm tương quan : 27
- Kiểm định phù hợp với tập mẫu : 27
- Kiểm định phù hợp với tổng thể : 27
- Kiểm tra hiện tượng đa cộng tuyến : 28
- Kiểm tra c ác sai lệch ngẫu nhiên ( phần dư ) có phân phối chuẩn: 28
- Kiểm tra quan hệ giữa X và Y là quan hệ tuyến tính : 29
- Kiểm tra giả định về tính độc lập của sai số ( không có tương quan giữa các phần dư ) : 29
X ây dựng mô hình : 30
Trang 3BÀI TẬP XỬ LÝ SỐ LIỆU
Câu 1 : Kiểm định EFA lần lượt cho các biến OC, PV, MP
1.1 Với thành phần văn hóa tổ chức OC
A1 : Kiểm tra điều kiện phân tích nhân tố :
Trị số của KMO lớn 0.863 >0.5 và Sig =0 < 0.05 là điều kiện đủ để phân tích nhân tố là thích hợp
A2 Xác định số lượng nhân tố :
Bảng 1.2 : Total Variance Explained
Compo
nent
Initial Eigenvalues Extraction Sums of Squared
Loadings Rotation Sums of Squared Loadings
Cumulative
% Total
% of Variance Cumulative %
Bảng 1.1 : KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy .853
Bartlett's Test of Sphericity
Approx Chi-Square 2613.931
Trang 4- Trong bảng 1.2 ta thấy rằng theo tiêu chuẩn Eigenvalues lớn hơn 1 thì chỉ có 2 nhân tố được rút ra
- Trong bản trên ta thấy tổng phương sai trích TVE ( Total Variance Explained ) bằng 47.398 % Con số này cho biết 2 nhân tố đầu tiên giải thích được 47.398 % biến thiên của dữ liệu
- Tuy nhiên, TVE thấp hơn 50 % Ta cần kiểm định độ tin cậy của thang đo bằng Cronbach anpha
Item Deleted
Scale Variance if Item Deleted
Corrected Total Correlation
Trang 5Hệ số tương quan biến tổng ( Corrected item- total Correlation ) của 2 biến quan sát OC21
và OC24 đều nhỏ hơn so với yêu cầu ( ≥ 0.3 ) Vì vậy, về mặt số liệu thống kê, ta cần loại 2 biến này
Tuy nhiên, hệ số tương quan biến tổng của OC24 thấp hơn và nếu loại biến này thì hệ số Cronbach Alpha của thang đo tăng từ 782 lên 805 Nên ban đầu để đảm bảo giá trị nội dung, ta chỉ nên loại biến OC24 trước
Ta sẽ tiến hành phân tích nhân tố EFA lại lần nữa để đánh giá độ tin cậy của thang đo và xem có sự thay đổi của các nhân tố hay không
Kết quả phân tích nhân tố EFA lần 2 cho biến quan sát OC sau khi loại biên OC24
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy .854
Bartlett's Test of Sphericity
Total Variance Explained
Component Initial Eigenvalues Extraction Sums of Squared
Cumulative
%
Total % of Variance
Trang 6
Sau khi loại biến quan sát OC24 ta thấy TVE bằng 50.916 % đạt yêu cầu ≥ 50 % Như vậy
để có thể đảm bảo được giá trị nội dung ta chỉ nên loại 1 biến OC24
Rotated Component Matrix a
Component
OC14 793 OC26 785 OC25 729 OC12 657 OC15 526 OC11 468
Như vậy, sau khi xoay nhân tố, ta thấy có sự thay đổi thành phần biến đo lường so với ban đầu
Kết luận : Sau khi dùng kỹ thuật phân tích EFA và hệ số Cronbach’s Alpha ta đã loại 1 biến quan sát OC 24 còn lại 10 biến quan sát Chia thành 2 nhân tố và thành phần như sau
- Nhân tố OC1NEW : OC11, OC12, OC14, OC15, OC25, OC26
- Nhân tố OC2NEW : OC13, OC21, OC22, OC23
Gía trị của các biến mới :
Trang 7- OC1NEW= Mean (OC11, OC12, OC14, OC15, OC25, OC26)
- OC2NEW= Mean (OC13, OC21, OC22, OC23)
1.2 Thành phần hệ thống giá trị của quản trị gia (PV) :
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy .743
Bartlett's Test of Sphericity
Total Variance Explained
Component Initial Eigenvalues Extraction Sums of Squared
Trang 8- Trong bản trên ta thấy tổng phương sai trích TVE ( Total Variance Explained ) bằng 47.779 % Con số này cho biết 2 nhân tố đầu tiên giải thích được 47.779 % biến thiên của dữ liệu
- Tuy nhiên, TVE thấp hơn 50 % Ta cần kiểm định độ tin cậy của thang đo bằng Cronbach alpha
Corrected Total Correlation
Item-Cronbach's Alpha if Item Deleted
Theo bảng Reliability Statistics, ta có Cronbach’s Alpha của thành phần hệ thống giá trị
của quản trị gia là 0.619 lớn hơn 0.6 cho nên thang đo này đạt tiêu chuẩn Về hệ số tương quan với biến - tổng có 3 biến không đạt yêu cầu đó là PV3, PV4, PV9 Các biến còn lại đều có hệ số tương quan với biến tổng lớp hơn 0.3 nên các biến này phù hợp và đạt được độ tin cậy Nhưng ta không loại một lúc 3 biến PV3, PV4, PV9 mà trước tiên ta loại biến PV4 vì PV4 có Corrected Item-Total Correlation nhỏ nhất bằng 0.104 Sau khi loại biến PV4 ta có phân tích EFA như sau:
Trang 9Total Variance Explained
Cumulative
% Total
% of Variance
Extraction Method: Principal Component Analysis
Sau khi loại biến PV4, ta thấy tổng phương sai trích Total Variance Explained bằng 51.071
% đạt yêu cầu ( ≥ 50 % ) Như vậy mô hình EFA là phù hợp Và ta không cần thiết phải loại tiếp 2 biến PV3 và PV9 để đảm bảo được giá trị nội dung
Rotated Component Matrix a
Component
PV6 774 PV5 767 PV8 703 PV2 626 PV7 518
Trang 10Extraction Method: Principal Component Analysis
Rotation Method: Varimax with Kaiser Normalization
a Rotation converged in 3 iterations
Qua bảng Rotated Component matrix ta có PV gồm 2 nhân tố :
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy .866
Bartlett's Test of Sphericity
Trang 11Total Variance Explained
Component Initial Eigenvalues Extraction Sums of Squared
Extraction Method: Principal Component Analysis
Ta thấy rằng theo tiêu chuẩn Eigenvalues lớn hơn 1 thì chỉ có 3 nhân tố được rút ra Như vậy, sau khi phân tích, thành phần MP đã xuất hiện thêm 1 nhân tố mới
- Trong bản trên ta thấy tổng phương sai trích TVE ( Total Variance Explained ) bằng 53.581 % Con số này cho biết 3 nhân tố đầu tiên giải thích được 53.581 % biến thiên của dữ liệu
Trang 12Rotated Component Matrixa
Component
MP21 688 MP23 684 MP26 684 MP15 647 MP24 645 MP25 640 MP16 592 MP22 585
a Rotation converged in 4 iterations
Thành phần nhân tố được đo lường bằng các biến quan sát như sau :
Trang 131.4 Thành phần kết quả hoạt động P :
Total Variance Explained
Compo
nent
Initial Eigenvalues Extraction Sums of Squared Loadings
Total % of Variance Cumulative % Total % of Variance Cumulative %
Extraction Method: Principal Component Analysis
Bảng cho thấy chỉ có 1 nhân tố trích được với tổng phương sai trích TVE ( Total Variance Explained) 55.022% Với mức TVE bằng 55.022% ta chấp nhận phân tích nhân tố EFA cho biến phụ thuộc P
Gía trị của các biến mới :
Corrected Total Correlation
Trang 15Kết quả như sau:
- Nhân tố OC1NEW : OC11, OC12, OC14, OC15, OC25, OC26
- Nhân tố PV1NEW : PV2, PV5, PV6, PV7, PV8
- Nhân tố MP1NEW: MP15, MP16, MP21, MP22, MP23, MP24, MP25, MP26
- Nhân tố P là biến phụ thuộc gồm P1, P2, P3, P4, P5, P6
Trang 16Câu 3: Thực hiện phân tích Anova một chiều để tìm sự khác biệt của các biến tìm
ẩn trong mô hình với này với các tiêu thức phân loại: OWN, POS, Age, EXP
Các biến tiềm ẩn gồm: OC1NEW, PV1NEW, MP1NEW,
3.1 Kiểm định sự khác biệt về hình thức sở hữu OWN
Test of Homogeneity of Variances
Levene Statistic df1 df2 Sig
Giá trị kiểm định của nhóm PV1NEW và MP1NEW đều lớn hơn mức ý nghĩa 05 => chấp nhận giả thuyết phương sai là đồng nhất giữa các nhóm trong PV1NEW và MP1NEW Ta tiến hành phân tích Anova 1 chiều
ANOVA
Squares df
Mean Square F Sig
Trang 17+ Trong PV1NEW : Giá trị Sìg = 589 > 05, như vậy không có sự khác biệt giá trị trung bình giữa các nhóm Kết luận : hệ thống giá trị của quản trị gia ( PV ) không khác nhau giữa các loại hình doanh nghiệp
+ Trong MP1NEW : Giá trị Sig = 0 < 05, như vậy có sự khác biệt về giá trị trung bình giữa các nhóm Hay thực tiễn quản trị khác nhau ở các loại hình doanh nghiệp khác nhau
Để xác định được thực tiễn quản trị ở các loại hình doanh nghiệp nào là khác nhau ta tiến hành kiểm định hậu Anova ( ANOVA post hoc test )
Mean Difference (I-J)
Std Error Sig
95% Confidence Interval Lower
Bound
Upper Bound
* The mean difference is significant at the 0.05 level
Trong bảng kiểm định hậu Anova ở cặp 2 nhóm tương ứng với dòng và cột chứa dấu (*) ta thấy giá trị Sig đều nhỏ hơn mức ý nghĩa 05 Tức là có sự khác biệt về giá trị trung bình giữa các cặp
Kết luận : Loại hình DN1 (DNNN ) có giá trị thực tiễn quản trị khác với loại hình DN3 (
Cty tư nhân ) và DN4 ( Dn gia đình )
Trang 183.2 Kiểm định sự khác biệt về cấp bậc quản lý ( POS ) :
Do phân tích Anova dùng để so sánh trung binh từ 3 đám đông trở lên Nên ta không thể sử dụng phân tích Anova cho cấp bậc quản lý POS, chỉ có 2 đám nhóm là : cấp bậc quản lsy cấp cao và cấp bậc quản lý cấp trung
3.3 Kiểm định sự khác biệt về độ tuổi quản trị gia ( Age ) :
Test of Homogeneity of Variances
a Groups with only one case are ignored in computing the test of homogeneity of
variance for OC1NEW
b Groups with only one case are ignored in computing the test of homogeneity of
variance for PV1NEW
c Groups with only one case are ignored in computing the test of homogeneity of
variance for MP1NEW
ANOVA Sum of
Trang 193.4 Kiểm định sự khác biệt về kinh nghiệm quản lý ( EXP ) :
Test of Homogeneity of Variances
Levene Statistic df1 df2 Sig
Giá trị kiểm định của nhóm OC1NEW và PV1NEW đều lớn hơn mức ý nghĩa 05 => chấp nhận giả thuyết phương sai là đồng nhất giữa các nhóm trong OC1NEW và PV1NEW Ta tiến hành phân tích Anova 1 chiều
Trang 20+ Trong PV1NEW có giá trị Sìg = 253 > 05 như vậy không có sự khác biệt giá trị trung bình giữa các nhóm Kết luận : hệ thống giá trị của quản trị gia ( PV ) không khác nhau giữa các kinh nghiệm quản lý
+ Trong OC1NEW : Giá trị Sig = 0004 < 05, như vậy có sự khác biệt về giá trị trung bình giữa các nhóm Hay văn hoá tổ chức khác nhau giữa các kinh nghiệm quản lý
Để xác định được văn hoá tổ chức ở các cấp kinh nghiệm nào là khác nhau ta tiến hành kiểm định hậu Anova ( ANOVA post hoc test )
Interval Lower Bound
Upper Bound
* The mean difference is significant at the 0.05 level
Trong bảng kiểm định hậu Anova ở cặp 1 và 5 tương ứng với dòng và cột chứa dấu (*) ta thấy giá trị Sig đều nhỏ hơn mức ý nghĩa 05 Tức là có sự khác biệt về giá trị trung bình giữa cặp
Kết luận : Kinh nghiệm quản lý bậc 1 có giá trị văn hoá tổ chức khác với kinh nghiệm quản
lý bậc 5
Trang 21C âu 4 : Xây dựng hàm tương quan tuyến tính giữa P và các biến độc lập vừa khám phá thông qua phân tích nhân tố/EFA
Phương trình hồi quy tổng quát :
P = β 0 + β 1 * OC1NEW + β 2 * PV1NEW + β 3 * MP1NEW
Để xem xét tác động của biến độc lập đối với biến phụ thuộc Trên cơ sở mô hình biểu diễn mối quan hệ giữa nhiều biến độc lập và một biến phụ thuộc Ta dùng mô hình hồi quy bội MLR
Bảng 4.1 : Model Summary b
Square
Std Error of the Estimate
Durbin-Watson
a Predictors: (Constant), MP1NEW, PV1NEW, OC1NEW
b Dependent Variable: PNEW
a Dependent Variable: PNEW
b Predictors: (Constant), MP1NEW, PV1NEW, OC1NEW
Bảng 4.3 : Coefficients a
Model Unstandardized
Coefficients
Standardized Coefficients
t Sig Correlations Collinearity Statistics
Trang 22Câu 5 : Kiểm định giả thuyết :
- Kiểm định phù hợp với tập mẫu :
Hệ số xác định R2adj là chỉ số dùng để đánh giá mức độ phù hợp của mô hình MLR Do đó, kiểm định mức độ phù hợp của mô hình là kiểm định giả thuyết :
H0 : R2adj = 0 : Mô hình hồi quy không phù hợp
H1 :R2adj ≠ 0: Mô hình hồi quy phù hợp
Bảng 4.1 cho ta thấy : R2adj = 0.393 ≠ 0 như vật mô hình hồi quy tuyến tính là phù hợp với tập dữ liệu đến mức 39.3 % Hay các biến độc lập giải thích được khoảng 39.3 % phương sai của biến phụ thuộc
- Kiểm định sự phù hợp với tổng thể :
Để kiểm định độ phù hợp của mô hình hồi quy tổng thế ta đặt giả thuyết:
H0 : R2p = 0 : Mô hình hồi quy không phù hợp
H1 :R2p ≠ 0 : Mô hình hồi quy phù hợp
Phép kiểm định F được sử dụng để kiểm định giả thuyết này tương đương với kiểm định F trong ANOVA: Bảng 4.2 Với Sig = 0.00 nhỏ hơn mức ý nghĩa nên từ chối giả thuyết H0 và ch ấp nhận giả thuyết H1 hay nói cách khác mô hình hồi quy xây dựng được phù hợp với tổng thể ở mức
ý nghĩa 5%
- Kiểm tra hiện tượng đa cộng tuyến :
Giá trị VIF trong bảng 4.3 của các biến đều nhỏ hơn 2 Do vậy các biến này không xảy ra hiện tượng đa công tuyến Như vậy, các biến là độc lập không có mối quan hệ tương quan cao với nhau Thoả yêu cầu khi xây dựng hàm tương quan
- Kiểm tra c ác sai lệch ngẫu nhiên ( phần dư ) có phân phối chuẩn:
+ Biểu đồ Histogram ( biểu đồ tần số ) cho ta thấy phần dư của mô hình có dạng phân phối chuẩn
Trang 23+ Bên cạnh đó, biểu đồ P-P Plot - So sánh phần dư quan sát với phân phối chuẩn kỳ vọng theo giả thuyết có phân phối chuẩn bằng cách vẽ cả hai phân phối tích lũy Ta thấy, các điểm quan sát không phân tán quá xa đường thẳng kỳ vọng, nên ta có thể
Trang 24Kết luận : giả thuyết phân phối chuẩn không vi phạm
- Kiểm tra phương sai của các sai lệch ngẫu nhiên không thay đổi ( xuất hiện hiện tượng Heteroskedascity ) :
Dùng sơ đồ phân phối các điểm (scatter plot) thể hiện mối quan hệ giữa các sai lệch (phần dư) theo giá trị của biến Xi để kiểm tra hiệc tượng heteroskedasticity
+ Trong biểu đồ Scatter plot, ta thấy các biến quan sát cùng phân tán và tập trung về một hướng Như vậy qua mô hình Scatter plot giả thuyết phương sai của các sai lệch ngẫu nhiên không thay đổi
là không vi phạm ( không xuất hiện hiện tượng Heteroskedascity )
- Kiểm tra quan hệ giữa X và Y là quan hệ tuyến tính :
Cũng dựa vào biểu đồ phân phối các điểm Scatter plot ta thấy mối quan hệ giữa X và Y là quan hệ tuyến tính Như vậy, giả thuyết này là không bị vi phạm
- Kiểm tra gi ả đ ịnh về tính độc lập của sai số ( không có tương quan giữa các phần dư ) :
Trong bảng 4.1, hệ số Durbin – Watson = 1.676 Như vậy có tương quan giữa các phần dư Hay giả định về tính độc lập của sai số không bị vi phạm
hình hồi quy là phù hợp với mô hình nghiên cứu