3.4 NGHIÊN CỨU CHÍNH THỨC
3.4.1 Thiết kế mẫu nghiên cứu
Đề đo lường nghiên cứu, một bảng câu hỏi với 25 biến quan sát và các câu hỏi đặc trưng đã được tạo. Mẫu được chọn thông qua phương pháp thuận tiện, chính là một trong các loại hình thức chọn mẫu phi xác suất.
Đề xác định kích cỡ mẫu cho nghiên cứu này, nhóm tác giả đã áp dụng hai phương pháp tính toán kích cỡ mẫu như sau:
Phương pháp 1: Tính cỡ mẫu theo công thức:
n> 50 + 8xm; trong đó: m là số biến độc lập (Tabachnick và Fidell, 1996) Như vậy: n> 50 + 8x25 =250 (1)
Phương pháp 2: Sử dụng công thức:
n=pxqx FP
Trong do:
z: chính là giá trị liên quan tới việc xác định mức độ tin cậy. Nếu chọn mức độ tin cậy là 95%, thì ta có được giá trị z là 1.96 (Từ bảng phân phối chuẩn - Standard Normal Distribution Table). Điều này miêu tả mức độ không tin cậy của trung bình hoặc tần số của mẫu khi là ước lượng của trung bình va tần suất tổng thể. Thông thường giá trị tham khảo la 1.96 (với mức độ tin cậy 95%)
p: Tý lệ ước lượng cỡ mẫu n thành công. Thường thường, giá trị p có thê được tim thay trong một số nghiên cứu trước đó hoặc thông tin tham khảo. Tuy nhiên, nêu không có thông tin nào sẵn có liên quan đến p, chúng ta thường đặt giá trị p tới 0.5 để tích số p x (1 - p) là lớn nhất - Đảm bảo cho mẫu n ước lượng an toàn.
e: Sai số cho phép. Có ba tỷ lệ sai số hay sử dụng là: +01 (1%), +0.05 (5%), +0.1 (10%), trong đó mức phô biến nhất là sai số ở mức +0.05.
Như vậy, giả định rằng độ biến động của dữ liệu ở mức CaO nhất hoặc biến số lớn nhất có thê trong tập hợp:
Datu=pxq=px(1-p)
=>u =l-2p=0=>p=0.05
Ta chọn:
e_ Giá trị tham khảo sai số e = 5 % hay e = 0.05
e Độ tin cậy y= 95%, ta có mức ý nghĩa = 1 - 0.95 = 0.05
=> Zz= Zoos — 1.96
2 2
Từ đó, ta có kích thước mẫu:
n=pxqx/ =px(1-p)x Ố? = 0.6 x (1 - 0.6) x C7? = 384.16 ~ 386 (2)
Từ (1) và (2), cỡ chọn mẫu tối thiểu cần có của nghiên cứu sẽ là 385 đơn vị (n > 385) 3.4.2 Phương pháp phân tích và xử lý dữ liệu
Quá trình phân tích đữ liệu nghiên cứu được thực hiện qua các giai đoạn:
(1) Dùng phương pháp đánh giá độ tin cậy Cronbach”s Alpha:
Việc đánh giá độ tin cậy của thang đo được thực hiện thông qua phương pháp hệ số tin cay Cronbach's Alpha va phan tích nhân tô khám phá (EFA) bằng phần mềm SPSS 20.0 dé sang lọc sau đó loại bỏ các biên quan sát không đạt tiêu chuẩn độ tin cậy (hay còn gọi là biến rác). Cụ thẻ:
Hệ số Cronbach's Alpha được dùng như một phép kiểm định thông kê đề đo mức độ chặt chẽ của tập hợp các biến quan sát, hay nói cách khác là khả năng giải thích cho một
khái niệm nghiên cứu. Nhiều nhà nghiên cứu có thê kế đến như: Nunnally, 1978; Peterson,
31
1994; Slater, 1995 da dé nghi rang hé s6 Cronbach’s Alpha tir 0,6 tré 1én là có thẻ chấp nhận được nêu khái niệm đang nghiên cứu mới hoặc mới đối với người tham gia trong ngữ cảnh nghiên cứu.
Tuy nhiên, Nunnally (1994) đã chỉ ra rằng hệ số Cronbach's Alpha không cho biết biến nào nên bị loại bỏ và biến nào không. Do đó, bên cạnh hệ số Cronbach's Alpha thì hệ số tương quan biến tổng (Corrected Item — Total Correlation) còn được sử dụng rộng rãi, tại đó các biến có tương quan biến tông đưới 0,3 sẽ bị loại bỏ.
(2) Phân tích nhân tổ EEA:
Đây là một phương pháp phô biến nhằm đánh giá giá trị của thang đo, như tính đơn hướng, giá trị hội tụ và phân biệt, hoặc để tóm gọn tập biến. Trong nghiên cứu này, phân tích nhân tố được sử dụng đề tổng hợp các biến quan sát thành một số nhân tô cụ thé dé đo lường các thuộc tính của các khái niệm nghiên cứu. Các tiêu chuẩn và biểu đồ chọn biến cho phân tích nhân tổ khám phá (EFA) bao gồm:
Tiêu chuẩn Bartlett và hệ số KMO được sử dụng đề đánh giá tính thich hop EFA.
Theo đó, giả thuyết H0 (rằng các biến không có tương quan với nhau trong tổng thé) sẽ bị bac bo, vi vậy EEA được xem là thích hợp khi thỏa mãn điều kiện: 0,5 < KMO < 1 và Sig
<0,05. Nếu KMO <0,5 thì phân tích nhân tô có thê không phù hợp với dữ liệu (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2005, tr.262).
Tiêu chuẩn đẻ rút trích nhân tổ bao gồm chỉ số Eigenvalue (đại diện cho mức độ biến thiên giải thích bởi các nhân tố), chỉ số Cumulative (tổng phương sai trích đề biết nhân tố giải thích được bao nhiêu phần trăm và mất bao nhiêu phần trăm). Theo Gerbing và Anderson (1988), các nhân tố có Eigenvalue <1 thì không giúp tóm tắt thông tin tốt hơn biến gốc (biển tiềm ẩn trong các thang đo trước khi áp dụng EFA). Vì vậy, chỉ những nhân tổ có Eigenvalue > 1 và tông phương sai trích > 50% mới được rút trích.
Tiêu chuẩn hệ số tải nhân tố (Factor loading) thê hiện mức độ tương quan giữa các biến và các nhân tô, được sử đụng nhằm đánh giá mức ý nghĩa của EFA. Theo Hair và cộng
su, Factor loading > 0,3 dugc coi la mức tôi thiéu, Factor loading > 0,4 duoc coi la quan trong, va Factor loading > 0,5 được Coi là có ý nghĩa thực tế. Ngoài ra, trong trường hợp các biến có Factor loading được trích xuất vào các nhân tố khác nhau mà chênh lệch rất nhỏ
(thường không chấp nhận < 0.3), tức là chúng không tạo sự khác biệt đáng kế đề đại điện
cho một nhân tô cụ thể, thì các biến này cũng sẽ bị loại bỏ và các biến còn lại sẽ được gom nhóm vào các nhân tố tương ứng đã được rút trích từ ma trận mẫu (Pattermn Matrix).
Tuy nhiên, giống như trong phân tích Cronbach's Alpha, quyết định loại bỏ hoặc giữ lại một biến quan sát không chỉ dựa vào số liệu thống kê mà còn phải xem xét giá trị nội dung mà biến ấy đại điện. Trong trường hợp biến có trọng số Factor loading thấp hay được trích vào các nhân tố khác nhau với sự chênh lệch về hệ số rất nhỏ, nhưng lại có ý nghĩa quan trọng trong giá frỊ nội đụng của khái niệm được đo lường bởi nó, thì không cần loại bỏ biến ấy (Nguyễn Đình Thọ và Nguyễn Thị Mai Trang, 201 1, tr.402, 403).
Trong nghiên cứu này, sau khi hoàn thành phân tích EFA, tiếp theo là thực hiện phân tích hồi quy bội. Do đó, trong quá trình kiểm tra Cronbach's Alpha, các thang đo sẽ được giữ lại nêu hệ số Cronbach's Alpha > 0,6 và các biến quan sát có tương quan biến - tông <
0,3 sẽ bị loại bỏ. Trong giai đoạn EFA, nhóm tác gia da sử dụng phương pháp trích Principal components với phép xoay Varimax, loại bỏ các biến quan sát có hệ s6 Factor loading < 0,5 hoặc được trích vào các nhân tô khác mà chênh lệch trọng số Factor loading giữa các nhân
tổ < 0,3.
(3) Phân tích hồi quy tuyến tính bội:
Phân tích hồi quy tuyến tính bội được thực hiện thông qua các bude sau:
Bước l: Kiển tra tương quan giữa các biến độc lập với nhau và với biến phụ thuộc bằng cách sử dụng ma trận hệ SỐ tong quan.
Về điều kiện cần cho phân tích hồi quy, có yêu cầu rằng cần có tương quan giữa các biến độc lập với nhau và biến phụ thuộc. Tuy nhiên, theo John và Benet-Martinez (2000), khi hệ số tương quan giữa các biến < 0,85, có khả năng đám bảo tính phân biệt giữa các biến. Nói cách khác, khi hệ số tương quan > 0,85, cần xem xét vai trò của các biến độc lập,
33
vì có thể xảy ra hiện tượng đa cộng tuyến, có nghĩa là một biến độc lập có thể được giải
thích bằng một biến khác.
Bước 2: Xây dựng và kiêm định mô hình hồi quy.
Mô hình hồi quy tuyến tính bội có đạng như sau:
Y=1X1+2X2+3X3+4X4+... + kXk:
Quá trình thực hiện thông qua các thủ tục SAU:
Đề lựa chọn các biến nhằm cho vào mô hình hồi quy thì nhóm tác giả đã dùng phương pháp Stepwise - SPSS xử lý tất cả các biến đưa vào một lượt.
Đề đánh giá tính phù hợp của mô hình, chúng ta sử dụng hệ số xác định R2 (R Square).
Tuy nhiên, hệ số này có đặc điểm tăng lên khi chúng ta thêm biến độc lập vào mô hình, mặc dù không phải mô hình càng có nhiều biến độc lập thì nó càng phù hợp với đữ liệu. Vì vậy, nhằm khắc phục vấn đề này, chúng ta sử dụng điều chỉnh R2 (Adjusted R Square) bởi nó không phụ thuộc vào số lượng biến độc lập được thêm vào mô hình, để đánh giá mức độ phù hợp của mô hình hỗi quy bội.
Đề lựa chọn mô hình tối ưu thông qua kiểm định độ phù hợp của mô hình, chúng ta dùng phương pháp phân tích ANOVA để kiểm định gia thuyết H0: (không có mối liên hệ
tuyến tính giữa biến phụ thuộc và tập hợp các biến độc lập l =2 =3 =... =k=0).
Trường hợp trị thống kê F có Sig rất nhỏ (< 0,05), thì giả thuyết H0 sẽ bi bác bỏ. Kết quả này cho kết luận rằng tập hợp các biến độc lập trong mô hình có khả năng giải thích sự biến thiên của biến phụ thuộc. Điều này ngụ ý rằng mô hình đã xây dựng phù hợp với dữ liệu, do đó có thể sử dụng được.
Các hệ số của phương trình hồi quy là hệ số hồi quy riêng phân k - nó đo lường cách biến phụ thuộc thay đổi trung bình nếu biến độc lập Xk thay đổi một don vi, trường hợp giữ nguyên các biển độc lập khác. Tuy nhiên, giá trị của hệ số này có thê bị ảnh hưởng bởi đơn vị đo lường của các biến độc lập, và do đó, so sánh chúng trực tiếp với nhau không thực sự có ý nghĩa. Để có thê so sánh các hệ số hồi quy với nhau và xác định tam quan trọng (mức
34
độ giải thích) của các biến độc lập đối với biến phụ thuộc, người ta thường chuẩn hóa số đo của tất cả các biến độc lập bằng cách sử dụng độ lệch chuan beta.
Bước 3: Kiểm tra vi phạm các giả định hồi quy
Dé xem xét tính phù hợp của mô hình hồi quy với tông thê nghiên cứu, cần kiểm tra xem mô hình có vi phạm các giả định cân thiết sau đây không:
- Tính liên hệ tuyến tính giữa các biến độc lập và biến phụ thuộc.
- Phần dư của biến phụ thuộc có phân phối chuẩn.
- Phương sai của sai số không đổi.
- Không có tương quan giữa các phần dư (tính độc lập của các sai sô).
- Không có tương quan giữa các biến độc lập (không có hiện tượng đa cộng tuyên).
Trong đó:
Công cụ đề kiểm tra giả định về tính liên hệ tuyến tính chính là đồ thị biêu diễn sự phân tán phân dư chuân hóa (hay còn gọi là Scatter), thê hiện mối tương quan giữa giá trị phần dư chuẩn hóa (Standardized Residual) cũng như giá trị dự đoán chuẩn hóa (Standardized Predicted Value).
Công cụ giÚp kiểm tra giá định phần dư có phân phối chuẩn có chính là đồ thị tần số Histogram hay đồ thị P-P plot. Đối với đồ thị Histogram thì phần dư chuẩn hóa có giá trị trung bình xấp xỉ bằng 0 và độ lệch chuân xấp xỉ bằng I, điều này được coi là giả thuyết phân phối chuẩn không bị v1 phạm.
Đề kiểm tra giả định về phương sai không đổi của mô hình, sử dụng công cụ là biêu đỗ phân tán giữa phần dư cùng giá trị dự đoán hoặc kiêm định Spearman's Rho. Nếu phần dư phân tán ngẫu nhiên xung quanh đường đi của cả hai trục mà không tạo ra bất kỳ hinh dang nao, thi giả định về phương sai không đổi là không bị vi phạm. Từ đó suy ra sử dụng phương pháp hồi quy bội mà không phải lo lắng về hiện tượng thay đổi phương sai.
35
Công cụ đề kiêm tra giả định không có tương quan giữa các phần đư đó là đại lượng thống ké d (Durbin - Watson) hay biều đồ phân tán phần dư chuân hóa (Scatter). Nhóm tác gia da kết hợp phương phap Backward va kiém dinh Durbin — Watson dé kiém tra gia dinh nay.
Định nghĩa của thống kê d của Durbin — Watson là như sau:
Khi n đủ lớn thi
Trong đó: đo -l <p < I, điều này dẫn đến 3 trường hợp:
Trường hợp thứ nhất: p = -l => đ =4: tự tương quan hoàn hảo âm Trường hợp thứ hai: p =0 => d= 2: không có tự tương quan Truong hop thir ba: p = | => d = 0: tu tương quan hoàn hảo dương e Trong đó dụ và dL là các giá trị tra bảng giá trị d.
Trên thực tế khi tiễn hành kiểm định Durbin — Watson, người ta thường áp dụng quy tắc kiêm định đơn giản.
e Khil<d <3 thi kết luận rằng mô hình không có tự tương quan.
e Khi 0< d< I thì kết luận rằng mô hình có tự tương quan đương.
e Khi 3< d<4 thì kết luận rằng mô hình có tự tương quan âm.
Bảng 3.6 Thống kê các trường hợp tương quan
Giả thuyết Ho Quyết định Nếu
Không có sự tương quan dương Bác bỏ 0<d<d Không có sự tương quan đương Không quyết định d <d<dụ
Không có sự tương quan âm Bác bỏ 4-d <d<4
Không có sự tương quan âm Không quyết định 4-du<d<4-d
Không có sự tương quan âm hoặc Không bác bỏ dụ <d<4-d dương