CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU
3.6 Phương pháp xử lí thông tin
3.6.2 Phương pháp xử lí thông tin sơ cấp
Đánh giá giá trị dữ liệu: để đảm bảo dữ liệu đã được thu thập đúng cách, khách quan và theo đúng thiết kế ban đầu. Kiểm tra tính hoàn thiện, tính nhất quán, tính rõ ràng của dữ liệu để dữ liệu sẵn sàng cho mã hóa và xử lý dữ liệu.
Mã hóa dữ liệu: các câu trả lời được thu thập từ cuộc khảo sát sẽ được xác định và phân loại bằng các kí hiệu. Sau đó tiến hành thực hiện nội dụng phân tích sau:
3.6.2.1 Phân tích thống kê mô tả
Sau khi tiến hàng khảo sát dữ liệu, dữ liệu sẽ được tổng hợp bằng phần mềm Excel, sau đó đưa vào công cụ SPSS 20.0 để phân tích. Sử dụng các công cụ thống kê như tần số, tỷ lệ phần trăm, thể hiện qua biểu diễn dữ liệu: bảng biểu, đồ thị và tổng hợp dữ liệu, nhằm mô tả đối tượng khảo sát.
3.6.2.2 Kiểm định độ tin cậy thang đo bằng Cronbach’s Alpha
Kiểm định Cronbach’s Alpha là kiểm định nhằm phân tích cũng như đánh giá độ tin cậy của thang đo. Mục đích của kiểm định Cronbach Alpha là để tìm hiểu xem các biến quan sát có cùng đo lường cho một thang đo hay không. Hệ số Cronbach Alpha giúp đo lường tính nhất quán nội tại của nhân tố (Suanders et al., 2007). Giá trị đóng góp nhiều hay ít được phản ánh thông qua hệ số tương quan biến tổng Corrected Item – Total Correlation.
Thông qua đó, cho phép chúng ta loại bỏ được những biến không phù hợp trong mô hình nghiên cứu các yếu tố tác động đến ý định lựa chọn doanh nghiệp để làm việc của sinh viên mới tốt nghiệp trên địa bàn thành phố Hồ Chí Minh.
Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008) thì mức giá trị hệ số Cronbach’s Alpha là:
Từ 0.8 đến gần bằng 1: thang đo lường rất tốt.
Từ 0.7 đến gần bằng 0.8: thang đo lường sử dụng tốt.
Từ 0.6 trở lên: thang đo lường đủ điều kiện.
Hệ số tương quan biến tổng là hệ số cho biến mức độ liên kết giữa một biến quan sát trong nhân tố với các biến còn lại. Nó phản ánh mức độ đóng góp vào giá trị khái niệm của nhân tố của một biến quan sát cụ thể như thế nào. Nếu một biến đo lường có hệ số tương quan biến tổng Corrected Item – Total Correlation ≥ 0.3 thì biến đó đạt yêu cầu (Nunally &
Bernstein, 1994).Vậy tiêu chuẩn để đánh giá một biến có thực sự đóng góp giá trị vào nhân tố hay không là hệ số tương quan biến tổng phải lớn hơn 0.3. Nếu biến quan sát có hệ số tương quan biến tổng nhỏ hơn 0.3 thì phải loại nó ra khỏi nhân tố đánh giá.
Vậy tóm lại trong phạm vi phân tích bài nghiên cứu tác giả quyết định sử dụng giá trị 0.6 (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008) để xem xét độ tin cậy của 6 yếu tố trong quá trình điều tra chính thức với kích cỡ 220 mẫu nghiên cứu. Tiếp theo, để xem xét sự đóng góp mức đóng góp ý nghĩa giải thích khái niệm nghiên cứu, hệ số tương quan biến tổng của mỗi biến quan sát phải trên 0.3 (Nunally & Bernstein, 1994).
3.6.2.3 Phân tích nhân tố khám phá EFA
Phân tích nhân tố khám phá EFA là phương pháp được sử dụng để thu gọn từ nhóm nhiều biến quan sát thành biến tiềm ẩn mà vẫn giải thích được dữ liệu ( Hair et al., 2010).
Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008) thì có các tham số thống kê quan trọng và tiêu chí chấp nhận trong phân tích nhân tố như sau: (1) hệ số tải nhân tố lớn 0.5;
(2) chỉ số Eigenvalue lớn hơn 1; (3) chỉ số Kaiser-Meyer- Olkin (KMO) lớn 0.5; (4) kiểm định Bartlett có p-value nhỏ hơn 0.05 và (5) phương sai giải thích lớn hơn 50%.
Hệ số tải nhân tố ( Factor loadings): là những hệ số tương quan đơn giữa các biến và các nhân tố. Hệ số này nhỏ hơn 0,5 trong EFA sẽ tiếp tục bị loại để đảm bảo giá trị hội tụ giữa các biến. Phương pháp trích hệ số sử dụng là Principal components và điểm dừng khi trích các nhân tố có Eigenvalue lớn hơn 1, tổng phương sai trích bằng hoặc lớn hơn 50%.
( Nguyễn Đình Thọ,2011). Còn theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008) cho rằng hệ số tải nhân tố là những hệ số tương quan đơn giữa các biến và nhân tố. Hệ số này phải có giá trị tối thiểu là 0.3; lớn hơn 0.4 được xem là quan trọng và lớn hơn 0.5 được xem là có ý nghĩa thực. Vậy trong nghiên cứu này sẽ sử dụng điều kiện hệ số tải nhân tố lớn hơn 0.5.
Trị số Eigenvalue: là một tiêu chí sử dụng phổ biến để xác định số lượng nhân tố trong phân tích EFA. Với tiêu chí này, chỉ có những nhân tố nào có Eigenvalue ≥ 1 mới được giữ lại trong mô hình phân tích .Eigenvalue đại diện cho phần biến thiên được giải thích bởi mỗi nhân tố.
Chỉ số Kaiser-Meyer-Olkin ( KMO): là chỉ số dùng để xem xét sự thích hợp của phân tích nhân tố. Chỉ số này nằm trong khoảng 0.5 đến 1 là điều kiện đủ để phân tích nhân tố ( Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008). Kaiser (1974) đề nghị, KMO >= 0.90:
rất tốt; 0.80 <= KMO < 0.90: tốt; 0.70 <= KMO <0. 80: được; 0.60 <= KMO <0. 70: tạm
được; 0.50 <= KMO <0. 60: xấu; KMO <0. 50: không chấp nhận được. Vậy tóm lại chỉ số KMO phải lớn hơn 0.5 và nếu có thể bằng 0.9 thì rất tốt.
Kiểm định Bartlett: đại lượng Bartlett là đại lượng thống kê dùng để xem xét giả thuyết các biến không tương quan trong tổng thể. Điều kiện cần để phân tích nhân tố là các biến phải có tương quan với nhau. ( Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008). Nếu phép kiểm định Bartlett có p<5%, chúng ta có thể từ chối giả thuyết H0 (ma trận tương quan là ma trận đơn vị), có nghĩa là các biến có quan hệ với nhau. Vậy kiểm định Bartlett phải có p nhỏ hơn 0.05.
Tổng phương sai trích ( Total Variance Explained) > 50% cho thấy mô hình EFA là phù hợp (Gerbing & Anderson, 1988). Coi biến thiên là 100% thì trị số này thể hiện các nhân tố được trích cô đọng được bao nhiêu % và bị thất thoát bao nhiêu % của các biến quan sát.
Vậy tóm lại tác giả sẽ sử dụng các chỉ số sau trong bài nghiên cứu: (1) hệ số tải nhân tố lớn 0.5; (2) chỉ số Eigenvalue lớn hơn 1; (3) chỉ số Kaiser-Meyer- Olkin (KMO) lớn 0.5; (4) kiểm định Bartlett có p-value nhỏ hơn 0.05 và (5) phương sai giải thích lớn hơn 50%.
3.6.2.4 Phân tích tương quan Pearson
Hệ số tương quan Pearson (Pearson correlation coefficient, kí hiệu r) đo lường mức độ tương quan tuyến tính giữa hai biến. Về nguyên tắc, việc phân tích tương quan Pearson sẽ tìm ra một đường thẳng phù hợp nhất với mối quan hệ tuyến tính của 2 biến.
Trong phân tích áp dụng cho luận văn, việc kiểm định hệ số tương quan Pearson là để kiểm tra mối liên hệ tuyến tính giữa các biến độc lập và biến phụ thuộc.
Hệ số tương quan Pearson (r) sẽ nhận giá trị từ +1 đến -1. Điều kiện để tương quan có ý nghĩa là giá trị sig. <0.05
r < 0 cho biết một sự tương quan nghịch giữa hai biến, nghĩa là nếu giá trị của biến này tăng thì sẽ làm giảm giá trị của biến kia.
r = 0 cho thấy không có sự tương quan.
r > 0 cho biết một sự tương quan thuận giữa hai biến, nghĩa là nếu giá trị của biến này tăng thì sẽ làm tăng giá trị của biến kia.
3.6.2.5 Phân tích hồi quy đa biến
Hồi quy đa biến là một phần mở rộng của hồi quy tuyến tính đơn giản. Nó được sử dụng khi chúng ta muốn dự đoán giá trị của một biến dựa trên giá trị của hai hoặc nhiều biến khác. Biến chúng ta muốn dự đoán được gọi là biến phụ thuộc (hoặc đôi khi, biến kết quả, mục tiêu hoặc biến tiêu chí). Các biến chúng ta đang sử dụng để dự đoán giá trị của biến phụ thuộc được gọi là biến độc lập. Hồi quy đa biến cũng cho phép bạn xác định mức độ đóng góp nhiều, ít, không đóng góp... của từng nhân tố vào sự thay đổi của biến phụ thuộc.
Ý nghĩa chỉ số trong hồi quy đa biến:
Giá trị Adjusted R Square: (R bình phương hiệu chỉnh) và R2 (R Square): Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), hệ số R thể hiện mối tương quan giữa các biến trong mô hình hồi quy, hệ số R2 (R Square) cho biết % sự biến động của biến phụ thuộc (Y) được giải thích bởi các biến độc lập (X) trong mô hình. Nếu R2 = 1 thì đường hồi quy phù hợp hoàn hảo. Nếu R2 = 0 thì X và Y không có quan hệ với nhau. Hệ số xác định R2 (R Square) được chứng minh là hàm không giảm theo số biến độc lập được đưa vào mô hình, càng đưa nhiều biến độc lập vào phương trình thì R2 càng tăng, tuy nhiên điều này cũng được chứng minh rằng không phải phương trình càng có nhiều biến sẽ phù hợp hơn với dữ liệu. Hệ số xác định R2 hiệu chỉnh (Adjusted R Square) được sử dụng để phản ánh sát hơn mức độ phù hợp của mô hình hồi quy tuyến tính đa biến vì nó không phụ thuộc vào độ lệch phóng đại của R2 . So sánh 2 giá trị R2 và R2 hiệu chỉnh, chúng ta sẽ thấy R2 hiệu chỉnh nhỏ hơn và dùng nó đánh giá độ phù hợp của mô hình sẽ an toàn hơn vì nó không thổi phồng mức độ phù hợp của mô hình. Giá trị R2 và R2 hiệu chỉnh phản ánh mức độ giải thích biến phụ thuộc của các biến độc lập trong mô hình hồi quy. R2 hiệu chỉnh phản ánh sát hơn so với R2. Mức biến thiên của 2 giá trị này là từ 0 - 1. Nếu càng tiến về 1 thì mô hình càng có ý nghĩa. Ngược lại, càng tiến về 0 tức là ý nghĩa mô hình càng yếu. Cụ thể hơn, nếu nằm trong khoảng từ 0.5 - 1 thì là mô hình tốt, < 0.5 là mô hình chưa tốt.
Trị số Durbin – Watson (DW): Có chức năng kiểm tra hiện tượng tự tương quan chuỗi bậc nhất. Hệ số Durbin Watson có giá trị biến thiên trong khoảng từ 0 đến 4; nếu các phần sai số không có tương quan với nhau thì giá trị sẽ gần bằng 2 (từ 1 đến 3); nếu giá trị càng
nhỏ, gần về 0 thì các phần sai số có tương quan thuận; nếu càng lớn, gần về 4 có ý nghĩa là các phần sai số có tương quan nghịch (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2005) Giá trị Sig. của kiểm định F: có tác dụng kiểm định độ phù hợp của mô hình hồi quy. Ở bảng ANOVA, nếu giá trị Sig. < 0.05 => Mô hình hồi quy tuyến tính bội và tập dữ liệu phù hợp (và ngược lại).
Giá trị Sig. của kiểm định t: được sử dụng để kiểm định ý nghĩa của hệ số hồi quy. Nếu Sig. <0.05 => Biến độc lập có tác động đến biến phụ thuộc.
Hệ số phóng đại phương sai VIF: (Variance inflation factor): Kiểm tra hiện tượng đa cộng tuyến. Nếu VIF > 10 thì có hiện tượng đa cộng tuyến (Theo Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2005). Tuy nhiên, trên thực tế thực hành, chúng ta thường so sánh giá trị VIF với 2. Nếu VIF < 2 không có hiện tượng đa cộng tuyến giữa các biến độc lập (và ngược lại).
Phương trình hồi quy đa biến có dạng:
Y = β0 + β1X1+ β2X2+ β3X3+…+ βnXn Trong đó:
Y: biến phụ thuộc Xi: biến độc lập β0: hằng số
3.6.2.6 Tính giá trị trung bình MEAN
Là giá trị trung bình số học của một biến, được tính bằng tổng các giá trị quan sát chia cho số quan sát. Đây là dạng công cụ thường được dùng cho dạng đo khoảng cách và tỷ lệ. Giá trị trung bình có đặc điểm là chịu sự tác động của các giá trị ở mỗi quan sát, do đó đây là thang đo nhạy cảm nhất đối với sự thay đổi của các giá trị quan sát.
Khi dùng thang đo Likert 5 lựa chọn trong bảng khảo sát. Khi đó:
Giá trị khoảng cách = (Maximum – Minimum) / n = (5-1)/5 = 0.8 Ý nghĩa các mức như sau:
1.00 – 1.80: Rất không đồng ý/ Rất không hài lòng/ Rất không quan trọng…
1.81 – 2.60: Không đồng ý/ Không hài lòng/ Không quan trọng…
2.61 – 3.40: Không ý kiến/ Trung bình…
3.41 – 4.20: Đồng ý/ Hài lòng/ Quan trọng…
4.21 – 5.00: Rất đồng ý/ Rất hài lòng/ Rất quan trọng…
Tóm tắt chương 3
Chương 3 tác giả trình bày tổng quan về nghiên cứu, quy trình nghiên cứu, phương pháp thu thập thông tin, thiết kế bảng câu hỏi khảo sát, thiết kế mẫu để khảo sát, phương pháp chọn mẫu,....Tác giả trình bày tổng quát về nghiên cứu định lượng và nghiên cứu định tính.
Ban đầu thực hiện nghiên cứu sơ bộ sau đó mới tiến hành nghiên cứu chính thức. Nghiên cứu chính thức được thực hiện thông qua phương pháp định lượng với bảng khảo sát; lấy mẫu phi xác suất với cỡ mẫu là 220. Thang đo sử dụng trong nghiên cứu là thang đo Likert 5 mức độ. Dữ liệu trong nghiên cứu chính thức được thu thập thông qua bảng khảo sát được phát qua online cho sinh viên của trường đại học Công Nghiệp Tp.HCM. Dữ liệu sau khi thu thập sẽ được đưa vào phần mềm SPSS 20 để phân tích.Phân tích dữ liệu gồm các bước như: Thống kê mô tả, Kiểm định độ tin cậy Cronbach’s Alpha, phân tích nhân tố khám phá EFA, phân tích tương quan, phân tích hồi quy.