CHƯƠNG 5: PHÂN TÍCH DỮ LIỆU TRUYỀN THỐNG
5.3. Phương pháp phân tích
5.3.3. Phân tích nhân tố
Phân tích nhân tố là một kỹ thuật để lấy số lượng lớn các biến và kết hợp những biến có liên quan đến cùng một nhân tố hoặc khái niệm cơ bản, để kết thúc với một số thứ nguyên nhỏ hơn. Ví dụ: phân tích nhân tố có thể giúp bạn thay thế các câu hỏi như
“Bạn có nhận được dịch vụ tốt không?” “Bạn tin tưởng vào người đại diện mà bạn đã nói chuyện đến mức nào?” và “Chúng tôi đã giải quyết truy vấn của bạn chưa?” với một yếu tố duy nhất - sự hài lòng của khách hàng.
Phân tích nhân tố nói chung là một phương pháp khám phá/mô tả đòi hỏi nhiều phán đoán chủ quan. Nó là một công cụ được sử dụng rộng rãi và thường gây tranh cãi vì các mô hình, phương pháp và tính chủ quan rất linh hoạt nên có thể xảy ra các cuộc tranh luận về cách diễn giải.
Theo một nghĩa nào đó, phân tích nhân tố là một phép nghịch đảo của các thành phần chính. Trong phân tích nhân tố, lập mô hình các biến quan sát dưới dạng hàm tuyến tính của “các nhân tố”. Trong các thành phần chính, tạo ra các biến mới là tổ hợp tuyến tính của các biến quan sát. Trong cả PCA (Phân tích thành phần chính) và FA (phân tích thành phần nhân tố), kích thước của dữ liệu được giảm xuống. Nhớ lại rằng trong PCA, việc giải thích các thành phần chính thường không rõ ràng lắm. Đôi khi, một biến cụ thể có thể đóng góp đáng kể vào nhiều hơn một trong các thành phần. Lý tưởng nhất là chúng ta muốn mỗi biến chỉ đóng góp đáng kể vào một thành phần. Một kỹ thuật được gọi là xoay vòng nhân tố được sử dụng để hướng tới mục tiêu đó. Ví dụ về các lĩnh vực có liên quan đến phân tích nhân tố bao gồm sinh lý học, sức khỏe, trí tuệ, xã hội học và đôi khi là sinh thái học trong số những lĩnh vực khác.
5.3.3.1. Các loại nhân tố phân tích
Có hai loại phân tích nhân tố: khám phá và xác nhận.
• Phân tích nhân tố khám phá (EFA) cố gắng khám phá bản chất của các cấu trúc ảnh hưởng đến một tập hợp các câu trả lời.
• Phân tích nhân tố xác nhận (CFA) kiểm tra xem một tập hợp cấu trúc cụ thể có đang ảnh hưởng đến các phản hồi theo cách dự đoán hay không.
Cả hai loại phân tích nhân tố đều dựa trên Mô hình nhân tố chung, được minh họa trong hình dưới. Mô hình này đề xuất rằng mỗi phản hồi được quan sát (từ biện pháp 1 đến biện pháp 5) bị ảnh hưởng một phần bởi các yếu tố chung cơ bản (yếu tố 1 và yếu tố 2) và một phần bởi các yếu tố duy nhất cơ bản (E1 đến E5). Độ mạnh của mối liên hệ giữa
mỗi yếu tố và mỗi thước đo khác nhau, sao cho một yếu tố nhất định ảnh hưởng đến một số biện pháp hơn những yếu tố khác.
Hình 5. 3: Mô hình nhân tố chung.
Phân tích nhân tố được thực hiện bằng cách xem xét mô hình tương quan (hoặc hiệp phương sai) giữa các phép đo được quan sát. Các thước đo có mức độ tương quan cao (tích cực hoặc tiêu cực) có thể bị ảnh hưởng bởi các yếu tố giống nhau, trong khi các biện pháp tương đối không tương quan có thể bị ảnh hưởng bởi các yếu tố khác nhau.
a. Phân tích nhân tố khám phá Mục tiêu
• Các mục tiêu chính của EFA là xác định
• Số lượng các yếu tố chung ảnh hưởng đến một tập hợp các biện pháp.
• Mức độ mạnh mẽ của mối quan hệ giữa mỗi yếu tố và mỗi thước đo quan sát được.
• Một số cách sử dụng phổ biến của EFA là để
• Xác định bản chất của các cấu trúc phản hồi cơ bản trong một lĩnh vực nội dung cụ thể.
• Xác định những nhóm mục nào “gắn kết với nhau” trong bảng câu hỏi.
• Thể hiện kích thước của thang đo. Các nhà nghiên cứu thường mong muốn phát triển các thang đo phản ứng với một đặc tính duy nhất.
• Xác định những tính năng nào là quan trọng nhất khi phân loại một nhóm mặt hàng.
• Tạo “điểm nhân tố” đại diện cho các giá trị của các cấu trúc cơ bản để sử dụng trong các phân tích khác.
Thực hiện EFA
Có bảy bước cơ bản để thực hiện EFA:
• Thu thập các phép đo. Cần đo lường các biến trên cùng một đơn vị thử nghiệm (hoặc phù hợp).
• Có được ma trận tương quan. Cần có được các mối tương quan (hoặc hiệp phương sai) giữa mỗi biến.
• Chọn số lượng nhân tố để đưa vào. Đôi khi có một giả thuyết cụ thể sẽ xác định các số nhân tố sẽ bao gồm, trong khi những lần khác, chỉ muốn mô hình cuối cùng tính đến càng nhiều hiệp phương sai trong dữ liệu với càng ít yếu tố càng tốt. Nếu có k số đo, thì có thể trích xuất nhiều nhất k nhân tố. Có một số phương pháp để xác định số lượng yếu tố "tối ưu" bằng cách kiểm tra dữ liệu. Tiêu chí Kaiser nói rằng nên sử dụng một số nhân tố bằng số giá trị riêng của ma trận tương quan lớn hơn một. “Kiểm tra sàng lọc” nói rằng bạn nên vẽ biểu đồ các giá trị riêng của ma trận tương quan theo thứ tự giảm dần, sau đó sử dụng một số yếu tố bằng với số lượng giá trị riêng xảy ra trước lần giảm mạnh cuối cùng về cường độ giá trị riêng.
• Trích xuất tập hợp các nhân tố ban đầu, phải gửi các mối tương quan hoặc hiệp phương sai vào một chương trình máy tính để trích xuất các yếu tố. Bước này quá phức tạp để có thể thực hiện bằng tay một cách hợp lý. Có một số phương pháp khai thác khác nhau, bao gồm khả năng tối đa, thành phần chính và chiết trục chính. Phương pháp tốt nhất nói chung là trích xuất khả năng xảy ra tối đa, trừ khi bạn thiếu nghiêm trọng tính chuẩn mực đa biến trong các biện pháp của mình.
• Xoay vòng các nhân tố thành giải pháp cuối cùng. Đối với bất kỳ tập hợp tương quan và số lượng nhân tố nhất định nào, thực sự có vô số cách mà có thể xác định các nhân tố và vẫn tính đến cùng một lượng hiệp phương sai trong các phép đo. Tuy nhiên, một số định nghĩa này dễ giải thích về mặt lý thuyết hơn những định nghĩa khác. Bằng cách xoay vòng các thừa số, cố gắng tìm ra một nghiệm nhân tử bằng với nghiệm thu được trong lần trích xuất ban đầu nhưng có cách giải thích đơn giản nhất. Có nhiều kiểu xoay vòng khác nhau, nhưng tất cả đều cố gắng làm cho mỗi yếu tố đáp ứng cao đối với một nhóm nhỏ các mục (trái ngược với việc đáp ứng vừa phải đối với một nhóm rộng). Có hai loại phép quay chính, phép quay trực giao tạo ra các nhân tố không tương quan và phép quay xiên tạo ra các yếu tố tương quan. Phép quay trực giao tốt nhất được nhiều người tin tưởng là Varimax. Các phép quay xiên ít được phân biệt hơn, với ba phép quay thường được sử dụng nhất là Direct Quartimin, Promax và Harris-Kaiser Orthoblique.
• Giải thích cấu trúc nhân tố. Mỗi thước đo sẽ liên quan tuyến tính đến từng nhân tố. Sức mạnh của mối quan hệ này được bao gồm trong tải nhân tố tương ứng, được tạo ra bởi vòng quay. Tải trọng này có thể được hiểu là một hệ số hồi quy chuẩn hóa, hồi quy hệ số trên các thước đo. Xác định một yếu tố bằng cách xem xét các cấu trúc lý thuyết có thể có có thể chịu trách nhiệm cho mô hình quan sát của tải tích cực và tiêu cực. Để dễ hiểu, bạn có tùy chọn nhân tất cả các tải cho một hệ số nhất định với -1. Về cơ bản, điều này đảo ngược thang đo của nhân tố, chẳng hạn như cho phép bạn biến một nhân tố “không thân thiện” thành một yếu tố “thân thiện”.
• Xây dựng điểm nhân tố để phân tích thêm. Nếu bạn muốn thực hiện các phân tích bổ sung bằng cách sử dụng các yếu tố làm biến, bạn sẽ cần phải xây dựng điểm yếu tố. Điểm cho một yếu tố nhất định là sự kết hợp tuyến tính của tất cả các thước đo, được tính trọng số bởi tải trọng của yếu tố tương ứng. Đôi khi điểm yếu tố được lý tưởng hóa, gán giá trị 1 cho tải tích cực mạnh, giá trị -1 cho tải âm mạnh và giá trị 0 cho tải trung gian. Sau đó, các điểm yếu tố này có thể được sử dụng trong phân tích giống như bất kỳ biến nào khác, mặc dù bạn nên nhớ rằng chúng sẽ đối chiếu chặt chẽ với các thước đo được sử dụng để tạo ra chúng.
Phân tích nhân tố so với Phân tích thành phần chính
• Phân tích nhân tố khám phá thường bị nhầm lẫn với phân tích thành phần chính (PCA), một thủ tục thống kê tương tự. Tuy nhiên, có sự khác biệt đáng kể giữa hai phương pháp: EFA và PCA sẽ cung cấp các kết quả hơi khác nhau khi áp dụng cho cùng một dữ liệu.
• Mục đích của PCA là thu được một số lượng tương đối nhỏ các thành phần có thể giải thích cho sự thay đổi được tìm thấy trong một số lượng tương đối lớn các phép đo. Quy trình này, được gọi là giảm dữ liệu, thường được thực hiện khi một nhà nghiên cứu không muốn đưa tất cả các thước đo ban đầu vào phân tích nhưng vẫn muốn làm việc với thông tin mà chúng chứa đựng.
• Sự khác biệt giữa EFA và PCA xuất phát từ thực tế là cả hai đều dựa trên các mô hình khác nhau. Hình 5.4 minh họa mô hình PCA. Sự khác biệt đầu tiên là hướng ảnh hưởng bị đảo ngược: EFA giả định rằng các phản hồi được đo lường dựa trên các yếu tố cơ bản trong khi trong PCA, các thành phần chính dựa trên các phản hồi đã đo lường. Sự khác biệt thứ hai là EFA giả định rằng phương sai trong các biến được đo lường có thể được phân tách thành phương sai được tính bởi các nhân tố chung và phương sai được tính bởi các nhân tố duy nhất. Các thành phần chính được định nghĩa đơn giản là sự kết hợp tuyến tính của các phép đo và do đó sẽ chứa cả phương sai chung và phương sai duy nhất.
• Tóm lại, nên sử dụng EFA khi quan tâm đến việc đưa ra các tuyên bố về các nhân tố chịu trách nhiệm cho một tập hợp các phản hồi được quan sát và nên sử dụng PCA khi chỉ quan tâm đến việc thực hiện giảm dữ liệu
Hình 5. 4: Mô hình minh họa PCA b. Phân tích nhân tố xác nhận (CFA)
Mục tiêu
• Mục tiêu chính của CFA là xác định khả năng của một mô hình nhân tố xác định trước để phù hợp với một tập dữ liệu quan sát.
• Một số cách sử dụng phổ biến của CFA là để
+ Thiết lập tính hợp lệ của một mô hình nhân tố đơn lẻ.
+ So sánh khả năng tính toán cùng một tập dữ liệu của hai mô hình khác nhau.
+ Kiểm tra độ tin cậy của tải một nhân tố cụ thể.
+ Kiểm tra mối quan hệ giữa hai hoặc nhiều tải nhân tố.
+ Kiểm tra xem một tập hợp các nhân tố có tương quan hay không tương quan.
+ Đánh giá tính hợp lệ hội tụ và phân biệt của một tập hợp các biện pháp.
Thực hiện CFA
Có sáu bước cơ bản để thực hiện CFA:
• Xác định mô hình nhân tố. Điều đầu tiên bạn cần làm là xác định chính xác mô hình bạn muốn kiểm tra. Điều này liên quan đến việc lựa chọn số lượng các nhân tố và xác định bản chất của tải giữa các nhân tố và các thước đo. Các tải này có thể được cố định ở 0, cố định ở một giá trị không đổi khác, được phép thay đổi tự do hoặc được phép thay đổi theo các ràng buộc cụ thể (chẳng hạn như bằng với tải khác trong mô hình).
• Thu thập các phép đo. Bạn cần đo lường các biến của mình trên cùng một đơn vị thử nghiệm (hoặc phù hợp).
• Lấy ma trận tương quan. Bạn cần có được các mối tương quan (hoặc hiệp phương sai) giữa mỗi biến của bạn.
• Phù hợp với mô hình với dữ liệu. Bạn sẽ cần phải chọn một phương pháp để có được ước tính của tải nhân tố mà không thay đổi. Quy trình phù hợp mô hình phổ biến nhất là Ước tính khả năng xảy ra tối đa, có thể nên sử dụng quy trình này trừ khi các thước đo của bạn thiếu nghiêm trọng tính chuẩn mực đa biến. Trong trường hợp này, bạn có thể muốn thử sử dụng ước tính phân phối không tiệm cận.
• Đánh giá mức độ đầy đủ của mô hình. Khi mô hình nhân tố phù hợp với dữ liệu, hệ số tải nhân tố được chọn để giảm thiểu sự khác biệt giữa ma trận tương quan được mô hình ngụ ý và ma trận quan sát thực tế. Số lượng chênh lệch sau khi các tham số tốt nhất được chọn có thể được sử dụng làm thước đo mức độ nhất quán của mô hình với dữ liệu.