Nội dung chính của bài giảng này trình bày việc phân biệt được thông tin định tính và định lượng. Phân tích và xử lý được các thông tin định tính và định lượng hợp lý cho từng loại đề tài nghiên cứu. Mời các bạn tham khảo!
Trang 1BÀI 5 PHƯƠNG PHÁP XỬ LÝ DỮ LIỆU
PGS.TS Phan Thế Công Giảng viên Trường Đại học Thương mại
Trang 2TÌNH HUỐNG KHỞI ĐỘNG
Hai sinh viên trò chuyện với nhau về khó khăn trong việc xử lý dữ liệu sau khi thu thập được
• Hằng: Chết tớ rồi Huyền ạ Giá như tớ nghe lời mấy bạn trong nhóm khuyên thì bây giờ không phải lo lắngthế này
• Huyền: Sao cậu lại nói vậy? Có chuyện gì à?
• Hằng: Tớ đã tham lam đưa quá nhiều câu hỏi mở vào bảng câu hỏi điều tra nên giờ thống kê và xử lý thếnào đây Nếu là câu hỏi đóng thì còn thống kê dễ dàng chứ câu hỏi mở thì trăm ngàn phương án trả lời biếtlàm sao bây giờ?
• Huyền: Tưởng gì Cậu chỉ cần xem lại bài 5 Phương pháp xử lý dữ liệu là được ngay mà Trong đó đãhướng dẫn cụ thể cách xử lý dữ liệu hay thông tin định tính tức là câu trả lời cho câu hỏi mở của cậu và cả
dữ liệu hay thông tin định lượng tức là câu trả lời cho câu hỏi đóng của cậu đó
• Hằng: Ừ nhỉ Tớ quên hẳn mất điều này Cảm ơn câu nhé, tớ phải xem lại ngay mới được
Trang 3MỤC TIÊU BÀI HỌC
• Phân biệt được thông tin định tính và định lượng
• Phân tích và xử lý được các thông tin định tính và định lượng hợp lý cho từng loại đề tài nghiên cứu
Trang 4CẤU TRÚC NỘI DUNG
Xử lý thông tin định lượng
Trang 55.1 CÁC KHÁI NIỆM CƠ BẢN
Phụ thuộc
(Dependent)
Một biến số được đo lường để xác định sự tácđộng (treatment) hay thay đổi (manipulation)của biến độc lập như thế nào
• Biến thành quả (Outcome)
• Biến kết quả (Result)
• Biến tiêu chí (Criterion)
Một biến số có quan hệ với biến phụ thuộc, mà
sự ảnh hưởng của nó cần phải được loại bỏ • Biến giới hạn (Restricting)
Ngoại vi
(Extraneous)
Một biến số có quan hệ với biến phụ thuộchoặc biến độc lập, không phải là mục tiêunghiên cứu
• Biến đe dọa (Threatening)
Điều tiết
(Moderator)
Một biến số có quan hệ với biến phụ thuộchoặc biến độc lập và có ảnh hưởng đến biếnphụ thuộc
• Biến tương tác (Interacting variable)
Trang 6CÂU HỎI TRẮC NGHIỆM
Ghép phương án số và phương án chữ thành những phương án đúng sau đây
1 Biến phụ thuộc (dependent) A Một biến số được thay đổi để xác định ảnh
hưởng của nó đối với biến phụ thuộc
2 Biến độc lập (independent) B Một biến số có quan hệ với biến phụ thuộc hoặc
biến độc lập và có ảnh hưởng đến biến phụ thuộc
3 Biến kiểm soát (control) C Một biến số có quan hệ với biến phụ thuộc hoặc
biến độc lập, không phải là mục tiêu nghiên cứu
4 Biến ngoại vi (extraneous) D Một biến số được đo lường để xác định sự tác
động (treatment) hay thay đổi (manipulation) củabiến độc lập như thế nào
5 Biến điều tiết (moderator) E Một biến số có quan hệ với biến phụ thuộc, mà
sự ảnh hưởng của nó cần phải được loại bỏ
Trang 7CÂU HỎI TRẮC NGHIỆM
Phương án nào đúng trong các phương án sau?
A Biến phụ thuộc: Một biến số được đo lường để xác định sự tác động hay thay đổi của biến độc lập như thế nào.
B Biến độc lập (independent): Một biến số được thay đổi để xác định ảnh hưởng của nó đối với biến phụ thuộc.
C Biến kiểm soát: Một biến số có quan hệ với biến phụ thuộc, mà sự ảnh hưởng của nó cần phải được loại bỏ.
D Biến ngoại vi: Một biến số có quan hệ với biến phụ thuộc hoặc biến độc lập và có ảnh hưởng đến biến phụ thuộc.
E Biến điều tiết: Một biến số có quan hệ với biến phụ thuộc hoặc biến độc lập, không phải là mục tiêu nghiên cứu.
Đáp án đúng là: A; B và C.
Vì: Theo mục 5.1 Các khái niệm cơ bản.
Trang 85.2 XỬ LÝ THÔNG TIN ĐỊNH LƯỢNG
5.2.1 Các loại thang đo trong phần tích dữ liệu
5.2.2 Độ tin cậy
5.2.4 Đo lường khuynh hướng tập trung
5.2.3 Xử lý dữ liệu
5.2.5 Kiểm tra T-mẫu độc lập (T-test)
5.2.6 Phân tích phương sai một hướng (one-way anova)
5.2.7 Xây dựng mô hình hồi quy
Trang 95.2.1 CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU
Thang đo đơn phương (single item scale)
Thang nhân tố (itemized category) Thang so sánh (comparative scale) Thang thứ hạng (rank order scale) Thang tổng (sum scale)
Thanh hình ảnh (pictorial scale)
Thang đo đa phương (multiple item scale) Thang Likert
Trang 105.2.1 CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo)
a Thang đo đơn phương
• Dùng khi thuộc tính cần đo chỉ có thể thể hiện một phương (dimensionality)
Chiều cao (cao, thấp)
Cân nặng (nặng, nhẹ)
Kính trọng (nhiều, ít)
• Có thể dùng để so sánh
Trang 115.2.1 CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo)
Trang 125.2.1 CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo)
Thang đo thứ hạng (rank order)
Ví dụ: Hãy chỉ ra mức độ yêu thích âm nhạc của bạn, với 1 là thích nhất, 2 là thích thứ nhì… cho mỗi loại âmnhạc dưới đây
Trang 135.2.1 CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo)
Trang 145.2.1 CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo)
b Thang đo đa phương
• Khi thuộc tính cần đo có thể có nhiều thành tố cùng một lúc:
• Ví dụ: Năng lực làm việc thể hiện qua nhiều thành tố (item) như:
Điểm số học tập;
Thông minh (IQ);
Khả năng cảm xúc (EQ)
• Một trả lời sẽ không thể hiện hết hoặc thể hiện không đúng nội dung cần đo
Thang đo tổng thể (summated)
• Thang Likert: Cách đo lường dựa vào mức độ “đồng ý” và không đồng ý về các nội dung muốn xem xét
• Phần lớn được dùng nghiên cứu động thái của tổ chức
Trang 155.2.2 ĐỘ TIN CẬY
• Đó là mức độ nhất quán hay ổn định của công cụ đo
• 3 cách ước lượng:
Dùng chỉ số Cronbatch alfa (chấp nhận khi chỉ số α > 0.7)
Kiểm tra và tái kiểm tra: Dùng một công cụ đo và đo 2 lần trên một nhóm khảo sát Chỉ số tương quancủa kết quả sẽ thể hiện độ tin cậy của công cụ đo
Mẫu tương đương (Equivalent forms): Lập 2 mẫu đo lường khác nhau nhưng đo cùng một hiện tượng.Chỉ số tương quan giữa 2 mẫu sẽ thể hiện độ tin cậy của công cụ đo
Trang 165.2.3 XỬ LÝ DỮ LIỆU
Mục tiêu: giúp sinh viên biết cách:
• Nhập liệu;
• Làm sạch số liệu;
• Thực hiện thống kê mô tả;
• Kiểm định T-tests, ANOVA;
• Tương quan, hồi quy
Trang 175.2.3 XỬ LÝ DỮ LIỆU (tiếp theo)
Dữ liệu vừa thu thập thường chưa được tổ chức tốt vì:
• Có thể có giá trị khuyết tức bị mất (missing);
• Có thể câu trả lời không phù hợp;
• Có thể nhập liệu sai
Trang 185.2.3 XỬ LÝ DỮ LIỆU (tiếp theo)
Ta cần xử lý dữ liệu (có thể dùng phần mềm thống kê SPSS)
• Phân tích mô tả (Descriptive analysis);
• Xác định trung bình “Mean” của từng biến số;
• Xem kết quả có bất thường không Nếu có thì sửa chữa lại số liệu cho đúng
Cách làm: Analyse Descriptive Statistics Frequencies
Trang 195.2.4 ĐO LƯỜNG KHUYNH HƯỚNG TẬP TRUNG
• Số bình quân mẫu (Mean) thường được dùng với vai trò ước lượng xu hướng trung tâm chẳng hạn số bìnhquân của tổng thể chung Số bình quân theo nghĩa thông thường, được gọi chính xác hơn là số bình quân
số học để phân biệt với số bình quân nhân hay số bình quân điều hòa Nó còn được gọi là số bình quâncủa mẫu
• Số trung vị (Median) là một số tách giữa nửa lớn hơn và nửa bé hơn của một mẫu, một quần thể, hay mộtphân bố xác suất Nó là giá trị giữa trong một phân bố, mà số các số nằm trên hay dưới con số đó là bằngnhau Điều đó có nghĩa rằng 1/2 quần thể sẽ có các giá trị nhỏ hơn hay bằng số trung vị, và một nửa quầnthể sẽ có giá trị bằng hoặc lớn hơn số trung vị
• Mốt (Mode) của một danh sách dữ liệu là giá trị của phần tử có số lần xuất hiện lớn nhất trong danh sách
Ví dụ, mode của {1, 3, 6, 6, 6, 7, 7, 12, 12, 17} là 6 Khác với số bình quân số học giản đơn, mode khôngnhất thiết phải là duy nhất Mode đặc biệt hữu dụng khi các giá trị của các quan sát không có thứ tự dễ thấy(thường khi dữ liệu không phải là số) do các số bình quân và số trung vị có thể không được xác định Ví dụ,mode của {táo, táo, chuối, cam, cam, cam, đào} là cam
Trang 205.2.4 ĐO LƯỜNG KHUYNH HƯỚNG TẬP TRUNG (tiếp theo)
Khi nào thì sử dụng các số đo này?
phân loại
Màu mắt, hình thức hợp đồng, giới tính
Trung vị(Median)
giá trị cực biên
Phân hạng trong lớp, thứ tự lúc sinh
Trung bình(Mean)
mức độ thích
Trang 21CÂU HỎI TRẮC NGHIỆM
Nhận định sau đây đúng hay sai?
Khi đo lường theo khuynh hướng tập trung thì trung bình và trung vị có giá trị giống nhau
Đáp án đúng là: Sai
Vì: Giá trị trung bình và trung vị là hai khái niệm khác nhau Trung bình mẫu thường được dùng với vai trò ướclượng xu hướng trung tâm chẳng hạn số bình quân của tổng thể chung, số bình quân theo nghĩa thôngthường được gọi chính xác hơn là số bình quân số học để phân biệt với số bình quân số nhân, số bình quânđiều hòa, còn gọi là số bình quân mẫu của mẫu Còn trung vị là một số tách giữa nửa lớn hơn và nửa bé hơncủa một mẫu hoặc một quần thể
Trang 225.2.5 KIỂM TRA T-MẪU ĐỘC LẬP (T-TEST)
• Quy trình kiểm tra T-mẫu độc lập so sánh trung bình của 2 nhóm
Đối tượng cần được phân bổ vào 2 nhóm một cách ngẫu nhiên, vì vậy sự khác biệt có được là do tácđộng (hay không chịu tác động) mà không phải do sự ảnh hưởng của yếu tố khác Chẳng hạn nếu sosánh thu nhập bình quân giữa nam và nữ không phù hợp với loại kiểm tra này
Một người không được phân công ngẫu nhiên thành nam hay nữ Trong tình huống như vậy, bạn nênbảo đảm rằng sự khác biệt ở các yếu tố khác không làm tăng cường hay giảm nhẹ sự khác biệt đáng kểcủa trung bình
Khác biệt về thu nhập bình quân có thể chịu ảnh hưởng bởi các yếu tố như học vấn, chứ không chỉ chịuảnh hưởng của giới tính
• Quy trình kiểm tra T một mẫu xác định xem trung bình của một biến nào đó có khác so với một hằng số chotrước hay không Ví dụ: Một nhà sản xuất thực phẩm muốn kiểm tra các hộp thực phẩm của mình có trọnglượng trung bình khác với 300 gram, với mức tin cậy là 95%
Trang 235.2.6 PHÂN TÍCH PHƯƠNG SAI MỘT HƯỚNG (ONE-WAY ANOVA)
• Quy trình phân tích phương sai một hướng là lối phân tích phương sai của biến phụ thuộc bởi một biến sốđơn (biến độc lập)
• Phân tích phương sai được dùng để kiểm tra giả thuyết rằng nhiều trung bình là bằng nhau Đây là một kỹthuật mở rộng của phương pháp kiểm tra T hai mẫu độc lập
• Bên cạnh việc xác định sự khác biệt giữa các trung bình, bạn cũng đôi khi muốn xác định xem trung bìnhnào là khác biệt
Trang 245.2.6 PHÂN TÍCH PHƯƠNG SAI MỘT HƯỚNG (ONE-WAY ANOVA) (tiếp theo)
• Có 2 loại kiểm tra để so sánh trung bình:
Đối chiếu ưu tiên là lối kiểm tra tiến hành trước khi tiến hành thực nghiệm;
Kiểm tra hậu kỳ là lối kiểm tra tiến hành sau khi thực nghiệm
• Bạn cũng có thể kiểm tra khuynh hướng thay đổi trên nhiều phân loại khác nhau
Ví dụ: Mức độ tiếp thu bài giảng của học sinh thay đổi khác nhau Một thực nghiệm tiến hành với 3 môn họckhác nhau: Toán, Lý và Văn Toán, Lý là môn khoa học suy luận và Văn là môn diễn đạt
• Bên cạnh tiến hành kiểm tra mức độ tiếp thu bài giảng tùy thuộc vào loại môn giảng, bạn cũng có thể xácđịnh mức độ tiếp thu khác biệt giữa các môn suy luận và môn diễn đạt
Trang 255.2.7 XÂY DỰNG MÔ HÌNH HỒI QUY
• Phân tích hồi quy là một phân tích thống kê để xác định xem các biến độc lập (biến thuyết minh) quy địnhcác biến phụ thuộc (biến được thuyết minh) như thế nào
• Đây là một phương pháp thống kê mà giá trị kỳ vọng của một hay nhiều biến ngẫu nhiên được dự đoán dựavào điều kiện của các biến ngẫu nhiên khác
Trang 265.2.7 XÂY DỰNG MÔ HÌNH HỒI QUY
• Phân tích hồi quy không chỉ là trùng khớp đường cong (lựa chọn một đường cong mà vừa khớp nhất vớimột tập điểm dữ liệu); nó còn phải trùng khớp với một mô hình với các thành phần ngẫu nhiên và xác định
• Hồi quy thường được xếp vào loại bài toán tối ưu vì chúng ta nỗ lực để tìm kiếm một giải pháp để cho sai
số và phần dư là tốt nhất Phương pháp sai số chung nhất được sử dụng là phương pháp bình phương cựctiểu: Phương pháp này tương ứng với một hàm hợp lý dạng Gauss của các dữ liệu quan sát khi biết biếnngẫu nhiên (ẩn) Về một mặt nào đó, bình phương cực tiểu là một phương pháp ước lượng tối ưu: Xemđịnh lý Gauss-Markov
Trang 275.3 XỬ LÝ THÔNG TIN ĐỊNH TÍNH
5.3.1 Các kỹ thuật phân tích dữ liệu định tính 5.3.2 Xử lý dữ liệu định tính
Trang 285.3.1 CÁC KỸ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH
• Sau khi thu thập xong dữ liệu, thông thường tất cả các nhà nghiên cứu đều muốn:
Xác định chủ đề và các tiểu chủ đề;
Xây dựng codebook;
Mô tả lại hiện tượng;
Đưa ra các so sánh;
Xây dựng, thể hiện và kiểm tra các mô hình (các lý thuyết sử dụng trong nghiên cứu)
• Quá trình phân tích dữ liệu phải đáp ứng được những mục tiêu nêu trên
Trang 295.3.1 CÁC KỸ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
Phân tích dữ liệu
định tính
Phân tích dữ liệu dạng chữ
Phân tích dữ liệu dạng mã hóa
• Dân tộc học
• Quyết định các mô hình
Trang 305.3.1 CÁC KỸ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
• Phân tích dữ liệu dạng chữ: Kỹ thuật phân tích từ ngữ và các đoạn văn bản bao gồm:
Phép phân tích những từ ngữ quan trọng trong hoàn cảnh cụ thể (KWIC);
Đếm từ;
Phân tích những mạng lưới có ý nghĩa
• Phân tích dữ liệu dạng mã hóa:
Phân tích lý thuyết nền;
Phân tích giản đồ;
Quy nạp phân tích;
Phân tích nội dung căn bản;
Sử dụng từ điển nội dung
Trang 315.3.1 CÁC KỸ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
Thời điểm thích hợp tiến hành phân tích dữ liệu định tính
• Survey: Dựa trên kiểm định có tiêu chuẩn hoặc những thiết kế cho nghiên cứu thực nghiệm thì ranh giớigiữa thu thập và phân tích dữ liệu khá rõ ràng
• Nghiên cứu định tính: Ranh giới giữa 2 quá trình này là không rõ ràng vì:
Trang 325.3.1 CÁC KỸ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
Lời khuyên: Thu thập – phân tích
Việc phân tích thông tin định tính nên diễn ra đồng thời với quá trình thu thập thông tin vì:
Nếu quá tập trung vào việc phân tích, bỏ qua việc thu thập thông tin;
Câu hỏi/vấn đề nghiên cứu gốc – thế mạnh của nghiên cứu định tính bị cản trở;
Tạo ra những kết luận quá sớm – điều rất cần tránh trong nghiên cứu;
Bỏ qua những thông tin có khả năng gợi mở phân tích/khả năng xác thực cho câu hỏi nghiên cứu chính;
Mất thông tin và không bao giờ thu thập được lại nữa;
Có khả năng thất bại trong giai đoạn cuối – giai đoạn chứng thực thông tin
• Nếu hai quá trình thu thập thông tin và phân tích thông tin cùng diễn ra: Chất lượng của cả hai quá trình nàycùng phải được cải thiện Bởi vậy, người nghiên cứu không chỉ được tập trung vào việc thu thập dữ liệu đểkhẳng định lý thuyết ban đầu
Trang 335.3.1 CÁC KỸ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
Lời khuyên: Mô tả tập trung
Cùng với quá trình phân tích dữ liệu cần chú ý: Những dữ liệu phong phú, chi tiết và cụ thể sẽ giúp nghiên cứuđịnh tính
• Cung cấp cho người đọc khả năng hiểu về thực tế, con người và hoàn cảnh cụ thể thông qua cách nghiêncứu bối cảnh
• Các dấu hiệu và ý nghĩa của các sự việc
• Tạo nền tảng cho tất cả các phần trong báo cáo
Trang 345.3.1 CÁC KỸ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
Lời khuyên: Tổ chức dữ liệu
Tổ chức dữ liệu theo hệ thống hợp lý
• Dữ liệu của phương pháp nghiên cứu định tính rất lớn và không có một hệ thống khuôn mẫu rõ ràng nhưtrong nghiên cứu định lượng
• Cần phải hoàn thành quá trình thu thập thông tin đủ và thông tin cần trước khi tiến hành phân tích
• Dữ liệu nên được ghi chép trong một hệ thống bằng việc gán nhãn cho các phần dữ liệu
Lời khuyên: Bảo vệ dữ liệu
Phải có những bản photo dự phòng để ở một nơi khác nhằm giữ an toàn cho dữ liệu tránh khỏi những sự cốđáng tiếc như: Dữ liệu bị làm xáo trộn, bị mất hoặc bị cháy
Trang 355.3.1 CÁC KỸ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp)
Quy trình tiến hành phân tích
• Theo Glasser, Strauss và Morse, quá trình phân tích dữ liệu định tính gồm 3 giai đoạn chính như sau:
Thu gọn dữ liệu: Làm sạch và tổ chức thông tin;
Thể hiện thông tin: Cô đọng và tổ chức sơ đồ phân tích thông tin;
Phác thảo phần kết luận và kiểm định kết quả
Thu gọn/làm sạch dữ liệu
Thể hiện thông tinKết luận/kiểm
chứng thông tin