• Ta cần xử lí dữ liệu có thể dùng phần mềm thống kê SPSS Phân tích mô tả Descriptive analysis Xác định trung bình “Mean” của từng biến số; Xem kết quả có bất thường không.. CÁC KĨ
Trang 1PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC
Giảng viên: TS Phan Thế Công
Trang 2BÀI 5 PHƯƠNG PHÁP XỬ LÍ DỮ LIỆU
Giảng viên: TS Phan Thế Công
Trang 3MỤC TIÊU CỦA BÀI
• Phân biệt được thông tin định tính và định lượng
• Phân tích và xử lí được các thông tin định tính và
định lượng hợp lí cho từng loại đề tài nghiên cứu
Trang 4CÁC KIẾN THỨC CẦN CÓ
Để học tốt bài học này, người học cần có những
kiến thức cơ bản của các môn học sau:
• Kiến thức của giai đoạn học phổ thông như:
lịch sử, văn học, toán học, địa lí
• Kiến thức về xác suất và thống kê toán;
• Các kiến thức và kĩ năng cơ bản về tin học
văn phòng
Trang 5HƯỚNG DẪN HỌC
• Đọc tài liệu là bài giảng, giáo trình và các tài
liệu tham khảo trước lúc nghe giảng, trước
lúc thực hành
• Nghe và đọc thêm các thông tin mới trên các
phương tiện thông tin truyền thông, sách
báo, tạp chí chuyên ngành
• Thảo luận với sinh viên và giáo viên trên
diễn đàn và thông qua hệ thống H2472
Trang 6CẤU TRÚC NỘI DUNG
Các khái niệm cơ bản
Trang 75.1 CÁC KHÁI NIỆM CƠ BẢN
Tóm lược các loại biến cố
Loại biến số Định nghĩa Các hình thức thể hiện khác
Phụ thuộc
(Dependent)
Một biến số được đo lường để xác định
sự tác động (treatment) hay thay đổi (manipulation) của biến độc lập như thế nào.
• Biến thành quả (Outcome)
• Biến kết quả (Result)
• Biến tiêu chí (Criterion)
• Biến giới hạn (Restricting)
Ngoại vi
(Extraneous)
Một biến số có quan hệ với biến phụ thuộc hoặc biến độc lập, không phải là mục tiêu nghiên cứu.
• Biến đe dọa (Threatening)
Điều tiết
(Moderator)
Một biến số có quan hệ với biến phụ thuộc hoặc biến độc lập và có ảnh hưởng đến biến phụ thuộc.
• Biến tương tác (Interacting variable)
Trang 85.2 XỬ LÍ THÔNG TIN ĐỊNH LƯỢNG
5.2.1 Các loại thang đo trong phân tích dữ liệu
5.2.2 Độ tin cậy
5.2.3 Xử lí dữ liệu
5.2.4 Đo lường khuynh hướng tập trung
5.2.5 Kiểm tra T-mẫu độc lập
Trang 95.2.1 CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU
Thang đo đa phương (mutiple items scale): Thang Likert
Thang nhân tố (itemized category)
Thang so sánh (comparative scale)
Thang đo đơn phương
(single item scale) Thang thứ hạng (rank order scale)
Thang tổng (sum scale)
Thang hình ảnh (pictorial scale)
Thang đo đa phương
(mutiple item scale) Thang Likert
Trang 105.2.1 CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo)
a Thang đo đơn phương
• Dùng khi thuộc tính cần đo chỉ có thể thể hiện một phương (dimensionality)
Chiều cao (cao, thấp)
Trang 115.2.1 CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo)
Thang đo so sánh
So với Bita’s, Biti’s là
Nhân tố đo lường: Tính sáng tạo!
Thang đo thứ hạng (rank order)
Ví dụ: Hãy chỉ ra mức độ yêu thích âm nhạc của bạn, với 1 là thích nhất, 2 là thích thứnhì… cho mỗi loại âm nhạc dưới đây
Trang 125.2.1 CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo)
Trang 135.2.1 CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo)
b Thang đo đa phương
• Khi thuộc tính cần đo có thể có nhiều thành tố cùng một lúc:
Ví dụ: Năng lực làm việc thể hiện qua nhiều thành tố (item) như:
Điểm số học tập;
Thông minh (IQ);
Khả năng cảm xúc (EQ)
• Một trả lời sẽ không thể hiện hết hoặc thể hiện không đúng nội dung cần đo
Thang đo tổng thể (summated)
• Thang Likert: Cách đo lường dựa vào mức độ “đồng ý” và không đồng ý về các nộidung muốn xem xét
• Phần lớn được dùng nghiên cứu động thái của tổ chức
Trang 145.2.2 ĐỘ TIN CẬY
• Đó là mức độ nhất quán hay ổn định của công cụ đo
• 3 cách ước lượng:
Dùng chỉ số Cronbatch alfa (chấp nhận khi chỉ số > 0.7)
Kiểm tra và tái kiểm tra: Dùng một công cụ đo và đo 2 lần trên một nhóm khảosát Chỉ số tương quan của kết quả sẽ thể hiện độ tin cậy của công cụ đo
Mẫu tương đương (Equivalent forms): Lập 2 mẫu đo lường khác nhau nhưng đocùng một hiện tượng Chỉ số tương quan giữa 2 mẫu sẽ thể hiện độ tin cậy củacông cụ đo
Trang 155.2.3 XỬ LÍ DỮ LIỆU
• Mục tiêu: giúp sinh viên biết cách:
Nhập liệu;
Làm sạch số liệu;
Thực hiện thống kê mô tả;
Kiểm định T-tests, ANOVA;
Tương quan, hồi quy
• Dữ liệu vừa thu thập thường chưa được tổ chức tốt vì:
Có thể có giá trị khuyết tức bị mất (missing);
Có thể câu trả lời không phù hợp;
Có thể nhập liệu sai
• Ta cần xử lí dữ liệu (có thể dùng phần mềm thống kê SPSS)
Phân tích mô tả (Descriptive analysis)
Xác định trung bình “Mean” của từng biến số;
Xem kết quả có bất thường không Nếu có thì sửa chữa lại số liệu cho đúng
• Cách làm: Analyse Descriptive Statistics Frequencies
Trang 165.2.4 ĐO LƯỜNG KHUYNH HƯỚNG TẬP TRUNG
• Số bình quân mẫu (Mean) thường được dùng với vai trò ước lượng xu hướng trungtâm chẳng hạn số bình quân của tổng thể chung Số bình quân theo nghĩa thôngthường, được gọi chính xác hơn là số bình quân số học để phân biệt với số bìnhquân nhân hay số bình quân điều hòa Nó còn được gọi là số bình quân của mẫu
• Số trung vị (Median) là một số tách giữa nửa lớn hơn và nửa bé hơn của một mẫu,một quần thể, hay một phân bố xác suất Nó là giá trị giữa trong một phân bố, mà sốcác số nằm trên hay dưới con số đó là bằng nhau Điều đó có nghĩa rằng 1/2 quầnthể sẽ có các giá trị nhỏ hơn hay bằng số trung vị, và một nửa quần thể sẽ có giá trịbằng hoặc lớn hơn số trung vị
• Mốt (Mode) của một danh sách dữ liệu là giá trị của phần tử có số lần xuất hiện lớnnhất trong danh sách Ví dụ, mode của {1, 3, 6, 6, 6, 7, 7, 12, 12, 17} là 6 Khácvới số bình quân số học giản đơn, mode không nhất thiết phải là duy nhất Mode đặcbiệt hữu dụng khi các giá trị của các quan sát không có thứ tự dễ thấy (thường khi
dữ liệu không phải là số) do các số bình quân và số trung vị có thể không được xácđịnh Ví dụ, mode của {táo, táo, chuối, cam, cam, cam, đào} là cam
Trang 175.2.4 ĐO LƯỜNG KHUYNH HƯỚNG TẬP TRUNG
Số đo Mức đo Khi sử dụng Ví dụ
Mốt (Mode) Số mệnh danh Dữ liệu dưới dạng
phân loại
Màu mắt, hình thức hợpđồng, giới tính
Trang 185.2.5 KIỂM TRA T-MẪU ĐỘC LẬP (T-TEST)
• Quy trình kiểm tra T-mẫu độc lập so sánh trung bình của 2 nhóm
Đối tượng cần được phân bổ vào 2 nhóm một cách ngẫu nhiên, vì vậy sự khácbiệt có được là do tác động (hay không chịu tác động) mà không phải do sự ảnhhưởng của yếu tố khác Chẳng hạn nếu so sánh thu nhập bình quân giữa nam và
nữ không phù hợp với loại kiểm tra này
Một người không được phân công ngẫu nhiên thành nam hay nữ Trong tìnhhuống như vậy, bạn nên bảo đảm rằng sự khác biệt ở các yếu tố khác không làmtăng cường hay giảm nhẹ sự khác biệt đáng kể của trung bình
Khác biệt về thu nhập bình quân có thể chịu ảnh hưởng bởi các yếu tố như họcvấn, chứ không chỉ chịu ảnh hưởng của giới tính
• Quy trình kiểm tra T một mẫu xác định xem trung bình của một biến nào đó có khác
so với một hằng số cho trước hay không Ví dụ: Một nhà sản xuất thực phẩm muốnkiểm tra các hộp thực phẩm của mình có trọng lượng trung bình khác với 300 gram,với mức tin cậy là 95%
Trang 195.2.6 PHÂN TÍCH PHƯƠNG SAI MỘT HƯỚNG (ONE-WAY ANOVA)
• Quy trình phân tích phương sai một hướng là lối phân tích phương sai của biến phụthuộc bởi một biến số đơn (biến độc lập)
• Phân tích phương sai được dùng để kiểm tra giả thuyết rằng nhiều trung bình làbằng nhau Đây là một kĩ thuật mở rộng của phương pháp kiểm tra T hai mẫuđộc lập
• Bên cạnh việc xác định sự khác biệt giữa các trung bình, bạn cũng đôi khi muốn xácđịnh xem trung bình nào là khác biệt
• Có 2 loại kiểm tra để so sánh trung bình:
Đối chiếu ưu tiên là lối kiểm tra tiến hành trước khi tiến hành thực nghiệm;
Kiểm tra hậu kì là lối kiểm tra tiến hành sau khi thực nghiệm
• Bạn cũng có thể kiểm tra khuynh hướng thay đổi trên nhiều phân loại khác nhau
Ví dụ: Mức độ tiếp thu bài giảng của học sinh thay đổi khác nhau Một thực nghiệmtiến hành với 3 môn học khác nhau: Toán, Lí và Văn Toán, Lí là môn khoa học suyluận và Văn là môn diễn đạt
• Bên cạnh tiến hành kiểm tra mức độ tiếp thu bài giảng tùy thuộc vào loại môn giảng,bạn cũng có thể xác định mức độ tiếp thu khác biệt giữa các môn suy luận và môndiễn đạt
Trang 205.2.7 XÂY DỰNG MÔ HÌNH HỒI QUY
• Phân tích hồi quy là một phân tích thống kê để xác định xem các biến độc lập (biếnthuyết minh) quy định các biến phụ thuộc (biến được thuyết minh) như thế nào
• Đây là một phương pháp thống kê mà giá trị kì vọng của một hay nhiều biến ngẫunhiên được dự đoán dựa vào điều kiện của các biến ngẫu nhiên khác
• Phân tích hồi quy không chỉ là trùng khớp đường cong (lựa chọn một đường cong
mà vừa khớp nhất với một tập điểm dữ liệu); nó còn phải trùng khớp với một môhình với các thành phần ngẫu nhiên và xác định
• Hồi quy thường được xếp vào loại bài toán tối ưu vì chúng ta nỗ lực để tìm kiếm mộtgiải pháp để cho sai số và phần dư là tốt nhất Phương pháp sai số chung nhất được
sử dụng là phương pháp bình phương cực tiểu: Phương pháp này tương ứng vớimột hàm hợp lí dạng Gauss của các dữ liệu quan sát khi biết biến ngẫu nhiên (ẩn)
Về một mặt nào đó, bình phương cực tiểu là một phương pháp ước lượng tối ưu:Xem định lí Gauss-Markov
Trang 215.3 XỬ LÍ THÔNG TIN ĐỊNH TÍNH
5.3.1 Các kĩ thuật phân tích
dữ liệu định tính
5.3.2 Xử lí dữ liệu định tính
Trang 225.3.1 CÁC KĨ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH
• Sau khi thu thập xong dữ liệu, thông thường tất cả các nhà nghiên cứu đều muốn:
Trang 235.3.1 CÁC KĨ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
Phân tích dữ liệu định tính
Phối hợp
• Dân tộc học
• Quyết định các
mô hình
Trang 245.3.1 CÁC KĨ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
• Phân tích dữ liệu dạng chữ: Kĩ thuật phân tích từ ngữ và các đoạn văn bản bao gồm
Phép phân tích những từ ngữ quan trọng trong hoàn cảnh cụ thể (KWIC);
Đếm từ;
Phân tích những mạng lưới có ý nghĩa
• Phân tích dữ liệu dạng mã hóa:
Phân tích lí thuyết nền;
Phân tích giản đồ;
Quy nạp phân tích;
Phân tích nội dung căn bản;
Sử dụng từ điển nội dung
Trang 255.3.1 CÁC KĨ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
Thời điểm thích hợp tiến hành phân tích dữ liệu định tính
• Survey: Dựa trên kiểm định có tiêu chuẩn hoặc những thiết kế cho nghiên cứu thựcnghiệm thì ranh giới giữa thu thập và phân tích dữ liệu khá rõ ràng
• Nghiên cứu định tính: Ranh giới giữa 2 quá trình này là không rõ ràng vì
Trang 265.3.1 CÁC KĨ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
Lời khuyên: Thu thập – phân tích
Việc phân tích thông tin định tính nên diễn ra đồng thời với quá trình thu thập thôngtin vì:
• Nếu quá tập trung vào việc phân tích, bỏ qua việc thu thập thông tin:
Câu hỏi/vấn đề nghiên cứu gốc – thế mạnh của nghiên cứu định tính bị cản trở;
Tạo ra những kết luận quá sớm – điều rất cần tránh trong nghiên cứu;
Bỏ qua những thông tin có khả năng gợi mở phân tích/khả năng xác thực chocâu hỏi nghiên cứu chính;
Mất thông tin và không bao giờ thu thập được lại nữa;
Có khả năng thất bại trong giai đoạn cuối – giai đoạn chứng thực thông tin
• Nếu hai quá trình thu thập thông tin và phân tích thông tin cùng diễn ra: Chất lượngcủa cả hai quá trình này cùng phải được cải thiện Bởi vậy, người nghiên cứu khôngchỉ được tập trung vào việc thu thập dữ liệu để khẳng định lí thuyết ban đầu
Trang 275.3.1 CÁC KĨ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
Lời khuyên: Mô tả tập trung
Cùng với quá trình phân tích dữ liệu cần chú ý: Những dữ liệu phong phú, chi tiết và cụthể sẽ giúp nghiên cứu định tính
• Cung cấp cho người đọc khả năng hiểu về thực tế, con người và hoàn cảnh cụ thểthông qua cách nghiên cứu bối cảnh
• Các dấu hiệu và ý nghĩa của các sự việc
• Tạo nền tảng cho tất cả các phần trong báo cáo
Lời khuyên: Tổ chức dữ liệu
Lời khuyên: Bảo vệ dữ liệu
Phải có những bản photo dự phòng để ở một nơi khác nhằm giữ an toàn cho dữ liệutránh khỏi những sự cố đáng tiếc như: Dữ liệu bị làm xáo trộn, bị mất hoặc bị cháy
Trang 285.3.1 CÁC KĨ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
Quy trình tiến hành phân tích
Theo Glasser, Strauss và Morse, quá trình phân tích dữ liệu định tính gồm 3 giai đoạnchính như sau:
Thu gọn dữ liệu: Làm sạch và tổ chức thông tin;
Thể hiện thông tin: Cô đọng và tổ chức sơ đồ phân tích thông tin;
Phác thảo phần kết luận và kiểm định kết quả;
Thể hiện thông tin
Kết luận/
kiểm chứng thông tin Thu gọn/làm
sạch dữ liệu
Trang 295.3.2 XỬ LÍ DỮ LIỆU ĐỊNH TÍNH
Xử lí dữ liệu định tính
Thu gọn
dữ liệu định tính
Phân tích
và thể hiện thông tin
Kết luận và viết báo cáo
Tìm kiếm các trường hợp điển hình
Phát triển
hệ thống dữ liệu
Nhập và lưu trữ thông tin
Gán nhãn cho các nhóm
Mã hóa dữ liệu
Thể hiện mối quan
hệ giữa các nhóm
Chuẩn
bị báo cáo
Kiểm chứng thông tin
Trang 305.3.2 XỬ LÍ DỮ LIỆU ĐỊNH TÍNH
Phân tích ban đầu
• Quy trình phân tích dữ liệu định tính có xu hướng tiếp tục và lặp lại quy trình nghiêncứu định tính
• Việc phân tích ban đầu sẽ tiếp tục cho đến khi nào chủ đề nghiên cứu được nhànghiên cứu làm rõ
Tạo các bản ghi
• Trong toàn bộ quá trình phân tích dữ liệu định tính, người nghiên cứu nên có những
bản ghi nhớ (ví dụ: ghi lại những điều bạn phát hiện thấy từ dữ liệu).
• Ý nghĩa: Khi người nghiên cứu nảy sinh ý hoặc hiểu hơn về chủ đề nghiên cứu, họ
có thể bổ sung thêm vào phần dữ liệu cần nghiên cứu
Trang 315.3.2 XỬ LÍ DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
Nhập và lưu trữ thông tin
• Các văn bản thường dùng trong nghiên cứu định tính: Những bản gỡ băng từ ghi âmphỏng vấn sâu, thảo luận nhóm, bản ghi chép thực địa của quan sát…
• Để đảm bảo tính nguyên gốc của thông tin cũng như tùy thuộc vào mục đích sửdụng dữ liệu, văn bản gỡ băng có thể có các mức độ khác nhau:
Gỡ băng sơ lược: Chỉ lấy những thông tin chính hoặc những đoạn văn bản cầnthiết phục vụ cho nghiên cứu
Gỡ băng chi tiết: Ghi chép lại toàn bộ các thông tin một cách chi tiết, chính xác vàtrung thực
• Người nghiên cứu nên đánh máy và tổ chức lại thông tin từ các bản viết tay, ghichép trong quá trình thu thập thông tin nhằm:
Hiểu sâu sắc và đầy đủ về ý nghĩa cũng như hoàn cảnh thu thập dữ liệu
Thấy được sự chuyển đổi thông tin từ quá trình thực địa tới quá trình phân tíchđầy đủ
Cảm nhận sắc thái, ý nghĩa của dữ liệu được bộc lộ dần trong toàn bộ quá trìnhtích lũy thông tin
• Gỡ băng hoặc nghe lại toàn bộ các bản ghi âm mất thời gian nhưng rất quan trọng,không thể bỏ qua
Trang 325.3.2 XỬ LÍ DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
Sử dụng các phần mềm hỗ trợ
• Tiết kiệm thời gian và công sức trong việc xử lí dữ liệu
• Máy tính và các phần mềm là công cụ để hỗ trợ quá trình phân tích
• Con người mới chính là yếu tố quyết định trong phân tích định tính: (Người thực hiệnquá trình phân tích dữ liệu định tính sẽ quyết định phải làm gì để đưa ra các khuônmẫu, những gì cấu thành nên chủ đề, phải đặt tên gì và tìm ra ý nghĩa của cáctrường hợp nghiên cứu)
• Theo Fielding (1995, 2000) người đã sử dụng rất nhiều phần mềm phân tích địnhtính có 3 loại phần mềm phân tích định tính như sau:
Phần mềm thu thập các văn bản dạng chữ;
Phần mềm thu thập và mã hóa;
Phần mềm xây dựng các lí thuyết
• Trước khi lựa chọn, người nghiên cứu nên cân nhắc những yếu tố sau:
Cách thức nhập dữ liệu: Nguồn lưu trữ thông tin khác nhau
Cách thức mã hóa: Mức độ khác nhau trong việc tổ chức, tái tổ chức và đặt nhãncho các mã
Sử dụng những phần ghi nhớ hoặc chú thích gắn với các mã (Hữu ích nếu việcphân tích dữ liệu định được thực hiện theo nhóm Các ghi nhớ hoặc chú thích sẽgiúp cho các thành viên trong nhóm hiểu ý của nhau hơn, hỗ trợ nhau trong quá
Trang 335.3.2 XỬ LÍ DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
• Cơ cấu liên kết và giảm mức độ khác nhau (kết nối những nguồn dữ liệu khác nhauhoặc những phần khác nhau trong quá trình phân tích)
• Cách thức thể hiện dữ liệu:
Tốc độ và quy trình tìm kiếm, thu thập dữ liệu;
Thể hiện những biến đổi quan trọng (bao gồm hoặc không bao gồm ngoại cảnh);
Ghi chép chi tiết (ghi chép lại những phần đã thực hiện)