1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bài giảng Bài 5: Phương pháp xử lý dữ liệu

44 18 3

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 44
Dung lượng 588,58 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Nội dung chính của bài giảng này trình bày việc phân biệt được thông tin định tính và định lượng. Phân tích và xử lý được các thông tin định tính và định lượng hợp lý cho từng loại đề tài nghiên cứu. Mời các bạn tham khảo!

Trang 1

BÀI 5 PHƯƠNG PHÁP XỬ LÝ DỮ LIỆU

PGS.TS Phan Thế Công Giảng viên Trường Đại học Thương mại

Trang 2

TÌNH HUỐNG KHỞI ĐỘNG

Hai sinh viên trò chuyện với nhau về khó khăn trong việc xử lý dữ liệu sau khi thu thập được

• Hằng: Chết tớ rồi Huyền ạ Giá như tớ nghe lời mấy bạn trong nhóm khuyên thì bây giờ không phải lo lắngthế này

• Huyền: Sao cậu lại nói vậy? Có chuyện gì à?

• Hằng: Tớ đã tham lam đưa quá nhiều câu hỏi mở vào bảng câu hỏi điều tra nên giờ thống kê và xử lý thếnào đây Nếu là câu hỏi đóng thì còn thống kê dễ dàng chứ câu hỏi mở thì trăm ngàn phương án trả lời biếtlàm sao bây giờ?

• Huyền: Tưởng gì Cậu chỉ cần xem lại bài 5 Phương pháp xử lý dữ liệu là được ngay mà Trong đó đãhướng dẫn cụ thể cách xử lý dữ liệu hay thông tin định tính tức là câu trả lời cho câu hỏi mở của cậu và cả

dữ liệu hay thông tin định lượng tức là câu trả lời cho câu hỏi đóng của cậu đó

• Hằng: Ừ nhỉ Tớ quên hẳn mất điều này Cảm ơn câu nhé, tớ phải xem lại ngay mới được

Trang 3

MỤC TIÊU BÀI HỌC

• Phân biệt được thông tin định tính và định lượng

• Phân tích và xử lý được các thông tin định tính và định lượng hợp lý cho từng loại đề tài nghiên cứu

Trang 4

CẤU TRÚC NỘI DUNG

Xử lý thông tin định lượng

Trang 5

5.1 CÁC KHÁI NIỆM CƠ BẢN

Phụ thuộc

(Dependent)

Một biến số được đo lường để xác định sự tácđộng (treatment) hay thay đổi (manipulation)của biến độc lập như thế nào

• Biến thành quả (Outcome)

• Biến kết quả (Result)

• Biến tiêu chí (Criterion)

Một biến số có quan hệ với biến phụ thuộc, mà

sự ảnh hưởng của nó cần phải được loại bỏ • Biến giới hạn (Restricting)

Ngoại vi

(Extraneous)

Một biến số có quan hệ với biến phụ thuộchoặc biến độc lập, không phải là mục tiêunghiên cứu

• Biến đe dọa (Threatening)

Điều tiết

(Moderator)

Một biến số có quan hệ với biến phụ thuộchoặc biến độc lập và có ảnh hưởng đến biếnphụ thuộc

• Biến tương tác (Interacting variable)

Trang 6

CÂU HỎI TRẮC NGHIỆM

Ghép phương án số và phương án chữ thành những phương án đúng sau đây

1 Biến phụ thuộc (dependent) A Một biến số được thay đổi để xác định ảnh

hưởng của nó đối với biến phụ thuộc

2 Biến độc lập (independent) B Một biến số có quan hệ với biến phụ thuộc hoặc

biến độc lập và có ảnh hưởng đến biến phụ thuộc

3 Biến kiểm soát (control) C Một biến số có quan hệ với biến phụ thuộc hoặc

biến độc lập, không phải là mục tiêu nghiên cứu

4 Biến ngoại vi (extraneous) D Một biến số được đo lường để xác định sự tác

động (treatment) hay thay đổi (manipulation) củabiến độc lập như thế nào

5 Biến điều tiết (moderator) E Một biến số có quan hệ với biến phụ thuộc, mà

sự ảnh hưởng của nó cần phải được loại bỏ

Trang 7

CÂU HỎI TRẮC NGHIỆM

Phương án nào đúng trong các phương án sau?

A Biến phụ thuộc: Một biến số được đo lường để xác định sự tác động hay thay đổi của biến độc lập như thế nào.

B Biến độc lập (independent): Một biến số được thay đổi để xác định ảnh hưởng của nó đối với biến phụ thuộc.

C Biến kiểm soát: Một biến số có quan hệ với biến phụ thuộc, mà sự ảnh hưởng của nó cần phải được loại bỏ.

D Biến ngoại vi: Một biến số có quan hệ với biến phụ thuộc hoặc biến độc lập và có ảnh hưởng đến biến phụ thuộc.

E Biến điều tiết: Một biến số có quan hệ với biến phụ thuộc hoặc biến độc lập, không phải là mục tiêu nghiên cứu.

Đáp án đúng là: A; B và C.

Vì: Theo mục 5.1 Các khái niệm cơ bản.

Trang 8

5.2 XỬ LÝ THÔNG TIN ĐỊNH LƯỢNG

5.2.1 Các loại thang đo trong phần tích dữ liệu

5.2.2 Độ tin cậy

5.2.4 Đo lường khuynh hướng tập trung

5.2.3 Xử lý dữ liệu

5.2.5 Kiểm tra T-mẫu độc lập (T-test)

5.2.6 Phân tích phương sai một hướng (one-way anova)

5.2.7 Xây dựng mô hình hồi quy

Trang 9

5.2.1 CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU

Thang đo đơn phương (single item scale)

Thang nhân tố (itemized category) Thang so sánh (comparative scale) Thang thứ hạng (rank order scale) Thang tổng (sum scale)

Thanh hình ảnh (pictorial scale)

Thang đo đa phương (multiple item scale) Thang Likert

Trang 10

5.2.1 CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo)

a Thang đo đơn phương

• Dùng khi thuộc tính cần đo chỉ có thể thể hiện một phương (dimensionality)

 Chiều cao (cao, thấp)

 Cân nặng (nặng, nhẹ)

 Kính trọng (nhiều, ít)

• Có thể dùng để so sánh

Trang 11

5.2.1 CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo)

Trang 12

5.2.1 CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo)

Thang đo thứ hạng (rank order)

Ví dụ: Hãy chỉ ra mức độ yêu thích âm nhạc của bạn, với 1 là thích nhất, 2 là thích thứ nhì… cho mỗi loại âmnhạc dưới đây

Trang 13

5.2.1 CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo)

Trang 14

5.2.1 CÁC LOẠI THANG ĐO TRONG PHÂN TÍCH DỮ LIỆU (tiếp theo)

b Thang đo đa phương

• Khi thuộc tính cần đo có thể có nhiều thành tố cùng một lúc:

• Ví dụ: Năng lực làm việc thể hiện qua nhiều thành tố (item) như:

 Điểm số học tập;

 Thông minh (IQ);

 Khả năng cảm xúc (EQ)

• Một trả lời sẽ không thể hiện hết hoặc thể hiện không đúng nội dung cần đo

Thang đo tổng thể (summated)

• Thang Likert: Cách đo lường dựa vào mức độ “đồng ý” và không đồng ý về các nội dung muốn xem xét

• Phần lớn được dùng nghiên cứu động thái của tổ chức

Trang 15

5.2.2 ĐỘ TIN CẬY

• Đó là mức độ nhất quán hay ổn định của công cụ đo

• 3 cách ước lượng:

 Dùng chỉ số Cronbatch alfa (chấp nhận khi chỉ số α > 0.7)

 Kiểm tra và tái kiểm tra: Dùng một công cụ đo và đo 2 lần trên một nhóm khảo sát Chỉ số tương quancủa kết quả sẽ thể hiện độ tin cậy của công cụ đo

 Mẫu tương đương (Equivalent forms): Lập 2 mẫu đo lường khác nhau nhưng đo cùng một hiện tượng.Chỉ số tương quan giữa 2 mẫu sẽ thể hiện độ tin cậy của công cụ đo

Trang 16

5.2.3 XỬ LÝ DỮ LIỆU

Mục tiêu: giúp sinh viên biết cách:

• Nhập liệu;

• Làm sạch số liệu;

• Thực hiện thống kê mô tả;

• Kiểm định T-tests, ANOVA;

• Tương quan, hồi quy

Trang 17

5.2.3 XỬ LÝ DỮ LIỆU (tiếp theo)

Dữ liệu vừa thu thập thường chưa được tổ chức tốt vì:

• Có thể có giá trị khuyết tức bị mất (missing);

• Có thể câu trả lời không phù hợp;

• Có thể nhập liệu sai

Trang 18

5.2.3 XỬ LÝ DỮ LIỆU (tiếp theo)

Ta cần xử lý dữ liệu (có thể dùng phần mềm thống kê SPSS)

• Phân tích mô tả (Descriptive analysis);

• Xác định trung bình “Mean” của từng biến số;

• Xem kết quả có bất thường không Nếu có thì sửa chữa lại số liệu cho đúng

Cách làm: Analyse  Descriptive Statistics  Frequencies

Trang 19

5.2.4 ĐO LƯỜNG KHUYNH HƯỚNG TẬP TRUNG

• Số bình quân mẫu (Mean) thường được dùng với vai trò ước lượng xu hướng trung tâm chẳng hạn số bìnhquân của tổng thể chung Số bình quân theo nghĩa thông thường, được gọi chính xác hơn là số bình quân

số học để phân biệt với số bình quân nhân hay số bình quân điều hòa Nó còn được gọi là số bình quâncủa mẫu

• Số trung vị (Median) là một số tách giữa nửa lớn hơn và nửa bé hơn của một mẫu, một quần thể, hay mộtphân bố xác suất Nó là giá trị giữa trong một phân bố, mà số các số nằm trên hay dưới con số đó là bằngnhau Điều đó có nghĩa rằng 1/2 quần thể sẽ có các giá trị nhỏ hơn hay bằng số trung vị, và một nửa quầnthể sẽ có giá trị bằng hoặc lớn hơn số trung vị

• Mốt (Mode) của một danh sách dữ liệu là giá trị của phần tử có số lần xuất hiện lớn nhất trong danh sách

Ví dụ, mode của {1, 3, 6, 6, 6, 7, 7, 12, 12, 17} là 6 Khác với số bình quân số học giản đơn, mode khôngnhất thiết phải là duy nhất Mode đặc biệt hữu dụng khi các giá trị của các quan sát không có thứ tự dễ thấy(thường khi dữ liệu không phải là số) do các số bình quân và số trung vị có thể không được xác định Ví dụ,mode của {táo, táo, chuối, cam, cam, cam, đào} là cam

Trang 20

5.2.4 ĐO LƯỜNG KHUYNH HƯỚNG TẬP TRUNG (tiếp theo)

Khi nào thì sử dụng các số đo này?

phân loại

Màu mắt, hình thức hợp đồng, giới tính

Trung vị(Median)

giá trị cực biên

Phân hạng trong lớp, thứ tự lúc sinh

Trung bình(Mean)

mức độ thích

Trang 21

CÂU HỎI TRẮC NGHIỆM

Nhận định sau đây đúng hay sai?

Khi đo lường theo khuynh hướng tập trung thì trung bình và trung vị có giá trị giống nhau

Đáp án đúng là: Sai

Vì: Giá trị trung bình và trung vị là hai khái niệm khác nhau Trung bình mẫu thường được dùng với vai trò ướclượng xu hướng trung tâm chẳng hạn số bình quân của tổng thể chung, số bình quân theo nghĩa thôngthường được gọi chính xác hơn là số bình quân số học để phân biệt với số bình quân số nhân, số bình quânđiều hòa, còn gọi là số bình quân mẫu của mẫu Còn trung vị là một số tách giữa nửa lớn hơn và nửa bé hơncủa một mẫu hoặc một quần thể

Trang 22

5.2.5 KIỂM TRA T-MẪU ĐỘC LẬP (T-TEST)

• Quy trình kiểm tra T-mẫu độc lập so sánh trung bình của 2 nhóm

 Đối tượng cần được phân bổ vào 2 nhóm một cách ngẫu nhiên, vì vậy sự khác biệt có được là do tácđộng (hay không chịu tác động) mà không phải do sự ảnh hưởng của yếu tố khác Chẳng hạn nếu sosánh thu nhập bình quân giữa nam và nữ không phù hợp với loại kiểm tra này

 Một người không được phân công ngẫu nhiên thành nam hay nữ Trong tình huống như vậy, bạn nênbảo đảm rằng sự khác biệt ở các yếu tố khác không làm tăng cường hay giảm nhẹ sự khác biệt đáng kểcủa trung bình

 Khác biệt về thu nhập bình quân có thể chịu ảnh hưởng bởi các yếu tố như học vấn, chứ không chỉ chịuảnh hưởng của giới tính

• Quy trình kiểm tra T một mẫu xác định xem trung bình của một biến nào đó có khác so với một hằng số chotrước hay không Ví dụ: Một nhà sản xuất thực phẩm muốn kiểm tra các hộp thực phẩm của mình có trọnglượng trung bình khác với 300 gram, với mức tin cậy là 95%

Trang 23

5.2.6 PHÂN TÍCH PHƯƠNG SAI MỘT HƯỚNG (ONE-WAY ANOVA)

• Quy trình phân tích phương sai một hướng là lối phân tích phương sai của biến phụ thuộc bởi một biến sốđơn (biến độc lập)

• Phân tích phương sai được dùng để kiểm tra giả thuyết rằng nhiều trung bình là bằng nhau Đây là một kỹthuật mở rộng của phương pháp kiểm tra T hai mẫu độc lập

• Bên cạnh việc xác định sự khác biệt giữa các trung bình, bạn cũng đôi khi muốn xác định xem trung bìnhnào là khác biệt

Trang 24

5.2.6 PHÂN TÍCH PHƯƠNG SAI MỘT HƯỚNG (ONE-WAY ANOVA) (tiếp theo)

• Có 2 loại kiểm tra để so sánh trung bình:

 Đối chiếu ưu tiên là lối kiểm tra tiến hành trước khi tiến hành thực nghiệm;

 Kiểm tra hậu kỳ là lối kiểm tra tiến hành sau khi thực nghiệm

• Bạn cũng có thể kiểm tra khuynh hướng thay đổi trên nhiều phân loại khác nhau

Ví dụ: Mức độ tiếp thu bài giảng của học sinh thay đổi khác nhau Một thực nghiệm tiến hành với 3 môn họckhác nhau: Toán, Lý và Văn Toán, Lý là môn khoa học suy luận và Văn là môn diễn đạt

• Bên cạnh tiến hành kiểm tra mức độ tiếp thu bài giảng tùy thuộc vào loại môn giảng, bạn cũng có thể xácđịnh mức độ tiếp thu khác biệt giữa các môn suy luận và môn diễn đạt

Trang 25

5.2.7 XÂY DỰNG MÔ HÌNH HỒI QUY

• Phân tích hồi quy là một phân tích thống kê để xác định xem các biến độc lập (biến thuyết minh) quy địnhcác biến phụ thuộc (biến được thuyết minh) như thế nào

• Đây là một phương pháp thống kê mà giá trị kỳ vọng của một hay nhiều biến ngẫu nhiên được dự đoán dựavào điều kiện của các biến ngẫu nhiên khác

Trang 26

5.2.7 XÂY DỰNG MÔ HÌNH HỒI QUY

• Phân tích hồi quy không chỉ là trùng khớp đường cong (lựa chọn một đường cong mà vừa khớp nhất vớimột tập điểm dữ liệu); nó còn phải trùng khớp với một mô hình với các thành phần ngẫu nhiên và xác định

• Hồi quy thường được xếp vào loại bài toán tối ưu vì chúng ta nỗ lực để tìm kiếm một giải pháp để cho sai

số và phần dư là tốt nhất Phương pháp sai số chung nhất được sử dụng là phương pháp bình phương cựctiểu: Phương pháp này tương ứng với một hàm hợp lý dạng Gauss của các dữ liệu quan sát khi biết biếnngẫu nhiên (ẩn) Về một mặt nào đó, bình phương cực tiểu là một phương pháp ước lượng tối ưu: Xemđịnh lý Gauss-Markov

Trang 27

5.3 XỬ LÝ THÔNG TIN ĐỊNH TÍNH

5.3.1 Các kỹ thuật phân tích dữ liệu định tính 5.3.2 Xử lý dữ liệu định tính

Trang 28

5.3.1 CÁC KỸ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH

• Sau khi thu thập xong dữ liệu, thông thường tất cả các nhà nghiên cứu đều muốn:

 Xác định chủ đề và các tiểu chủ đề;

 Xây dựng codebook;

 Mô tả lại hiện tượng;

 Đưa ra các so sánh;

 Xây dựng, thể hiện và kiểm tra các mô hình (các lý thuyết sử dụng trong nghiên cứu)

• Quá trình phân tích dữ liệu phải đáp ứng được những mục tiêu nêu trên

Trang 29

5.3.1 CÁC KỸ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)

Phân tích dữ liệu

định tính

Phân tích dữ liệu dạng chữ

Phân tích dữ liệu dạng mã hóa

• Dân tộc học

• Quyết định các mô hình

Trang 30

5.3.1 CÁC KỸ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)

• Phân tích dữ liệu dạng chữ: Kỹ thuật phân tích từ ngữ và các đoạn văn bản bao gồm:

 Phép phân tích những từ ngữ quan trọng trong hoàn cảnh cụ thể (KWIC);

 Đếm từ;

 Phân tích những mạng lưới có ý nghĩa

• Phân tích dữ liệu dạng mã hóa:

 Phân tích lý thuyết nền;

 Phân tích giản đồ;

 Quy nạp phân tích;

 Phân tích nội dung căn bản;

 Sử dụng từ điển nội dung

Trang 31

5.3.1 CÁC KỸ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)

Thời điểm thích hợp tiến hành phân tích dữ liệu định tính

• Survey: Dựa trên kiểm định có tiêu chuẩn hoặc những thiết kế cho nghiên cứu thực nghiệm thì ranh giớigiữa thu thập và phân tích dữ liệu khá rõ ràng

• Nghiên cứu định tính: Ranh giới giữa 2 quá trình này là không rõ ràng vì:

Trang 32

5.3.1 CÁC KỸ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)

Lời khuyên: Thu thập – phân tích

Việc phân tích thông tin định tính nên diễn ra đồng thời với quá trình thu thập thông tin vì:

 Nếu quá tập trung vào việc phân tích, bỏ qua việc thu thập thông tin;

 Câu hỏi/vấn đề nghiên cứu gốc – thế mạnh của nghiên cứu định tính bị cản trở;

 Tạo ra những kết luận quá sớm – điều rất cần tránh trong nghiên cứu;

 Bỏ qua những thông tin có khả năng gợi mở phân tích/khả năng xác thực cho câu hỏi nghiên cứu chính;

 Mất thông tin và không bao giờ thu thập được lại nữa;

 Có khả năng thất bại trong giai đoạn cuối – giai đoạn chứng thực thông tin

• Nếu hai quá trình thu thập thông tin và phân tích thông tin cùng diễn ra: Chất lượng của cả hai quá trình nàycùng phải được cải thiện Bởi vậy, người nghiên cứu không chỉ được tập trung vào việc thu thập dữ liệu đểkhẳng định lý thuyết ban đầu

Trang 33

5.3.1 CÁC KỸ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)

Lời khuyên: Mô tả tập trung

Cùng với quá trình phân tích dữ liệu cần chú ý: Những dữ liệu phong phú, chi tiết và cụ thể sẽ giúp nghiên cứuđịnh tính

• Cung cấp cho người đọc khả năng hiểu về thực tế, con người và hoàn cảnh cụ thể thông qua cách nghiêncứu bối cảnh

• Các dấu hiệu và ý nghĩa của các sự việc

• Tạo nền tảng cho tất cả các phần trong báo cáo

Trang 34

5.3.1 CÁC KỸ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp theo)

Lời khuyên: Tổ chức dữ liệu

Tổ chức dữ liệu theo hệ thống hợp lý

• Dữ liệu của phương pháp nghiên cứu định tính rất lớn và không có một hệ thống khuôn mẫu rõ ràng nhưtrong nghiên cứu định lượng

• Cần phải hoàn thành quá trình thu thập thông tin đủ và thông tin cần trước khi tiến hành phân tích

• Dữ liệu nên được ghi chép trong một hệ thống bằng việc gán nhãn cho các phần dữ liệu

Lời khuyên: Bảo vệ dữ liệu

Phải có những bản photo dự phòng để ở một nơi khác nhằm giữ an toàn cho dữ liệu tránh khỏi những sự cốđáng tiếc như: Dữ liệu bị làm xáo trộn, bị mất hoặc bị cháy

Trang 35

5.3.1 CÁC KỸ THUẬT PHÂN TÍCH DỮ LIỆU ĐỊNH TÍNH (tiếp)

Quy trình tiến hành phân tích

• Theo Glasser, Strauss và Morse, quá trình phân tích dữ liệu định tính gồm 3 giai đoạn chính như sau:

 Thu gọn dữ liệu: Làm sạch và tổ chức thông tin;

 Thể hiện thông tin: Cô đọng và tổ chức sơ đồ phân tích thông tin;

 Phác thảo phần kết luận và kiểm định kết quả

Thu gọn/làm sạch dữ liệu

Thể hiện thông tinKết luận/kiểm

chứng thông tin

Ngày đăng: 14/05/2021, 21:46

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w