1. Trang chủ
  2. » Luận Văn - Báo Cáo

chuong6 phương pháp nghiên cứu khoa học

84 487 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 84
Dung lượng 4,95 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

` Biến đo bằng thang thứ tự ordinal◦ Dùng chi-square test để so sánh phân phối các loại categories của mẫu và kỳ vọng của tổng thể Các bước tiến hành ◦ Nghĩa là có sự khác biệt giữa phân

Trang 1

PHÂN TÍCH DỮ LIỆU

Trang 4

Hiệu chỉnh (Editing)

Mã hoá (Coding)

Tạo tập tin dữ liệu

Trang 5

` Mục đích

™ Đúng thủ tục/đối tượng phỏng vấn (legibility)

™ Xử lý các phỏng vấn/trả lời không hoàn chỉnh

(completeness)

™ Tính nhất quán của các trả lời (consistency)

™ Sự chính xác của các trả lời (accuracy)

™ Sự rõ ràng của các trả lời (clarification)

Trang 6

` Quá trình

Hiệu chỉnh sơ bộ (field editing):

• Thực hiện bởi interviewer

• Càng sớm càng tốt sau khi phỏng vấn xong

Hiệu chỉnh cuối cùng (office editing):

• Thực hiện bởi editor

• Sau khi thu thập xong data

• Đòi hỏi người hiệu chỉnh phải có nhiều kinh nghiệm,

kiến thức

Trang 7

` Xử lý khi phát hiện lỗi

™ Liên lạc trở lại để bổ sung hoặc làm rõ

™ Hiệu chỉnh, làm rõ hoặc bổ sung theo trí nhớ

hoặc các cứ liệu/suy luận khác

™ Hủy bỏ một số câu trả lời (missing value)

™ Hủy hoàn toàn cuộc phỏng vấn/questionnaire

Trang 8

Là quá trình gán mã số (số hoặc nhãn) cho các biến

và các trả lời.

Thang đo của biến tùy thuộc vào cách hỏi và bản chất của biến được hỏi.

Trang 9

` Các bước mã hoá

◦ Đặt tên biến cho các câu hỏi

x Câu hỏi 1 chọn lựa

x Câu hỏi nhiều chọn lựa

◦ Chuyển tập các chọn lựa trả lời của mỗi câu hỏi thànhtập các số/nhãn phù hợp, có ý nghĩa

x Câu hỏi đóng

x Câu hỏi mở

x Câu hỏi có chọn lựa: “Khác”

x Hai trường hợp “Không biết”

Trang 11

Cách phân loại/ nhóm phải phù hợp với vấn đề/ mục tiêu nghiên cứu.

Thí dụ: Thông tin cá nhân

hoặc doanh nghiệp.

Tuổi <18 18-30 … ?

<16 16-25 … ?

Tính phù hợp

(appropriateness)

Trang 13

Mỗi trả lời chỉ tương ứng với một mã số.

Tính loại trừ nhau

(mutual exclusivity)

Thí dụ: quốc doanh, tư

nhân, TNHH, cổ phần ??

Trang 14

Mỗi câu trả lời ứng với

một thứ nguyên duy

nhất.

Tính đơn nguyên

(unidimensionality)

Trang 15

‰ Nhập dữ liệu vào file (SPSS)

‰ Cải biến tập dữ liệu

‰ Tạo biến mới, biến trung gian, v.v.

‰ Xử lý missing value

Thí dụ về data file

Trang 17

Tổng quan về phân tích dữ liệu Tổng quát về phân tích đơn biến Thống kê mô tả

Kiểm nghiệm giả thuyết đơn biến

Trang 18

` Chọn phương pháp phân tích đơn biến nào?

Trang 19

Bao nhiêu biến được phân tích đồng thời

Phân tích

đơn biến

Phân tích nhị biến

Trang 20

Phân tích đơn biến

Chi – square

test

Kolmogorov– Smirnov

test

Yếu vịTần suất

Trung vịKhoảng/

phần trăm

Z test/ t test

Trung bìnhPhương sai

Thang đocủa biến

Thứ tự

Chỉ danhKhoảng

MÔ TẢ

SUY

ĐOÁN

Trang 22

` Lợi ích của biến chỉ danh, thứ tự:

™ Trình bày phân phối dữ liệu của một biến có

thang đo nominal hoặc ordinal.

™ Phát hiện một số dạng sai sót khi mã hoá.

™ So sánh với các phân phối/ dữ liệu có liên quan.

™ Đề nghị những phương pháp biến đổi các biến

™ Kiểm tra sampling.

Trang 24

Kiểm chứng xem những phát biểu nào đó có thích hợp cho tổng thể nghiên cứu hay không.

• TD: Bình quân tuổi của 100 SV trong mẫu là Ā =

24 (s=5) Nhà NC muốn kiểm chứng cho tổng thể:

• Null hypothesis Ho: µ = 23

• Alternative hypothesis H1: µ ≠ 23

Các phân tích liên quan đến kiểm nghiệm giả thuyết gọi là phân tích suy luận (inferential analysis).

Trang 25

• Tính (tra bảng) giá trị test tới hạn (critical value) ứng với

α (one/ two tailed)

Trang 26

` Biến đo bằng thang khoảng (interval)

Có thể dùng t Test hoặc Z Test để test giá trị trung bình của tổng thể khi biết giá trị trung bình của mẫu

Trang 27

Thí dụ (tiếp theo thí dụ trên)

` Bình quân tuổi của 100 SV trong mẫu là Ā = 24 (s=5) Nhà NC muốn kiểm chứng cho tổng thể:

Null hypothesis Ho: µ = 23

Alternative hypothesis H1: µ ≠ 23

x Do n = 100 > 30 nên dùng Z test

x Chọn mức ý nghĩa α = 0.05 (two tailed) Æ Z c = 1.96

x Tính Z khi chưa biết σ : Z = (Ā - µ) n 1/2 /s

= (24 - 23) x 100 1/2 /5 = 2

x Z = 2 > Zc = 1.96 Î loại Ho

Î Không thể kết luận (với significant 5%) là µ = 23

Lưu ý: Nếu biến tỉ lệ thì Z = (p - π)/ (pq/ n) 1/2

Trang 28

` Biến đo bằng thang thứ tự (ordinal)

◦ Dùng chi-square test để so sánh phân phối các loại

(categories) của mẫu và kỳ vọng của tổng thể

Các bước tiến hành

Trang 29

“Bác bỏ H0- nếu (tínhđược) > (tới hạn)”.

B3. Tra bảng Square chuẩn Î

E

E O

1

2

χ O i: Số lần xuất hiện loại i trong mẫu

E i: Giá trị kỳ vọng của số lần xuất hiện

Trang 30

` Biến đo bằng thang thứ tự (ordinal)

◦ Dùng chi-square test để so sánh phân phối các loại

(categories) của mẫu và kỳ vọng của tổng thể

Các bước tiến hành

◦ Nghĩa là có sự khác biệt giữa phân phối của mẫu và

phân phối của tổng thể

◦ Kiểm định Chi-Square không có ý nghĩa khi số lần

xuất hiện kỳ vọng cho mỗi lựa chọn < 5

Trang 31

` Thí dụ: Khảo sát 100 người đang sử dụng

25252525

-10-5510

1002525100

4114

Trang 32

Thí dụ: Khảo sát 100 người đang sử dụng internet ở HCMC (n = 100)

` Cột 1: Phân bố nghề nghiệp của những người sử

dụng internet.

` Cột 2: Phân bố kỳ vọng (bằng nhau cho các nhóm)

` Ho: Không có sự khác nhau về nghề nghiệp của

Trang 34

Bảng 2 chiều (Two – way Tabulation)

™ Khảo sát mức độ và các mối liên hệ (có thể có)

giữa các cặp biến.

™ Thích hợp cho các trường hợp số loại trong mỗi

biến không lớn, thang đo nominal hoặc ordinal.

™ Chỉ định hướng, không kết luận về mối quan hệ

nhân quả giữa các biến.

™ Kết quả có thể bị lệch nếu các ô có giá trị nhỏ.

Trang 35

Function group Total

Trang 36

Phương pháp Áp dụng Minh họa

Hồi quy

đơn giản

Xây dựng một hàm tuyến tính giữa

2 biến metric

(phụ thuộc nhau)

Doanh thu (đồng) theo chiphí khuyến mãi

Trang 37

Chi – Square contingency test

¾ Mục đích:

ƒ Xác định sự tồn tại mối quan hệ giữa 2 biến danh

định.

¾ Yêu cầu:

ƒ Không có ô nào có số lần xuất hiện kỳ vọng < 1

ƒ Không quá 1/5 tổng số ô có số lần xuất hiện < 5

¾ Hạn chế:

ƒ Chỉ xác định có quan hệ hay không, không cho

biết mức độ quan hệ.

Trang 38

Hệ số Contingency thường được bổ sung vào kiểm nghiệm Chi-Square để biết mức độ quan hệ giữa 2 biến.

) 1 (

2

=

f n

C = 0: không có quan hệ

C không có chặn trên Î khó diễn dịch

V = 0: không có quan hệ

V = 1: có quan hệ hoàn hảo

Nên trong thực tế hay dùng hệ số thống kê Cramer

Trang 39

Thí dụ: Kết quả khảo sát nhãn hiệu Bia ưa thích

nhất phân theo mức thu nhập.

Thu nhập Nhãn hiệu bia ưa thích nhất Tổng

(109.38)

200(101.56)

50

Trang 40

` Ghi chú: Con số trong ngoặc chỉ giá trị kỳ vọng của mỗi ô

trong bảng Chúng được xác định theo tỉ lệ với tổng về thunhập và loại bia ưa thích

(Ô 1-1 có giá trị kỳ vọng = 350 x 375 / 1200 = 109.38)

Tính

Kết quả : = 252.2

Df = (k-1)(l-1) = (3-1)(3-1) = 4Nếu chọn α = 1% thì = 13.3 (tra bảng)

l

E O

1

2 1

Trang 41

Hệ số tương quan Spearman và Pearson

` Spearman: tương quan giữa 2 biến thứ tự (ordinal)

` Pearson: tương quan giữa các biến khoảng/ tỉ lệ.

Hệ số tương quan r = 0 Æ 1 (không kể dấu +/-)

r > 0.8 rất mạnh

r = 0.6 – 0.8 mạnh

r = 0.4 – 0.6 có tương quan

r = 0.2 – 0.4 tương quan yếu

r < 0.2 không tương quan

Trang 42

Lưu ý:

` Hai biến phải có phân phối chuẩn nhị biến.

` Phương sai của 1 biến tại bất kỳ giá trị nào của

biến kia cũng phải bằng nhau.

` Khi r nhỏ không có nghĩa là không tương quan, mà

chỉ không tương quan tuyến tính.

` Khi |r| lớn chỉ cho thấy mối tương quan, nhưng

không xác định quan hệ nhân quả.

Trang 43

` Phân tích hồi quy tuyến tính đơn

◦ Phân tích 2 biến khoảng/ tỉ lệ: Hồi quy tuyến tính đơn

Y = aX + b

◦ Sự khác biệt giữa hồi quy tương quan

Hồi quy tuyến tính

Tạo ra một phươngtrình toán học liên kếtcác biến lại

Tồn tại giả thiết nhân –quả: Biến độc lập –Biến phụ thuộc

Tương quan

Phát hiện ra mức độtương quan giữa

2 biếnKhông có giả thiết vềnhân quả

Trang 45

Phân tích phụ thuộc

• Xác định được biến nào là phụ thuộc, biến nào là độc lập

• Bao gồm các phương pháp: phân tích hồi quy đa biến,

ANOVA, Conjoint, Discriminant, Canonical analysis

Trang 46

Phương pháp Thang đo của biến

Phụ thuộc Độc lập

Một biến phụ thuộc

Hồi quy bội - biến dummy Interval Nominal

Discriminant analysis Nominal Interval

Conjoint analysis Ordinal Nominal

Các phương pháp phân tích phụ thuộc – Yêu cầu về thang đo

Trang 47

Phương pháp Thang đo của biến

Phụ thuộc Độc lập

Hai biến phụ thuộc trở lên

Canonical analysis Interval Interval

Mạng lưới của nhiều biến phụ thuộc và độc lập

Structural Equation Modeling

Các phương pháp phân tích phụ thuộc – Yêu cầu về thang đo

Trang 48

` HỒI QUY TUYẾN TÍNH BỘI

y = a1X1 + a2X2 + a3X3 + anXn + b

™ Dạng mở rộng của hồi quy đơn

™ Một biến phụ thuộc, nhiều biến độc lập.

™ Tất cả được đo bằng thang interval (ngoại lệ:

dummy-variable multiple regression)

Trang 49

Đánh giá mô hình và kết quả hồi quy theo 3 phần:

¾ Mức độ phù hợp của phương trình hồi quy:

9 Dùng hệ số r 2 (coefficient of determination)

9 r2 = 0 ÷ 1 Î đặc trưng cho % của biến thiên trong

biến phụ thuộc được giải thích do sự biến thiên củabiến độc lập

¾ Kiểm nghiệm mức ý nghĩa của r2:

9 Dùng F – test, với độ tự do: df = n – k – 1 cho mẫu

số và df = k cho tử số (n: cỡ mẫu, k: số biến độc lập)

¾ Kiểm nghiệm mức ý nghĩa của các độ dốc ai:

9 Dùng t – test với độ tự do df = n – k – 1

Trang 50

Kiểm nghiệm các giả thuyết của phương pháp hồi quy

Linearity

Đa cộng tuyến (Multicolinearity)

Phân phối chuẩn (Normality) của sai số và mỗi biến

Sai số hồi quy có variance không đổi

Tính độc lập của các sai số hồi quy

Trang 52

Đa cộng tuyến (Multicolinearity)

‰ Giả thuyết: các biến độc lập không có tương quan tuyến tính với nhau

‰ Khi bị vi phạm Æ Có hiện tượng đa cộng tuyến, nghĩa là hiện hữu mối tương quan tuyến tính giữa ≥ 2 biến độc lập

‰ Đa cộng tuyến gây ra:

9 Hạn chế giá trị r2

9 Sai lệch/ đổi dấu các hệ số hồi quy

‰ Test đa cộng tuyến: hệ số Tolerance hoặc VIF

Trang 53

Một số lưu ý khi sử dụng multiple regression:

™ Phân tích hồi quy tuyến tính chỉ có nghĩa khi có tươngquan TUYẾN TÍNH giữa các biến

™ r2 không nói lên được quan hệ nhân quả giữa các biến

™ Có thể dự đoán sai nếu nằm ngoài khoản tính toán

™ Để đảm bảo độ tin cậy phải có nhiều hơn 10 điểm cho mỗibiến độc lập đưa vào phương trình (Æ yêu cầu cỡ mẫu)

™ Khoảng dao động (range) các biến có thể ảnh hưởng đến ýnghĩa phương trình hồi quy

™ Trường hợp biến độc lập là nominal thì có thể sử dụngdummy-variable Khi đó:

™ Số biến dummy = k-1; với k = số loại của biến nominal

™ Mỗi biến dummy chỉ nhận giá trị 0 hoặc 1

Trang 54

Thí dụ:

Bài toán tìm các yếu tố quyết định sự thỏa mãn của nhân viên trong Cty XYZ.

‰ Biến phụ thuộc: sự thỏa mãn của nhân viên Cty

‰ Biến độc lập: thu nhập, điều kiện làm việc, sự quantâm của cấp trên, quan hệ với đồng nghiệp, cơ hộithăng tiến, cơ hội học tập, v.v

Trang 56

` ANOVA – ANALYSIS OF VARIANCE

Trang 57

` ANOVA – ANALYSIS OF VARIANCE

Trang 58

` ANOVA – ANALYSIS OF VARIANCE

Khảo sát mối quan hệ giữa các biến độc lập

và phụ thuộc

Trang 59

` ANOVA – ANALYSIS OF VARIANCE

Tương tự như phân tích hồi quy,

nhưng các biến độc lập là biến nonmetric (nominal/ ordinal)

Trang 60

` ANOVA – ANALYSIS OF VARIANCE

So sánh giá trị trung bình của một thuộc tính (biến phụ thuộc/ thang metric) thể hiện ảnh hưởng của một hay nhiều thuộc tính khác (biến độc lập/thang nonmetric)

Trang 61

` ANOVA – ANALYSIS OF VARIANCE

™ Nếu có nhiều biến độc lập với thang chỉ danh gọi là

Factorial ANOVA

™ Nguyên tắc: Nếu có sự khác biệt đáng kể giữa các

nhóm thì “between-group variance > within-group variance”

™ ANCOVA: có xét đến các ảnh hưởng của một haynhiều biến ngoại lai (gọi là control variable hoặc covariates

- thang đo metric) và sẽ loại ra khỏi tập biến phụ thuộctrước khi phân tích ANOVA

™ MANOVA nếu có nhiều biến phụ thuộc

™ MANCOVA có nhiều biến phụ thuộc và biến kiểm soát

Trang 62

Thí dụ:

` Khảo sát 200 doanh nghiệp thuộc 3 ngành May

mặc, Mỹ phẩm và Nhựa gia dụng về chi phí dành cho khuyến mãi hằng năm.

` Mục đích phân tích nhằm tìm xem có sự khác

nhau đáng kể/ có ý nghĩa thống kê giữa 3 ngành này về chi phí khuyến mãi không?

Trang 63

Cty Ngành Chi phí KM

(1000 USD)

1234 199200

MayMay

Mỹ phẩmNhựa NhựaMay

1232351346876 6812

Trang 64

` Bài toán này có thể so sánh giá trị trung bình của

chi phí khuyến mãi theo từng cặp ngành (dùng t – test) Tuy nhiên, khi số treatment lớn Î số lượng

Trang 65

có thang nonmetric.

Trang 66

Thí dụ:

Công ty máy tính muốn biết xem thu nhập gia đình (X1)

và số năm học ở trường của chủ hộ (X2) có phải là hữuích trong việc phân biệt hộ có mua máy tính PC haykhông Khảo sát X1 và X2 của 2 nhóm mẫu ngẫu nhiên(có và không có PC)

` Biến độc lập: X1 – thu nhập,

X2 – số năm học : metric

` Biến phụ thuộc: Có PC, Không có PC: category.

` Kết quả sẽ là hàm phân biệt: Y= v 1 X 1 + v 2 X 2

v 1 , v 2 : trọng số phân biệt (hằng số) Y: điểm phân biệt

So sánh Yi và Yc

Î Phần tử i sẽ thuộc nhóm nào trong 2 nhóm mẫu trên

Trang 67

` CONJOINT ANALYSIS

Trang 68

` CONJOINT ANALYSIS

Phân tích ảnh hưởng tổng hợp (joint effects) của 2 haynhiều biến độc lập (thang nominal) lên một biến phụthuộc (utility score - thang đo ordinal)

Mục đích

Trang 69

` CONJOINT ANALYSIS

Áp dụng

Thường dùng trong test sản phẩm với nhiều yếu tố khácnhau (chất lượng, kiểu dáng, giá bán, nhãn hiệu, v.v.).Mỗi yếu tố có vài phương án khác nhau Tìm xem tổhợp nào được ưa thích nhất

Trang 70

` CONJOINT ANALYSIS – ÁP DỤNG

‰ Nhà NC tạo ra một tập các phương án sản phẩm Mỗi

phương án là 1 tổ hợp của các yếu tố

‰ Tập các phương án này được đưa cho đối tượng chọn/

xếp hạng (hoặc cho điểm thể hiện mức ưa thích)

‰ Conjoint analysis sẽ đánh giá ảnh hưởng của các utility

score thành phần (hay part-worths, tượng trưng cho

mức độ quan trọng của mỗi yếu tố) lên sự ưa thích tổng hợp (utility) đối với một sản phẩm

Trang 72

Thí dụ:

Thiết kế sản phẩm mới có 3 thuộc tính:

` Giá : (cao, trung bình, thấp)

` Kiểu dáng : (cao, trung bình, thấp)

` Chức năng : (đơn giản, phức tạp)

Î Chỉ cần đánh giá 1 nhóm khoảng 8 tổ hợp (thay vì

18 tổ hợp) về tính hấp dẫn của sản phẩm đối với khách hàng.

Trang 73

Thí dụ:

Nhà nghiên cứu

Tầm quan trọng của mỗi thuộc tính

Tầm quan trọng của mỗi mức độ trong các thuộc tính

Tạo ra sản phẩm có độ

vị lợi cao nhất đối với người mua.

Trang 74

Phân tích phụ thuộc

Phân tích tương tác

Trang 75

` FACTOR ANALYSIS (PHÂN TÍCH NHÂN TỐ)

Là phép rút gọn dữ liệu và biến bằng cách nhóm chúng lại với các nhân tố đại diện

Điều kiện: các biến phải có thang đo metric

• Xây dựng bộ thang đo Multiple – item

• Xác định cấu trúc bộ dữ liệu

• Giảm thứ nguyên trong tập dữ liệu, rút gọn dữ liệuỨng dụng

Trang 76

Thí dụ:

123

…n

Trang 77

` CLUSTER ANALYSIS (PHÂN TÍCH NHÓM)

Mục tiêu

Phân chia các đối tượng/ người thành các nhóm với các thành viên trong nhóm có các đặc trưng tương tự.

Phân loại hành vi mua (Typology)

Trang 78

` CLUSTER ANALYSIS (PHÂN TÍCH NHÓM)

Quá trình thực hiện

Xác định các biến làm cơ sở để phân nhóm

Phần chia các nhóm dựa trên sự tương tự

Đặc tên nhóm dựa theo đặc điểm chung của các thuộc tính (các biến cơ sở)

Chuẩn định (Validation) và mô tả đặc trưng (profiling)

Trang 79

Thí dụ: Cluster analysis để phân khúc thị trường

Yêu cầu thang đo: metric

Công ty TICO: Xác định các Nhóm Khách Hàng khác

nhau căn cứ trên hành vi mua.

“Hãy đánh giá mức độ quan trọng của các yếu tố sau đây trong quyết định mua hàng của Ông/ Bà”

Trang 80

Thí dụ: Cluster analysis để phân khúc thị trường

` Hơn 300 khách hàng được khảo sát

` Nhận dạng ra các nhóm khác nhau

` Trong mỗi nhóm có sự tương tự nhau về tầm quantrọng của các yếu tố (X1 Î X5) ảnh hưởng đến quyếtđịnh mua

Nhóm 1

Khách hàng trẻ, thu nhập cao, ở TP

Nhóm 2

Khách hàng công nghiệp – sản xuất

Trang 81

MULTIDIMENTIONAL SCALING (perceptual mapping)

nguyên (dimensions) đặc trưng cho nhận thức/ đánh giácủa khách hàng về các đối tượng

™ Trong MR: Thường được sử dụng trong bài toán xác định

vị trí tương đối (relative position) của các nhãn hiệu cạnhtranh nhau do phản hồi từ phía khách hàng

™ Xác định những yếu tố đặc trưng cho việc đánh giá của

khách hàng

™ Là phương pháp ngược với Cluster

Trang 82

• Gộp các đối tượng

thành các nhóm theo 1 số đặc tính tượng tự nhau

Trang 84

KỸ THUẬT ĐO VÀ THU THẬP DỮ LIỆU

Ngày đăng: 20/07/2016, 10:09

HÌNH ẢNH LIÊN QUAN

Bảng 2 chiều (Two – way Tabulation) - chuong6 phương pháp nghiên cứu khoa học
Bảng 2 chiều (Two – way Tabulation) (Trang 34)

TỪ KHÓA LIÊN QUAN

w