Hôm nay Chuẩn bị dữ liệu Các loại phân tích thống kê Phân tích mô tả Phân tích khác biệt... Sơ đồ tổng quát về chuẩn bị và phân tích dữ liệu Chuẩn hóa Hiệu chỉnh và Mã hóa Nhập l
Trang 1Phương pháp phân tích dữ liệu
Trang 2Hôm nay
Chuẩn bị dữ liệu
Các loại phân tích thống kê
Phân tích mô tả
Phân tích khác biệt
Trang 3Sơ đồ tổng quát về chuẩn bị và phân tích dữ liệu
Chuẩn hóa
Hiệu chỉnh và
Mã hóa Nhập liệu Tóm tắt dữ liệu
Phân tích dữ
liệu
Phân tích thống kê
Phân tích đơn biến, nhị biến
Phân tích
đa biến
Diễn dịch
Chuẩn bị dữ liệu Phát
hiện lỗi
Trang 4Xác nhận tính hợp lý của dữ liệu (Data validation)
Là quy trình xác định cuộc khảo sát, phỏng vấn
hoặc quan sát có được thực hiện đúng hay không
và không có gian lận cũng như sai lệch
Tiếp xúc lại mẫu phỏng vấn nếu trong trường hợp
bị sai lệch để làm cho hợp lý tiến trình thu thập
dữ liệu
Trang 5Hiệu chỉnh dữ liệu (Data Editing)
Là tiến trình kiểm tra các lỗi của dữ liệu
Chính
xác Đối tượng nghiên cứu có thật sự trả lời bảng câu hỏi không?
Hợp lệ Đối tượng nghiên cứu có hiểu hướng dẫn
của bảng câu hỏi
Hoàn
thành
Đối tượng nghiên cứu có trả lời tất cả những câu hỏi trong bảng câu hỏi không?
Trang 6Quan điểm của bạn về bia Heineken là gì?
Rất không
có hương
vị
Rất có hương vị
Heineken là:
Rất không xứng đáng với sự tin cậy chút nào Rất xứng đáng với sự tin cậy
Rất không đáng tin cậy chút nào Rất tin cậy
Trang 7 Anh/chị có kế hoạch chi tiêu như thế nào về các loại thức uống cho một tuần? (tổng số bằng
100%)
Trang 8Mã hóa dữ liệu (Data Coding)
Là một tiến trình của việc nhóm và quy định những
giá trị số học cho những hồi đáp trong bảng câu hỏi
Mã hóa câu hỏi
đóng
Quy định những tên
và giá trị của biến mô
tả
Mã hóa câu hỏi mở
- Tạo ra một bảng danh sách những loại hồi đáp
- Hợp nhất những loại hồi đáp
- Quy định mỗi loại hợp nhất
1 giá trị số học
Trang 11Nhập dữ liệu (Data Entry)
Tạo một bảng tính (spreadsheet) trong SPSS để nhập dữ
liệu
Questionnaire number : cho mỗi bảng câu hỏi
một con số
Name : “Q1”
Type : số hoặc chuỗi (numeric or string)
Label : mô tả biến
Value : quy định những giá trị số học cho các biến mô tả
Missing values : giá trị (“9” or “99”) quy định cho biến
bỏ trống (missing value)
Measure : thang đo tỉ lệ và khoảng (scale); thang đo thứ tự (ordinal); thang đo danh nghĩa (nominal)
Trang 12
Tóm tắt dữ liệu dạng bảng (Data Tabulation)
Đây là một quá trình đơn giản của việc đếm số
lượng các quan sát mà các quan sát này được
phân loại thành các hạng mục nào đó
Bảng đơn(One-way tabulation): sự phân loại
của một biến đơn
Bảng chéo (Cross tabulation): sự phân loại của những biến kép
Trang 13
Bảng đơn
Mức độ thích
thương hiệu
Tần số tuyệt đối
Tần số tương đối (%)
Tần số tích lũy (%)
Rất thích (5) 40 20 20
Thích (4) 100 50 70
Tạm được (3) 30 15 85
Rất ghét (1) 10 5 100
Trang 14Bảng chéo
Mức độ gần gũi
với cửa hàng
Tuổi
<15 15-30 >30
Trang 15Tóm tắt dữ liệu dạng đồ thị
Tiệm tạp hóa 15%
Chợ 25%
Siêu thị 35%
Online
25%
Nơi thường mua dầu gội
Trang 16Sơ đồ tổng quát về chuẩn bị và phân tích dữ liệu
Chuẩn hóa
Hiệu chỉnh và
Mã hóa Nhập liệu
Đưa dữ liệu vào bảng Phân tích dữ
liệu
Phân tích thống kê
Phân tích đơn biến, nhị biến
Phân tích
đa biến
Diễn dịch
Chuẩn bị dữ liệu Phát
hiện lỗi
Trang 17Các loại phân tích thống kê
Thống kê mô tả (Descriptive analysis)
mô tả những đặc điểm chính của dữ liệu
Kiểm định sự khác biệt (Test of Differences) kiểm định sự khác biệt của
trung bình
Kiểm định sự liên kết (Test of Association) xác định mối quan hệ giữa
các biến
Kiểm định sự phụ thuộc lẫn nhau (Test for Interdependence) để tóm tắt thông tin
dữ liệu bằng việc nhóm các biến hoặc nhóm các đối tượng
Trang 18Phân tích mô tả
Trang 19Phân tích mô tả
Là bước đầu tiên của phân tích dữ liệu
Cung cấp những tóm tắt cơ bản về mẫu và các hồi
đáp
Đo lường khuynh hướng tập trung (Measures of central tendency) (Mode, Median, Mean)
Tóm tắt các hồi đáp điển hình
Đo lường tính biến thiên (Measures of variability) (frequency, range, standard deviation)
Đo lường sự đa dạng của hồi đáp
Trang 20
Đo lường khuynh hướng trung tâm
Mức độ đo lường càng cao
Nhiều phân tích hơn được sử
dụng
Tóm tắt những trả lời đặc trưng Mean Median
Mode
danh
Dữ liệu thứ tự
Dữ liệu tỉ lệ