Phân tích dữ liệu phải đáp ứng được những mục tiêu: Giúp xác định nội dung hay chủ đề Mô tả lại được đối tượng nghiên cứu và các yếu tố liên quan Có phân tích so sánh theo thời gian
Trang 1Giảng viên: Đàm Sơn Toại
Email: toaids@neu.edu.vn
Bài giảng được soạn bởi PGS.TS Lê Quang Cảnh
CHƯƠNG 5 PHÂN TÍCH DỮ LIỆU
Trang 2 Giới thiệu về phân tích dữ liệu
Các dạng phân tích dữ liệu
Phân tích dữ liệu định tính
Phân tích dữ liệu định lượng
Nội dung:
Trang 3Dân số (triệu người)
Tính tốc độ tăng trưởng dân số của Việt Nam theo từng thời kỳ.
Trang 4Thông tin gì từ dữ liệu này?
Trang 5Thông tin gì từ dữ liệu này?
Trang 6 Khi muốn đánh giá tình hình thực hiện kế hoạch của một huyện
Nghiên cứu ví dụ:
Kế hoạchQI-2014
Thực hiệnQ1-2015
Kế hoạchQ1-2015 (%)
Trang 71 Giới thiệu phân tích dữ liệu
Trang 8 Khái niệm: sử dụng công cụ để diễn giải ý nghĩa của dữ liệuhay thông tin chứa đựng sau dữ liệu
Cần có công cụ/kỹ thuật/phương pháp
Phát hiện được thông tin/ý nghĩa đằng sau dữ liệu
Kỹ thuật và phương pháp phân tích dữ liệu phụ thuộc vào dạng
Trang 9 Nội dung của phân tích dữ liệu bao gồm:
Xác định phương pháp và thủ tục phân tích dữ liệu,
Luận giải kết quả hoặc phát hiện từ dữ liệu,
Phác thảo kết quả phân tích
Quy trình của phân tích
Nhập dữ liệu: (mã hóa, nhập và làm sạch dữ liệu)
Xử lý làm nổi bật thông tin dữ liệu chứa đựng
Luận giải kết quả phân tích
1 Giới thiệu phân tích dữ liệu: Nội dung và quy trình
Trang 10 Phân tích dữ liệu phải đáp ứng được những
mục tiêu:
Giúp xác định nội dung hay chủ đề
Mô tả lại được đối tượng nghiên cứu và các yếu tố liên quan
Có phân tích so sánh theo thời gian hoặc không
gian
Phục vụ cho việc phát hiện ý nghĩa của dữ liệu
Cung cấp được dẫn chứng kiểm định giả thuyết
Trang 112 Các dạng phân tích dữ liệu
Trang 12 Phân theo nội dung
Phân tích khám phá
Phân tích xu thế (theo thời gian)
Phân tích theo không gian
Phân tích tương quan và tác động
Phân theo dạng dữ liệu
Phân tích dữ liệu định tính
Phân tích dữ liệu định lượng
2 Các dạng phân tích dữ liệu
Trang 13 Mỗi đối tượng nghiên cứu luôn có mối quan hệ với các đối
tượng khác
Một đặc điểm của đối tượng nghiên cứu lại có thể được mô
tả/đo lường theo nhiều cách khác nhau hoặc chỉ tiêu khác nhau
Phân tích khám phá sẽ giúp hiểu đối tượng nghiên cứu và giúp rút gọn dữ liệu phục vụ cho nghiên cứu:
Dựa trên mối liên hệ giữa các biến/đặc điểm
Những đặc điểm hay biến tương đồng có thể được rút gọn lại
Ví dụ: Tìm hiểu các nguyên nhân phá rừng HOẶC
2 Các dạng phân tích dữ liệu: phân tích phát khám phá
Trang 14hiện-2 Các dạng phân tích dữ liệu: phân tích khám phá
Hãy sáp xêp các guong mat theo cách nhóm khác nhau!
Trang 15 Mỗi đối tượng nghiên cứu luôn biến động theo thời gian
Khi phân tích theo thời gian, sẽ:
Cho biết xu thế vận động và phát triển
Cho phép so sánh sự thay đổi theo thời gian
Tốc độ tăng trưởng
Cung cấp các dẫn chứng luận giải hoặc dự báo
2 Các dạng phân tích dữ liệu: phân tích theo thời gian
Trang 16 Đối tượng nghiên cứu luôn thuộc trong không gian nhất định nào đó, trong đó có liên hệ với các bộ phận khác để hình thành lên tổng thể/hệ thống
Ví dụ: Khi nghiên cứu GDP của ngành Nông nghiệp,
Phân tích theo không gian cho biết cơ cấu hay vị thế của đối tượng nghiên cứu trong tổng thể hoặc hệ thống
Ví dụ:
2 Các dạng phân tích dữ liệu: phân tích theo không gian
Trang 172 Các dạng phân tích dữ liệu: phân tích theo không gian
GDP của Việt Nam trong năm 2013, theo
giá cố định 2010
Làm thế nào để biết thêm các thông tin từ
dữ liệu này?
2013 Tổng 2543596 Nông nghiệp 446905 Công nghiệp 981146 Dịch vụ 1115545
17.6
38.6 43.9
Trang 18 Đối tượng nghiên cứu luôn có mối quan hệ với các biến hay chỉ tiêu kinh tế xã hội khác.
Ví dụ: giữa thời gian học và kết quả thi hết môn
2 Các dạng phân tích dữ liệu: phân tích tương
quan và tác động
Sinh viên
Thời gian học Kết quả thi
Trang 193 Phân tích dữ liệu định tính
Trang 21 Phân tích dữ liệu định tính là quá trình:
Nghiên cứu các dữ liệu dạng chữ, lời nói, hình ảnh, âm
thanh,… mà nhà nghiên cứu quan sát thấy
Đặc điểm của người trả lời, sự đồng ý hoặc từ chối trả lời về những vấn đề cụ thể
Nghiên cứu có thể phân tích và sắp xếp lại các dữ liệu dạng chữ nhằm giúp người đọc hiểu được ý nghĩa sâu xa của
những dữ liệu hay những thông tin mà dữ liệu ẩn chứa
3.1 Phân tích dữ liệu định tính: khái niệm
Trang 223.1 Phân tích dữ liệu định tính: Khái niệm
Kỹ năng/ kinh nghiệm
Trực giác/cảm giác Nhạy bén
Có thể sử dụng các bản hướng dẫn với điều kiện phải rất linh hoạt
Trang 23 Phân tích dữ liệu định tính dạng chữ
Phân tích những từ ngữ quan trọng trong hoàn cảnh cụ thể (KWIC)
Đếm từ
Phân tích những mạng lưới có ý nghĩa
Phân tích dữ liệu dạng mã hóa
Trang 243.3 Phân tích dữ liệu định tính: Quy trình
Thể hiện thông tin
Kết luận/
Kiểm chứng thông tin
Thu gọn/làm sạch
dữ liệu
Trang 25 Nhập và lưu trữ dữ liệu ban đầu
Các dữ liệu định tính thương lưu trữ đặc tính về đối tượng nghiên cứu thu thập được từ: ghi âm, phỏng vấn, thảo luận nhóm, quan sát
Tùy mục đích sử dụng dữ liệu mà có thể sử dụng phương pháp xử
Phát hiện thông tin đằng sau dữ liệu và sắp xếp thông tin
3.3 Phân tích dữ liệu định tính: Quy trình
Trang 26 Kết luận và kiểm chứng thông tin
Đưa ra kết luận những thông tin mà dữ liệu chưa đựng
Kiểm chứng lại thông tin (nếu thấy cần thiết)
Lồng ghép thông tin vào trả lời câu hỏi nghiên cứu
3.3 Phân tích dữ liệu định tính: Quy trình
Trang 27 Mang tính chủ quan: phục thuộc vào con người
Thiếu rõ ràng: “anh rút ra được, tôi chịu!”
Khó có thể lặp lại
Không thể tổng hợp và suy diễn cho tổng thể3.4 Phân tích dữ liệu định tính: Lưu ý
Trang 284 Phân tích dữ liệu định lượng
Trang 29 Phân tích dữ liệu định lượng là quá trình:
Xử lý và phân tích các số liệu nhà nghiên cứu thu thập được
Phục vụ cho các nghiên cứu sử dụng phương pháp định lượng
Kết quả phân tích định lượng có thể hỗ trợ tích cực cho phân tích định tính
4.1 Phân tích dữ liệu định lượng: khái niệm
Trang 30 Dữ liệu định lượng có thể tồn tại dưới nhiều dạng khác nhau
Số liệu
Các dữ liệu được số hóa: ví dụ đặc điểm giới tính được mã hóa
Các dạng đo lường sử dụng trong phân tích dữ liệu định lượng
Thang đo thông thường-định danh (nominal scale)
Thang đo khoảng (interval scale): đo số lượng với khoảng cách tương đồng nhau
Thang đo thứ tự (ordinal scale): đo lường các mức độ theo một trật tự nhưng không nhất thiết là cùng khoảng cách tương đồng
Ví du: (rất tệ, tệ, trung bình, tốt, rất tốt),….
4.1 Phân tích dữ liệu định lượng: Các dạng đo
lường định lượng
Trang 31 Trả lời cho các câu hỏi số lượng: bao nhiêu, thay đổi thế nào?
Cho biết tương quan giữa các biến
Ví dụ: biến đổi khí hậu với sản lượng, hay thời gian học với kết quả học tập,…
Kiểm định các giả thuyết
Kiểm định: càng công khai minh bạch thì tham những càng thấp
4.1 Phân tích dữ liệu định lượng: Để làm gì
Trang 32 Chuẩn bị và kiểm tra dữ liệu
Khám phá và phân tích dữ liệu
Trình bày kết quả phân tích
4.1 Phân tích dữ liệu định lượng: Quy trình
Trang 33 Các loại dữ liệu sử dụng cho phân tích định lượng
Số liệu
Các dữ liệu có thể được mã hóa theo các thang đo định lượng
Dữ liệu định lượng cần thu thập đảm bảo yêu cầu ở chương 4:
Dữ liệu cần chính xác và tin cậy (đầy đủ, thích hợp, thống nhất, cập nhật)
Mã hóa dữ liệu
Với các dữ liệu không phải ở dạng số, cần được mã hóa
Chuẩn bị mã (ví dụ: giới tính nam =1 , nữ =2,….)
Lưu lại các mã để sử dụng về sau
4.2 Chuẩn bị và kiểm tra dữ liệu
Trang 34 Nhập dữ liệu
Cần thống nhất cách hiểu chung về nhập dữ liệu
Nhập dữ liệu theo mã đã quy định
Kiểm tra dữ liệu đã nhập
Mục tiêu để tăng độ chính xác và trung thực của nhập dữ liệu
Tiến hành: kiểm tra độc lập hoặc
Yêu cầu nhập hai người độc lập ở bước trên
Khẳng định file số liệu sử dụng cho phân tích
4.2 Chuẩn bị và kiểm tra dữ liệu
Trang 35 Phân tích thống kê mô tả
Cung cấp các dẫn chứng trả lời các câu hỏi nghiên
Trang 36 Phân tích thống kê mô tả
Mô tả các chỉ tiêu cơ bản của biến số hay chỉ tiêu thống kê
Cung cấp hiểu biết cơ bản về biến hay chỉ tiêu thống kê đó
Các chỉ số thống kê mô tả cơ bản
Số quan sát có trong dữ liệu
Giá trị đại diện của biến: Trung bình, trung vị, min, max, tần số, tần suất,
Độ biến thiên của các quan sát: độ lệch chuẩn, phương sai, khoảng biến thiên
4.3 Phân tích số liệu
Trang 38 Phân tích sự khác biệt và tương quan
So sánh giữa các nhóm: tương đồng và khác biệt
Cung cấp thêm các thông tin cho các nhận định trong nghiên cứu
Các cách cơ bản
So sánh các biến hoặc các nhóm (so sánh giá trị cụ thể, so sánh tỷ lệ, so sánh xu thế, so sánh tổng số, so sánh phân bố, thể hiện quan hệ giữa các biến,…)
Hệ số tương quan giữa các biến
Đo tác động (hồi quy), độ xác định
Kiểm định sự khác biệt giữa các nhóm (t-test hoặc ANOVA)
4.3 Phân tích số liệu
Trang 39 Phân tích xu thế (theo thời gian)
Cho biết được sự vận động của đối tượng/biến theo thời gian
Có thể tính tốc độ tăng trưởng nhanh hay chậm, xu thế vận động
Để phục vụ cho
Tính toán sự thay đổi và tốc độ thay đổi theo thời gian
Cho phép so sánh tốc độ/sự thay đổi theo thời gian
So sánh thực hiện kế hoạch
Phát hiện xu thế vận động và dự báo
4.3 Phân tích số liệu
Trang 40 Trình bày kết quả phân tích dữ liệu định lượng
Thể hiện kết quả dưới dạng có thể truyền tải thông tin từ dữ liệu
Thân thiện với người đọc
Trang 41 Trình bày kết quả phân tích dữ liệu định lượng
Dưới dạng bảng 2 chiều (tại một thời điểm theo các đối tượng khác nhau)
4.3 Phân tích số liệu
GDP bình quân đầu người
Tỷ lệ hộ nghèo
Tốc độ tăng trưởng
Trang 42 Trình bày kết quả phân tích dữ liệu định tính
Dưới dạng bảng 3 chiều (tại 1 thời điểm)
Trang 43 Trình bày kết quả phân tích dữ liệu định lượng
Dưới dạng hình
Biến động theo thời gian (line)
4.3 Phân tích số liệu
0 1 2 3 4 5 6 7 8 9 10
Trang 44 Trình bày kết quả phân tích dữ liệu định tính
Nông nghiệp Công nghiệp Dịch vụ
Trang 46Thank you!