Bảng câu hỏi mẫu khảo sát người dân Tất cả các nội dụng trong bảng câu hỏi được mã hóa dưới dạng name tên biến để thuận lợi trong cách quản lý dữ liệu trên phần mềm spss.. 3 Tiểu học Ng
Trang 1TÀI LIỆU SỬ DỤNG CHO CHUYÊN ĐỀ 5:
THỰC HIỆN PHÂN TÍCH SỐ LIỆU KHẢO SÁT
ThS Phạm Minh Tiến, ThS Nguyễn Văn Dũng
Tình huống:
Nhằm giải quyết vấn đề tốc độ tại khu vực trường học, các bên bao gồm Quỹ Phòng chống thương vong Châu Á, Ban An toàn giao thông tỉnh Gia Lai và Tập đoàn sơn KOVA đã đề xuất Dự án “Slow Zones, Safe Zones”, đây là một chương trình toàn diện với mục tiêu tăng cường sự an toàn xung quanh khu vực trường học Thông qua việc vận động triển khai các giải pháp giảm tốc độ cho toàn thành phố Pleiku một cách bền vững, giáo dục học sinh và nâng cao nhận thức cộng đồng để thúc đẩy sự thay đổi hành
vi một cách tích cực và cải thiện cơ sở hạ tầng giúp học sinh đến trường và về nhà an toàn hơn, chương trình “ Slow Zone, Safe Zones” sẽ giảm những ca bị thương và tử vong do tai nạn giao thông tại các khu vực trường học ở thành phố Pleiku, tỉnh Gia Lai
Dự án được triển khai khảo đối tượng là người dân về vấn đề an toàn giao thông và việc
đi bộ của họ quanh khu vực 3 trường học (Trường Tiểu học Phan Đăng Lưu (thuộc xã Biển Hồ), Trường Tiểu học Anh Hùng Núp (thuộc xã Biển Hồ), Trường Tiểu học Nguyễn Lương Bằng (thuộc xã Thắng Lợi) Sau khi tổ chức khảo sát các đối tượng của
dự án, nhóm nghiên cứu sẽ tập trung vào xử lý dữ liệu khảo sát Các công việc thực hiện cho quá trình phân tích dữ liệu khảo sát được thực hiện như sau:
Phần 1 Nhập và phân tích dữ liệu
1.1 Bước 1: Tạo bảng mã để nhập dữ liệu trên phần mềm excel
Dựa vào phiếu khảo sát, người phụ trách sẽ thiết kế bảng nhập liệu
Trang 2Hình 1 Bảng câu hỏi mẫu khảo sát người dân
Tất cả các nội dụng trong bảng câu hỏi được mã hóa dưới dạng name (tên biến) để thuận
lợi trong cách quản lý dữ liệu trên phần mềm spss Nguyên tắc đặt name gồm: (1) bắt đầu bằng ký tự chữ, không có khoảng trắng giữa các ký tự, nếu có sử dụng dấu gạch dưới “_” hoặc dấu chấm “.” Ví dụ: câu 2 có hai trường dữ liệu Trường dữ liệu thứ nhất
với nhãn của biến: Nhà anh/chị ở đường nào, đặt tên biến là c2.a hoặc c2_a; trường dữ liệu thứ hai với nhãn của biến: Nhà anh/chị ở phường nào, đặt tên biến là c2.b hoặc c2_b
Kết quả tạo name được trình bảy trong hình bên dưới (Cột A):
Trang 3Hình 2 Kết quả mẫu tạo biến nhập liệu
Đối với trường hợp câu hỏi nhiều lựa chọn Ví dụ câu 5: Các phương tiện thường phản ứng thế nào khi nhìn thấy học sinh đi qua đường ở khu vực trường này? Trả lời
có 5 lựa chọn:
1 Đi chậm lại
2 Không thay đổi tốc độ
3 Tăng tốc
4 Điều chỉnh tốc độ theo chất lượng đường
5 Dừng lại cho đến khi các em học sinh sang đường thành công
Cách cổ điển thông thường sẽ tạo 5 biến để nhập dữ liệu đại diện cho 5 lựa chọn
trả lời trên Đặt tên biến từ c5.1 (Đi chậm lại ) đến c5.5 (Dừng lại cho đến khi các em học sinh sang đường thành công)
Đối với các câu hỏi có mục trả lời khác Ví dụ: Câu 4 Nếu có, anh chị vui lòng
mô tả lộ trình anh chị thường đi?, lựa chọn trả lời số 3: Khác (Ghi rõ):… Khi tạo biến, ngoài việc tạo tên biến c4 cho nhãn (Nếu có, anh chị vui lòng mô tả lộ trình anh chị thường đi?), thì cần tạo thêm tên biến c4.a cho nhãn khác ( khi người trả lời chọn đáp
án 3: Khác (Ghi rõ)
1.2 Bước 2: Nhập dữ liệu, mã hóa dữ liệu và làm sạch dữ liệu
(1) Nhập dữ liệu:
Dữ liệu thường được nhập ở hai dạng: dạng số và dạng chữ (xem hình 2)
Dạng số (numeric): Đối với các câu hỏi có câu trả lời đã được mã hóa dạng số
(ví dụ: câu 1: giới tính có mã hóa 1 là Nam, 2 là Nữ) hoặc câu hỏi định lượng được đo
Trang 4lường bằng thang đo khoảng và tỷ lệ Khi nhập vào phần mềm sẽ nhập trực tiếp số hoặc
mã hóa dạng số
Dạng chữ (string): Đối với các câu hỏi mở (ví dụ: câu số 7: Đoạn đường nào ở
khu vực trường anh/chị cho là nguy hiểm nhất? Tại sao?) và câu hỏi có đáp án trả lời là khác (ví dụ:câu số 6: Theo quan sát của anh/chị, học sinh thường sang đường ở?) hoặc câu hỏi thông tin không thể mã hóa dưới dạng số ( Họ và tên người được khảo sát, mã phiếu,…)
(2) Mã hóa dữ liệu
Mã hóa dữ liệu là chuyển dữ liệu dạng chữ sang dạng số hoặc là ký tự để thuận lợi
trong việc quản lý và phân tích dữ liệu
Thông thường, sau khi nhập dữ liệu, đặc biệt là những câu hỏi mở hoặc những câu hỏi
có lựa chọn trả lời là khác, thì cần phải mã hóa lại theo nhóm ( tức gôm những câu trả lời có nội dung giống nhau thành một nhóm)
1 Có nhiều học sinh và phụ huynh đưa đóa con đi học
2 Có nhiều xe, phương tiện đi lại, vượt nhanh
3 Đoạn đường cong, nhiều ngã rẽ, khuất tầm nhìn, chất lượng không đảm bảo
4 Không có vách ngăn, biển báo, tín hiệu,…
5 Đông người qua lại
6 Vi phạm quy định giao thông
7 Cháu nhỏ không để ý khi qua đường
8 Khác
9 Không có Đối với câu hỏi chưa được mã hóa, như câu : Khảo sát quanh khu vực trường…… thì sau khi nhập cũng cần được mã hóa
1 Tiểu học Phan Đăng Lưu
2 Tiểu học Anh Hung Nup
Trang 53 Tiểu học Nguyễn Lương Bằng
(3) Làm sạch dữ liệu
Kiểm tra và rà soát thông tin dữ liệu:
- Xem các câu hỏi có nhập đủ dữ liệu không
- Xem tính logic giữa các biến
- Xem có vượt giới hạn mã hóa dữ liệu
Kết quả dữ liệu sau khi mã hóa và làm sạch
Hình 3 Kết quả mẫu dữ liệu sau khi mã hóa và làm sạch
1.3 Bước 3: Chuyển dữ liệu từ excel sang phần mềm spss
Dữ liệu sau khi mã hóa và làm sạch trên phần mềm excel sẽ được chuyển sang phần mềm spss Cách thức thực hiện như sau:
Mở phần mềm spss, vào file/open/data
Dẫn đường dẫn đến folder chứa tập dữ liệu excel (GIALAI_data_khao sat nguoi dan)
Trang 6Hình 4: Hướng dẫn xuất dữ liệu từ excel sang spss Chọn file ecxel cần chuyển sang spss, open => OK
Kết quả dữ liệu được xuất sang spss
Hình 5: Kết quả sau khi xuất dữ liệu từ excel sang spss
1.4 Bước 4: Khai báo mã hóa và gán thông tin dữ liệu trên phần mềm spss
- Khai báo giá trị mã hóa: Khai báo tất cả các biến được mã hóa dưới dạng số hoặc ký tự trong values
Ví dụ: khai báo giá trị mã hóa
cho biến c1 ( giới tính) được
mã hóa: 1 là Nam, 2 là Nữ Thao
tác thực hành như hình bên
Và làm tương tự cho các biến
còn lại
Trang 7- Gán nhãn cho tất cả các biến: Copy nội dung giải thích (câu hỏi) hoặc đánh máy vào cột nhãn để giải thích cho name
Ví dụ: Gán nhãn (label) của
name c3 Copy nội dung
câu hỏi (Anh/chị có thường
xuyên đi qua khu vực trường
học này không?) trong phiếu
khảo sát, past vào ô Label
tương ứng với name
Và làm tương tự cho các
biến còn lại
- Chọn thang đo cho tất cả các biến: Trên spss có 3 loại thang đo chính: (1) Nominal là thang đo định danh, chỉ phân loại đối tương; (2) Ordinal là thang
đo thứ bậc, phân loại có hơn kém; (3) Scale là thang đo định lượng, đo cho tất
cả các biến định lượng (là thang đo tổng hợp của hai thang đo interval và ratio)
Ví dụ: Gán thang đo (Measure) của
name c3 Nhấp chuột trái vào ô
Measure tương ứng của name c3,
chọn thang đo Nomial
Và làm tương tự, chọn thang đo phù
hợp cho các biến còn lại
Kết quả dữ liệu đã được hoàn chỉnh trên spss:
Hình 6: Kết quả sau khi xuất dữ liệu từ excel sang spss
Trang 81.5 Thực hiện phân tích dữ liệu trên phần mềm spss
Có nhiều lệnh và nhiều cách để phân tích thống kê mô tả dữ liệu trên phần mềm spss Tuy nhiên, các lệnh phổ biến nhất hiện nay được trình bày bên dưới:
Thống kê mô tả đơn biến định tính
Thực hiện: Đối với biến định tính:
Bước 1: Menu/ analyze/ Descriptives
Statistics/ Frequency
Bước 2: Chọn biến định tính cần tính và đưa
qua khung Variables
Bước 3: Vào Charts để vẽ đồ thị Bước 4: Nhấp Continue và OK để kết thúc
Kết quả thể hiện trong bảng Output như sau:
• Dữ liệu định tính: (Frequency table): tần số, tần suất, mode
• Dữ liệu định lượng: (Statistics): trung bình, trung vị, số mode, phương sai, đọ lệch chuẩn, giá trị nhỏ nhất, giá trị lớn nhất,…
• Thống kê mô tả sử dụng biến phân tách định tính
• Kết hợp 1 biến định lượng với một/nhiều biến định tính
Tables
• Sử dụng phân tích cho câu hỏi có nhiều sự lựa chọn
Mutil
Response
Trang 9 Thống kê mô tả đơn biến định lượng
Bước 3: Vào Statistics để chọn các đại
lượng mô tả Bước 4: Vào Charts để vẽ đồ thị histograms
Bước 5: Kết quả sử dụng Frequency cho biến định lượng
Trang 10Sử dụng lệnh Descriptives
Bước 1: Menu/ analyze/ Descriptives
Statistics/ Descriptives
Bước 2: Chọn biến định lượng cần tính và đưa
qua khung Variables
Bước 3: Vào Options để chọn các đại lượng
thống kê
Bước 4: Kết quả thể hiện dưới bảng sau
Thực hành
Anh/chị sử dụng dữ liệu của nhóm để phân tích
Sử dụng lệnh frequency/ Descriptives để tính các đại lượng đặc trưng thống kê
Phân tích bảng kết quả tạo ra
Nhận diện sự khác nhau và giống nhau giữa công cụ frequency cho biến định lượng và Descriptives?
Trang 11Thống kê mô tả kết hợp nhiều biến định tính (≥ 2 biến định tính)
Sử dụng lệnh Crosstabs
Bước 1: Menu/ analyze/ Descriptives Statistics/
Crosstabs
Bước 2: Chọn biến cần phân tích
Bước 3: Vào Cells nếu muốn tính tỷ lệ phần
Có thể sử dụng Tables để Thống kê mô tả kết hợp nhiều biến định tính (≥ 2 biến định
tính)
Trang 12Thống kê mô tả kết hợp 1 biến định lượng với nhiều biến định tính ((≥ 1 biến định
tính)
Sử dụng lệnh Tables
Bước 1: Menu/ Analyze/ Tables/ Custom Tables Bước 2: Chọn biến cần phân tích
Bước 3.1: Thêm các đại lượng thống kê Bước 3.2: Thêm các đại lượng thống kê
Bước 3.3: Thêm các đại lượng thống kê Bước 4: Kết quả
Trang 131.6 Bước 6: Xuất kết quả sang phần mềm excel để tổng hợp cho nội dung báo cáo (
file hướng dẫn kèm theo trên lớp)
Sau khi xử lý dữ liệu với kết quả thể hiện trong output
B1: Chọn các kết quả cần xuất sang các phần mềm khác ( Sử dụng phím shift khi chọn
liên tục các kết quả, ctrl khi chọn riêng lẻ từng bảng kết quả)
Trang 14B2 Vào Menu/ Export
B3 Chọn chủ đề xuất ( Object to export), loại tập tin, địa chỉ lưu và tên file kết quả
Trang 15Kết quả sau khi xuất sang excel
(3) Chọn địa chỉ lưu kết quả
(4) Đặt tên file kết quả
Trang 16Phần 2 Trình bày và phân tích kết quả phân tích khảo sát
2.1 Tổng quan về phân tích số liệu khảo sát
Phân tích số liệu khảo sát là việc tóm lược kết quả và diễn dịch ý nghĩa của từng thông tin trong bảng khảo sát để có được câu trả lời rõ ràng cho các câu hỏi
đã đặt ra Phân tích số liệu phải liên kết quả nghiên cứu với từng câu hỏi đã nêu ra trong phần câu hỏi và mục tiêu nghiên cứu Đây là một trong những phần quan trọng
nhất của cuộc khảo sát vì chất lượng của việc phân tích ảnh hưởng rất lớn đến sự hữu ích của nghiên cứu
Việc phân tích có thể gói gọn trong các số liệu đã khảo sát hoặc có thể so sánh với các kết quả thu được từ các nghiên cứu khảo sát khác
Thông thường phân tích kết quả là hình thành các bảng, hình ảnh, đồ thị, và các đo lường khác về đặc trưng của mẫu (trung bình, tần số, số lớn nhất, số nhỏ nhất,…), mối quan hệ giữa các biến số (phân tích hồi quy, hệ số tương quan,…) và nhận định, đánh giá vấn đề
2.2 Trình bày kết quả dưới dạng hình (biều đồ), bảng thống kê
Dừng lại cho đến khi các em học sinh
sang đường thành công
Điều chỉnh tốc độ theo chất lượng
đường
Tăng tốcKhông thay đổi tốc độ
Đi chậm lại
Trang 17Hình 2.5 Hành vi của người điều khiển phương tiện
Hình 2.17 Tỷ lệ phương tiện giao thông va quệt học sinh của các khối lớp tiểu học
Không tuân thủ luật giao thông
Luôn chạy xe với tốc độ cao
Chưa có ý thức nhường đường cho người đi bộ
Trang 18Hình 2.27: Nguyên nhân gây tai nạn giao thông
2 Chạy quá tốc
độ quy định
3 Vượt
xe không đúng quy định
4 Không
đi đúng phần đường quy định
5 Không giữ khoảng cách an toàn
6 Không tập trung nạn với 7 Tai
người đi bộ
8 Do điều kiện môi trường
9 Không nhường đường
10 Sử dụng rượu bia
Trang 19Hình 2.3 Cảm giác an toàn khi đi bộ đoạn đường trước cổng trường
2.2.4 Bảng thống kê
1 Định nghĩa: Bảng thống kê là một hình thức trình bày kết quả tổng hợp số liệu thống
kê theo từng nội dung riêng biệt nhằm phục vụ cho yêu cầu của quá trình nghiên cứu thống kê
2 Mục đích:
- Phản ánh đặc trưng cơ bản của từng tổ và của cả tổng thể;
- Mô tả mối liên quan mật thiết giữa các số liệu thống kê;
3 Kết cấu của bảng thống kê:
+ Về hình thức
- Bảng thống kê bao gồm các hàng ngang và cột dọc, các tiêu đề và các tài liệu con số
- Hàng ngang cột dọc phản ánh quy mô của bảng thống kê, thường được đánh số thứ tự
- Ô của bảng dùng để điền số liệu thống kê
- Tiêu đề của bảng: Phản ánh nội dung của bảng và của từng chỉ tiêu trong bảng
Tương đối không
an toànKhông an toàn
Trang 20- Các số liệu được ghi vào các ô của bảng, mỗi số liệu phản ánh đặc trưng về mặt lượng của hiện tượng nghiên cứu
Hình thức của bảng được mô tả qua sơ đồ sau:
Trang 21
Số lượng Tỉ lệ lượng Số Tỉ lệ lượng Số Tỉ lệ lượng Số Tỉ lệ
Trang 22Đoạn phân tích được trình bày đi từ các ý chi tiết, cụ thể nhằm hướng tới ý khái quát nằm ở cuối đoạn Các câu triển khai được đi kèm số liệu cụ thể Đồng thời các các câu bình luận, giải thích, nhận xét, đánh giá Câu chủ đề trong đoạn phân tích quy nạp đặt ở phía cuối đoạn
2.3.2 Kết cấu của một đoạn báo cáo (đoạn phân tích)
Phần phân tích hình, bảng biểu, thường có 2 nhóm ý:
Nhận xét về diễn biến và mối quan hệ giữa các số liệu: xu hướng nổi bật, tăng, giảm, biến động, đại lượng có giá trị lớn nhất, nhỏ nhất, giá trị trung bình
Cố gắng giải thích nguyên nhân, bình luận các diễn biến (hoặc mối quan hệ) đó
2013 Tỷ lệ điện khí hóa nông thôn của nước ta tăng nhanh nhờ phát huy sức mạnh của
cả hệ thống chính trị, từ trung ương đến địa phương và toàn thể người dân Ngoài ra, thành công của chương trình điện khía hóa nông thôn có đóng góp quan trọng của EVN
và các công ty điện lực Với vai trò nòng cốt, EVN và các đơn vị không chỉ đầu tư, mở rộng các dự án nguồn và lưới điện truyền tải, mà còn tích cực đưa điện về các xã vùng sâu, vùng xa, biên giới và hải đảo, trong điều kiện nguồn vốn hết sức khó khăn
Ghi chú: Phương pháp diễn dịch thường được sử dụng hơn
Trang 23năm 2013 Thành công trên là nhờ phát huy sức mạnh của cả hệ thống chính trị, từ trung ương đến địa phương và toàn thể người dân Ngoài ra, còn có đóng góp quan trọng của EVN và các công ty điện lực Với vai trò nòng cốt, EVN và các đơn vị không chỉ đầu
tư, mở rộng các dự án nguồn và lưới điện truyền tải, mà còn tích cực đưa điện về các xã vùng sâu, vùng xa, biên giới và hải đảo, trong điều kiện nguồn vốn hết sức khó khăn Như vậy, tỷ lệ điện khí hóa nông thôn của nước ta tăng nhanh và bền vững trong giai đoạn 2007 – 2013