Nhận xét Giới tính Lệnh thực hiện: Menu Analyze Descriptive Statistics Frequencies Chọn biến gioitinh đưa vào ô Variable OK. Nhận xét: Tỷ lệ nữ chiếm 46.9%, tỷ lệ nam chiếm 53.
Trang 1UNIVERSITY OF ECONOMICS HO CHI MINH CITY
- -
Môn học: Phân tích dữ liệu Giảng viên: Chu Nguyễn Mộng Ngọc Lớp học phần: 21D1DAT60800402 THÀNH VIÊN: 10d NX: trong các nhóm thì nhóm này làm tốt nhất
1 Nguyễn Thị Phương Thảo 211109033
2 Nguyễn Phước Hưng 211109011
3 Nguyễn Thiên Sinh Phúc 211109026
4 Nguyễn Huỳnh Thùy Dương 211110008
TP.HCM, Tháng 07/2021
Trang 21 Lập bảng mô tả tần suất giới tính, nghề nghiệp Nhận xét
Giới tính
Lệnh thực hiện: Menu Analyze Descriptive Statistics Frequencies Chọn biến
gioitinh đưa vào ô Variable OK.
Nhận xét: Tỷ lệ nữ chiếm 46.9%, tỷ lệ nam chiếm 53.1%
Kết luận: Tỷ lệ nữ tham gia công việc trong xã hội chiếm tỷ lệ ít hơn nam.
Nghề nghiệp
Lệnh thực hiện: Menu Analyze Descriptive Statistics Frequencies Chọn biến
Trang 3Nhận xét
- Tỷ lệ nghề nghiệp chiếm tỷ trọng cao nhất là công nhân (20.4%)
- Tỷ lệ nghề nghiệp chiếm tỷ trọng thấp nhất là bác sĩ và nghiên cứu (đều chiếm 2%)
Kết luận:
- Những nghề đòi hỏi chuyên môn thấp sẽ phổ biến hơn (công nhân)
- Những nghề đòi hỏi chuyên môn, kỹ thuật cao thì sẽ chiếm tỷ lệ thấp (bác sĩ, nghiên cứu)
2 Lập bảng tần số cho thu nhập trên cơ sở phân tổ đều thu nhập thành 5 tổ theo gợi ý (1-1,99tr); (2-2,99tr); (3-3,99tr); (4-4,99tr); (5-5,99tr) Nhận xét
Lệnh thực hiện: Nhóm tiến hành phân tổ dữ liệu thành 5 nhóm theo yêu cầu và đặt tên
biến mới là “thunhapMH”: Menu Transform Recode into Different Variables Chọn biến thunhap di chuyển sang “Input Variable Output Variable”, vào mục Old and New
Values tiến hành khai báo các nhóm và lưu dưới dạng tên mới “thunhapMH”.
Trang 4Sau đó, nhóm lập bảng tần số cho thu nhập trên cơ sở phân tổ đều: Menu Analyze Descriptive Statistics Frequencies Chọn biến thunhapMH đưa vào ô Variable
OK Kết quả phân tích được thể hiện dưới bảng sau:
Nhận xét:
- Nhóm có thu nhập trong khoảng từ 2 triệu đến 2.99 triệu chiếm tỷ trọng cao nhất (40.8%)
- Nhóm có thu nhập trong khoảng từ 5 triệu đến 5.99 triệu chiếm tỷ trọng thấp nhất (6.1%)
Kết luận:
- Nhóm có thu nhập thấp từ 1 triệu đến 2.99 triệu chiếm tỷ lệ cao (chiếm 67.3%), chứng tỏ người dân thành phố A có mức thu nhập thấp
- Khi mức thu nhập càng cao thì tỷ trọng càng thấp
3 Lập bảng hai biến mô tả thu nhập (đã phân tổ đều) theo giới tính.
Lệnh thực hiện: Menu Analyze Table Custom table Chọn biến thunhapMH thả vào Rows, chọn biến gioitinh thả vào Columns
Chọn tab Summary Statistics Di chuyển Column N% sang mục Display Apply to Selection
Chọn tab Categories and Totals Chọn Total Apply.
Nhấn OK
Trang 5Nhận xét:
Dựa vào bảng trên, số lượng nữ làm việc thấp hơn nam (số lượng nữ đi làm là 23 người
và số lượng nam đi làm là 26 người)
Đối với nữ, công việc có mức thu nhập thấp chiếm tỷ lệ cao nhất 47.8% (từ 2-2.99 triệu/tháng) và có được công việc với mức thu nhập cao thì chiếm tỷ lệ thấp nhất 4.3 % (từ 5-5.99 triệu)
Đối với nam, nhóm công việc có mức thu nhập thấp chiếm tỷ lệ cao nhất 34.6% phân bổ trong hai nhóm đầu (từ 1-1.99 triệu/tháng và 2-2.99 triệu/tháng) Tương tự, nhóm có được công việc với mức thu nhập cao thì chiếm tỷ lệ thấp nhất 7.7 % ở cả hai nhóm thu nhập (từ 4-4.99 triệu/tháng và 5-5.99 triệu/tháng )
4 Lập bảng thống kê các bệnh của người dân do vấn đề ô nhiễm không khí, nhận xét bệnh nào phổ biến hơn.
Lệnh thực hiện:
- Gom biến: Menu Analyze Table Multiple Respone Sets Di chuyển biến
benh1 và benh2 sang Variables in Set Chọn Categories Lưu dưới tên mới
- Lập bảng thống kê: Menu Analyze Table Custom table Di chuyển biến
BenhMH sang Rows.
Chọn tab Summary Statistics Di chuyển Responses và Column Responses % sang mục Display Apply to Selection.
Chọn tab Categories and Totals Chọn Total Apply.
Trang 6Nhận xét: Bệnh viêm hô hấp chiếm tỷ lệ cao hơn (61.3%), bệnh viêm mắt chiếm tỷ lệ
thấp hơn (38.7%)
Kết luận: Chứng tỏ bệnh viêm hô hấp phổ biến hơn bệnh viêm mắt.
5 Tính Trung bình, Trung vị, yếu vị (mode), phương sai, tứ phân vị của dữ liệu về
Số tiền chi trả cho chữa bệnh (nghìn /tháng) Nhận xét
Lệnh thực hiện: Menu Analyze Descriptive Statistics Frequencies Chọn biến
tienchuabenh đưa vào ô Variable Mở tab Statistics Stick chọn các mục: Quartiles,
Mean, Median, Mode, Minimum, Maximum Continue OK
- Trong tổng số 49 người phỏng vấn, ta rút ra được những thông tin như sau:
Số tiền chi trả cho việc khám chữa bệnh cao nhất là 400 nghìn/tháng, thấp nhất là
20 nghìn/tháng
Trung bình người dân chi trả 101.43 nghìn/ tháng cho việc khám chữa bệnh
Có 50% người dân chi trả ít hơn 70 nghìn/tháng và 50% người dân chi trả nhiều hơn 70 nghìn/tháng
Trang 7 Dữ liệu có nhiều mode nên phần mềm SPSS hiện kết quả giá trị Mode bằng giá trị Min Kết luận: có nhiều người chi trả số tiền khám chữa bệnh giống nhau
Trong 3 giá trị Mean, Median, Mode chênh lệch nhiều, chứng tỏ dữ liệu có giá trị ngoại lệ, tức là có số tiền chi trả đặc biệt lớn
Thông qua Phương sai 9133.333 nghìn/tháng, ta thấy độ dàn trải trong chi trả phí khám chữa bệnh của quan sát lớn
3 giá trị của Tứ phương vị lần lượt là 40 nghìn/tháng, 70 nghìn/ tháng, 100 nghìn/ tháng, chia dữ liệu số tiền chi trả khám chữa bệnh thành 4 phần bằng nhau
6 Vẽ box plot cho tuổi, nhận xét về kết quả.
Cách thực hiện
Trước khi nhóm tiến hành vẽ biểu đồ Box plot cho dữ liệu tuổi, nhóm chạy lệnh Analyze
=> Descriptive Statistics => Frequencies Chọn biến tuoi đưa vào ô Variable để xác định được chính xác Min, Max và Quartiles
Kết quả được thể hiện như sau:
- Người nhỏ tuổi nhất trong mẫu là 16 tuổi
- Người lớn tuổi nhất trong mẫu là 85 tuổi
- Ba giá trị tứ phân vị 30 tuổi , 40 tuổi và 50 tuổi chia dữ liệu làm 4 phần bằng nhau Sau đó, nhóm tiến hành sắp xếp dữ liệu tuổi theo thứ tự giảm dần (Chọn cột tuoi nháy chuột phải chọn lệnh Sort Descending).
Chạy lệnh Box plot cho dữ liệu tuổi và kiểm tra giá trị ngoại lệ: Graphs Legacy
Dialogs Boxplot Chọn Simple và Summaries of separate variables Define Chọn biến tuoi di chuyển sang tab Boxes Represent OK
Trang 8Nhận xét: Có 1 giá trị ngoại lệ tại vị trí 1 (số thứ tự 23), có độ tuổi 85, vượt xa so với độ
tuổi của nhóm người phỏng vấn
7. Kiểm định mối quan hệ tương quan giữa tuổi và chi tiêu cho khám chữa bệnh.
Đặt giả thuyết:
Ho: không có mối liên hệ giữa tuổi và chi tiêu cho khám chữa bệnh
H1: có mối liên hệ giữa tuổi và chi tiêu cho khám chữa bệnh
Lệnh thực hiện: Menu Analyze Correlate Bivariate Đưa biến tuoi và
tienchuabenh vào Tab Variables OK.
Trang 9Nhận xét:
Kết quả cho thấy: Sig = 0.000 < 0.05 thì bác bỏ Ho, nghĩa là có mối liên hệ giữa số tuổi
và chi tiêu cho khám chữa bệnh
Hệ số tương quan Pearson:
0 <r = 0.574 < 1 (quan hệ thuận chiều, Trung Bình Khá)
Kết luận: Có mối liên hệ ở mức trung bình khá giữa tuổi và chi tiêu khám chữa bệnh,
người càng lớn tuổi thì số tiền dành cho việc khám chữa bệnh càng nhiều
8 Kiểm định sự khác biệt thu nhập (lệnh Independent sample t test) giữa nam và
nữ Nhận xét Chọn độ tin cậy 95%
Lệnh thực hiện:
Kiểm tra giá trị ngoại lệ: Menu Graphs Legacy Dialogs Boxplot Đưa biến
thunhap vào Tab Variables OK.
Trang 10Nhận xét: Ta thấy không có giá trị ngoại lệ.
Đặt giả thuyết:
- Giả thuyết phương sai:
H0: Phương sai của hai nhóm bằng nhau
H1: Phương sai của hai nhóm khác nhau
- Giả thuyết kiểm định:
H0: không có mối quan hệ giữa thu nhập và giới tính.
H1: có mối quan hệ giữa thu nhập và giới tính.
Kiểm định giả thuyết:
Menu Analyze Compare Means Independent - Samples T Test Chọn biến
thunhap đưa vào Tab Test Variable và chọn biến gioitinh đưa vào tab Group Variable Khai báo trong mục Define Group theo quy luật mã hóa giới tính (0: Nữ; 1: Nam) OK
Trang 11Kiểm tra kết quả kiểm định phương sai: Sig = 0.5 > 0.05 thì chấp nhận H , tức là 0
phương sai của 2 nhóm bằng nhau
Ta xem kết quả kiểm định t trên dòng Equal variances assumed
Kiểm tra kết quả kiểm định: Sig (2 tailed) = 0.506 > 0.05 thì Chấp nhận H , tức là 0
không có mối quan hệ giữa giới tính và thu nhập
Kết luận: Không có sự khác biệt về thu nhập giữa nam và nữ Thu nhập của nam và nữ
như nhau