Phân tích tác động của các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục lên biến Thu nhập...7 1.7.. Kiểm tra có đa cộng tuyến multicollinearity giữa các biến
Trang 1ĐẠI HỌC UEH TRƯỜNG KINH DOANH KHOA KINH DOANH QUỐC TẾ - MARKETING
NHÓM 1
1 Dương Ngọc Minh Anh
2 Nguyễn Quỳnh Hương
3 Lê Trần Bảo Khuê
4 Nguyễn Vũ Khánh Linh
5 Trần Thị Xuân Phương
6 Nguyễn Hà Thi
7 Nguyễn Thanh Thảo
8 Nguyễn Thị Thủy Tiên
9 Nguyễn Ngọc Tú
BÀI BÁO CÁO CUỐI KÌ
Môn học: Phân tích kinh doanh
Giảng viên: Nguyễn Văn Dũng
Mã lớp học phần: 23D1BUS50318014
Trang 2MỤC LỤC
I Đề bài 1
II Tóm tắt 2
III Giới thiệu 2
IV Nội dung khảo sát 2
1 Kết quả khảo sát chính: 3
1.1 Bảng tần số của Trình độ học vấn 3
1.2 Biểu đồ tròn của Giới tính 3
1.3 So sánh giá trị trung bình về Thu nhập của hai nhóm Giới tính 4
1.4 So sánh giá trị trung bình về Thu nhập của các Trình độ học vấn 4
1.5 Kiểm tra mức tương quan giữa các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân và Tập thể dục 6
1.6 Phân tích tác động của các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục lên biến Thu nhập 7
1.7 Phân tích tác động điều tiết của việc Tập thể dục lên mối quan hệ giữa Tuổi và Thu nhập 9
2 Kết quả khảo sát mở rộng: 10
2.1 Biện pháp tốt để giữ gìn sức khỏe 10
2.2 Địa điểm thích hợp nhất để tập thể dục 11
2.3 Mức độ cải thiện sức khỏe sau khi tập thể dục 12
KẾT LUẬN 12
TÀI LIỆU THAM KHẢO 13
Trang 3I Đề bài
1 Thu thập và xây dựng file dữ liệu SPSS với các yêu cầu sau:
i Có các biến:
a Họ và tên: chuỗi ký tự (string) không dấu
b Thu nhập: triệu vnđ/tháng
c Tuổi
d Giới tính: nam (1), nữ (0)
e Trình độ học vấn: thpt (1), đại học (2), thạc sĩ (3), tiến sĩ (4)
f Tình trạng hôn nhân: độc thân (1), có gia đình (2)
g Tập thể dục: có tập thể dục thường xuyên (trên 20 phút mỗi ngày) (1), không tập thể dục thường xuyên (dưới 20 phút mỗi ngày) (0)
ii Số quan sát: 100 quan sát
2 Lập bảng tần số về Trình độ học vấn
Yêu cầu có: (i) số quan sát ứng với từng trình độ và (ii) tỷ lệ phần trăm cụ thể cho từng trình
độ Phân tích trong mẫu nghiên cứu, trình độ học vấn nào chiếm tỷ lệ cao nhất? trình độ học vấn nào chiếm tỷ lệ thấp nhất?
3 Vẽ đồ thị hình chiếc bánh (pie chart) thể hiện tỷ lệ phần trăm của số quan sát phân theo Giới tính (nam, nữ) Yêu cầu có tỷ lệ phần trăm cụ thể cho từng giới tính trên đồ thị Phân tích trong mẫu nghiên cứu, nam hay nữ chiếm tỷ lệ cao hơn
4 So sánh giá trị trung bình về Thu nhập của 2 nhóm Giới tính, có sự khác biệt có ý nghĩa thống kê nào giữa 2 nhóm Giới tính về Thu nhập hay không?
5 So sánh giá trị trung bình về Thu nhập của các Trình độ học vấn, có sự khác biệt có ý nghĩa thống kê nào giữa các Trình độ học vấn về Thu nhập hay không?
6 Kiểm tra có đa cộng tuyến (multicollinearity) giữa các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục hay không?
7 Sử dụng hồi quy tuyến tính bội (multiple linear regression), phân tích tác động của các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục lên biến Thu nhập
8 Tạo biến tương tác (interaction variable) giữa Tuổi và Tập thể dục Phân tích tác động điều tiết (moderating effect) của việc Tập thể dục lên mối quan hệ giữa Tuổi và Thu nhập
II Tóm tắt
Bài báo cáo này tập trung vào việc đánh giá sự ảnh hưởng lẫn nhau của các biến Thu nhập, Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân và Thói quen tập thể dục của người dân Việt Nam chủ yếu là giới trẻ sinh sống tại Thành phố Hồ Chí Minh Bài báo cáo này được
Trang 4khảo sát online với mẫu là 100 người Kết quả của bài nghiên cứu cho thấy rằng có sự khác nhau có ý nghĩa thống kê về Thu nhập giữa hai nhóm giới tính và các nhóm Trình độ học vấn Đồng thời, không có đa cộng tuyến giữa các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục Kết quả còn cho thấy hầu hết các biến đều không có tác động đến Thu nhập ngoại trừ biến Trình độ học vấn và Tập thể dục Và cuối cùng, khi xét đến tác động điều tiết của biến Tập thể dục lên mối quan hệ giữa Tuổi và Thu nhập, thì kết quả là việc tập thể dục không có tác động điều tiết mối quan hệ của Tuổi lên Thu nhập
III Giới thiệu
Vận động đã được chứng minh là có nhiều lợi ích cho sức khỏe, cả về thể chất và tinh thần Tập thể dục mang lại rất nhiều điều tốt đẹp cho bạn và có thể giúp bạn sống lâu hơn Hoạt động thể chất thường xuyên là một trong những điều quan trọng nhất bạn có thể làm cho sức khỏe của mình Tập thể dục được định nghĩa là bất kỳ chuyển động nào làm cho cơ bắp của bạn hoạt động và yêu cầu cơ thể bạn đốt cháy calo Ngoài ra, việc tập thể dục còn ảnh hưởng đến nhiều điều khác mà chúng ta tưởng chừng như chúng không liên quan gì đến nhau Để tìm hiểu về sự khác biệt giữa người tập thể dục thường xuyên và không thường xuyên nhóm chúng em đã khảo sát và phân tích những sự khác biệt đó Đối tượng khảo sát là giới trẻ (chủ yếu là học sinh sinh viên) đang sinh sống và học tập tại TPHCM Bài báo cáo này được thu thập và khảo sát online với cỡ mẫu là 100 Từ bài khảo sát, nhóm đã chỉ ra những yếu tố tác động qua lại với nhau và chúng đã tác động như thế nào lên việc tập thể dục
IV Nội dung khảo sát
Nội dung khảo sát gồm các câu hỏi:
Phần 1: Thông tin cá nhân
- Họ và tên
- Giới tính
- Độ tuổi
- Trình độ học vấn (hiện tại)
- Thu nhập trung bình tháng
- Tình trạng hôn nhân
Phần 2: Hoạt động tập thể dục
- Theo anh/chị, đâu là những biện pháp tốt để giữ gìn sức khỏe? (Tập thể dục, Sử dụng thực phẩm chức năng, Ăn kiêng, )
- Một số hình thức thể dục, thể thao mà anh/chị biết
- Tần suất tập thể dục của anh/chị? (thường xuyên/không thường xuyên)
Trang 5- Anh/chị thường tập thể dục ở đâu? (Ở nhà, tại phòng tập chuyên nghiệp, sân vận động, công viên, )
- Sau khi tập thể dục, anh chị đánh giá sức khỏe của mình (thang đo Likert 5 điểm tương ứng từng điểm là: 1 Không cải thiện 2 Cải thiện ít 3 Cải thiện tương đối 4 Cải thiện khá tốt 5 Cải thiện rất tốt)
1 Kết quả khảo sát chính:
1.1 Bảng tần số của Trình độ học vấn
Bước 1: Ta lập bảng tần số của trình độ học vấn
Nhìn vào bảng trên, ta có thể thấy, trình độ học vấn chiếm tỉ lệ cao nhất là Đại học với 76%
Và trình độ học vấn chiếm tỉ lệ thấp nhất là Tiến sĩ với 2%
1.2 Biểu đồ tròn của Giới tính
Bước 2: Ta vẽ biểu đồ tròn của Giới tính:
Nhìn vào biểu đồ trên, ta có thể thấy, nam chiếm tỉ lệ 30% và nữ chiếm tỉ lệ 70% Ta thấy, nữ chiếm tỉ lệ cao hơn trong mẫu nghiên cứu này
Trang 61.3 So sánh giá trị trung bình về Thu nhập của hai nhóm Giới tính
Bước 3: Ta thực hiện phân tích T Test để so sánh giá trị trung bình về Thu nhập của hai nhóm Giới tính Từ đó rút ra kết luận có ý nghĩa thống kê giữa hai nhóm giới tính về thu nhập hay không
Nhìn vào bảng trên, ta thấy giá trị trung bình về Thu nhập của nữ là 1.4 và của nam là 1.73
Vì từ 1 đến 5 đại diện cho từng mức thu nhập tăng dần Do đó, 1.4 < 1.73, suy ra giá trị thu nhập trung bình của nữ nhỏ hơn giá trị thu nhập trung bình của nam
Đầu tiên, ta xét Sig của Levene’s test = 0.217 > 0.05, suy ra phương sai của hai tổng thể không khác nhau Sử dụng kết quả T Test ở dòng Equal variances assumed, ta thấy Sig = 0.047 < 0.05, suy ra có sự khác biệt có ý nghĩa về trung bình của hai giới tính về thu nhập Nói cách khác, giữa 2 giới tính khác nhau thì có bằng chứng cho thấy sự khác nhau về thu nhập
1.4 So sánh giá trị trung bình về Thu nhập của các Trình độ học vấn
Bước 4, ta sử dụng phân tích Oneway ANOVA để so sánh giá trị trung bình về Thu nhập của các Trình độ học vấn Từ đó rút ra kết luận có sự khác biệt có ý nghĩa thống kê nào giữa các Trình độ học vấn về Thu nhập hay không
Trang 7Theo bảng thống kê mô tả trên, ở cột Mean giá trị trung bình về Thu nhập của các Trình độ học vấn lần lượt THPT là 1.27, Đại học là 1.51 và Tiến sỹ là 3.5 Mà giá trị từ 1 đến 5 đại diện cho từng mức thu nhập tăng dần nên rõ ràng Trình độ học vấn THPT có mức trung bình thu nhập thấp nhất trong ba trình độ trên; và ngược lại, Trình độ học vấn Tiến sỹ có mức thu nhập trung bình cao nhất (Ý 1)
Ở bảng Test of Homogeneity of Variances, Sig của thống kê Levenve của giá trị Thu nhập trung bình mỗi tháng là 0.130 > 0.05 nên ở độ tin cậy 95% giả thuyết H0: “Phương sai bằng
nhau” được chấp nhận, và bác bỏ giả thuyết H1: “Phương sai khác nhau” Và do đó kết quả phân tích ANOVA có thể sử dụng.
Kết quả phân tích ANOVA với mức ý nghĩa 0.000<0.05, như vậy với dữ liệu quan sát đã đủ điều kiện để khẳng định có sự khác biệt về Thu nhập trung bình mỗi tháng giữa các nhóm có
Trình độ học vấn khác nhau Hay có sự khác biệt có ý nghĩa thống kê giữa các Trình độ học
vấn về Thu nhập
Trang 81.5 Kiểm tra mức tương quan giữa các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân và Tập thể dục
Bước 5: Ta kiểm tra có đa cộng tuyến (multicollinearity) giữa các biến Tuổi, Giới tính, Trình
độ học vấn, Tình trạng hôn nhân, Tập thể dục hay không
Ta thấy khi chạy bảng Correlations, kết quả mối tương quan giữa biến Tuổi và Giới tính là 0.000 < ±0.7 nên không có đa cộng tuyến giữa hai biến này
Tương tự, mối tương quan giữa hai biến: Trình độ học vấn với Giới tính là 0.059 , Tình trạng hôn nhân với Giới tính là 0.154, Tần suất tập thể dục và Giới tính là -0.277, Trình độ học vấn với Tuổi là 0.464**, Tình trạng hôn nhất với Tuổi là 0.034, Tần suất tập thể dục với Tuổi là 0.115, Tình trạng hôn nhân với Trình độ học vấn là 0.035, Tần suất tập thể dục với Trình độ học vấn là -0.112, Tần suất tập thể dục với Tình trạng hôn nhân là 0.058 Tất cả chỉ số đều nhỏ hơn ±-0.7 nên có thể kết luận từng cặp biến riêng lẻ đều không có đa cộng tuyến
1.6 Phân tích tác động của các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục lên biến Thu nhập
Bước 6: Ta sử dụng hồi quy tuyến tính bội (multiple linear regression) để phân tích tác động của các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục lên biến Thu nhập
Trang 9Nhìn vào bảng trên, giá trị R bình phương (R square) cho thấy 23.5% sự thay đổi của biến thu nhập trung bình được giải thích bởi các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục
Hình trên kiểm định các giả thuyết sử dụng phần mềm SPSS: các giá trị ở cột Sig (trừ biến trình độ học vấn và tần suất tập thể dục) đều lớn hơn 5% chứng tỏ các biến Giới tính, Tuổi, Tình trạng hôn nhân đều không có tác động ý nghĩa đến biến Thu nhập Tuy nhiên, riêng biến trình độ học vấn có giá trị ở cột Sig là 0.042 và Tần suất tập thể dục có giá trị ở cột Sig là
Trang 100.001 chứng tỏ hai biến này có tác động đến biến phụ thuộc (tức là biến Thu nhập) Bên cạnh
đó, ta nhận thấy hệ số B của biến Trình độ là 0.317 mang dấu dương và của biến Tập thể dục
là
-0.564 mang dấu âm, nghĩa là Trình độ học vấn có tác động tích cực đến Thu nhập, còn Tập thể dục có tác động tiêu cực đến Thu nhập
1.7 Phân tích tác động điều tiết của việc Tập thể dục lên mối quan hệ giữa Tuổi và Thu nhập
Bước 7: Ta tạo biến tương tác (interaction variable) giữa Tuổi và Tập thể dục Sau đó phân
tích tác động điều tiết (moderating effect) của việc Tập thể dục lên mối quan hệ giữa Tuổi và Thu nhập
Bảng trên kiểm định giả thuyết về độ phù hợp với tổng thể của mô hình, giá trị F=8.346 và Sig = 0.000 < 5% chứng tỏ R bình phương của tổng thể khác 0 Và R bình phương chúng ta không thể tính cụ thể được nhưng chúng ta chắc chắn nó sẽ khác 0, mà khác 0 thì chứng tỏ các biến độc lập (độ tuổi và tần suất tập thể dục) có tác động đến biến thu nhập
Ta thấy, bảng trên có biến điều tiết (interaction) nên các tác động trực tiếp của tuổi và tần suất không phân tích nữa vì dấu của nó đã bị thay đổi Ta có Sig interaction = 0.116 > 0.05 vậy nên đủ điều kiện kết luận rằng việc tập thể dục không có tác động điều tiết lên tuổi tác và thu nhập Tóm lại, sự tác động của Tuổi lên Thu nhập không bị điều tiết (tăng hay giảm) bởi biến Tập thể dục
Trang 112 Kết quả khảo sát mở rộng:
2.1 Biện pháp tốt để giữ gìn sức khỏe
Nhìn vào bảng trên, ta có thể thấy trong số 151 lựa chọn, 61.6% lựa chọn cho rằng việc tập thể dục là biện pháp tốt nhất để giữ gìn sức khỏe, kế đến có 17.9% lựa chọn cho rằng sử dụng thực phẩm chức năng là biện pháp tốt nhất để bảo vệ sức khỏe, cuối cùng là 13.2% lựa chọn cho rằng ăn kiêng là biện pháp tốt nhất để bảo vệ sức khỏe Có 7.3% lựa chọn cho rằng có biện pháp khác tốt hơn những biện pháp trên để bảo vệ sức khỏe
2.2 Địa điểm thích hợp nhất để tập thể dục
Nhìn vào bảng trên, ta có thể thấy trong 157 lựa chọn, địa điểm tập thể dục được lựa chọn nhiều nhất là ở nhà (50.3%), kế đến là tại công viên (21%), đứng thứ ba là tại phòng tập chuyên nghiệp (11.5%), thứ tư là những địa điểm khác ngoài những địa điểm trên (8.9%) và cuối cùng là tại sân vận động (8.3%)
Trang 122.3 Mức độ cải thiện sức khỏe sau khi tập thể dục
Sau khi tập thể dục gần một nửa số người khảo sát là 46 người đánh giá sức khỏe của mình cải thiện khá tốt, 16 người cải thiện rất tốt, 27 người đánh giá cải thiện tương đối Bên cạnh
đó có 6 người thấy cải thiện ít và không cải thiện sức khỏe sau tập thể dục là 5 người
KẾT LUẬN
Bài khảo sát của chúng tôi tìm hiểu về vấn đề Hoạt động tập thể dục có bị tác động bởi các yếu tố nhân khẩu học như Thu nhập, Tuổi, Giới tính, Trình độ học vấn hay Trình độ hôn nhân hay không Ngoài ra, bài viết cũng phân tích về mối quan hệ giữa Thu nhập và Giới tính hay Thu nhập và Trình độ học vấn; sự tác động của các biến lên Thu nhập
Theo dữ liệu đã phân tích, có sự khác nhau giữa giá trị trung bình về Thu nhập giữa hai giới tính Nam và Nữ Thu nhập trung bình của Nữ thấp hơn so với Nam
Trình độ học vấn cũng ảnh hưởng đến mức thu nhập, và nó có tác động tích cực Khi trình độ học vấn của một người càng cao thì nhìn chung thu nhập có xu hướng tăng lên Trong khi các biến nhân khẩu học như Giới tính, Tuổi, Trình độ học vấn hay Tình trạng hôn nhân đều tác động tích cực đến Thu nhập thì Tần suất tập thể dục lại tác động tiêu cực đến Thu nhập Nghĩa là, Thu nhập càng cao thì Tần suất tập thể dục càng thấp
Mặt khác, Tần suất tập thể dục sẽ không tác động đến mối quan hệ giữa Tuổi và Thu nhập Vì đây chỉ là một bài khảo sát ngắn nên chưa thể phân tích và nghiên cứu sâu về những
sự tác động hay mối quan hệ giữa các biến Trong quá trình thu thập dữ liệu, các đối tượng
Trang 13khảo sát chưa thực sự dàn trải ở nhiều Độ tuổi hay Trình độ học vấn nên kết quả phân tích sẽ không khỏi trách phải việc thiếu sự chuẩn xác
TÀI LIỆU THAM KHẢO
1 Jos Seegers (30/10/2012) Analysis Multiple Response Categories Helpdesk IBM SPSS
Statistics 20.1
2 Nhóm ThS Bách Khoa (27/04/2002) Cách khai báo mã hóa biến câu hỏi nhiều lựa chọn,nhiều câu trả lời với SPSS Phân tích SPSS - Nhóm MBA Bách Khoa.
3 Evans, J R (2016) Business analytics: Methods, models, and decisions (Second Edition).
Pearson
4 Helpdesk IBM SPSS Statistics 20, truy xuất từ
https://helpdeskspssabs.femplaza.nl/analysis/analysis_multiple_response_cat.htm
5 Phạm Lộc Blog (13/09/2021) Mã hóa, nhập liệu, xử lý câu hỏi nhiều lựa chọn trong SPSS, truy xuất từ
https://www.phamlocblog.com/2016/12/ma-hoa-cau-hoi-nhieu-lua-chon-spss.html
6 HOTROSPSS (27/04/2022 ) Cách khai báo mã hóa biến câu hỏi nhiều lựa chọn, nhiều câu trả lời với SPSS, truy xuất từ
https://phantichspss.com/cach-khai-bao-ma-hoa-bien-cau-hoi-nhieu-lua-chonnhieu-cau-tra-loi-voi-spss.html