Hai phương pháp thống kê chính được sử dụng trong phân tích dữ liệu: thống kê mô tả, đây là phương pháp tóm tắt dữ liệu từ một mẫu sử dụng các chỉ số như là giátrị trung bình hoặc độ lệc
Trang 11 Hồ Văn Trực
2 Lê Thị Phương Thảo
3 Nguyễn Hữu Anh Tuấn
4 Phan Bảo Trân
Đà Nẵng, 11/2020.
Trang 2M C L C ỤC LỤC ỤC LỤC
CHƯƠNG 1 MỞ ĐẦU: 1
1.1 Đặt vấn đề: 1
1.2 Đối tượng nghiên cứu 1
1.3 Mục tiêu nghiên cứu: 1
1.3.1 Về mặt học thuật: 1
1.3.2 Về mặt thực tiễn: 2
1.3.3 Học tập của bản thân: 3
1.4 Phạm vi nghiên cứu: 3
1.4.1 Nội dung nghiên cứu giới hạn 3
1.4.2 Đối tượng khảo sát giới hạn 3
1.4.3 Không gian nghiên cứu giới hạn 3
1.4.4 Thời gian nghiên cứu 3
1.5 Bố cục của đề tài 3
CHƯƠNG 2 CƠ SỞ LÝ LUẬN VỀ MỨC ĐỘ CHI TIÊU CỦA SINH VIÊN SINH SỐNG VÀ HỌC TẬP TRÊN ĐỊA BÀN ĐÀ NẴNG 4
2.1 Thu thập dữ liệu 4
2.1.1 Phương pháp chọn mẫu 4
2.1.2 Các nghiên cứu thực nghiệm vàquansát 4
2.1.3 Các thực nghiệm 5
2.1.4 Các kiểu dữ liệu 6
2.1.5 Giả thuyết vô nghĩa và các giả thuyết thay thế 8
2.1.6 Sai số 8
2.1.7 Ước lượng theo khoảng 9
2.1.8 Mức ý nghĩa 11
2.2 Các khái niệm và lí thuyết: 12
2.2.1 Thu nhập (Số tiền có được mỗi tháng): 12
2.2.2 Chi tiêu: 13
Trang 32.2.3 Lý thuyết về thái độ ứng xử của người tiêu dùng và thu nhập của
M.Friedman 13
2.2.1 Các lý thuyết của Keynes 13
CHƯƠNG 3 PHƯƠNG PHÁP NGHIÊN CỨU 15
3.1 Sử dụng biểu mẫu Google Form: 15
3.2 Sử dụng phần mềm SPSS (Statistical Package for the Social Sciences): 17
3.3 Kiến thức học được từ môn học Thống kê Kinh doanh - Kinh tế 17
CHƯƠNG 4 Kết quả phân tích về mức độ chi tiêu của sinh viên sống và học tập trên địa bàn Đà Nằng 19
4.1 Một số bảng thống kê: 19
4.2 Số tiền có được mỗi tháng của sinh viên: 21
4.2.1 Uớc lượng số tiền có được bình quân trong 1 tháng của sinh viên Nam và Nữ sinh sống và làm việc tại thành phố Đà Nằng (Mức ý nghĩa 5%) 22
4.2.2 Uớc lượng tỉ lệ sinh viên sinh sống và học tập tại Đà Nằng có số tiền mỗi tháng từ 3000000 VND trở lên (Mức ý nghĩa 5%) 24
4.3 Sử dụng phương pháp kiểm định để xác thực một số ý kiến: 24
4.3.1 Có ý kiến cho rằng: Số tiền có được mỗi tháng của sinh viên trung bình là 3000000 VNĐ (Mức ý nghĩa 5%) 24
4.3.2 Có ý kiến cho rằng “Tỷ lệ sinh viên chi tiêu quá số tiền có được mỗi tháng là 50% 25
4.3.3 Có ý kiến cho rằng: Chi tiêu bình quân mỗi tháng của sinh viên nam và nữ là bằng nhau 26
4.3.4 Có ý kiến cho rằng: Hình thức ăn uống không ảnh hưởng đến chi phí ăn uống của sinh viên Đà Nằng 27
4.3.5 Kiểm tra dữ liệu phân phối chuẩn 28
4.3.6 Có ý kiến cho rằng: Hình thức ăn uống của sinh viên không chịu ảnh hưởng bởi giới tính 30
4.4 Kiểm định tương quan: 31
4.4.1 Kiểm định có hay không mối quan hệ tương quan tuyến tính giữa số tiền có được mỗi tháng và chi tiêu cho ăn uống mỗi tháng của sinh viên sinh sống và học tập tại Đà Nằng 31
Trang 44.4.2 Kiểm định có hay không mối quan hệ tương quan Hạng giữa số tiền có được mỗi tháng và chi tiêu cho ăn uống mỗi tháng của sinh viên sinh sống và
học tập tại Đà Nằng 31
4.4.3 Phân tích tác động của số tiền có được mỗi tháng đến tiền ăn uống của sinh viên 32
CHƯƠNG 5 HÀM Ý CHÍNH SÁCH: 35
5.1 Đối với sinh viên: 35
5.2 Đối với phụ huynh sinh viên: 36
5.3 Đối với doanh nghiệp: 36
CHƯƠNG 6 KẾT LUẬN: 37
6.1 Kết quả đạt được của đề tài: 37
6.2 Hạn chế: 37
6.3 Hướng phát triển của đề tài: 37
TÀI LIỆU THAM KHẢO 38
Trang 5CHƯƠNG 1 MỞ ĐẦU:
Đối với các bạn sinh viên trên cả nước nói chung và các bạn sinh viên ở Đà Nằngnói riêng, bắt đầu cuộc sống đại học đồng nghĩa với việc bạn sẽ tự làm chủ vấn đềchi tiêu của bản thân Sống xa nhà đồng nghĩa với việc sinh viên phải học cáchthích nghi và tự lập ở môi trường sống mới Để hỗ trợ cho các bạn sinh viên có dựđịnh muốn sinh sống và học tập ở Đà Nằng có thể tính toán chi tiêu một cách hợp
lí, nhóm chúng tôi sẽ tiến hành dự án thống kê “Mức độ chi tiêu của sinh viên đangsinh sống và học tập trên địa bàn Đà Nằng”
1.1.1 Về mặt học thuật:
Sự dụng kiến thức học môn thông kê kinh doanh và kinh tế để thực hiện nghiêncứu Thống kê là nghiên cứu của tập hợp nhiều lĩnh vực khác nhau, bao gồm phântích, giải thích, trình bày và tổ chức dữ liệu Khi áp dụng thống trong khoa
học, công nghiệp hoặc các vấn đề xã hội, thông lệ là bắt đầu với tổng thể thống kêhoặc một quá trình mô hình thống kê sẽ được nghiên cứu Tổng thế có thể gồmnhiều loại khác nhau như “tất cả mọi người đang sống trong một đất nước” hay
“tập hợp các phân tử của tinh thể” Nó đề cập tới tất cả các khía cạnh của dữ liệubao gồm việc lập kế hoạch, thu thập dữ liệu mẫu cho các cuộc khảo sát và thí
nghiệm
Khi không thể thu thập được dữ liệu điều tra dân số, các nhà thống kê thu thập dữliệu bằng cách phát triển các mẫu thí nghiệm và mẫu khảo sát cụ thể Quá trình lấymẫu đại diện đảm bảo rằng những suy luận và kết luận có thể được áp dụng từ mẫucho đến tổng thể Một nghiên cứu thực nghiệm bao gồm việc đo lường hệ thốngđược nghiên cứu, thao tác trên hệ thống và sau đó đo lường thêm, sử dụng cùng thủtục mẫu để xác định xem các thao tác có thay đổi giá trị đo lường hay không Ngượclại, một quan sát nghiên cứu không liên quan đến thao tác thực nghiệm
Hai phương pháp thống kê chính được sử dụng trong phân tích dữ liệu: thống kê
mô tả, đây là phương pháp tóm tắt dữ liệu từ một mẫu sử dụng các chỉ số như là giátrị trung bình hoặc độ lệch chuẩn, và thống kê suy luận, rút ra kết luận từ dữ liệubiến thiên ngẫu nhiên (ví dụ: các sai số quan sát, mẫu của tổng thể) Thống kê mô
tả được sử dụng thường xuyên nhất với hai thuộc tính phân phối (mẫu hoặc tổng
Trang 6thể): chiều hướng trung tâm (hoặc vị trí) tìm cách để mô tả giá trị trung bình hoặc
giá trị đặc trưng của phân phối, trong khi phân tán (hoặc thay đổi) mức độ đặc
trưng mà các thuộc tính của phân phối đi trệch so với nghiên cứu Suy luận về thống kê toán học được thực hiện trong khuôn khổ của lý thuyết xác suất,
bỏ cho một tính chất xác thực không đúng) và sai số loại II (giả thuyết không đượcbác bỏ và sự khác biệt thật sự giữa các tổng thể được bỏ qua cho một phủ định sai).Một việc quan trọng là tập hợp các giá trị của các ước lượng dẫn đến bác bỏ giảthuyết vô nghĩa Do đó sai số của xác suất loại I là xác suất các ước lượng thuộccác miền quan trọng cho rằng giả thuyết đúng (có ý nghĩa thống kê) và sai số củaxác suất loại II là xác suất mà các ước lượng không phụ thuộc các lớp quan trọngđược đưa ra rằng giả thuyết thay thế là đúng Các chính sách thống kê của một bàiđánh giá xác suất đúng khi bác bỏ giả thuyết vô nghĩa khi giả thuyết là sai Nhiềuvấn đề đã được liên kết với khôn khổ: từ việc có được một cỡ mẫu đủ để xác địnhmột giả thuyết vô nghĩa thích hợp
Quy trình đo lường để tạo ra các dữ liệu thống kê cũng có thể bị lỗi Phần nhiềutrong số các lỗi này được chia làm hai loại: ngẫu nhiên (noise - dữ liệu vô nghĩa)hoặc có hệ thống (bias - độ chệch), nhưng các loại sai lệch khác (ví dụ, sai lệch khingười phân tích báo cáo sai các đơn vị đo lường) cũng rất quan trọng Sự xuất hiệncủa dữ liệu bị thiếu hoặc sự kiểm duyệt có thể dẫn đến các ước tính bị chệch vànhững kỹ thuật cụ thể đã được phát triển để giải quyết những vấn đề này
- Tìm ra được các mối liên hệ ảnh hưởng đến chi tiêu của sinh viên
- Khảo sát các 5 nhóm chi tiêu cơ bản của sinh viên: Tiền trọ, tiền ăn uống,tiền đi lại, tiền mua sắm dụng cụ học tập và tiền cho các hoạt động vui chơi
Trang 7giải trí.
Trang 81.1.4 Nội dung nghiên cứu giới hạn: Mức độ chi tiêu hàng tháng.
1.1.5 Đối tượng khảo sát giới hạn: Sinh viên đang sinh sống và học tập trên
địa bàn Đà Nằng
1.1.6 Không gian nghiên cứu giới hạn: Thành phố Đà Nằng
1.1.7 Thời gian nghiên cứu: Từ ngày 28/09/2020 đến ngày 10/11/2020
- Chương 1: Mở đầu
- Chương 2: Cơ sở lý luận về mức độ chi tiêu của sinh viên sinh sống và họctập trên địa bàn Đà Nằng
- Chương 3: Phương pháp nghiên cứu
- Chương 4: Kết quả phân tích về mức độ chi tiêu của sinh viên sống và họctập trên địa bàn Đà Nằng
- Chương 5: Hàm ý chính sách
- Chương 6: Kết luận
- Tài liệu tham khảo
Trang 9CHƯƠNG 2 CƠ SỞ LÝ LUẬN VỀ MỨC ĐỘ CHI TIÊU CỦA SINH
VIÊN SINH SONG VÀ HỌC TẬP TRÊN ĐỊA BÀN ĐÀ
Lý thuyết chọn mẫu là một phần của lý thuyết xác suất thống kê toán Xác suấtđược sử dụng trong “toán học thống kê” (cách khác “lý thuyết thống kê”) để nghiêncứu sự phân bố lấy mẫu thống kê mẫu và các tính chất của thủ tục thống kê Việc
sử dụng các phương pháp thống kê là được chấp nhận khi các phương pháp hoặcthống kê mẫu tổng thể đủ thông tin để chấp nhận giả thuyết
Sự khác biệt trong quan điểm giữa lý thuyết xác suất cổ điển và lý thuyết xác suấtlấy mẫu là xấp xỉ, lý thuyết xác suất bắt đầu từ các tham số cho tổng quy mô mẫu
để suy ra xác suất mẫu Tuy nhiên phương pháp thống kê phát triển theo hướng đốilập - quy nạp từ các mẫu để các thông số lớn hơn hoặc tổng quy mô mẫu
1.1.9 Các nghiên cứu thực nghiệm và quan sát
Mục đích cho một dự án nghiên cứu thống kê là điều tra nguyên nhân, và từ đó rút
ra kết luận của những thay đổi ảnh hưởng đến giá trị các nhân tố ảnh hưởng hoặccác biến độc lập dựa trên các biến phụ thuộc hoặc trả lời cho nghiên cứu Có hailoại chính của nghiên cứu thống kê các biến nguyên nhân: nghiên cứu thực nghiệm
và nghiên cứu quan sát Cả hai loại nghiên cứu này đều có sự tác động của biến độclập (hoặc các biến) về hành vi của các biến phụ thuộc được quan sát Sự khác biệtgiữa hai biến này nằm ở cách nghiên cứu dựa trên thực tế Mỗi biến có thể có ý
Trang 10nghĩa Nghiên cứu thực nghiệm liên quan đến việc lấy kích thước mẫu nghiên cứu,
thao tác hệ thống và thêm vào kích thước mẫu sử dụng cho quá trình lấy
Các bước cơ bản của một nghiên cứu thống kê là:
Lập kế hoạch nghiên cứu, bao gồm việc tìm kiếm số liệu để trả lời cho các nghiêncứu Sử dụng các thông tin sau: ước tính sơ lược về kích thước của hiệu quả điềutra, các giả thuyết, các biến khảo sát dự định Xem xét việc lựa chọn đối tượngkhảo sát và đúng quy trình nghiên cứu Các nhà thống kê cho rằng nên so sánh thửnghiệm một cách đáng tin cậy với tiêu chuẩn mẫu hoặc tiêu chuẩn so sánh một kếtquả nghiên cứu Chấp nhận ước lượng không chệch của mức ý nghĩa đáng tin cậy.Thiết kế nghiên cứu nhằm ngăn sự ảnh hưởng của các biến gây nhiễu và phân bốmẫu ngẫu nhiên của hệ số tin cậy cho các đối tượng để ước lượng không chệch củamức ý nghĩa đáng tin cậy và sai sót trong nghiên cứu Ở giai đoạn này, các thínghiệm và các thống kê viết giao thức nghiên cứu mà chính việc hướng dẫn thựchiện các thí nghiệm và chỉ ra những phân tích ban đầu của các dữ liệu nghiên cứu.Kiểm tra các nghiên cứu sau các giao thức thử nghiệm và phân tích dữ liệu và phântích
Kiểm tra thêm các dữ liệu thiết lập trong phân tích thứ cấp, đề xuất giả thuyết mớicho các nghiên cứu sau này
Tìm kiếm tài liệu và trình bày kết quả nghiên cứu
Các thí nghiệm về nghiên cứu hành vi con người có mối liên quan đặc biệt Cácnghiên cứu nổi tiếng của Hawthorne, nghiên cứu về những thay đổi trong môi
Trang 11trường làm việc tại nhà máy Hawthorne của Công ty Western Electric Các nhà
Trang 12nghiên cứu đã quan tâm đến việc xác định liệu tăng việc chiếu sáng có tăng năng
suất làm việc của công nhân lắp ráp Đầu tiên, các nhà nghiên cứu đã đo
Nghiên cứu quan sát
Một ví dụ của nghiên cứu quan sát là một trong những khám phá sự tương quangiữa giữa việc hút thuốc lá và ung thư phổi Nghiên cứu này thường sử dụng việcđiều tra để thu thập các quan sát về các khu vực tham gia nghiên cứu và sau đóthực hiện các phân tích thống kê Trong trường hợp này, những nhà nghiên cứu thuthập các quan sát của những người hút thuốc và không hút thuốc, có thể thông quamột nghiên cứu về bệnh chứng, và sau đó tìm số liệu các trường hợp ung thư phổitrong mỗi nhóm điều tra
1.1.11 Các kiểu dữ liệu
Các biến thử khác nhau đã được tạo ra để phân loại mức độ đo lường Các nhà tâm
lý Stanley Smith Stevens đã xác định thang đo danh nghĩa, thứ tự, khoảng thời gian
và tỷ lệ đo Thang đo danh nghĩa không có thứ tự xếp hạng có ý nghĩa trong các giátrị, và cho phép chuyển đổi một-một Thang đo thứ tự có sự khác biệt chính xácgiữa các giá trị liên tiếp, nhưng có một thứ tự có ý nghĩa giá trị và cho phép bất kỳchuyển đổi nào để chuyển đổi Đo khoảng thời gian có ý nghĩa và khoảng cáchgiữa các phép đo được xác định, nhưng giá trị bằng không là tùy ý (như trongtrường hợp số dôi kinh độ và độ C hoặc độ F), và cho phép bất kỳ chuyển đổi tuyếntính Đo tỷ lệ có cả một giá trị số không có ý nghĩa và khoảng cách giữa các phép
đo khác nhau được xác định, và cho phép chuyển đổi sang sự thay đổi tỷ lệ
Vì các biến chỉ phù hợp cho thang đo danh nghĩa hoặc thang đo thứ tự, không thể
đo lường một cách hợp lý về số lượng, đôi khi chúng được nhóm lại với nhau nhưcác biến phân loại, trong khi thang đo tỷ lệ và thang đo thời gian được nhóm lại với
Trang 13nhau như là các biến định tính, những biến có thể rời rạc hoặc liên tục do tính chất
số lượng Chúng thường được phân biệt như vậy thường ít tương quan với các dữ
Trang 14liệu trong nghiên cứu khoa học lưu trữ và phân tích thông tin được đưa vào Trong
đó các biến phân loại phân đôi có thể được đại diện với các kiểu dữ liệu Boolean
(sử dụng hệ thống dữ liệu lý luận như AND, OR, NOT để xác định quan hệ giữa các thực thể), biến phân loại Polytomous với số nguyên và các biến liên tục với
các loại dữ liệu nghiên cứu khoa học lưu trữ và phân tích thông tin được đưa vào.
Nhưng các bản đồ của các kiểu dữ liệu khoa học lưu trữ và phân tích thông tin đưa
vào với các loại dữ liệu thống kê phụ thuộc vào phân loại sau khi được thực hiện.
Vấn đề có thích hợp hay không để áp dụng các loại khác nhau của các phương phápthống kê số liệu thu được từ các loại khác nhau của các phương pháp đo lườngphức tạp do các vấn đề liên quan đến việc chuyển đổi các biến và giải thích chínhxác các câu hỏi đặt ra nghiên cứu “mối quan hệ giữa các dữ liệu và những gì dữliệu mô tả đơn thuần phản ánh một thực tế là một số loại báo cáo thống kê có thể cógiá trị chân lý đó không phải là bất biến theo một số biến thay đổi Có hay khôngmột sự chuyển đổi hợp lý để chiêm ngưỡng phụ thuộc vào câu hỏi ai đang cố gắng
để trả lời”
Hãy xem xét một mẫu các phân phối độc lập có cùng tính chất, các biến ngẫu nhiênvới một phân phối xác suất nhất định: suy luận thống kê và lý thuyết tính toán xácđịnh một mẫu ngẫu nhiên là véc tơ ngẫu nhiên được đưa ra bởi các véc tơ theo cộtcủa các biến phân phối độc lập có cùng tính chất Tổng thể được chọn làm mẫuđược mô tả bởi một phân phối xác suất mà có thể có tham số chưa biết
Một thống kê là một biến ngẫu nhiên, đó là một chức năng của các mẫu ngẫu nhiên,nhưng không phải là chức năng của các tham số chưa biết Mặc dù các phân phốimẫu của xác suất thống kê có thể có tham số chưa biết
Xem xét chức năng của các tham số chưa biết: một ước lượng là một thống kê được
sử dụng để ước lượng hàm này Ước lượng thường được sử dụng bao gồm ý nghĩacủa mẫu khảo sát, không gồm mẫu phương sai và hiệp phương sai mẫu
Biến ngẫu nhiên là một hàm của mẫu ngẫu nhiên và các tham số chưa biết, nhưng
có phân phối xác suất không phụ thuộc vào các tham số chưa biết, được gọi là mộtđại lượng quan trọng hay biến phụ thuộc Sử dụng biến phụ thuộc bao gồm các chỉ
số z, các số liệu thống kê chi bình phương và giá trị t-value của phân phối Student.Giữa hai ước lượng của một tham số cho trước, với ước lượng điểm trung bình bìnhphương được cho rằng có hiệu quả hơn Hơn nữa một ước lượng được cho là giá trị
Trang 15tiệm cận nếu giá trị kỳ vọng của nó bằng với giá trị thực của tham số chưa biết
được ước tính, và là giá trị tiệm cận nếu giá trị kỳ vọng của nó hội tụ ở giới
đánh giá phù hợp cùng quy về trong xác suất để đúng với giá trị của tham số.
Điều này vẫn còn để lại những câu hỏi làm thế nào để có ước lượng trong một tìnhhuống nhất định và thực hiện các tính toán, một phương pháp đã được đề xuất: cácphương pháp trong thời điểm hiện tại, những phương pháp likelihood lớn nhất,phương pháp bình phương nhỏ nhất và phương pháp gần nhất của ước lượngphương trình
1.1.12 Giả thuyết vô nghĩa và các giả thuyết thay thế
Giải thích thông tin thống kê có thể bao gồm sự phát triển của một giả thuyết trong
đó giả định rằng bất cứ điều gì xảy ra được đề xuất như là một nguyên nhân không
có hiệu quả trên các biến đo lường
Minh họa tốt nhất cho một người mới làm thống kê là gặp phải tình trạng khó khănkhi thử nghiệm với những người khảo sát Các giả thuyết không có giá trị H0,khẳng định rằng bị cáo là vô tội, trong khi các giả thuyết khác H1, khẳng định rằng
bị cáo có tội Bản cáo trạng đưa ra những nghi ngờ về việc có tội Các giả thuyếtH0 (hiện trạng) đối lập với giả thuyết H1 và được tồn tại khi H1 được hỗ trợ bằngcác chứng cứ “bác bỏ những điều vô lý” Tuy nhiên “không đạt yêu cầu để bác bỏgiả thuyết H0” trong trường hợp không bao gồm tính vô tội, nhưng chỉ đơn thuần làkhông đủ bằng chứng để buộc tội Vì vậy, người được khảo sát không nhất thiếtphải chấp nhận H0 nhưng không bác bỏ H0 Trong khi người ta không thể “chứngminh” một giả thuyết, người ta có thể kiểm tra xấp xỉ để đưa ra phương pháp thửnghiệm, phương pháp kiểm tra các sai số loại II
Những gì các nhà thống kê gọi là một giả thuyết có một hoặc hai khả năng xảy rachỉ đơn giản là một giả thuyết trái ngược với giả thuyết vô nghĩa
1.1.13 Sai số
Tác động từ giả thuyết hai loại sai số cơ bản được ghi nhận:
Sai số loại I là giả thuyết rỗng bị bác bỏ là sai khi “bác bỏ phủ định”
Trang 16Sai số lại II là giả thuyết không rỗng được bác bỏ để loại bỏ và sự khác biệt trênthực tế giữa các quần thể được bỏ qua cho một “bác bỏ khẳng định”
Độ lệch chuẩn đề cập đến mức độ các quan sát cá nhân trong mẫu khác với một giátrị trung tâm, chẳng hạn như các mẫu hoặc ý nghĩa tổng thể, trong khi sai số chuẩn
đề cập đến một ước tính của sự khác biệt giữa trung bình mẫu và ý nghĩa tổng thể.Một lỗi thống kê là số lượng mà một quan sát khác với giá tị kỳ vọng của nó, giá trịthặng dư là số lượng một quan sát khác với giá trị ước lượng giả định giá trị dựkiến về một mẫu nhất định (còn gọi là dự đoán)
Sai số bình phương có nghĩa khi được sử dụng cho việc ước lượng hiệu quả thuthập dữ liệu, một lớp được sử dụng rộng rãi trong ước lượng Sai số căn bậc haiđơn giản là căn bậc hai của sai số căn bậc hai có nghĩa
Nhiều phương pháp thống kê nhằm giảm thiểu tổng giá trị thặng dư của bìnhphương, và chúng được gọi là “phương pháp bình phương nhỏ nhất” trái ngược với
độ lệch chuẩn nhỏ nhất Sau đó cung cấp cung cấp số lượng bằng với các lỗi nhỏ vàlớn, trong khi trước đây chỉ ra rõ các sai số lớn hơn Tổng giá trị thặng dư của giátrị bình phương có thể phân biệt được, nó cung cấp thuộc tính có ích để tính hàmhồi quy Bình phương tối thiểu áp dụng hồi quy tuyến tính được gọi là bình phươngnhỏ nhất thông thường và bình phương nhỏ nhất chấp nhận cho hàm hồi quy phituyến tính được gọi là bình phương tối thiểu phi tuyến tính Cũng trong một môhình hồi quy tuyến tính các phần không xác định của mô hình được gọi là sai sốgiới hạn, bị nhiễu hoặc có thể là dữ liệu thừa
Tiến trình đo lường tạo ra số liệu thống kê cũng có thể có sai số Nhiều trong số cácsai số này được phân loại ngẫu nhiên (dữ liệu thừa) hoặc hệ thống (độ sai lệch),nhưng các loại sai số khác (ví dụ: sai lệch, chẳng hạn như khi một báo cáo phântích của các đơn vị không chính xác) cũng quan trọng Sự xuất hiện của dữ liệu bịmất và/ hoặc kiểm định, điều này có thể dẫn đến ước lượng sai lệch và từ đó đãphát triển một phương pháp cụ thể để giải quyết vấn đề này.1161
1.1.14 Ước lượng theo khoảng
Khoảng tin cậy: dòng màu đỏ là giá trị thực cho giá trị trung bình trong ví dụ này,đường màu xanh là khoảng tin cậy ngẫu nhiên cho 100 giá trị
Trang 17Hầu hết các nghiên cứu chỉ ra là một phần của một mẫu tổng thể, vì vậy kết quảkhông hoàn toàn đại diện cho toàn bộ tổng thể Bất kỳ ước tính thu được từ mẫu chỉgần đúng với giá trị tổng thể Khoảng tin cậy cho phép các nhà thống kê thể hiệnchặt chẽ các mẫu dự tính phù hợp với các giá giá trị thực trong toàn bộ tổng thể.Thông thường chúng được thể hiện ở khoảng tin cậy 95% Chính thức khoảng tincậy 95% cho một giá ở phạm vi rộng, nếu lấy mẫu và phân tích được lặp đi lặp lạitrong cùng một điều kiện (cho ra bộ dữ liệu khác nhau), khoảng cách giữa hai giátrị sẽ bao gồm giá trị thật (tổng thể) đạt 95% giá trị trong tổng số các trường hợp cóthể xảy ra Điều này không có nghĩa là xác suất mà giá trị thực trong khoảng tin cậy
là 95% Từ những quan điểm, kết luận như vậy là không có nghĩa, như là giá trịthực không phải là một biến ngẫu nhiên Hoặc là giá trị thực hoặc trong phải trongmột khoảng tin cậy Tuy nhiên, sự thật là trước khi bất kỳ dữ liệu nào được lấy mẫu
và đưa ra kế hoạch làm thế nào để tạo ra khoảng tin cậy, xác suất là 95% chokhoảng tin cậy chưa được thống kê sẽ bao gồm các giá trị đúng: tại thời điểm này,giới hạn của khoảng tin cậy là các biến ngẫu nhiên chưa được quan sát Mộtphương pháp mà không mang lại một khoảng tin cậy được hiểu là một xác suấtnhất định có chứa các giá trị thực sử dụng trong một khoảng tin cậy từ thống kêBayesian: phương pháp này phụ thuộc vào cách giải thích khác nhau thế nào là
“xác suất”, đó như là xác suất Bayesian
Trong nguyên tắc chọn khoảng tin cậy có thể được đối xứng hoặc không đối xứng.Một khoảng tin cậy có thể không đối xứng vì nó hoạt động thấp hơn hoặc cao hơncác ràng buộc cho một tham số (khoảng tin cậy phía trái hoặc phải), nhưng nó cũng
có thể là không đối xứng vì khoảng hai chiều được xây dựng đối xứng trong dựtính Đôi khi các giới hạn cho một khoảng tin cậy đạt được tiệm cận và được sửdụng để ước tính giới hạn
Trang 181.1.15 Mức ý nghĩa
Trong biểu đồ này dòng màu đen là phân phối xác suất cho các kiểm định thống kê,các miền quan trọng là tập hợp các giá trị bên phải của điểm dữ liệu được quan sát(giá trị quan sát của kiểm định thống kê) và giá trị p-value được đại diện bởi cáckhu vực màu xanh lá cây
Thống kê hiếm khi chỉ trả lời các câu hỏi dưới dạng có/không dưới các phân tích
Sự giải thích thường đi xuống đến mức ý nghĩa thống kê áp dụng với số lượng vàthường đề cập đến xác suất của một giá trị chính xác từ chối giả thuyết rỗng (có thểxem như là giá trị p-value)
Phân phối chuẩn là để thử nghiệm một giả thuyết đối với một giả thuyết khác Mộtmiền quan trọng là để tập hợp các giá trị của các ước lượng dẫn đến bác bỏ giảthuyết rỗng Do đó xác suất của sai số loại I là xác suất mà các ước lượng thuộc cáckhu vực quan trọng cho rằng giải thuyết đúng (có ý nghĩa thống kê) và xác suất sai
số loại II là xác suất mà các ước lượng không thuộc miền quan trọng được đưa rabằng giả thuyết thay thế là đúng Các số lượng thống kê của một thử nghiệm là xácsuất mà nó đúng bác bỏ giả thuyết rỗng khi giả thuyết là sai
Trang 19Đề cập đến mức ý nghĩa thống kê không nhất thiết là kết quả của tổng thể so với sốhạng thực Ví dụ, trong một nghiên cứu lớn về một loại thuốc có thể chỉ ra rằngthuốc có tác dụng mang lại lợi ích đáng kể về mặt thống kê nhưng rất nhỏ, như vậyloại thuốc này dường như không có khả năng tác dụng nhiều cho bệnh nhân.
Trong khi về nguyên tắc mức chấp nhận ý nghĩa được thống kê có phải xem xétvấn đề, các giá trị p-value là mức ý nghĩa nhỏ nhất cho phép thử nghiệm để bác bỏgiả thuyết Kết quả tương đương nói rằng các giá trị p-value là xác suất, giả địnhgiả thuyết là đúng, kết quả quan sát là cực kỳ thấp như kiểm định thống kê Do đógiá trị p-value càng nhỏ, xác suất sai số loại I càng thấp
Một vấn đề thường xảy ra với loại này:
Một sự khác biệt đó là có ý nghĩa thống kê cao vẫn có thể không có ý nghĩa, nhưng
nó có thể phát biểu đúng các kiểm định trong thống kê Một câu trả lời trở thành giảthuyết chỉ có mức ý nghĩa bao gồm các giá trị p-value, tuy nhiên không biết đượckích thước hay tầm quan trọng của kiểm định quan sát được và cũng có thể kết luậnđược tầm quan trọng của các khác biệt nhỏ trong các nghiên cứu lớn Một cách tiếpcận tốt hơn và ngày càng phổ biến là để báo cáo khoảng tin cậy Mặc dù chúngđược đưa ra từ việc tính toán tương tự như những kiểm định giả thuyết hoặc giá trịp-value, mô tả kích thước của ảnh hưởng và những điều không chắc chắn
Độ sai lệch của thay đổi điều kiện, những ý kiến sai lầm của Aka: những lời phêbình chỉ ra các giá trị để kiểm định giả thuyết (giả thuyết vô nghĩa) được ưachuộng, vì xác suất của kết quả của giả thuyết vô nghĩa đưa ra kết quả quan sátđược Một thay thế cho phương pháp này được đưa ra bởi suy luận Bayesian, mặc
dù nó đòi hỏi việc một xác suất cho trước
Bác bỏ giả thuyết không tự động chứng minh được giả thuyết thay thế
Như tất cả mọi thứ trong thống kê suy luận nó dựa vào kích thước mẫu, và do đódưới miền giá trị p-value giá trị có thể không được tính
2.2 Các khái niệm và lí thuyết:
1.1.16 Thu nhập (Số tiền có được mỗi tháng):
- Dưới góc độ kế toán: (1) Sự vượt quá doanh thu hơn chi phí cho một kỳ kế toán.Còn được gọi là thu nhập hoặc lợi nhuận gộp (2) Một số tiền mà tổng tài sản tăngtrong kỳ kế toán
Trang 20- Kinh tế: Tiêu thụ mà vào cuối một thời kì, sẽ để lại mỗi cá nhân với cùng mộtlượng hàng hóa (và sự mong đợi của hàng hóa tương lai) như khi bắt đầu của thời
kỳ đó Do đó, thu nhập có nghĩa là số tiền tối đa một cá nhân có thể chi tiêu trongmột thời gian mà không bị bất kỳ trở ngại nào Thu nhập (và không phải GDP) làđộng cơ thúc đẩy một nền kinh tế bởi vì chỉ có nó có thể tạo ra nhu cầu
- Dưới góc độ pháp luật: tiền hoặc các hình thức thanh toán khác (nhận định kỳhoặc thường xuyên) từ thương mại, việc làm, cung cấp vốn, đầu tư, tiền bản quyền,vv
Tóm lại thu nhập là dòng chảy của tiền mặt hoặc tương đương tiền mặt nhận được
từ công việc (tiền lương hoặc tiền thưởng), vốn (lãi suất hoặc lợi nhuận), hoặc đất(thuê)
1.1.17 Chi tiêu:
Thanh toán tiền mặt hoặc tương đương tiền mặt đối với hàng hóa, dịch vụ, hoặcmột khoản phí đối với nguồn kinh phí giải quyết các nghĩa vụ được minh chứngbằng một hóa đơn, biên lai, chứng từ, tài liệu, vv Nó chính là hành động nhằmthỏa mãn những nguyện vọng, trí tưởng tượng riêng và các nhu cầu về tình cảm,vật chất của một cá nhân hoặc hộ gia đình nào đó thông qua việc mua sắm các sảnphẩn và việc sử dụng các sản phẩm đó
1.1.18 Lý thuyết về thái độ ứng xử của người tiêu dùng và thu nhập của
M.Friedman
Trước hết, về thái độ ứng xử của người tiêu dùng, theo M.Friedman trong điều kiện
ổn định sẽ có hai nguyên nhân làm cho tiêu dùng cao hơn thu nhập là: Sự ổn địnhchi và các khoản thu nhập tăng lên Sự tiêu dùng thông thường phụ thuộc vào thunhập, lãi suất và thu nhập từ tài sản vật chất
Thứ hai, về thu nhập, theo M.Friedman , thu nhập (Y) trong một thời kỳ nhất địnhbao gồm: thu nhập thường xuyên Yp và thu nhập tức thời (Yt) Giữa tiêu dùngthường xuyên và thu nhập thường xuyên có mối quan hệ với nhau M.Friedman chorằng tiêu dùng thường xuyên phụ thuộc vào lãi suất, tương quan giữa tài sản vậtchất với thu nhập thường xuyên và sự phân chia thu nhập cho tiêu dùng và tiếtkiệm là chính chứ không phải là thu nhập thường xuyên
1.1.1 Các lý thuyết của Keynes
- Khuynh hướng tiêu dùng và khuynh hướng tiết kiệm
Trang 21Khuynh hướng tiêu dùng phản ánh mối tương quan giữa thu nhập mà mối tươngquan giữa thu nhập và số chi cho tiêu dùng được rút ra từ thu nhập đó Những nhân
tố ảnh hưởng: thu nhập của dân cư; những nhân tố khách quan ảnh hưởng tới thunhập (thuế suất, giá cả, thay đổi của mức tiền công danh nghĩa); nhân tố chủ quanảnh hưởng tới tiêu dùng (hầu hết là các nhân tố chi phối hành vi tiết kiệm)
- Khuynh hướng tiết kiệm: phản ánh mối tương quan giữa thu nhập và tiết kiệm+ Tiết kiệm cá nhân (phụ thuộc 8 nhân tố): thận trọng, nhìn xa, tính toán, kinhdoanh, tự lập, tham vọng, kiêu hãnh, hà tiện
Khi việc làm tăng thì tổng thu nhập thực tế tăng Tâm lý chung của dân chúng làkhi thu nhập tăng, tiêu dùng sẽ tăng, nhưng mức tăng của tiêu dùng chậm hơn mứctăng của thu nhập và khuynh hướng gia tăng tiết kiệm một phần thu nhập
Trang 22CHƯƠNG 3 PHƯƠNG PHÁP NGHIÊN CỨU.
3.1.Sử dụng biểu mẫu Google Form:
Để thuận tiện cho việc nghiên cứu, với số lượng ít nhất là 100 quan sát (100 sinhviên), chúng tôi sử dụng biểu mẫu Google Form để thu thập dữ liệu
Bảng khảo sát gồm 21 câu hỏi như sau (Đặc biệt, có thêm 1 câu hỏi phụ nhằm xácđịnh người điền mẫu có phải là sinh viên sinh sống và học tập tại Đà Nằng haykhông; Mục đích là để giới hạn và đảm bảo dữ liệu chính xác phù hợp với mục tiêunghiên cứu):
BẢNG CÂU HỎI KHẢO SÁT
Q1 Bạn hiện bao nhiêu tuổi: Q2 Giới tính:
Q4.1 Ba mẹ hoặc người thân chu cấp
Q4.2 Công việc làm thêm
Q4.3 Học bổng, các khoản hỗ trợ từ nhà trường, tổ
Q4.4 Vay vốn
Q5 Bạn lệ thuộc nhiều nhất vào khoản tiền từ:
1 Ba mẹ hoặc người thân chu cấp
2 Công việc làm thêm
Trang 231 Tự nấu ăn, người nhà nấu
2 Ăn ở quán, mua đồ ăn mang về
3 Linh hoạt giữa 2 cách
Q10 Bạn chi khoảng bao nhiêu tiền cho việc ăn uống mỗi tháng:
Q11 Hình thức di chuyển mà bạn sử dụng thường xuyên nhất:
Q15 Bạn chi bao nhiêu tiền cho các hoạt động giải trí mỗi tháng:
Q16 Bạn chi bao nhiêu tiền cho các hoạt động mua sắm áo quần, giày dép mỗi
Trang 24Q18 Nếu có, bạn chi bao nhiêu cho tất cả các khoản ở câu hỏi trên mỗi tháng:
Q19 Mỗi tháng bạn dự tính sẽ dành dụm được bao nhiêu (Đây là khoản dự phòng kiêm tiết kiệm mỗi tháng) :
Q20 Bạn có hài lòng với mức chi tiêu hàng tháng của mình:
Q21 Đánh giá với mức tiền là 3000000 VNĐ mỗi tháng có đủ cho một sính viên sinh sống và học tập tại Đà Nắng:
3.2.Sử dụng phần mềm SPSS (Statistical Package for the Social Sciences):
Phần mềm SPSS là một chương trình máy tính phục vụ công tác thống kê, hỗ trợ xử
lí và phân tích dữ liệu sơ cấp - là các thông tin được thu thập trực tiếp từ đối
tượng nghiên cứu, thường được sử dụng rộng rãi trong các nghiên cứu điều tra xã hội học và kinh tế lượng SPSS có các tính năng cơ bản sau:
bảng minh họa, tính toán số liệu và phân tích số liệu.
những xu hướng, mối liên hệ mà có thể bạn không để ý.
Với sự hướng dẫn của giáo viên bộ môn, chúng tôi sẽ sử dụng phần mềm này để xử
lí dữ liệu và cho ra các kết quả hữu ích.
3.3.Kiến thức học được từ môn học Thống kê Kinh doanh - Kinh tế
Sử dụng kiến thức học được từ môn thống kê như:
- Thống kê mô tả
- T - Test
- Ước lượng trung bình của tổng thể
- Ước lượng tỷ lệ của tổng thể
- Kiểm định trung bình của tổng thể với hằng số