ĐẠI HỌC UEH TRƯỜNG KINH TẾ, LUẬT VÀ QUẢN LÝ NHÀ NƯỚC KHOA TOÁN – THỐNG KÊ DỰ ÁN CUỐI KỲ MÔN THỐNG KÊ ỨNG DỤNG TRONG KINH DOANH Lớp 22D1STA50800531 Giảng viên TS Chu Nguyễn Mộng Ngọc Người thực hiện 1.
Trang 1ĐẠI HỌC UEH TRƯỜNG KINH TẾ, LUẬT VÀ QUẢN LÝ NHÀ NƯỚC
KHOA TOÁN – THỐNG KÊ
DỰ ÁN CUỐI KỲ MÔN THỐNG KÊ ỨNG DỤNG TRONG KINH DOANH
Lớp: 22D1STA50800531 Giảng viên: TS Chu Nguyễn Mộng Ngọc Người thực hiện:
1 Nguyễn Thị Hồng Liên
2 Vương Quế Phương
3 Trần Thu Bảo Châu
4 Trần Thục Đoan
5 Nguyễn Gia Bảo
6 Lưu Bá Toàn
7 Nguyễn Phương Phi
TP Hồ Chí Minh, ngày 30 tháng 04 năm 2022
Trang 2MỤC LỤC
LỜI MỞ ĐẦU 1
Câu 1 2
a Lập bảng tần số mô tả giới tính Sau đó sử dụng đồ thị phù hợp mô tả lại kết quả bảng tần số này (đồ thị phải vẽ bằng Excel) 2
b Lập bảng tần số mô tả tình trạng hôn nhân Sau đó sử dụng đồ thị phù hợp mô tả lại kết quả bảng tần số này (đồ thị phải vẽ bằng Excel) 2
Câu 2 Lập biểu đồ nhánh lá mô tả tuổi 3
Câu 3 Lập bảng tần số cho thu nhập trên cơ sở phân chia đều thu nhập thành 6 nhóm Sau đó vẽ histogram cho thu nhập (khuyến khích sử dụng Excel nhưng không bắt buộc) 3
Câu 4 Lập bảng hai biến cho biến thu nhập (biến thu nhập này là kết quả phân nhóm của câu 3) và biến có nhà hay không có nhà, nhận xét sự khác biệt về thu nhập giữa hai nhóm 4
Câu 5 Lập bảng các đai lượng thống kê mô tả (Trung bình, Trung vị, yếu vị mode, phương sai, tứ phân vị) về tuổi, các đại lượng này phải tính thủ công, có công thức rõ ràng, chia theo hai nhóm có và không có bằng lái xe So sánh các số liệu 6
Câu 6 Vẽ box plot mô tả đồng thời tuổi của hai nhóm có và không có bằng lái xe trên cùng hệ trục, nhận xét 11
Câu 7 Vẽ đồ thị phân tán mô tả mối quan hệ giữa số thẻ tín dụng và số năm đi làm; giữa thu nhập và số năm đi học bằng Excel Nhận xét 2 đồ thị này 12
Câu 8 Tính hệ số thể hiện mối quan hệ tương quan giữa số thẻ tín dụng và số năm đi làm thu nhập và số năm đi học Nhận xét đáp số 13
Câu 9 Xây dựng khoảng ước lượng về số con với độ tin cậy 90% 15
Câu 10 Kiểm định sự khác biệt thu nhập giữa nam và nữ Nhận xét Chọn độ tin cậy 95% 16
LỜI KẾT 18
TÀI LIỆU THAM KHẢO 19
Trang 3LỜI MỞ ĐẦU
Trong môi trường kinh doanh và kinh tế toàn cầu hiện nay, bất cứ ai cũng có thể truy cập một lượng lớn thông tin thống kê Vì vậy, thông qua bộ môn “Thống kê ứng dụng trong kinh tế và kinh doanh” chúng ta có thể rèn luyện kỹ năng xử lý phân tích thông qua các bảng, biểu số liệu, để từ đó có thể đưa ra những nhận định đúng đắn, đồng thời
có thể bắt kịp với xu hướng phát triển hiện nay
Nắm bắt được những ý tưởng này, nhóm chúng em dưới sự phân công và số liệu của
cô Mộng Ngọc đã thực hiện các nghiệp vụ trong dự án thống kê này nhằm mục đích luyện tập cho mỗi thành viên có cái nhìn khách quan và để nghiên cứu sâu hơn vấn đề được giao sẵn Dự án này có mục tiêu là hệ thống lại cơ sở những kiến thức chúng em vừa học sau một học kì và là để đánh giá lại lượng kiến thức của từng thành viên
Để có thể hoành thành được dự án này, chúng em đã cố gắng sắp xếp thời gian để có thể cùng hoạt động với nhau nhằm mang lại kết quả chỉn chu nhất Vì là nhóm lần đầu phối hợp cũng như là kinh nghiệm còn non trẻ nên dự án này có thể không hoàn thiện hết và đề cập hết tất cả các mặt liên quan Mong các thầy, cô và các bạn đọc, đặc biệt giảng viên phụ trách là cô Chu Nguyễn Mộng Ngọc có thể bỏ qua những sai sót nhỏ Nhóm chúng em mong rằng có thể nhận được những lời góp ý từ cô để nhóm ngày một hoàn thiện hơn
Chúng em xin chân thành cảm ơn!
DANH SÁCH THÀNH VIÊN ST
1 Nguyễn Thị Hồng Liên 31211025969 100% Nhóm trưởng
3 Trần Thu Bảo Châu 31211020883 100%
5 Nguyễn Phương Phi 31211026995 100%
6 Vương Quế Phương 31211026029 100%
Thực hiện các nghiệp vụ thống kê sau
Trang 4Câu 1.
a Lập bảng tần số mô tả giới tính Sau đó sử dụng đồ thị phù hợp mô tả lại kết quả bảng tần số này (đồ thị phải vẽ bằng Excel)
Bảng phân phối tần số
Giới tính Tần số (người) Tần suất Tần suất phần trăm (%)
Đồ thị phân phối mô tả giới tính
Nam Nữ
b Lập bảng tần số mô tả tình trạng hôn nhân Sau đó sử dụng đồ thị phù hợp mô tả lại kết quả bảng tần số này (đồ thị phải vẽ bằng Excel).
Bảng phân phối tần số
Tình trạng hôn nhân (người)Tần số Tầnsuất Tần suất phầntrăm (%)
Trang 5Đồ thị phân phối mô tả tình trạng
hôn nhân
Độc thân
Có gia đình
Ly hôn
Câu 2 Lập biểu đồ nhánh lá mô tả tuổi
Đồ thị nhánh lá mô tả tuổi
1 8 8 9 9 9
2 1 1 1 2 2 3 3 3 5 5 5 5 6 6 6 7 8 8 8 9
3 1 1 2 3 3 3 3 4 4 5 5 5 6 6 7 7 7 8 9 9 9
4 0 0 0 0 1 1 2 2 3 3 3 4 7 8 8 9 9
5 0 0 3 3 4 5 6 6 7 7
6 1 2 3 5 6 6 6 6 8 8
7 2 2 2 3 6 8
8 7
Câu 3 Lập bảng tần số cho thu nhập trên cơ sở phân chia đều thu nhập thành 6 nhóm Sau đó vẽ histogram cho thu nhập (khuyến khích sử dụng Excel nhưng không bắt buộc)
Bảng tần số cho thu nhập
Thu nhập (ngàn đô) Tần số Tần suất Tần suất phần trăm (%)
Trang 60.000-24.999 25.000-49.999 50.000-74.999 75.000-99.999
100.000-124.999 125.000-149.999 0
4
8
12
16
20
24
28
32
36
40
Thu nhập ( ngàn đô)
Câu 4 Lập bảng hai biến cho biến thu nhập (biến thu nhập này là kết quả phân nhóm của câu 3) và biến có nhà hay không có nhà, nhận xét sự khác biệt về thu nhập giữa hai nhóm
Vì biến thu nhập là thang đo thứ bậc, biến có nhà hay không có nhà là biến là thang đo danh nghĩa
Bảng hai biến cho thu nhập
Bảng hai biến cho thu nhập
Trang 7Thu nhập Sỡ hữu nhà Tổng
Nhận xét:
- Nhóm có nhà:
+Tỉ lệ phần trăm thấp nhất là 6.25% ở mức thu nhập 125.000-149.999 (ngàn đô)
+Tỉ lệ phần trăm cao nhất là 40.63% ở mức thu nhập 50.000-74.999 (ngàn đô)
-Nhóm không có nhà:
+ Tỉ lệ phần trăm thấp nhất là 0% thuộc hai khoảng thu nhập 100.000 – 124.999 (ngàn đô) và 125.000 – 149.999 (ngàn đô)
+Tỉ lệ phần trăm cao nhất là 62.07% ở mức thu nhập 25.000 – 49.999 (ngàn đô)
-Nhìn chung:
+Có thể thấy rằng 56.26% số lượng người có nhà và 81.04% số lượng người không
có nhà ở thành phố A đều có thu nhập năm từ 25.000 đến 74.999 ngàn đô
+Nhìn chung, thu nhập của những người ở cả hai giới tập trung nhiều ở khoảng 50.000 đến 74.999 ngàn đô
-Đối với những người có nhà, khoảng thu nhập phổ biến là từ 50.000 - 74.999 ngàn đô (13 người) chiếm 40.63% Trong khi đó, đối với những người không có nhà, khoảng thu nhập phổ biến nhất của họ là từ 25.000 - 49.999 ngàn đô (36 người) chiếm 62.07% Và cũng ở khoảng thu nhập 25.000 - 49.999 ngàn đô, số lượng người không
có nhà gấp hơn 7 lần so với người có nhà
-Số lượng người có nhà và không có nhà ngang bằng nhau ở khoảng thu nhập dưới 25.000 ngàn đô
-Theo chiều tăng thu nhập, số lượng người có nhà tăng vọt ở nhóm thu nhập 50.000-74.999 ngàn đô (13 người) và sau đó tăng tương đối so với số lượng người không có nhà ở khoảng thu nhập từ 75.000 ngàn – 99.999 ngàn đô Từ thu nhập 100.000 ngàn
đô trở lên, đa số đều là những người có nhà
Trang 8-Khoảng thu nhập ít phổ biến nhất đối với người không có nhà là từ 100.000 ngàn – 149.999 ngàn đô (0 người)
-Do vậy, từ bảng hai biến cho thu nhập và sở hữu nhà,
ta có thể kết luận rằng, biến thu nhập tỉ lệ thuận với biến sở hữu nhà Khi thu nhập càng cao, khả năng sở hữu nhà càng lớn
tứ phân vị) về tuổi, các đại lượng này phải tính
nhóm có và không có bằng lái xe So sánh các số liệu.
Có bằng lái:
6
Tuổi Số lượng n
Trang 9- Trung bình: x=∑x
- Tứ phân vị: i= p100× n= p100× n
+Phân vị thứ nhất: p=25=>i25=10025 ×71=17.750 => Vị trí thứ 18: x18=26
+Phân vị thứ hai: p=50=>i50=10050 ×71=35.500 => Vị trí thứ 36: x36=37
+Phân vị thứ ba: p=75=>i75=10075 ×71=53.250 => Vị trí thứ 54: x54=49
-Trung vị = tứ phân vị thứ hai=37
-Mode = 40
-Phương sai:
Không có bằng lái:
Tuổi Số lượng n
Trang 10-Trung bình: x=∑x
-Tứ phân vị: i= p100× n= p100× n
+Phân vị thứ nhất: p = 25 => i25=10025 ×19=4.750 => Vị trí thứ 5: x5=39
+Phân vị thứ hai: p = 50 => i50=10050 ×19=9.500 => Vị trí thứ 10: x10=66
+Phân vị thứ ba: p = 75 => i75=10075 ×19=14.250 => Vị trí thứ 15: x15=72
- Trung vị = tứ phân vị thứ hai=66
- Mode = 66
- Phương sai:
Co bang lai Ko co bang lai
Trung bình: x (tuổi) 38.620 54.947
Phương sai: s2 222.553 315.386
Nhận xét:
-Về trung bình:
+Độ tuổi trung bình của người có bằng lái là 38.620 (tuổi)
+Độ tuổi trung bình của người không có bằng lái là 54.947 (tuổi)
=> Độ tuổi trung bình có bằng lái nhỏ hơn độ tuổi trung bình không có bằng lái
-Về trung vị:
+Độ tuổi chính giữa của một nhóm người có bằng lái là 37 (tuổi)
+Độ tuổi chính giữa của một nhóm người không có bằng lái là 66 (tuổi)
=> Trung vị về tuổi của nhóm người có bằng lái nhỏ hơn độ tuổi trung vị của nhóm người không có bằng lái
-Mode:
+Độ tuổi xuất hiện nhiều nhất trong nhóm người có bằng lái là 40 (tuổi)
Trang 11+Độ tuổi xuất hiện nhiều nhất trong nhóm người không có bằng lái là 66 (tuổi)
=> Mode của người có bằng lái nhỏ hơn mode của người không có bằng lái
-Phương sai
+Phương sai của nhóm người có bằng lái là 222.553
+Phương sai của nhóm người không có bằng lái là 315.386
=> Phương sai của nhóm người có bằng lái nhỏ hơn phương sai của nhóm người không có bằng lái
-Tứ phân vị
Có bằng lái:
+Phân vị thứ 1 là 26 (tuổi)
+Phân vị thứ 2 là 37 (tuổi)
+Phân vị thứ 3 là 49 (tuổi)
Không có bằng lái:
+Phân vị thứ 1 là 39 (tuổi)
+Phân vị thứ 2 là 66 (tuổi)
+Phân vị thứ 3 là 72 (tuổi)
=> Tứ phân vị của nhóm có bằng lái nhỏ hơn tứ phân vị của nhóm không có bằng lái Nhìn chung, về trung bình, trung vị, mode, phương sai, tứ phân vị của nhóm có bằng lái đều nhỏ hơn nhóm không có bằng lái Nhóm có bằng lái có xu hướng tập trung là những người nhỏ tuổi hơn, nhóm không có bằng lái thường là những người có độ tuổi trung niên
Câu 6 Vẽ box plot mô tả đồng thời tuổi của hai nhóm có và không có bằng lái xe trên cùng hệ trục, nhận xét.
Nhận xét:
Trang 12-Ở những người có bằng lái xe ô tô thì độ tuổi rơi vào khoảng 26 đến 49 (tuổi), còn những người không có bằng lái xe ô tô thì độ tuổi rơi vào khoảng 39 đến 72 (tuổi) -Với những người có bằng lái, giá trị nhỏ nhất trong giới hạn là 18, giá trị lớn nhất là
78 Trong đó, có một người ở độ tuổi 87 có bằng lái, nằm ở ngoài giới hạn và được xem là giá trị bất thường
-Với những người không có bằng lái, giá trị nhỏ nhất trong giới hạn là 25, giá trị lớn nhất là 76
-Đa số những người có bằng lái xe ô tô rơi vào độ tuổi 37 (tuổi), còn những người không có bằng lái xe ô tô rơi vào độ tuổi 66 (tuổi)
-Trung bình số tuổi của những người có bằng lái ô tô 37 (tuổi) nhỏ hơn trung bình số tuổi của những người không có bằng lái xe (66 tuổi)
-Nhóm người không có bằng lái xe ô tô có xu hướng tập trung dữ liệu (trung vị = 66) ở mức cao, dữ liệu lệch trái, dao động lớn, không ổn định
-Nhóm người có bằng lái xe có mức tập trung trung bình (trung vị = 37), dữ liệu có sự phân tán đều hơn
=>Thông qua dữ liệu và biểu đồ, những người không có bằng lái xe ô tô phần lớn rơi vào những người cao tuổi, những người có bằng lái xe ô tô là những người đang trong
độ tuổi lao động
Câu 7 Vẽ đồ thị phân tán mô tả mối quan hệ giữa số thẻ tín dụng và số năm đi làm; giữa thu nhập và số năm đi học bằng Excel Nhận xét 2 đồ thị này.
0 5 10 15 20 25 30 35
0
5
10
15
20
25
30
ĐỒ THỊ MÔ TẢ MỐI QUAN HỆ GIỮA SỐ THẺ TÍN DỤNG VÀ SỐ
NĂM ĐI LÀM
Số năm đi làm
Nhận xét
Đối với đồ thị quan hệ giữa số năm đi làm và thẻ tín dụng:
-Ta thấy đối với những người số năm đi làm từ 1-5 năm thì số thẻ tín dụng của họ rất nhiều Đồ thị phân tán này chỉ rõ ở mức khoảng từ 2- 20 thẻ tín dụng Một điều gây bất ngờ là những người chưa đi làm thường sở hữu nhiều thẻ tín dụng hơn những người đã
đi làm Nhìn chung trung bình ở mức từ 5 đến 10 thẻ tín dụng
-Những người có số năm đi làm càng lâu thì số thẻ tín dụng của họ có xu hướng giảm dần Đơn cử là người đi làm 30 năm chỉ có 5 thẻ tín dụng Điều này cho thấy càng về
Trang 13lâu về dài nhiều thẻ tín dụng sẽ gây nhiều phiền phức, rắc rối Thế nên những người đi làm lâu năm thường sẽ muốn trở nên đơn giản hết mức có thể trong việc quản lý và kiểm soát được tài chính của bản thân
0 20 40 60 80 100 120 140 160
0
5
10
15
20
ĐỒ THỊ MÔ TẢ MỐI QUAN HỆ
GIỮA THU NHẬP VÀ SỐ NĂM ĐI
HỌC
Thu nhập năm
Nhận xét
Đối với đồ thị quan hệ giữa thu nhập và số năm đi học:
-Đối với mức lương từ 5 - 20 triệu/ năm thì có khoảng 6 người trải từ 10 -16 năm đi học
-Đối với mức lương từ 20-40 triệu/năm thì có rất đông người đạt được mức lương này
Cụ thể là từ khoảng 30-40 triệu/năm, đặc biệt tập trung nhiều ở 12 năm đi học Điều này có thể cho ta biết đây chính là mức lương trung bình cho những người vừa tốt nghiệp phổ thông
-Đối với 40-60 triệu/ năm thì tỉ lệ đi học 12-14 năm khá đồng đều so với những người
đi học từ 10-12 năm
-Từ khoảng 60-80 triệu/ năm không đồng đều khi mà số người đi học từ 10-12 năm lại nhiều hơn số người học ở những mức cao hơn
-Khoảng trên 80 triệu/ năm thì nhiều ở khoảng từ 12-16 năm đi học
Nhìn chung, đồ thị này thể hiện tương đối chính xác với những người có mức lương trung bình với số năm đi học phổ thông Còn những mức lương từ 60-80 triệu thì lại có
số người chỉ học từ 10-12 năm nhiều hơn số người học trên 12 năm Về những mức lương cao hơn thì số người đi học cao hơn thường sẽ có mức lương cao hơn do đòi hỏi những kiến thức công việc nhất định
Câu 8 Tính hệ số thể hiện mối quan hệ tương quan giữa số thẻ tín dụng và số năm đi làm thu nhập và số năm đi học Nhận xét đáp số.
- Trung bình số thẻ tín dụng:
i=1
n
x i
∑
i=1
90
x i
- Độ lệch chuẩn số thẻ tín dụng:
Trang 14s x=√ ∑
i=1
n
(x i −x)2
n−1
= √ ∑
i=1
90 (x i −x)2 90−1
= √ (x1−x)2 +(x2− y)2 +(x3−x)2+…+(x90−x)2
89
- Trung bình số năm đi làm:
i=1
n
y i
∑
i=1
90
y i
y1+ y2+ y3+ + y90
- Độ lệch chuẩn số năm đi làm:
i=1
n
(y i − y)2
n−1
= √ ∑
i=1
90 (y i − y)2 90−1
= √ (y1− y)2
+(y2− y)2
+(y3− y)2
89
- Hiệp phương sai giữa số thẻ tín dụng và số năm đi làm:
i=1
n
(x i −x)(y i − y)
∑
i=1
90 (x i −x)(y i − y) 90−1
89
89
=> Hệ số tương quan giữa số thẻ tín dụng và số năm đi làm:
Nhận xét: với hệ số tương quan dương, và xấp xỉ 0 thì ta có thể kết luận rằng số thẻ
tín dụng và số năm đi làm hầu như không liên quan đến nhau
Trang 15- Trung bình thu nhập năm:
i =1
n
X i
∑
i =1
90
X i
- Độ lệch chuẩn thu nhập năm:
i=1
n
(X i − X)2
n−1
= √ ∑
i=1
90 (X i − X)2 90−1
= √ (X1−X)2 +(X2− X)2 +(X3−X)2+…+(X90− X)2
89
89
- Trung bình số năm đi học:
i=1
n
Y i
∑
i=1
90
Y i
2
- Độ lệch chuẩn số năm đi học:
i=1
n
(Y i −Y)2
n−1
= √ ∑
i=1
90 (Y i −Y)2 90−1
= √ (Y1−Y)2
+(Y2−Y)2
+(Y3− yY)2
89
89
- Hiệp phương sai giữa số thẻ tín dụng và số năm đi làm:
i=1
n
(X i −Y)(Y i −Y)
∑
i=1
90 (X i −Y)(Y i −Y) 90−1
89
89
=> Hệ số tương quan giữa thu nhập năm và số năm đi học:
Trang 16r XY= s XY
Nhận xét: Với hệ số tương quan dương, thì ta có thể kết luận rằng thu nhập năm và số
năm đi học tương quan thuận và có mức độ tương quan tương đối yếu
Câu 9 Xây dựng khoảng ước lượng về số con với độ tin cậy 90%.
Ta có:
Độ tin cậy 90% → α ¿ 0.1 → α2 ¿ 0.05
Bậc tự do là n – 1 →t α
2
=1.662
Trung bình số con x ¿ ∑
i=1
90
x i n
Độ lệch chuẩn của số con: s ¿ ∑
i=1
90
n−1
Sai số biên e ¿t α
2
s
√n ¿ 1.6621.25√90 ¿ 0.22
=>x± t α
2
s
=> Vậy với độ tin cậy 90% thì ước lượng khoảng về số con là từ 0.8→1.25
Câu 10 Kiểm định sự khác biệt thu nhập giữa nam và nữ Nhận xét Chọn độ tin cậy 95%.
Gọi:
n1: Số lượng nam
n2: Số lượng nữ
x1: Thu nhập trung bình của n1người nam
x2: Thu nhập trung bình của n2 người nữ
μ1:Thu nhập trung bình của nam
μ2:Thu nhập trung bình của nữ