báo cáo nghiên cứu thống kê
Trang 2GIÁO VIÊN HƯỚNG DẪN: LÊ THỊ THIÊN HƯƠNG
Phần dành riêng cho Khoa:
Trang 3TRÍCH YẾU
Tất cả các bậc cha mẹ đều mong muốn con mình sẽ phát triển chiều cao
và khỏe mạnh Ta đã biết chiều cao phụ thuộc khá nhiều vào gen di truyền Tuy nhiên, đây không phải yếu tố quyết định hoàn toàn mà còn phụ thuộc vào nhiều yếu tố khác nhau Để phát triển chiều cao tốt nhất ta cần hiểu thêm các yếu tố nào ảnh hưởng đến chiều cao Khi có điều kiện thuận lợi cho đủ tất cả các yếu tố ta sẽ phát triển được chiều cao tối ưu của mình
Vì vậy, nhóm ch ng tôi th c hiện đề án CHIỀU CAO TRUNG B NH CỦA SINH VIÊN N TẠI ĐH HOA SEN nh m đưa ra cái nhìn t ng quát nhất về chiều cao và các yếu tố ảnh hưởng đến chiều cao c ng như tìm ra biện pháp để phát triển chiều cao c ng như nâng cao s c kho để thanh thiếu niên có thể học tập và làm việc thật hiệu quả
Trang 4LỜI CẢM ƠN
Ch ng tôi xin gửi lời cảm ơn chân thành đến cô Lê Thị Thiên Hương và những gi p đỡ, góp ý gi p ch ng tôi hoàn thành đề tài này một cách tốt và hiệu quả nhất
Nhóm ch ng tôi c ng xin gửi lời cảm ơn đến khoa Kinh Tế Thương Mại trường Đaị học Hoa Sen vì đã tạo cơ hội cho ch ng tôi học tập một môn học có tính ng dụng cao vào th c tiễn và hỗ trợ tốt cho khả năng t ng hợp,
xử lý số liệu cho ch ng tôi
Tuy nhiên do những hạn chế về m t kiến th c c ng như thời gian, nhóm
ch ng tôi không tránh khỏi những sai sót Rất mong s đánh giá và góp ý của cô
Ch ng tôi chân thành cảm ơn
Nhóm th c hiện đề án
Trang 5NHẬN XÉT
Trang 6
DANH SÁCH SINH VIÊN
Trang 7MỤC LỤC
Contents
TRÍCH YẾU i
LỜI CẢM ƠN ii
NHẬN XÉT iii
DANH SÁCH SINH VIÊN iv
MỤC LỤC v
BẢNG PHÂN CÔNG CÔNG VIỆC vi
BẢNG BIỂU – H NH ẢNH vii
A MỞ ĐẦU 1
1 Cơ sở lý thuyết 1
2 Đối tượng, phạm vi nghiên c u và phương pháp nghiên c u 19
3 Câu hỏi nghiên c u 22
4 Giả thuyết nghiên c u 22
B NỘI DUNG 23
2 Một số yếu tố tác động đến chiều cao của sinh viên nữ Đại học Hoa Sen 27
3 Một số giải pháp nh m phát triển chiều cao của sinh viên nữ Hoa Sen 29
C KẾT LUẬN 31 TÀI LIỆU THAM KHẢO b PHỤ LỤC c
Trang 8BẢNG PHÂN CÔNG CÔNG VIỆC
1.Trần Thị Muội Thu thập dữ liệu, viết báo cáo,tính toán
2.Lê Thụy Bích Thủy Thu thập dữ liệu,viết báo cáo,tính toán
3.Võ Thị Thanh Tr c Thu thập dữ liệu, t ng hợp số liệuchỉnh sửa báo cáo
4 Phạm Trịnh Huyền Trân Thu thập dữ liệu,t ng hợp số liệu
5 Phạm Trần Thiên Lý Thu thập dữ liệut, ng hợp số liệu
6 Lê Quỳnh Nhƣ Thu thập dữ liệu,t ng hợp số liệu
7 Nguyễn Thị CẩmVân Thu thập dữ liệu viết báo cáo,tính toán
8 Nguyễn Thị Thanh Tr c Thu thập dữ liệu viết báo cáo,tính toán
9 Nguyễn Thị Nguyệt Hồng Thu thập dữ liệu,t ng hợp số liệu
Trang 9BẢNG BIỂU – HÌNH ẢNH
Hình 1: Biểu đồ thanh đ ng thể hiện chiều cao của sinh viên nữ Đại học Hoa Sen 24
Hình 2: Biểu đồ thể hiện giờ bắt đầu ng của sinh viên nữ Đại học Hoa Sen 28
Hình 3: Biểu đồ thể hiện gen di truyền chiều cao của sinh viên nữ Đại học Hoa Sen 29
Bảng 1: Phương pháp thu thập thông tin 6
Bảng 2: Bảng dữ liệu thu thập 23
Trang 10A MỞ ĐẦU
1 ơ sở lý thuyết
HƯƠNG I GIỚI THIỆU MÔN HỌ
I.1 KHÁI NIỆM VÀ HỨ NĂNG THỐNG KÊ
1 Khái niệm
Có thể hiểu khái niệm thống kê trên hai góc độ:
Góc độ lý luận: Thống kê là một môn khoa học kinh tế, nghiên c u m t lượng trong mối liên hệ ch t chẽ với m t chất của các hiện tượng và quá trình kinh tế xã hội, phát sinh trong điều kiện thời gian và địa điểm cụ thể
Góc độ nghiệp vụ: Thống kê có thể hiểu là các số liệu thể hiển thôn tin về đối tượng nghiên c u
Một cách t ng quát, có thể định nghĩa: Thống kê là một nhành của toán
học liên quan đến việc thu thập, phân tích và trình bày các dữ liệu Đây
là một khoa học bao gốm một hệ thống các phương pháp từ việc thu thập, trình bày, tóm tắt dữ liệu đến các phương pháp phân tích và d đoán, gi p các nhà quản lý đưa ra các quyết định
2 hức năng của thống kê
Quá trình nghiên c u thống kê trải qua ba giai đoạn có quan hệ ch t chẽ và mật thiết với nhau, trong đó gian đoạn trước làm tiền đề để th c hiện giai đoạn sau
(1) Giai đoạn điều tra thống kê: bao gồm ghi chép, thu thập tài liệu thống
kê
(2) Giai đoạn t ng hợp và trình bày kết quả điều tra thu thập được
(3) Giai đoạn phân tích và d báo thống kê
Như vậy, thống kê có hai lĩnh v c:
Trang 11 Thống kê mô tả bao gồm các phương pháp thu thập trình bày dữ liệu và tính toán các đ c trưng nh m mô tả đối tượng nghiên
T ng thể thống kê (hay t ng thể) là tập hợp tất cả các đối tượng mà
ta nghiên c u các đơn vị (hay phần tử) tạo thành t ng thể được gọi là đơn vị
t ng thể Mẫu là một bộ phận lấy ra từ t ng thể
2 iến
Biến là đ c điểm của đơn vị t ng thể, được chia ra thành hai loại:
Biến định tính thể hiện tính chất của đơn vị được khỏa sát
Biến định lượng thể hiện b ng các số
3 Dữ liệu
Dữ liệu là kết quả quan sát được của các biến, giá trị nhận được có thể thay đ i từ đơn vị này sang đơn vị khác Dữ liệu c ng được phận biệt thành hai loại: dữ liệu định tính và định lượng
4 Tiêu thức thống kê
Tiêu th c thống kê là khái niệm dùng để chỉ các đ c điểm của đơn
vị tồng thể mà ta nghiên c u
a Tiêu thức định tính là tiêu th c phản ánh tính chất của đơn
vị t ng thể, không thể hiện tr c tiếp b ng các con số
b Tiêu thức định lượng (còn gọi là tiêu th c số lượng) là tiêu
th c có biểu hiện tr c tiếp b ng con số
Trang 12Lượng biến có tể phân biệt thành hai loại:
Lượng biến rời rạc là lượng biến mà các giá trị có thể có
của nó là hữu hạn ho c vô hạn và có thể đếm được
Lượng biến liên tục là lượng iến mà các giá trị có thể có của
nó lấp kín cả một khoảng trên trục số
Thông thường, các giá trị của lượng biến liên tục là các số có cả phần nguyên và phần thập phân, còn giá trị của lượng biến không liên tục là các số nguyên
Các tiêu th c định tính và định lượng chỉ có hai biểu hiện không trùng nhau
trên một t ng thề được gọi là tiêu thức thay phiên
b hỉ tiêu chất lượng là các chỉ tiêu biểu hiện tính chất, trình
độ ph biến, quan hệ so sánh trong t ng thể
I.3 Á Ậ O LƯỜNG VÀ TH NG O D LIỆU
Để th c hiện nghiên c u, trong thống kê người ta sử dụng bốn cấp bậc đo lường theo m c độ thông tin tăng dần, đó là thang đo: định danh, th bậc, khoảng và tỉ lệ
1 Thang đo định danh (hay thang đo phân loại) là bậc thấp nhất,
không thể hiện s hơn kém Thang đo này được sử dụng cho
các dữ liệu định tính, chỉ khác biệt nhau về tên gọi
2 Thang đo thứ bậc thể hiện s hơn kém của dữ liệu nhưng
không biết chính xác m c độ hơn kém đó Thang đo này c ng
được sử dụng cho các dữ liệu định tính
Trang 133 Thang đo khoảng thể hiện được m c độ hơn kém giữa các giá
trị đo lường, trong đó giá trị 0 chỉ là quy ước mà không có ý nghĩa Thang đo khoảng được xem là thang đo th bậc có khoảng cách đều nhau Thang đo này được sử dụng cho các dữ
liệu định lượng
4 Thang đo tỉ lệ là loại thang đo dùng cho các dữ liệu định
lượng, có đầy đủ các tình chất của thang đo khoảng, torng đó giá trị 0 có nghĩa thật s , cho phép lấy tỉ lệ so sánh giữa hai giá trị thu thập Đây là thang đo ở bậc cao nhất trong hệ thống
thang đo
Trên th c tế, vấn đề thang đo khá ph c tạp và ta có thể áp dụng thang đo định tính đối với các tiêu th c định lượng và ngược lại, áp dụng thang đo định lượng cho tiêu th c định tính Ngay cả khi dữ liệu đã thu thập xong ta
c ng có thể chuyển đ i dữ liệu định lượng thành dữ liệu định tính
HƯƠNG II THU THẬP VÀ T NH ÀY D LIỆU
II.1 THU THẬP D LIỆU
1 Xác định dữ liệu cần thu thập
Quá trình nghiên c u thống kê cần phải có nhiều dữ liệu Việc thu thập dữ liệu đòi hỏi nhiều thời gian, công s c, chi phí Do đó cần phải tiền hành thu thập dữ liệu một cách hệ thống, đáp ng được mục tiêu nghiên c u trong khả năng nguồn nhân l c, kinh phí và thời gian cho phép Muốn vậy phải xác định rõ những dữ liệu nào cần thu thập, th t ưu tiên của các dữ liệu này
2 Nguồn dữ liệu
Khi nghiên c u, ta có thể sử dụng các dữ liệu từ những nguồn có sẵn, đã được công bố ho c chưa công bố, hay có thể t mình đi thu tthập dữ liệu mới
Dữ liệu từ nguồn có sẵn, thường đã qua t ng hợp, xử lý, gọi là dữ liệu th cấp
Dữ liệu thu thập tr c tiếp từ các đối tượng nghiên c u gọi là dữ liệu sơ cấp
Trang 14a Nguồn dữ liệu thứ cấp khá đa dạng, có thể là:
Các báo cáo nội bộ cơ quan, doanh nghiệp: các số liệu báo cáo về tình hình sản xuất, tiêu thụ, tài chính,…
Các số liệu của Cơ quan Thống kê nhà nước, Cơ quan Chính phủ: dân số, việc làm, m c sống dân cư, tài nguyên,…
Báo, tạp chí, mạng internet,…
b Nguồn dữ liệu sơ cấp
Dữ liệu sơ cấp được thu thập thông qua các cuộc điều tra khảo sát
Căn c vào tính liên tục hay không liên tục của việc ghi chép dữ liệu, người ta chia ra thành điều tra thường xuyên hay không thường xuyên
Điều tra thường xuyên là tiến hành thu thập, ghi chép
số liệu về hiện tượng nghiên c u một cách có hệ thồng, theo sát quá trình biến động cùa hiện tượng
Điều tra không thường xuyên là tiến hàng thu thập,
ghi chéo chỉ khi cần có nhu cầu cần nghiên c u hiện tượng dữ liệu điều tra không thường xuyên phản ánh trạng thái của hiện tượng tại một thường điểm nhất định
Căn c vào phạm vi khảo sát, người ta lại chia ra thành điều tra toàn
bộ và không toàn bộ
Điều tra toàn bộ là tiến hành thu thập, ghi chép dữ
liệu trên tất cả các đọn vị của t ng thể
Điều tra không toàn bộ là chỉ tiến hành thu thập trên
một số đơn vị được chọn ra từ t n thể đang nghiên
c u
3 ác phương pháp thu thập dữ liệu sơ cấp
a Thu thập trực tiếp
Trang 15Phỏng vấn tr c tiếp
Phương pháp lấy mẫu xác suất bao gồm các phương pháp chọn mẫu
ngẫu nhiên đơn giản, chọn mẫu hệ thống, chọn mẫu phân tầng, chọn mẫu cả khối hay nhiều giai đoạn
Phương pháp lấy mẫu phi xác suất bao gồm các phương pháp lấy
mẫu thuận tiện, lấy mẫu định m c, lấy mẫu phán đoán Mẫu phi xác
Trang 16suất không đại diện được cho toán bộ t ng thể nhưng được chấp nhận trong nghiên c u khám phá và trong kiểm định giả thuyết
II.2 T NH ÀY D LIỆU
1 ảng tần số
Bảng tần số là một bảng t ng hợp, trình bày dữ liệu b ng cách phân chia
ch ng thành từng nhóm (lớp) khác nhau Bảng tần số thường bao gồm ba cột:
Cột th nhất mô tả các biểu hiện ho c các giá trị (hay khoảng giá trị) của dữ liệu
Cột th hai mô tả tần số tương ng với các biểu hiện ho c giá trị đó
Cột th ba là các tần suất (tỉ lệ %)
a Cách lập bảng tần số cho dữ liệu định tính
Đối với các dữ liệu định tính như giới tính, nhành học,…, ta sẽ lập bảng tần
số gồm các thông tin sau đây:
Cột th nhất liệt kê tất cả các biểu hiện có thể có của tập dữ liệu
Cột th hai ghi tần số (số lần từng biểu hiện đó xuất hiện trong tập dữ liệu) t ng của cột tần số phải b ng số phần tử của tập dữ liệu
Cột th ba ghi tần suất (b ng cách lấy tần số chia cho số phần tử của tập dữ liệu và nhân với 100%) T ng của cột tần suất phải b ng 100%
b Cách lập bảng tần số cho dữ liệu định lượng
Có hai trường hợp: dữ liệu có ít giá trị và dữ liệu co nhiều giá trị
(1) Trường hợp dữ liệu có ít giá trị: Bảng tần số c ng có ba cột tương t trường hợp dữ liệu định tính, nhưng cột th nhất ghi các giá trị (lượng, biến) của dữ liệu
(2) Trường hợp dữ liệu có nhiều giá trị: Trước hết ta phân nhóm cho các giá trị rồi mới lập bảng tần số trên cơ sở dữ liệu đã phân nhóm
Trên th c tế, người ta thường phân nhóm với khoảng cách đều nhau
Trang 17Giả sử mẫu dữ liệu có n phần tử, giá trị lớn nhất, nhỏ nhất của dữ liệu lần lượt là X max , X min Gọi k là số nhóm cần chia và h là khoảng cách giữa các
h max min
Một số điều kiện phải tuân thủ khi phân nhóm:
Các nhóm không được trùng nhau, mỗi giá trị chỉ thuộc về một nhóm
Tất cả các nhóm phải bảo đảm bao quát hết tất cả các giá trị của mẫu
số liệu
Không có nhóm rỗng (t c là nhóm không có phần tử nào)
Chú ý: Trong bảng tần số đôi khi người ta còn thêm vào cột tần số tích l y
(ho c tần suất tích l y) thể hiện số lần quan sát (ho c % số lần quan sát) cộng dồn đến giới hạn tr6en của một nhóm nào đó Nói cách khác, tần số tích l y cho thấy có bao nhiêu quan sát b ng ho c nhỏ hơn một vị trí nào đó của biến khảo sát
(3) Phân nhóm mở
Ngoài cách phân nhóm như trên ta còn có thể phân nhóm mở, trong đó nhóm đầu tiên không có giới hạn dười và nhóm cuối cùng không có giới hạn trên, các nhóm còn lại có khoảng cách đều ho c không đều nhau Mục đích của phân nhóm mở là để nhóm đầu tiên và nhóm cuối cùng ch a các đơn vị có giá trị đột biến và tránh việc lập quá nhiều t khi tính toán đối với phân nhóm mở người ta quy ước lấy khoảng cách của nhóm mở b ng khoảng cách của nhóm gần nó nhất
c Cách lập bảng tần só kết hợp hai tiêu thức thống kê
Bảng tần số có thể có dùng để mô tả hai tiêu th c thống kê Ngoài ra bảng kết hợp này có thể được xoay theo chiều khác, ho c tách riêng thông tin về tần số, tần suất thành hai bảng riêng biệt
2 ồ thị thống kê các loại
Trang 18a Đồ thị thống kê cho dữ liệu định lượng
(1) Biểu đồ phân phối tần số
Biểu đồ phân phối tần số (Histogram) được sử dụng để chuyển hóa thông tin tr6en bảng tần số thành hình ảnh tr c quan Đây là một loại đ thị biểu diễn
s phân phối tần số b ng các cột sao cho diện tích của cột tỉ lệ với tần số
(2) Đa giác tần số
Phương pháp th hai để biểu diễn phân phối tần số b ng đồ thị là dùng đa giác tần số để vẽ đa giác này, ta nối các trung điểm của cạnh đỉnh các cột trong Histogram lại với nhau b ng các đoạn thẳng muốn đưởng biểu diễn không có vẽ lơ lửng trên không, ta thêm vào hai bên của Histogram hai nhóm có tần số b ng 0
Phần lá: gồm các chữ số còn lại Lá ở một nhánh c ng sắp xếp theo
th t tăng dần c ng có tể chia đôi một nhánh thành nhánh trên và nhánh dưới khi có quá nhiều lá
b Đồ thị thống kê cho dữ liệu định tính
(1) Biểu đồ dạng thanh (thanh đứng hay thanh ngang)
Trên biểu đồ này, mỗi thanh đại diện cho một phân loại của biến (tiêu th c thống kê) mà ta quan tâm, chiều dài của thanh thể hiện tần số của các quan sát thuộc về phân loại đó Còn chiều rộng của các thanh b ng nhau
Trang 19Không nên nhầm lẫn giữa Histogram với biểu đồ thanh đ ng đây là hai công cụ thống kê khác nhau, thể hiện hai loại dữ liệu định lượng, định tính Giữa các thanh của Histogram không có khoảng cách, còn giữa các thanh của biểu đồ dạng thanh phải có khoảng cách vì mỗi thanh là một biểu hiện của biến phân loại
(2) Biểu đồ hình tròn
Thường dùng dể mô tả kết cuấ (%) của vấn đề đang nghiên c u Trên biểu
đồ, toàn bộ diện tích hình tròn dược chia thành nhiều mạnh nhỏ hỉnh r quạt, diện tích mỗi mảnh tương ng vối tỉ lệ của pahn6 loại mà nó đại diện trong toàn thể và manh một màu khác nhau Th t của các phân loại (theo chiều kim đồng hồ) là th t nó được sắp xếp trong bảng t ng hợp
HƯƠNG III TÓM TẮT D LIỆU – ẢNG Á I LƯỢNG THỐNG KÊ MÔ TẢ
Đối với dữ liệu định lượng, ch ng ta có thể tóm tắt tốt hơn khi số lượngdữ liệu lớn, đó là dùng các đại lượng thống kê mô tả Các đại lượng này được chia thành hai nhóm: nhóm các đại lượng thể hiện m c độ tập trung của dữ liệu và nhóm thể hiện độ phân tán của dữ liệu Ở nhóm th nhất ta có trung bình cộng (được sử dụng nhiều nhất), mốt, turng vị Ở nhóm th hai ta có khoảng biến thiên, độ lệch tuyệt đối bình quân, phương sai, độ lệch chuẩn (được sử dụng nhiều nhất) và hệ số biến thiên
TRUNG
1 Trung bình cộng ( rithmetic mean)
Trung bình cộng được xác định b ng cách cộng tất cả các giá trị của từng phần tử (các quan sát), sau đó đem chia cho t ng số phần tử (t ng số quan sát)
Trang 20Có hai loại turng bình cộng là trung bình cộng đơn giản (mean) và trung bình cộng có trong số (weighted mean)
a Trung bình cộng đơn giản
X n
k
i i i
f
f X X
k
i i i
f
f x X
X X
là trị số
giữa của các nhóm i (X im a x,X im in là giới hạn trên, giới hạn dưới của nhóm i) và
f i là tần số của nhóm i
c ặc điểm của trung bình cộng
Trung bình cộng thường rất nhạy cảm với các đột biến (giá trị quá lớn ho c quá nhỏ), giá trị trung bình sẽ kém tiêu biểu nếu trong dãy số có các giá trị đột biến
Trang 21 Trung bình cộng được sử dụng để so sánh giữa hau hay nhiều t ng thể
T ng độ lệch giữa các giá trị X i với giá trị trung bình X b ng 0,
1
0 ) (
) (
) (
.
1 1
1 min
0
0 0 0
0
0 0 0
M
M M M
M
f f f
f
f f h
(3) Trường hợp dữ liệu phân nhóm có khoảng cách không đều: Mốt vẫn
được tính theo công th c (5) nhưng việc xác định nhóm có mốt không căn c vào tần số mà căn c vào mật độ phân phối (Mật độ phân phối = Tần số: khoảng cách nhóm)