Mời các bạn cùng tham khảo Bài giảng Thống kê cho khoa học xã hội - Bài 2: Các phương pháp thống kê mô tả để nắm chi tiết các kiến thức về các phương pháp trình bày dữ liệu thống kê; ý nghĩa của số tuyệt đối trong thống kê; ý nghĩa và cách tính các loại số tương đối trong thống kê; đặc điểm, ý nghĩa, tác dụng và cách xác định các mức độ đo xu hướng trung tâm số trung bình, số trung vị và mốt...
Trang 1GIỚI THIỆU MÔN HỌC
1
THỐNG KÊ CHO KHOA HỌC XÃ HỘI
Giảng viên: ThS Nguyễn Thị Xuân Mai
Trang 2BÀI 2 CÁC PHƯƠNG PHÁP THỐNG KÊ MÔ TẢ
Giảng viên: ThS Nguyễn Thị Xuân Mai
2
Trang 3MỤC TIÊU BÀI HỌC
• Trình bày các phương pháp trình bày dữ liệu thống kê
• Trình bày ý nghĩa của số tuyệt đối trong thống kê
• Trình bày ý nghĩa và cách tính các loại số tương đối
trong thống kê
• Trình bày đặc điểm, ý nghĩa, tác dụng và cách xác định
các mức độ đo xu hướng trung tâm: số trung bình, số
Trang 4CÁC KIẾN THỨC CẦN CÓ
Kiến thức chung về kinh tế - xã hội
4
Trang 5HƯỚNG DẪN HỌC
• Đọc tài liệu tham khảo
những vấn đề chưa hiểu rõ
• Trả lời các câu hỏi của bài học
mô tả
5
Trang 6CẤU TRÚC NỘI DUNG
Các tham số thống kê mô tả
2.2
Trình bày dữ liệu thống kê
2.1
6
Trang 82.1 TRÌNH BÀY DỮ LIỆU THỐNG KÊ (tiếp theo)
Các phương pháp trình bày dữ liệu thống kê
• Phân tổ thống kê: Phân chia hiện tượng thành các tổ có tính chất khác nhau
Là phương pháp cơ bản để tiến hành tổng hợp thống kê
Là một trong các phương pháp quan trọng của phân tích thống kê, đồng thời là
cơ sở để vận dụng các phương pháp phân tích thống kê khác
Trình tự thực hiện:
Xác định mục đích phân tổ
Lựa chọn tiêu thức phân tổ: lựa chọn tiêu thức thống kê nào nói rõ bản chấtcủa hiện tượng nhất, phù hợp với mục đích nghiên cúu trong điều kiện thờigian, không gian nhất định
Trang 109
428 15
845 8
0 100 200 300 400 500 600 700 800 900 Doanh nghiệp nhà nước
Công ty cổ phần
Công ty liên doanh
Công ty trách nhiệm hữu hạn
Tư nhân
Số lượng DN lữ hành quốc tế trên cả
nước năm 2013 phân theo loại hình DN
0.69
32.80
1.15 64.75
2.1.1 TRÌNH BÀY DỮ LIỆU ĐỊNH TÍNH (tiếp theo)
• Trình bày một biến dữ liệu định tính
10
Trang 12Số lượt khách quốc tế (nghìn lượt người)
đến năm 2013 phân theo mục đích đến và
phương tiện đến
20.07 9.70
3.34
77.60 15.52 6.88
35.09 2.64 48.57
13.70
Du lịch Thương mại Thăm thân nhân Các mục đích khác
Tỷ trọng số lượt khách quốc tế đến năm
2013 phân theo mục đích đến và phương
tiện đến
Đường hàng không Đường thủy Đường bộ
Biểu đồ nhiều thanh ngang (Side by Side chart) Biểu đồ hình cột (columns)
Trang 13 Số lượng các lượng biến ít: mỗi lượng biến có thể hình thành nên 1 tổ.
→ phân tổ không có khoảng cách tổ
Số cơ sở lưu trú trên cả nước năm 2013 được xếp hạng theo số sao
Trang 14Tổng
Thu nhập bình quân một tháng (Triệu đồng)
Số nhân viên(Người)3-5
5-77-99-1111-1313-15
Trang 15• Với dãy số phân tổ có khoảng cách tổ mở, khi tính toán, khoảng cách tổ của tổ liền
kề được lấy làm khoảng cách tổ của tổ mở
Trang 162.1.2 TRÌNH BÀY DỮ LIỆU ĐỊNH LƯỢNG (tiếp theo)
16
Trang 182.1.2 TRÌNH BÀY DỮ LIỆU ĐỊNH LƯỢNG (tiếp theo)
18
Trang 192.2 CÁC THAM SỐ THỐNG KÊ MÔ TẢ
2.2.1 Số tuyệt đối và sốtương đối trong thống kê
2.2.2 Các mức độ đo xuhướng trung tâm
2.2.3 Các mức độ đo độ
biến thiên
2.2.4 Đặc trưng phânphối của dãy số
19
Trang 202.2.1 SỐ TUYỆT ĐỐI VÀ SỐ TƯƠNG ĐỐI TRONG THỐNG KÊ
a Số tuyệt đối trong thống kê: Biểu hiện quy mô, khối lượng của hiện tượng nghiên
cứu trong điều kiện thời gian, địa điểm cụ thể
• Luôn bao hàm một nội dung kiến thức xã hội trong điều kiện thời gian, không gian
cụ thể
• Phải qua điều tra thực tế và tổng hợp mới xác định được
• Có đơn vị tính cụ thể
Số tuyệt đối thời điểm
Ví dụ: Tổng số lao động của doanh nghiệp A tại thời điểm 1/7/2014 là
13500 người
Số tuyệt đối thời kỳ
Ví dụ: Tổng doanh thu của doanh nghiệp A năm 2014 là 2200 tỷ đồng
20
Trang 212.2.1 SỐ TUYỆT ĐỐI VÀ SỐ TƯƠNG ĐỐI TRONG THỐNG KÊ
21
b Số tương đối trong thống kê: Biểu hiện quan hệ so sánh giữa hai mức độ nào đó
của hiện tượng
• Chỉ thu được qua tính toán
• Mỗi số tương đối đều phải có gốc dùng để so sánh Gốc so sánh khác nhau, ý nghĩakhác nhau
• Đơn vị tính: lần, %, đơn vị kép
• Có 5 loại số tương đối:
Trang 222.2.1 SỐ TUYỆT ĐỐI VÀ SỐ TƯƠNG ĐỐI TRONG THỐNG KÊ (tiếp theo)
Số tương đối động thái (tốc độ phát triển): phản ánh sự biến động về mức độ củahiện tượng qua thời gian
Ví dụ: Doanh thu của doanh nghiệp A năm 2014 bằng 112% so với năm 2013 tức
đã tăng 12%
Số tương đối kế hoạch: Dùng để lập và kiểm tra tình hình thực hiện kế hoạch
Số tương đối nhiệm vụ kế hoạch:
Số tương đối thực hiện (hoàn thành) kế hoạch:
Trang 23 Số tương đối không gian: Sử dụng trong hai trường hợp:
So sánh giữa hai mức độ cùng loại nhưng khác nhau về không gian
So sánh giữa hai bộ phận trong một tổng thể: hai không gian khác nhau cùng tồntại trong một tổng thể
Số tương đối cường độ: Nói lên trình độ phổ biến của hiện tượng trong điều kiệnlịch sử nhất định, là kết quả so sánh hai mức độ khác loại nhưng có mối liên hệvới nhau Số tương đối cường độ có đơn vị kép
Ví dụ: Mật độ dân số Việt Nam năm 2014 bằng 269 người/km2
tt
bp
y y
d
Trang 242.2.1 SỐ TUYỆT ĐỐI VÀ SỐ TƯƠNG ĐỐI TRONG THỐNG KÊ (tiếp theo)
24
• Điều kiện vận dụng chung số tương đối và tuyệt đối trong thống kê
Phải xét đến đặc điểm của hiện tượng nghiên cứu để rút ra kết luận cho đúng
Phải vận dụng một cách kết hợp các số tương đối với số tuyệt đối, vì:
Số tuyệt đối là cơ sở bảo đảm tính chất chính xác của số tương đối
Ý nghĩa của số tương đối còn phụ thuộc vào trị số tuyệt đối mà nó phản ánh
Các nhiệm vụ phân tích thống kê không thể giải quyết được tốt, nếu chỉ dùngcác số tuyệt đối
Trang 262.2.2 CÁC MỨC ĐỘ ĐO XU HƯỚNG TRUNG TÂM
26
• Số trung bình (Mean) trong thống kê là mức độ đại biểu theo một tiêu thức nào đó
của một tổng thể gồm nhiều đơn vị cùng loại
Phản ánh mức độ đại biểu, nêu lên đặc trưng chung nhất của tổng thể
So sánh các hiện tượng không có cùng quy mô
Nghiên cứu các quá trình biến động qua thời gian
Lập kế hoạch và phân tích thống kê
San bằng mọi chênh lệch về lượng biến của tiêu thức
Chịu ảnh hưởng của lượng biến đột xuất
Trang 28n 2
n n 2
1
f .
f f
f x
f x f
x x
100
i
i i
f
f d
i
i i
f
f d
fxx
Trang 29Khi đó, năng suất trung bình của công nhân doanh nghiệp A được tính theo công thức:
Nếu biết tỷ trọng số công nhân ở từng mức năng suất lao động, năng suất lao độngtrung bình được tính:
Năng suất lao động
i i
i
i i
x x
Trang 30M x
M
M
M
M x
n
n 2
2 1
1
n 2
n x
x M M x
Trang 322.2.2 CÁC MỨC ĐỘ ĐO XU HƯỚNG TRUNG TÂM (tiếp theo)
32
• Số trung bình
Số trung bình nhân: Vận dụng khi các lượng biến có mối quan hệ tích
Số trung bình nhân giản đơn
Số trung bình nhân gia quyền
Ví dụ: Có tốc độ phát triển về số lượng lao động ở tỉnh A trong 10 năm như sau: 5 năm
có tốc độ phát triển hàng năm là 110%; 2 năm có tốc độ phát triển hàng năm là 125% và
3 năm có tốc độ phát triển hàng năm là 115%
Vậy tốc độ phát triển trung bình hàng năm trong giai đoạn 10 năm nói trên là:
x
x
x x
i
n
n 2
f x x x x
1
1436 1
15 1 25 1 1 1
Trang 332.2.2 CÁC MỨC ĐỘ ĐO XU HƯỚNG TRUNG TÂM (tiếp theo)
• Mốt (Mode - Mo) là biểu hiện của một tiêu thức phổ biến nhất hay được gặp nhiều
nhất trong tổng thể hay trong một dãy số phân phối
→ Mốt là biểu hiện hoặc lượng biến có tần số fi lớn nhất
Không chịu ảnh hưởng của lượng biến đột xuất
Có thể không có Mốt nhưng cũng có thể có nhiều Mốt
Được sử dụng đối với biến thuộc tính và biến định lượng
Trang 34• Số trung vị (Median - Me) là lượng biến của đơn vị đứng ở vị trí chính giữa trong
một dãy số lượng biến, chia dãy số thành hai phần bằng nhau
Không chịu ảnh hưởng của lượng biến đột xuất
Chỉ sử dụng đối với biến định lượng
Nếu số đơn vị tổng thể là lẻ (n=2m+1), Me = xm+1
Nếu số đơn vị tổng thể là chẵn (n=2m), Me = (xm + xm+1) / 2
Trang 35 Phân vị mức p là giá trị mà có ít nhất p% số quan sát có giá trị nhỏ hơn hoặc
bằng giá trị phân vị mức p và có ít nhất (100 - p)% số quan sát có giá trị lớn hơnhoặc bằng giá trị phân vị mức p
Một số trường hợp ứng dụng cụ thể: tam phân vị (chia tổng thể thành 3 phầnbằng nhau); tứ phân vị; ngũ phân vị hay thập phân vị
• Tứ phân vị: là các giá trị đặc biệt chia dãy số thành 4 phần bằng nhau.
Q1 - điểm tứ phân vị thứ nhất, tương ứng với phân vị mức 25, có 25% số đơn vịtổng thể có giá trị nhỏ hơn hoặc bằng Q1 và 75% số đơn vị tổng thể có giá trị lớnhơn hoặc bằng Q1
Q2 - điểm tứ phân vị thứ hai, tương ứng với phân vị mức 50, chính là trung vị
Q3- điểm tứ phân vị thứ ba, tương ứng với phân vị mức 75
Khoảng tứ phân vị (interquartile range, IQR=Q3-Q1) cho biết 50% số đơn vị cógiá trị nằm trong khoảng từ Q1 đến Q3
Trang 362.2.3 CÁC MỨC ĐỘ ĐO ĐỘ BIẾN THIÊN
Các mức độ đo độ biến thiên cho biết:
• Đặc trưng về phân phối
• Kết cấu và tính đồng đều của tổng thể
• Trình độ đại biểu của số trung bình
Không phụ thuộc vào sự phân bố của dữ liệu
Chỉ phụ thuộc vào lượng biến lớn nhất và nhỏ nhất
Rất nhạy cảm với các lượng biến đột xuất
Trang 372.2.3 CÁC MỨC ĐỘ ĐO ĐỘ BIẾN THIÊN (tiếp theo)
37
Trang 382.2.3 CÁC MỨC ĐỘ ĐO ĐỘ BIẾN THIÊN (tiếp theo)
38
Trang 392.2.4 ĐẶC TRƯNG PHÂN PHỐI CỦA DÃY SỐ
Dựa trên 5 giá trị của một dãy số lượng biến gồm: xmin, Q1, Me, Q3và xmax ta có thể xácđịnh được hình dạng của phân phối chuẩn
39
Khoảng cách từ xmin tới Me
Giới hạn trong Giới hạn
ngoài
Q1 Me Q3
Nghi ngờ là lượng biến đột xuất
Nghi ngờ là lượng biến đột xuất
Lượng biến đột xuất
Lượng biến đột xuất
Khớp nối
1.5 IQR 1.5 IQR
Giới hạn ngoài
Giới hạn trong
Trang 402.2.4 ĐẶC TRƯNG PHÂN PHỐI CỦA DÃY SỐ
40
• Biểu đồ Boxplot là một cách biểu diễn bộ dữ liệu với 5 giá trị quan trọng là giá trị
nhỏ nhất (xmin ), tứ phân vị thứ nhất (Q1), tứ phân vị thứ hai (Q2) hay Me, tứ phân vịthứ ba (Q3) và giá trị lớn nhất (xmax)
Hộp (box) giới hạn từ Q1 đến Q3, biểu diễn 50% số đơn vị giữa của tổng thể
“Ria” bên trái từ xmin đến Q1biểu diễn 25% số đơn vị tổng thể có giá trị nhỏ nhất,
“Ria” bên phải từ Q3 đến xmax biểu diễn 25% số đơn vị tổng thể có giá trị lớn nhất.Nếu là phân phối chuẩn đối xứng thì Q2 hay Me sẽ ở chính giữa hộp
Trang 412.2.4 ĐẶC TRƯNG PHÂN PHỐI CỦA DÃY SỐ
41
• Biểu đồ Boxplot
Nhận biết vị trí của bộ dữ liệu trên cơ sở Me
Nhận biết sự dàn trải của dữ liệu trên cơ sở độ dài của hộp (khoảng tứ phân vịIQR) và độ dài của ria mèo
Nhận biết độ lệch phân phối của dữ liệu
So sánh 2 hay nhiều bộ dữ liệu với cùng 1 thước đo
Nhận biết lượng biến đột xuất (outliers) và nghi ngờ có thể là lượng biến đột xuấtqua sơ đồ sau:
Trang 42TÓM LƯỢC CUỐI BÀI
Trong bài học này, chúng ta đã nghiên cứu các nội dung chính sau:
• Dữ liệu thống kê đối với dữ liệu định tính và dữ liệu định lượng bằngcác phương pháp phân tổ thống kê, bảng thống kê, đồ thị thống kê
• Tính toán các tham số thống kê mô tả: các mức độ trung tâm: sốtrung bình, số trung vị, mốt; các mức độ đo độ biến thiên: khoảngbiến thiên, phương sai, độ lệch tiêu chuẩn, hệ số biến thiên
• Đặc trưng phân phối của dãy số
42