Bài giảng Thống kê kinh doanh: Bài 2 - ThS. Nguyễn Thị Xuân Mai trình bày dữ liệu thống kê; số tuyệt đối và số tương đối trong thống kê; các mức độ trung tâm; các tham số đo độ biến thiên của tiêu thức.
Trang 1BÀI 2
MÔ TẢ DỮ LIỆU THỐNG KÊ
ThS Nguyễn Thị Xuân Mai
Trường Đại học Kinh tế Quốc dân
Trang 2TÌNH HUỐNG KHỞI ĐỘNG: Bạn muốn một sản phẩm dưỡng da như thế nào?
1 Dữ liệu trên phải được trình bày thế nào sao cho có hiệu quả nhất?
2 Làm thế nào để nêu lên được những đặc trưng cơ bản của hiện tượng?
3 Làm thế nào đánh giá được mức độ đại diện của các vấn đề nghiên cứu?
4 Liệu những ý kiến đưa ra có tập trung hay không?
Trong quá trình nghiên cứu phát triển sản phẩm mới, nhãn hàng Pond’s đã tổ chức thu thập
ý kiến của các bạn nữ tuổi từ 15-25 về loại kem dưỡng da đang sử dụng, hiệu quả sử dụngcũng như mong muốn của các bạn về một sản phẩm mới Tuy nhiên, những thông tin thuthập được mới chỉ ở dạng thô, mang tính chất rời rạc, chưa cho thấy đặc trưng chung củahiện tượng nghiên cứu Vậy với những thông tin đó, làm thế nào để có thể phân tích và đưa
ra một quyết định đúng đắn?
Trang 3MỤC TIÊU
Sau khi học xong bài này, sinh viên có khả năng:
• Trình bày được khái niệm, tác dụng phân tổ thống kê
• Mô tả được các bước tiến hành phân tổ thống kê
• Trình bày được khái niệm và đặc điểm số tuyệt đối, số tương đối trong thống kê
• Phân biệt được các loại số tuyệt đối và số tương đối khác nhau
• Nêu được khái niệm, công thức tính và so sánh các đặc điểm của số trung bình,
số trung vị và mốt
• Nhận biết được các đặc trưng phân phối của dãy số
• Trình bày được khái niệm, công thức tính và đặc điểm các tham số đo độ biến
thiên của tiêu thức
• Tính toán được các mức độ của hiện tượng kinh tế xã hội dựa theo số liệu đã có
Trang 4NỘI DUNG
Trình bày dữ liệu thống kê
Số tuyệt đối và số tương đối trong thống kê
Các mức độ trung tâm
Các tham số đo độ biến thiên của tiêu thức
Trang 51 TRÌNH BÀY DỮ LIỆU THỐNG KÊ
1.2 Trình bày dữ liệu định tính
1.1 Một số vấn đề chung về phân tổ thống kê
1.3 Trình bày dữ liệu định lượng
1.4 Dãy số phân phối
Trang 61.1 MỘT SỐ VẤN ĐỀ CHUNG VỀ PHÂN TỔ THỐNG KÊ
(hay một số) tiêu thức nào đó để phân chia các
đơn vị của hiện tượng nghiên cứu thành các tổ
(hoặc tiểu tổ) có tính chất khác nhau
Cho phép thực hiện được việc nghiên cứu một
cách kết hợp giữa cái chung và cái riêng
Được vận dụng ngay trong giai đoạn điều tra
thống kê
Là phương pháp cơ bản để tiến hành tổng
hợp thống kê
Là một trong các phương pháp phân tích
thống kê, đồng thời là cơ sở để vận dụng các
Trang 71.1 MỘT SỐ VẤN ĐỀ CHUNG VỀ PHÂN TỔ THỐNG KÊ (tiếp theo)
Phân chia các loại hình kinh tế xã hội của hiện
tượng nghiên cứu;
Biểu hiện kết cấu của hiện tượng nghiên cứu;
Biểu hiện mối liên hệ giữa các tiêu thức
Căn cứ vào nhiệm vụ của phân tổ thống kê:
Phân tổ phân loại;
Trang 8Phân phối các đơn vị vào từng tổ
Trang 9CÁC BƯỚC PHÂN TỔ THỐNG KÊ
làm căn cứ để tiến hành phân tổ thống kê
Phải dựa trên cơ sở phân tích lý luận
để chọn ra tiêu thức bản chất nhất, phùhợp với mục đích nghiên cứu
Phải căn cứ vào điều kiện lịch sử cụ
thể của hiện tượng nghiên cứu
Phải tùy theo mục đích nghiên cứu và
điều kiện tài liệu thực tế mà quyết địnhphân tổ hiện tượng theo một hay nhiềutiêu thức
Trang 101.2 TRÌNH BÀY DỮ LIỆU ĐỊNH TÍNH
Tiêu thức phân tổ là tiêu thức thuộc tính.
• Các loại hình, biểu hiện tương đối ít: mỗi loại
hình, biểu hiện có thể hình thành nên một tổ
• Các loại hình, biểu hiện thực tế nhiều: ghép
nhiều tổ nhỏ lại thành một số tổ lớn, theo
nguyên tắc các tổ nhỏ ghép lại với nhau phải
giống nhau (hoặc gần giống nhau) về tính chất,
về giá trị sử dụng, về loại hình
Trang 111.3 TRÌNH BÀY DỮ LIỆU ĐỊNH LƯỢNG
Thu nhập bình quân một tháng
(Triệu đồng)
Số nhân viên (Người)
Trang 121.3 TRÌNH BÀY DỮ LIỆU ĐỊNH LƯỢNG (tiếp theo)
Tiêu thức phân tổ là tiêu thức số lượng.
• Lượng biến của tiêu thức thay đổi ít: mỗi lượng biến có thể hình thành nên một tổ,
gọi là phân tổ không có khoảng cách tổ
Bậc thợ Số công nhân (Người)
Trang 131.3 TRÌNH BÀY DỮ LIỆU ĐỊNH LƯỢNG (tiếp theo)
• Lượng biến của tiêu thức biến thiên lớn: mỗi tổ sẽ bao gồm một phạm vi lượng biến, vớihai giới hạn, gọi là phân tổ có khoảng cách tổ
Khoảng cách tổ (h) = giới hạn trên – giới hạn dưới
đồng nhất về loại hình kinh tế xã hội và lượng biến trên các đơn vị thay đổi tương đốiđều đặn hoặc khi ta không biết gì về quy luật thay đổi về lượng của các đơn vị
lượng biến trên các đơn vị thay đổi không đều Khi đó, cần phải tuyệt đối tuân theoquy luật của mối quan hệ lượng - chất và dựa vào mục đích nghiên cứu, ý nghĩa kinh
tế - xã hội của hiện tượng mà xác định nội dung và phạm vi của tổ cho phù hợp
n
x x
h max min
Trang 141.4 DÃY SỐ PHÂN PHỐI
Dãy số phân phối là kết quả của phân tổ thống kê Gồm có:
Trang 152.2 Số tương đối trong thống kê
2 SỐ TUYỆT ĐỐI VÀ SỐ TƯƠNG ĐỐI TRONG THỐNG KÊ
2.1 Số tuyệt đối trong thống kê
2.3 Điều kiện vận dụng số tuyệt đối và số tương đối trong thống kê
Trang 162.1 SỐ TUYỆT ĐỐI TRONG THỐNG KÊ
là mức độ biểu hiện quy mô, khối
lượng của hiện tượng nghiên cứu trong
điều kiện thời gian và địa điểm cụ thể
Luôn bao hàm một nội dung kinh tế
xã hội trong những điều kiện thờigian và địa điểm nhất định
Phần lớn các số tuyệt đối trong
thống kê là do kết quả của điều trathống kê và tổng hợp tài liệu
Luôn có đơn vị tính cụ thể
Trang 172.1 SỐ TUYỆT ĐỐI TRONG THỐNG KÊ (tiếp theo)
Số tuyệt đối cho ta nhận thức cụ thể về
quy mô, khối lượng hiện tượng trong điềukiện thời gian và địa điểm cụ thể
Là cơ sở để phân tích thống kê và tiến
hành tính toán các mức độ khác trongnghiên cứu thống kê
Số tuyệt đối thời kỳ phản ánh quy mô,
khối lượng của hiện tượng trong mộtkhoảng thời gian nhất định
Số tuyệt đối thời điểm phản ánh quy mô,
khối lượng của hiện tượng tại một thờiđiểm nhất định
Trang 182.2 SỐ TƯƠNG ĐỐI TRONG THỐNG KÊ
là mức độ biểu hiện mối quan hệ so sánh
giữa hai mức độ nào đó của hiện tượng
nghiên cứu
Số tương đối là kết quả so sánh hai
số đã có (thường là hai số tuyệt đối),không trực tiếp thu thập được quađiều tra
Tuỳ thuộc vào mức độ nghiên cứu cụ
thể mà gốc so sánh khác nhau Khigốc so sánh khác nhau thì ý nghĩacủa số tương đối khác nhau
Trang 192.2 SỐ TƯƠNG ĐỐI TRONG THỐNG KÊ (tiếp theo)
Số tương đối động thái;
Số tương đối kế hoạch;
Số tương đối kết cấu;
Số tương đối không gian;
Số tương đối cường độ
Trang 202.2 SỐ TƯƠNG ĐỐI TRONG THỐNG KÊ (tiếp theo)
• Số tương đối động thái (tốc độ phát triển): phản ánh sự biến động về mức độ của
hiện tượng nghiên cứu qua thời gian
• Số tương đối kết cấu: biểu hiện tỷ trọng của từng bộ phận chiếm trong toàn bộ
K n k
Trang 212.2 SỐ TƯƠNG ĐỐI TRONG THỐNG KÊ (tiếp theo)
• Số tương đối không gian: sử dụng trong
hai trường hợp:
So sánh giữa hai mức độ cùng loại
nhưng khác nhau về không gian
So sánh giữa hai bộ phận trong một
tổng thể: hai không gian khác nhaucùng tồn tại trong một tổng thể
• Số tương đối cường độ: nói lên trình độ
phổ biến của hiện tượng trong điều kiện lịch
sử nhất định, là kết quả so sánh hai mức
độ khác loại nhưng có mối liên hệ với nhau
Số tương đối cường độ có đơn vị kép
Ví dụ về số tương đối không gian:
So sánh giá cả một loại hàng hóa giữa hai thị trường
Trang 222.3 ĐIỀU KIỆN VẬN DỤNG SỐ TUYỆT ĐỐI VÀ SỐ TƯƠNG ĐỐI TRONG THỐNG KÊ
• Khi sử dụng số tương đối và số tuyệt đối phải căn cứ vào tính chất và đặc điểm của
hiện tượng nghiên cứu để rút ra kết luận cho chính xác
• Phải vận dụng kết hợp các số tương đối và số tuyệt đối vì số tương đối trong thống
kê là kết quả so sánh giữa hai số tuyệt đối đã có, là sự kết hợp khác nhau giữa các
số tuyệt đối Mặt khác, ý nghĩa của số tương đối còn phụ thuộc vào trị số tuyệt đối
mà nó phản ánh
Trang 243.1 SỐ TRUNG BÌNH
mức độ đại biểu theo một tiêu thức nào đó
của một tổng thể gồm nhiều đơn vị cùng loại
Số trung bình san bằng mọi sự chênh lệch
về lượng biến của tiêu thức để có một con
số duy nhất đại diện cho tất cả lượng biếncủa tiêu thức nghiên cứu
Số trung bình chịu ảnh hưởng của lượng
biến đột xuất trong dãy số Đây cũng làmột nhược điểm của số trung bình
Ví dụ: Tiền lương trung bình của công nhân trong một xí nghiệp
Trang 253.1 SỐ TRUNG BÌNH (tiếp theo)
Được sử dụng phổ biến trong các nghiên cứu thống kê, vì nó nêu lên đặc điểm
chung của hiện tượng kinh tế - xã hội số lớn trong điều kiện thời gian và địa điểm
cụ thể
Cho phép so sánh những hiện tượng không có cùng qui mô
Cho thấy xu hướng phát triển của hiện tượng
Được sử dụng nhiều để lập kế hoạch và phân tích thống kê
Số trung bình cộng được sử dụng phổ biến nhất trong nghiên cứu thống kê,
được tính bằng công thức trung bình cộng trong toán học
Số trung bình nhân là số trung bình của những đại lượng có quan hệ tích số với
nhau, thường được ứng dụng để tính tốc độ phát triển trung bình
Trang 263.1 SỐ TRUNG BÌNH (tiếp theo)
Số trung bình cộng giản đơn:
Số trung bình cộng gia quyền:
Số trung bình cộng điều hòa gia quyền:
i
i i
i i i
i i
n
i i
n
i
i i
n
n n
n
i i
x M M
x
f x
f x f
f
x x
f
f x f
f f
f x f
x f
x x
n
x x
1
1 2
1
2 2 1
1 1
M x
M x
Trang 273.1 SỐ TRUNG BÌNH (tiếp theo)
NSLĐ (Triệu đồng) Số công nhân (Người) fi xi xifi
Trang 283.1 SỐ TRUNG BÌNH (tiếp theo)
Số trung bình nhân giản đơn:
Số trung bình nhân gia quyền:
Điều kiện vận dụng số trung bình trong thống kê:
• Số trung bình phải được tính từ tổng thể đồng chất
• Số trung bình chung cần được vận dụng kết hợp với số trung bình tổ và dãy số phân
phối để có thể giải thích sâu sắc từng khía cạnh, từng bộ phận của hiện tượng
Trang 293.3 MỐT
nhất trong tổng thể hay trong 1 dãy số phân phối
Mốt biểu hiện mức độ phổ biến của hiện tượng nhưng bản thân nó không san bằnghay bù trừ chênh lệch giữa các lượng biến Do đó có thể dùng Mốt để bổ sung haythay thế cho số trung bình cộng trong trường hợp tính toán gặp khó khăn
Mốt bảo đảm ý nghĩa thực tế hơn các tính toán khác khi có lượng biến đột xuất vì
nó không chịu ảnh hưởng của lượng biến đột xuất
Là một trong những tham số nêu lên đặc trưng phân phối của dãy số
Được sử dụng nhiều trong bài toán lý thuyết phục vụ đám đông
Trang 30 Trong một số trường hợp, một dãy số
phân phối có thể có nhiều Mốt, có thểlại không có Mốt Khi đó ta không nêntính Mốt
Điểm của nhóm học sinh Điểm
Trang 313.2 SỐ TRUNG VỊ
trong một dãy số lượng biến, chia dãy số thành hai phần bằng nhau
Số trung vị biểu hiện mức độ phổ biến của hiện tượng nhưng bản thân nó khôngsan bằng hay bù trừ chênh lệch giữa các lượng biến Do đó, nó có thể bổ sung haythay thế cho số trung bình cộng khi việc tính số trung bình gặp khó khăn
Số trung vị không chịu ảnh hưởng của lượng biến đột xuất Vì vậy, có thể dùng sốtrung vị khi tiêu thức nghiên cứu phân phối quá lệch, hoặc đối với một dãy số cóquá ít đơn vị
Là một trong những tham số nêu lên đặc trưng phân phối của dãy số
Ứng dụng trong công tác kỹ thuật và phục vụ công cộng ở nơi thuận lợi, phục vụđược nhiều người nhất mà lại tiết kiệm nhất
Trang 323.2 SỐ TRUNG VỊ (tiếp theo)
Trở lại ví dụ về NSLĐ ở phần số trung bình, tính trung vị về NSLĐ của công nhân trong
doanh nghiệp A nói trên
• Doanh nghiệp có n=200 công nhân, vậy vị trí chính giữa là 100 và 101
• Dựa trên cơ sở tính tần số tích lũy, xác định tổ chứa vị trí 100 và 101 là tổ 25 – 30
(triệu đồng), đây là tổ có trung vị
• Trung vị được tính theo công thức:
• Xét ví dụ về NSLĐ ở trên
200
85 2
25-30
85 45
20-25
40 30
15-20
10 10
Trang 333.2 SỐ TRUNG VỊ (tiếp theo)
Cách xác định trung vị
• Đối với dãy số không có khoảng cách tổ:
Nếu số đơn vị tổng thể lẻ: ∑f = 2m + 1, Me = xm+1
Nếu số đơn vị tổng thể chẵn: ∑f = 2m,
• Đối với dãy số có khoảng cách tổ:
Bước 1: Xác định tổ có trung vị, là tổ chứa lượng biến của đơn vị đứng ở vị trí giữa
Bước 2: Tính trị số gần đúng của trung vị
m m 1 e
x x M
Trang 343.3 MỐT (tiếp theo)
Cách xác định mốt
• Đối với dãy số thuộc tính: Mốt là biểu hiện có tần số lớn nhất.
• Đối với dãy số lượng biến không có khoảng cách tổ: Mốt là lượng biến xi có tần số f-i
lớn nhất
• Đối với dãy số lượng biến có khoảng cách tổ bằng nhau:
Bước 1: Xác định tổ có Mốt – là tổ có tần số lớn nhất
Bước 2: Tính trị số gần đúng của Mốt
• Đối với dãy số lượng biến có khoảng cách tổ không bằng nhau: việc xác định Mốt
phải căn cứ vào mật độ phân phối Tổ chứa Mốt là tổ có mi max
Trang 353.4 NGHIÊN CỨU ĐẶC TRƯNG PHÂN PHỐI CỦA DÃY SỐ QUA CÁC MỨC ĐỘ TRUNG TÂM
0 0
M M
Trang 364 CÁC THAM SỐ ĐO ĐỘ BIẾN THIÊN CỦA TIÊU THỨC
4.2 Độ lệch tuyệt đối bình quân
4.1 Khoảng biến thiên
4.3 Phương sai
4.4 Độ lệch tiêu chuẩn
4.5 Hệ số biến thiên
Trang 374 CÁC THAM SỐ ĐO ĐỘ BIẾN THIÊN CỦA TIÊU THỨC (tiếp theo)
Ý nghĩa:
• Giúp đánh giá trình độ đại biểu của số trung bình: nếu độ biến thiên thấp, trình độ đại
biểu của số trung bình cao và ngược lại
• Quan sát độ biến thiên của tiêu thức trong một dãy số lượng biến cho thấy đặc trưng
về phân phối, kết cấu và tính đồng đều của tổng thể
• Độ biến thiên của tiêu thức thường được dùng trong nhiều trường hợp nghiên cứu
thống kê: phân tích biến động, mối liên hệ trong điều tra, dự đoán
Trang 384.1 KHOẢNG BIẾN THIÊN
• Khái niệm: Khoảng biến thiên là độ lệch giữa lượng biến lớn nhất và lượng biến nhỏ
nhất của tiêu thức nghiên cứu
• Nhược điểm:
Do chỉ phụ thuộc vào 2 lượng biến lớn nhất và nhỏ nhất trong dãy số, mà không
xét đến các lượng biến khác, nên việc nhận định có thể chưa thật hoàn toànchính xác
Khoảng biến thiên rất nhạy cảm với các lượng biến đột xuất
Trang 394.2 ĐỘ LỆCH TUYỆT ĐỐI BÌNH QUÂN
đối giữa lượng biến và số trung bình của các lượng biến đó
thực tế về dấu của các độ lệch, nên việc phân tích bằng các phương pháp toán học
Trang 404.3 PHƯƠNG SAI
lượng biến với số trung bình cộng của các lượng biến đó
toán bị khuếch đại và không có đơn vị tính phù hợp
Trang 414.4 ĐỘ LỆCH TIÊU CHUẨN
• Khái niệm: Độ lệch tiêu chuẩn là căn bậc hai của phương sai, tức là số trung bình
toàn phương của bình phương các độ lệch giữa các lượng biến với số trung bình
cộng của các lượng biến đó
• Là chỉ tiêu hoàn thiện nhất và thường dùng nhất trong nghiên cứu thống kê để đánh
giá độ biến thiên của tiêu thức
2
Trang 424.5 HỆ SỐ BIẾN THIÊN
• Khái niệm: Hệ số biến thiên là tham số đo độ biến thiên tương đối rút ra từ sự so
sánh giữa độ lệch tiêu chuẩn với số trung bình cộng
• Để so sánh độ biến thiên của các hiện tượng khác loại hoặc các hiện tượng cùng loại
Trang 43GIẢI QUYẾT TÌNH HUỐNG
Câu hỏi:
1 Dữ liệu trên phải được trình bày thế nào sao cho có hiệu quả nhất?
2 Làm thế nào để nêu lên được những đặc trưng cơ bản của hiện tượng?
3 Làm thế nào đánh giá được mức độ đại diện của các vấn đề nghiên cứu?
4 Liệu những ý kiến đưa ra có tập trung hay không?
Trả lời:
1 Phân chia dữ liệu thu được thành các bộ phận khác nhau theo đặc điểm của hiện tượng vàmục đích nghiên cứu
2 Nghiên cứu dãy số phân phối được hình thành qua phân tổ thống kê dữ liệu thu được
3 Tính toán các mức độ như số trung bình, số trung vị và mốt theo tiêu thức nghiên cứu
4 Để đánh giá liệu ý kiến đưa ra có tập trung hay không phải xem xét mức độ đồng đều củanhững kết quả thu được theo tiêu thức nghiên cứu chẳng hạn qua độ lệch tiêu chuẩn
Trang 44CÂU HỎI MỞ
Sau khi học xong bài này, anh/chị hãy rút ra vai trò của số trung bình trong nghiên
cứu thống kê.
Trả lời:
Trong các nghiên cứu thống kê, số trung bình được sử dụng rất phổ biến vì nó nêu lên
đặc điểm chung của hiện tượng kinh tế - xã hội số lớn trong điều kiện thời gian và địa
điểm cụ thể Hơn nữa, với các hiện tượng không có cùng qui mô, việc sử dụng số trung
bình để so sánh nhằm đánh giá về hiệu quả, năng suất hoạt động là rất phù hợp Với
việc nghiên cứu sự biến động của số trung bình qua thời gian, ta có thể thấy được xu
hướng phát triển của hiện tượng để từ đó có thể dự đoán được các mức độ trong tương
lai phục vụ cho việc lập kế hoạch hoạt động