Đối với dãy số lượng biến rời rạc và sự biến thiên giữa các lượng biết ít đòi hỏi phải quản lý chặt chẽ trên từng lượng biến thì mỗi lượng biến xếp vào một tổ.. Giáo trình Thống kê Trang
Trang 1Giáo trình Thống kê Trang 63
CHƯƠNG 4: PHÂN TỔ THỐNG KÊ Sau khi học xong chương này, sinh viên có thể:
− Trình bày được khái niệm, ý nghĩa và nhiệm vụ của phân tổ thống kê;
− Xác định được tiêu thức phân tổ;
− Vận dụng được các phương pháp phân tổ thống kê
4.1 Khái niệm:
Phân tổ thống kê là một nghiệp vụ thống kê được dùng để phân chia tổng thể phức tạp thành nhiều tổng thể bộ phận hoặc nhiều tổ (>=2) khác nhau trên từng tiêu thức nhất định, trong từng biểu hiện thời gian và không gian xác định
Cơ sở để tiến hành phân tổ bao gồm:
− Mục đích yêu cầu quản lý hoặc yêu cầu phân tích
− Tính chất của hiện tượng nghiên cứu, tính chất của tiêu thức nghiên cứu
− Cơ cấu nội tại của đồng thể phức tạp và mối quan hệ giữa chúng
− Tính lịch sử của đối tượng quản lý và trình độ quản lý của từng thời kỳ
Phân tổ thống kê được dùng để giải quyết các vấn đề cơ bản sau đây:
− Xác định loại hình cơ cấu của tổng thể phức tạp
− Xác định qui mô của tổng thể phức tạp và qui mô của từng tổng thể bộ phận cấu thành nên tổng thể phức tạp đó
− Nghiên cứu mối quan hệ nhân quả giữa các hiện tượng trong một hệ
Trang 2Giáo trình Thống kê Trang 64
thống quản lý
− Xác định các cơ sở để sắp xếp các cột, các dòng trong biểu bảng thống kê tổng hợp
− Phân tổ thống kê được dùng làm cơ sở để sắp xếp các đơn vị tổng thể theo một trật tự nhất định
Tùy theo từng mục đích yêu cầu nghiên cứu mà phân chia thành các loại phân tổ thống kê sau đây:
− Nếu theo số lượng tiêu thức được dùng làm cơ sở để tiến hành phân tổ thì chia làm 3 loại:
từng tiêu thức nghiên cứu
nhiều tổ, tiểu tổ trên cơ sở kết hợp nhiều tiêu thức nghiên cứu với nhau
các chỉ tiêu nghiên cứu vào các cột, các dòng của biểu bảng thống kê để trình bày nội dung nghiên cứu, mục đích nghiên cứu
4.2 Phương pháp phân tổ thống kê:
Để phân tổ thống kê phải thực hiện tuần tự các bước sau đây:
4.2.1 Xác định tiêu thức phân tổ:
Trang 3Giáo trình Thống kê Trang 65
Tiêu thức phân tổ là tiêu thức thực thể phản ánh bản chất của hiện tượng phải phù hợp với mục đích yêu cầu quản lý và phân tích trong từng điều kiện thời gian và không gian xác định
4.2.2 Xác định số tổ và độ lớn của mỗi tổ trong một tổng thể phức tạp 4.2.2.1 Trường hợp phân tổ đơn:
a Đối với tiêu thức thuộc tính:
Số tổ được chia phụ thuộc vào tính chất của loại hình và mục đích nghiên cứu
Trường hợp số loại hình ít (hoặc không nhiều) Đòi hỏi quản lý chặt chẽ thì mỗi loại hình xếp vào một tổ
Trường hợp phức tạp: Số loại hình quá nhiều, tỉ mỉ, phức tạp, khó quản lý tiến hành ghép một số loại hình có tính chất giống nhau hoặc gần giống nhau vào một tổ
Trong thực tế người ta thường dựa vào các đường lối chủ trương chính sách của Đảng và Nhà nước hoặc của các ngành, bộ, địa phương đã qui định dưới hình thức văn bản chỉ thị hay danh mục vv… để tiến hành xác định số tổ được chia
b Đối với tiêu thức số lượng: Số tổ được chia phụ thuộc vào tính chất của dãy số lượng biến và trình độ quản lý
Đối với dãy số lượng biến rời rạc và sự biến thiên giữa các lượng biết ít đòi hỏi phải quản lý chặt chẽ trên từng lượng biến thì mỗi lượng biến xếp vào một tổ Sau khi xác định được số tổ cần chia thì phải sắp xếp số đơn vị tổng
Trang 4Giáo trình Thống kê Trang 66
thể vào các tổ tương ứng, tức là xác định số lần xuất hiện của từng lượng biến hoặc của từng tổ trong từng tiêu thức phân tổ
Ví dụ: Để nghiên cứu chất lượng lao động của công nhân trong một doanh nghiệp người ta tiến hành phân tổ theo tiêu thức bậc thợ như sau:
Bảng 4.1
Bậc thợ Số công nhân (người)
1
2
3
4
5
6
7
10
30
100
150
80
50
5 Cộng toàn doanh nghiệp 425
Ví dụ 2: Để đánh giá tình hình thực hiện kế hoạch hoá gia đình ở một địa phương người ta tiến hành phân tổ theo tiêu thức số con trong mỗi hộ gia đình như sau:
Bảng 4.2
Số con trong mỗi hộ gia đình Số hộ gia đình
0
1
2
3
4
100
200
300
50
30 Tổng cộng toàn địa phương 680
Trang 5Giáo trình Thống kê Trang 67
Đối với dãy số lượng biến rời rạc hoặc đối với dãy số lượng biến liên tục và sự biến thiên về mặt lượng giữa các lượng biến khá lớn và khó quản lý thì tiến hành phân tổ có khoảng cách tổ: tức là ghép một số lượng biến có mặt chất giống nhau vào một tổ theo nguyên tắc lượng tích luỹ đến một mức độ nào đó thì chất thay đổi, khi chất thay đổi thì lượng biến đổi theo để hình thành tổ mới
Độ lớn của mỗi tổ phụ thuộc vào khoảng biến thiên về mặt lượng của từng loại hình mặt chất
Phân tổ có khoảng cách tổ tức là trong mỗi tổ sẽ có 2 giới hạn, giới hạn dưới là lượng biến nhỏ nhất và giới hạn trên là lượng biến lớn nhất của tổ đó Biến nào lớn hơn giới hạn trên sẽ được xếp vào tổ tiếp theo Do đó độ lớn của mỗi tổ được xác định bằng hiệu giữa giới hạn trên và giới hạn dưới của mỗi tổ
Bảng 4.3
Loại hình Chất
lượng học tập
Điểm thi
Số sinh viên (người) Liên tục Rời rạc
Yếu kém
TB
Khá
Giỏi
Xuất sắc
1 – 4
4 – 6
6 – 8
8 – 10
0 – 3
4 – 6
7 – 8
9 – 10
10
100
80
50
Trang 6Giáo trình Thống kê Trang 68
Chú ý:
- Mặt chất các tiêu thức số lượng được xác định phải dựa vào tiêu thức thuộc tính có liên quan
- Trong phân tổ có khoảng cách tổ nếu là dãy số lượng biến liên tục thì giới hạn trên và giới hạn dưới của 2 tổ liền nhau phải ghi giống nhau Ưu điểm về việc chọn giá trị giới hạn trên và dưới hạn dưới trong trường hợp này là giúp cho ta có thể sắp xếp được tất cả các lượng biến có giá trị liên tục, nhưng có nhược điểm là phải chú thích thêm những lượng biến trùng với giá trị của giới hạn trên (hoặc giới hạn dưới của tổ kế tiếp) thì phải được đặt vào
Còn đối với dãy số có lượng biến rời rạc thì ghi cách nhau một đơn vị Việc ghi giới hạn giới của của kế tiếp lớn hơn giới hạn trên của tổ trước đó 1 đơn vị giúp ta phân biệt rõ ràng, dễ dàng sắp xếp các lượng biến, nhưng trường hợp này không thể sắp xếp cho các lượng biến liên tục
- Nếu độ lớn giữa các tổ bằng nhau gọi là phân tổ đều, ngược lại gọi là phân tổ không đều Trong một tổ nếu chỉ có một giới hạn thì gọi là tổ mở, còn nếu có đủ 2 giới hạn gọi là tổ đóng
Phân tổ đều được áp dụng đối với tổng thể đồng chất và sự biến thiên về mặt lượng giữa các lượng biến tương đối đều đặn
Trong phân tổ đều trị số khoảng các tổ đều được xác định bằng công thức như sau:
Đối với dãy số lượng biến liên tục thì trị số khoảng cách tổ đều được xác định bằng công thức:
Trang 7Giáo trình Thống kê Trang 69
1 + 3,322 lgN Trong đó:
- Xmax và Xmin là lượng biến lớn nhất và lượng biến nhỏ nhất trong dãy số lượng biến của tiêu thức phân tổ
- N là qui mô của tổng thể phức tạp hoặc số đơn vị tổng thể
- 1+3,322 lgN = n : là công thức toán được dùng để xác định số tổ cần chia một cách khách quan
Trong thực tế có nhiều trường hợp số tổ cần chia (n) được xác định một cách chủ quan (ấn định sẵn) do đó h được tính đơn giản như sau
n Sau khi xác định được h thì phải xác định giới hạn dưới và giới hạn trên của một tổ theo một trật tự nhất định từ nhỏ đến lớn hoặc từ lớn đến nhỏ Giới hạn dưới của tổ nhỏ nhất chính bằng Xmin, giới hạn trên của tổ này bằng giới hạn dưới cộng với trị số khoảng cách tổ đều
Xt = Xd + h Tổ thứ 2: Giới hạn dưới của tổ thứ 2 bằng Xt = giới hạn trên của tổ đứng kề liên ngay trước
Đối với dãy số lượng biến rời rạc thì trị số khoảng cách tổ đều được xác định bằng công thức như sau:
n
Trang 8Giáo trình Thống kê Trang 70
Trong đđđó:
- n là số tổ cần chia một cách khách quan hoặc chủ quan
- Xmax và Xmin được xác định giống như đối với dãy số lượng biến liên tục, nó chỉ khác ở chỗ Xmax và Xmin của hai tổ liền nhau phải ghi cách nhau 1 đơn vị
Ví dụ: Để đánh giá sản lượng thu hoạch lúa của tỉnh X, người ta tiến hành điều tra chọn mẫu để xác định năng suất thu hoạch lúa bình quân trong tỉnh trên số liệu điều tra của 64 xã trong đó năng suất thu hoạch thấp nhất là 38tạ/ha, cao nhất là 52tạ/ha Biết rằng diện tích gieo trồng lúa trong toàn tỉnh là 2.000ha Ta có:
1 + 3,322 lg64
Bảng 4.4
Năng suất thu hoạch lúa bình quân mỗi xã (Tạ/ha) Số xã trung bình
38 – 40
40 – 42
42 – 44
44 – 46
46 – 48
4
8
10
17
12
Trang 9Giáo trình Thống kê Trang 71
48 – 50
50 – 52
8
5
Sau khi phân tổ ta tính năng suất luá bình quân mỗi xã trong toàn tỉnh rồi nhân với diện tích luá gieo trồng cả tỉnh sẽ tính được tổng sản lượng thu hoạch
Ví dụ 2: Để quản lý qui mô xí nghiệp trong một ngành sản xuất ở địa phương, người ta lựa chọn tiêu thức phân tổ là số công nhân và tiến hành điều tra số công nhân trên 20 xí nghiệp của ngành với số liệu giả thiết như sau:
Bảng 4.5
STT
(XN) (người) Số CN (XN) STT (người) Số CN (XN) STT (người) Số CN (XN) STT (người) Số CN
1
2
3
4
5
1200
1304
1800
1670
1400
6
7
8
9
10
1430
1350
1240
1700
1800
11
12
13
14
15
1650
2050
2120
1980
2400
16
17
18
19
20
2883
2540
2760
2300
2130
Giả sử rằng qui mô của xí nghiệp được phản ánh là nhỏ, trung bình, lớn và rất lớn, > n = 4
4
Trang 10Giáo trình Thống kê Trang 72
Bảng 4.6
Loại hình Qui mô Số CN (người) Số XN
Nhỏ Vừa Lớn Rất lớn
1.200 – 1.620 1.621 – 2041
2042 – 2482
2483 – 2880
6
6
4
4
Phân tổ không đều: được áp dụng đối với tổng thể phức tạp không đồng chất
Độ lớn của mỗi tổ được xác định phụ thuộc vào loại hình về mặt chất của tiêu thức thuộc tính có liên quan
Ví dụ: Để quản lý tình hình học sinh đến trường ở một địa phương, người ta tiến hành phân tổ theo tiêu thức độ tuổi đến trường như sau:
Bảng 4.7
Loại hình trường Độ tuổi đến trường Số học sinh Đào tạo Liên tục
(tháng năm)
Rời rạc (năm) Đến trường
NT
MG
Cấp 1
Cấp 2
< 3
3 – 6
6 – 11
11 – 15
<3
4 – 6
7 – 11
12 – 15
50
500
600
550
Trang 11Giáo trình Thống kê Trang 73
Cấp 3
TH+dạy nghề
>ĐH
15 – 18
>18
16 – 18
>19
400
100
4.2.2.2 Phân tổ kết hợp
Cơ sở để tiến hành phân tổ kết hợp đó là phương pháp phân tổ đơn và khi kết hợp nhiều tiêu thức phân tổ với nhau thì phải theo một trật tự nhất định sau đây:
- Tiêu thức nào xảy ra trước tiến hành phân tổ trước và ngược lại
Ví dụ: Để nghiên cứu mối quan hệ giữa trình độ lao động, năng suất lao động và giới tính của công nhân trong một doanh nghiệp người ta tiến hành phân tổ như sau:
Bảng 4.8
Trang 12Giáo trình Thống kê Trang 74
4.2.2.3 Phân tổ liên hệ
Cơ sở để phân tổ liên hệ là phương pháp xác định phân tổ đơn và phân tổ kết hợp, sau đó mới sắp xếp các chỉ tiêu hoặc tiêu thức nghiên cứu vào các cột, các dòng của biểu bảng thống kê tổng hợp theo một trật tự nhất định sau đây:
- Tiêu thức nguyên nhân sắp xếp trước, tiêu thức kết quả sắp xếp sau
- Những tiêu thức nào có mối quan hệ gần nhau thì phải sắp xếp gần nhau
- Tiêu thức nào xảy ra trước thì sắp xếp trước và ngược lại
CÂU HỎI ÔN TẬP Câu 1: Để phân tổ thống kê một cách hợp lý, ta dựa trên những cơ sở nào?
Câu 2: Trình bày các bước phân tổ thống kê
BÀI TẬP Bài 1: Có tài liệu sau cuả các công nhân tại một nhà máy trong tháng 1/2001 như sau:
Tổ Số công nhân
Số lượng sản phẩm (kg)
Tổ Số công nhân
Số lượng sản phẩm (kg)
Trang 13Giáo trình Thống kê Trang 75
Yêu cầu:
1 Căn cứ vào năng suất lao động bình quân một công nhân, hãy phân tổ số công nhân trên thành 4 nhóm có khoảng cách tổ đều Trong mổi nhóm hãy tính số công nhân và số lượng sản phẩm
2 Căn cứ theo tiêu thức số công nhân, hãy phân tổ 20 tổ lao động trên thành 4 nhóm có khoảng cách tổ đều Trong mỗi nhóm hãy tính số tổ lao động, số sản phẩm sản xuất được
Bài 2: Có số liệu về mức thu nhập và số cán bộ công nhân viên của các bưu cục trong một tỉnh trong năm 2000 như sau:
Số bình quân tháng Thu nhập Số lao động Số bình quân tháng Thu nhập Số lao động
TT (tr đ/người) (người) TT (tr đ/người) (người)
Trang 14Giáo trình Thống kê Trang 76
Yêu cầu:
1 Căn cứ vào thu nhập bình quân một công nhân, hãy phân tổ các bưu cục trên thành 3 tổ có khoảng cách tổ đều (với đơn vị tính tiền là 1.000đ), trong mỗi tổ hãy tính số bưu cục, số lao động và tổng thu nhập
2 Tương tự như trên nhưng phân thành 4 tổ
Các anh chị có nhận xét gì về mối liên hệ giữa qui mô của bưu cục với thu nhập bình quân của công nhân?