Tuy nhiên, vấn đề xác định kích thước mẫu số liệu cần thu thập là bao nhiêu để đảm bảo tính đúng đắn, đáng tin cậy của các nghiên cứu và mặt khác tiết kiệm được các chi phí thu thập tính
Trang 1VTKT
I ĐẶT VẤN ĐỀ
Việc áp dụng phương pháp phân tích tương quan trong phân tích kinh tế đã được đề cập
đến trong nhiều tài liệu, giáo trình Tuy nhiên, vấn đề xác định kích thước mẫu số liệu cần thu
thập là bao nhiêu để đảm bảo tính đúng đắn, đáng tin cậy của các nghiên cứu và mặt khác tiết
kiệm được các chi phí thu thập tính toán
II NỘI DUNG
Một xu hướng quan trọng khi hoàn thiện phương pháp phân tích tương quan trong phân
tích kinh tế đó là việc hoàn thiện cơ sở số liệu ban đầu Theo [1] đã đưa ra phương pháp lựa
chọn mẫu số liệu trên cơ sở đảm bảo tính đồng nhất của mẫu số liệu thống kê Phương pháp này
chủ yếu đảm bảo về mặt “chất” của mẫu số liệu thông qua việc phân tích lựa chọn xử lý thô đối
với tập hợp số liệu ban đầu Vấn đề đặt ra là với một mức độ tin cậy nhất định và một độ chính
xác cho trước, kích thước của mẫu số liệu bằng bao nhiêu để đạt được độ chính xác đó Vì trong
thực tế việc tăng kích thước mẫu số liệu sẽ rất khó khăn đòi hỏi nhiều thời gian, công sức và
kinh phí
Theo [2] việc xác định kích thước mẫu số liệu cho trung bình mẫu được xác định như sau:
Từ biểu thức u
n để độ chính xác không vượt quá 0 cho trước ta cần có
0 u
2
là khoảng ước lượng; là phương sai; u tính theo bảng Laplat; là độ tin cậy; n là kích
thước mẫu số liệu
XÁC ĐỊNH KÍCH THƯỚC MẪU SỐ LIỆU
TS ĐẶNG THỊ XUÂN MAI
Bộ môn Kinh tế xây dựng Khoa Vận tải - Kinh tế Trường Đại học Giao thông Vận tải
Tóm tắt: Bài báo nêu lên phương pháp ứng dụng toán xác suất thống kê trong việc xác
định kích thước mẫu số liệu trong các nghiên cứu phân tích kinh tế
Summary: The aim of this paper is to provide a method that applying statistics and
probability theories to determine the sample size of the data in economic analysis research
Trang 2VTKT
Từ đó suy ra:
2
0
u
(3)
Trong công thức trên nếu phương sai 0 chưa biết ta thay bằng độ lệch mẫu S'
2
0
u
S
(4)
Tuy nhiên do S'lại phụ thuộc n, để khắc phục điều này ta thực hiện lấy một mẫu
(x1, x2…xm) với kích thước m 30 nào đó và tính trị số trung bình
và độ lệch mẫu S'theo mẫu đó
m
1 i i
X m
1
X (5)
n
1 i
2
i X x 1 m
1
Sau đó kết hợp với bảng tính sẵn [2] giá trị hàm Laplat e dt
2 ) x (
x 2
t2
được kích cỡ mẫu n theo công thức (2)
Ví dụ ta có mẫu số liệu ban đầu như sau:
Số liệu ban đầu
xuất (tỷ)
Giá trị sản lượng (tỷ)
Trang 3VTKT
( Tổng cục thống kê 1996)
Việc tính toán xác định kích cỡ mẫu sẽ được xác định theo từng tiêu chí:
1 Số lao động
2 Giá trị vốn sản xuất
3 Giá trị sản lượng
Tiêu chí 1: Số lao động (số người)
Với sai số 0 = 25, ta chia khoảng và lập bảng phân bố tần số sau:
Từ 214 đến 238
- 239 - 263
- 264 - 288
- 289 - 313
- 214 - 338
- 339 - 363
- 364 - 388
- 389 - 413
- 414 - 438
- 439 - 463
- 464 - 491
5
2 0*
6 2*
2*
1
4
1
4
3
* Bỏ khoảng có tần số bằng 0 và gộp 2 khoảng có tần số bằng nhau ta có:
Từ đó tính: Kỳ vọng mẫu (trung bình mẫu): X = 348
Phương sai mẫu (độ lệch tiêu chuẩn): S'= 85
Với độ tin cậy 90% thì kích thước mẫu tối thiểu là 31
Từ 214 đến 238
- 239 - 263
- 289 - 313
- 314 - 363
- 364 - 388
- 389 - 413
- 414 - 438
- 439 - 463
- 464 - 491
5
2
6
4
1
4
1
4
3
Trang 4VTKT
Tiêu chí 2: Giá trị vốn sản xuất (tỷ đồng)
Số liệu xếp theo thứ tự tăng dần là:
11,536 17,092 21,699 12,282 17,126 22,648 12,299 17,446 23,576 12,299 18,394 24,179 12,844 18,709 24,840 13,981 19,704 25,000 14,233 20,337 26,056 14,641 20,435 29,787 15,483 21,521 30,931 15,892 21,600 31,511
Với sai số 0 = 1,5 ta chia khoảng và lập bảng phân bố tần số sau:
Từ 11,536 đến 13,035
- 13,036 - 14,535
- 14,536 - 17,535
- 17,536 - 19,035
- 19,036 - 22,035
5
2
6
2
6
- 22,036 - 23,535
- 23,536 - 25,035
- 25,036 - 26,535
- 29,536 - 31,511
1
4
1
3
Từ đó tính: Kỳ vọng (trung bình) mẫu: X = 19,410 Phương sai (độ lệch tiêu chuẩn) S’ = 5, 518
Với độ tin cậy 90% thì kích thước mẫu tối thiểu là: 37
Tiêu chí 3: Giá trị sản lượng ( tỷ đồng)
Số liệu xếp theo thứ tự tăng dần là:
13,103 19,361 26,244 13,447 20,241 26,643 14.600 21,880 30,240 15,477 22,010 32,279 15,647 23,505 33,816 16,360 24,208 33,990 17,009 24,840 37,900 17,931 25,268 40,639 17,998 25,310 41,086 18,598 25,663 42,363
Với sai số 0 = 2,0 ta chia khoảng và lập bảng phân bố tần số như sau:
Trang 5VTKT
Từ 13,103 đến 15,102 15,103 - 17,102 17,103 - 19,102 19,103 - 23,102 23,103 - 25,102 25,103 - 27,102 29,103 - 33,102 33,103 - 35,102 37,103 - 39,102 39,103 - 41,102 41,103 - 42,363
3
4
3
4
3
5
2
2
1
2
1
Từ đó tính: Kỳ vọng (trung bình) mẫu X = 24, 624
Phương sai (độ lệch tiêu chuẩn) S’ = 8,223
Với độ tin cậy 90% kích thước mẫu tối thiểu là 45
Ta thấy rằng với các tiêu chí nghiên cứu khác nhau (với các nội dung nghiên cứu khác
nhau), đủ để đảm bảo một độ tin cậy nhất định kích thước của mẫu số liệu là hoàn toàn khác
nhau Do đó khi nghiên cứu hiện tượng kinh tế dưới tác động của một chỉ tiêu sẽ tiết kiệm được
thời gian, công sức và chi phí tính toán Vì khi tăng kích thước mẫu n thì độ chính xác 0 của
các ước lượng càng nhỏ và do đó độ chính xác của các ước lượng càng tăng lên Khi nghiên cứu
hiện tượng kinh tế dưới tác động đồng thời của nhiều chỉ tiêu nghiên cứu ta có thể phân ra làm
hai trường hợp sau:
- Nếu coi xét mức độ quan trọng của các tiêu chí là như nhau (hoặc không tính đến mức độ
quan trọng của các chỉ tiêu) thì kích thước của mẫu số liệu nên chọn theo giá trị lớn nhất của các
kích thước mẫu đã xác định [tức là max(n1, n2, n3…)]
- Nếu có xem xét đến mức độ quan trọng của các chỉ tiêu thì kích thước của mẫu số liệu có
thể chọn theo kích thước của tiêu chí quan trọng nhất trong các tiêu chí nghiên cứu
III KẾT LUẬN
Việc xác định kích thước mẫu số liệu trong các nghiên cứu kinh tế rất quan trọng, nó đảm
bảo cả về mặt “chất” và mặt “lượng” của mẫu số liệu Phương pháp xác định kích thước mẫu số
liệu này còn có thể áp dụng trong nhiều lĩnh vực khoa học công nghệ khác như: xác định số lần
tiến hành thí nghiệm, số lượng đối tượng nghiên cứu, số lần quan sát ghi chép sự kiện… Ưu
điểm nổi bật của phương pháp này là vừa đảm bảo độ tin cậy của các nghiên cứu vừa tiết kiệm
được thời gian, công sức và chi phí tính toán
Tài liệu tham khảo
[1] TS Đặng Thị Xuân Mai, Tính đồng nhất của số liệu khi áp dụng phương pháp phân tích tương quan
trong phân tích kinh tế, tạp chí Khoa học Giao thông vận tải số 21 tháng 3/2008
[2] Trần Văn Minh (chủ biên), Xác suất thống kê và các tính toán trên Excel, NXB Giao thông vận tải,
Hà Nội 2001
[3] Luận án tiến sỹ Đặng Thị Xuân Mai, Nghiên cứu hoàn thiện một số vấn đề về phân tích hoạt động
kinh doanh của doanh nghiệp xây dựng, 2001
[4] Danh mục các doanh nghiệp xây lắp có đến 31-12-1995, Tổng cục Thống kê, Vụ giao thông - Xây dựng,1996