Có thể phân biệt 3 loại số sử dụng trong công tác định lượng: Số tuyệt đối, Số tương đối, Số bình quân.. Hiện tượng có 2 khuynh hướng cần được đo lường: * Khuynh hướng tập trung, được ph
Trang 1Chương 4 THỐNG KÊ MÔ TẢ HIỆN TƯỢNG
( Descriptive Statistics)
Đặt vấn đề: 1 Có thể phân biệt 3 loại số sử dụng trong công tác định
lượng: Số tuyệt đối, Số tương đối, Số bình quân
2 Hiện tượng có 2 khuynh hướng cần được đo lường:
* Khuynh hướng tập trung, được phản ảnh qua 3 chỉ tiêu:Số trung bình, Mode và Số trung vị
*Khuynh hướng phân tán, được phản ảnh qua 5chỉ tiêu:Khoảng biến thiên, Độ lệch tuyệt đối bình quân, Phươngsai, Độ lệch chuẩn và Hệ số biến thiên
Mục đích nghiên cứu:
+ SV nhuần nhuyễn kỹ thuật tính các chỉ tiêu trên bằng tay,bằng máy tính bỏ túi và trên Exel, SPSS
+SV hiểu rõ nội dung phản ảnh của các chỉ tiêu trên nhằm sửdụng trong mô tả và phân tích các hiện tượng kinh tế
Tài liệu tham khảo:
-Lý thuyết: giáo trình Xác suất thống kê, Thống kê ứng dụng.-Vận dụng: tài liệu về Quản trị doanh nghiệp, Quản trị rủi ro,tài chính doanh nghiệp,…
1 SỐ TUYỆT ĐỐI (Absolute figure)
1.1 Khái niệm:
Theo “Thuật ngữ TK thông dụng”: Số tuyệt đối là chỉ tiêu biểu hiện qui mô, khối lượng của hiện tượng trong điều kiện không gian, thời gian cụ thể
TD 1:Tổng số dân tòan thế giới có ngày 1.7.2005 là 6 477 triệu người
Giá trị Tài sản cố định của công ty A có ngày 1/1/2009 là 1870,421 tỉđ
TD 2: GDP của CHND Trung Hoa năm 2004 là 1 649 329,4 triệu USD.
Lợi nhuận sau thuế của công ty A trong 6 tháng đầu năm 2009 là594,161 tỉ đồng
1.2 Đơn vị tính: 3 nhóm.
a Đơn vị hiện vật: bao gồm hiện vật tự nhiên và hiện vật qui đổi.
Trang 2+ Hiện vật tự nhiên: căn cứ trên trạng thái vật chất, dịch vụ của sản phẩm
(giá trị sử dụng) để đo lường sản phẩm Bao gồm: kg, l, m, cái, con, chiếc,bộ, chục, cuộc gọi, lượt khách, …
* Ưu điểm : tính cụ thể cao.
* Nhược điểm:
- không cộng được sản phẩm cùng lọai, khác qui cách, phẩm chất → dùngđơn vị hiện vật qui đổi
- không cộng được sản phẩm khác lọai → dùng đơn vị giá trị
+ Hiện vật qui đổi: là đơn vị hiện vật tự nhiên của 1 lọai sản phẩm để qui
đổi các sản phẩm cùng lọai nhưng có qui cách, phẩm chất khác nhau ra sảnphẩm qui đổi
TD 3: Sản lượng lương thực có hạt của VN năm 2007 là 39,98 triệu
tấn.Trong đó, bao gồm 35,87 triệu tấn lúa và 4,11 triệu tấn ngô
Như vậy, khi cộng lúa và ngô người ta đã sử dụng hệ số qui đổi:
1 kg lúa = 1 kg ngô hạt
Cơ sở để xác định Hệ số qui đổi là giá trị sử dụng của sản phẩm Cụ thể, khixác lập hệ số qui đổi giữa lúa và ngô, người ta căn cứ vào hàm lượng caloricủa lúa và ngô cung cấp cho người và vật nuôi
* Ưu điểm: cộng được SP cùng lọai, khác qui cách phẩm chất
* Nhược điểm:
- không cộng được SP khác lọai
- không phản ảnh lượng hiện vật cụ thể, chỉ phản ảnh lượng hiện vật tươngđương
b Đơn vị giá trị: dùng giá trị (giá cả) để phản ảnh giá trị sử dụng của sản
phẩm Bao gồm: đ, USD, nhân dân tệ,…
* Ưu điểm: cộng được tất cả các lọai sản phẩm.
* Nhược điểm: chịu ảnh hưởng của thay đổi giá cả
c Đơn vị thời gian: giờ công , ngày công,….
Trang 31.3 Phân lọai: Căn cứ theo thời gian tính của số liệu, phân biệt 2 lọai số
tuyệt đối:
a STĐ thời điểm (TD1): phản ảnh qui mô của hiện tượng có tại một thờiđiểm nhất định TD: số lao động trong danh sách, số lao động có mặt; giátrị tài sản cố định, lượng hàng hóa tồn kho, số dư tiền gửi ngân hàng, ……
* Đặc điểm: không có sự tích lũy về lượng, từ đó kết quả cộng dồn 2 số
tuyệt đối thời điểm không có nghĩa
TD: Giá trị Tài sản cố định của công ty A có ngày 1/1/2009 là 1870,421 tỉ đ,ngày 2/1/2009 vẫn là 1870,421 tỉ đ; điều này không có nghĩa là GT TSCĐcủa công ty có trong 2ngày là: 1870,421 + 1870,421 = 3740,842 tỉ đ
b STĐ thời kỳ (TD2): phản ảnh qui mô của hiện tượng cộng dồn trong mộtthời kỳ nhất định TD: sản lượng, chi phí sản xuất, doanh thu, lợi nhuận của
1 doanh nghiệp,……
* Đặc điểm: có sự tích lũy về lượng, từ đó kết quả cộng dồn 2 số tuyệt đối
thời điểm có nghĩa
2 SỐ TƯƠNG ĐỐI (relative figure)
2.1 Khái niệm: Số tương đối là kết quả so sánh tỉ lệ giữa 2 trị số.
TD 4: Tốc độ tăng dân số VN bình quân giai đoạn 1999-2009 là 1,2%/ năm
2.2 Hình thức biểu hiện: % (lần, ‰,…); đ/người, người/km2, m2 nhà
ở/người,…
2.3 Phân lọai: 5 loại.
2.3.1 Số tương đối phát triển (tốc độ phát triển: developement index): so
sánh 2 trị số của 1 chỉ tiêu khác nhau về thời gian tính STĐ phát triểnnghiên cứu biến động của hiện tượng theo thời gian
Với: + y1 : trị số của chỉ tiêu kỳ sau (ky ønghiên cứu)
+ y0 : trị số của chỉ tiêu kỳ trước (kỳ gốc )
Trang 4TD 5: Theo số liệu thống kê của Bộ thương mại VN, Kim ngạch xuất khẩuhàng dệt may của VN sang Mỹ giai đoạn 1999-2005 như sau:(ĐVT:triệu USD )
= 1,3324 lần = 133,24% → tăng 33,24%.
Từ đó, có 2 vấn đề là :- cần thiết kế thành bảng tính toán.
- có thể tính các tốc độ phát triển trên theo cùng 1gốc cố định không ?
Nếu tính theo cùng 1 gốc cố định thì các tốc độ phát triển như sau :
Trang 5+Tốc độ phát triển liên hoàn : ti = y y0i (100%)
+Tốc độ phát triển định gốc : Ti = y y1i (100%)
với y 1 : trị số được chọn làm gốc cố định.
3 Liên hệ giữa tốc độ phát triển định gốc và các tốc độ liên
→ t2 t3 t4….tn = Tn1 =
1
n
y y
Trang 6Từ đó, Bảng tính toán các tốc độ phát triển và các tốc độ tăng như sau :
Nhận xét: Qua bảng tính toán trên ta thấy : nhìn chung, trong giai đoạn
99-2005 Kim ngạch xuất khẩu dệt may VN sang thị trường Mỹ đạt bình quânhàng năm là 133,8 triệu USD; kim ngạch này gần như luôn tăng với tốc độtăng bình quân hàng năm là 38,4% để sau 7 năm thì kim ngạch năm 2005đã đạt gấp 7 lần kim ngạch năm 1999
Cụ thể trong giai đoạn trên, kim ngạch năm 2000 tăng nhanh song sau đó lạigiảm nhẹ vào năm 2001 (giảm 5,1%) Kim ngạch này lại tăng đột biếntrong năm 2002 (tăng 114,1%) và sau đó liên tục tăng trong những năm cuốicủa thời kỳ mặc dù tốc độ tăng chậm dần và đạt thấp nhất vào năm 2005(chỉ tăng 5,6%)
Toàn bộ tình hình trên cho phép ta tin rằng trong điều kiện bình thường, kimngạch dệt may VN sang Mỹ trong giai đoạn sắp tới tiếp tục tăng song tốc độtăng khó đạt được như giai đoạn trên
2.3.2 Số tương đối kế họach :
Gọi: + y0 : số thực tế kỳ trước (kỳ gốc)
+ yk : số kế họach kỳ sau (kỳ nghiên cứu)
+ y1 : số thực tế kỳ sau (kỳ nghiên cứu)
Ta có: * STĐ đặt kế họach = y y0k (100%)
* STĐ thực hiện kế họach = y y k1 (100%) Ngoài ra:
* Tốc độ phát triển =
(100%)
Trang 7Với: + yi : lượng của bộ phận thứ i trong tổng thể + y : tổng lượng của tổng thể. i
2.3.4 Số tương đối cường độ: mật độ dân số, GDP trên đầu người, số bác sĩ
3 CÁC CHỈ TIÊU PHẢN ẢNH KHUYNH HƯỚNG TẬP TRUNG CỦA TIÊU CHÍ ( Measures of central tendency ).
3.1.SỐ TRUNG BÌNH (Số Bình quân): Mean, Average
3.1.1 Khái niệm: Số trung bình là trị số đại diện theo 1 tiêu chíđịnh lượng của 1 tổng thể bao gồm các đơn vị cùng lọai
3.1.2 Đặc điểm- Vận dụng:
+ Số trung bình san bằng từ đó che lấp mọi chênh lệch của tổng thể.
+ Trị số trung bình x ( xmin , xmin max)
+ Số trung bình được sử dụng phổ biến trong công tác định lượng để phản
ảnh trị số đại biểu theo từng tiêu chí định lượng
STB cộng → STB điều hòa
3.1.3 Công thức tính STB nhân.
3.1.3.1.Số trung bình Cộng (Arithmetic Mean )
a Số trung bình cộng giản đơn (Arithmetic Mean )
TD 6: Tiền lương của 4 công nhân thuộc tổ cắt công ty May VT trong tháng
8/2009 tuần tự là(1000đ): 1800 2450 2620 và 3000.Vậy tiền lương 1
CN trên bình quân tổ SX là:
Công thức kinh tế: Tiền lương BQ 1 CN = Tổngsốti TổngsốCN ềnlương
= 18002450426203000
Công thức toán học: Số trung bình cộng giản đơn:
Trang 8Với: xi: trị số thứ i của tiêu chí.
( tiền lương của CN thứ i )
n: tổng số đơn vị tổng thể.
(tổng số CN)
xi : tổng lượng của tiêu chí
(tổng lương của CN)
b Số trung bình cộng gia quyền( có trọng số) (Weighted Mean).
(cĩ quyền số)
TDï 7: Tiền lương của 50 công nhân may chuyền may 1 thuộc công ty May
VT trong tháng 8/2009như sau:
Tiền lương 1 CN(x i :1000đ) Số CN(f i: người)
1700 7
2100 10
2200 25
3500 8
Cộng 50
Vậy tiền lương 1 CN trên bình quân tổ SX là: Công thức kinh tế: Tiền lương BQ 1 CN = Tổngsốti TổngsốCN ềnlương =
50 ) 8 3500 ( ) 25 2200 ( ) 10 2100 ( ) 7 1700 ( x X x x =2318 ngđ Công thức toán học : Số trung bình cộng gia quyền: Với: xi:trị số nhóm thứ i của tiêu chí
n x x n 1 i i k 1 i i k 1 i i i f f x x
Trang 9(mức lương thứ i)
f i: số đơn vị có lượng biến thứ i
(số CN có mức lương thứ i)
fi = n : tổng số đơn vị tổng thể.
(tổng số CN)
xifi : tổng lượng của tiêu chí
(tổng lương CN)
f i: - quyền số.Là đại lượng xuất hiện giống nhau ở tử số và mẫu số trong công thức.
- trọng số.
Công thức biển đổi của số trung bình cộng có trọng số:
i
k i i i i k i i k i i k i i i x w f f x f f x x 1 1 1 1 i
k i i w x x 1
Với: wi : tỉ trọng của bộ phận thư ùi trong tổng thể wi = k i fi i 1 Aùp dụng: Với TD 7, dữ liệu được cung cấp như sau: Tiền lương 1 CN ( x i :1000đ) Tỉ trọng CN ( w i: %)
1700 14
2100 20
2200 50
3500 16
Cộng 100 Vậy tiền lương 1 CN trên bình quân tổ SX là:
k
i i
w
x
x
1 (1700x0,14)+(2100x0,2)+(2200x0,5)+(3500x0,16) = 2318 ngđ
Trang 103.1.3.2 Số trung bình điều hòa(Harmonic mean )
a Số trung bình điều hòa gia quyền.
TD 8: Tiền lương của công nhân may gồm 4 chuyền may thuộc 1 công ty
May trong tháng 7/2008 như sau:
Chuyền T.lương 1 CN( x i :1000đ) Tổng lương ( M i
:1000đ)
1 1700 11900
2 2100 21000
3 2200 55000
4 3500 28000
Cộng / 115900
Vậy tiền lương 1 CN trên bình quân 4 chuyền may là: Công thức kinh tế: Tiền lương BQ 1 CN = Tổngsốti TổngsốCN ềnlương
= 3500 28000 2200 55000 2100 21000 1700 11900 115900 = Công thức toán học: Số trung bình điều hòa gia quyền:
Với: xi : lượng nhóm thứ i (lượng biến thứ i của tiêu thức) Mi : tổng lượng nhóm thứ i
i
i
x
M
: số đơn vị tổng thể nhóm i.
b Số trung bình điều hòa giản đơn.
Là trường hợp đặc biệt của điều hóa gia quyền khi quyền số M i bằng nhau.
n 1
i
n 1
x M M x
Trang 11n x
M
nM x
M
M x
1 1
1
1
11
(khi Mi ≡ )
Công thức toán học: Số trung bình điều hòa giản đơn:
3.1.3.3 Số trung bình nhân (Geometric mean )
a Số trung bình nhân giản đơn (Geometric mean )
TD 9: Số Lượt khách du lịch và Doanh thu du lịch của tỉnh Đồng Nai giai
Tốc độ phát triển năm
sau so năm trước (ti : %) / 120,13 166,60 135,64 109,90 130,00
Trang 12Tốc độ phát triển Tổng lượt khách bình quân hàng năm giai đoạn 2001-2006của tỉnh là:
t = 5 1 , 2013x1 , 666x1 , 3564x1 , 099x1 , 3 = 1,3114 =131,14%
Tốc độ tăng bình quân hàng năm là:
a = 131,14% - 100% = 31,14%
Công thức toán học: Số trung bình nhân giản đơn:
n i n i
n
t t t t t
1 3
Với: ti : tốc độ phát triển liên hoàn thứ i
Tương tự , ta tính được tốc độ phát triển liên hoàn về Tổng Doanh thu bìnhquân hàng năm của tỉnh giai đoạn 2001-2006 là 129,19%
Ghi chú: 1.Từ mối liên hệ giữa tốc độ phát triển định gốc và các tốc độ
liên hoàn : Các công thức STB Nhân giản đơn:
2.Trong kinh tế, STB Nhân chủ yếu dùng để tính tốc độ phát
triển bình quân theo thời gian.
3.Không dùng STB Nhân để tính tốc độ tăng bình quân.
n
i n
n 1
n 1 n
n n i1
yT
Trang 13b Số trung bình nhân gia quyền.
TD 10:Tốc độ tăng diện tích khai thác đưa vào canh tác của trang trại BP 1
trong 10 năm qua như sau: -5 năm đầu, mỗi năm tăng 20%
-3 năm tiếp theo, mỗi năm tăng 15%
-2 năm cuối, mỗi năm tăng 10%
Tốc độ phát triển bình quân hàng năm trong 5 năm đầu là: 120%
3 năm tiếp là: 115%
2 năm cuối là: 110%
Tốc độ phát triển bình quân hàng năm trong 10 năm trên là:
k 1 i
i
k 2
1 i
f i
f
f k
f 2
f
1 t t t t
3.2.1 Khái niệm: Mode là biểu hiện được gặp nhiều nhất trong tổng thể.
TD 11: Tổng số lao động trong danh sách của công ty TNHH Hoàn Cầu cóngày 1/8/2009 là 70 người; trong đó có 50 lao động nữ và 20 lao động nam
Vậy Mode về giới tính của số lao động trên là NỮ
(Đa số lao động trên là nữ)
TD 12: Năng suất lao động của 30 nghệ nhân thêu thuộc xưởng thêu MT
trong tháng 7/2009 là:
f k i
f i
t
t 1
1
Trang 14NSLĐ (bức tranh/người) 25 26 28 29 32
Số lao động (người) 14 4 5 6 1
Mode về NSLĐ của 30 nghệ nhân trên là mức NS 25 SP/người
(Đa số nghệ nhân trên có mức NS là 25 SP/người)
3.2.2 Đặc điểm-Vận dụng:
+ Không phụ thuộc vào tất cả các lượng biến, mà phụ thuộc vào sự phân bốcủa tổng thể theo các lượng biến
+ Từ đó, Mode không chịu ảnh hưởng của các lượng biến đột xuất
+ Được dùng trong nghiên cứu kinh tế văn hóa, chính trị, xã hội, để phảnảnh thị hiếu, tâm lý của người tiêu dùng; phản ảnh khuynh hướng của quầnchúng,…
3.2.3 Phương pháp xác định: 2 trường hợp:
a Đối với tiêu chí thuộc tính (xem TD 11): Mode là biểu hiện được gặpnhiều nhất trong tổng thể
b Đối với tiêu chí số lượng: 2 trường hợp:
a1 Dãy số rời rạc (xem TD 12): Mode là lượng biến có tần số lớn nhất
a2 Tài liệu phân tổ có khoảng cách tổ: 2 bước
- Xác định tổ có chứa Mode
- Xác định Mode ( theo công thức )
3.3 Số trung vị ( Median : Me )
3.3.1 Khái niệm: Số trung vị là lượng biến đứng giữa trong dãy số lượng
biến sắp xếp thứ tự
TD 13: Điểm môn học Thống kê của 5 SV nhóm 1 là:
5 6 7 8 9
Số trung vị về điểm của 5 SV trên là điểm 7
Trang 15TD 14: Điểm môn học Thống kê của 6 sinh nhóm 2 là:
5 5 8 9
Số trung vị về điểm của 6 SV = x 3 2x4
= 6 27 = 6,5 điểm
3.3.2 Đặc điểm-Vận dụng:
+Không phụ thuộc vào tất cả các lượng biến, mà phụ thuộc vào vị trí củacác lượng biến
+Từ đó, Mode không chịu ảnh hưởng của các lượng biến đột xuất
+3 chỉ tiêu STB, Mode, số trung vị phản ảnh khoảng trị số tập trung củatổng thể
+3 chỉ tiêu STB, Mode, số trung vị phản ảnh hình dáng của phân phối củaDãy số:
Biểu thị hình dáng của phân phối chủ yếu sử dụng đối với phân phối chuẩn:
o
e M M
Mean = Me =Mode
Trang 16TD: BIỂU ĐỒ PHÂN BỐ ĐIỂM THI ĐẠI HỌC CỦA THÍ SINH TOÀN QUỐC 2006
3.3.3 Phương pháp xác định: 2 trường hợp:
a Dãy số rời rạc: Me là lượng biến đứng giữa, có 2 trường hợp:
a1.Số đơn vị tổng thể lẻ(xem TD 13): có 1 lượng biến đứng giữa (xm+1):
a2 .Số đơn vị tổng thể chẵn (TD 14): có 2 lượng biến đứng giữa (xm & xm+1):
Me = x m 2x m 1
b Tài liệu phân tổ có khoảng cách tổ: 2 bước
- Xác định tổ có chứa Mode
- Xác định Mode ( theo công thức )
Trang 17Aùp dụng: Với tình hình của thí dụ 12, ta tính được:
Ghi chú :
1 Tương tự, khi số đơn vị tổng thể lớn , có thể chia Dãy số thành 10 phầnbằng nhau, gọi là Thập phân vị
2 Thống kê mô tả cung cấp cho nhà quản trị 5 chỉ tiêu sau (five number)
để quan sát khái quát dãy dữ liệu: xmin - Q1 - Me - Q3 - xmax với biểu
đồ Box-and-Whisker Plot như sau :
Trang 18
++Box plot và các biểu đồ hình dáng của phân phối:
++Tác dụng của box plot:
- Khái quát lượng của bộ dữ liệu sắp xếp theo vị trí của chúng quanh Me
- Nhận biết hình dáng phân phối của dữ liệu
- Quan sát sự dàn trãi của dữ liệu từ việc tính toán: xmax - xmin , IQR =Q3 Q1
-đ- Xác định được lượng biến đột xuất (outliers).
Q1 Me Q3
IQR
1.5 IQR 1.5 IQR
Giới hạn trong
Giới hạn ngồi
Q1Me Q3
Lượng biến đột xuất
Lượng biến
đột xuất
Giới hạn trong
1.5 IQR 1.5 IQR
Giới hạn
ngồi
Trang 19Trong đó:
+Giới hạn trong (inner fene) :-Cận dưới (lower bound)= Q1 - 1,5 IQR
-Cận trên (upper bound)= Q3 + 1,5 IQR
+Giới hạn ngoài (outer fene) :-Cận dưới (lower bound)= Q1 - 3 IQR
-Cận trên (upper bound)= Q3 + 3 IQR
Như vậy, những trị số x < Q1 - 3 IQR và những trị số x > Q3 + 3 IQR lànhững lượng biến đột xuất Trong thực tế, lượng biến đột xuất là những thông sốbất thường của chất lượng sản phẩm trong quản trị sản xuất, những thông tin khácbiệt trong nghiên cứu thị trường; những khoản phát sinh, những dòng vốn đột biếntrong phân tích tài chính;……
Việc xác định được những lượng biến đột xuất này có tác dụng trong phân tích dữliệu phục vụ cho mọi mục đích nghiên cứu Về mặt xử lý số liệu, có thể loại trừnhững lượng biến đột xuất khỏi dãy dữ liệu trước khi vận dụng các phương phápphân tích khác vì những trị số này có thể phản ảnh sự manh nha thay đổi của hiệntượng song chưa thành qui luật của hiện tượng
Ngoài ra, những trị số trong khoảng giới hạn trong và giới hạn ngoài cũngcó thể là lượng biến đột xuất
4 CÁC ĐẶC TRƯNG ĐO LƯỜNG KHUYNH HƯỚNG PHÂN TÁN
CỦA TIÊU CHÍ ( Measures of central dispersion)
4.1.Khoảng biến thie ân (The Range : R )
R = xmax - xmin
Ưu: tính khái quát cao, dễ tính toán
Nhược: càng kém chính xác khi tổng thể càng lớn
Khoảng biến thiên của nhữûng trị số ở giữa được gọi là Độ trãi giữa ( RQ )
hay gọi là Khoảng tứ phân vị ( IQR : Interquartiles Range):
IQR = Q3 - Q1
Trang 204.2 Độ lệch tuyệt đối bình quân ( The Mean Absolube Deviation : d
f
f x x d
Ưu: tính chính xác cao
Nhược: bỏ qua sự khác nhau về dấu
4.3 Phương sai ( The Variance : σ2 , Var )
°Phương sai của tổng thể chung : σ2
2 i 2
f
f x x
Với x : Số trung bình của tổng thể chung
Ưu: tránh triệt tiêu do dấu nhưng vẫn bảo đảm sựkhác nhau về dấu
Nhược: phóng to độ chênh lệch
°Phương sai của tổng thể mẫu : Phương sai hiệu chỉnh mẫu ( s2
)