CHƯƠNG II: PHƯƠNG PHÁP TRÌNH BÀY Phân tổ thống kê là căn cứ vào một hay một số tiêu thức nào đó để tiến hành phân chia các đơn vị của hiện tượng nghiên cứu thành các tổ hoặc tiểu tổ có t
Trang 1CHƯƠNG II: PHƯƠNG PHÁP TRÌNH BÀY
Phân tổ thống kê là căn cứ vào một hay một
số tiêu thức nào đó để tiến hành phân chia các đơn vị của hiện tượng nghiên cứu thành các tổ (hoặc tiểu tổ) có tính chất khác nhau.
Căn cứ vào một hay một số tiêu thức:
-Căn cứ để lựa chọn
- Số lượng tiêu thức lựa chọn
Kết quả là hình thành các tổ có tính chất khác nhau Các đơn vị trong phạm vi mỗi
tổ có tính chât giống nhau (hoặc gần giống nhau)
Trang 2TổngTổng hợphợp thốngthống kêkê
PhânPhân tíchtích thốngthống kêkê
- Phân tổ có khoảng cách tổ (khoảng cách
tổ bằng nhau và khoảng cách tổ không bằng nhau.
Trường hợp 2: Phân tổ theo tiêu thức số lượng
- Số lượng lượng biến ít;
- Số lượng lượng biến nhiều.
Trang 3Phân tổ có khoảng cách tổ
Khái niệm tổ có khoảng cách tổ:
Mỗi tổ bao gồm một phạm vi lượng biến với 2 giới hạn Giới hạn
dưới là lượng biến nhỏ nhất để hình thành tổ Giới hạn trên là lượng
biến lớn nhất mà nếu quá nó thì chất đổi, dẫn đến hình thành một tổ
mới.
Khoảng cách tổ:
Là chênh lệch giữa giới hạn trên và giới hạn dưới.
h = Giới hạn trên – Giới hạn dưới
Phân tổ có khoảng cách tổ
Trường hợp 1: Khoảng cách tổ bằng nhau
h = (x max – x min )/n
Trường hợp 2: Khoảng cách tổ không bằng nhau
Dựa vào ý nghĩa KTXH của hiện tượng để xác định nội dung
và phạm vi của tổ
Câu hỏi thảo luận
• Những trường hợp nào có thể là phân tổ không
có khoảng cách tổ?
Ví dụ
Trong 1 doanh nghiệp có 100 công nhân, chia thành 6 tổ,khoảng cách tổ bằng nhau theo tiêu thức tiền lương Biết côngnhân có lương cao nhất là 3.200.000 đồng, công nhân có lươngthấp nhất là 2.000.000
Trang 4Dr pepper Sprite Coke classic Diet coke Pepsi Diet coke Pepsi Coke classic Pepsi Pepsi Coke classic Pepsi Coke classic Coke classic Pepsi
Dr Pepper Pepsi Pepsi Sprite Coke classic Coke classic Coke classic Sprite Dr Pepper Diet coke Dr Pepper Pepsi Coke classic Pepsi Sprite Coke classic Diet Coke
Bảng phân phối tần số, tần suất
• Từ số liệu trên, hình thành bảng phân phối tần số, tần suất sau:
Soft drink Tần số Tần suất
Bar graphs (Biểu đồ dạng thanh)
• Là công cụ đồ thị cho phép biểu diễn dữ liệu định tính đượctổng hợp theo phân phối tần số, tần suất (lần và %)
Trang 5Pie chart (biểu đồ dạng bánh)
• Là công cụ đồ thị cho phép biểu diễn dữ liệu định tính được
tổng hợp theo tần suất (lần và phần trăm)
Dr Pepper Pepsi Sprite
của các nhà đầu tư A, B, C
( Đơn vị tính: %)
20
Nhà đầu tư Danh mục
Cổ phiếu 42.27 37.41 41.04 39.81Trái phiếu 29.09 29.93 28.36 29.32Tín phiếu 14.09 13.61 20.15 15.12Tiết kiệm 14.55 19.05 10.45 15.74
Trang 6Biểu đồ hình cột biểu diễn kết cấu vốn theo danh mục đầu tư
Tiết kiệm Tín phiếu Trái phiếu
Tìm khoảng biến thiên: 58 - 12 = 46
Chọn số tổ: 5 (thường trong khoảng 5 đến 15)
Tính khoảng cách tổ (độ rộng): 10 (lấy 46/5 sau đó làm tròn lên)
Xác định giới hạn tổ: 10, 20, 30, 40, 50, 60
Tính trị số giữa của tổ: 15, 25, 35, 45, 55
Đếm số quan sát và đưa vào các tổ
24Lập bảng dữ liệu định lượng
Bảng phân bố tần số
Trang 7Lập bảng dữ liệu định lượng
Tần số tích luỹ
Bài 2Trị số giữa của tổ
03
4200
510
Vẽ đồ thị phân bố dữ liệu định lượng
Ogive
Giới hạn tổ
Vẽ đồ thị phân bố dữ liệu định lượng
Đường cong Ogive
Trang 8Biểu đồ thân lá (Stem and Leaf Display)
• Có 50 ứng viên phỏng vấn cho vị trí quản lý tại công ty Haskens Số liệu
dưới đây thể hiện số câu trả lời đúng trong tổng số 150 câu hỏi của các
ứng viên.
126 128 118 127 124
Biểu đồ thân lá (Stem and Leaf Display)
6 8 9
7 2 3 3 5 6 6
8 0 1 1 2 3 4 5 6
9 1 2 2 2 4 5 5 6 7 8 8 10 0 0 2 4 6 6 6 7 8
11 2 3 5 5 8 9 9
12 4 6 7 8
13 2 4
14 1
6 8 9
7 2 3 3 5 6 6
8 0 1 1 2 3 4 5 6
9 1 2 2 2 4 5 5 6 7 8 8 10 0 0 2 4 6 6 6 7 8
11 2 3 5 5 8 9 9
12 4 6 7 8
13 2 4
14 1
2.1 Số tuyệt đối và số tương đối trong TK
2.2 Các tham số đo độ trung tâm 2.
Mô
Mô tả tả dữ dữ liệu liệu 2.3 Các tham số đo độ phân tán
2.4 Phân vị
2.5 Hình dáng của phân phối
2.1 Số tuyệt đối và số tương đối trong thống kê
2.1.1 Số tuyệt đối
Khái niệm Đặc điểm
Ý nghĩa Đơn vị tính
Các loại số tuyệt đối
Trang 9Ví dụ
Ví dụ 1: Dân số Việt Nam vào thời điểm 0h ngày
1/4/2009 là 85.543.947 người
Ví dụ 2: GDP của Việt Nam tính theo giá thực tế
năm 2010 đạt khoảng 105 tỷ USD.
Khái niệm
Số tuyệt đối trong thống kê là mức độ biểu hiện quy
mô, khối lượng của hiện tượng kinh tế xã hội trong điều kiện thời gian và địa điểm cụ thể
Biểu hiện quy mô: Nói lên quy mô của hiện tượng
Biểu hiện khối lượng:
Là trị số của 1 tiêu thức
3Đơn vị tiền tệ:
Thường dùng Việt Nam đồng và Đô la
Mỹ để biểu hiện
Các loại số tuyệt đối
Số tuyệt đối thời kỳ: phản ánh quy mô, khối lượng của hiện tượng nghiên cứu trong 1 khoảng thời gian nhất định Đặc điểm về số tuyệt đối thời kỳ là có sự tích lũy về lượng theo thời gian.
Số tuyệt đối thời điểm: phản ánh quy mô, khối lượng của hiện tượng nghiên cứu tại một thời điểm nhất định Đặc điểm của số tuyệt đối thời điểm là không có sự tích lũy về lượng qua thời gian
Trang 102.1.2 Số tương đối
Khái niệm Đặc điểm Tác dụng
Các loại số tương đối
Ví dụ: Tổng kim ngạch xuất khẩu của Việt Nam 4 tháng đầu
năm 2010 so với cùng kỳ năm trước là 108,9% Con số108,9% là con số tương đối, để tính có được con số này taphải có 2 mức độ là tổng kim ngạch xuất khẩu của Việt Nam
4 tháng đầu năm 2010 và tổng kim ngạch xuất khẩu 4 thángđầu năm 2009, sau đó so sánh 2 mức độ này với nhau
Khái niệm
Số tương đối trong thống kê biểu hiện quan hệ so sánh giữa
hai mức độ nào đó của hiện tượng nghiên cứu
7 7 8% 8%
8 8 9% 9%
Trang 11Tác dụng
1
Được dùng trong
phân tích thống
kê, giúp nêu lên
kết cấu, quan hê
so sánh, trình độ
phát triển, trình
độ phổ biến
2Dùng số tương đối để biểu hiện tình hình thực tế trong trường hợp cần giữ bí mật số tuyệt đối
3
Có tác dụng trong công tác lập và kiểm tra tình hình thực hiện kế hoạch
Các loại số tương đối
Số tương đối động thái
Số tương đối động thái
Biểu hiện sự biến
động về mức độ
của hiện tượng
nghiên cứu qua
một thời gian nào
và tốc độ phát triển của hiện tượng qua thời gian hay là biểu hiện xu hướng của hiện tượng
Số tương đối kế hoạch
Số tương đối nhiệm vụ kế hoạch
Là tỷ lệ so sánh giữa mức độ của
1 chỉ tiêu cần đạt tới và mức
độ thực tế ở kỳ gốc
Dùng để lập
kế hoạch
(lần, %) 0
k nyy
K
Trang 12Số tương đối kế hoạch
Số tương đối thực hiện kế hoạch
(lần, %) k
1 t
y
y
K
Ví dụ: Ở xí nghiệp A, tổng số sản phẩm được sản xuất ra năm 2008
là 1000 sản phẩm Lãnh đạo xí nghiệp đặt mục tiêu cho năm 2009
là 1200 sản phẩm Trong thực tế năm 2009, số sản phẩm sản xuất ra
là 1250 sản phẩm.
Như vậy ta có:
yo = 1000 (sản phẩm)
yk = 1200 (sản phẩm) y1 = 1250 (sản phẩm)
Từ đó ta tính được:
Số tương đối nhiệm vụ kế hoạch: = x 100 = 120 (%)
Số tương đối thực hiện kế hoạch: = x 100 = 104,17 (%)
cả các bộ phận là
1 hoặc 100%.
(lần, %)
tt
bpy
y
d
Số tương đối không gian
Là kết quả so sánh giữa 2 mức độ cùng loại nhưng khác nhau về không gian hoặc so sánh giữa các bộ phận trong 1
tổng thể.
So sánh giữa 2 mức độ cùng loại nhưng khác nhau về không gian
So sánh giữa hai bộ phận trong 1 tổng thể:
2 không gian khác nhau cùng tồn tại trong
1 tổng thể.
Trang 13Số tương đối cường độ
Nói lên trình độ phổ biến của hiện tượng trong điều kiện
lịch sử nhất định, là kết quả so sánh 2 mức độ khác loại
nhưng có mối liên hệ với nhau.
Số tương đối cường độ
có đơn vị kép.
2.1.3 Điều kiện vận dụng
Khi sử dụng số tương đối
và tuyệt đối phải xét đến đặc điểm của hiện tượng nghiên cứu để rút ra kết luận cho đúng
Phải vận dụng kết hợp số tương đối và số tuyệt đối vì:
+ Các số tương đối được tính ra từ số tuyệt đối.
+ Ý nghĩa của số tương đối còn phụ thuộc vào trị số tuyệt đối mà nó phản ánh.
Ví dụ: Năm 2010, tốc độ tăng trưởng GDP của Việt Nam là
6,78%, trong khi tốc độ tăng trưởng GDP của Mỹ chỉ có 2,9%
Nhưng khi xem xét các số tuyệt đối, qui mô GDP của Việt
Nam năm 2010 là 105 tỷ USD, trong khi đó, qui mô GDP của
Mỹ là 14.000 tỷ USD Như vậy, 1% tăng trưởng của Mỹ đã
lớn hơn cả nền kinh tế của Việt Nam
Ví dụ:
Một doanh nghiệp ngày 5/1 tuyển thêm 10% số công nhân, ngày 25/1 sa thải 10% số công nhân Hỏi số công nhân cuối tháng và đầu tháng tăng, giảm hay bằng nhau?
Trang 14- Số bình quân cộng giản đơn:
- Số bình quân cộng gia quyền:
- Số bình quân cộng điều hòa:
n
x n
x x x x
n i i
n i i n
n n
f
f x f
f f
f x f x f x x
1
1 2
1 2 2 1 1
x M
M x
1 1
2.2.1 Số bình quân
• Số bình quân nhân
- Số bình quân nhân giản đơn:
- Số bình quân nhân gia quyền:
n n
i i n
x x x
i
f i f
f
n f
Trang 15MỘT SỐ DẠNG BÀI TẬP VỀ SỐ TRUNG BÌNH
Dạng 1: Đã cho sẵn dữ liệu
Có số liệu của 5 phân xưởng sản xuất:
Yêu cầu:
- Tính %HTKH về doanh thu bình quân chung 5 phân xưởng sản xuất 6 tháng
đầu năm, 6 tháng cuối năm và cả năm.
% HTKH
về doanh thu
Doanh thu thực tế (triệu đồng)
% HTKH
về doanh thu
Dạng 2: Không cho quyền số
Có số liệu về 4 phân xưởng sản xuất như sau:
Giá thành đơn vị sản phẩm (1000đ)
Dạng 3: Số trung bình điều hòa
Một nhóm gồm 3 người công nhân cùng sản xuất 1 loại sản
phẩm trong thời gian như nhau:
Người công nhân 1 sản xuất 1 sản phẩm hết 30 phút
Người công nhân 2 sản xuất 1 sản phẩm hết 38 phút
Người công nhân 3 sản xuất 1 sản phẩm hết 35 phút
Yêu cầu:
Tính thời gian hao phí trung bình để sản xuất 1 sản phẩm của 3
người công nhân nói trên
Trang 162.2 Mốt
Khái niệm:
Là biểu hiện của 1 tiêu thức được gặp nhiều nhất trong một
tổng thể hay trong 1 dãy số phân phối
Cách tính mốt:
-Áp dụng cho dãy số không có khoảng cách tổ
-Áp dụng cho dãy số có khoảng cách tổ bằng nhau
- Áp dụng cho dãy số có khoảng cách tổ không bằng nhau
Cách tính Mốt Trường hợp 1: Dãy số không có khoảng cách tổ
Mốt được tính theo 2 bước
δ
1 M M
δ
2 1
1 min
Trang 17Cách tính Mốt
• Trường hợp dãy số không có khoảng cách tổ không bằng nhau: việc xác
định Mốt phải căn cứ vào mật độ phân phối
i
i i
h
f
m
Vì các khoảng cách tổ khác nhau nên tổ chứa Mốt sẽ là tổ có m i max Cần
phải thêm cột vào bảng tính để xác định tổ chứa Mốt và tìm δ1, δ2 theo
0
M
m … Công thức tính tương tự như ở trên
Ví dụ
Có số liệu về tuổi ở 1 địa phương như sau:
Yêu cầu:
1.Tính tuổi trung bình của nhóm người trên?
2 Tính Mod về tuổi của nhóm người trên?
có lượng biến đột xuất
vụ đám đông
Mốt là một trong những tham số nêu lên đặc trưng phân phối của dãy số
2.2.3 Trung vị (Me)
Khái niệm
Cách tính
Tác dụng
Trang 182.2.3 Trung vị
Khái niệm:
Trung vị là lượng biến của đơn vị đứng ở vị trí chính giữa
trong dãy số lượng biến, chia dãy số thành hai phần bằng nhau
Cách tính trung vị:
-Áp dụng cho dãy số không có khoảng cách tổ
-Áp dụng cho dãy số có khoảng cách tổ
e
M
1 M i M min M e
f
S 2 f h x
số nêu lên đặc trưng phân phối của dãy số
Thay thế số trung bình cộng trong trường hợp việc tính số trung bình cộng gặp khó khăn
Ứng dụng trong công tác kỹ thuật
và phục vụ công cộng
Trang 19Tool/Data Analysis/Descriptive Statistics
Kết quả sẽ cho số bình quân, trung vị, Mod, số
lớn nhất, số nhỏ nhất, tổng cộng và số lượng biến.
Tuy nhiên phải tính trên dữ liệu gốc chưa phân
tổ, chưa lập bảng tần số.
Ngoài ra Excel chỉ nhận được 1 giá trị Mod nếu
tập dữ liệu có nhiều Mod.
• Tool/Data Analysis/Descriptive Statistics, kết quả sẽ cho số bình quân, trung vị, Mod, số lớn nhất, số nhỏ nhất, tổng cộng và số lượng biến.
• Tuy nhiên phải tính trên dữ liệu gốc chưa phân tổ, chưa lập bảng tần số.
• Ngoài ra Excel chỉ nhận được 1 giá trị Mod nếu tập
dữ liệu có nhiều Mod.
• Excel còn cho biết đại lượng Skewness: Nếu
• - Phân phối chuẩn: Skewness = 0
• - Phân phố lệch phải: Skewness > 0
• - Phân phối lệch trái: Skewness < 0
Một số lưu ý
• Mo và Me không thay đổi với lượng biến đột xuất
• Mo được tính cả với dãy số phân phối thuộc tính và số lượng
• Me chỉ được tính ở dãy số phân phối số lượng
• Số trung bình có đặc điểm san bằng các chênh lệch của từng
lượng biến
• Mo và Me không san bằng chênh lệch của từng lượng biến
• Số trung bình chịu ảnh hưởng của lượng biến đột xuất
2.3.1 Khoảng biến thiên
2.3.2 Độ lệch tuyệt đối bình quân 2.3.
Các Các tham tham số số đo
đo độ độ biến biến thiên thiên của của tiêu thức
2.3.3 Phương sai
2.3.4 Độ lệch tiêu chuẩn
2.3.5 Hệ số biến thiên
Trang 203Được sử dụng nhiều trong nhiều trường hợp nghiên cứu thống
kê như phân tích biến động, mối liên hệ trong điều tra, dự đoán
2.3.1 Khoảng biến thiên
Khái niệm
Là chênh lệch giữa lượng biến lớn nhất và lượng biến nhỏ nhất của tiêu thức nghiên cứu
Ưu điểm: Dễ tính Hạn chế: Chỉ nói lên chênh lệch giữa lượng biến lớn và nhỏ nhất
Công thức Ưu, nhược điểmƯ
lệch tuyệt đối giữa
các lượng biến với
số bình quân của
các lượng biến đó.
Ưu điểm: Đo được tất cả các độ lệch bên trong lượng biến, có ý nghĩa khi dùng phân tích chất lượng sản phẩm để xét độ đồng đều Hạn chế: Chỉ tính giá trị tuyệt đối của
độ lệch
Công thức Ưu, nhược điểmƯ
n
x x
f f x x d
2.3.3 Phương sai
• Khái niệm: Phương sai là trung bình cộng của bình phương các độ lệch
giữa các lượng biến với số trung bình của các lượng biến đó
• Công thức:
nx
xn
f f x x
=
2 i i i
i 2 i
f f x f f x
•Ưu điểm: Khắc phục được sự khác nhau về dấu của độ lệch.
• Hạn chế: vì là bình phương các độ lệch nên trị số bị khuếch đại và không
có đơn vị tính phù hợp.
Trang 21Công thức Ưu, nhược điểmƯ
Độ lệch chuẩn của tổng thể mẫu
Đối với tổng thể mẫu: sử dụng n - 1 ở
) 16 24 ( ) 16 18 ( 2 ) 16 17 ( ) 16 15 ( ) 16 14 ( ) 16 12 ( ) 16 10
) x x ( s
2 i
So sánh các độ lệch chuẩn
5,15
x
5,15
x
5,15
x
Nhận xét: Cả 4 chỉ tiêu trên đều chỉ dùng để so sánh biến
thiên của các hiện tượng cùng loại
Sử dụng Excel:
Tool/Data Analysis/Descriptive Statistics
Có chứa giá trị phương sai: Sample Variance, lấy căn bậc 2 sẽ được độ lệch tiêu chuẩn (có sẵn) là standard deviation.
Trang 22ra còn được dùng trong trường hợp hai hiện tượng có đơn vị tính khác nhau
• Tứ phân vị:
86
2.5 Hình dáng của phân phối
Trang 23Hình dáng của phân phối
Tác dụng của đồ thị hộp ria mèo
• Nhận biết vị trí của bộ dữ liệu trên cơ sở Me
• Nhận biết sự dàn trải của dữ liệu trên cơ sở
độ dài của hộp (khoảng tứ phân vị IQR) và
độ dài của hộp ria mèo
• Nhận biết độ lệch phân phối của dữ liệu
• Nhận biết lượng biến đột xuất và nghi ngờ là đột xuất
• So sánh 2 hay nhiều bộ dữ liệu với cùng 1 thước đo
90
Nhận biết lượng biến đột xuất
IQR 1.5 IQR 1.5 IQR
Giới hạn trong Giới hạn ngoài
Q1 Me Q3
Nghi ngờ là lượng biến đột xuất
Nghi ngờ là
lượng biến
đột xuất
Lượng biến đột xuất Lượng biến
Bài tập
• Làm bài tập tại lớp
• Làm bài tập về nhà
Trang 24Ôn tập cuối chương
• Đọc:
• Bài tập SGK: