Learning Objectives • Measures of Center and Location: Mean Arithmetic Average,Weighted Mean, Geometric Mean, Mode, Median • Other measures of Location: Percentiles, Quartiles • Measu
Trang 1Khái niệm & Ứng dụng
Thống kê kinh doanh
cơ bản:
Khái niệm & Ứng dụng
Activity 4 + 5 + 6 Thống kê mô tả
Sơ đồ phân tích
Activity 4 + 5 + 6 Thống kê mô tả
Sơ đồ phân tích
Người dịch : Châu Lê Duy Thức (binhgiaminh@yahoo.com)
Nguyễn Phúc Đạt (astrotek1232000@yahoo.com)
Trang 2Learning Objectives
• Measures of Center and Location: Mean
(Arithmetic Average,Weighted Mean,
Geometric Mean), Mode, Median
• Other measures of Location: Percentiles,
Quartiles
• Measures of Variation: Range,
Interquartile range, Variance and Standard
deviation, Coefficient of variation
Những chỉ tiêu biến thiên: Khoảng biến thiên, khoảng tứ phân vị, phương sai và độ lệch tiêu chuẩn, hệ số biến thiên
Những chỉ tiêu biến thiên: Khoảng biến thiên, khoảng tứ phân vị, phương sai và độ lệch tiêu chuẩn, hệ số biến thiên
Những chỉ tiêu tập trung và phân tán : (trung bình cộng, trung bình gia trọng, trung bình nhân), Mode, Trung vị.
Những chỉ tiêu tập trung và phân tán : (trung bình cộng, trung bình gia trọng, trung bình nhân), Mode, Trung vị.
Những chỉ tiêu phân tán khác: những phân vị, những điểm tứ phân vị
Những chỉ tiêu phân tán khác: những phân vị, những điểm tứ phân vị
Trang 3Contents
• 1 Measures of Central Tendency
• 1.1 Mean (Arithmetic Mean)
tiêu chí 1.1 số bình quân (TB cộng)
1.2 Mode
1.3 Trung vị
1.4 Hình dáng (của) một Phân phối.
1 Các chỉ tiêu phản ánh khuynh hướng tập trung của
tiêu chí 1.1 số bình quân (TB cộng)
1.2 Mode
1.3 Trung vị
1.4 Hình dáng (của) một Phân phối.
2 Những chỉ tiêu phân tán khác: những phân vị và những điểm tứ phân vị
2.1 Những điểm tứ phân vị.
2.2 Box and Whisker Plot 2.3 Các biểu đồ hình dạng phân phối box and Whisker Plot
2 Những chỉ tiêu phân tán khác: những phân vị và những điểm tứ phân vị
2.1 Những điểm tứ phân vị.
2.2 Box and Whisker Plot 2.3 Các biểu đồ hình dạng phân phối box and Whisker Plot
Trang 4• Using Microsoft Excel
• Exercices 3 Các chỉ tiêu biến thiên
3.1 Khoảng biến thiên 3.2 Khoảng tứ phân vị (độ trãi giữa)
3.3 Phương sai 3.4 Sự lệch tiêu chuẩn.
3.5 Hệ số biến thiên
3.6 Quy tắc Thực nghiệm và Định lý Tchebysheff
3.5 Hệ số biến thiên
3.6 Quy tắc Thực nghiệm và Định lý Tchebysheff
3.7 Định lý Tchebysheff
Sử dụng Microsoft Excel
Exercices
Trang 5Summary Measures
Center and Location
Mean Median Mode
Other Measures of Location
Weighted Mean
Describing Data Numerically
Variation
Variance Standard Deviation
Range Percentiles Interquartile Range
Quartiles
Sơ lược về các chỉ tiêu
Sơ lược về các chỉ tiêu
Mô tả dữ liệu số
Mô tả dữ liệu số
Chỉ tiêu phân tán khác
phân vị
Tứ phân vị
Tứ phân vị
Sự biến thiên Khoảng biến thiên
Khoảng tứ phân vị
Khoảng tứ phân vị
Phương sai
Sự lệch tiêu chuẩn
Sự lệch tiêu chuẩn
Trang 61 Measures of Central Tendency
Center and Location
Mean Median Mode Weighted Mean
i
i i W
w
xww
x
wX
Các chỉ tiêu phản ánh khuynh hướng tập trung của tiêu chíCác chỉ tiêu phản ánh khuynh hướng tập trung của tiêu chí
Trang 71.1 Mean (Arithmetic Mean)
Mean (arithmetic mean) of data values
Trang 8Được sử dụng khi những giá trị được nhóm lại bởi tần số (thường xuyên) hoặc tương đối quan trọng
2 8
8 7
12 6
4 5
Frequency
Days to
Complete
2 8
8 7
12 6
4 5
6.31
26 164
2 8 12 4
8) (2 7) (8 6) (12 5)
(4 w
x w X
i
i i W
Trang 91.2 Mode
• A measure of central tendency
• Value that occurs most often
• Not affected by extreme values
• Used for either numerical or categorical data
• There may be no mode or several modes
- Giá trị mà xuất hiện thường xuyên nhất.
- Không bị ảnh hưởng bởi những giá trị cực trị.
- Được sử dụng cho mọi dữ liệu số hay tuyệt đối.
- Có thể không có Mode nào hay vài Mode
- Một chỉ tiêu phản ánh khuynh hướng tập trung của các tiêu chí
- Giá trị mà xuất hiện thường xuyên nhất.
- Không bị ảnh hưởng bởi những giá trị cực trị.
- Được sử dụng cho mọi dữ liệu số hay tuyệt đối.
- Có thể không có Mode nào hay vài Mode
Trang 101.3 Median
• Robust measure of central tendency
• Not affected by extreme values
• In an ordered array, the median is the “middle” number
If n or N is odd, the median is the middle number
If n or N is even, the median is the average of the two
- Chỉ tiêu mạnh phản ánh khuynh hướng tập trung của các tiêu chí
- Không bị ảnh hưởng bởi giá trị cực đại
- Trong một mảng có trật tự, trung bình là số
“giữa”
+ Nếu n hoặc N là số lẻ, trung bình là số giữa + Nếu n hoặc N là chẵn, trung bình là trung bình của hai số giữa
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Trang 11
(Longer tail extends to left) (Longer tail extends to right)
Hình dáng của một phân phối
Hình dáng của một phân phối
- Mô tả dữ liệu được phân phối như thế nào
Trang 12The p thpercentile in a data array:
p% are less than or equal to this
value
(100 – p)% are greater than or
equal to this value
Các chỉ tiêu phân tán khác
Trang 132.1 Quartiles
• Split Ordered Data into 4 Quarters
• Position of ith Quartile
Vị trí của dữ liệu thứ 4 trong bảng tứ phân vị được tính như sau
Trang 16Refer to summary on Exhibit 3.4 (p.114), Fig 3.13 (p.115)
Các biểu đồ hình dạng phân phối box and Whisker
Plot
Trang 17Population Standard Deviation Sample Standard Deviation
Range
Interquartile Range
Trang 18Phương sai của tổng thể mẫu
Độ lệch tiêu chuẩn chung
Độ lệch tiêu chuẩn mẫu
Trang 19Sự khác nhau giữa giá trị lớn nhất và nhỏ nhất
Không phụ thuộc vào sự phân bố của dãy số
Không phụ thuộc vào sự phân bố của dãy số
Trang 20Độ trãi giữa hay khoảng tứ phân vị
Sắp xếp các dữ liệu theo thứ tự
Trang 21X N
• Important measure of variation
• Shows variation about the mean
3.3 Variance Phương sai
Chỉ tiêu quan trọng của
biến thiên
Chỉ tiêu quan trọng của
biến thiên
Cho thấy sự biến thiên của số trung
bình
Cho thấy sự biến thiên của số trung
Trang 223.4 Standard Deviation
• Most important measure of variation
• Shows variation about the mean
Sample standard deviation :
Population standard deviation :
X X S
X N
Độ lệch tiêu chuẩn
Chỉ tiêu quan trọng nhất của
biến thiên
Chỉ tiêu quan trọng nhất của
biến thiên Cho thấy sự
biến thiên của
số trung bình
Cho thấy sự biến thiên của
số trung bình
Độ lệch tiêu chuẩn mẫu
Độ lệch tiêu chuẩn chung
Trang 23Comparing Standard Deviations
So sánh độ lệch tiêu chuẩn
So sánh độ lệch tiêu chuẩn
Trang 24• Shows Variation Relative to Mean
• Used to Compare 2 or More Groups
Cho thấy biến thiên tương đối
để tính giá trị trung bình
Sử dụng để
so sánh 2 hay nhiều hơn chỉ
tiêu
Sử dụng để
so sánh 2 hay nhiều hơn chỉ
tiêu
Trang 253.6 The Empirical Rule and
Tchebysheff’s Theorem
• 3.6.1 The Empirical Rule (Qui tắc thực nghiệm)
population or the sample
lý Tchebysheff
Qui tắc thực nghiệm và định
Trang 273.7 Tchebysheff’s Theorem
• Regardless of how the data are distributed, at least (1 - 1/k2) of the values will fall within k standard deviations of the mean
• Examples:
(1 - 1/12) = 0% …… k=1 (μ ± 1σ)
(1 - 1/22) = 75% … k=2 (μ ± 2σ)
(1 - 1/32) = 89% ……… k=3 (μ ± 3σ)
Bất kể sự phân phối của dữ liệu, ít nhất là (1 - 1/
k2) của các giá trị sẽ nằm trong k độ lệch chuẩn của số bình quân
Định lý Tchebysheff
Trang 28Using Microsoft Excel
• Use menu choice:
tools / data analysis / descriptive statistics
• Enter details in dialog box
Trang 29
Using Microsoft Excel (continued)
tools / data analysis / descriptive statistics
Trang 30Using Microsoft Excel (continued)
Enter dialog box
details
Check box for
summary statistics
Click OK
Trang 31Using Microsoft Excel (continued)
Microsoft Excel descriptive statistics output,
using the house price data:
House Prices:
$2,000,000 500,000 300,000 100,000 100,000
Trang 32Froblem for Activity 6
• The following data represent the waiting
customer enters the line until he or she
reaches the teller window) of 15 customers
Dữ liệu sau đây đại diện cho thời gian đợi trong vài phút (definded trong khi thời gian khách hàng vào hàng cho đến khi khách hàng đạt đến cửa sổ người thu ngân) của
15 khách hàng tại hai nhánh ngân hàng
Dữ liệu sau đây đại diện cho thời gian đợi trong vài phút (definded trong khi thời gian khách hàng vào hàng cho đến khi khách hàng đạt đến cửa sổ người thu ngân) của
15 khách hàng tại hai nhánh ngân hàng
Trang 34Froblem for Activity 6 (continued)
branches :
1 Using Exel: List the five-number summary
(Xmin – First quartile – Median – Third quartile – Xmax)
interquartile range, variance, standard deviation, coefficient of variation