Định nghĩa Thống kê là một khoa học bao gồm hệ thống các phương pháp: thu thập, tổng hợp, trình bày, tóm tắt dữ liệu; phân tích và dự đoán giúp các nhà quản lý ra quyết định... Ước lượ
Trang 1THỐNG KÊ ỨNG DỤNG TRONG
KINH DOANH VÀ KINH TẾ
Trang 2Chương 1: Giới thiệu môn học
Định nghĩa
Chức năng của thống kê
Các khái niệm căn bản
Trang 3Định nghĩa
Thống kê là một khoa học bao gồm hệ thống các phương pháp: thu thập, tổng hợp, trình bày, tóm tắt dữ liệu; phân tích và dự đoán giúp các nhà quản lý ra quyết định
3 NNP-ĐHNH
Trang 4Chức năng của thống kê
Thống kê mô tả (Descriptive Statistics): Thu
thập, trình bày dữ liệu và tính toán các đặc
trưng nhằm mô tả đối tượng nghiên cứu
Thống kê suy diễn (Inferential Statistics): các phương pháp giúp hiểu biết về tổng thể dựa
trên kết quả khảo sát của mẫu
Trang 5Các khái niệm căn bản
Tổng thể (Population)
Mẫu (Sample)
Biến (Variable)
Dữ liệu (Data)
5 NNP-ĐHNH
Trang 6Tập hợp chính và mẫu (Population and
Sample)
Tập hợp chính (Tổng thể): tập hợp tất cả các đơn
vị (phần tử) mà ta quan tâm nghiên cứu trong một vấn đề nào đó Số phần tử của tổng thể được ký hiệu là N
Mẫu: là tập hợp con của tập hợp chính Mẫu
gồm một số hữu hạn n phần tử
Tập hợp chính = {x1, x2, x3 …xN}
Mẫu = {x1, x2, x3 …xn}
Trang 7Biến (Variable)
Biến: là đặc điểm của đơn vị tổng thể
Biến định tính (qualitative variable)
Thể hiện loại của đơn vị (phần tử)
Ví dụ: Giới tính, nghề nghiệp,
Biến định lượng (quantitative variable)
Thể hiện bằng con số (numeric),đó là kết quả của cân, đong, đo, đếm
7 NNP-ĐHNH
Trang 8Phân loại Biến
Trang 10Phân loại dữ liệu
Trang 11Tóm tắt các loại thang đo
Thang đo Đặc điểm Đối tượng
có thể đo
Định danh Định nghĩa duy
nhất cho mỗi số:
Thái độ, ý kiến, các chỉ số…
Tỉ lệ Sự tương được
của các tỉ số 4/2
= 10/5
Tuổi, chí phí, doanh thu, thị
NNP-ĐHNH
Trang 12Các loại thang đo
Thang đo định danh (Nominal Scale)
Thang đo thứ bậc (Ordinal Scale)
Thang đo khoảng (Interval Scale)
Thang đo tỉ lệ (Ratio Scale)
Trang 13Chương 2 Thu thập và trình bày dữ liệu
Phân loại và thu thập dữ liệu
Trình bày dữ liệu: bảng và các biểu đồ thống kê
Trang 14Nội Dung Chương 2
Thu Thậïp dữ liệu
Tổng hợp
Trình bày dữ liệu
Trang 15Nguồn dữ liệu
Quan sát
Thực nghiệm
Điều tra
Nguồn dữ liệu
Dữ liệu thứ cấp
3 NNP-ĐHNH
Trang 16Dữ liệu thứ cấp (Secondary Data)
Số liệu công bố của nhà nước
Bảng báo cáo tài chánh
Internet
Trang 17
Dữ liệu sơ cấp (Primary Data)
Loại điều tra
Điều tra toàn bộ (Census)
Điều tra chọn mẫu (Sampling)
Phương pháp thu thập dữ liệu
Phỏng vấn
Gửi thư
Quan sát
5 NNP-ĐHNH
Trang 21(tieáp theo)
9 NNP-ĐHNH
Trang 22 Sắp xếp các quan sát vào các nhóm
Chiều cao Đếm Tần số
Trang 23 Nếu dữ liệu khảo sát được quy đổi thành số tự nhiên, ta được (làm tròn lên)
Chiều cao Tần số
[154;159] 3 (159;164] 17 (164;169] 10 (169;174] 9 (174;179] 6
5
1
45
i i
11 NNP-ĐHNH
4, 8 5
Trang 24 Bảng phân phối tần số
Biểu đồ phân phối tần số
Dữ liệu định tính: biểu đồ hình cột, biểu đồ hình tròn, biểu đồ Pareto
Dữ liệu định lượng:
Biểu đồ phân phối tần số (Histogram)
Phương pháp Nhánh-Lá (Stem&Leaf)
Trình bày dữ liệu
Trang 25Đa giác
Phân phối tần số tương đối tích lũy
Bảng
41, 24, 32, 26, 27, 27, 30, 24, 38, 21
21, 24, 24, 26, 27, 27, 30, 32, 38, 41
0 1 2 3 4 5 6 7
Trang 26Biểu đồ phân phối tần số (Histogram)
Trang 27Biểu đồ nhánh- lá (Stem and Leaf)
Trang 28Trình bày dữ liệu (tiếp theo)
Hình thanh
Trang 291
hướng tập trung
Khảo sát độ phân tán
Khảo sát hình dạng phân phối của tổng thể
Chương 3 Tóm Tắt Dữ liệu
NNP-ĐHNH TPHCM
Trang 30Khuynh hướng tập trung
Tóm tắt dữ liệu
Độ phân tán
Phương sai
Độ lệch tiêu chuẩn
Hệ số biến thiên
Range
Trang 31Đặc trưng đo lường khuynh hướng tập trung
Khuynh hướng tập
N
i i
x x
Trang 32Trung bình số học (Mean)
x x
n
Trang 33 Dữ liệu phân nhóm (Grouped Data)
Trong đó:
mi: điểm giữa (midpoint) của khoảng thứ i
fi: tần số (frequency)
x
n f
Trang 34•Trung bình trọng số (Weighted Mean)
1
11
i
i i
x w
w
f w
Trang 35 Tính chất của trung bình số học
Tổng độ lệch giữa các giá trị xi với trung
bình số học bằng 0
(
7 NNP-ĐHNH TPHCM
Trang 362.Trung bình tổng thể
Tính từ dữ liệu gốc
Trong đó:
: trung bình tổng thể
xi: giá trị của quan sát thứ i
N: kích thước tổng thể
1
N
i i
x N
8 NNP-ĐHNH TPHCM
Trang 37 Dữ liệu phân nhóm
Trong đó
N
f m
k
i
i i
Trang 38 Trung bình trọng số (Weighted Mean)
N f
Trang 390 1 2 3 4 5 6 7 8 9 10 12 14
Trung bình
= 5
Trung bình = 6
0 1 2 3 4 5 6 7 8 9 10
Trung bình số học chịu ảnh hưởng bởi
các giá trị đột biến (outliers)
(tiếp theo)
Trung bình số học
11 NNP-ĐHNH TPHCM
Trang 401 2
n n
e
x x
Trang 41 Dữ liệu phân nhóm (Grouped Data)
trong đó nhóm Me là nhóm đầu tiên có
1
1(min)
2
Me
i i
Trang 42Đặc điểm của số trung vị
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Số trung vị không chịu ảnh hưởng bởi
các giá trị đột biến (outliers)
e
Trang 43Số yếu vị (Mode)
Mode là giá trị có tần số lớn nhất
trị đột biến
Một dãy số có thể có nhiều Mode
Một dãy số có thể không có Mode
Mode có thể xác định cho dữ liệu định
tính
15 NNP-ĐHNH TPHCM
Trang 440 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Mode có hai trị số:
9 và 12
0 1 2 3 4 5 6
Không có Mode
Mode (tt)
16
Trang 45 Dữ liệu phân nhóm:
trong đó nhóm Mo là nhóm có tần số lớn
nhất
Nếu không có nhóm kề trước/sau thì tần số
của nhóm đó bằng không
1 (min)
Trang 46Trung bình hình học (Geometric
Trang 47Đo lường độ phân tán
Biến thiên
Phương sai Độ lệch tiêu chuẩn Hệ số
biến thiên
Phương sai tổng thể Phương sai mẫu
Độ lệch tiêu chuẩn tổng
Trang 48Đo lường độ phân tán (tt)
Phân vị thứ p (0<p<100) là giá trị mà có tối đa
p% giá trị nằm bên trái nó và tối đa (100-p)%
giá trị nằm bên phải nó Kí hiệu là
min max x
Trang 49 Dữ liệu phân nhóm: Xét nhóm k là nhóm đầu tiên có Ta có:
1
1 (min)
100
k
i i
f
NNP-ĐHNH TPHCM
Trang 50Tứ phân vị (Quartiles) của dữ liệu mẫu
Trang 51 Phát hiện giá trị bất thường (Outliers)
Một quan sát được xem là bất thường nếu giá trị của quan sát đó nằm ngoài đoạn
[Q1 – 1,5RI; Q3 + 1,5RI]
23 NNP-ĐHNH TPHCM
Trang 52 Độ lệch tuyệt đối trung bình (Mean of Absolute Deviation)
Dữ liệu mẫu
1
n
i i
Trang 53 Độ lệch tuyệt đối trung bình tổng thể
N
x MAD
Trang 54 Phương sai và độ lệch tiêu chuẩn
Phương sai mẫu (Sample variance)
Trang 55 Độ lệch tiêu chuẩn mẫu (Standard Deviation) : là căn bậc 2 của phương sai mẫu
Trang 56 Phương sai tổng thể (Population variance)
Độ lệch tiêu chuẩn
Trang 57Ví dụ: So sánh 3 tập dữ liệu
x
x
x
29 NNP-ĐHNH TPHCM
Trang 58 Các công thức khai triển tính phương sai mẫu
– Phương sai mẫu
1
2
1 2
s
n i
n i
i i
Đo lường độ phân tán (tt)
( ) 1
n
i i
Trang 59– Phöông sai toång theå
2 1
Trang 60 Hệ số biến thiên (Coefficient of Variation)
– Dữ liệu mẫu
– Tổng thể
100 %
s CV
Trang 61Hình dáng phân phối của dãy số (Shape)
Hệ số lệch
Công thức của Pearson
Xác định cho dữ liệu mẫu
sk: hệ số lệch (Skew)
Trang 62 Xác định cho tổng thể
Trang 63 Ba dạng hình dáng phân phối của dãy số
Mean = Median = Mode
Mean < Median < Mode Mode < Median < Mean
Lệch phải
Hình dáng phân phối của dãy số (tt)
35 NNP-ĐHNH TPHCM
Trang 64Chương 4 ƯỚC LƯỢNG VÀ KIỂM ĐỊNH
GIẢ THUYẾT
Trang 65I ƯỚC LƯỢNG (Estimation)
II KIỂM ĐỊNH GIẢ THUYẾT THAM SỐ (Parametric test)
Trang 66I ƯỚC LƯỢNG
1 Ước lượng điểm – Point Estimation
Tổng thể Mẫu
Trung bình μ x
Tỷ lệ p pˆ
Phương sai 2 s2
Trang 67I ƯỚC LƯỢNG
2 Ước lượng khoảng – Interval Estimation
2.1 Ước lượng trung bình tổng thể (μ)
(Confidence intervals for mean of a normal population)
2.2 Ước lượng tỷ lệ tổng thể (p)
(Confidence intervals for population proportion)
2.3 Ước lượng phương sai tổng thể (σ 2 )
(Confidence intervals for the variance of a normal population)
Trang 682.1 Ước lượng trung bình tổng thể (μ)
(Confidence intervals for mean of a normal population)
zα/2 được tra từ bảng phân phối chuẩn chuẩn tắc
x là trung bình của mẫu
μ là trung bình của tổng thể cần ước lượng
Trang 692.1 Ước lượng trung bình tổng thể (μ)
(Confidence intervals for mean of a normal population)
Trường hợp n≥30:
Nếu chưa biết: sử dụng độ lệch chuẩn mẫu s
n
s z
x n
s z
x /2 /2
Trong đó:
zα/2 được tra từ bảng phân phối chuẩn chuẩn tắc
x là trung bình của mẫu
μ là trung bình của tổng thể cần ước lượng
s là độ lệch chuẩn mẫu hiệu chỉnh
Trang 71Các giá trị độ tin cậy thông dụng
Trang 722.1 Ước lượng trung bình tổng thể (μ)
(Confidence intervals for mean of a normal population)
Ví dụ: Một trường đại học nghiên cứu về số giờ tự học của sinh viên, chọn ngẫu nhiên 200 sinh viên cho thấy số giờ tự học trung bình trong một tuần là 18,36 giờ, độ lệch chuẩn là 3,92 giờ Với độ tin cậy 95% xác định số giờ tự học trung bình trong 1 tuần của sinh viên ở trường này
Trang 732.1 Ước lượng trung bình tổng thể (μ)
(Confidence intervals for mean of a normal population)
18 8168
,
17
200
92 ,
3 96 , 1 36 ,
18 200
92 ,
3 96 , 1 36
Nghĩa là số giờ tự học trung bình trong 1 tuần
của sinh viên từ 17,8168 đến 18,9032 giờ với
độ tin cậy là 95%
Trang 742.1 Ước lượng trung bình tổng thể (μ)
(Confidence intervals for mean of a normal population)
x n
s t
x n1, /2 n1, /2
Trang 75Phân phối Student (t)
Đây là một họ các phân phối
Giá trị tới hạn được xác định thông qua bậc tự do ( degrees of freedom=df)
df= n – 1
trong đó n là kích thước mẫu hay số quan sát
Trang 76Nếu giá trị trung bình là 8,0, thì x3 phải là 9
(x3 không phải là giá trị tự do)
Trang 77nhưng có các đuôi to hơn
so với phân phối z
PP chuẩn chuẩn tắc (z) Standard Normal (t với df = )
Ghi chú: t z khi n tăng (hay df tăng)
Trang 78Cho: n = 3
df = n - 1 = 2
=0.10 /2 =0.05
/2 = 05
Trang 79t distribution values
So sánh các giá trị t với các giá trị z
Confidence t t t z Level (df=10) (df=20) (df=30)
0.80 1.372 1.325 1.310 1.28 0.90 1.812 1.725 1.697 1.64 0.95 2.228 2.086 2.042 1.96 0.99 3.169 2.845 2.750 2.58
Ghi chú: t z khi n tăng (hay df tăng)
Trang 80Ví dụ
Một mẫu ngẫu nhiên với n = 25 có x = 50 và
s = 8 Xác định khoảng tin cậy 95% cho μ
Trang 812.1 Ước lượng trung bình tổng thể (μ)
(Confidence intervals for mean of a normal population)
Ví dụ: Một công ty điện thoại muốn ước lượng
thời gian trung bình của một cuộc gọi Một mẫu
ngẫu nhiên 20 cuộc gọi cho thấy thời gian trung
bình là 14,8 phút, độ lệch chuẩn là s = 5,6 phút
Với độ tin cậy 95%, hãy ước lượng thời gian trung bình của một cuộc gọi
Trang 822.1 Ước lượng trung bình tổng thể (μ)
(Confidence intervals for mean of a normal population)
n
s t
x n
s t
x n1,/2 n1, /2
tn-1,α/2 = t19,0.025 = 2,093
4208 ,
17 1792
,
12
20
6 ,
5 093 ,
2 8 ,
14 20
6 ,
5 093 ,
Trang 832.2 Ước lượng tỷ lệ tổng thể (p)
(Confidence intervals for the population proportion)
Khoảng tin cậy 1 cho tỉ lệ tổng thể (p)
được xác định như sau
n
p
p z
p
p n
p
p z
ˆ )
ˆ 1
zα/2 được tra từ bảng phân phối chuẩn chuẩn tắc
pˆ là tỉ lệ mẫu khảo sát được
Trang 842.2 Ước lượng tỷ lệ tổng thể (p)
(Confidence intervals for population proportion)
Ví dụ: Một nghiên cứu được thực hiện nhằm ước lượng thị phần đối với mặt hàng bánh kẹo nội địa, kết quả điều tra mẫu ngẫu nhiên 100 khách hàng cho thấy có 34 người dùng sản phẩm bánh kẹo
nội địa Với độ tin cậy 95% hãy ước lượng tỉ lệ
khách hàng sử dụng bánh kẹo nội địa
Trang 852.2 Ước lượng tỉ lệ tổng thể (p)
(Confidence intervals for population proportion)
n
p
p z
p
p n
p
p z
ˆ )
ˆ 1
100
)34,01
(34,
096
,134
,
0100
)34,01
(34,
096
,134
Nghĩa là thị phần bánh nội địa nằm trong khoảng
từ 24,72% đến 43,28% với độ tin cậy 95%
Trang 862.3 Ước lượng phương sai tổng thể
(Confidence intervals for the variance of a normal population)
Khoảng tin cậy 1 cho phương sai của tổng thể
Trang 87Ví dụ: Một công ty muốn nghiên cứu sự biến
thiên về tuổi thọ bóng đèn, chọn ngẫu nhiên 15
sản phẩm và tính được phương sai s2 = 15,27
(ngày2) Với độ tin cậy 95%, hãy ước lượng
phương sai của tuổi thọ bóng đèn của công ty
Biết tuổi thọ của bóng đèn của công ty có phân
phối chuẩn,
2.3 Ước lượng phương sai tổng thể
(Confidence intervals for the variance of a normal population)
Trang 882 / 1
, 1
2 2
2
2 / , 1
2
) 1 (
) 1 (
s n
s n
2.3 Ước lượng phương sai tổng thể
(Confidence intervals for the variance of a normal population)
Trang 89Cỡ mẫu:
/ 2 2 0
n
Trong đó:
- n là số đơn vị cần khảo sát
- zα/2 là giá trị tới hạn chuẩn chuẩn tắc
- ε0: Sai số tối đa cho phép
3 Xác định cỡ mẫu cho bài toán ước lượng
3.1 Xác định cỡ mẫu cho ước lượng trung bình
Trang 903.1 Xác định cỡ mẫu cho ước lượng trung bình
Ví dụ 1: Người ta tiến hành điều tra chọn mẫu để xác định mức thu nhập trung bình trong năm của các hộ gia đình
nông dân với yêu cầu:
Phạm vi sai số≤ 20 nghìn đồng
Độ tin cậy 95%
Độ lệch tiêu chuẩn về thu nhập ước tính là 160.000đ
Trang 913.2 Xác định cỡ mẫu cho ước lượng tỷ lệ
2 / 2
2 0
z p(1 p)
trong đó:
p : tỉ lệ mẫu
zα/2: giá trị tới hạn chuẩn chuẩn tắc
ε0: Sai số tối đa cho phép
Trang 923.2 Xác định cỡ mẫu cho ước lượng tỉ lệ
Ví dụ 2: Ở một huyện miền núi, người ta tổ chức cuộc điều tra để xác định tỉ lệ trẻ em mù chữ với yêu cầu phạm vi sai số ε≤1%, độ tin cậy 95%, trong cuộc điều tra trước đó người ta xác định được tỷ lệ mù chữ là 9% Xác định số trẻ em cần điều tra (n)
Trang 93II KIỂM ĐỊNH GIẢ THUYẾT
Hypothesis testing
Trang 941 Các khái niệm trong kiểm định giả thuyết
1.1 Giả thuyết H 0 và H 1
Giả thuyết gốc H0: (The null hypothesis)
H 0 : = 0 (kiểm định hai bên)
H 0 : 0 hay H 0 : 0 (kiểm định một bên)
Đối thuyết H1: (The alternative Hypothesis)
Kiểm định hai bên (Two-tails test)
Kiểm định một bên (One-tail test)
Trang 95Level of Significance and the Rejection Region
Trang 961 Các khái niệm trong kiểm định giả thuyết
1.2 Các loại sai lầm
Sai lầm loại 1 (Type I error) Là sai lầm của việc
bác bỏ giả thuyết H0 ở mức ý nghĩa của kiểm
định, trong khi giả thuyết này đúng
Sai lầm loại 2 (Type II error) Là sai lầm của
việc chấp nhận giả thuyết H0 ở mức ý nghĩa của
kiểm định, trong khi giả thuyết này sai
Trang 972 Kiểm định giả thuyết về
trung bình tổng thể
z
n 30
Trang 982 Kiểm định giả thuyết về
trung bình tổng thể
x
z 0
2 /
Trang 99Do not reject H0 Reject H0 Reject H0
There are two cutoff
values ( critical values ):
μ
x/2 /2
Lower Upper
xα/2
/2
Trang 1002 Kiểm định giả thuyết về
trung bình tổng thể
Ví dụ Một nhà máy sản xuất mì quy định trọng lượng trung bình 1 gói mì là μ0 = 75g, độ lệch chuẩn = 15g Sau một thời gian sản xuất kiểm tra 80 gói ta có trọng lượng trung bình mỗi gói là 72g Cho kết luận về tình hình sản xuất với mức ý nghĩa α = 5%
Trang 101- Ta đặt giả thuyết
o
o H
75 :
1 0
n=80>30; = 15; α = 5%, zα/2 = 1,96
80 15
75 72
96 , 1 79
2 Kiểm định giả thuyết về
trung bình tổng thể
Trang 1022 Kiểm định giả thuyết về
trung bình tổng thể
Trang 1032 Kiểm định giả thuyết về
trung bình tổng thể
x
2 / ,
1
tnt
Trang 1042 Kiểm định giả thuyết về
trung bình tổng thể
Ví dụ 2: Một nhà sản xuất đèn flash trong máy chụp hình cho biết tuổi thọ trung bình của sản
phẩm này là 100h, người ta chọn ngẫu nhiên 15 bóng để thử nghiệm thấy tuổi thọ trung bình là 99,7h và s2 =0,15h2
Hãy cho kết luận về tình hình sản xuất với mức ý nghĩa 5%
Trang 1052 Kiểm định giả thuyết về
trung bình tổng thể
- Ta đặt giả thuyết
o
o H
:
1 0
- Kiểm tra giả thuyết
n=15<30; s2 = 0,15; α = 5%, t14,α/2 = 2,145
15
15 , 0
100 7
, 99
n s
x
t
145 , 2
3
t nên ta bác bỏ giả thuyết H0,
tức là không công nhận tuổi thọ của đèn là 100h