Chap 7-1 Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc.Phân phối của thống kê mẫu Chương 7 Mục tiêu chương Sau khi hoàn thành chương này, bạn sẽ có thể: Mô tả
Trang 1Chap 7-1 Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc.
Phân phối của thống kê mẫu
Chương 7
Mục tiêu chương
Sau khi hoàn thành chương này, bạn sẽ có thể:
Mô tả một mẫu ngẫu nhiên đơn giản và tại sao việc lấy
mẫu lại quan trọng
Giải thích sự khác biệt giữa thống kê mô tả và suy luận
Xác định khái niệm phân phối mẫu
Xác định giá trị trung bình và độ lệch chuẩn cho phân
bố lấy mẫu của giá trị trung bình mẫu,
Mô tả Định lý giới hạn trung tâm và tầm quan trọng của
nó
Xác định giá trị trung bình và độ lệch chuẩn cho phân
bố mẫu của tỷ lệ mẫu,
Mô tả phân phối mẫu của phương sai mẫu
pˆ
X
Cốt lõi của thống kê là đưa ra những suy
luận về thống kê tổng thể từ dữ liệu mẫu
Phân tích thống kê đòi hỏi một mẫu thích hợp
từ các đối tượng của tổng thể được quan tâm
Các quan sát mẫu có thể được hiển thị là các
biến ngẫu nhiên nếu được chọn phù hợp.
Hiểu về phân phối xác suất của biến ngẫu nhiên giúp
đưa ra kết luện về xác suất và suy luận
Giới thiệu
Trang 2Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 7-4
Thống kê mô tả
Thu thập, trình bày và mô tả dữ liệu
Thống kê suy luận
Rút ra kết luận và / hoặc đưa ra quyết định liên quan
đến tổng thể chỉ dựa trên dữ liệu mẫu
Các công cụ thống kê kinh doanh
Một tổng thể là tập hợp của tất cả các đối tượng
hoặc cá thể mà ta quan tâm
Ví dụ: Tất cả các cử tri tiềm năng trong cuộc bầu cử tiếp theo
Tất cả các bộ phận sản xuất ngày hôm nay Tất cả các hóa đơn bán hàng cho tháng Mười Một
Một mẫu là một tập hợp con của tổng thể
Ví dụ: 1000 cử tri được chọn ngẫu nhiên để phỏng vấn
Một vài phần được chọn để kiểm tra phá hủy Hóa đơn ngẫu nhiên được chọn để kiểm toánTổng thể và mẫu
Trang 3Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 7-7
Tại sao dùng mẫu?
Điều hành ít tốn kém hơn so với điều tra tổng
thể
Có thể thu được kết quả thống kê với độ
Chọn mẫu từ tổng thể
Một tổng thể được tạo ra bởi một quá trình có
thể được mô hình hóa như một chuỗi các thí
nghiệm ngẫu nhiên
Một quy trình sản xuất tạo ra các piston động cơ với
sự thay đổi nhỏ của đường kính => đường kính của
piston được sản xuất được xem là biến ngẫu nhiên
Giá cổ phiếu, kết quả bán hàng của cửa hàng hàng
ngày từ quá trình phức tạp (thử nghiệm ngẫu nhiên)
=> kết quả là biến ngẫu nhiên
Các tham số tổng thể được mô hình hóa như
biến ngẫu nhiên có phân phối xác suất với trung
bình và phương sai chưa biết.
Mẫu ngẫu nhiên đơn giản
Mọi đối tượng trong tổng thể đều có cơ hội được lựa
chọn như nhau
Các đối tượng được chọn độc lập
Các mẫu có thể được lấy từ một bảng các số ngẫu
nhiên hoặc các trình tạo số ngẫu nhiên của máy tính
Một mẫu ngẫu nhiên đơn giản là lý tưởng so với các
phương pháp chọn mẫu khác
Trang 4Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 7-10
Rút ra kết luận về tổng thể từ việc nghiên
cứu kết quả của mẫu
(đã biết) Suy luận (chưa biết, nhưng có thể
được ước lượng từ dữ liệu mẫu)
Sample Population
Thống kê suy luận
Phân phối của
thống kê mẫu
cung cấp cơ sở
để suy luận
Thống kê suy luận
Phân phối mẫu
Xem xét một mẫu ngẫu nhiên được chọn từ
một tổng thể để suy luận.
Mỗi mẫu có các giá trị quan sát khác nhau, và
do đó, số liệu thống kê khác nhau.
Phân phối mẫu là phân phối của tất cả các giá
trị có thể có của một thống kê cho một mẫu có
kích thước nhất định được chọn từ tổng thể
Trang 5Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 7-13
Cấu trúc của chương
Phân phối mẫu
Phân phối mẫu của phương sai mẫu
Phân phối mẫu của trung bình mẫu
Sampling Distributions
Sampling Distribution of Sample Variance
Phát triển một phân phối mẫu
Giả sử có một tổng thể …
Quy mô tổng thể N=4
Biến ngẫu nhiên, X,
là tuổi của cá nhân
Giá trị của X:
18, 20, 22, 24 (tuổi)
Trang 6Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 7-16
0,25
0
18 20 22 24
A B C DPhân phối đồng đều
P(x)
x
(continued)
Những chỉ tiêu mô tả của phân phốiTổng thể:
Phát triển một phân phối mẫu
214
242220
μ)(Xσ
2 i
Bây giờ hãy xem xét tất cả các mẫu có thể, có
cỡ mẫu n = 2
1st 2nd Observation Obs 18 20 22 24
Trang 7Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 7-19
Những chỉ tiêu mô tả của phân phối MẪU:
Phát triển một phân phối mẫu
(continued)
μ 21 16
24 21 19 18 N
X ) X
E( i
1.58 16
21) - (24 21)
(19 21) - (18 N μ) X ( σ
-2 2
2
2 i X
So sánh phân phối của tổng thể
với mẫu của nó
18 19 20 21 22 23 24
0 1 2 3 P(X)
1.58 σ 21
2.236 σ
Giá trị kỳ vọng của trung bình mẫu
Giả sử chúng ta có một mẫu ngẫu nhiên n quan sát từ
một tổng thể lớn với trung bìnhvà phương sai2
Cho X1, X2, Xnbiểu diễn các mẫu ngẫu nhiên từ một
X n 1 X
Trang 8Giá trị kỳ vọng của trung bình mẫu
Kỳ vọng của trung bình mẫu cũng chính là
trung bình tổng thể.
Chứng mình:
Khi số lượng mẫu lặp lại và độc lập trở nên rất
lớn, giá trị trung bình của trung bình mẫu tiến
Phương sai của trung bình mẫu
Nếu tổng thể rất lớn so với cỡ mẫu, thì sự phân
phối của các quan sát trong mẫu ngẫu nhiên
độc lập riêng lẻ là như nhau:
Phương sai củaX giảm khi cỡ mẫu tăng.
Sai số chuẩn của trung bình
Các mẫu khác nhau có cùng cỡ mẫu từ cùng một tổng
thể sẽ tạo ra các trung bình mẫu khác nhau
Một thước đo về độ sự biến động của giá trị trung bình
giữa các mẫu khác nhau được cho bởi Sai số chuẩn
của trung bình:
Lưu ý rằng sai số chuẩn của giá trị trung bình giảm khi
kích thước mẫu tăng
n σ
σX
Trang 9Phương sai của trung bình mẫu
Nếu cỡ mẫu, n, không nhỏ so với quy mô tổng
thể, các quan sát trong các mẫu riêng lẻ sẽ
không phân phối độc lập.
Phương sai của trung bình mẫu sẽ được điều
Nếu tổng thể là chuẩn với trung bình μ và độ
lệch chuẩn σ, phân phối mẫu của cũng theo
phân phối chuẩn với
Chuyển đổi sang phân phối chuẩn tắc
Giá trị Z cho phân phối mẫu của :
Trong đó: = trung bình mẫu
Trang 10Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 7-28
Điều chỉnh tổng thể hữu hạn
Áp dụng Điều chỉnh tổng thể hữu hạn nếu:
một thành viên tổng thể không thể được bao gồm
nhiều lần trong một mẫu (lấy mẫu không thay thế) và
mẫu lớn so với tổng thể (n lớn hơn khoảng 5% N)
Thế thì
hay
1NnNn
σ)XVar(
Phân phối mẫu chuẩn (có cùng trung bình)
Các thuộc tính của phân phối mẫu
Trang 11Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 7-31
Các thuộc tính của phân phối mẫu
Đối với chọn mẫu có thay thế :
khi n tăng, giảm
Cỡ mẫu lớn hơn
Cỡ mẫu nhỏ hơn
Phân phối mẫu: Ví dụ
Ví dụ: Phân phối lương của các nhà điều hành
Giả sử, dựa trên dữ liệu lịch sử, chúng ta tin rằng mức
tăng % lương hàng năm cho các giám đốc điều hành
theo phân phối chuẩn với mức trung bình là 12,2% và độ
lệch chuẩn là 3,6% Một mẫu ngẫu nhiên gồm 9 quan sát
được lấy từ tổng thể này và tính giá trị trung bình Xác
suất trung bình mẫu sẽ lớn hơn 14,4% là bao nhiêu?
Giải: ta có: = 12,2; = 3,6; n = 9
Gọi là giá trị trung bình của mẫu và tính sai số chuẩn
của giá trị trung bình của mẫu:
Xác suất cần tìm:
X
3,61,29
Trang 12Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 7-34
Nếu tổng thể không chuẩn
Chúng ta có thể áp dụng Định lý giới hạn trung
tâm (CLT) :
Thậm chí nếu tổng thểkhông chuẩn,
…các trung bình mẫu từ tổng thểsẽ xấp xỉ chuẩn
x
Định lý giới hạn trung tâm
Gọi X1, X2, …, Xnlà tập hợp n biến ngẫu nhiên
độc lập có cùng phân phối với trung bình và
phương sai 2, và là trung bình mẫu của biến
ngẫu nhiên này.
Khi n càng lớn, phân phối của Z với:
CLT có thể được áp dụng cho cả biến rời rạc
Trang 13Quy luật số lớn
Cho trước một mẫu ngẫu nhiên có kích
thước n từ tổng thể,
Giá trị trung bình mẫu sẽ tiến về trung bình
tổng thể khi n lớn, bất kể phân phối xác suất của biến.
Khi n lớn, phương sai của trung bình mẫu sẽ
càng nhỏ, cuối cùng, bằng 0 => trung bình sẽ trở thành hằng số.
Cỡ mẫu nhỏ hơn
Nếu tổng thể không chuẩn
Cỡ mẫu lớn bao nhiêu thì đủ?
Quy ước
Đối với hầu hết các phân phối, n > 25 sẽ cho
phân phối mẫu gần như chuẩn.
Đối với phân phối tổng thể chuẩn, phân phối
mẫu của giá trị trung bình luôn theo phân phối chuẩn
Trang 14Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 7-40
Ví dụ
Giả sử một tổng thể có trung bình μ = 8 và độ
lệch chuẩn σ = 3 Giả sử một mẫu ngẫu nhiên
có kích thước n = 36 được chọn
Xác suất mà giá trị trung bình của mẫu nằm
trong khoảng từ 7,8 đến 8.2 là bao nhiêu?
Ví dụ
Giải:
Ngay cả khi tổng thể không theo phân phối
chuẩn, định lý giới hạn trung tâm có thể được
μ
0.536
3n
3638-8.2nσμ-μ
3638-7.8P8.2)μ
Sampling Distribution
Standard Normal Distribution .1915
Trang 15Ví dụ
Nghiên cứu tiếp thị cho cà phê Antelope
Antelope Coffee đang xem xét khả năng mở một quán cà
phê cho người sành ăn ở Big Rock, Montana Nghiên
cứu trước đây đã chỉ ra rằng các cửa hàng của nó sẽ
thành công ở các thành phố nếu thu nhập trung bình
hàng năm của các hộ trên 70.000 đô la Độ lệch chuẩn
của thu nhập được ước tính là 5.000 đô la ở Big Rock,
Montana
Một mẫu ngẫu nhiên gồm 36 người, và thu nhập trung
bình là $ 72.300 Mẫu này có cung cấp bằng chứng để
kết luận rằng một cửa hàng nên được mở không?
Ví dụ
Giải: Phân phối thu nhập được biết là lệch, nhưng CLT
cho phép chúng ta kết luận rằng giá trị trung bình mẫu
được phân phối chuẩn Để trả lời câu hỏi, chúng ta cần
xác định xác suất thu được một trung bình mẫu củax =
72.300 hay lớn hơn nếu trung bình tổng thể là 70.000
Đầu tiên, tính giá trị cho thống kê Z chuẩn hóa:
Từ bảng phân phối chuẩn tắc, ta thấy rằng xác suất để có
được giá trị Z là 2,76 hoặc lớn hơn là 0,0029 Bởi vì xác
suất này rất nhỏ, ta có thể kết luận rằng thu nhập trung
bình tổng thể có thể lớn hơn 70.000 => mở quán
73.200 70.000
2,765.000/ 36
Z
Khoảng chấp nhận (Acceptance interval)
Mục tiêu: xác định một khoảng giá trị trong đó
trung bình mẫu có khả năng xảy ra, cho trước
trung bình và phương sai tổng thể
Nếu giá trị trung bình của mẫu nằm trong khoảng
đó, chúng ta có thể chấp nhận kết luận rằng biến
ngẫu nhiên đến từ tổng thể với trung bình và
phương sai đã biết
Chúng ta có thể tính xác suất trung bình mẫu nằm
trong khoảng đó nếu giá trị trung bình có phân phối
gần chuẩn
Trang 16Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 7-46
Khoảng chấp nhận
Theo CLT, chúng ta biết rằng phân phối của X
xấp xỉ chuẩn nếu n đủ lớn, với trung bình và độ
lệch chuẩn
Gọi zα/2là giá trị z mà chừa ra diện tích α/2 ở
đuôi phải của phân phối chuẩn (tức là, khoảng
μ
Pz X z
Khoảng chấp nhận: Ví dụ
Một người quản lý của một công ty bảo hiểm y
tế muốn theo dõi các khoản thanh toán yêu cầu
bảo hiểm hàng ngày để xác định xem yêu cầu
trung bình có ổn định hay không.
Dựa trên kinh nghiệm trong quá khứ, giá trị trung
bình của yêu cầu bồi thường là, = $6.000, và=
$2.000
Ông đã thu thập một mẫu ngẫu nhiên n = 100 yêu
cầu để tính giá trị trung bình của mẫu
Công ty thiết lập một khoảng tin cậy 95% để giám sát
các yêu cầu
Khoảng chấp nhận: Ví dụ
Theo đó, khoảng thời gian chấp nhận sẽ là :
Nếu giá trị trung bình của mẫu nằm trong phạm
vi (5.608-6.392), các khiếu nại không đi lệch
khỏi tiêu chuẩn lịch sử với xác suất 95%.
Kết luận này có thể sai với xác suất 0,05
2000
6000 1,96 6000 392
100
Trang 17Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 7-49
Phân phối mẫu của tỷ lệ mẫu
Sampling Distributions
Sampling Distribution of Sample Variance
Phân phối mẫu của tỷ lệ mẫu
Trong phân phối nhị thức, E(X) = nP biểu diễn
số lần thành công trong số n lần thử khi n đủ
lớn.
Thế thì, P biểu diễn tỷ lệ của số lần thành công
Để mô tả phân phối này, chúng ta cần giá trị
có phân phối nhị thức, nhưng theo CLT, có thể được
xem xấp xỉ với phân phối chuẩn, nếu
nP(1 – P) > 5
size sample
interest of stic characteri the having sample the in items of number n
X
P ˆ
Pˆ
PˆPˆ
Trang 18Tỷ lệ tổng thể
Giá trị trung bình và phương sai của phân phối
mẫu của tỷ lệ mẫu, có thể thu được bằng:
ˆvar p p var X var X P P
Phân phối mẫu của P
0 0,2 0,4 0,6 0,8 1
p ) P E( ˆ
n P) P(1 n
X Var
σ2 P
Pˆ
Giá trị Z cho các tỷ lệ
n P) P(1 P P σ
P P Z
Trang 19Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 7-55
Ví dụ
Nếu tỷ lệ thực của cử tri ủng hộ Dự luật A
là P = 0,4 thì xác suất mẫu cỡ 200 mang
lại tỷ lệ mẫu trong khoảng từ 0,40 đến
.4).4(1n
P)P(1
1.44)ZP(0
.03464.40.45Z.03464.40.40P.45)PP(.40
Trang 20Ví dụ
Đánh giá hệ thống dây điện tại nhà:
Một mẫu ngẫu nhiên gồm 270 ngôi nhà từ một số lượng lớn các ngôi
nhà cũ để ước tính tỷ lệ các ngôi nhà có hệ thống dây điện không an
toàn Nếu trên thực tế, 20% nhà có hệ thống dây điện không an toàn,
xác suất tỷ lệ mẫu sẽ nằm trong khoảng từ 16% đến 24% là bao
Sampling Distributions
Phân phối mẫu của phương sai mẫu
Phương sai mẫu
Gọi x1, x2, , xnlà một mẫu ngẫu nhiên từ
một tổng thể Phương sai mẫu là
căn bậc hai của phương sai mẫu được gọi là
độ lệch chuẩn mẫu
phương sai mẫu là khác nhau đối với các mẫu
ngẫu nhiên khác nhau từ cùng một tổng thể
2 i
1 n 1 s
Trang 21Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 7-61
Phân phối mẫu của phương sai
mẫu
Phân phối mẫu của s2có trung bình là σ2
Nếu phân phối của tổng thể là chuẩn, thì
Nếu phân phối của tổng thể là chuẩn, thì
có phân phối2 (chi bình phương) với bậc tự do n – 1
2
2) σE(s
1n
2σ)Var(s
4 2
Phân phối chi bình phương
Phân phối chi bình phương với (n - 1) bậc tự do
(degree of freedom – d.f.) là phân phối của tổng
bình phương của (n - 1) biến ngẫu nhiên chuẩn
tắc độc lập.
Phân phối tổng thể của biến ngẫu nhiên X sẽ theo
phân phối chuẩn
Phân phối chi bình phương được xác định chỉ đối với
các giá trị dương, vì các phương sai đều dương
Phân phối chi bình phương
Phân phối chi bình phương là một họ phân phối, tùy
Trang 22Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 7-64
Nếu giá trị trung bình của ba giá trị này là 8,0,
(2 giá trị có thể là bất kỳ số nào, nhưng số thứ ba phải xác định
đối với một giá trị trung bình cho trước)
Ý tưởng:Số lượng quan sát tự do thay đổi sau khi tính
trung bình mẫu
Ví dụ:Giả sử trung bình của 3 số là 8,0
Cho X1= 7 Cho X 2 = 8
X3là bao nhiêu?
Phân phối Chi bình phương: Tính chất
Cho một biến ngẫu nhiên, 2
v, theo phân phối chi bình phương với v bậc tự do:
E v
2
var v 2 v
Xem chứngminh trong sáchgiáo trình
Một tủ đông thương mại phải giữ nhiệt độ đã chọn
với ít biến động Thông số kỹ thuật yêu cầu độ
lệch chuẩn không quá 4 độ (phương sai 16 độ
bình phương)
Một mẫu gồm 14 tủ đông được kiểm
tra
Giới hạn trên (K) của phương sai
mẫu là bao nhiêu để xác suất vượt
quá giới hạn này, biết rằng độ lệch
chuẩn của tổng thể là 4, nhỏ hơn
0,05?
Trang 23Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc Chap 7-67
Tìm giá trị chi bình phương
Sử dụng phân phối chi bình phương với diện tích
0,05 ở đuôi phải:
probability
α = 0,05
2 13
σ1)s(n
χ Theo phân phối chi bình phương với df(n – 1) = 13
0.0516
1)s(nPK)
13 2
n = 14)
1)(14)(22.36)(16
Nếu s 2 từ mẫu có cỡ mẫu n = 14 có phương sai lớn hơn 27,52,
có bằng chứng mạnh mẽ cho thấy phương sai tổng thể vượt quá
16.
or
Tiêu chuẩn sản xuất của một thiết bị điện xác
định độ lệch chuẩn là 3,6 ohms Khu vực của
bạn được yêu cầu thiết lập một quy trình giám
sát chất lượng để kiểm tra sự biến đổi của điện
trở.
Một mẫu ngẫu nhiên gồm 6 quan sát được thu
thập để tính toán phương sai mẫu Xác định
giới hạn trên cho s2sao cho xác suất vượt quá
giới hạn này (3,6) nhỏ hơn 0,05.