1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Giáo trình kinh tế chất lượng - ôn lại thống kê - 2 potx

12 211 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 12
Dung lượng 151,53 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Xác Suất Có Điều Kiện Để biết thêm về xác suất của những biến cố xảy ra kết hợp của hai biến ngẫu nhiên X và Y, chúng ta cũng cần nên biết về xác suất xảy ra của biến ngẫu nhiên cụ thể

Trang 1

Sự Độc Lập Thống Kê

Các biến ngẫu nhiên rời rạc được gọi là sự độc lập thống kê nếu P(X = x và Y = y) =

P(X = x) P(Y = y) Vì vậy trong trường hợp này, xác suất kết hợp là tích của các xác suất riêng lẻ Đối với trường hợp biến có dạng liên tục, chúng ta sẽ có fXY(x, y) = fX(x) fY(y)

Xác Suất Có Điều Kiện

Để biết thêm về xác suất của những biến cố xảy ra kết hợp của hai biến ngẫu nhiên X và

Y, chúng ta cũng cần nên biết về xác suất xảy ra của biến ngẫu nhiên cụ thể (Y) nào đó

cho trước sự kiện đã xảy ra của một biến (X) ngẫu nhiên khác Ví dụ, chúng ta có thể

muốn biết xác suất để giá mua một căn nhà là 200.000 đô la, nếu cho trước diện tích sinh

hoạt phải là 1.500 thước vuông Anh Yêu cầu này sẽ dẫn chúng ta đến khái niệm xác

suất có điều kiện, được định nghĩa trong trường hợp biến ngẫu nhiên dạng rời rạc như sau:

P(Y = y  X = x) =

) x X ( P

) y Y , x X ( P

=

=

= với P(X = x) ≠ 0

Ký hiệu “” có nghĩa là cho trước Hàm mật độ xác suất có điều kiện (cho cả khi biến ngẫu nhiên là rời rạc và liên tục) được định nghĩa như sau:

fYX(x, y) =

) x ( f

) y , x ( f

X

XY với mọi giá trị của x sao cho fX(x) > 0

Trong đó fXY(x, y) là hàm mật độ xác suất kết hợp của X và Y và fX(x) là hàm mật độ

xác suất của riêng biến X, thường được đề cập đến như là hàm mật độ cận biên của

biến X Lưu ý rằng xác suất có điều kiện phụ thuộc vào cả giá trị x và y Khi cả hai biến ngẫu nhiên này phụ thuộc thống kê lẫn nhau thì phân phối xác suất có điều kiện trở thành các phân phối cận biên tương ứng Để hiểu được điều này, hãy lưu ý rằng sự độc lập thống kê ngầm định fXY(x, y) = fX(x) fY(y) Rút ra từ kết luận này, chúng ta có:

fYX (yx) = fXY(x, y)/fX(x) = fY(y) và fXY (xy) = fXY(x, y)/fY(y) = fX(x) } Bảng 2.4 Phân phối xác suất kết hợp đối với số lần xuất hiện các con số 3 (X) và

số 5 (Y) khi một cặp súc sắc được thảy

Trang 2

Y

0 1 2

} V Í D Ụ 2.9

Bảng 2.4 trình bày các giá trị xác suất kết hợp của số lần xuất hiện của số 3 (X) và số 5 (Y) khi một cặp súc sắc được thảy Chúng ta hãy tính kết quả thứ nhất của mật độ cận biên của biến X và Y Vì X = 0 có thể xảy ra khi Y = 0 hoặc 1 hoặc 2, P(X = 0) có thể tính toán được bằng P(X = 0, Y = 0) + P(X = 0, Y = 1) + P(X = 0, Y = 2) = 16/36 + 8/36 + 1/36 = 25/36 Tính toán tương tự, chúng ta có P(X = 1) = 10/36 và P(X = 2) = 1/36 Lưu ý rằng tổng của ba giá trị xác suất trên là bằng 1, vì điều này là hiển nhiên Phân phối cận biên của Y cũng được xác định theo trình tự tính toán tương tự Bảng 2.5 trình bày các giá trị cận biên của X và Y ở các hàng và cột ngoài cùng tương ứng Lưu ý rằng các giá trị này xuất hiện với các quy luật giống nhau

} Bảng 2.5 Phân Phối Cận Biên Đối Với Số Lần Xuất Hiện Các Con Số 3 (X) Và Số

5 (Y) Khi Một Cặp Súc Sắc Được Thảy

X

fX(x) 25/36 10/36 1/36 1

} Bảng 2.6 Phân Phối Có Điều Kiện Đối Với Số Lần Xuất Hiện Các Con Số 5 (Y)

Cho Trước Số Lần Xuất Hiện Của Các Số 3 (X) Khi Một Cặp Súc Sắc Được Thảy

X

0 0,64 0,32 0,04

1 0,80 0,20 0,00

2 1,00 0,00 0,00 Xác suất có điều kiện để Y = 0 với X = 0 cho trước được tính toán như sau:

P(Y = 0X = 0) = P(X = 0, Y = 0)/ P(X = 0) = 16/36 ÷ 25/36 = 0,64

Trang 3

Tiến hành tương tự, chúng ta sẽ có được các giá trị phân phối có điều kiện của biến Y với X cho trước trình bày trong bảng 2.6

Giá Trị Kỳ Vọng Toán Học Trong Trường Hợp Hai Biến

Khái niệm kỳ vọng toán học có thể mở rộng dễ dàng sang trường hợp các biến ngẫu nhiên gồm hai biến Cho trước hàm g(X, Y) và hàm xác suất kết hợp f(x, y), giá trị kỳ vọng của g(X, Y) được xác định bằng cách nhân g(x, y) với f(x, y) và cộng tổng các giá trị có thể có của x và y Chúng ta có các định nghĩa sau đây

ĐỊNH NGHĨA 2.3 ( GIÁ TRỊ KỲ VỌNG )

Giá trị kỳ vọng của g(X, Y) được xác định như sau:

E[g(X, Y)] = ∑∑

) y , x ( ) y , x ( g

Trong đó phép tính tổng hai lần biểu diễn phép tính tổng trên tất cả các giá trị có thể có của x và y (Vì vậy giá trị kỳ vọng sẽ bằng tổng có trọng số với giá trị xác suất kết hợp được dùng làm trọng số)

Gọi µx là giá trị kỳ vọng của biến ngẫu nhiên X, và µy là giá trị kỳ vọng của biến ngẫu nhiên Y Phương sai của chúng được xác định tương tự như trường hợp đơn biến:

] ) X [(

x

2

y

2

}BÀI TẬP THỰC HÀNH 2.5

Từ các giá trị xác suất kết hợp cho trong bảng 2.4, hãy tính trị trung bình µx = E(X), µy = E(Y), và phương sai 2

x

σ , 2 y

σ Hãy kiểm chứng rằng biến X và Y là không độc lập thống kê với nhau

Giá Trị Kỳ Vọng Có Điều Kiện và Phương Sai Có Điều Kiện

Giá trị kỳ vọng của Y với X cho trước được gọi là giá trị kỳ vọng của Y với X cho

trước Một cách cụ thể hơn, đối với một cặp biến ngẫu nhiên rời rạc, thì E(YX =x) =

=y

Y

yfYX(x,y) Hay nói cách khác, đó là giá trị trung bình của Y sử dụng giá trị mật độ có điều kiện của ∑

=y Y

yfYX(x,y) như một trọng số Giá trị kỳ vọng của Y với X cho trước

Trang 4

còn được gọi là giá trị hồi quy của Y theo X Từ bảng 2.6, chúng ta có thể thấy rằng

E(YX = 0) = (0,64 × 0) + (0,32 × 1) + (0,04 × 2) = 0,32 + 0,08 = 0,4; E(YX = 1) = 0,2; và E(YX = 2) = 0 Trong mô hình hồi quy đơn giản được trình bày trong ví dụ 1.1, chúng ta có PRICE = α + β SQFT + u Nếu E(uSQFT) = 0 thì E(PRICESQFT) = α + β SQFT Vì vậy, phần xác định của mô hình là giá trị kỳ vọng có điều kiện của biến PRICE với SQFT cho trước, khi E(uSQFT) = 0

Khái niệm giá trị kỳ vọng có điều kiện đã trình ở trên có thể mở rộng dễ dàng để

tính toán phương sai có điều kiện, được xác định như sau Gọi µ*(X) là giá trị kỳ vọng

có điều kiện của Y cho trước X, được ký hiệu là E(YX) Phương sai có điều kiện của Y với X cho trước được định nghĩa như sau Var(YX) = EYX [(Y – µ* )2 | X ] Nói cách khác, cố định giá trị của biến X và tính toán giá trị trung bình có điều kiện của Y với X cho trước, và sau đó tính toán phương sai xung quanh giá trị trung bình này với trọng số là mật độ có điều kiện fYX(x,y)

Một số tính chất của giá trị kỳ vọng có điều kiện sử dụng trong môn học kinh tế lượng được tóm tắt sau đây Để hiểu rõ thêm về phần chứng minh, xin tham khảo tác giả Ramanathan (1993, phần 5.2)

Tính chất 2.4 Đối với mọi hàm u(x) thì ta luôn có E[u(x)X] = u(x) Tính chất này ngầm định

rằng khi tiến đến giá trị kỳ vọng có điều kiện cho trước X thì hàm u(X) tiến đến

giá trị hằng số Do đó, một trường hợp đặc biệt được suy ra là nếu c là hằng số thì

E(cX) = c

Tính chất 2.5 E([a(x) + b(X)Y]X) = a(X) + b(X) E(YX)

Tính chất 2.6 EXY(Y) = EX [EYX (YX)] Tính chất này có nghĩa là giá trị kỳ vọng không điều

kiện của Y, sử dụng mật độ chung giữa X và Y, có thể tính toán được bằng cách tính trước tiên giá trị kỳ vọng có điều kiện của Y với X cho trước (là biểu thức trong dấu ngoặc vuông), sau đó tính giá trị kỳ vọng của chúng theo X Tính chất

này được gọi là luật của các giá trị kỳ vọng lặp (law of iterated expectations)

Tính chất 2.7 Var(Y) = EX[Var(YX)] + VarX[E(YX)] Nói cách khác, giá trị phương sai của

Y sử dụng hàm mật độ kết hợp fXY(x, y) tính toán được sẽ tương đương với giá trị kỳ vọng của phương sai có điều kiện của biến Y cộng với phương sai của giá trị kỳ vọng có điều kiện của biến Y với X cho trước

Đồng phương sai và tương quan

Khi gặp phải hai biến ngẫu nhiên, một trong những vấn đề thường thu hút sự quan tâm là

mối quan hệ giữa hai biến này như thế nào? Khái niệm đồng phương sai và tương quan

là hai cách để đo lường mức độ quan hệ “chặt” giữa hai biến ngẫu nhiên đó

Trang 5

Hãy xem xét hàm g(X, Y) = (X – µX)(Y – µY) Giá trị kỳ vọng của hàm số này được

gọi là đồng phương sai giữa X và Y và được ký hiệu là σXY hay Cov(X, Y)

ĐỊNH NGHĨA 2.4 ( ĐỒNG PHƯƠNG SAI )

Giá trị đồng phương sai giữa X và Y được xác định như sau

σxy = Cov(X, Y) = E[(X – µx)(Y – µy)] = E[XY – Xµy – µxY + µxµy] (2.6) = E(XY) – µyE(X) – µxE(Y) + µxµy = E(XY) – µxµy

Dễ dàng suy ra từ kết luận trên rằng Cov(X,X) = Var(X)

Các định nghĩa về phương sai và đồng phương sai đều đúng trong cả hai trường hợp phân phối có dạng rời rạc và liên tục Vì phương sai chỉ là một đại lượng đo lường mức độ phân tán của biến ngẫu nhiên xung quanh giá trị trung bình, nên đồng phương sai giữa hai biến ngẫu nhiên sẽ là đại lượng đo lường mức độ liên kết chung giữa chúng Giả sử rằng hai biến ngẫu nhiên rời rạc X và Y quan hệ đồng hướng với nhau, và do đó khi giá trị Y tăng thì giá trị X cũng tăng theo như biểu diễn trên hình 2.6 Các vòng tròn nhỏ biểu thị các cặp giá trị của X và Y tương ứng với các kết quả khả dĩ giới hạn Đường gạch chấm biểu diễn giá trị trung bình µx và µy Bằng cách chuyển trục toạ độ đến đường gạch chấm này với gốc toạ độ là (µx, µy), chúng ta có thể thấy rằng Xi – µx và Yi – µy là độ dài tính từ gốc toạ độ mới, đối với một kết quả nào đó được ký hiệu bằng hậu tố i Từ hình vẽ, có thể chứng minh rằng các điểm nằm trong phần tư thứ nhất và thứ ba sẽ làm cho tích (Xi – µx)(Yi – µy) luôn có giá trị dương, vì từng số hạng trong biểu thức sẽ cùng dương hoặc cùng âm Khi chúng ta tính toán đại lượng đồng phương sai là tổng có trọng số các tích biểu thức trên, kết quả cuối cùng có khuynh hướng nhận giá trị dương vì có nhiều số hạng dương hơn các số hạng âm Vì vậy, giá trị đồng phương sai có khuynh hướng dấu dương Trong trường hợp cả hai biến X và Y di chuyển theo hướng ngược lại, giá trị Cov(X, Y) sẽ có dấu âm

Mặc dù đại lượng đồng phương sai rất có ích trong việc xác định tính chất của mối liên kết giữa X và Y nhưng nó tồn tại một vấn đề khá nghiêm trọng là các giá trị tính bằng số rất nhạy đối với giá trị đơn vị dùng để đo biến X và Y Nếu X là một loại biến tài chính tính bằng đô-la hơn là tính bằng đơn vị ngàn đô-la, đại lượng đồng phương sai sẽ dốc đứng do ảnh hưởng của hệ số 1.000 Để tránh vấn đề này, người ta sẽ sử dụng đại

lượng đồng phương sai “được chuẩn hóa” Đại lượng này còn được gọi là hệ số tương

quan giữa biến X và Y và được ký hiệu là ρxy

ĐỊNH NGHĨA 2.5 ( HỆ SỐ TƯƠNG QUAN )

Trang 6

Hệ số tương quan giữa biến X và Y được định nghĩa như sau:

2 / 1 y

x

xy xy

)]

Y ( Var ) X ( Var [

) Y , X ( Cov

= σ σ

σ

=

Nếu biến X và Y có quan hệ dương thì hệ số tương quan sẽ có dấu dương Nếu biến

X và y có quan hệ âm thì chúng sẽ di chuyển theo hướng ngược lại Trong trường hợp này, giá trị đồng phương sai và hệ số tương quan đều có dấu âm Hệ số tương quan hoàn toàn có thể bằng zero Trong trường hợp này, chúng ta có thể kết luận rằng biến x và y

không có tương quan Người ta có thể viết rằng 2 1

xy ≤

ρ hay tương đương với ρxy ≤ 1 Giá trị ρxysẽ bằng 1 khi và chỉ khi có một mối quan hệ tuyến tính chính xác giữa X và

Y theo biểu thức Y – µy = β( X – µx) Nếu ρxy = 1 thì quan hệ giữa X và Y được gọi

là tương quan hoàn hảo Nêu lưu ý rằng mối tương quan hoàn hảo chỉ xảy ra khi giữa X

và Y có mối quan hệ tuyến tính một cách chính xác Ví dụ, Y có thể xuất hiện trong biểu

thức dạng Y = X2, rõ ràng là có biểu hiện mối quan hệ nhưng hệ số tương quan giữa X và

Y sẽ không thể bằng 1 Vì vậy, hệ số tương quan sẽ đo lường phạm vi của mối liên kết tuyến tính giữa hai biến

Nếu biến X và Y là hai biến độc lập thì fXY(x, y) = fX(x) fY(y), có nghĩa là xác suất kết hợp chính là tích của các xác suất riêng lẻ Trong trường hợp này, nên lưu ý từ định nghĩa của σxy, chúng ta có

) y ( f x ( f y )(

x

x

Vì biến x và y bây giờ có thể tách rời nhau nên chúng ta có

µ

=

y

y y x

x x

=E(X −µx)E(Y −µy)

Nhưng do E(X – µx) = E(X) – µx = 0 (xin xem tính chất 2.1a), nên σxy = 0 và ρxy = 0 nếu

hai biến ngẫu nhiên này là độc lập Hay nói cách khác, nếu biến X và Y là hai biến độc lập thì chúng sẽ không tương quan nhau

Kết luận ngược lại có thể không còn chính xác (nghĩa là mối tương quan zero sẽ không ngầm định tính chất độc lập), và có thể kiểm chứng thông qua các ví dụ sau Đặt fXY(x, y) tương tự như trong bảng 2.7

Trang 7

Cov(X, Y) = E(XY) – E(X) E(Y) E(X) = (1 × 0,4) + (2 × 0,2) + (3 × 0,4) = 2 E(Y) = (6 × 0,4) + (8 × 0,2) + (10 × 0,4) = 8 E(XY) = (6 × 1 × 0,2) + (6 × 3 × 0,2) + (8 × 2 × 0,2) + (10 × 1 × 0,2)

+ (10 × 3 × 0,2) = 16

Vì vậy, Cov(X, Y) = 0 Nhưng biến X và Y là không độc lập vì P(X = 2, Y = 6) = 0, P(X

= 2) = 0,2, và P(Y = 6) = 0,4 Do đó, xác suất kết hợp sẽ không thể bằng tích của các xác suất riêng lẻ

}BÀI TẬP THỰC HÀNH 2.6

Sử dụng các biến X và Y với xác suất kết hợp cho trong bảng 2.4, hãy tính giá trị Cov(X, Y) và ρxy (lưu ý rằng bạn đã tính giá trị trung bình và phương sai trong bài tập 2.5)

}BÀI TẬP THỰC HÀNH 2.7 +

Giả sử biến ngẫu nhiên X chỉ có thể nhận các giá trị 1, 2, 3, 4, và 5, mỗi giá trị ứng với xác suất bằng nhau và bằng 0,2 Cho Y = X2 Hãy tính hệ số tương quan giữa X và Y và chứng minh rằng hệ số này không bằng 1, cho dù giữa biến X và Y có mối quan hệ chính xác

} Bảng 2.7 Ví Dụ Cho Thấy Đồng Phương Sai Bằng Không Không Nhất Thiết Phải Là Độc Lập

X

Y 6 8 10 FX(x)

1 0,2 0 0,2 0,4

2 0 0,2 0 0,2

3 0,2 0 0,2 0,4

Tính chất 2.8 liệt kê một số tính chất liên quan đến hai biến ngẫu nhiên

Tính chất 2.8

a Nếu a và b là hằng số thì Var(aX + bY) = a2Var(X) + b2Var(Y) + 2abCov(X,Y) Một trường hợp đặc biệt của tính chất này là Var(X + Y) = Var(X) + Var(Y) + 2Cov(X, Y) Tương tự, Var(X – Y) = Var(X) + Var(Y) – 2Cov(X, Y)

b Hệ số tương quan ρxy nằm trong khoảng – 1 đến + 1

Trang 8

c Nếu X và Y là hai biến độc lập thì σxy = Cov(X, Y) = 0; có nghĩa là, X và Y không tương quan nhau Trong trường hợp này, kết hợp (a) và hệ quả rút ra từ tính chất này,

ta có Var(X + Y) = Var(X) + Var(Y) và Var(X – Y) = Var(X) + Var(Y)

d Giá trị ρxy sẽ bằng 1 khi và chỉ khi tồn tại mối quan hệ tuyến tính chính xác giữa X và Y theo biểu thức Y – µy = β( X – µx)

e Giá trị tương quan giữa biến X và chính nó bằng 1

f Nếu U = a0 + a1X, V = b0 + b1Y, và a1b1 > 0 thì ρuv = ρxy; nghĩa là hệ số tương quan sẽ thay đổi trong trường hợp đơn vị đo được điều chỉnh theo tỷ lệ Nếu a1b1 < 0 thì ρuv = – ρxy Tuy nhiên, nếu U = a0 + a1X + a2Y, V = b0 + b1X + b2Y thì ρuv ≠ ρxy Điều này có nghĩa là giá trị tương quan không thay đổi trong trường hợp có sự biến đổi tuyến tính tổng quát (ai và bi được giả thiết có giá trị khác zero)

g Nếu giá trị a1, a2, b1 và b2 là cố định thì Cov(a1X + a2Y, b1X + b2Y) = a1b1Var(X) + (a1b2 + a2b1)Cov(X, Y) + a2b2Var(Y)

Phân Phối Nhiều Biến *

Trong phần này, các khái niệm vừa trình bày ở trên sẽ được mở rộng cho trường hợp có nhiều hơn hai biến ngẫu nhiên Gọi x1, x2, …, xn tương ứng với n số biến ngẫu nhiên Và hàm mật độ xác suất kết hợp của chúng là fX(x1, x2, …, xn) Tương tự như trước đây, chúng là độc lập nếu hàm mật độ xác suất PDF chung là tích của mỗi PDF riêng lẻ Vì vậy, chúng ta có

fX(x1, x2, …, xn) = fX1(x1) fX2(x2) fXn(xn)

Trong trường hợp đặc biệt khi mỗi giá trị x được phân phối giống nhau và độc lập lẫn

nhau (được ký hiệu là iid – independently and idetically distributed), chúng ta có

fX(x1, x2, …, xn) = fX (x1) fX (x2) fX (xn)

Trong đó fX(x) là hàm phân phối chung của mỗi giá trị x Một số kết quả đáng quan tâm

về phân phối đa biến được trình bày trong tính chất 2.9

Tính chất 2.9

a Nếu a1, a2, …, an là hằng số hoặc không ngẫu nhiên thì E[a1x1 + a2x2 + + anxn] = a1E(x1) + a2E(x2) + + anE(xn) Vì vậy, giá trị kỳ vọng của một tổ hợp tuyến tính các số hạng bằng tổ hợp tuyến tính của mỗi giá trị kỳ vọng riêng lẻ Trong ký hiệu phép lấy tổng, ta có E[Σ(aixi)] = ΣE(aixi) = ΣaiE(xi)

b Nếu mỗi xi đều có giá trị trung bình bằng nhau thì E(xi) = µ, chúng ta có E(Σai xi) = µΣai Đặc biệt, nếu tất cả hệ số ai đều bằng nhau và bằng 1/n thì chúng ta sẽ có

Trang 9

E(Σxi/n) = E( x ) = µ Vì vậy, giá trị kỳ vọng của giá trị trung bình của các biến ngẫu nhiên có phân phối giống nhau sẽ bằng giá trị trung bình chung của chúng

c Var[Σ(aixi)] = Σi 2

i

a Var(xi) + ∑∑

≠ j i

j

ia

a Cov(xi, xj), trong đó các hệ số ai được giả thiết là hằng số hoặc không ngẫu nhiên

d Nếu tất cả các biến x1, x2, , xn đều độc lập thì mỗi cặp tương quan (ρij) và đồng phương sai sẽ bằng zero hay Cov(xi, xj) = 0 = ρij với mọi i ≠ j

e Từ (c) và (d) ta có thể rút ra kết luận rằng khi biến x độc lập thì Var[Σ(aixi)] =

Σ 2 i

a Var(xi), vì số hạng đồng phương sai sẽ không tồn tại nữa Do đó, phương sai của tổng các biến ngẫu nhiên độc lập sẽ bằng tổng các phương sai Đặc biệt, nếu tất cả các giá trị phương sai đều bằng nhau, nghĩa là Var(xi) = σ2 với mỗi i, thì Var[Σ(aixi)] = σ2Σ 2

i

a

f Nếu tất cả các x1, x2, , xn đều là biến ngẫu nhiên độc lập nghĩa là tập biến xi có phân phối chuẩn với giá trị trung bình µi và phương sai 2

i

σ hay được thể hiện bằng ký hiệu xi ∼ N(µi, 2

i

σ ) thì tổ hợp tuyến tính của tập biến x cho trước có dạng a1 x1 + a2 x2 + + an xn cũng sẽ có dạng phân phối chuẩn với giá trị trung bình là a1 µ1 + a2 µ2 + + an µn và giá trị phương sai là 2

1

2 1

a σ + 2

2

2 2

a σ + + 2

n

2 n

a σ Trong ký hiệu phép lấy tổng, chúng ta có thể viết như sau U = Σ( ai xi) ∼ N[(Σai µi), (Σ 2

i

2 i

a σ )]

g Nếu tất cả các x1, x2, , xn đều độc lập và có phân phối giống nhau (iid) tuân theo phân phối chuẩn N(µ, σ2) thì giá trị trung bình của chúng là x = (1/n)Σxi sẽ có dạng phân phối chuẩn với giá trị trung bình bằng µ và phương sai bằng σ2/n, nghĩa là x ∼ N(µ, σ2/n) Tương tự, chúng ta có z = n(x−µ)/σ ∼ N(0, 1)

} 2.4 Lấy Mẫu Ngẫu Nhiên và Các Phân Phối Lấy Mẫu

Một kiểm định bằng thống kê có thể phát sinh thêm ngoài nhu cầu giải quyết một bài toán cụ thể nào đó Nó có thể là một sự cố gắng nhằm giải thích một cách hợp lý hành vi trong quá khứ của một tác nhân nào đó hay dự báo các hành vi trong tương lai của

chúng Trong việc định dạng vấn đề, điều quan trọng là phải xác định được một không gian thống kê hợp lý, hay tổng thể mà bao gồm tổng tất cả các phần tử có liên quan đến thông tin yêu cầu Thuật ngữ tổng thể được dùng theo một nghĩa tổng quát và không chỉ

giới hạn khi đề cập đến các sinh vật mà thôi Tất cả các hạt giống trong thùng lưu trữ, mọi công ty trong thành phố, và tất cả các bồn sữa được sản xuất bởi trại bò sữa cũng

được gọi là tổng thể

Một nhà phân tích sẽ quan tâm nhiều đến những kết luận rút ra về những tính chất của tổng thể Điều hiển nhiên là chi phí sẽ rất cao nếu nghiên cứu từng phần tử của tập chính để đưa ra các kết luận Do đó mà nhà phân tích sẽ chọn ra một mẫu gồm một số phần tử, tiến hành quan sát chúng, và sử dụng những quan sát này để rút các kết luận về đặc điểm của tổng thể mà mẫu phần tử làm đại diện Quá trình này được gọi là lấy mẫu

Trang 10

Có thể có rất nhiều cách lấy mẫu: lấy mẫu ngẫu nhiên, lấy mẫu phán đoán, lấy mẫu chọn lọc, lấy mẫu có hoặc không có hoàn trả phần tử trở lại tổng thể, lấy mẫu phân tầng,

v.v Trong tài liệu này, chúng tôi chỉ đề cập đến lấy mẫu ngẫu nhiên, là cách lấy mẫu

thường dùng nhất

ĐỊNH NGHĨA 2.6 (Lấy mẫu ngẫu nhiên)

Một mẫu ngẫu nhiên đơn giản của n yếu tố là một mẫu có tính chất rằng mọi tổ hợp của

n yếu tố đều có một cơ hội là mẫu được chọn bằng nhau Một mẫu ngẫu nhiên của các

quan sát đối với một biến ngẫu nhiên X là một tập hợp của các biến ngẫu nhiên độc lập,

được phân phối giống nhau (iid) X1, X2, , Xn, mỗi biến có cùng phân phối xác suất như phân phối của X

Các Phân Phối Mẫu

Một hàm của các giá trị quan sát của các biến ngẫu nhiên không chứa bất kỳ thông số

chưa biết nào được gọi là một trị thống kê mẫu Hai trị thống kê mẫu được sử dụng một

cách thường xuyên nhất là trung bình mẫu (ký hiệu là x_) và phương sai mẫu (ký hiệu là

s2):

Trung bình mẫu: x_ = (x1 + x2 + + xn )/n = 1n∑xI (2.8)

Phương sai mẫu: s2 = (n −1 1) (x1 – x_)2 + (n −1 1) (x2 – x_)2 (2.9)

+ + (n 1− 1) (x n – x_)2 = (n −1 1) ∑ (xi - x_)2

Lý do phải chia cho n – 1 chứ không phải là n được giải thích trong Phần 2.7 Căn bậc

hai của phương sai mẫu (s) được gọi là độ lệch chuẩn mẫu hay sai số chuẩn Sự khác biệt giữa một trị thống kê mẫu và một thông số tổng thể phải được hiểu một cách rõ

ràng Giả sử biến ngẫu nhiên X có giá trị kỳ vọng µ và phương sai σ2 Đây là những thông số tổng thể có giá trị cố định và không ngẫu nhiên Tuy nhiên ngược lại trung bình mẫu x_ và phương sai mẫu s2 là các biến ngẫu nhiên Điều này là do những thử nghiệm khác nhau của một thí nghiệm cho các giá trị trung bình mẫu và phương sai khác nhau Bởi vì các trị thống kê này là các biến ngẫu nhiên, nó có ý nghĩa khi nói về các phân

phối của chúng Nếu chúng ta rút ra một mẫu ngẫu nhiên có cỡ mẫu là n và tính trung

bình mẫu x_, chúng ta thu được một giá trị nhất định Lặp lại thí nghiệm này nhiều lần,

mỗi lần rút ra một mẫu ngẫu nhiên có cùng cỡ mẫu n Chúng ta sẽ có được nhiều giá trị

của trung bình mẫu Chúng ta khi đó có thể tính tỷ số những lần mà các giá trị trung bình

Ngày đăng: 12/08/2014, 06:22

HÌNH ẢNH LIÊN QUAN

Bảng 2.4 trình bày các giá trị xác suất kết hợp của số lần xuất hiện của số 3 (X) và số 5  (Y) khi một cặp súc sắc được thảy - Giáo trình kinh tế chất lượng - ôn lại thống kê - 2 potx
Bảng 2.4 trình bày các giá trị xác suất kết hợp của số lần xuất hiện của số 3 (X) và số 5 (Y) khi một cặp súc sắc được thảy (Trang 2)

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w