05 bài giảng số 4 tổng thể lý thuyết mẫu và ước lượng tham số của các biến ngẫu nhiên

Khái niệm về phương pháp mẫu Trong thực tế thường phải nghiên cứu một hay một số dấu hiệu định lượng hoặc địnhtính trên một tập hợp các phần tử thuần nhất.. Trong thực tế, người ta thườn

Trang 1

Chương 6: Cơ sở lý thuyết mẫu

Đ1 Khái niệm về phương pháp mẫu

Trong thực tế thường phải nghiên cứu một hay một số dấu hiệu định lượng hoặc địnhtính trên một tập hợp các phần tử thuần nhất Toàn bộ tập hợp các phần tử đồng nhất theomột dấu hiệu nghiên cứu định tính hoặc định lượng nào đó gọi là tổng thể nghiên cứuhoặc tổng thể

Thực chất các dấu hiệu này là các biến ngẫu nhiên Vì vậy việc nghiên cứu một tổng thểthực chất là tìm các tham số đặc trưng của biến ngẫu nhiên đặc trưng cho tổng thể đó

Ví dụ: Nghiên cứu kết quả sản xuất kinh doanh của các doanh nghiệp, có thể có các dấuhiệu định lượng như: lợi nhuận, doanh thu, thị phần

Để xác định các tham số đặc trưng của tổng thể, có thể dùng phương pháp điều tra toàn

bộ tức là thống kê toàn bộ tổng thể và phân tích từng phần tử của nó

Tuy nhiên, phương pháp này ít được sử dụng vì có rất nhiều hạn chế

Trong thực tế, người ta thường dùng phương pháp mẫu: Là nghiên cứu một bộ phận củatổng thể , gồm một số phần tử của tổng thể được chọn ra làm đại diện Dựa trên thông tinthu được của các phần tử trong mẫu, bằng phương pháp suy luận khoa học để tìm thôngtin tổng quát

Phương pháp này có nhiều ưu điểm như:

-Tính khả thi: khi không thể điều tra toàn bộ tổng thể

-chi phí ít tốn kém hơn so với điều tra toàn bộ tổng thể

Trang 2

gọi là biến ngẫu nhiên gốc của tổng thể Quy luật phân phối xác suất của X gọi là quyluật gốc của tổng thể.

Giả sử X có thể nhận các giá trị x1, x2, , xkvới các tần số tương ứng N1, N2, Nk Khi

1.Trung bình tổng thể

Trung bình tổng thể, kí hiệu là m là trung bình số học của các giá trị của dấu hiệu trongtổng thể

m = 1N

N

X

i=1

xiNếu tổng thể chỉ nhận k giá trị x1, x2, xk với các tần số tương ứng N1, N2, Nk thìtrung bình tổng thể được tính bởi công thức

m = 1N

Trang 3

Như vậy, trung bình tổng thể bằng kì vọng của biến ngẫu nhiên gốc X

Ta có:

m = 1N

k

X

i=1

Nixi = 63

Ngoài ra, tùy vào từng trường hợp người ta còn sử dụng các loại trung bình sau

+Trung bình điều hòa

Kí hiệu σ2, là trung bình số học của bình phương các sai lệch giữa các giá trị của dấuhiệu trong tổng thể và trung bình tổng thể

σ2 = 1N

N

X

i=1

(xi− m)2Hoặc

Trang 4

σ2 = 1N

nó phản ánh mức độ phân tán của các giá trị của dấu hiệu χ xung quanh trung bình tổngthể

Phương sai tổng thể cũng có thể được tính bằng công thức

σ2 = 1N

Cho tổng thể kích thước N, trong đó có M phần tử mang dấu hiệu nghiên cứu, N − Mphần tử không mang dấu hiệu nghiên cứu Ta gọi tần suất tổng thể là tỷ số giữa số phần

tử mang dấu hiệu nghiên cứu và kích thước tổng thể

p = MN-Chú ý: p chính là xác suất để lấy ngẫu nhiên một phần tử thì phần tử đó mang dấu hiệunghiên cứu

Đ3 Mẫu ngẫu nhiên

I Định nghĩa mẫu ngẫu nhiên

Lấy n phần tử từ tổng thể, được một tập hợp con của tổng thể gồm n phần tử đại diệncho tổng thể gọi là mẫu, n gọi là kích thước mẫu

Để đảm bảo tính đại diện của mẫu cho tổng thể, mẫu được tạo lập với những giả thiếtsau:

-Lấy lần lượt từng phần tử vào mẫu

-Mỗi phần tử được lấy vào mẫu một cách ngẫu nhiên

Trang 5

-Các phần tử được lấy theo phương thức hoàn lại

Gọi Xi (i = 1 n) là giá trị của dấu hiệu χ đo lường được trên phần tử thứ i của mẫu.Các giá trị Xi có thể xem như các biến ngẫu nhiên thu được qua việc tiến hành n phépthử độc lập đối với biến ngẫu nhiên X

Định nghĩa 1: Mẫu ngẫu nhiên kích thước n là tập hợp của n biến ngẫu nhiên độc lập

X1, X2, Xnđược thành lập từ biến ngẫu nhiên X trong tổng thể nghiên cứu và có cùngquy luật phân phối xác suất của X, kí hiệu W = (X1, X2, Xn)

-Chú ý: Do các thành phần mẫu được rút ra từ cùng biễn ngẫu nhiên gốc X nên chúng

có cùng quy luật phân phối xác suất và tham số đặc trưng với biến ngẫu nhiên gốc X:E(X1) = E(X2) = = E(Xn) = E(X) = m

V (X1) = V (X2) = = V (Xn) = V (X) = σ2

Ví dụ:Nghiên cứu số chấm thu được khi gieo một con xúc xắc Khi đó số chấm thu được

X là biến ngẫu nhiên gốc X có bảng phân phối xác suất:

Nếu gieo con xúc xắc 3 lần và gọi Xi (i=1,2,3) là số chấm xuất hiện ở lần giao thứ i thì

X 1 2 3 4 5 6

P 1 6

1 6

ta có 3 biến ngẫu nhiên độc lập, có bảng phân phối xác suất như X, chúng tạo nên mẫukích thước n=3: W = (X1, X2, X3)

Nếu thực hiên gieo 3 làn thực sự: giả sử lần thứ nhất được mặt 2 chấm, lần thứ 2 đượcmặt 3 chấm, lần thứ 3 được mặt 5 chấm ta viết kết quả gieo w = (2, 3, 5)

Định nghĩa 2: Giả sử X1 nhận giá trị x1, X2 nhận giá trị x2, , Xn nhận giá trị xn Tậphợp n giá trị x1, x2, xn tạo thành một giá trị của mẫu ngẫu nhiên, còn gọi là mẫu cụthể, kí hiệu w = (x1, x2, xn) Mỗi phần tử nhận giá trị cụ thể của mẫu cụ thể gọi làmột quan sát

Trang 6

4.Mẫu phân tổ.

5.Mẫu nhiều cấp

III.Thang đo các giá trị mẫu

Biến ngẫu nhiên trong tổng thể nghiên cứu có thể là định tính hoặc định lượng Để biểudiễn các giá trị của dấu hiệu trong tổng thể cũng như trong mẫu phải dùng các thang đokhác nhau để lượng hóa dấu hiệu nghiên cứu đó

1 Thang đo định danh

Ví dụ: nam(0), nữ(1)

2 Thang đo thứ bậc

Ví dụ:đặc trưng cho học vấn: tiểu học (0), trung học (1), đại học (2)

3 Thang đo khoảng

Ví dụ: Đặc trưng cho lứa tuổi

Số liệu điều tra về tổng thu nhập (triệu) của 100 hộ gia đình:

Ta có bảng phân phối tần số và tần suất như sau:

Trang 7

x j <x i

njn

F∗(xi)còn được gọi là hàm phân bố thực nghiệm của mẫu

3 Đa giác tần số, tần suất

- Đa giác tần số là một đường gấp khúc mà các đoạn thẳng của nó nối các điểm(x1, n1),(x2, n2) (xk, nk)

- Đa giác tần suất là một đường gấp khúc mà các đoạn thẳng của nó nối các điểm(x1, f1),(x2, f2) (xk, fk)

Đ4 Thống kê

I Định nghĩa

Với mẫu ngẫu nhiên W = (X1, X2, Xn), ta mới chỉ có được một vài thông tin rời rạc

về biến ngẫu nhiên gốc X Vì vậy, nếu tổng hợp các biến ngẫu nhiên cùng phân phối Xi

lại thì theo luật số lớn sẽ bộc lộ những quy luật mới làm cơ sở nhận định về biến ngẫunhiên gốc X Việc tổng hợp mẫu dưới dạng một hàm nào đó của các thành phần mẫu Xi

Trang 8

được gọi là một thống kê, kí hiệu G = f(X1, X2, Xn)

Do các Xi là các biến ngẫu nhiên nên G cũng là biến ngẫu nhiên tuân theo một quyluật phân phối xác suất nhất định Khi mẫu ngẫu nhiên nhận một giá trị cụ thể ω =(x1, x2, xn)thì G cũng nhận một giá trị cụ thể g = f(x1, x2, xn)

Ví dụ: Thống kê

G = X1+ X2+ + Xn

nCác thống kê đặc trưng của mẫu ngẫu nhiên được chia thành 3 loại:

-Các thống kê đặc trưng xu hướng trung tâm của phân phối của mẫu như: trung bìnhmẫu, trung vị

-Các thống kê đặc trưng cho độ phân tán của mẫu như: Phương sai, độ lệch chuẩn, khoảngbiến thiên,

-Các thống kê đặc trưng dạng phân phối

II Trung bình mẫu

Thống kê trung bình mẫu kí hiệu X cho bởi công thức

X = X1+ X2+ + Xn

nKhi mẫu ngẫu nhiên nhận giá trị cụ thể ω = (x1, x2, xn)thì trung bình mẫu cũng nhậngiá trị cụ thể

x = x1+ x2+ + xn

nGiả sử biến ngẫu nhiên gốc X có kì vọng toán E(X) = m và phương sai V (X) = σ2,

do các biến ngẫu nhiên Xi độc lập và có cùng phân phối với X nên dễ dàng chứng minh

được kì vọng E(X) = m, phương sai V (X) = σ 2

n và độ lệch chuẩnqV (X) = √σ

n

Độ lệch chuẩn thường được dùng để phản ánh sai số ước lượng nên còn được gọi là sai

số chuẩn của trung bình mẫu:

Se(X) = √σ

n+Ghi chú:Nếu mẫu được lấy theo phương thức không hoàn lại và n > 0, 1N thì các côngthức trên phải sử dụng hệ số hiệu chỉnh

Trung vị là giá trị nằm chính giữa chia các số liệu mẫu thành hai phần bằng nhau, kí hiệu

Trang 9

L-giới hạn dưới của lớp chứa trung vị

n-kích thước mẫu

S-tổng tần số của các lớp đứng trước lớp chứa trung vị

nXd-tần số của lớp chứa trung vị

h-độ dài của lớp chứa trung vị

IV Khoảng biến thiên

Là sai lệch giữa giá trị lớn nhất và nhỏ nhất của mẫu, kí hiệu R: R = Xmax− XminNếu các số liệu mẫu được ghép lớp thì khoảng biến thiên là hiệu số giữa cận trên của lớpcuối cùng với cận dưới của lớp đầu tiên trong dãy phân phối các giá trị của mẫu

V Khoảng tứ phân vị

Nếu mẫu được chia thành 4 phần bằng nhau ta có tứ phân vị, tứ phân vị đầu Q1 là giá trịcủa mẫu cách đơn vị đầu tiên 1/4 đơn vị của mẫu, tứ phân vị thứ hai chính là trung vị, tứphân vị thứ ba Q3 là giá trị của mẫu cách đơn vị đầu tiên 3/4 số đơn vị của mẫu

Khoảng tứ phân vị kí hiệu IQR,

IQR = Q3− Q4

VI Tổng bình phương các sai lệch và độ lệch bình phương trung bình

Cho mẫu ngẫu nhiên W = (X1, X2, Xn)Tổng bình phương các sai lệch giữa các giátrị của mẫu và trung bình mẫu được kí hiệu SS

Trang 10

Như vậy S2 phản ánh đúng giá trị phương sai tổng thể theo nghĩa kì vọng.

Ta cũng có: E(S∗2) = σ2

Thật vậy: E(S∗2) = E[1nPn

i=1(Xi− m)2] = n1E[Pn

i=1(Xi− m)2]E(S∗2) = n1 Pn

i=1V (Xi) = n1Pn

i=1V (X) = σ2

Trang 11

Độ lệch chuẩn mẫu.

Kí hiệu S, là căn bậc hai của phương sai mẫu S =√S2

Với mẫu cụ thể: ω = (x1, x2, xn)

Ta có:

ms = 1n

n

X

i=1

(xi− x2) = x2− (x)2hoặc

ms = 1n

Trang 12

IX Hệ số bất đối xứng

a3 =

Pn i=1

Trang 13

Giả sử tổng thể kích thước N, trong đó có M phần tử mang dấu hiệu nghiên cứu Lấy ramẫu ngẫu nhiên kích thước n và thấy có X phần tử mang dấu hiệu nghiên cứu.

Tần suất mẫu là một thống kê, kí hiệu f là tỷ số giữa số phần tử mang dấu hiệu nghiêncứu trong mẫu và kích thước mẫu

f = XnNếu xem dấu hiệu nghiên cứu như một biến ngẫu nhiên tuân theo quy luật A(p), E(X)=p,V(X)=p(1-p), ta có:

E(f ) = p, V (f ) = p(1 − p)

nSai số chuẩn của tần suất mẫu là

Se(f ) = pp(1 − p)

√nNếu mẫu lấy theo phương pháp không hoàn lại thì sai số chuẩn là:

a Tính trung bình mẫu, phương sai, độ lệch chuẩn mẫu

b Giả sử biết trung bình tổng thể là 31(gr), tình phương sai s∗2

c Tính tần suất mẫu của số quả nặng trong khoảng từ 31 đến 35 gr

Trang 14

Giả sử trên cùng một tổng thể phải nghiên cứu đồng thời hai dấu hiệu nghiên cứu, trong

đó dấu hiệu nghiên cứu thứ nhất có thể xem là biến ngẫu nhiên X, dấu hiệu nghiên cứuthứ hai là biến ngẫu nhiên Y Việc nghiên cứu đồng thời hai biến ngẫu nhiên trong tổngthể tương tự như việc nghiên cứu một biến ngẫu nhiên hai chiều

Mẫu ngẫu nhiên hai chiều kích thước n là tập hợp của n biến ngẫu nhiên độc lập(X1, Y1), (X2, Y2), (Xn, Yn) được thành lập từ biến ngẫu nhiên hai chiều (X, Y) cócùng quy luật phân phối xác suất với (X, Y) Kí hiệu:

W = [(X1, Y1), (X2, Y2), (Xn, Yn)]

Mẫu cụ thể:

Trang 15

w = [(x1, y1), (x2, y2), (xn, yn)]

II Phương pháp mô tả mẫu ngẫu nhiên hai chiều

Giả sử từ tổng thể rút ra mẫu ngẫu nhiên kích thước n, trong đó thành phần X nhận cácgiá trị x1, x2, xh, thành phần Y nhận các giá trị y1, y2, yktrong đó các giá trị (xi, yj)xuấthiện với tần số nij Các giá trị xi, yj sắp xếp theo thứ tự tăng dần, ta có bảng phân phốitần số:

Y /X x1 x2 xi xh mj

y1 n11 n12 n1i n1h m1

y2 n21 n22 n2i n2h m2

yj nj1 nj2 nji njh mj

yk nk1 nk2 nki nkh mk

ni n1 n2 ni nh P = n

trong đó: ni là tổng tần số của mẫu mang giá trị xi của thành phần X, mj là tổng tần

số của mẫu mang giá trị yj của thành phần Y

Một số thống kê đặc trưng của mẫu ngẫu nhiên hai chiều

1 Bảng phân phối thực nghiêm của thành phần X:

Trang 16

§6 Quy luËt ph©n phèi x¸c suÊt cña mét sè thèng kª

I BiÕn ngÉu nhiªn gèc ph©n phèi theo quy luËt chuÈn

Gi¶ sö biÕn ngÉu nhiªn gèc ph©n phèi chuÈn X ∼ N(µ, σ2)

Trang 17

+ Thống kê trung bình mẫu:

E(X) = à, V (X) = σ

2

nSuy ra thống kê:

Do

S∗2 = 1n

n

X

i=1

(Xi− à)2Suy ra

s(n − 1)S2

II Hai biến ngẫu nhiên gốc cùng phân phối theo quy luật chuẩn

Giả sử xét cùng lúc hai tổng thể, ở tổng thể thứ nhất biến ngẫu nhiên gốc X1 ∼ N (à1, σ2

1),

ở tổng thể thứ hai biễn ngẫu nhiên gốc X2 ∼ N (à2, σ2

2) Từ hai tổng thể rút ra hai mẫungẫu nhiên độc lập có kích thước tương ứng n1, n2

+ Xét thống kê X1− X2 là hiệu hai trung bình mẫu:

Ta có:

E(X1− X2) = E(X1) − E(X2) = à1− à2

V (X1− X2) = V (X1) − V (X2) = σ

2 1

n1 −σ

2 2

à2

Trang 18

+(n2− 1)S2

1

σ2 2

tuân theo quy luật phân phối khi bình phương (n1+ n2− 2)bậc tự do

trong đó

2 1

n1(Sn2

1 +Sn2

2)+ Do

χ21 = (n1− 1)S2

1

σ2 1

và χ2

2 = n2− 1)S2

1

σ2 2

Trang 19

phân phối theo quy luật Fisher-Snedecor F (n1− 1, n2− 1).

III Biến ngẫu nhiên gốc tuân theo quy luật không - một

Giả sử dấu hiệu nghiên cứu có thể xem như biến ngẫu nhiên phân phối theo quy luậtA(p) Khi đó tần suất mẫu f sẽ phân phối theo quy luật nhị thức với các tham số đặctrưng là:

E(f ) = p, V (f ) = p(1−p)n

Nếu

n > 5 và |

q p 1−p −q1−p

p |

√

n < 0, 3thì tần suất mẫu sẽ phân phối xấp xỉ chuẩn với E(f) = p và V (f) = p(1−p)

n Do đó biếnngẫu nhiên

U = f − pSe(f ) =

(f − p)√

npp(1 − p)

sẽ phân phối xấp xỉ chuẩn hóa N(0, 1)

IV Hai biến ngẫu nhiên gốc cùng tuân theo quy luật không - một

Xét hai tổng thể, biến ngẫu nhiên chứa dấu hiệu nghiên cứu là X1 và X2, X1 ∼ A(p1),

X2 ∼ A(p2) Từ đó rút ra hai mẫu kích thước n1, n2 với tần suất mẫu tương ứng là f1,

p 1 (1−p 1 )

n 1 + p2 (1−p 2 )

n 2

∼ N (0, 1)

Trang 20

Đ7.Suy diễn thống kê

Như phần trên ta thấy, quy luật phân phối xác suất của các thống kê đặc trưng mẫuphản ánh mối liên hệ chặt chẽ giữa các tham số của mẫu với các tham số tương ứng củatổng thể nghiên cứu Nếu đã biết quy luật phân phối xác suất hay các tham số đặc trưngcủa tổng thể thì có thể sử dụng các kết luận trên để suy đoán về tính chất của một mẫungẫu nhiên rút ra từ tổng thể đó, gọi là suy diễn thống kê

I Suy diễn về mẫu ngẫu nhiên rút ra từ tổng thể phân phối chuẩn

Giả sử trong tổng thể biến ngẫu nhiên X tuân theo quy luật chuẩn N(à, σ2), cần suy

đoán xem với một mức xác suất cho trước thì các thống kê mẫu ngẫu nhiên: trung bình,phương sai mẫu sẽ nằm trong khoảng nào Kí hiệu mức xác suất cho trước là (1 − α)

1 Suy diễn trung bình mẫu

Ta có thống kê

U = (X − à)

√n

σ ∼ N (0, 1)Với xác suất 1 − α ta tìm được α1 và α2 thỏa mãn α1+ α2 = α và tìm được các giá trịtới hạn u1−α 1 và uα 2 sao cho:

P (u1−α1 < U < uα2) = 1 − αHay

P (u1−α1 < (X − à)

√n

σ < uα2) = 1 − αChuyển vế ta được:

P (à − √σ

nuα1 < X < à + √σ

nuα2) = 1 − α+ Suy diễn tối thiểu: Nếu chọn α2 = 0, ta có

P (à − √σ

nuα < X) = 1 − α+ Suy diễn tối đa: Nếu chon α1 = 0, ta có:

P (X < à + √σ

nuα) = 1 − α+ Suy diễn đối xứng: Nếu chọn α1 = α2 = α/2, ta có:

Trang 21

ví dụ 1:

Một công ty sản xuất mỳ ăn liền với trọng lượng đóng gói là biến ngẫu nhiên phân phốichuẩn có trọng lượng trung bình là 340g và độ lệch chuẩn 10 g Lấy ngẫu nhiên mẫu 16gói để kiểm tra

a Tìm xác suất để trọng lượng trung bình các gói mỳ nằm trong khoảng từ 335 đến 345g

b Tìm xác suất để trọng lượng trung bình các gói mỳ lớn hơn 340 g.(suy diễn tối thiểu)

c Với xác suất 0,99 thì trọng lượng trung bình các gói mỳ nằm trong khoảng nào xungquanh giá trị trung bình.(Suy diễn khoảng đối xứng)

(333, 55; 346, 45)

2 Suy diễn phương sai mẫu

Trang 22

P ( σ

2

n − 1χ

2(n−1) 1−α 1 < S2 < σ

2

n − 1χ

2(n−1)

α 2 ) = 1 − α+ Suy diễn tối thiểu:

P (S2 > σ

2

n − 1χ

2(n−1) 1−α ) = 1 − α+ Suy diễn tối đa:

P ( σ

2

n − 1χ

2(n−1) α/2 < S2 < σ

2

n − 1χ

2(n−1) α/2 ) = 1 − α

Ví dụ 2:

Điểm thi một môn học của sinh viên là biến ngẫu nhiên X ∼ N(à = 6, 5; σ2 = 0, 81).Với một tập hợp ngẫu nhiên gồm 40 sinh viên và mức xác suất 0,95 cho trước

a Tìm một khoảng cho điểm trung bình của các sinh viên đó

b Phương sai và độ lệch chuẩn điểm số tối đa của các sinh viên đó?

b áp dụng công thức suy diễn tối đa phương sai mẫu S2

Trang 23

P (S2 < 1, 158) = 0, 95Vậy phương sai điểm tối đa là 1,1158.

3 Suy diễn tần suất mẫu

Giả sử biến ngẫu nhiên X trong tổng thể phân phối không-một với tham số p Từ tổngthể rút ra mẫu kích thước n, với mức xác suất 1 − α cho trước, ta có thể suy diễn tần suấtmẫu f:

Ta đã có

U = (f − p)

√npp(1 − p) ∼ N (0, 1)

Ta có thể tìm được cặp giá trị α1 và α2 sao cho

P (u1−α1 < U < uα2) = 1 − α)Thay biểu thức U vào ta có:

Ví dụ 3:

Một lô hàng đủ tiêu chuẩn xuất khẩu nếu tỷ lệ sản phẩm loại một của lô hàng đó là 90%

Từ một lô hàng dự định xuất khẩu người ta lấy ngẫu nhiên 100 sản phẩm thì vói xác suất0,9 , trong đó phải có ít nhất bao nhiêu sản phẩm loại một thì đủ tiêu chuẩn xuất khẩu.Giải:

áp dụng công thức suy diễn tối thiểu ta có:

Trang 24

⇒ X > 100.0, 86154 = 86, 154

Vậy phải có ít nhất 87 sản phẩm loại một trong lô hàng đó

Trang 25

Chương 7: Ước lượng các tham số của biến ngẫu nhiên

Giả sử cần nghiên cứu tổng thể thông qua dấu hiệu nghiên cứu χ, và dấu hiệu này cóthể xem như một biến ngẫu nhiên X có quy luật phân phối xác suất xác định, thì giá trịcác tham số đặc trưng của biến ngẫu nhiên đó sẽ cho biết thông tin tổng hợp về tổng thể.Giả sử chưa xác định được giá trị của một tham số θ, việc xác định một cách gần đúnggiá trị của θ dựa trên những thông tin có được gọi là ước lượng tham số

Phương pháp mẫu cho phép giải quyết bài toán trên như sau: Từ tổng thể rút ra mẫu ngẫunhiên kích thước n và dựa vào đó xây dựng một thống kê ˆθ dùng để ước lượng θ Có haiphương pháp sử dụng để ước lượng là: Phương pháp ước lượng điểm và Phương pháp ướclượng bằng khoảng tin cậy

Đ1 Phương pháp ước lượng điểm

Phương pháp ước lượng điểm là dùng một giá trị tính toán trên mẫu để ước lượng chotham số θ Thông thường giá trị được chọn là một thống kê ˆθ nào đó của mẫu ngẫu nhiên.1.Định nghĩa:

Giả sử từ cần ước lượng tham số θ của biến ngẫu nhiên gốc X Từ mẫu W = (X1, X2 Xn).Chọn một thống kê ˆθ = f(X1, X2, Xn)tương ứng với tham số θ cần ước lượng Vớimột mẫu cụ thể, ta tính được giá trị ˆθ = f(x1, x2, xn) của thống kê ˆθ trên mẫu cụ thể

đó thì ước lượng của θ chính là giá trị ˆθ vừa tính

Thống kê ˆθ = f(X1, X2, Xn)gọi là hàm ước lượng

Để đánh giá chất lượng của ước lượng người ta đưa ra các tiêu chuẩn sau:

2.Các tiêu chuẩn lựa chọn hàm ước lượng

a Ước lượng không chệch

Thống kê ˆθ của mẫu được gọi là ước lượng không chệch của tham số θ của biến ngẫunhiên X nếu: E(ˆθ) = θ

Nếu E(ˆθ) 6= θ thì ˆθ gọi là ước lượng chệch của θ

Dựa vào các kết quả ở chương VI ta có thể rút ra một số kết luận:

- Trung bình mẫu X là ước lượng không chệch của kì vọng toán m

- Tần suất mẫu f là ước lượng không chệch của xác suất p của biến ngẫu nhiên gốc X

- Phương sai mẫu S2 và phương sai S∗2là các ước lượng không chệch của phương sai σ2

b Ước lượng hiệu quả:

Thống kê mẫu được gọi là ước lượng hiệu quả nhất của tham số θ của biến ngẫu nhiên

Trang 26

gốc X nếu nó là ước lượng không chệch và có phương sai nhỏ nhất so với mọi ước lượngkhông chệch khác được xây dựng trên cùng một mẫu đó.

Ước lượng không chệch ˆθ1 là hiệu quả hơn ˆθ2 nếu V ( ˆθ1) < V ( ˆθ2)và độ hiệu quả của ˆθ1

θ = f (x1, x2, xn)được gọi là ước lượng hợp lý tối đa của θ nếu ứng với giá trị này của

Nếu tại điểm θ = ˆθ đạo hàm bậc hai âm thì tại đó lnL hay L đạt cực đại và ˆθ =

f (x1, x2, xn)là ước lượng hợp lý tối đa cần tìm của θ

Trang 27

dp = 0 → p = xHơn nữa: d2lnL

P n i=1 (x i −à) 2

Giải tương tự trên ta có ước lượng hợp lý tối đa của à là X, còn của σ2 là MS

Phương pháp ước lượng điểm có một nhược điểm cơ bản là khi kích thước mẫu nhỏthì sai số ước lượng có thể rất lớn, mặt khác không thể đánh giá được khả năng mắc sailầm khi ước lượng là bao nhiêu Do đó khi kích thước mẫu nhỏ người ta thường dùngphương pháp ước lượng bằng khoảng tin cậy,

Đ2 Phương pháp ước lượng bằng khoảng tin cậy

Trang 28

Xác suất 1 − α gọi là độ tin cậy của ước lượng, và I = G2 − G1 được gọi là độ dài củakhoảng tin cậy.

Phương pháp tiến hành:

Từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = (X1, X2, Xn)

từ đó xây dựng một thống kê G = f(X1, X2, Xn, θ) sao cho quy luật phân phối xácsuất của G hoàn toàn xác định và không phụ thuộc vào các đối số của nó Với độ tin cậy

1 − αcho trước có thể tìm được cặp giá trị α1 và α2 sao cho α1+ α2 = α, tương ứng tìm

được cặp giá trị Gα 1, Gα 2 thỏa mãn: P (G < Gα 1) = α1 và P (G > Gα 2) = α2

Khi đó ta có:

P (Gα1 < G < Gα2) = P (G > Gα1) − P (G > Gα2) = 1 − α1− α2 = 1 − αHay

P (G1 < G < G2) = 1 − αVới mẫu cụ thể w = (x1, x2, xn), ta tính được giá trị G1, G2 tương ứng là g1, g2 Nhưvậy với độ tin cậy, với mỗi mẫu cụ thể tham số θ của biến ngẫu nhiên gốc X sẽ nằmtrong khoảng (g1, g2)với khả năng mắc sai lầm α

2.Ước lượng kì vọng toán à của biến ngẫu nhiên phân phối theo quy luật chuẩn:2.1.Đã biết phương sai tổng thể σ2

P (U < u1−α1) = α1 và P (U > uα 2) = α2

Ta có:

P (u1−α1 < U < uα2) = 1 − (α1+ α2) = 1 − αhay

Trang 29

Vậy với độ tin cậy 1 − α tham số à sẽ nằm trong khoảng (X −√σ

nuα2, X +√σ

nuα1)Vớivô số cặp α1, α2 ta tìm được vô số khoảng tin cậy tương ứng Trong thực tế người thường

sử dụng các trường hợp đặc biệt sau:

-Khoảng tin cậy bên phải: Lấy α1 = 0 và α2 = αthì uα 1 = u0 = ∞

Khi đó khoảng tin cậy là

(X − √σ

nuα; ∞) (1)Biểu thức (1) còn dùng để ước lượng giá trị tối thiểu của à

-Khoảng tin cậy bên trái: Lấy α2 = 0và α1 = αthì uα 2 = u0 = ∞

Khi đó khoảng tin cậy là

(−∞; X + √σ

nuα) (2)Biểu thức (2) còn dùng để ước lượng giá trị tối đa của à

-Khoảng tin cậy đối xứng: Lấy α1 = α2 = α/2, khi đó khoảng tin cậy là:

nuα/2 thì khoảng tin cậy là:(X − ; X + )

u2α/2] = [σ

2

2 0

u2α/2]Các khoảng tin cậy trên là các khoảng tin cậy ngẫu nhiên Với mỗi mẫu cụ thể ta tính

được giá trị cụ thể của trung bình mẫu x và các khoảng tin cậy cụ thể

Ví dụ 1 (bt7.16):

Doanh số của một cửa hàng là biến ngẫu nhiên phân phối chuẩn với độ lệch chuẩn là 2triệu/tháng Điều tra ngẫu nhiên doanh số của 600 cửa hàng có quy mô tương tự nhautìm được doanh số trung bình là 8,5 triệu Với độ tin cậy 95% hãy ước lượng doanh sốtrung bình của các cửa hàng thuộc quy mô đó

Giải:

Trang 30

Ta có: Trung bình mẫu x = 8, 5, kích thước mẫu n=600, σ = 2, 1 − α = 0, 95 suy raα/2 = 0, 025 và uα/2 = u0,025 = 1, 96

Khoảng tin cậy đối xứng là:

(8, 4199; 8, 5800)

Độ chính xác = √1

600.1, 96 = 0, 08Chú ý:

-Khi tăng kích thước mẫu n lên, giữ nguyên độ tin cậy thì giảm đi tức là độ chính xáccủa ước lượng tăng lên

-Khi tăng độ tin cậy, giữ nguyên kích thước mẫu thì giá trị tới hạn chuẩn tăng lên làmcho độ chính xác của ước lượng giảm đi

* Nếu mẫu được chọn theo phương thức không hoàn lại từ tổng thể hữu hạn và n>0,1Nthì Se(X) sẽ nhân thêm hệ số hiệu chỉnh, do đó thống kê G trở thành

G = U = X − à

Se(X) =

X − àq

N −n

N −1.σn22.2.Chưa biết phương sai tổng thể σ2

Ta chọn thống kê

G = T = (X − à)

√nStrong đó S là độ lệch chuẩn mẫu, thống kê G phân phối theo quy luật Student với n-1 bậc

tự do

Trang 31

Tương tự trên ta tìm được hai giá trị tới hạn:

nt

(n−1) α/2 )-Khoảng tin cậy bên phải:

(X − √S

nt

(n−1)

α ; ∞)-Khoảng tin cậy bên trái:

*Kích thước mẫu tối thiểu sao cho với độ tin cậy (1 − α) cho trước, độ dài khoảng tincậy không vượt quá I0 = 20:

n ≥ [S

2

2 0

t2(n−1)α/2 ]

Ví dụ 1(bt7.19):

Có số liệu về trọng lượng của một loại trứng gà như trong bảng Bằng khoảng tin cậy đốixứng, hãy ước lượng trọng lượng trung bình của loại trứng gà này với độ tin cậy 0,95

Định dạng
Số trang	63
Dung lượng	339,86 KB