Khái niệm về phương pháp mẫu Trong thực tế thường phải nghiên cứu một hay một số dấu hiệu định lượng hoặc địnhtính trên một tập hợp các phần tử thuần nhất.. Trong thực tế, người ta thườn
Trang 1Chương 6: Cơ sở lý thuyết mẫu
Đ1 Khái niệm về phương pháp mẫu
Trong thực tế thường phải nghiên cứu một hay một số dấu hiệu định lượng hoặc địnhtính trên một tập hợp các phần tử thuần nhất Toàn bộ tập hợp các phần tử đồng nhất theomột dấu hiệu nghiên cứu định tính hoặc định lượng nào đó gọi là tổng thể nghiên cứuhoặc tổng thể
Thực chất các dấu hiệu này là các biến ngẫu nhiên Vì vậy việc nghiên cứu một tổng thểthực chất là tìm các tham số đặc trưng của biến ngẫu nhiên đặc trưng cho tổng thể đó
Ví dụ: Nghiên cứu kết quả sản xuất kinh doanh của các doanh nghiệp, có thể có các dấuhiệu định lượng như: lợi nhuận, doanh thu, thị phần
Để xác định các tham số đặc trưng của tổng thể, có thể dùng phương pháp điều tra toàn
bộ tức là thống kê toàn bộ tổng thể và phân tích từng phần tử của nó
Tuy nhiên, phương pháp này ít được sử dụng vì có rất nhiều hạn chế
Trong thực tế, người ta thường dùng phương pháp mẫu: Là nghiên cứu một bộ phận củatổng thể , gồm một số phần tử của tổng thể được chọn ra làm đại diện Dựa trên thông tinthu được của các phần tử trong mẫu, bằng phương pháp suy luận khoa học để tìm thôngtin tổng quát
Phương pháp này có nhiều ưu điểm như:
-Tính khả thi: khi không thể điều tra toàn bộ tổng thể
-chi phí ít tốn kém hơn so với điều tra toàn bộ tổng thể
Trang 2gọi là biến ngẫu nhiên gốc của tổng thể Quy luật phân phối xác suất của X gọi là quyluật gốc của tổng thể.
Giả sử X có thể nhận các giá trị x1, x2, , xkvới các tần số tương ứng N1, N2, Nk Khi
1.Trung bình tổng thể
Trung bình tổng thể, kí hiệu là m là trung bình số học của các giá trị của dấu hiệu trongtổng thể
m = 1N
N
X
i=1
xiNếu tổng thể chỉ nhận k giá trị x1, x2, xk với các tần số tương ứng N1, N2, Nk thìtrung bình tổng thể được tính bởi công thức
m = 1N
Trang 3Như vậy, trung bình tổng thể bằng kì vọng của biến ngẫu nhiên gốc X
Ta có:
m = 1N
k
X
i=1
Nixi = 63
Ngoài ra, tùy vào từng trường hợp người ta còn sử dụng các loại trung bình sau
+Trung bình điều hòa
Kí hiệu σ2, là trung bình số học của bình phương các sai lệch giữa các giá trị của dấuhiệu trong tổng thể và trung bình tổng thể
σ2 = 1N
N
X
i=1
(xi− m)2Hoặc
Trang 4σ2 = 1N
nó phản ánh mức độ phân tán của các giá trị của dấu hiệu χ xung quanh trung bình tổngthể
Phương sai tổng thể cũng có thể được tính bằng công thức
σ2 = 1N
Cho tổng thể kích thước N, trong đó có M phần tử mang dấu hiệu nghiên cứu, N − Mphần tử không mang dấu hiệu nghiên cứu Ta gọi tần suất tổng thể là tỷ số giữa số phần
tử mang dấu hiệu nghiên cứu và kích thước tổng thể
p = MN-Chú ý: p chính là xác suất để lấy ngẫu nhiên một phần tử thì phần tử đó mang dấu hiệunghiên cứu
Đ3 Mẫu ngẫu nhiên
I Định nghĩa mẫu ngẫu nhiên
Lấy n phần tử từ tổng thể, được một tập hợp con của tổng thể gồm n phần tử đại diệncho tổng thể gọi là mẫu, n gọi là kích thước mẫu
Để đảm bảo tính đại diện của mẫu cho tổng thể, mẫu được tạo lập với những giả thiếtsau:
-Lấy lần lượt từng phần tử vào mẫu
-Mỗi phần tử được lấy vào mẫu một cách ngẫu nhiên
Trang 5-Các phần tử được lấy theo phương thức hoàn lại
Gọi Xi (i = 1 n) là giá trị của dấu hiệu χ đo lường được trên phần tử thứ i của mẫu.Các giá trị Xi có thể xem như các biến ngẫu nhiên thu được qua việc tiến hành n phépthử độc lập đối với biến ngẫu nhiên X
Định nghĩa 1: Mẫu ngẫu nhiên kích thước n là tập hợp của n biến ngẫu nhiên độc lập
X1, X2, Xnđược thành lập từ biến ngẫu nhiên X trong tổng thể nghiên cứu và có cùngquy luật phân phối xác suất của X, kí hiệu W = (X1, X2, Xn)
-Chú ý: Do các thành phần mẫu được rút ra từ cùng biễn ngẫu nhiên gốc X nên chúng
có cùng quy luật phân phối xác suất và tham số đặc trưng với biến ngẫu nhiên gốc X:E(X1) = E(X2) = = E(Xn) = E(X) = m
V (X1) = V (X2) = = V (Xn) = V (X) = σ2
Ví dụ:Nghiên cứu số chấm thu được khi gieo một con xúc xắc Khi đó số chấm thu được
X là biến ngẫu nhiên gốc X có bảng phân phối xác suất:
Nếu gieo con xúc xắc 3 lần và gọi Xi (i=1,2,3) là số chấm xuất hiện ở lần giao thứ i thì
X 1 2 3 4 5 6
P 1 6
1 6
1 6
1 6
1 6
1 6
ta có 3 biến ngẫu nhiên độc lập, có bảng phân phối xác suất như X, chúng tạo nên mẫukích thước n=3: W = (X1, X2, X3)
Nếu thực hiên gieo 3 làn thực sự: giả sử lần thứ nhất được mặt 2 chấm, lần thứ 2 đượcmặt 3 chấm, lần thứ 3 được mặt 5 chấm ta viết kết quả gieo w = (2, 3, 5)
Định nghĩa 2: Giả sử X1 nhận giá trị x1, X2 nhận giá trị x2, , Xn nhận giá trị xn Tậphợp n giá trị x1, x2, xn tạo thành một giá trị của mẫu ngẫu nhiên, còn gọi là mẫu cụthể, kí hiệu w = (x1, x2, xn) Mỗi phần tử nhận giá trị cụ thể của mẫu cụ thể gọi làmột quan sát
Trang 64.Mẫu phân tổ.
5.Mẫu nhiều cấp
III.Thang đo các giá trị mẫu
Biến ngẫu nhiên trong tổng thể nghiên cứu có thể là định tính hoặc định lượng Để biểudiễn các giá trị của dấu hiệu trong tổng thể cũng như trong mẫu phải dùng các thang đokhác nhau để lượng hóa dấu hiệu nghiên cứu đó
1 Thang đo định danh
Ví dụ: nam(0), nữ(1)
2 Thang đo thứ bậc
Ví dụ:đặc trưng cho học vấn: tiểu học (0), trung học (1), đại học (2)
3 Thang đo khoảng
Ví dụ: Đặc trưng cho lứa tuổi
Số liệu điều tra về tổng thu nhập (triệu) của 100 hộ gia đình:
Ta có bảng phân phối tần số và tần suất như sau:
Trang 7x j <x i
njn
F∗(xi)còn được gọi là hàm phân bố thực nghiệm của mẫu
3 Đa giác tần số, tần suất
- Đa giác tần số là một đường gấp khúc mà các đoạn thẳng của nó nối các điểm(x1, n1),(x2, n2) (xk, nk)
- Đa giác tần suất là một đường gấp khúc mà các đoạn thẳng của nó nối các điểm(x1, f1),(x2, f2) (xk, fk)
Đ4 Thống kê
I Định nghĩa
Với mẫu ngẫu nhiên W = (X1, X2, Xn), ta mới chỉ có được một vài thông tin rời rạc
về biến ngẫu nhiên gốc X Vì vậy, nếu tổng hợp các biến ngẫu nhiên cùng phân phối Xi
lại thì theo luật số lớn sẽ bộc lộ những quy luật mới làm cơ sở nhận định về biến ngẫunhiên gốc X Việc tổng hợp mẫu dưới dạng một hàm nào đó của các thành phần mẫu Xi
Trang 8được gọi là một thống kê, kí hiệu G = f(X1, X2, Xn)
Do các Xi là các biến ngẫu nhiên nên G cũng là biến ngẫu nhiên tuân theo một quyluật phân phối xác suất nhất định Khi mẫu ngẫu nhiên nhận một giá trị cụ thể ω =(x1, x2, xn)thì G cũng nhận một giá trị cụ thể g = f(x1, x2, xn)
Ví dụ: Thống kê
G = X1+ X2+ + Xn
nCác thống kê đặc trưng của mẫu ngẫu nhiên được chia thành 3 loại:
-Các thống kê đặc trưng xu hướng trung tâm của phân phối của mẫu như: trung bìnhmẫu, trung vị
-Các thống kê đặc trưng cho độ phân tán của mẫu như: Phương sai, độ lệch chuẩn, khoảngbiến thiên,
-Các thống kê đặc trưng dạng phân phối
II Trung bình mẫu
Thống kê trung bình mẫu kí hiệu X cho bởi công thức
X = X1+ X2+ + Xn
nKhi mẫu ngẫu nhiên nhận giá trị cụ thể ω = (x1, x2, xn)thì trung bình mẫu cũng nhậngiá trị cụ thể
x = x1+ x2+ + xn
nGiả sử biến ngẫu nhiên gốc X có kì vọng toán E(X) = m và phương sai V (X) = σ2,
do các biến ngẫu nhiên Xi độc lập và có cùng phân phối với X nên dễ dàng chứng minh
được kì vọng E(X) = m, phương sai V (X) = σ 2
n và độ lệch chuẩnqV (X) = √σ
n
Độ lệch chuẩn thường được dùng để phản ánh sai số ước lượng nên còn được gọi là sai
số chuẩn của trung bình mẫu:
Se(X) = √σ
n+Ghi chú:Nếu mẫu được lấy theo phương thức không hoàn lại và n > 0, 1N thì các côngthức trên phải sử dụng hệ số hiệu chỉnh
Trung vị là giá trị nằm chính giữa chia các số liệu mẫu thành hai phần bằng nhau, kí hiệu
Trang 9L-giới hạn dưới của lớp chứa trung vị
n-kích thước mẫu
S-tổng tần số của các lớp đứng trước lớp chứa trung vị
nXd-tần số của lớp chứa trung vị
h-độ dài của lớp chứa trung vị
IV Khoảng biến thiên
Là sai lệch giữa giá trị lớn nhất và nhỏ nhất của mẫu, kí hiệu R: R = Xmax− XminNếu các số liệu mẫu được ghép lớp thì khoảng biến thiên là hiệu số giữa cận trên của lớpcuối cùng với cận dưới của lớp đầu tiên trong dãy phân phối các giá trị của mẫu
V Khoảng tứ phân vị
Nếu mẫu được chia thành 4 phần bằng nhau ta có tứ phân vị, tứ phân vị đầu Q1 là giá trịcủa mẫu cách đơn vị đầu tiên 1/4 đơn vị của mẫu, tứ phân vị thứ hai chính là trung vị, tứphân vị thứ ba Q3 là giá trị của mẫu cách đơn vị đầu tiên 3/4 số đơn vị của mẫu
Khoảng tứ phân vị kí hiệu IQR,
IQR = Q3− Q4
VI Tổng bình phương các sai lệch và độ lệch bình phương trung bình
Cho mẫu ngẫu nhiên W = (X1, X2, Xn)Tổng bình phương các sai lệch giữa các giátrị của mẫu và trung bình mẫu được kí hiệu SS
Trang 10Như vậy S2 phản ánh đúng giá trị phương sai tổng thể theo nghĩa kì vọng.
Ta cũng có: E(S∗2) = σ2
Thật vậy: E(S∗2) = E[1nPn
i=1(Xi− m)2] = n1E[Pn
i=1(Xi− m)2]E(S∗2) = n1 Pn
i=1V (Xi) = n1Pn
i=1V (X) = σ2
Trang 11Độ lệch chuẩn mẫu.
Kí hiệu S, là căn bậc hai của phương sai mẫu S =√S2
Với mẫu cụ thể: ω = (x1, x2, xn)
Ta có:
ms = 1n
n
X
i=1
(xi− x2) = x2− (x)2hoặc
ms = 1n
Trang 12IX Hệ số bất đối xứng
a3 =
Pn i=1
Trang 13Giả sử tổng thể kích thước N, trong đó có M phần tử mang dấu hiệu nghiên cứu Lấy ramẫu ngẫu nhiên kích thước n và thấy có X phần tử mang dấu hiệu nghiên cứu.
Tần suất mẫu là một thống kê, kí hiệu f là tỷ số giữa số phần tử mang dấu hiệu nghiêncứu trong mẫu và kích thước mẫu
f = XnNếu xem dấu hiệu nghiên cứu như một biến ngẫu nhiên tuân theo quy luật A(p), E(X)=p,V(X)=p(1-p), ta có:
E(f ) = p, V (f ) = p(1 − p)
nSai số chuẩn của tần suất mẫu là
Se(f ) = pp(1 − p)
√nNếu mẫu lấy theo phương pháp không hoàn lại thì sai số chuẩn là:
a Tính trung bình mẫu, phương sai, độ lệch chuẩn mẫu
b Giả sử biết trung bình tổng thể là 31(gr), tình phương sai s∗2
c Tính tần suất mẫu của số quả nặng trong khoảng từ 31 đến 35 gr
Trang 14Giả sử trên cùng một tổng thể phải nghiên cứu đồng thời hai dấu hiệu nghiên cứu, trong
đó dấu hiệu nghiên cứu thứ nhất có thể xem là biến ngẫu nhiên X, dấu hiệu nghiên cứuthứ hai là biến ngẫu nhiên Y Việc nghiên cứu đồng thời hai biến ngẫu nhiên trong tổngthể tương tự như việc nghiên cứu một biến ngẫu nhiên hai chiều
Mẫu ngẫu nhiên hai chiều kích thước n là tập hợp của n biến ngẫu nhiên độc lập(X1, Y1), (X2, Y2), (Xn, Yn) được thành lập từ biến ngẫu nhiên hai chiều (X, Y) cócùng quy luật phân phối xác suất với (X, Y) Kí hiệu:
W = [(X1, Y1), (X2, Y2), (Xn, Yn)]
Mẫu cụ thể:
Trang 15w = [(x1, y1), (x2, y2), (xn, yn)]
II Phương pháp mô tả mẫu ngẫu nhiên hai chiều
Giả sử từ tổng thể rút ra mẫu ngẫu nhiên kích thước n, trong đó thành phần X nhận cácgiá trị x1, x2, xh, thành phần Y nhận các giá trị y1, y2, yktrong đó các giá trị (xi, yj)xuấthiện với tần số nij Các giá trị xi, yj sắp xếp theo thứ tự tăng dần, ta có bảng phân phốitần số:
Y /X x1 x2 xi xh mj
y1 n11 n12 n1i n1h m1
y2 n21 n22 n2i n2h m2
yj nj1 nj2 nji njh mj
yk nk1 nk2 nki nkh mk
ni n1 n2 ni nh P = n
trong đó: ni là tổng tần số của mẫu mang giá trị xi của thành phần X, mj là tổng tần
số của mẫu mang giá trị yj của thành phần Y
Một số thống kê đặc trưng của mẫu ngẫu nhiên hai chiều
1 Bảng phân phối thực nghiêm của thành phần X:
Trang 16§6 Quy luËt ph©n phèi x¸c suÊt cña mét sè thèng kª
I BiÕn ngÉu nhiªn gèc ph©n phèi theo quy luËt chuÈn
Gi¶ sö biÕn ngÉu nhiªn gèc ph©n phèi chuÈn X ∼ N(µ, σ2)
Trang 17+ Thống kê trung bình mẫu:
E(X) = à, V (X) = σ
2
nSuy ra thống kê:
Do
S∗2 = 1n
n
X
i=1
(Xi− à)2Suy ra
s(n − 1)S2
II Hai biến ngẫu nhiên gốc cùng phân phối theo quy luật chuẩn
Giả sử xét cùng lúc hai tổng thể, ở tổng thể thứ nhất biến ngẫu nhiên gốc X1 ∼ N (à1, σ2
1),
ở tổng thể thứ hai biễn ngẫu nhiên gốc X2 ∼ N (à2, σ2
2) Từ hai tổng thể rút ra hai mẫungẫu nhiên độc lập có kích thước tương ứng n1, n2
+ Xét thống kê X1− X2 là hiệu hai trung bình mẫu:
Ta có:
E(X1− X2) = E(X1) − E(X2) = à1− à2
V (X1− X2) = V (X1) − V (X2) = σ
2 1
n1 −σ
2 2
à2
Trang 18+(n2− 1)S2
1
σ2 2
tuân theo quy luật phân phối khi bình phương (n1+ n2− 2)bậc tự do
trong đó
2 1
n1(Sn2
1 +Sn2
2)+ Do
χ21 = (n1− 1)S2
1
σ2 1
và χ2
2 = n2− 1)S2
1
σ2 2
Trang 19phân phối theo quy luật Fisher-Snedecor F (n1− 1, n2− 1).
III Biến ngẫu nhiên gốc tuân theo quy luật không - một
Giả sử dấu hiệu nghiên cứu có thể xem như biến ngẫu nhiên phân phối theo quy luậtA(p) Khi đó tần suất mẫu f sẽ phân phối theo quy luật nhị thức với các tham số đặctrưng là:
E(f ) = p, V (f ) = p(1−p)n
Nếu
n > 5 và |
q p 1−p −q1−p
p |
√
n < 0, 3thì tần suất mẫu sẽ phân phối xấp xỉ chuẩn với E(f) = p và V (f) = p(1−p)
n Do đó biếnngẫu nhiên
U = f − pSe(f ) =
(f − p)√
npp(1 − p)
sẽ phân phối xấp xỉ chuẩn hóa N(0, 1)
IV Hai biến ngẫu nhiên gốc cùng tuân theo quy luật không - một
Xét hai tổng thể, biến ngẫu nhiên chứa dấu hiệu nghiên cứu là X1 và X2, X1 ∼ A(p1),
X2 ∼ A(p2) Từ đó rút ra hai mẫu kích thước n1, n2 với tần suất mẫu tương ứng là f1,
p 1 (1−p 1 )
n 1 + p2 (1−p 2 )
n 2
∼ N (0, 1)
Trang 20Đ7.Suy diễn thống kê
Như phần trên ta thấy, quy luật phân phối xác suất của các thống kê đặc trưng mẫuphản ánh mối liên hệ chặt chẽ giữa các tham số của mẫu với các tham số tương ứng củatổng thể nghiên cứu Nếu đã biết quy luật phân phối xác suất hay các tham số đặc trưngcủa tổng thể thì có thể sử dụng các kết luận trên để suy đoán về tính chất của một mẫungẫu nhiên rút ra từ tổng thể đó, gọi là suy diễn thống kê
I Suy diễn về mẫu ngẫu nhiên rút ra từ tổng thể phân phối chuẩn
Giả sử trong tổng thể biến ngẫu nhiên X tuân theo quy luật chuẩn N(à, σ2), cần suy
đoán xem với một mức xác suất cho trước thì các thống kê mẫu ngẫu nhiên: trung bình,phương sai mẫu sẽ nằm trong khoảng nào Kí hiệu mức xác suất cho trước là (1 − α)
1 Suy diễn trung bình mẫu
Ta có thống kê
U = (X − à)
√n
σ ∼ N (0, 1)Với xác suất 1 − α ta tìm được α1 và α2 thỏa mãn α1+ α2 = α và tìm được các giá trịtới hạn u1−α 1 và uα 2 sao cho:
P (u1−α1 < U < uα2) = 1 − αHay
P (u1−α1 < (X − à)
√n
σ < uα2) = 1 − αChuyển vế ta được:
P (à − √σ
nuα1 < X < à + √σ
nuα2) = 1 − α+ Suy diễn tối thiểu: Nếu chọn α2 = 0, ta có
P (à − √σ
nuα < X) = 1 − α+ Suy diễn tối đa: Nếu chon α1 = 0, ta có:
P (X < à + √σ
nuα) = 1 − α+ Suy diễn đối xứng: Nếu chọn α1 = α2 = α/2, ta có:
Trang 21ví dụ 1:
Một công ty sản xuất mỳ ăn liền với trọng lượng đóng gói là biến ngẫu nhiên phân phốichuẩn có trọng lượng trung bình là 340g và độ lệch chuẩn 10 g Lấy ngẫu nhiên mẫu 16gói để kiểm tra
a Tìm xác suất để trọng lượng trung bình các gói mỳ nằm trong khoảng từ 335 đến 345g
b Tìm xác suất để trọng lượng trung bình các gói mỳ lớn hơn 340 g.(suy diễn tối thiểu)
c Với xác suất 0,99 thì trọng lượng trung bình các gói mỳ nằm trong khoảng nào xungquanh giá trị trung bình.(Suy diễn khoảng đối xứng)
(333, 55; 346, 45)
2 Suy diễn phương sai mẫu
Trang 22P ( σ
2
n − 1χ
2(n−1) 1−α 1 < S2 < σ
2
n − 1χ
2(n−1)
α 2 ) = 1 − α+ Suy diễn tối thiểu:
P (S2 > σ
2
n − 1χ
2(n−1) 1−α ) = 1 − α+ Suy diễn tối đa:
P ( σ
2
n − 1χ
2(n−1) α/2 < S2 < σ
2
n − 1χ
2(n−1) α/2 ) = 1 − α
Ví dụ 2:
Điểm thi một môn học của sinh viên là biến ngẫu nhiên X ∼ N(à = 6, 5; σ2 = 0, 81).Với một tập hợp ngẫu nhiên gồm 40 sinh viên và mức xác suất 0,95 cho trước
a Tìm một khoảng cho điểm trung bình của các sinh viên đó
b Phương sai và độ lệch chuẩn điểm số tối đa của các sinh viên đó?
b áp dụng công thức suy diễn tối đa phương sai mẫu S2
Trang 23P (S2 < 1, 158) = 0, 95Vậy phương sai điểm tối đa là 1,1158.
3 Suy diễn tần suất mẫu
Giả sử biến ngẫu nhiên X trong tổng thể phân phối không-một với tham số p Từ tổngthể rút ra mẫu kích thước n, với mức xác suất 1 − α cho trước, ta có thể suy diễn tần suấtmẫu f:
Ta đã có
U = (f − p)
√npp(1 − p) ∼ N (0, 1)
Ta có thể tìm được cặp giá trị α1 và α2 sao cho
P (u1−α1 < U < uα2) = 1 − α)Thay biểu thức U vào ta có:
Ví dụ 3:
Một lô hàng đủ tiêu chuẩn xuất khẩu nếu tỷ lệ sản phẩm loại một của lô hàng đó là 90%
Từ một lô hàng dự định xuất khẩu người ta lấy ngẫu nhiên 100 sản phẩm thì vói xác suất0,9 , trong đó phải có ít nhất bao nhiêu sản phẩm loại một thì đủ tiêu chuẩn xuất khẩu.Giải:
áp dụng công thức suy diễn tối thiểu ta có:
Trang 24⇒ X > 100.0, 86154 = 86, 154
Vậy phải có ít nhất 87 sản phẩm loại một trong lô hàng đó
Trang 25Chương 7: Ước lượng các tham số của biến ngẫu nhiên
Giả sử cần nghiên cứu tổng thể thông qua dấu hiệu nghiên cứu χ, và dấu hiệu này cóthể xem như một biến ngẫu nhiên X có quy luật phân phối xác suất xác định, thì giá trịcác tham số đặc trưng của biến ngẫu nhiên đó sẽ cho biết thông tin tổng hợp về tổng thể.Giả sử chưa xác định được giá trị của một tham số θ, việc xác định một cách gần đúnggiá trị của θ dựa trên những thông tin có được gọi là ước lượng tham số
Phương pháp mẫu cho phép giải quyết bài toán trên như sau: Từ tổng thể rút ra mẫu ngẫunhiên kích thước n và dựa vào đó xây dựng một thống kê ˆθ dùng để ước lượng θ Có haiphương pháp sử dụng để ước lượng là: Phương pháp ước lượng điểm và Phương pháp ướclượng bằng khoảng tin cậy
Đ1 Phương pháp ước lượng điểm
Phương pháp ước lượng điểm là dùng một giá trị tính toán trên mẫu để ước lượng chotham số θ Thông thường giá trị được chọn là một thống kê ˆθ nào đó của mẫu ngẫu nhiên.1.Định nghĩa:
Giả sử từ cần ước lượng tham số θ của biến ngẫu nhiên gốc X Từ mẫu W = (X1, X2 Xn).Chọn một thống kê ˆθ = f(X1, X2, Xn)tương ứng với tham số θ cần ước lượng Vớimột mẫu cụ thể, ta tính được giá trị ˆθ = f(x1, x2, xn) của thống kê ˆθ trên mẫu cụ thể
đó thì ước lượng của θ chính là giá trị ˆθ vừa tính
Thống kê ˆθ = f(X1, X2, Xn)gọi là hàm ước lượng
Để đánh giá chất lượng của ước lượng người ta đưa ra các tiêu chuẩn sau:
2.Các tiêu chuẩn lựa chọn hàm ước lượng
a Ước lượng không chệch
Thống kê ˆθ của mẫu được gọi là ước lượng không chệch của tham số θ của biến ngẫunhiên X nếu: E(ˆθ) = θ
Nếu E(ˆθ) 6= θ thì ˆθ gọi là ước lượng chệch của θ
Dựa vào các kết quả ở chương VI ta có thể rút ra một số kết luận:
- Trung bình mẫu X là ước lượng không chệch của kì vọng toán m
- Tần suất mẫu f là ước lượng không chệch của xác suất p của biến ngẫu nhiên gốc X
- Phương sai mẫu S2 và phương sai S∗2là các ước lượng không chệch của phương sai σ2
b Ước lượng hiệu quả:
Thống kê mẫu được gọi là ước lượng hiệu quả nhất của tham số θ của biến ngẫu nhiên
Trang 26gốc X nếu nó là ước lượng không chệch và có phương sai nhỏ nhất so với mọi ước lượngkhông chệch khác được xây dựng trên cùng một mẫu đó.
Ước lượng không chệch ˆθ1 là hiệu quả hơn ˆθ2 nếu V ( ˆθ1) < V ( ˆθ2)và độ hiệu quả của ˆθ1
θ = f (x1, x2, xn)được gọi là ước lượng hợp lý tối đa của θ nếu ứng với giá trị này của
Nếu tại điểm θ = ˆθ đạo hàm bậc hai âm thì tại đó lnL hay L đạt cực đại và ˆθ =
f (x1, x2, xn)là ước lượng hợp lý tối đa cần tìm của θ
Trang 27dp = 0 → p = xHơn nữa: d2lnL
P n i=1 (x i −à) 2
Giải tương tự trên ta có ước lượng hợp lý tối đa của à là X, còn của σ2 là MS
Phương pháp ước lượng điểm có một nhược điểm cơ bản là khi kích thước mẫu nhỏthì sai số ước lượng có thể rất lớn, mặt khác không thể đánh giá được khả năng mắc sailầm khi ước lượng là bao nhiêu Do đó khi kích thước mẫu nhỏ người ta thường dùngphương pháp ước lượng bằng khoảng tin cậy,
Đ2 Phương pháp ước lượng bằng khoảng tin cậy
Trang 28Xác suất 1 − α gọi là độ tin cậy của ước lượng, và I = G2 − G1 được gọi là độ dài củakhoảng tin cậy.
Phương pháp tiến hành:
Từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = (X1, X2, Xn)
từ đó xây dựng một thống kê G = f(X1, X2, Xn, θ) sao cho quy luật phân phối xácsuất của G hoàn toàn xác định và không phụ thuộc vào các đối số của nó Với độ tin cậy
1 − αcho trước có thể tìm được cặp giá trị α1 và α2 sao cho α1+ α2 = α, tương ứng tìm
được cặp giá trị Gα 1, Gα 2 thỏa mãn: P (G < Gα 1) = α1 và P (G > Gα 2) = α2
Khi đó ta có:
P (Gα1 < G < Gα2) = P (G > Gα1) − P (G > Gα2) = 1 − α1− α2 = 1 − αHay
P (G1 < G < G2) = 1 − αVới mẫu cụ thể w = (x1, x2, xn), ta tính được giá trị G1, G2 tương ứng là g1, g2 Nhưvậy với độ tin cậy, với mỗi mẫu cụ thể tham số θ của biến ngẫu nhiên gốc X sẽ nằmtrong khoảng (g1, g2)với khả năng mắc sai lầm α
2.Ước lượng kì vọng toán à của biến ngẫu nhiên phân phối theo quy luật chuẩn:2.1.Đã biết phương sai tổng thể σ2
P (U < u1−α1) = α1 và P (U > uα 2) = α2
Ta có:
P (u1−α1 < U < uα2) = 1 − (α1+ α2) = 1 − αhay
Trang 29Vậy với độ tin cậy 1 − α tham số à sẽ nằm trong khoảng (X −√σ
nuα2, X +√σ
nuα1)Vớivô số cặp α1, α2 ta tìm được vô số khoảng tin cậy tương ứng Trong thực tế người thường
sử dụng các trường hợp đặc biệt sau:
-Khoảng tin cậy bên phải: Lấy α1 = 0 và α2 = αthì uα 1 = u0 = ∞
Khi đó khoảng tin cậy là
(X − √σ
nuα; ∞) (1)Biểu thức (1) còn dùng để ước lượng giá trị tối thiểu của à
-Khoảng tin cậy bên trái: Lấy α2 = 0và α1 = αthì uα 2 = u0 = ∞
Khi đó khoảng tin cậy là
(−∞; X + √σ
nuα) (2)Biểu thức (2) còn dùng để ước lượng giá trị tối đa của à
-Khoảng tin cậy đối xứng: Lấy α1 = α2 = α/2, khi đó khoảng tin cậy là:
nuα/2 thì khoảng tin cậy là:(X − ; X + )
u2α/2] = [σ
2
2 0
u2α/2]Các khoảng tin cậy trên là các khoảng tin cậy ngẫu nhiên Với mỗi mẫu cụ thể ta tính
được giá trị cụ thể của trung bình mẫu x và các khoảng tin cậy cụ thể
Ví dụ 1 (bt7.16):
Doanh số của một cửa hàng là biến ngẫu nhiên phân phối chuẩn với độ lệch chuẩn là 2triệu/tháng Điều tra ngẫu nhiên doanh số của 600 cửa hàng có quy mô tương tự nhautìm được doanh số trung bình là 8,5 triệu Với độ tin cậy 95% hãy ước lượng doanh sốtrung bình của các cửa hàng thuộc quy mô đó
Giải:
Trang 30Ta có: Trung bình mẫu x = 8, 5, kích thước mẫu n=600, σ = 2, 1 − α = 0, 95 suy raα/2 = 0, 025 và uα/2 = u0,025 = 1, 96
Khoảng tin cậy đối xứng là:
(8, 4199; 8, 5800)
Độ chính xác = √1
600.1, 96 = 0, 08Chú ý:
-Khi tăng kích thước mẫu n lên, giữ nguyên độ tin cậy thì giảm đi tức là độ chính xáccủa ước lượng tăng lên
-Khi tăng độ tin cậy, giữ nguyên kích thước mẫu thì giá trị tới hạn chuẩn tăng lên làmcho độ chính xác của ước lượng giảm đi
* Nếu mẫu được chọn theo phương thức không hoàn lại từ tổng thể hữu hạn và n>0,1Nthì Se(X) sẽ nhân thêm hệ số hiệu chỉnh, do đó thống kê G trở thành
G = U = X − à
Se(X) =
X − àq
N −n
N −1.σn22.2.Chưa biết phương sai tổng thể σ2
Ta chọn thống kê
G = T = (X − à)
√nStrong đó S là độ lệch chuẩn mẫu, thống kê G phân phối theo quy luật Student với n-1 bậc
tự do
Trang 31Tương tự trên ta tìm được hai giá trị tới hạn:
nt
(n−1) α/2 )-Khoảng tin cậy bên phải:
(X − √S
nt
(n−1)
α ; ∞)-Khoảng tin cậy bên trái:
*Kích thước mẫu tối thiểu sao cho với độ tin cậy (1 − α) cho trước, độ dài khoảng tincậy không vượt quá I0 = 20:
n ≥ [S
2
2 0
t2(n−1)α/2 ]
Ví dụ 1(bt7.19):
Có số liệu về trọng lượng của một loại trứng gà như trong bảng Bằng khoảng tin cậy đốixứng, hãy ước lượng trọng lượng trung bình của loại trứng gà này với độ tin cậy 0,95