1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Phân tích liên tiếp

83 206 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 83
Dung lượng 476,79 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

7 2 PHÂN TÍCH LIÊN TIẾP: KIỂM ĐỊNH GIẢ THIẾT ĐƠN 11 2.1 Tiêu chuẩn liên tiếp tỉ số xác suấtSPRT.. Trong luậnvăn này tác giả sẽ trình bày về thống kê liên tiếp, được dùng để xử lí dữ liệu

Trang 1

Mục lục

1.1 Giới thiệu về phân tích liên tiếp 5

1.2 Thí dụ: Kiểm tra sản phẩm 7

1.2.1 Phân phối cỡ mẫu 7

2 PHÂN TÍCH LIÊN TIẾP: KIỂM ĐỊNH GIẢ THIẾT ĐƠN 11 2.1 Tiêu chuẩn liên tiếp tỉ số xác suất(SPRT) 11

2.2 SPRT: Kết thúc hữu hạn và bị chặn 13

2.3 Hàm OC (θ) 17

2.4 Số trung bình mẫu 20

2.5 Đồng nhất thức cơ bản của Wald 28

2.5.1 Ứng dụng của đồng nhất thức cơ bản 28

2.6 Các cận trên và cận dưới của số trung bình mẫu 31

3 PHÂN TÍCH LIÊN TIẾP: KIỂM ĐỊNH CHO GIẢ THIẾT HỢP 35 3.1 Phương pháp hàm trọng lượng 35

3.1.1 Ứng dụng của phương pháp hàm trọng lượng 36

3.2 Tiêu chuẩn liên tiếp t và t2 37

3.2.1 Sự khai triển tiệm cận đều và sự nghịch đảo của tích phân 40 3.2.2 Tiệm cận chuẩn của thống kê T 41

3.2.3 Tiêu chuẩn liên tiếp t 45

Trang 2

3.2.4 Tiêu chuẩn liên tiếp t2 (tiêu chuẩn hai phía) 46

4 ƯỚC LƯỢNG LIÊN TIẾP 49 4.1 Các khái niệm cơ bản 49

4.2 Tính đủ và hoàn toàn đầy đủ 50

4.3 Cận dưới Cramer-Rao 59

4.4 Quy trình hai bước 64

4.4.1 Quy trình Stein cho ước lượng trung bình của một phân phối chuẩn với phương sai chưa biết 64

4.4.2 Quy trình ước lượng hiệu của hai trung bình 68

4.4.3 Quy trình cho ước lượng trung bình chung 70

4.4.4 Khoảng tin cậy chiều dài cố định dựa trên SPRT 75

KẾT LUẬN 82

Tài liệu tham khảo 83

Trang 3

Lời nói đầu

Ngày nay đi cùng với sự phát triển của xã hội là sự gia tăng nhu cầu về việcứng dụng các phương pháp thống kê toán để phân tích các số liệu thống kê thuđược trong các lĩnh vực của khoa học tự nhiên, kinh tế và xã hội Trong luậnvăn này tác giả sẽ trình bày về thống kê liên tiếp, được dùng để xử lí dữ liệukhi số lượng các quan trắc là không cố định

Luận văn được chia thành bốn chương:

Chương 1: Mở đầu Chương này giới thiệu chung về phương pháp phân tíchliên tiếp trong thống kê, đặc điểm cơ bản của phân tích liên tiếp, và ứng dụngcủa nó trong kiểm tra sản phẩm

Chương 2: Phân tích liên tiếp: kiểm định giả thiết đơn Nội dung củachương này là sử dụng phân tích liên tiếp để kiểm định bài toán giả thiết đơn,đối thiết đơn Đưa ra cách xây dựng tiêu chuẩn liên tiếp tỉ số xác suất (SPRT)

và các ví dụ minh họa, chỉ ra tính hữu hạn, bị chặn của SPRT Sau đó xét cáchàm OC, hàm ASN, và đồng nhất thức cơ bản của Wald

Chương 3: Phân tích liên tiếp: kiểm định cho giả thiết hợp Nội dungchương này là ứng dụng của SPRT trong kiểm định giả thiết hợp, đưa ra phươngpháp hàm trọng lượng ( Phân phối tiên nghiệm ) để xây dựng một SPRT tối ưu

và các ứng dụng của phương pháp hàm trọng lượng Chương này cũng đưa racác tiêu chuẩn liên tiếp t và t2 và các tính chất của nó

Chương 4: Ước lượng liên tiếp Chương này bao gồm các khái niệm cơ bảntrong ước lượng liên tiếp, nghiên cứu tính đủ và đầy đủ, cận dưới Cramer - Rao,quy trình hai bước Và cách xác định khoảng tin cậy độ dài cố định dựa trênSPRT

Luận văn này được thực hiện tại trường Đại Học Khoa Học Tự Nhiên - ĐạiHọc Quốc Gia Hà Nội, dưới sự hướng dẫn nhiệt tình của GS.TSKH Đặng HùngThắng Thầy đã dành nhiều thời gian hướng dẫn cũng như giải đáp các thắc

Trang 4

mắc của tôi trong suốt quá trình làm luận văn Tôi muốn bày tỏ lòng biết ơnsâu sắc đến thầy.

Qua đây, tôi xin gửi tới quý thầy cô Khoa Toán-Cơ-Tin học, Trường Đại họcKhoa học Tự nhiên, Đại học Quốc gia Hà Nội, cũng như các thầy cô đã thamgia giảng dạy khóa cao học 2011- 2013, lời cảm ơn sâu sắc nhất đối với công laodạy dỗ trong suốt quá trình học tập của tôi tại Nhà trường

Tôi xin cảm ơn gia đình, bạn bè và các bạn đồng nghiệp thân mến đã quantâm, tạo điều kiện và cổ vũ, động viên tôi để tôi hoàn thành tốt nhiệm vụ củamình

Hà Nội, tháng 08 năm 2014

Tác giả luận văn

Lê Thị Bích Ngọc

Trang 5

Chương 1

MỞ ĐẦU

1.1 Giới thiệu về phân tích liên tiếp

Phân tích liên tiếp khác với các quy trình thống kê khác trong đó cỡ mẫu làkhông cố định trước Người thí nghiệm chọn một dãy các quan sát (hoặc một

số cố định các quan sát) ở một thời điểm và quyết định xem: ngừng lấy mẫu

và đưa ra một quyết định hoặc là tiếp tục lấy mẫu và đưa ra quyết định sau.Những bài toán ra quyết định mà trong đó người thí nghiệm có thể liên tục thayđổi phương pháp xử lí thì sẽ ở mức khó hơn, và gọi là bài toán thiết kế liên tiếp.Chẳng hạn xét bài toán sau

Bài toán 1.1: Nếu ta muốn so sánh vài loại thuốc khác nhau hoặc các phươngpháp điều trị(như trong kiểm tra liên tiếp các loại thuốc ung thư)để biết có nêngiảm một số loại thuốc ra khỏi giai đoạn đầu của cuộc thử nghiệm, nếu như kếtquả những loại thuốc này là kém hơn so với các loại thuốc khác

Vậy một nét đặc trưng cơ bản của phân tích liên tiếp đó là số quan sát cần tìm

để kết thúc thí nghiệm là một biến ngẫu nhiên Vì nó phụ thuộc vào kết quả củacác quan sát

Phương pháp liên tiếp giúp ta có thể đưa ra dự đoán sớm hơn là dùng phươngpháp cỡ mẫu cố định

Trong thí nghiệm liên tiếp ta cần xác định:

1 Kích cỡ mẫu ban đầu

Trang 6

2 Một quy tắc cho sự kết thúc thí nghiệm.

3 Số lượng các quan sát được làm thêm nếu thí nghiệm tiếp tục

4 Một quy tắc quyết định cuối cùng

Trong những thí nghiệm này chỉ có số lượng các quan sát là phụ thuộc liên tiếp,đòi hỏi định lý đơn giản và sẽ áp dụng chung, hơn nữa trong bài toán thiết kếliên tiếp không chỉ có số phép thử mà cả số phương pháp xử lí cũng phụ thuộcliên tiếp

Nếu thí nghiệm vẫn tiếp tục cho đến khi chúng ta quan sát X1, , Xn , mộttiêu chuẩn liên tiếp là hoàn toàn xác định bởi các tập rời nhau R0m, R1m và Rcm

∈ Rn - không gian Euclid m chiều với m = 1,2 nếu X1, , Xn phụ thuộc vào

R0m, ta chấp nhận giả thiết H, bác bỏ H khi nó phụ thuộc vào Rm1 Và ta tiếptục lấy mẫu nếu nó nằm trong Rcm

Bởi vì các tập trên là rời nhau và hợp của chúng là Rm suy ra chỉ cần xácđịnh hai tập bất kì trong ba tập đó Vấn đề cơ bản là lựa chọn một tập thíchhợp trong hai tập này Tiêu chuẩn lựa chọn tập được quyết định bởi đặc trưng

sử dụng(OC) và cỡ mẫu trung bình(ASN), những hàm này sẽ được xây dựngnhư sau:

Giả sử rằng hàm phân bố cơ bản là được chỉ ra bởi một tham số giá trị thực vàgiả sử các nhà thống kê có thể lựa chọn giữa hai giả thiết H0 và H1 Hàm OC(θ)

là xác suất chấp nhận H0 khi θ là giá trị thực của tham số Với mong muốn rằnghàm OC phải là các giá trị cao của θ sao cho phù hợp với H0 và giá trị thấp của

θ sao cho phù hợp với H1 Ví dụ người ta có thể yêu cầu OC(θ) ≥ 1 − α, ∀θ ∈ H0

và OC(θ) ≤ β, ∀θ ∈ H1, trong đó α và β là các xác suất phạm sai lầm Một tiêuchuẩn liên tiếp S được gọi là chấp nhận được nếu hàm OC của nó thỏa mãn tiêuchuẩn trên

Như đã nói ở trên số lượng các quan sát cần tìm trong phân tích liên tiếp làmột biến ngẫu nhiên và quan trọng hơn là giá trị kì vọng của nó khi θ là mộttham số giá trị thực Giá trị kì vọng này là hàm điển hình của θ và được gọi làhàm ASN(hàm cỡ mẫu trung bình) Với mong muốn có một hàm ASN nhỏ với

α, β cho trước, và cỡ mẫu dự kiến là nhỏ hơn so với quy trình cỡ mẫu cố định.Cho ν(θ|D) là kí hiệu của cỡ mẫu kì vọng của quy trình D khi θ là giá trị thực.Nếu D0 là chấp nhận được và ν(θ|D) = M inDν(θ|D) khi đó D0 được xem làmột tiêu chuẩn tốt đều nhất Tuy nhiên, nói chung là không tồn tại tiêu chuẩn

Trang 7

tốt đều nhất Tiêu chuẩn này có thể tìm thấy trong một phân tích liên tiếp tối

ưu, khi H0 và H1 là những giả thiết đơn Phép kiểm định theo tỉ số xác suấtliên tiếp của Wald cho ASN nhỏ nhất với cả hai H0 và H1

Hiệu quả của quy trình D tại θ được xác định bằng tỉ lệ số lượng mẫu dựkiến nhỏ nhất của D tại θ với số lượng mẫu dự kiến của D tại θ Wald’s SPRT

có hiệu quả bằng 1 với cả hai giả thiết H0 và H1

Phân tích liên tiếp sớm nhất là phương pháp lấy mẫu đôi của Dodge vàRomig trong kiểm tra chất lượng sản phẩm Lấy n sản phẩm và bác bỏ mẫunày nếu như số lượng phế phẩm trong mẫu ≥ c (và chấp nhận nếu < c ) Mộtphương pháp khác đó là : lấy mỗi sản phẩm một cách riêng biệt tại các thờiđiểm khác nhau, bác bỏ những mẫu mà số lượng phế phẩm trong mẫu ≥ c, vàchấp nhận những mẫu mà số lượng thành phẩm trong mẫu ≥ n − c + 1, cỡ mẫucần thiết ít nhất là c và nhiều nhất là n Phương pháp này gọi là kiểm tra rútngắn

1.2.1 Phân phối cỡ mẫu

Kí hiệu N là cỡ mẫu ngẫu nhiên cần thiết để kết thúc thí nghiệm, khi đó:

Trang 8

!(1 − θ)m−c

!(1 − θ)r

!

Người ta thường ưa dùng kế hoạch lấy mẫu rút ngắn hơn là kế hoạch lấy mẫuđơn tương đương bởi vì E(N|θ)của kế hoạch lấy mẫu rút ngắn là nhỏ hơn cỡmẫu của kế hoạch lấy mẫu đơn Xét trường hợp c = 1:

Trang 9

E (N |θ) tăng với y do đó E (N |θ) giảm với θ khi c = 1 Tuy nhiên điều nàykhông đúng với c > 1.

!

θr (1.11)

Trang 10

trừ (1.11) cho (1.10), sau đó chia cả 2 vế cho (1 − θ)n−c ta được:

c−1

P

r=0

r + n − cr

Trang 11

Chương 2

PHÂN TÍCH LIÊN

TIẾP: KIỂM ĐỊNH

GIẢ THIẾT ĐƠN

2.1 Tiêu chuẩn liên tiếp tỉ số xác suất(SPRT)

Neyman và Pearson (1933) đã cung cấp một phương pháp xây dựng tiêuchuẩn mạnh nhất để kiểm định giả thiết đơn, đối thiết đơn

Giả sử ta có hàm mật độ xác suất f (x0, θ) và ta muốn kiểm định: H0 : θ =

Qn i=1f (Xi, θ0)Khi đó tiêu chuẩn mạnh nhất để kiểm định H0|H1 thu được bằng cách bác bỏ

H0 nếu Λn ≥ K và chấp nhận H0 nếu Λn < K.Với K được xác định bởi mức ýnghĩa

Trang 12

Wald đưa ra tiêu chuẩn liên tiếp tỉ số xác suất: chọn hai hằng số A, B saocho: 0 < B < A <∞ Chấp nhận H0 nếu Λn ≤ B, bác bỏ H0 nếu Λn ≥ A, tiếptục lấy mẫu nếu B < Λn < A khi người thí nghiệm tiến hành đến bậc n (n =1,2, )

Ví dụ 2.1.2 Cho phân phối mũ: f (x, θ) = θ−1exp (−x/θ) , x > 0, θ > 0

ta muốn kiểm định: H0 : θ = θ0|H1 : θ = θ1 Khi đó:

θ0(1 − θ1)



< ln A

Trang 13

m là số lượng phế phẩm hoặc thành phẩm (Xi = 1) trong số n quan sát Khi

đó tại bước thứ n miền để tiếp tục lấy mẫu là:

c0+ sn < m < c1+ sn

Trong mặt phẳng của n và m Miền tiếp tục lấy mẫu nằm giữa 2 đường cóchung hệ số góc và chắn c0 và c1 Mỗi điểm mẫu (n, m) khi phác họa trên mặtphẳng này có tọa độ nguyên Hai quy trình được xác định bởi cặp chắn (c0, c1)

và (c∗0, c∗1) là tương đương nếu không có điểm (n, m) (0 ≤ m ≤ n) nào giữa cácđường y = c0+ sx và y = c0∗+ sx và giữa các đường y = c1+ sx và y = c1∗+ sxAnderson và Friedman(1960) chỉ ra rằng nếu hệ số góc là hữu tỉ thì đó là một

số đếm được của SPRT và nếu hệ số góc là vô tỉ thì là một số không đếm được

Lý do ta dùng một phân tích liên tiếp đó là : ta có thể kết thúc thí nghiệmsớm hơn là dùng quy trình cỡ mẫu cố định Khi đó chúng ta cần đảm bảorằng quy trình liên tiếp sẽ kết thúc hữu hạn với xác suất 1 Ta có kết quả củaStein(1946) và Wald(1947)

Định lí 2.2.1 Cho Z = lnnf (X,θ1 )

f (X,θ0)

o Trong đó ta muốn kiểm định H0 : f (x) =

f0(x)|H1 : f (x) = f1(x) khi đó Wald’s SPRT kết thúc hữu hạn với xác suất 1,điều kiện P (Z = 0) < 1

Khi ta làm việc với một họ những mật độ được chỉ ra bởi một tham số

θ , Z = lnnf (X,θ1 )

f (X,θ 0 )

o Trong đó f (x; θ0), f (x; θ1) lần lượt là hàm mật độ củanhững giả thiết H0 và H1 Nói chung có thể chỉ ra rằng nếu N là thời điểmdừng của SPRT: P (N > kr) ≤ (1 − qr)k Trong đó k và r là số nguyên dương

do P (Z = 0) < 1, ∃ d > 0 và q > 0 sao cho: hoặc P (Z > d) ≥ q hoặc

Trang 14

P (Z < −d) ≥ q.

Ở trường hợp trước chọn số nguyên r: r d > ln BA

Ở trường hợp sau chọn số nguyên r : −r d < − ln AB

Bây giờ {N = ∞} = ∩∞n=1{N > n} với {N > n} là đơn điệu giảm Do đó:

P (N là không hữu hạn) = lim

n→∞P (N > n) = lim

k→∞(N > kr)Chú ý rằng P (N > n) là dãy các xác suất đơn điệu giảm và bị chặn dưới, do đó

có một giới hạn Giới hạn này cũng là giới hạn của bất kì dãy con nào, đặc biệtdãy bao gồm tất cả mọi phần tử thứ r của dãy ban đầu Như vậy:

lim

k→∞P (N > kr) ≤ lim

k→∞(1 − qr)k = 0Tiếp theo ta sẽ tìm hiểu xem liệu có thể tìm A và B một cách tường minh với

Giả sử, không mất tổng quát rằng: PHi(∪Ek ∪ ∪Fk) = 1, i = 0, 1

P (N = ∞) = 0 được thỏa mãn khi P(Z = 0 )< 1 (xem định lý 2.2.1) Chú ýrằng Z sẽ đồng nhất bằng 0 nếu và chỉ nếu f1(x) và f0(x) đồng nhất tại mỗi x.Điều kiện yếu P (Z = 0) < 1 sẽ được thỏa mãn với điều kiện biến ngẫu nhiên X

là không tập trung trên tập của những điểm x mà có f1(x) = f0(x) Khi đó :

Trang 15

r  25

n

Trang 16

Tại bước thứ n ta làm thêm một quan sát nếu:

n ln(5/2)

2 ln 2 − 1 < r < n ln(5/2)

2 ln 2 + 1

0, 65n − 1 < r < 0, 65n + 1Với n = 1 : −0, 35 < r < 1, 65, quan sát thứ nhất có 1 phế phẩm, r nằm trongmiền tiếp tục lấy mẫu

Ví dụ 2.2.6 (Quy trình cỡ mẫu cố định cho ví dụ 2.2.5) Nếu một mẫu cố định

cỡ n được sử dụng trong ví dụ (2.2.5) Ta sử dụng phương pháp xấp xỉ phânphối chuẩn để kiểm định θ = θ0|θ = θ1

P (r > k|θ0 = 1

2) = 0, 2

P (r ≤ k|θ1 = 0, 8) = 0, 2Tức là:

1 − Φ k − n/2

(n/4)1/2



= 0, 2

⇔ Φ k − n/2

(n/4)1/2



= 0, 8 = Φ(0, 84)

Trang 17

Và :

Φ k − 0, 8n(0, 16n)1/2



= 0, 2 = Φ(−0, 84)hay:

số A, B cho trước với B < 1 < A, để kiểm định : H0 : f = f0(x) = f (x; θ0)|H1 :

f = f1(x) = f (x; θ1) Nếu θ0 và θ1 chỉ là 2 trạng thái của tự nhiên (states ofnature), khi đó không có điểm nào trong hàm OC (θ) đang xét Tuy nhiên nếugiả thiết kiểm định trên là một giả thiết đơn giản, ví dụ: H0 : θ ≤ θ∗|H1 : θ ≥ θ∗khi đó người ta sẽ quan tâm đến OC(θ) ∀ giá trị có thể của θ Cho θ là cố định

và xác định như một hàm mà trong đó θ là giá trị của h ( 6= 0) và :

Kỳ vọng này là 1 khi h = 0 nhưng có một giá trị của h mà giá trị của nó cũng

là 1 Chẳng hạn, h = 1 nếu θ = θ0 và h = −1 nếu θ = θ1 Công thức trên có thểviết như sau :

Trang 19

H0), một điểm trên đường cong OC Đẳng thức giữa h và θ không cung cấp mộtgiá trị rõ ràng của θ khi h = 0, vì biểu thức này thỏa mãn ∀θ Tuy nhiên, người

ta có thể ước lượng được giới hạn của OC(θ) khi h → 0 bằng cách sử dụng luậtI’hospital Như vậy:

Trang 20

Dễ thấy : lim

h→∞θ = 0; lim

h→−∞θ = 1Nếu θ0 = 0, 5; θ1 = 0, 8 và α = β = 0, 01 Ta được:

Cỡ mẫu cần thiết để quyết định kế hoạch lấy mẫu liên tiếp hoặc lấy mẫu

đôi là một biến ngẫu nhiên N Sự phân phối của biến ngẫu nhiên này phụ thuộc

vào phân phối thực của các quan sát trong suốt quá trình lấy mẫu Đặc biệt, ta

quan tâm đến ước lượng E(N), cỡ mẫu trung bình (ASN)

Trong mục (2.2) đã chỉ ra rằng với tiêu chuẩn SPRT, N là hữu hạn với xác suất

1, do đó N có thể nhận giá trị 1,2,3 với các xác suất P1, P2, và P Pi = 1

Mô men của N không thể tính toán rõ ràng Tuy nhiên, người ta có thể chỉ ra

rằng (giả sử P (Z = 0) < 1): E(Ni) < ∞, ∀i Xét:

Trang 21

Ta có thể thấy dãy trong ngoặc hội tụ bằng cách sử dụng tiêu chuẩn tỉ số với

0 < q ≤ 1 tỉ số của số hạng thứ n + 1 và số hạng thứ n trong dãy trên là

Eθ1(ln Λn) = (ln B) β + (ln A) (1 − β).tuy nhiên

ln ΛN = Z1+ Z2+ + Znmột tổng ngẫu nhiên của các biên ngẫu nhiên độc lập, cùng phân phối, với :

Trang 22

khi đó biến cố (N = i) được quyết định bởi ràng buộc trên Z1, Z2, Zi và do đó

Sự hoán vị của tổng và kì vọng là có thể xảy ra nếu dãy là chắc chắn hội tụ.Xét:

Eθ0(N )=. α ln A + (1 − α) ln B

Trang 23

Eθ1(N )=. (1 − β) ln A + β ln B

Ví dụ 2.4.1 Cho X là phân phối chuẩn với giá trị trung bình: θ và Var(X) =

1, Cho θ0 = 0, θ1 = 1; α = β = 0, 01 Khi đó: A = 99 = B1, lnA = 4, 595

- Tại bước thứ n chấp nhận H0 nếu X(1) < 1 và X(n) < 2 khi đó (Λn = 0)

- Tại bước thứ n làm thêm một quan sát nếu 1 ≤ Xi ≤ 2(i = 1, 2 ) khi đó

Λn = 1

- Tại bước thứ n bác bỏ H0 nếu X(1) > 1 và X(n) > 2, Λn = ∞

Trang 24

Kí hiệu N là cỡ mẫu ngẫu nhiên cần thiết Khi đó:

P0(n) =P (N = n|H0)

=P N = n, bác bỏ H0|H0 + P N = n, chấp nhận H0|H0

=P 1 ≤ Xi ≤ 2, i ≤ n − 1, X(1) > 1vàX(n) > 2|H0+ P 1 ≤ Xi ≤ 2, i ≤ n − 1, X(1) < 1vàX(n) < 2|H0

=P 1 ≤ Xi ≤ 2, i ≤ n − 1, X(n) > 2|H0+ P 1 ≤ Xi ≤ 2, i ≤ n − 1, X(n) < 1|H0

= 12

n−1

 12

+ 12

n−1

(0)

= 12

=P 1 ≤ Xi ≤ 2, i ≤ n − 1, X(n) > 2|H1+ P 1 ≤ Xi ≤ 2, i ≤ n − 1, X(n) < 1|H1

= 12



= 12

n

E(N |H0) =P∞

n=1n 12n = 2, và E (N |H1) = 2Vì

Trang 25

Momen cao hơn của tổng dừng ngẫu nhiên được bắt nguồn bởi Chow, sauđây ta sẽ phát biểu kết quả của họ cho moment thứ 2.

Cho (Ω, F, P ) là không gian xác suất và Z1, Z2, là một dãy các biến ngẫunhiên trong Ω Một biến dừng (của dãy {Zi}) là một biến ngẫu nhiên với giá trịnguyên dương Như vậy biến cố {N = n} chỉ phụ thuộc (Z1, Z2, Zn) ∀n ≥ 1Cho :

Định lí 2.4.3 Cho Z1, Z2, là độc lập với E(Zn) = 0, E|Zn| = an, E(Zn)2 =

Trang 26

Ví dụ 2.4.5 Cho bài toán Bernoulli của θ0|θ1 ta thấy rằng:

1 − θ0



= θ ln 9 − ln 5

Khi h → 0, θ và π(θ) dần đến vô hạn E(Z) và E(ln Λ) tiến đến 0 Nhưng

tỉ số của chúng thì có thể được tính bằng cách ước lượng giới hạn của nó khi h

Trang 27

h− 1

9h− 1 =

ln 5ln9

= −(ln 19)2(ln 5) ln5/9

= (2, 9444)

2

(1, 6094) (0, 5878)

= 9, 16Cách khác:

Vì Eθ(Z) = 0 khi h = 0, chúng ta sử dụng phương trình Wald thứ hai, thu được:



Ah− 1

Ah− Bh

(ln B)2 = (ln A)2 = 8, 6697

Trang 28

Nó đúng với giá trị trong bảng (2.4.1).

Trong phần này ta sẽ đưa ra một đồng nhất thức của Wald, nó đóng mộtvai trò quan trọng trong những thời điểm phát sinh của cỡ mẫu cần thiết để kếtthúc SPRT cho bài toán kiểm định H0 : θ = θ0|H1 : θ = θ1 X có hàm mật độxác suất là f (x; θ)

Lấy vi phân 2 lần và đặt t = 0, ta được:

t=0

= 0

Trang 29

Bổ đề 2.5.2 Nếu E(Z) = 0, khi đó h = 0, với điều kiện P (Z = 0) < 1(trong

đó, Z không là một biến ngẫu nhiên tầm thường hầu chắc chắn) và vi phân củaE(eZh) dưới dấu tích phân là chấp nhận được

Chứng minh Dưới giả định của bổ đề :

dd(h)(1) = 0 =

dd(h)E(e

Trang 30

⇒ từ bổ đề (2.5.2) ta có h = 0 Do đó:

E0,5(N ) = (2, 9444)

2

E0,5(Z)2 = (2, 9444)2 = 9Cũng như trong ví dụ (2.4.5):

Wald đã thu được công thức chính xác cho hàm OC và hàm ASN khi

Z = lnhf (X;θ1 )

f (X;θ 0 )

ichỉ nhận những giá trị trong số lượng hữu hạn của các tíchphân bội của hằng số d Ferguson(1967) có thể thu được biểu thức chính xáccho các xác suất phạm sai lầm và kì vọng thời điểm dừng khi X có mật độ:

f (x; θ) = 1

2(1 − θ

2)e(−|x|+θx), |θ| < 1

Trang 31

Giả sử ta muốn kiểm định H0 : θ = θ0|H1 : θ = θ1 với θ1 > θ0 Kemperman(1961)

đã thu được cận trên và cận dưới cho xác suất phạm sai lầm được cho bởi:

(1 − B) A − 2B /B(A − 2B) (1 − B) /AB = AXét cận trên của β/(1 − α) ta có:

≤ B(A − )

A − 1 = B +

(1 − )B

A − 1Kết quả này gợi ý cho ta điều chỉnh xấp xỉ Wald đến các giá trị biên A và Bnhư sau:

Trang 32

Khi E(N ) tồn tại, công thức : E(N ) = E(SN)/E(Z) là đúng và có ý nghĩa.M.N Ghosh(1960) đã chỉ ra rằng E(N ) là bị chặn nếu điều kiện chính được thỏamãn.

Định lí 2.6.1 Cho biến ngẫu nhiên Z sao cho E(Z) < 0 Khi đó E(N ) là bịchặn nếu:

Cho c, k : x > k > 0, c > 0 Và G(z) là hàm phân phối của Z

Trường hợp đặc biệt 1: Nếu Z là phân phối chuẩn với giá trị trung bình

µ, Var Z = σ2 khi đó ta có thể đặt c = 2/3 và k = 2σ − µ

Trường hợp đặc biệt 2: Nếu Z là một phân phối mũ bình phương tiêuchuẩn (standard double exponential distribution), khi đó ta có thể đặt: c =

1, k = 1

Tiếp theo xét cận dưới cho ASN cần tìm, bởi một tiêu chuẩn liên tiếp bất

kỳ Cho X1, X2, là một dãy các biến ngẫu nhiên độc lập cùng phân phối có hàmmật độ f (x; θ) với θ ∈ Ω Giả sử ta muốn kiểm định: H0 : θ ∈ ω0|H1 : θ ∈ ω1

ω0 và ω1 là hai tập rời nhau của Ω Kí hiệu D là tiêu chuẩn liên tiếp tùy ý của

H0 và H1 Cho 0 < α, β < 1 sao cho:

Pθ D chấp nhận H1 ≤ α, nếu θ ∈ ω0và:

Pθ D chấp nhận H0 ≤ β, θ ∈ ω1 (2.14)Khi đó Hoeffding(1953) thu được:

Trang 33

Chú ý rằng bất đẳng thức (2.15) và (2.16) ta thu được bởi Wald khi H0 và H1

là các giả thiết đơn

Trường hợp đặc biệt: Giả sử rằng:

f (x; θ) = (2π)−1/2exp−(x − θ)2/2

ω0 = θ : θ ≤ −δ và ω1 = θ : θ ≥ δKhi đó:

e1(θ) =

((θ − δ)2/2 nếu θ < −δ

N là thời điểm dừng của tiêu chuẩn liên tiếp

Định lí 2.6.2 Cho tiêu chuẩn liên tiếp kết thúc với xác suất 1 dưới mỗi f0, f1, f2.Giả sử rằng E2(N ) < ∞ Với E2(N ) là kì vọng ở thời điểm dừng khi f = f2.Hơn nữa cho: α + β < 1 khi đó:

Trang 34

τ2 =

Z{ln [f1(x)/f0(x)] − g0+ g1}2f2dx (2.19)

Trường hợp đặc biệt: cho f0, f1, f2 là mật độ chuẩn với phương sai = 1

và giá trị trung bình lần lượt là: −ξ, ξ, 0(ξ > 0) Khi đó:

Chú ý rằng khi α là nhỏ:

n[1 − 2 ln(2α)]1/2− 1o2 = −2 ln α + Oh(−2 ln α)1/2i

Nó có thể thu được bằng phép bình phương thứ nhất,sau đó sử dụng BĐT:(−2 ln a)1/2− (1 − 2 ln 2)1/2 ≤ [1 − 2 ln(2α)]1/2 ≤ −(2 ln α)1/2+ (1 − 2 ln 2)1/2Tiếp theo xét SPRT, kết thúc ngay khi: 2ξ|SN| > ln A(> 0)

Vì Zi = 2ξXi, ở đây:

Sn = X1+ + Xn(ln A)2 ≤ 4ξ2E2(SN2) = 4ξ2E2(N ) (vì E2(X2) = 1)

và A = (1 − α)/α Do đó:

E2(N ) = ξ−2 1

2ln

 (1 − α)α

2

(2.21)Bảng (1.6.1)Giá trị của E2(N ) và của cận dưới trong 2.20 với ξ = 0, 1

Cỡ mẫu cố định 541,2 270,6 164,3 70,8 27,5

Cận dưới (2.20) 388,3 187,0 111,1 46,6 17,8

Trang 35

dS là kí hiệu của phần tử diện tích.

Khi đó SPRT dựa vào tỉ số:

ω 0g0(θ)Qn

i=1f (x1, θ)dθ

Trang 36

và thỏa mãn điều kiện sau:

(i) xác suất phạm sai lầm loại 1,α(θ) là hằng số trên ω0

(ii) xác suất phạm sai lầm loại 2,β(θ), là hằng số trên S1

(iii) với mọi θ thuộc miền trong của ω1, giá trị của β(θ) không lớn hơn giá trịhằng số của nó trên S1

Wald yêu cầu hàm trọng lượng gi(θ), (i = 0, 1) là tối ưu, nghĩa là với cáchàm trọng lượng bất kì h0(θ) và h1(θ), các xác suất phạm sai lầm liên quan

B < 2n−1θm

1 (1 − θ1)n−m+ θ1n−m(1 − θ1)m < A (3.4)chú ý rằng tiêu chuẩn liên tiếp nhị thức cho bởi 3.4 là không tối ưu theo nghĩacủa 3.3 vì nó có thể không thỏa mãn (iii)

Trang 37

(b) Tiêu chuẩn liên tiếp Chi bình phương

Cho Xi độc lập và phân phối chuẩn có giá trị trung bình chưa biết θ vàvarian σ2 Chúng ta muốn kiểm định H0 : σ = σ0|H1 : σ = σ1 > σ0 Chọng(θ) = 1/2c, −c ≤ θ ≤ c, và 0 trong trường hợp ngược lại Giới hạn của tỉ sốhợp lí cải biên dưới H1 và H0 dẫn đến:

−2

0 − σ−21 )2

ưu theo nghĩa của 3.3

3.2 Tiêu chuẩn liên tiếp t và t 2

Ở đây ta sẽ cung cấp một tình huống thực tế trong đó các giả thiết sau đây

Trang 38

phế phẩm nếu cường độ chịu kéo của nó là nhỏ hơn M và khi đó P (X < M )

sẽ trở thành tỉ lệ các thanh sắt phế phẩm trong một lô sắt lớn Chúng ta cóthể muốn biết liệu tỉ lệ của các thanh sắt phế phẩm là bằng p hay p0 Vì cường

độ chịu kéo có thể giả định là phân phối chuẩn với trung bình µ và phương sai

σ2, P (X > M ) = Φ [(M − µ/σ)] Do ta có thể thay đổi độ đo ban đầu của M ,

vì vậy không mất tổng quát đặt M = 0, khi đó P (X < 0) = Φ(−η) trong đó

η = µ/σ Nếu σ đã biết, người ta có thể dễ dàng thiết lập một tiêu chuẩn liêntiếp

Cho X là phân phối chuẩn với trung bình θ và phương sai σ2 chưa biết Tamuốn kiểm định H0 : θ = θ0|H1 : |θ − θ0| ≥ δσ trong đó σ > 0 Khi đó biên S1bao gồm tất cả các điểm (θ, σ) với mỗi |θ − θ0| = δσ, có nghĩa là nó bao gồm

2 điểm cho mỗi σ cố định Định nghĩa g0(θ, σ) = 1/c nếu 0 ≤ σ ≤ c, θ = θ0(vàbằng 0 ở miền còn lại) g1(θ, σ) = 1/2c nếu 0 ≤ σ ≤ c, θ = θ0 = ±δσ (và bằng 0

ở miền còn lại) Người ta dễ dàng thu được:

Trang 39

Tương tự, cho tiêu chuẩn liên tiếp t bằng cách đặt g1(θ, σ) = 1/c nếu 0 ≤

σ ≤ c và θ = θ0+ δσ (và bằng = 0 tại những miền còn lại) ta thu được giới hạncủa tỉ số cải biên hợp lí:

ψ1(T ; δ, n) = e

−nδ 2 /2

Γ [(n − 1)/2]

Z ∞ i=0

v(n−3)/2e−v+nδT

√ 2vdv

Như vậy quy trình liên tiếp có thể dựa trên tn trong đó tn =√

n(X −θ0)/sn, X làtrung bình mẫu và sn là độ lệch tiêu chuẩn mẫu, dựa trên n quan sát Có nghĩa

là, tiêu chuẩn liên tiếp t (hoặc t2) của H0 : θ = θ0|H1 : θ − θ0 ≥ δσ(|θ − θ0| ≥ δσ)

có thể mô tả như sau: Nếu thí nghiệm được tiến hành cho đến bước thứ n, thìmiền tiếp tục lấy mẫu được cho bởi:

Bn < tn < An(Bn0 < |tn| < A0n), n = 2, 3, (3.6)

Trong đó các hằng số Bn và An(Bn0, A0n) thu được bằng cách nghịch đảo bấtđẳng thức : B < ψ1(T ; δ, n) < A [B < ψ(T ; δ, n) < A] trong số hạng của tn[|tn|].David và Kruskal(1956) thu được một biểu thức tiệm cận cho ψ(T ; δ, n) và dầnđến tiệm cận chuẩn của T khi đã chuẩn hóa hợp lí, chỉ ra rằng tiêu chuẩn liêntiếp t kết thúc hữu hạn với xác suất 1

Rushton(1950) đã thu được một xấp xỉ tiệm cận với ln ψ1 Cho:

T∗ = nT =

Pn i=1(Xi− θ0)[Pn

i=1(Xi− θ0)2]1/2

=

ntn(n − 1 + t2

1 − α



< ln ψ1(T ) < ln1 − β

αKhi đó Rushton(1950) đã thu được, với n lớn:



Trang 40

3.2.1 Sự khai triển tiệm cận đều và sự nghịch đảo

x(n−3)/2e−x+δT∗

√ 2xdx

ta muốn giải những phương trình của T∗ như một hàm của n, L1, L2, δ tức là:

T∗ = T∗(n, Li, δ) Ta sẽ chỉ ra rằng nghiệm của phương trình thứ 2 liên quanchặt chẽ đến nghiệm của phương trình thứ nhất, cho:

Ngày đăng: 11/06/2015, 16:25

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Nguyễn Văn Hữu, Đào Hữu Hồ, Hoàng Hữu Như (2004), Thống kê toán học, NXB ĐHQGHN Sách, tạp chí
Tiêu đề: Thống kê toán học
Tác giả: Nguyễn Văn Hữu, Đào Hữu Hồ, Hoàng Hữu Như
Nhà XB: NXB ĐHQGHN
Năm: 2004
[3] Đào Hữu Hồ, Xác suất Thống kê (2007), NXB ĐHQGHN Sách, tạp chí
Tiêu đề: Xác suất Thống kê
Tác giả: Đào Hữu Hồ
Nhà XB: NXB ĐHQGHN
Năm: 2007
[8] Wilks S.S (1967), Mathematical statistics (bản dịch tiếng nga), Moskow Sách, tạp chí
Tiêu đề: Mathematical statistics
Tác giả: Wilks S.S
Nhà XB: Moskow
Năm: 1967
[2] Nguyễn Viết Phú, Nguyễn Duy Tiến (2004), Cơ sở lý thuyết xác suất, NXB ĐHQGHN Khác
[4] Đặng Hùng Thắng ( 2000), Thống kê và ứng dụng, NXB Giáo dục Khác
[5] Wald, Abraham (1947),Sequential Analysis, John Wiley and Sons Khác
[7] Anscome, F.J (1953), Sequential estimaion, J.Roi.Statist.Soc.Ser B. 15 1- 29.[200] Khác
[9] Zakula Govindarajulu, Sequential Statistics.handp Khác

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w