1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bổ đề Neyman Pearson và ứng dụng

50 1,6K 15

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 50
Dung lượng 352,41 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Lời giải cho các lớp bàitoán kiểm định giả thiết thống kê về tham số được trình bày bằng ngônngữ hàm tiêu chuẩn đối với từng lớp có một tiêu chuẩn kiểm định riêng.Vínhư, với lớp bài toán

Trang 1

Mục lục

1.1 Bài toán kiểm định giả thiết và các khái niệm mở đầu 7

1.2 Các loại sai lầm trong bài toán kiểm định giả thiết và cách khắc phục 8

1.3 Một số kiến thức bổ sung về lý thuyết xác suất 9

1.3.1 Tiêu chuẩn ngẫu nhiên 9

1.3.2 Hàm lực lượng 10

1.3.3 Tiêu chuẩn mạnh nhất mức α 10

1.3.4 Định lý Fubini 10

1.3.5 Một số mệnh đề 11

Chương 2: Bổ đề Neyman - Pearson 13 2.1 Bổ đề Neyman - Pearson 13

2.2 Hệ quả 16

2.2.1 Hệ quả 1 16

2.2.2 Hệ quả 2 17

2.3 Bài toán kiểm định giả thiết hợp với đối thiết đơn 19

2.3.1 Bài toán 19

2.3.2 Định nghĩa phân bố ít thuận lợi nhất mức α 19

2.3.3 Định lý 20

2.4 Một số ví dụ minh họa 21

2.5 Bổ đề Neyman - Pearson mở rộng 26

Chương 3: Ứng dụng của bổ đề Neyman - Pearson 31 3.1 Kiểm định giả thiết về số trung bình 31

Trang 2

3.1.1 Bài toán 1: Kiểm định giả thiết về số trung bình khi

phương sai đã biết 313.1.2 Bài toán 2: Kiểm định giả thiết về số trung bình khi

phương sai chưa biết 343.1.3 Bài toán 3: Kiểm định giả thiết về sự bằng nhau

giữa hai giá trị trung bình khi phương sai đã biết 363.1.4 Bài toán 4: Kiểm định giả thiết về sự bằng nhau

giữa hai giá trị trung bình khi phương sai chưa biết 383.2 Kiểm định giả thiết về tỉ lệ 403.2.1 Bài toán 1: Kiểm định về giá trị một tỉ lệ 403.2.2 Bài toán 2: Kiểm định giả thiết về sự bằng nhau của

hai tỉ lệ 423.3 Kiểm định giả thiết về phương sai 453.3.1 Bài toán 1: Kiểm định về giá trị một phương sai 453.3.2 Bài toán 2: Kiểm định giả thiết về sự bằng nhau của

hai phương sai 47

Trang 3

Lời cảm ơn

Để hoàn thành khóa luận tốt nghiệp ngoài sự cố gắng, nỗ lực của bảnthân tôi còn nhận được sự giúp đỡ nhiệt tình của các thầy cô giáo trongKhoa Toán - Công nghệ - Trường Đại học Hùng Vương đã tận tình chỉ bảotôi trong quá trình thực hiện đề tài này

Nhân dịp này tôi xin gửi lời cảm ơn chân thành nhất tới cô giáo Bùi ThịThu Dung - giảng viên Bộ môn Toán Khoa Toán - Công nghệ - Trường Đạihọc Hùng Vương, cô đã giành nhiều thời gian quý báu để tận tình hướngdẫn chỉ bảo tôi trong suốt quá trình làm đề tài, đồng thời cô đã giúp tôilĩnh hội những tri thức mới và rèn luyện tác phong nghiên cứu khoa học.Qua đây, tôi cũng xin gửi lời cảm ơn tới các thầy cô giáo trong KhoaToán – Công Nghệ, tới gia đình, bạn bè là những người luôn ủng hộ, quantâm, nhiệt tình giúp đỡ, chia sẻ và động viên tôi trong suốt quá trình thựchiện và hoàn thành đề tài

Mặc dù đã cố gắng rất nhiều song khóa luận không tránh khỏi nhữngthiếu sót Vì vậy tôi rất mong nhận được những ý kiến đóng góp của cácthầy giáo, cô giáo và các bạn sinh viên để khóa luận được hoàn thiện hơn

Tôi xin chân thành cảm ơn!

Việt Trì, tháng 5 năm 2012

Sinh viênDương Văn Long

Trang 4

1 Lí do chọn đề tài khóa luận

Kiểm định giả thiết thống kê là một lĩnh vực quan trọng và hấp dẫntrong chuyên ngành lý thuyết xác suất và thống kê Lời giải cho các lớp bàitoán kiểm định giả thiết thống kê về tham số được trình bày bằng ngônngữ hàm tiêu chuẩn đối với từng lớp có một tiêu chuẩn kiểm định riêng.Vínhư, với lớp bài toán kiểm định giả thiết hợp một phía, ta sử dụng tiêuchuẩn của tỷ số hợp lý đơn điệu; với lớp bài toán kiểm định giả thiết hợptrong đoạn ta dùng tiêu chuẩn không chệch mạnh đều nhất; hay với lớpbài toán kiểm định giả thiết hợp 2 phía ta dùng tiêu chuẩn của họ mũ,

Bổ đề Neyman - Pearson đã chỉ ra cho chúng ta tiêu chuẩn để kiểmđịnh các bài toán thuộc lớp bài toán kiểm định giả thiết đơn đối với đốithiết đơn, dạng H1 : θ = θ0/K1 : θ = θ1

Trong học phần Lý thuyết xác suất và thống kê, sinh viên ngành Toán

và các ngành khác đã được tìm hiểu một số dạng bài toán thuộc lớp bàitoán kiểm định giả thiết đơn đối với đối thiết đơn như: Bài toán kiểm định

về số trung bình, bài toán kiểm định về tỷ lệ, bài toán kiểm định về phươngsai Tuy nhiên trong tất cả các giáo trình mới chỉ dừng lại ở việc đưa racác bước để giải quyết bài toán nêu trên mà chưa chỉ ra nguồn gốc tườngtận của lời giải đó Do vậy đã gây ra không ít những khó khăn đối với sinhviên chuyên ngành Toán nói riêng và một số sinh viên muốn đi sâu nghiêncứu bài toán kiểm định giả thiết thống kê nói chung

Từ những lí do trên, tôi đã mạnh dạn chọn đề tài: "Bổ đề Neyman

- Pearson và ứng dụng" làm đề tài khóa luận tốt nghiệp của mình vớimong muốn tìm hiểu thêm phương pháp giải cho lớp bài toán kiểm địnhgiả thiết nêu trên Đồng thời, khóa luận giúp các bạn sinh viên có mongmuốn cầu thị tìm hiểu sâu về bài toán kiểm định giả thiết có thêm tài liệutham khảo trong trường Đại học

2 Mục tiêu khóa luận

- Trình bày nội dung và chứng minh chi tiết Bổ đề Neyman - Pearson

và Bổ đề Neyman - Pearson mở rộng

Trang 5

Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long

- Hệ thống hóa một số ứng dụng của Bổ đề Neyman - Pearson trongviệc giải quyết một số dạng bài toán kiểm định giả thiết thống kê

3 Nhiệm vụ nghiên cứu

- Nghiên cứu Bổ đề Neyman - Pearson và Bổ đề Neyman - Pearson

mở rộng

- Nghiên cứu ứng dụng của Bổ đề Neyman - Pearson trong việc giảiquyết một số dạng bài toán kiểm định giả thiết thống kê

4 Phương pháp nghiên cứu

- Phương pháp nghiên cứu lí luận: Nghiên cứu các tài liệu, giáo trình

có liên quan tới Bổ đề Neyman - Pearson và những ứng dụng của Bổ đề

- Phương pháp tổng kết kinh nghiệm: Tổng hợp và hệ thống hóa cáckiến thức về vấn đề nghiên cứu một cách đầy đủ, khoa học và chính xác

5 Đối tượng và phạm vi nghiên cứu

- Đối tượng nghiên cứu: Bổ đề Neyman - Pearson và ứng dụng của Bổđề

- Phạm vi nghiên cứu: Ứng dụng của Bổ đề Neyman - Pearson vàogiải quyết một số dạng bài toán kiểm định giả thiết thống kê

6 Bố cục của khóa luận

- Ngoài phần Mở đầu, Kết luận và Tài liệu tham khảo, nội dung củakhóa luận gồm 3 chương

Chương 1 Kiến thức chuẩn bị

1.1 Bài toán kiểm định giả thiết và các khái niệm mở đầu

1.2 Các loại sai lầm trong bài toán kiểm định giả thiết và cách khắcphục

1.3 Một số kiến thức bổ sung về lý thuyết xác suất

Chương 2 Bổ đề Neyman - Pearson

Chương 3 Ứng dụng của Bổ đề Neyman - Pearson

3.1 Kiểm định giả thiết về số trung bình

3.2 Kiểm định giả thiết về tỉ lệ

Trang 6

3.3 Kiểm định giả thiết về phương sai

7 Ý nghĩa khoa học và thực tiễn

7.1 Ý nghĩa khoa học

- Đề tài khóa luận đã hệ thống hóa một số ứng dụng của Bổ đề Neyman

- Pearson vào giải quyết một số dạng bài toán kiểm định giả thiết thốngkê

7.2 Ý nghĩa thực tiễn

- Đề tài là tài liệu tham khảo cho giảng viên, sinh viên muốn đi sâunghiên cứu về Bổ đề Neyman - Pearson nói riêng và chuyên ngành lý thuyếtxác suất thống kê nói chung

Trang 7

Chương 1

KIẾN THỨC CHUẨN BỊ

đầu

Giả sử ta có mẫu ngẫu nhiên (X1, X2, , Xn) - các quan sát độc lập

về biến ngẫu nhiên ξ còn F là lớp các hàm phân bố nào đó Ta chia lớp

F thành hai lớp con FH và FK = F \FH Biết rằng hàm phân bố F củabiến ngẫu nhiên ξ đang xét thuộc vào lớp F nhưng chưa biết F ∈ FH hay

F ∈ FK Ta gọi mệnh đề: “hàm phân bố F thuộc lớp FH” là giả thiết H,còn mệnh đề “hàm phân bố F thuộc lớp FK” là đối thiết K Bài toán đặt

ra là: hãy kiểm tra xem giả thiết H đúng hay đối thiết K đúng?

Nếu lớp F được tham số hóa, tức là F = {F (x, θ), θ ∈ Θ}, trong đódạng toán học của hàm F đã biết, θ là tham ẩn chưa biết Khi đó, ta sẽ đồngnhất lớp F với không gian tham Θ và giả thiết H : F ∈ FH sẽ là θ ∈ ΘH,đối thiết K : F ∈ FK sẽ là θ ∈ ΘK, trong đó ΘH ∩ ΘK = ∅, ΘH ∪ ΘK = Θ

- Nếu ΘH gồm chỉ một điểm thì giả thiết H được gọi là giả thiết đơn.Nếu ΘH có nhiều hơn một điểm thì H được gọi là giả thiết hợp

- Nếu ΘK gồm chỉ một điểm thì đối thiết K được gọi là đối thiết đơn.Nếu ΘK có nhiều hơn một điểm thì K được gọi là đối thiết hợp

Phương pháp chung để giải bài toán kiểm định giả thiết H với đốithiết K (nói tắt là bài toán kiểm định giả thiết H/K) là:

Xét biến ngẫu nhiên X giả sử X = {(X1, X2, , Xn)} là không giangiá trị của biến ngẫu nhiên X Ta tìm cách chia X ra làm hai phần: S và

S =X\S Sau đó ta chọn quyết định theo quy tắc sau:

- Nếu mẫu ngẫu nhiên (X1, X2, , Xn) ∈ S thì ta bác bỏ giả thiết H

và chấp nhận đối thiết K

- Nếu mẫu ngẫu nhiên (X1, X2, , Xn) ∈ S ta chấp nhận H hay nói

Trang 8

chính xác hơn là ta chưa có cơ sở để bác bỏ H và do đó ta có khuynhhướng chấp nhận H cho đến khi có thông tin mới, như vậy việc bác bỏ Hđáng tin cậy hơn việc chấp nhận H Miền S tìm được ở trên được gọi làmiền tiêu chuẩn (hoặc miền giới hạn).

thiết và cách khắc phục

Nội dung của bài toán kiểm định giả thiết là dựa vào mẫu quan sát

để lựa chọn một trong hai quyết định: chấp nhận giả thiết H hay phải bác

bỏ nó Khi đưa ra quyết định chấp nhận hay bác bỏ giả thiết H có thể sẽmắc hai loại sai lầm:

Sai lầm loại I: Bác bỏ giả thiết H khi thực chất H đúng

Sai lầm loại II: Chấp nhận giả thiết H khi thực chất H sai

Ký hiệu P (S|H) và P (S|K) là xác suất phạm sai lầm loại I và loại

II tương ứng Người làm thống kê muốn hạn chế cả hai loại sai lầm này,nghĩa là mong muốn chọn được miền tiêu chuẩn S sao cho cực tiểu hóa

cả hai xác suất phạm sai lầm, tức là chọn S sao cho có thể loại trừ khảnăng phạm cả hai loại sai lầm càng nhiều càng tốt Song không thể cựctiểu đồng thời cả hai loại sai lầm khi cỡ mẫu cố định, bởi vì hai xác suấttrên liên hệ với nhau bởi hệ thức:

P (S|K) + P (S|K) = 1; P (S|H) + P (S|H) = 1

Do đó miền tiêu chuẩn S cực tiểu P (S|H) chưa chắc đã cực tiểu

P (S|K) và ngược lại Hơn nữa miền tiêu chuẩn S = ∅ sẽ có xác suấtphạm sai lầm loại I bằng 0, tức là bé nhất nhưng miền tiêu chuẩn như vậy

ta không xét Do vậy, có hai phương pháp chọn miền tiêu chuẩn S cũng làhai cách khắc phục sai lầm trong bài toán kiểm định giả thiết thống kê.Phương pháp I: Cố định hai mức xác suất phạm sai lầm, chọn miền

S sao cho cỡ mẫu n là cực tiểu

Phương pháp II: Ta cố định một loại xác suất phạm sai lầm và tìmmiền S sao cho xác suất phạm sai lầm kia đạt giá trị nhỏ nhất Thôngthường ta cố định xác suất phạm sai lầm loại I: P (S|H) ≤ α tức là chogiới hạn trên của xác suất phạm sai lầm loại I, ta sẽ chọn miền tiêu chuẩn

S sao cho xác suất phạm sai lầm loại II P (S|K) đạt cực tiểu hay P (S|K)đạt cực đại Phương pháp II được sử dụng rộng rãi hơn

Trang 9

Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long

Cho trước 0 ≤ α ≤ 1, ta chọn miền tiêu chuẩn S sao cho:

1.3.1 Tiêu chuẩn ngẫu nhiên

Tiêu chuẩn được đặc trưng bởi hàm ϕ(X) gọi là tiêu chuẩn ngẫu nhiên.Hàm ϕ(X) gọi là hàm tiêu chuẩn, 0 ≤ ϕ(X) ≤ 1

Nếu ϕ(X) = ϕ(X1, X2, , Xn) chỉ nhận hai giá trị 0 và 1,

ϕ(X) =

(

1 nếu (X1, X2, , Xn) ∈ S

0 nếu (X1, X2, , Xn) 6∈ S (1.3.1)khi đó ϕ(X) được gọi là tiêu chuẩn không ngẫu nhiên hay là hàm chỉtiêu của S trên không gian mẫuX với miền tiêu chuẩn S = {X : ϕ(X) = 1} Theo phương pháp II, để cực tiểu hóa tổng xác suất phạm sai lầm.Trước hết ta cố định xác suất phạm sai lầm loại 1, tức là cố định Pθ(S|H) =

Pθ(S) = Eθϕ(X) với θ ∈ ΘH Sau đó tìm θ ∈ ΘK sao cho: Pθ(S|K) đạtcực tiểu

Trang 10

1.3.2 Hàm lực lượng

Đại lượng βϕ(θ) = Eθϕ(X) = Pθ(S), θ ∈ Θ được gọi là hàm lực lượng(hay hàm mạnh) của tiêu chuẩn S

1.3.3 Tiêu chuẩn mạnh nhất mức α

Tiêu chuẩn ϕ mức α để kiểm định giả thiết H đối với đối thiết đơn

K1 : {θ = θ1} cực đại hàm lực lượng βϕ(θ1) (cực đại theo hàm ϕ(X)) đượcgọi là tiêu chuẩn mạnh nhất mức α

Nghĩa là, miền tiêu chuẩn S được gọi là mạnh nhất mức α nếu thỏamãn các điều kiện sau:

- Định lý Fubini về đổi thứ tự tích phân:

Nếu µ1, µ2 là các độ đo δ - hữu hạn và f là hàm đo được không âm hoặc

µ1 ⊗ µ2 khả tích thì các hàm số x → R f (x, y)dµ2(y), y → R f (x, y)dµ1(x).Hơn nữa:

Trang 11

Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long

(i) Ta công nhận kết quả này

(ii) Ta có X ∼ N (a, σ2) suy ra ϕX(t) = eita−σ2t22

Do mẫu độc lập và tính duy nhất của hàm đặc trưng nên ta có:

=

√n(X − a)

⇒ Z2 = n(X − a)

2

σ2 ∼ χ2(1)

Trang 12

S ∼ T (n − 1).

c Mệnh đề 3:

Cho (X1, X2, , Xn) và (Y1, Y2, , Ym) là các mẫu ngẫu nhiên độc lậpnhau tương ứng của các đặc tính X ∼ N (a1, σ2), Y ∼ N (a2, σ2) trên Ωkhi đó F = S

2 n

S2 m

có phân phối F (n − 1, m − 1)

Trang 13

Chương 2

BỔ ĐỀ NEYMAN - PEARSON

Giả sử P0 và P1 là các phân bố xác suất có mật độ tương ứng là p0 và

p1 đối với độ đo µ nào đó

1 Để kiểm định giả thiết đơn H1 : θ = θ0 với đối thiết đơn K1 : θ = θ1(θ0 6= θ1), ta tìm được tiêu chuẩn ϕ và hằng số k sao cho:

2 Nếu tiêu chuẩn ϕ thỏa mãn (2.1.1) và (2.1.2) với k nào đó thì ϕ làtiêu chuẩn mạnh nhất mức α để kiểm định giả thiết H1/K1

3 Nếu ϕ là tiêu chuẩn mạnh nhất mức α để kiểm định giả thiết H1/K1thì với k nào đó ϕ thỏa mãn (2.1.2) µ - hầu khắp nơi ϕ cũng thỏa mãn(2.1.1) trừ trường hợp tồn tại tiêu chuẩn mức nhỏ hơn α và lực lượng bằng1

Trang 14

p0(X) < c



Đây chính là hàm phân bố của biến ngẫu nhiên p1(X)

p0(X), vì thế α(c) làhàm không tăng và liên tục trái

Trang 15

Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long

0 khi p1(x) < c0p0(x)

Số hạng thứ hai có nghĩa khi α(c0) 6= α(c0 + 0)

Nếu α(c0) = α(c0 + 0) thì khi đó P0{p1(x) = c0p0(x)} = 0 Do đó ϕxác định µ− hầu khắp nơi Ta chọn hằng số k trong (2.1.2) chính là c0.Bây giờ ta chứng minh ϕ được chọn như trên sẽ thỏa mãn (2.1.1) Thựcvậy:

E0ϕ(X) = P0

 p1(X)

p0(X) > c0

+ α − α(c0 + 0)α(c0) − α(c0 + 0)P0

+ Nếu x ∈ S− suy ra ϕ(x) = 0 và p1(x) < kp0(x)

Đặt S = S+ ∪ S−, từ những điều trên ta có ϕ − ϕ? và p1 − kp0 cùngdấu hay (ϕ − ϕ?)(p1 − kp0) > 0

Trang 16

Như vậy ϕ là tiêu chuẩn mạnh nhất.

Chứng minh khẳng định 3

Để chứng minh khẳng định 3 ta giả sử ϕ là tiêu chuẩn xác định bởi(2.1.1) và (2.1.2), còn ϕ? là tiêu chuẩn mạnh nhất mức α để kiểm định giảthiết H1/K1

Đặt S = {S+∪ S−} ∩ {x : p1(x) 6= kp0(x)}, tức là tập những điểmthuộc miền xác định của ϕ mà trên đó ϕ 6= ϕ? Ta phải chứng minhµ(S) = 0 Giả sử µ(S) > 0, vì (ϕ − ϕ?)(p1 − kp0) > 0 trên S nên

Z(ϕ − ϕ?)p0dµ > 0Suy ra R ϕp1dµ > R ϕ?p1dµ hay E1ϕ(X) > E1ϕ?(X)

Như vậy ϕ mạnh hơn ϕ? Điều này mâu thuẫn với giả thiết ϕ? mạnhnhất Do đó µ(S) = 0, tức là tiêu chuẩn mạnh nhất ϕ? phải thỏa mãn(2.1.2) µ− hầu khắp nơi Bây giờ chứng minh ϕ? cũng thỏa mãn (2.1.1)trừ trường hợp E0ϕ?(X) < α và E1ϕ?(X) = 1 Thực vậy, nếu E0ϕ?(X) < α

và E1ϕ?(X) < 1 do ϕ? có dạng (2.1.2) µ− hầu khắp nơi, ta điều chỉnh giá trị

ϕ? trên tập {x : p1(x) = kp0(x)} và khi đó ta nhận được hoặc E0ϕ?(X) = αhoặc E1ϕ?(X) = 1 Bổ đề cơ bản Neyman - Pearson được chứng minh xong

2.2.1 Hệ quả 1

Giả sử β là lực lượng của tiêu chuẩn mạnh nhất mức α để kiểm định

Trang 17

Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long

giả thiết đơn P = P0 với đối thiết đơn P = P1 Khi đó α < β trừ trườnghợp P0 = P1

Chứng minh Ta thấy tiêu chuẩn ϕ(x) ≡ α có mức ý nghĩa bằng α

và có lực lượng bằng α Do đó α ≤ β (vì β là lực lượng của tiêu chuẩnmạnh nhất) Giả sử α = β, vì α = β = 1 chỉ sảy ra đối với tiêu chuẩn luônluôn không chấp nhận giả thiết trong mọi trường hợp (tiêu chuẩn loại nhưthế ta không xét) nên ta xét trường hợp α = β < 1 Nếu α = β thì tiêuchuẩn ϕ(x) ≡ α là mạnh nhất Theo khẳng định 3 của định lý 2.1, tiêuchuẩn này phải thỏa mãn (2.1.2) với k nào đó µ− hầu khắp nơi Mặt khácϕ(x) ≡ α Vậy ϕ phải có dạng:

√2πσ

Trang 18

⇒ exp



− 12σ2

σ2



≥ cexp

n(θ12 − θ02) 1

√n

< cα− θ0σ

√n

√n

Trang 19

Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long

Giả sử λ(θ) là phân bố xác suất trên Θ Ta sẽ chuyển bài toán kiểmđịnh giả thiết hợp H2 với đối thiết đơn K2 về bài toán kiểm định giả thiếtđơn với đối thiết đơn bằng cách đưa vào “trung bình có trọng lượng” củacác mật độ xác suất fθ(x), θ ∈ Θ Khi đó giả thiết hợp H2 được thay bằnggiả thiết đơn Hλ, mà theo giả thiết này mật độ của biến ngẫu nhiên đangxét được xác định bởi công thức:

hλ(x) =

Z

Θ

fθ(x)dλ(θ)

Vấn đề đặt ra là chọn phân bố xác suất λ(θ) trên Θ như thế nào? Bởi

vì giả thiết H2 : f (x) ∈ {fθ(x), θ ∈ Θ} không cho lượng tin nào về giá trịchính xác của θ, mặt khác Hλ lại cần phải tương đương với H2 (với quanđiểm đối thiết K2), cho nên lẽ tự nhiên ta đòi hỏi phân bố λ là ít thuậnlợi nhất

2.3.2 Định nghĩa phân bố ít thuận lợi nhất mức α

Giả sử βλ là lực lượng cực đại có thể đạt được đối với đối thiết K2 củatiêu chuẩn mạnh nhất ϕλ để kiểm định giả thiết Hλ với đối thiết K2 Tagọi λ là phân bố ít thuận lợi nhất (với mức α) nếu với mọi phân bố λ0 tacó: βλ ≤ βλ0, trong đó: βλ = Eθϕλ(X), βλ0 = Eθϕλ0(X)

βλ là xác suất bác bỏ giả thiết khi giả thiết sai Vì thế để cho chắcchắn và khách quan ta sẽ chọn phân bố λ mà βλ tương ứng là nhỏ nhất.Chọn λ như vậy tiêu chuẩn ϕλ được xây dựng sử dụng được thì các tiêuchuẩn ϕλ 0 (λ0 6= λ) khác lại càng sử dụng tốt hơn Để thấy rõ hiệu quảcủa phương pháp nêu trên, định lý sau chỉ rõ mối quan hệ giữa tiêu chuẩnmạnh nhất đối với bài toán rút gọn Hλ/K2 và tiêu chuẩn mạnh nhất đốivới bài toán ban đầu H2/K2

Trang 20

2.3.3 Định lý

Giả sử trên không gian tham Θ cho σ - trường sao cho mật độ fθ(x)

đo được theo toàn bộ các biến θ và x Giả sử trên σ - trường đó tồn tạiphân bố xác suất λ với tính chất sau: tiêu chuẩn mạnh nhất ϕλ mức α đểkiểm định giả thiết Hλ/K2 có mức nhỏ hơn hoặc bằng α đối với giả thiếtban đầu H2 : Eθϕλ(X) ≤ α, ∀θ ∈ Θ Khi đó:

1 Tiêu chuẩn ϕλ là mạnh nhất để kiểm định giả thiết H2/K2

2 Nếu ϕλ là tiêu chuẩn mạnh nhất duy nhất mức α để kiểm định giảthiết Hλ/K2, thì ϕλ cũng là tiêu chuẩn mạnh nhất duy nhất để kiểm địnhgiả thiết H2/K2

3 Phân bố λ là ít thuận lợi nhất

Giả sử ϕλlà tiêu chuẩn mức α đối với giả thiết H2, ϕ? là tiêu chuẩn mức

α bất kỳ khác để kiểm định giả thiết H2/K2, tức là Eθϕ?(X) ≤ α, ∀θ ∈ Θ.Khi đó:

Θ

Eθϕ?(X)dλ(θ) ≤ α

Điều đó có nghĩa rằng ϕ? là tiêu chuẩn mức α đối với giả thiết Hλ

Do đó βϕ? ≤ βλ Vậy ϕλ là tiêu chuẩn mạnh nhất để kiểm định giả thiết

H2/K2

* Chứng minh khẳng định 2:

Theo khẳng định 1 để chứng minh khẳng định 2 ta chỉ cần chứngminh tiêu chuẩn mạnh nhất đối với H2/K2 cũng là mạnh nhất đối với

Hλ/K2 Điều này rõ ràng bởi vì giả sử ϕ là tiêu chuẩn mạnh nhất đối với

H2/K2, tức là Eθϕ(X) ≤ α, ∀θ ∈ Θ và R

X

ϕ(x)g(x)dµ(x) đạt cực đại, thìtheo chứng minh khẳng định 1 ta thấy ϕ cũng có mức α đối với Hλ/K2 và

Trang 21

Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long

Để chứng minh λ là phân bố ít thuận lợi nhất ta xét λ0 là phân

bố bất kỳ khác trên Θ, ϕλ là tiêu chuẩn được xác định trong định lý,khi đó ϕλ cũng là tiêu chuẩn mức α để kiểm định Hλ0/K2 (chứng minhR

Ví dụ 1: Ta có một mẫu ngẫu nhiên (X1, X2, , Xn) được rút ra từ

họ N (θ, 1), Xi ∼ N (θ, 1) Tham ẩn θ chỉ nhận một trong hai giá trị θ0hoặc θ1 (θ1 > θ0) Hãy kiểm tra xem θ nhận giá trị nào, tức là bài toánkiểm định giả thiết H1 : θ = θ0 với đối thiết K1 : θ = θ1, mức ý nghĩa α.Tính các xác suất phạm sai lầm?



= {(x1, , xn) : x > c}

Trang 22

E0ϕ(X) = P0X > c = α.

Với giả thiết H1 thì Xi ∼ N (θ0, 1), do vậy X ∼ N (θ0, 1

n) Và từ đó tacó:

P0X > c = P0 X − θ0

1/√

n >

c − θ01/√n



= αhay

1 − Φ(c − θ0

1/√

n) = 1 − Φ((c − θ0)

√n) = α

trong đó Φ(.) là hàm của phân bố N (0, 1)

Để tính các xác suất phạm sai lầm, ta giả sử θ1 > θ0

Nếu giả thiết H1 đúng thì X ∼ N (θ0, 1

n) Do đó xác suất phạm sailầm loại I là α = P0(X > c) còn khả năng đúng khi ta chấp nhận H1 là

P0(X < c) = 1 − α

Nếu đối thiết K1 đúng thì X ∼ N (θ0, 1

n) Khi đó xác suất phạm sailầm loại II là: P1(X < c) = β còn khả năng đúng khi ta chấp nhận K1 là

P1(X > c) = 1 − β

Rõ ràng α càng nhỏ thì β càng lớn và β càng nhỏ thì α lại càng lớn,nghĩa là sự biến thiên của xác suất phạm sai lầm loại I và xác suất phạmsai lầm loại II là ngược chiều nhau Với xác suất phạm sai lầm loại I cố

Trang 23

Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long

định, để giảm xác suất phạm sai lầm loại II ta chọn đối thiết θ1 cách xa

θ0, nghĩa là xác suất sai lầm loại II sẽ giảm khi θ1 tiến xa θ0 (vì giả thiết

θ1 > θ0)

Chú ý: Vì DX = DX/n cho nên một cách để làm giảm cả hai xácsuất sai lầm là tăng số quan sát n lên (khi miền tiêu chuẩn X > c khôngthay đổi)

Bây giờ ta xét ví dụ cụ thể hơn:

Ví dụ 2 Giả sử ta có mẫu ngẫu nhiên gồm 100 quan sát từ đại lượng

X ∼ N (µ, 252)

1 Hãy chỉ ra miền tiêu chuẩn mạnh nhất để kiểm định giả thiết

H1 : µ = 36 với đối thiết K1 : µ = 42, mức ý nghĩa α = 0, 05

2 Tính xác suất phạm sai lầm loại II

3 Chỉ rõ xác suất để có các quyết định đúng

4 Tìm hàm lực lượng

5 Tính các xác suất sai lầm loại II khi đối thiết K1 là µ = 39; 40; 45; 50

6 Tính xác suất sai lầm loại I và loại II đối với H1 : µ = 36, K1 : µ = 42nếu miền tiêu chuẩn S =X > 38, 5 , X > 40 , X > 41

7 Với H1 : µ = 36, K1 : µ = 42; S = X > 40 Hãy tính xác suất sailầm loại I và loại II khi số quan sát tăng từ 100 lên 200

Trang 24

Vậy xác suất sai lầm loại II là: β = 0, 1292.

Ta thấy rằng tăng cỡ mẫu từ 100 lên 200, xác suất sai lầm từ loại Igiảm từ 0, 0548 xuống 0, 0119, xác suất sai lầm từ loại II giảm từ 0, 2119xuống 0, 1292

Ví dụ 3: Để kiểm tra chất lượng của bóng điện do nhà máy nào đósản xuất ra ta lấy một mẫu ngẫu nhiên cỡ n và quan sát về một đặc trưng

Trang 25

Bổ đề Neyman - Pearson và ứng dụng Dương Văn Long

nào đó của bóng điện, chẳng hạn thời gian thắp sáng của bóng điện hoặc

độ sáng của bóng điện Gọi X là thời gian thắp sáng của bóng điện Bóngđiện được coi là tốt nếu X vượt quá đại lượng u nào đó Ta muốn kiểmtra giả thiết H : p ≥ p0, trong đó p = P {X ≤ u} là xác suất để bóng điện

bị coi là phế phẩm

Giải:

Giả sử (X1, X2, , Xn) là mẫu ngẫu nhiên cỡ n về đặc trưng X, tức

là các Xi độc lập cùng phân bố như X Nhưng phân bố của X ta lại chưabiết được gì cả Phân bố của biến ngẫu nhiên X có thể đặc trưng bởi xácsuất p cùng với P− và P+ là phân bố có điều kiện của đại lượng X với cácđiều kiện X ≤ u và X > u tương ứng Nếu các phân bố P− và P+ có mật

độ p− và p+ đối với độ đo µ nào đó (chẳng hạn µ = P−+ P+ ) thì mật độđồng thời của mẫu ngẫu nhiên đã cho là:

pm(1 − p)n−mp−(xi1) p−(xim)p+(xj1) p+(xj,n−m)trong đó xi1, xi2, , xim ≤ u < xj1, xj2, , xj,n−m nghĩa là trong mẫu

và ta nhận được mật độ đồng thời trên

Bây giờ ta chọn đối thiết cố định, chẳng hạn p = p1 với p1 < p0 Khi đóphân bố ít thuận lợi nhất sẽ là phân bố mà nó tập trung vào (p0, P−, P+)với xác suất 1 Do vậy hλ sẽ là : (p0, P−, P+) Vì (p0, P−, P+) sẽ là phần tửtrong H mà gần đối thiết (p1, P−, P+) nhất, bởi vì khi phân biệt giữa haigiả thiết đơn, nếu chúng càng gần nhau thì càng khó phân biệt, còn nếuchúng càng xa nhau thì càng dễ phân biệt

Theo định lý 2.3.3 tiêu chuẩn mạnh nhất mức α để kiểm định

Hλ(p0, P−, P+) với đối thiết (p1, P−, P+) sẽ là:

Ngày đăng: 31/10/2014, 15:32

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w