Nó đưa ra một phéptính xấp xỉ cho hàm phân phối của tổng các biến ngẫu nhiên độc lập W so với hàm phân phối chuẩn hóa Φ.. Một trong những công cụ để đánh giá khoảng cáchgiữa W và Φ hay đ
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
LUẬN VĂN THẠC SĨ KHOA HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
GS.TSKH NGUYỄN DUY TIẾN
Hà Nội, Năm 2014
Trang 3Lời cám ơn
Tác giả xin bày tỏ lòng biết ơn chân thành và sâu sắc của mình tớiGS.TSKH Nguyễn Duy Tiến, người đã tận tình giúp đỡ và chỉ bảo tôitrong suốt quá trình làm luận văn tốt nghiệp Qua đây tôi cũng xin chânthành cám ơn sự giúp đỡ của các thầy giáo, cô giáo trong Bộ môn Xácsuất Thống kê Trường Đại học Khoa học Tự nhiên - Đại học Quốc gia HàNội, những người đã giúp đỡ tôi trong suốt quá trình học tập và nghiêncứu tại trường
Tác giả xin trân trọng cảm ơn Trường Đại học Sao Đỏ, Khoa Khoahọc Cơ bản và các đồng nghiệp đã tạo mọi điều kiện giúp đỡ để tác giả antâm học tập và hoàn thành tốt luận văn
Do mới làm quen với công tác nghiên cứu khoa học và còn hạn chế
về thời gian thực hiện nên luận văn không thể tránh khỏi những thiếu sót.Tác giả kính mong nhận được ý kiến đóng góp của các thầy cô và các bạn
để luận văn được hoàn thiện hơn
Hà Nội, năm 2014
Trang 4Mục lục
1 Các kiến thức chuẩn bị 6
1.1 Biến ngẫu nhiên 6
1.1.1 Định nghĩa và phân loại 6
1.1.2 Hàm phân phối 7
1.1.3 Hàm đặc trưng 7
1.1.4 Các đặc trưng của biến ngẫu nhiên 8
1.2 Phân bố chuẩn 9
1.2.1 Phân bố chuẩn một chiều 9
1.2.2 Phân bố chuẩn nhiều chiều 10
1.3 Khoảng cách biến phân toàn phần 11
1.4 Sự hội tụ của dãy các biến ngẫu nhiên 11
1.5 Phương pháp Stein cho xấp xỉ chuẩn 12
1.5.1 Phương trình Stein và ý nghĩa 12
1.5.2 Xây dựng các đẳng thức Stein 13
1.5.3 Xấp xỉ chuẩn của hàm trơn 14
2 Bất đẳng thức Berry - Esseen một chiều 16 2.1 Giới thiệu chung 16
2.2 Bất đẳng thức Berry – Esseen đều 17
2.2.1 Trường hợp cùng phân bố 17
Trang 52.2.2 Trường hợp không cùng phân bố 18
2.2.3 Chứng minh bất đẳng thức Berry - Esseen đều 19
2.2.4 Áp dụng định lý Berry – Esseen đều 24
2.3 Bất đẳng thức Berry – Esseen không đều 26
2.3.1 Trường hợp cùng phân bố 26
2.3.2 Trường hợp không cùng phân bố 26
2.3.3 Chứng minh bất đẳng thức Berry - Esseen không đều 27 3 Bất đẳng thức Berry - Esseen nhiều chiều 36 3.1 Trường hợp cùng phân bố 36
3.2 Trường hợp không cùng phân bố 49
Trang 6Mở đầu
Xác suất là một bộ phận của toán học nghiên cứu về các hiện tượngngẫu nhiên Lý thuyết xác suất nhằm tìm ra những quy luật trong nhữnghiện tượng tưởng chừng không có quy luật này; và nó được ra đời đầu tiên
ở nước Pháp vào nửa cuối thế kỷ 17
Trong lý thuyết xác suất định lý giới hạn trung tâm là một trongnhững định lý cơ bản và có nhiều ứng dụng thực tiễn Nó đưa ra một phéptính xấp xỉ cho hàm phân phối của tổng các biến ngẫu nhiên độc lập W
so với hàm phân phối chuẩn hóa Φ Tuy nhiên định lý này không đánh giáđược tốc độ hội tụ của giới hạn W→ Φ
Trong thực tế ta lại quan tâm nhiều đến khoảng cách giữa phân bốcủa W và phân bố chuẩn hóa Khoảng cách này càng nhỏ thì xấp xỉ chúng
ta cần càng có giá trị Một trong những công cụ để đánh giá khoảng cáchgiữa W và Φ hay đánh giá được tốc độ hội tụ của định lý giới hạn trungtâm là bất đẳng thức Berry – Esseen Trong đề tài này tôi sẽ trình bày
về lịch sử, quá trình hoàn thiện, chứng minh, mở rộng, phát triển và ứngdụng của bất đẳng thức này
Nội dung đề tài gồm ba chương:
Chương 1 Các kiến thức chuẩn bị Chương này đưa ra một số kiếnthức về biến ngẫu nhiên, phân phối chuẩn, khoảng cách biến phân toànphần, phương pháp Stien Đây là những kiến thức bổ trợ sẽ được nhắc đến
ở những chương sau
Trang 7Chương 2 Bất đẳng Berry - Esseen một chiều Chương này tác giảphát biểu định lý Berry - Esseen đều và không đều Với mỗi dạng tác giảphát biểu định lý trong trường hợp cùng phân bố và không cùng phân bố,
có giới thiệu sơ lược về lịch sử của định lý, cuối cùng là chứng minh và đưa
ra một vài áp dụng của định lý
Chương 3 Bất đẳng Berry - Esseen nhiều chiều Chương này là sự
mở rộng của định lý Berry - Esseen một chiều Sự mở rộng được phát biểucho cả hai trường hợp cùng phân bố và không cùng phân bố Tuy nhiên,
để giảm độ phức tạp tác giả chỉ dừng lại ở việc chứng minh định lý trongtrường hợp đơn giản hơn, đó là trường hợp cùng phân bố
Trang 8Chương 1
Các kiến thức chuẩn bị
Chương này tác giả đưa ra một vài kiến thức cơ bản về biến ngẫunhiên, phân bố chuẩn, khoảng cách biến phân toàn phần, phương phápStein Đây là những kiến thức cơ bản của xác suất thống kê mà được sửdụng nhiều trong các chương sau
1.1 Biến ngẫu nhiên
1.1.1 Định nghĩa và phân loại
Nói một cách chung chung thì biến ngẫu nhiên là đại lượng lấy giá trịthực tùy thuộc vào kết quả ngẫu nhiên của phép thử Định nghĩa chínhxác của biến ngẫu nhiên như sau:
Định nghĩa 1.1 : Giả sử (Ω, A) là không gian đo đã cho Biến ngẫunhiên là ánh xạ X : Ω → R sao cho:
(X ≤ x) = {ω ∈ Ω |X(ω) ≤ x} ∈ A, ∀x ∈ R
Hoặc tương đương:
X−1(B) = {ω ∈ Ω |X(ω) ∈ B} ∈ A, ∀B ∈ B
với B là σ - đại số các tập Borel của R
Định nghĩa 1.2 : Biến ngẫu nhiên gọi là rời rạc nếu tập các giá trị của
nó là hữu hạn hay đếm được Biến ngẫu nhiên rời rạc được xác định bằng
Trang 9bảng phân phối xác suất:
Định nghĩa 1.3 : Biến ngẫu nhiên gọi là liên tục nếu các giá trị có thể
có của nó lấp đầy một khoảng trên trục số Biến ngẫu nhiên liên tục Xđược xác định bởi hàm mật độ f(x) thỏa mãn hai tính chất: f(x)≥ 0 vớimọi x và
Hàm phân phối của biến ngẫu nhiên có một số tính chất sau:
• Hàm phân phối xác định với mọi x ∈ R
• 0 ≤ F (x) ≤ 1, F (−∞) = 0, F (+∞) = 1
•Hàm phân phối là hàm không giảm: x1 > x2 → F (x1) ≥ F (x2)
• P(a ≤ X < b) = F(b) - F(a)
•Mối quan hệ giữa hàm phân phối và hàm mật độ: F0(x) = f (x)
Ta có thể định nghĩa: Biến ngẫu nhiên X là liên tục nếu hàm phânphối của nó có đạo hàm
1.1.3 Hàm đặc trưng
Định nghĩa 1.5 : Giả sử F là hàm phân phối của biến ngẫu nhiên X Khi
đó hàm đặc trưng của X là hàm biến thực ϕ(t) = ϕX(t) được định nghĩa
Trang 10• ϕ(t) là hàm liên tục đều trên R.
• Với mọi số thực a, b thì: ϕaX+b(t) = eibtϕX(at)
Ec = c nếu c là hằng sốE(X + Y) = EX + EYEcX = c.EX, c là hằng số
X, Y độc lập thì E(XY) = EX.EYEg(X) =
n
P
i=1g(xi)pi nếu X - rời rạc
Trang 11Định nghĩa 1.7 : Phương sai của biến ngẫu nhiên X là một số không
âm, kí hiệu DX, được xác định bởi DX = EX2 − (EX)2
Các tính chất của phương sai:
Dc = 0 nếu c là hằng sốDcX = c2DX
Nếu X, Y độc lập thì D(X ± Y) = DX + DY
1.2 Phân bố chuẩn
1.2.1 Phân bố chuẩn một chiều
Định nghĩa 1.8 : Biến ngẫu nhiên liên tục X nhận các giá trị trongkhoảng (−∞, +∞) gọi là phân phối theo quy luật chuẩn hóa, kí hiệu: X
∼ N(0,1), nếu hàm mật độ xác suất của nó có dạng:
Trang 12bằng phép biến đổi chuẩn hóa Y = X−µσ
Nếu X ∼ N (µ,σ2) thì: P (a < X < b) = Φ(b−µσ ) − Φ(a−µσ )
1.2.2 Phân bố chuẩn nhiều chiều
Cho vectơ ngẫu nhiên X = (X1, X2, , Xk) Khi đó ta kí hiệu:
• cov(Xi, Xj) = E(Xi− EXi)(Xj− EXj) = EXiXj− EXi.EXj, gọi
(x−a
Trang 13ρ là hệ số tương quan của X, Y: ρ = cov(X,Y )σ
(x−a
σx )2+
y−b σy
2
= fX(x).fY(y)
1.3 Khoảng cách biến phân toàn phần
Kí hiệu Ω là không gian độ đo với δ - đại số A
Định nghĩa 1.11 : Gọi µ, ν là hai độ đo xác suất trên Ω Khi đó khoảngcách biến phân toàn phần được định nghĩa bởi:
dT V(µ, ν) := sup
A∈A
|µ(A) − ν(A)|
1.4 Sự hội tụ của dãy các biến ngẫu nhiên
Giả sử (Xn) là dãy các biến ngẫu nhiên trong không gian xác suất
(Ω, A, P ) Ta có các định nghĩa hội tụ sau:
Định nghĩa 1.12 : Dãy biến ngẫu nhiên (Xn) được gọi là hội tụ theoxác suất tới biến ngẫu nhiên X, kí hiệu Xn −→ X, nếu với ε > 0 bất kìthì :
limn→∞P (|Xn − X| ≥ ε) = 0
Định nghĩa 1.13 : Dãy biến ngẫu nhiên (Xn) được gọi là hội tụ hầuchắc chắn (hay hội tụ với xác suất 1) tới biến ngẫu nhiên X, kí hiệu
Xn −→ X, nếu tồn tại tập A có xác suất không sao cho với ω /∈ A:
Xn(ω) → X(ω)
Trang 14Định nghĩa 1.14 : Dãy biến ngẫu nhiên (Xn) được gọi là hội tụ theotrung bình bậc p tới biến ngẫu nhiên X, kí hiệu Xn −→ X, nếu:
1.5 Phương pháp Stein cho xấp xỉ chuẩn
Trong lý thuyết xác suất không phải phân bố của biến ngẫu nhiên nàocũng được xác định rõ ràng Điều đó điều hỏi chúng ta phải xấp xỉ mộtphân bố phức tạp bằng một phân bố đơn giản hơn Phương pháp Stein là
là phương pháp mới được công bố năm 1972 Đó là phương pháp dùng đểsuy ra ước lượng xấp xỉ của phân bố này bởi một phân bố khác, là công
cụ cho xấp xỉ không chỉ tốt với các biến ngẫu nhiên độc lập mà còn dùngcho cả các biến ngẫu nhiên phụ thuộc Hơn nữa ta có thể ước lượng sai sốcủa xấp xỉ một cách trực tiếp
1.5.1 Phương trình Stein và ý nghĩa
Cho X là biến ngẫu nhiên có phân phối chuẩn hóa
h là hàm đo được nhận giá trị thực cho trước sao cho E |h (X)| < ∞
f : R → R là hàm liên tục và có đạo hàm liên tục trên từng đoạnthỏa mãn E f0(X) < ∞ Khi đó ta có:
f0(ω) − ωf (ω) = h (ω) − Eh (X) (1.1)
Trang 15Phương trình (1.1) được gọi là phương trình Stein tổng quát.
E {f0(W ) − W f(W )} = Eh(W ) − Eh(X) (1.3)
P (W ≤ x) − Φ(x) = E {f0(W ) − W f(W )} (1.4)Trong hai phương trình (1.3), (1.4) thay vì ước lượng vế phải ta điước lượng vế trái đơn giản hơn Đó là ý nghĩa thiết thực của phương trìnhStein
Ki(t) = EXi I{0≤t≤Xi} − I{Xi≤t<0} Khi đó thì:
Ki(t) ≥ 0, ∀t ∈ R+∞
Trang 16Viết dưới dạng tích phân ta được:
1.5.3 Xấp xỉ chuẩn của hàm trơn
Trong phần này, tác giả sẽ đưa ra các ước lượng Eh(W) - Eh(X) chocác lớp biến ngẫu nhiên khác nhau với:
h là một hàm trơn thỏa mãn: kh0k := sup
x
|h0(x)| < ∞
X là biến nhẫu nhiên có phân phối chuẩn hóa
Định lý 1.1 Giả sử tồn tại δ > 0 sao cho với hàm h - Lipschiz đều ta có
Trang 17|Eh(W) −Eh(X)| ≤ δ kh0k thì:
suph∈Lip(1)
|Eh(W ) − Eh(X)| ≤ δ (1.8)
supx
|P (W ≤ x) − Φ(x)| ≤ 2.δ1/2 (1.9)Định lý trên cho thấy cận trên của khoảng cách |Eh(W) −Eh(X)|
tương ứng với cận trên của khoảng cách |P (W ≤ x) − Φ(x)| Sau đây làcác hệ quả suy ra từ định lý (1.1):
Hệ quả 1.1 ChoX1, X2, , Xn là các biến ngẫu nhiên độc lập có EXi = 0
Hệ quả 1.2 Cho X1, X2 , Xn là các biến ngẫu nhiên độc lập có EXi = 0
Trang 18Chương 2
Bất đẳng thức Berry - Esseen một chiều
2.1 Giới thiệu chung
Trong lý thuyết xác suất và thống kê ứng dụng, định lý giới hạn trungtâm là một trong những định lý cơ bản và có nhiều ứng dụng thực tiễn.Định lý này khẳng định:
Nếu (Xn) là các đại lượng ngẫu nhiên độc lập cùng phân phối có
EXi = µ và DXi = δ2, i = 1, , n
Đặt Wn = X1 +X 2 + X n −nµ
δ √
n và Fn(x) là hàm phân phối của Wn
Khi đó: với mọi x ∈ R thì Fn(x) hội tụ yếu đến hàm phân phối chuẩnhóa Φ(x)
Tuy nhiên định lý này chỉ cho biết về sự hội tụ yếu của Fn(x) → Φ(x)
mà chưa đánh giá được tốc độ hội tụ của nó Berry (1941) và Esseen (1942)
là hai nhà toán học đầu tiên đã độc lập đưa ra một bất đẳng thức cho phépđánh giá khoảng cách giữa Fn(x) và Φ(x) Vì vậy bất đẳng thức mang tênhai ông ra đời, đó là bất đẳng thức Berry – Esseen
Kể từ đó, nhiều nhà toán học trên thế giới đã quan tâm đến việc xácđịnh cận cho bất đẳng thức Berry – Esseen nhằm thu hẹp khoảng cáchgiữa Fn(x) và Φ(x) Khoảng cách này càng nhỏ thì xấp xỉ chúng ta cầncàng có giá trị Hơn nữa trong thống kê bài toán cỡ mẫu tối thiểu có ý
Trang 19nghĩa thực tế vô cùng to lớn Nhờ bất đẳng thức Berry - Esseen ta có thểxác định cỡ mẫu tối thiểu n nhỏ hơn đáng kể so với kết quả có được bằngcác phương pháp khác.
Với ý nghĩa thiết thực như vậy, tác giả nghiên cứu đề tài "Bất đẳngthức Berry - Esseen" Chương này tác giả trình bày về bất đẳng thức Berry
|P (Wn ≤ x) − Φ(x)| ≤ C
n1/2
βσ
Năm 1942, Esseen chỉ ra C ≤ 7.59, sau đó là C ≤ 2.9 năm 1956Năm 1958, Wallace chứng minh được C ≤ 2.05
Năm 1967, Zolotarev chỉ ra C ≤ 0.81097
Năm 1982, Shiganov khẳng định C ≤ 0.7655
Kết quả tốt nhất thuộc về Tyurin (năm 2009) đưa ra C ≤ 0.4785Với mỗi nhà toán học thì bất đẳng thức Berry - Esseen có một phiên
Trang 20bản khác nhau Năm 1965, Petrov đưa ra phát biểu tổng quát hơn khithêm vào tham số δ ∈ (0, 1] Định lý (2.1) chỉ là trường hợp riêng khi
δ = 1 Petrov chứng minh được:
Định lý 2.2 Nếu (Xi) là các đại lượng ngẫu nhiên độc lập cùng phân bốcó: EXi = 0, DXi = σ2, β2+δ = E |Xi|2+δ < ∞, ∀i
|P (Wn ≤ x) − Φ(x)| ≤ Cδ
nδ/2
βσ
2+δ
(2.2)
2.2.2 Trường hợp không cùng phân bố
Sau khi đưa ra định lý 2.1 ở trên, Berry - Esseen tiếp tục mở rộngđịnh lý cho trường hợp không cùng phân bố Kết quả nghiên cứu của họnhư sau:
Định lý 2.3 Nếu (Xi) là các đại lượng ngẫu nhiên độc lập (không nhấtthiết cùng phân bố) có: EXi = 0, DXi = σi2
Esseen (năm 1945) chỉ ra C ≤ 7.5
Bergstrom (năm 1949) chứng minh được C ≤ 4.8
Beck (năm 1972) khẳng định C ≤ 0.7975
Kết quả tốt nhất thuộc về Tyurin (năm 2010) với C ≤ 0.5606
Trải qua nhiều năm nghiên cứu, các tác giả đã đưa ra bất đẳng thứcBerry – Esseen dưới nhiều dạng khác nhau về mặt hình thức cũng như
Trang 21cách chứng minh bất đẳng thức này Phát biểu sau đây có thể coi là kháiquát hơn cả Nó được đưa ra bởi Katz (năm 1963) và Petrov (năm 1965)với sự có mặt của tham số δ ∈ (0, 1] Cụ thể:
Định lý 2.4 Nếu (Xi) là các đại lượng ngẫu nhiên độc lập (không nhấtthiết cùng phân bố) có: EXi = 0, DXi = σi2
2.2.3 Chứng minh bất đẳng thức Berry - Esseen đều
Trong mục này tác giả trình bày chứng minh định lý 2.4 Vì đây làđịnh lý tổng quát nhất cho trường hợp bất đẳng thức Berry - Esseen đều
dx
dt ≥ 2M δ(π
2 − 6
T δ)
Từ đó ta có điều phải chứng minh
Bổ đề 2.3 Giả sử (Xi) là dãy các biến ngẫu nhiên độc lập có: EXi = 0,
DXi = δi2 Gọi ϕ∗n(t) là hàm đặc trưng của Sn =
n
P
i=1
Xi.Đặt s2n =
≤ 3
Γnt
sn
γi|t|
sn
2+δ, |θ| ≤ 1
Với |t| ≤ sn
2Γ n ta có
tδi
s n
≤ ... hội tụ Berry (1941) Esseen (1942)
là hai nhà toán học độc lập đưa bất đẳng thức cho phépđánh giá khoảng cách Fn(x) Φ(x) Vì bất đẳng thức mang tênhai ơng đời, bất đẳng thức Berry. ..
2.2.3 Chứng minh bất đẳng thức Berry - Esseen đều
Trong mục tác giả trình bày chứng minh định lý 2.4 Vì làđịnh lý tổng quát cho trường hợp bất đẳng thức Berry - Esseen
... đưa bất đẳng thứcBerry – Esseen nhiều dạng khác mặt hình thức
Trang 21cách chứng minh bất đẳng thức