Điều này đặt ra vấn đềnghiên cứu bài toán ước lượng hàm mật độ trong các mô hình thống kê có sai số đo.Trong luận án này, chúng tôi khảo sát một mô hình thống kê có sai số đo vàđược ứng
Trang 1ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
CAO XUÂN PHƯƠNG
BÀI TOÁN GIẢI CHẬP TRONG THỐNG KÊ PHI THAM SỐ
LUẬN ÁN TIẾN SĨ TOÁN HỌC
TP Hồ Chí Minh – Năm 2018
Trang 2ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
CAO XUÂN PHƯƠNG
BÀI TOÁN GIẢI CHẬP TRONG THỐNG KÊ PHI THAM SỐ
Chuyên ngành: LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN HỌC
Mã số chuyên ngành: 62460106
Phản biện độc lập 1: GS TSKH NGUYỄN HỮU DƯ
Phản biện độc lập 2: TS VÕ VĂN TÀI
NGƯỜI HƯỚNG DẪN KHOA HỌC: GS TS ĐẶNG ĐỨC TRỌNG
Tp Hồ Chí Minh – Năm 2018
Trang 3Lời cam đoan
Tôi xin cam đoan các kết quả trong luận án là trung thực và chưa từng được ai công
bố trong bất kỳ một công trình nào khác
Nghiên cứu sinh
Cao Xuân Phương
Trang 4Lời cảm ơn
Trong những dòng đầu tiên của luận án, tôi xin cảm ơn công lao giảng dạy củacác Thầy Cô trong Khoa Toán-Tin học, Trường Đại học Khoa học Tự nhiên-Đại họcQuốc gia Tp Hồ Chí Minh Các Thầy Cô đã dành cho tôi tất cả tấm lòng “ngườithầy” trong những năm học ở bậc đại học, cao học và nghiên cứu sinh Chính nhữngkiến thức mà tôi tiếp thu được từ các Thầy Cô trong suốt những năm qua là nền tảnghết sức quan trọng để tôi có thể hoàn thành được luận án này
Tôi kính gửi những tình cảm tốt đẹp nhất và lòng biết ơn chân thành của mìnhđến Thầy GS TS Đặng Đức Trọng, Trưởng Khoa Toán-Tin học, Trường Đại họcKhoa học Tự nhiên-Đại học Quốc gia Tp Hồ Chí Minh, về sự tận tình hướng dẫn,chỉ dạy của Thầy đối với tôi trong suốt quá trình học tập, nghiên cứu và hoàn thànhluận án này
Tôi xin bày tỏ lòng biết ơn đến Ban giám hiệu, các Thầy Cô thuộc Phòng Sauđại học của Trường Đại học Khoa học Tự nhiên-Đại học Quốc gia Tp Hồ Chí Minh
đã tạo mọi điều kiện thuận lợi giúp tôi hoàn thành chương trình nghiên cứu sinh.Kính gửi đến Ban giám hiệu, Ban chủ nhiệm Khoa Toán-Thống kê của TrườngĐại học Tôn Đức Thắng và các anh chị đồng nghiệp tại trường lời cảm ơn sâu sắc vì
sự hỗ trợ nhiều mặt để tôi có thể hoàn thành chương trình nghiên cứu sinh
Cuối cùng, tôi xin gửi tất cả những lời thân thương nhất đến các thành viên củagia đình tôi, những người đã luôn bên tôi những lúc khó khăn, luôn động viên, hỗ trợ
và tạo mọi điều kiện thuận lợi nhất để tôi học tập
Tp Hồ Chí Minh, ngày 13 tháng 05 năm 2018
Cao Xuân Phương
Trang 5Mục lục
1.1 Ước lượng vững và rủi ro minimax 10
1.2 Một số kiến thức về Xác suất 11
1.3 Không gian Lp 12
1.4 Tích chập trên R 14
1.5 Giá của hàm số 14
1.6 Đạo hàm suy rộng 15
1.7 Biến đổi Fourier 15
1.8 Hàm mật độ trơn thường và siêu trơn 17
1.9 Hàm giải tích 17
1.10 Bài toán đặt không chỉnh và sơ đồ chỉnh hóa 24
1.11 Chỉnh hóa Tikhonov 25
2 Chỉnh hóa Tikhonov cho bài toán giải chập 26 2.1 Giới thiệu 26
2.2 Ước lượng Tikhonov 28
2.3 Các kết quả xấp xỉ 29
2.4 Các chứng minh 33
3 Chỉnh hóa tham số chóp cho bài toán giải chập với phân phối sai số chưa biết 42 3.1 Giới thiệu 42
3.2 Phương pháp ước lượng 43
3.3 Các kết quả xấp xỉ 44
Trang 63.4 Các chứng minh 48
4 Bài toán giải chập với các sai số không cùng phân phối 58 4.1 Giới thiệu 58
4.2 Phương pháp ước lượng 60
4.3 Các kết quả xấp xỉ 62
4.4 Các thử nghiệm số 66
4.5 Các chứng minh 72
Trang 7f(k) Đạo hàm (suy rộng) cấp k của hàm f
fft Biến đổi Fourier của hàm f, fft(t) =R∞
−∞f (x) eitxdx
−∞f (x − u) g (u) du
IA Hàm chỉ tiêu của tập A, IA(x) = 1 nếu x ∈ A và IA(x) = 0 nếu x /∈ A
P(A) Xác suất của sự kiện A
an = O(bn) an ≤ const ·bn, với mọi n đủ lớn
an,m = O(bn,m)an,m ≤ const ·bn,m, với mọi n, m đủ lớn
an bn an = O(bn) và bn = O(an)
λ(A) Độ đo Lebesgue của tập Lebesgue đo được A ⊂R
dae Số nguyên nhỏ nhất lớn hơn hay bằng a
Trang 8Mở đầu
Ước lượng hàm mật độ là một trong những bài toán cơ bản nhất của thống kêphi tham số Bài toán này bắt đầu được nghiên cứu trong những bài báo Rosenblatt[43], Parzen [41] Từ đó đến nay, rất nhiều công trình nghiên cứu đã đề cập đến bàitoán này trên nhiều khía cạnh khác nhau Chúng ta có thể xem những tổng hợptương đối đầy đủ về bài toán này trong các tài liệu Devroye-Gyo¨rfi [11], Wasserman[51], Tsybakov [50] và nhiều tài liệu khác
Giả sửX là một dấu hiệu định lượng trên một tổng thể mà được mô hình như làmột biến số ngẫu nhiên liên tục Ta mong muốn ước lượng hàm mật độ f của X Vềnguyên tắc, việc ước lượng f được dựa trên một mẫu quan trắc(X1, , Xn) về dấuhiệu X Các quan trắc này thường được giả sử là độc lập và cùng phân phối (xácsuất) Tính độc lập được suy ra từ một giả thiết là các quan trắc này không ảnhhưởng lẫn nhau, trong khi giả sử về tính cùng phân phối là hợp lý nếu các quan trắcnày được đo trong những hoàn cảnh giống nhau Trong thực tế, những quan trắctrực tiếp của X có thể không có sẵn bởi vì các sai số đo xuất hiện trong quá trình
đo Các sai số đo này có thể xuất hiện từ nhiều nguyên nhân, chẳng hạn như dụng
cụ đo, phương pháp đo Nói khác đi, các quan trắc nhận được có thể không phải làcác thể hiện của X Trong Meister [37], mục 2.1, ta có thể tìm thấy một số ví dụthực tế về những phép đo có sai số không thể bỏ qua được Điều này đặt ra vấn đềnghiên cứu bài toán ước lượng hàm mật độ trong các mô hình thống kê có sai số đo.Trong luận án này, chúng tôi khảo sát một mô hình thống kê có sai số đo vàđược ứng dụng nhiều trong thực tế, đó là mô hình sai số đo cộng tính (additivemeasurement error model) Mô hình này có dạng
trong đó (Yj)1≤j≤n, (Xj)1≤j≤n và (Zj)1≤j≤n tương ứng là các dãy hữu hạn các biến
số ngẫu nhiên liên tục độc lập Ta giả thiết rằng các biến sốX1, , Xn có cùng phânphối, và hơn nữa, véc tơ (X1, , Xn)độc lập với véc tơ (Z1, , Zn) Trong mô hìnhnày,X1, , Xn là các biến số được quan tâm nhưng không được quan trắc,Y1, , Yn
là các quan trắc (dữ liệu), Z1, , Zn là các sai số đo (nhiễu) trên dữ liệu Bài toán
là tìm một ước lượng cho hàm mật độ chung f của mỗi biến số Xj dựa trên cơ sởcác quan trắc Y1, , Yn Bài toán này được gọi là bài toán giải chập (deconvolutionproblem) và thuộc loại các bài toán ngược (inverse problems) trong thống kê phi
Trang 9tham số.
Luận án nghiên cứu bài toán giải chập trong ba trường hợp sau đây của các sai
số đo Z1, , Zn:
(i) Z1, , Zn là độc lập và cùng phân phối Hàm mật độ chung g của mỗi biến số
Zj được giả thiết biết trước và thỏa mãn
(ii) Z1, , Zn là độc lập và cùng phân phối Hàm mật độ chung g của mỗi biến số
Zj chưa được biết nhưng thỏa mãn
g ∈ L2(R), supp(g) ⊂ [−S, S]
với S > 0 Ở đây ký hiệu supp(g) biểu thị giá (support) của hàm g
(iii) Z1, , Zn là độc lập, tuy nhiên các sai số đo này có thể khác phân phối Hàmmật độ gj (j = 1, , n) của biến sốZj được giả thiết biết trước và thỏa mãn
supp (gj) ⊂ [−S, S] , j = 1, , n,
trong đó S là hằng số dương độc lập với n
Sau đây chúng tôi giới thiệu phần tổng quan về bài toán giải chập nhằm mục đíchchỉ ra sự không trùng lặp của các trường hợp (i), (ii) và (iii) ở trên với các trườnghợp của các sai số đo đã được nghiên cứu trong lịch sử
Về mặt lịch sử, bài toán giải chập bắt đầu được quan tâm khảo sát vào khoảngthập niên 80 của thế kỷ 20 với những nghiên cứu tiên phong tiêu biểu của Mendelsohn-Rice [32], Carroll-Hall [6], Liu-Taylor [26], Stefanski-Carroll [46] Bài toán này có thểđược ứng dụng vào một số lĩnh vực, như khôi phục ảnh và tín hiệu, thống kê y học,kinh tế lượng, Với bài toán giải chập, công cụ toán học được sử dụng phổ biếnnhất là phép biến đổi Fourier Biến đổi Fourier của một hàm φ ∈ L1(R) được xácđịnh bởi
Trang 10Bài toán giải chập với các sai số đo Z1, , Zn cùng phân phối là loại bài toángiải chập được nghiên cứu rộng rãi nhất Trong đa số nghiên cứu về loại bài toán này,hàm mật độ chungg của mỗi biến sốZj được giả thiết biết trước và được gọi là hàmmật độ sai số Độc giả có thể tham khảo Carroll-Hall [6], Devroye [12], Liu-Taylor[26], Taylor-Zhang [49], Stefanski [48], Fan [16, 17], Pensky-Vidakovic [42], Fan-Koo[19], Lee-Taylor [28], Comte và các cộng sự [7], Hall-Meister [23], Butucea-Tsybakov[3], Lounici-Nickl [30] và nhiều nghiên cứu khác Đây có thể được xem như là mộtgiả thiết cổ điển cho loại bài toán này Với giả thiết này, cách tiếp cận chung trongviệc xây dựng ước lượng cho f là như sau: từ sự độc lập của Xj và Zj, hàm mật độ
h của Yj liên hệ với các hàm mật độ f, g thông qua đẳng thức
sở mẫu quan trắc (Y1, , Yn) và thay thế hàm 1
g ft bằng một hàm G thích hợp saocho G(t) ≈ gft1(t) và GΦ ∈ L1(R) ∪ L2(R) Khi đó, một ước lượng cho f được đề xuấtdưới dạng
Trang 11Một vài phương pháp đã được phát triển dựa theo cách tiếp cận này, chẳng hạnphương pháp nhân (kernel method) và phương pháp wavelet (wavelet method) Vớiphương pháp nhân, hàm mật độ f được ước lượng bởi
trong đó K là một hàm nhân sao cho biến đổi Fourier Kft có giá com-pắc, tham
số bn > 0 được chọn theo cỡ mẫu n sao cho limn→∞bn = 0 Ước lượng ˆKer được
Stefanski và Carroll giới thiệu lần đầu tiên trong bài báo [46] và được biết đến nhưước lượng nhân giải chập mật độ chuẩn (the standard density deconvolution kernelestimator) Ước lượng này và các phiên bản cải tiến của nó đã được sử dụng rộngrãi trong rất nhiều nghiên cứu về sau, chẳng hạn như Carroll-Hall [6], Devroye [12],Liu-Taylor [26], Stefanski [48], Fan [16, 17], Butucea-Tsybakov [3] Với phương phápwavelet, hàm mật độ f được ước lượng bởi
ˆWave(x; Y1, , Yn) = X
12π
Lưu ý rằng điều kiện (3) ở trên được thỏa mãn với rất nhiều hàm mật độ thôngdụng, ví dụ như các hàm mật độ chuẩn, Cauchy, Laplace, gamma Fan [16] đã đặctrưng hai loại hàm mật độ sai số g thỏa mãn (3) dựa trên tốc độ tắt dần của biếnđổi Fourier gft tại vô cực Loại thứ nhất là các hàm mật độ sai số “trơn thường” vàloại thứ hai là các hàm mật độ sai số “siêu trơn” Cụ thể hơn, hàm mật độ sai số g
được gọi là trơn thường (ordinary smooth) bậc γ > 0 nếu tồn tại 0 < c1 < c2 sao cho
Trang 12chẳng hạn như Fan [17, 18], Pensky-Vidakovic [42], Fan-Koo [19], Lee-Taylor [28],Comte và các cộng sự [7], Butucea-Tsybakov [3], Lounici-Nickl [30].
Bài toán giải chập trong trường hợpZ gft
6= ∅là một bài toán khó Trường hợpnày xảy ra với các hàm mật độ đều, các hàm mật độ tam giác, tích chập của các hàmmật độ đều, tích chập của một hàm mật độ đều với một hàm mật độ tùy ý khác,hay tổng quát hơn là các hàm mật độ có giá com-pắc, Trường hợp này cũng đãđược khảo sát trong một số nghiên cứu, như Devroye [12], Groeneboom-Jongbloed[21], Meister [34, 36], Hall-Meister [23], Feuerverger và các cộng sự [20], Delaigle-Meister [15] Devroye trong [12] đã chứng minh sự tồn tại của một ước lượng vữngtheo trung bình tương ứng với sai số-L1 khi tập hợpZ(gft)có độ đo Lebesgue không.Groeneboom và Longbloed trong [21] đã tập trung vào trường hợp g là hàm mật độđều trên khoảng [0, 1)và đề xuất một ước lượng cho f dựa trên hàm phân phối thựcnghiệm của mẫu (Y1, , Yn) Meister trong [34] đã chứng minh sự tồn tại của mộtước lượng vững theo trung bình tương ứng với sai số-L2 có trọng số trên miền Fourierkhi tập hợp Z(gft) không chứa bất kỳ khoảng mở khác rỗng nào của R, một trườnghợp rất tổng quát của g Meister trong [35] đã xem xét trường hợp biến đổi Fourier
gft đã được biết và bị chặn dưới bởi một hằng số dương trong một khoảng đóng Tácgiả đã xây dựng một ước lượng chuỗi trực giao cho f theo các đa thức Legendre vàsau đó khảo sát tốc độ hội tụ của sai số-L2 trung bình khi hàm mật độ mục tiêu f
có giá com-pắc Đặc biệt, Hall và Meister trong [23] đã khảo sát trường hợp g thỏamãn điều kiện
c1|sin (ηt)|µ|t|−ν ≤ gft(t) ≤ c2|sin (ηt)|µ|t|−ν với |t| > T (5)
và gft(t) > 0 với |t| ≤ T, trong đó 0 < c1 < c2, η > 0, µ ≥ 1, ν > 0 và T > 0 Ướclượng cho f trong bài báo này có dạng
khi giá của hàm f bị chặn dưới và hàm mật độ sai số g thỏa mãn
Trang 13
trong đó c > 0, η > 0, µ ∈ Z+ và ν > 0 Từ điều kiện (5) cũng như điều kiện (6),
ta suy ra hàm gft có các không điểm cô lập (isolated zeros) trên R, và thậm chí cáckhông điểm này là tuần hoàn trên các khoảng (−∞, 0) và (0, ∞) Các điều kiện nàyđược thỏa mãn nếu g = g1∗ g2, trong đó g1 là hàm mật độ đều trên [−a, a] và g2 làhàm mật độ Laplace Tuy nhiên, nếu g = g1∗ g2, trong đó g1 và g2 lần lượt là cáchàm mật độ đều trên[−a, a] và[−b, b]với ab ∈/ Z, thì các không điểm trên R của hàm
gft là cô lập nhưng không tuần hoàn, và khi đó các điều kiện (5) và (6) không đượcthỏa mãn Theo hiểu biết của chúng tôi, hiện nay vẫn chưa có nghiên cứu nào về tốc
độ hội tụ của ước lượng giải chập trong trường hợp các không điểm của hàm gft là
cô lập, không tuần hoàn
Trong hầu hết các tình huống thực tế, hàm mật độ sai số g thường không đượcbiết Khi đó, các ước lượng được đề cập ở trên không thể được áp dụng Do vậy,vấn đề nghiên cứu bài toán giải chập trong tình huống hàm mật độ sai số g khôngđược biết mang lại nhiều ý nghĩa về mặt ứng dụng Chúng ta đề cập đến bài báoDiggle-Hall [13] như là nghiên cứu đầu tiên liên quan đến tình huống này Trong bàibáo này, thay thế cho giả thiết hàm g được biết trước, các tác giả đã giả thiết rằng
có một mẫu quan trắc ngẫu nhiên bổ sung (Z10, , Zm0 ) được lấy từ phân phối sai
số Mẫu bổ sung này được thu thập từ các phép đo tách rời với mô hình (1) và độclập với mẫu (Y1, , Yn) Từ đó, các tác giả đã ước lượng gft(t) chưa biết bởi
gft(t)
1n
trong đóK là một hàm nhân với biến đổi FourierKftcó giá com-pắc,ρ > 0,H(u) ≈ u1
và A là một tập con Lebesgue đo được của R Neumann trong [39] đã xét ước lượng
Trang 14ˆU với A = {u ∈ R : |ˆgft(u)|2 ≥ m−1}, H(u) = 1/u và chứng minh tính tối ưu về tốc
độ hội tụ của sai số-L2 trung bình dưới giả thiết hàm mật độ sai số g là trơn thường.Johannes trong [24] đã nghiên cứu tính vững theo trung bình và tốc độ hội tụ củaước lượng ˆU với H(u) = 1/u, A = {u ∈ R : |ˆgft(u)|2 ≥ ξ(1 + u2)s} (ξ := ξ(n, m) > 0,
s ∈ R) dưới các giả thiết trơn thường và siêu trơn củag Comte và Lacour trong [9]
đã khảo sát sai số-L2 trung bình của ước lượng ˆU vớiKft(t) =I[−π,π](t),H(u) = 1/u
và A = {u ∈ R : |ˆgft(u)|2 ≥ m−1}, và sau đó đưa ra một ước lượng tương thích(adaptive estimator) cho f Gần đây, Wang và Ye trong [53] đã khảo sát ước lượng
ˆU với H(u) = ¯u/ max{|u|2; m−1} và A = R Các tác giả đã thiết lập các chặn trên
về tốc độ hội tụ của sai số-L2 trung bình khi hàm mật độ g là trơn thường và siêutrơn; thêm vào đó, các tác giả cũng đã đề xuất một cách chọn thực nghiệm cho tham
số chỉnh hóa ρ dựa trên phương pháp bootstrap loại SIMEX Chúng ta có thể nhậnthấy một điểm chung trong các nghiên cứu vừa đề cập là giả thiết Z(gft) = ∅ Trong
nổ lực tìm kiếm những công trình nghiên cứu về bài toán giải chập khi hàm mật độsai sốg chưa biết, chúng tôi thấy rằng vẫn chưa có các bài báo đề cập đến tình huống
Z(gft) 6= ∅
Trong nhiều ứng dụng, các sai số đo Z1, , Zn có thể không cùng phân phối.Thật ra, quá trình đo có thể thay đổi từ cá thể này sang cá thể khác, và khi đó phânphối sai số có thể khác nhau giữa các quan trắc Do đó, vấn đề nghiên cứu bài toángiải chập với các sai số đo Z1, , Zn không cùng phân phối có nhiều ý nghĩa khoahọc và thực tiễn Nghiên cứu đầu tiên cho loại bài toán này là Delaigle-Meister [14].Các tác giả đã đề xuất một ước lượng giải chập loại nhân và chứng minh tính tối ưu
về tốc độ hội tụ của sai số-L2 trung bình khi các hàm gjft,j = 1, , n, thỏa mãn một
số điều kiện đặc biệt, trong đó có một điều kiện là Z(gjft) = ∅ với một j ∈ {1, , n}
Ở đây, gj là hàm mật độ củaZj Tiếp nối Delaigle-Meister [14], một vài nghiên cứu,như Wang và các cộng sự [52], McIntyre-Stefanski [38], Chesneau-Fadili [10], Wang
và các cộng sự [54], cũng đã khảo sát loại bài toán giải chập này Tuy nhiên, cácnghiên cứu này cũng chỉ tập trung vào trường hợp Z(gft
j) = ∅ với mọi j = 1, , n
Từ phần tổng quan trên, chúng tôi thấy rằng mặc dù bài toán giải chập đã đượcnghiên cứu rộng rãi trong lịch sử nhưng hiện nay vẫn còn một số trường hợp liênquan đến các sai số đo vẫn chưa được quan tâm khảo sát, đặc biệt là những trườnghợp mà hàm đặc trưng của các sai số đo có các không điểm trên R Do vậy, luận ánkhảo sát các trường hợp (i), (ii) và (iii) ở trên nhằm mục đích lấp một phần khoảngtrống này Trong các trường hợp này, hàm đặc trưng của các sai số đo có thể có các
Trang 15không điểm trên R Thêm vào đó, không có bất kỳ ràng buộc đặc biệt nào về vị trícủa các không điểm này Theo hiểu biết của chúng tôi, những trường hợp này chưatừng được nghiên cứu trong lịch sử bài toán giải chập.
Nội dung của luận án được viết dựa trên các kết quả đã công bố trong các bàibáo [P1], [P2] và [P4] Phần còn lại của luận án được chia thành 4 chương Chương
1 trình bày một số kiến thức chuẩn bị để sử dụng cho nội dung chính của luận án.Chương 2 trình bày chỉnh hóa Tikhonov cho bài toán giải chập tương ứng với trườnghợp (i) Chương 3 trình bày chỉnh hóa tham số chóp cho bài toán giải chập tươngứng với trường hợp (ii) Cuối cùng, chương 4 trình bày chỉnh hóa Tikhonov cho bàitoán giải chập tương ứng với trường hợp (iii)
Trang 16do chính chúng tôi thiết lập, như Định lý 1.7.7, Mệnh đề 1.9.3, Mệnh đề 1.9.4, Bổ
đề 1.9.6 và Bổ đề 1.9.7, và do đó phần chứng minh của những kết quả này sẽ đượctrình bày chi tiết
1.1 Ước lượng vững và rủi ro minimax
ChoWX = (X1, , Xn)là một mẫu ngẫu nhiên từ một phân phối xác suất liêntục với hàm mật độ f chưa biết Giả sử f (·; Xˆ 1, , Xn) là một ước lượng của f sao
cho các hàm f , fˆ cùng thuộc về một không gian bán-metric (C, d) hầu chắc chắn Ở
đây bán-metric (semi-metric)dtrênC được xác định như là ánh xạd : C × C → [0, ∞)
thỏa mãn các điều kiện: d(u, u) = 0 với mọi u ∈ C; d(u, v) = d(v, u) với mọi u, v ∈ C;
d(u, v) ≤ d(u, w) + d(w, v) với mọi u, v, w ∈ C
Chok ∈Z+ Để đặc trưng cho sự sai khác giữa ước lượng ˆvà hàm mật độ mục
tiêu f, ta có thể sử dụng đại lượng dk( ˆf , f ) hay đại lượng Edk( ˆf , f ), gọi là các ướclượng sai số hay vắn tắt là các sai số Lưu ý rằng ở đây
Nếu dk( ˆf , f ) → 0 theo xác suất, khi n → ∞, ta nói ˆlà một ước lượng vững yếu
(weakly consistent) của f Nếu dk( ˆf , f ) → 0 hầu chắc chắn, khi n → ∞, ta nói ˆlà
một ước lượng vững mạnh (strongly consistent) của f Cuối cùng, nếu Edk( ˆf , f ) → 0
khi n → ∞, ta nói ˆlà một ước lượng vững theo trung bình (mean consistent) củaf.
Trang 17Bây giờ, xét F là một họ phi tham số các hàm mật độ sao cho mỗi phần tử của
F có thể được xem như là hàm mật độ mục tiêu f Khi đó, đại lượng
R[ ˆf ; F] := sup
f ∈FEdk( ˆf , f )
được gọi là rủi ro tối đa (maximum risk) của ước lượng ˆtrên lớp hàm F Hơn nữa,
đại lượng infˆ
nR[ ˆfn; F], trong đó infimum được lấy trên họ tất cả các ước lượng ˆn
của f dựa trên mẫu WX, được gọi là rủi ro minimax (minimax risk) trên lớp hàm
F Đặc biệt, nếu ˆthỏa mãn
R[ ˆf ; F] = inf
ˆ
n
R[ ˆfn; F]
thì ta nói ˆlà một ước lượng minimax (minimax estimator) trên lớp hàm F.
Với ước lượng ˆ, nếu tồn tại một dãy số dương {ψn}n thỏa mãn ψn → 0 khi
R[ ˆf ; F] ≤ Cψn,
thì dãy {ψn}n được gọi là một tốc độ hội tụ (rate of convergence) của ˆtrên lớp hàm
F
Nếu tồn tại các hằng số dương c1, c2 độc lập với n và một dãy số dương {ϕn}n
thỏa mãn ϕn → 0 khi n → ∞ sao cho
c1ϕn ≤ inf
ˆn R[ ˆfn; F] ≤ c2ϕn,
thì dãy {ϕn}n được gọi là tốc độ hội tụ tối ưu (optimal rate of convergence) của cácước lượng trên lớp hàm F
Một ước lượng ˆ∗ thỏa mãn R[ ˆf∗; F] ≤ cϕn, trong đó {ϕn}n là tốc độ hội tụ tối
ưu trên lớp hàm F và hằng số dương c độc lập với n, được gọi là một ước lượng tối
ưu về tốc độ (rate optimal estimator)
1.2 Một số kiến thức về Xác suất
Định lý 1.2.1 NếuX1, , Xn là các biến số ngẫu nhiên độc lập và φ1, , φn là cáchàm Borel đo được thì φ1(X1), , φn(Xn) cũng là các biến số ngẫu nhiên độc lập.Hơn nữa, nếu E(|φj(Xj)|2) < ∞, j = 1, , n, thì
Trang 18Định lý 1.2.2 (Luật mạnh số lớn) (Xem Billingsley [2], trang 85) Giả sử{Xn}n
là một dãy các biến số ngẫu nhiên độc lập, cùng phân phối với E(|X1|) < ∞ Khi đó,
Định nghĩa 1.2.4 Cho X là một biến số ngẫu nhiên Hàm sốϕX :R→C, xác định
bởiϕX(t) =E eitX vớii =√−1, được gọi là hàm đặc trưng (characteristic function)của X
Giả sử(X1, , Xn)là một mẫu quan trắc ngẫu nhiên được lấy từ phân phối xácsuất của X Đặt
Ta gọi ϕˆX là hàm đặc trưng thực nghiệm (empirical characteristic function) của X
dựa trên mẫu (X1, , Xn)
Mệnh đề 1.2.5 Cho X là một biến số ngẫu nhiên Ta có
Trang 19kf k∞ = inf M > 0 : |f (x)| ≤ M với hầu hết x ∈ Ω
Ta định nghĩa
Lp(Ω, µ) = f : Ω →C đo được: kf kp < ∞ ,
L∞(Ω, µ) = {f : Ω → C đo được: kf k∞ < ∞}
Trong trường hợp Ω ⊂R và µlà độ đo Lebesgue trênΩ, để đơn giản ta dùng ký hiệu
Lp(Ω) thay cho Lp(Ω, µ), với 0 < p ≤ ∞ VớiA là tập Lebesgue đo được trong R, kýhiệu λ(A) biểu thị độ đo Lebesgue của A
Định lý 1.3.2 (Xem Rudin [44], trang 66) Cho (Ω,M, µ) là một không gian đo.(a) Nếu f ∈ Lp(Ω, µ), g ∈ Lq(Ω, µ) với p ≥ 1, q ≥ 1 và 1p +1q = 1, thì f g ∈ L1(Ω, µ).Hơn nữa, ta có bất đẳng thức kf gk1 ≤ kf kpkgkq, được gọi là bất đẳng thức
Ho¨lder Bất đẳng thức Ho¨lder với p = q = 2 còn được gọi là bất đẳng thứcCauchy-Schwarz
(b) Nếuf, g ∈ Lp(Ω, µ) với p ≥ 1, thì f + g ∈ Lp(Ω, µ) Hơn nữa, ta có bất đẳng thức
kf + gkp≤ kf kp+ kgkp, được gọi là bất đẳng thức Minkowski
Định lý 1.3.3 (Xem Rudin [44], trang 67) Cho (Ω,M, µ)là một không gian đo Khi
đó, (Lp(Ω, µ), k · kp), 1 ≤ p ≤ ∞, là không gian Banach
Định lý 1.3.4 (Định lý hội tụ bị chặn Lebesgue) (Xem Rudin [44], trang 26).Cho {fn}n là một dãy hàm giá trị phức đo được trên không gian đo (Ω,M, µ) sao cho
• với mọi x ∈ Ω, fn(x) → f (x) khi n → ∞;
• tồn tại g ∈ L1(Ω, µ) sao cho |fn(x)| ≤ g (x) với mọi x ∈ Ω, n ∈N
Khi đó, f ∈ L1(Ω, µ), RΩ|fn− f | dµ → 0 và RΩfndµ →RΩf dµ khi n → ∞
Lưu ý rằng kết luận của định lý hội tụ bị chặn Lebesgue vẫn còn đúng khi ta thaycụm từ “với mọi x ∈ Ω” bằng cụm từ “với hầu hết x ∈ Ω”
Định lý 1.3.5 (Định lý Fubini) (Xem Rudin [44], trang 164–165) Cho (Ω,M, µ)
và (Γ,N, ν) là hai không gian đo σ-hữu hạn và cho f là một hàm (M×N)-đo đượctrên Ω × Γ
(a) Nếu 0 ≤ f ≤ ∞ và nếu
Trang 20thì ϕ là hàm M-đo được, ψ là hàm N-đo được và
Định lý 1.4.1 (Định lý Young) (Xem Brezis [4], trang 104) Cho f ∈ L1(R) và
g ∈ Lp(R), với 1 ≤ p ≤ ∞ Với hầu hết x ∈ R, hàm u 7→ f (x − u) g (u) khả tíchLebesgue trên R, và khi đó ta định nghĩa
Định nghĩa 1.5.1 Cho hàm số f :R→ R Bao đóng trong R của tập hợp {x ∈R :
f (x) 6= 0} được gọi là giá (support) của hàm f, ký hiệu supp (f ) Hàm f được gọi là
có giá com-pắc nếu supp (f ) là một tập com-pắc trong R
Mệnh đề 1.5.2 Cho f, g ∈ L1(R), supp (f ) ⊂ [a, b] và supp (g) ⊂ [c, d], với a ≤ b,
c ≤ d Khi đó, supp (f ∗ g) ⊂ [a + c, b + d]
Trang 21với mọi hàm ϕkhả vi liên tục vô hạn lần trên R và có giá com-pắc.
1.7 Biến đổi Fourier
Định nghĩa 1.7.1 Cho f ∈ L1(R) Hàm số fft:R →C, xác định bởi
fft(t) =
Z ∞
−∞
f (x) eitxdx,
được gọi là biến đổi Fourier của f
Mệnh đề 1.7.2 (Xem Meister [37], trang 179) Cho f, g ∈ L1(R) Ta có
(a) (af + bg)ft= afft+ bgft với mọi a, b ∈ C.
(b) supt∈R ... tốn giải chập tương ứng với trườnghợp (i) Chương trình bày chỉnh hóa tham số chóp cho tốn giải chập tươngứng với trường hợp (ii) Cuối cùng, chương trình bày chỉnh hóa Tikhonov cho bàitoán giải chập. .. sai số khác quan trắc Do đó, vấn đề nghiên cứu toángiải chập với sai số đo Z1, , Zn khơng phân phối có nhiều ý nghĩa khoahọc thực tiễn Nghiên cứu cho loại toán. .. sát loại toán giải chập Tuy nhiên, cácnghiên cứu tập trung vào trường hợp Z(gft
j) = ∅ với j = 1, , n
Từ phần tổng quan trên, thấy toán giải chập đượcnghiên