TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2KHOA TOÁN Bùi Thị Gấm TÌM HIỂU VỀ BÀI TOÁN TRUNG BÌNH HIỆU GINI KHÓA LUẬN TỐT NGHIỆP HỆ ĐẠI HỌC CHÍNH QUY Chuyên ngành: Toán ứng dụng Người hướng dẫn: ThS.
Trang 1TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA TOÁN
Bùi Thị Gấm
TÌM HIỂU VỀ BÀI TOÁN TRUNG BÌNH HIỆU GINI
KHÓA LUẬN TỐT NGHIỆP HỆ ĐẠI HỌC CHÍNH QUY
Chuyên ngành: Toán ứng dụng
Người hướng dẫn: ThS Nguyễn Trung Dũng
Hà Nội - 2014
Trang 2LỜI CẢM ƠN
Trong quá trình thực hiện khóa luận em đã nhận được nhiều sự giúp đỡ quý báu
và bổ ích từ các thầy cô và bạn bè Em xin chân thành cảm ơn các thầy cô trongkhoa Toán trường Đại học sư phạm Hà Nội 2 đã tận tâm giảng dạy, truyền thụ kiếnthức kinh nghiệm quý báu để em hoàn thành tốt khóa luận Đặc biệt, em xin bày
tỏ lòng cảm ơn sâu sắc của mình tới Thầy Nguyễn Trung Dũng, thầy đã trực tiếp
hướng dẫn, nhiệt tình giúp đỡ và chỉ bảo em trong suốt quá trình thực hiện khóa luận
Em xin chân thành cảm ơn các thầy cô trong tổ toán Ứng dụng- khoa toán, thưviện nhà trường, gia đình và bạn bè đã tạo mọi điều kiện, động viên, giúp đỡ để emhoàn thành khóa luận này
Hà Nội, ngày 10 tháng 05 năm 2014
Sinh viên
Bùi Thị Gấm
Trang 3LỜI CAM ĐOAN
Tôi cam đoan khóa luận "Tìm hiểu về bài toán trung bình hiệu Gini" là kết quả
nghiên cứu của tôi dưới sự hướng dẫn của Thầy Nguyễn Trung Dũng.
Tôi khẳng định kết quả nghiên cứu trong khóa luận này không trùng với kết quả củabất cứ tác giả nào Nếu sai sót tôi xin chịu hoàn toàn trách nhiệm
Hà Nội, ngày 10 tháng 05 năm 2014
Sinh viên
Bùi Thị Gấm
Trang 4Mục lục
1.1 Biến ngẫu nhiên và phân phối xác suất 2
1.1.1 Biến ngẫu nhiên 2
1.1.2 Biến ngẫu nhiên rời rạc 5
1.1.3 Biến ngẫu nhiên liên tục 6
1.2 Kì vọng và các tính chất 7
1.2.1 Phương sai và các tính chất 8
1.2.2 Ví dụ 9
1.3 Một số bất đẳng thức 12
1.3.1 Bất đẳng thức Hermite-Hadamard 12
1.3.2 Bất đẳng thức Cauchy-Schwarz 12
2 TRUNG BÌNH HIỆU GINI 13 2.1 Trung bình hiệu Gini với hàm phân phối lý thuyết 13
2.1.1 Bài toán mở đầu 13
2.2 Trung bình hiệu Gini với hàm phân phối thưc nghiệm 22
2.2.1 Cận trên theo sai phân tiến 26
2.2.2 Trung bình hiệu Gini sinh bởi các hàm 28
Trang 5MỞ ĐẦU
1 Lý do chọn đề tài
Toán ứng dụng là một bộ phận cấu thành Toán học, nó luôn gây được hứng thúcho người học bởi tính thực tiễn của mình Từ sau bài viết đầu tiên về trung bình hiệuGini(GMD) của nhà toán học người ý Corrado Gini(1912) đã có rất nhiều thành tựuđược tạo ra Trong khoảng hơn 80 năm GMD đã trở thành thước đo bất đẳng thức ,thước đo sai số thống kê được sử dụng trong các nền kinh tế Với ứng dụng thực tiễnnhư vậy và mong muốn tìm hiểu, nghiên cứu sâu hơn về bài toán này em chọn đề tài
" Tìm hiểu về bài toán trung bình hiệu Gini" làm đề tài khóa luận tốt nghiệp Đại
học cho mình
2 Đối tượng, phạm vi nghiên cứu
Đối tượng: Bài toán trung bình hiệu Gini
Phạm vi : Bài toán trung bình hiệu Gini với hàm phân phối lý thuyết và hàm phânphối thực nghiệm
3 Nhiệm vụ, mục đích nghiên cứu
Nghiên cứu về trung bình hiệu Gini, đánh giá chặn trên của trung bình hiệu Ginitrong hai trường hợp hàm phân phối lý thuyết và hàm phân phối thực nghiệm
4 Phương pháp nghiên cứu
Nghiên cứu qua sách giáo khoa, sách tham khảo, internet và các tài liệu có liênquan
Hà Nội, ngày 10 tháng 05 năm 2014
Sinh viên
Bùi Thị Gấm
Trang 6Chương 1
MỘT SỐ KIẾN THỨC CƠ SỞ
1.1 Biến ngẫu nhiên và phân phối xác suất
1.1.1 Biến ngẫu nhiên
Định nghĩa 1.1.1 Cho không gian xác suất (Ω, F ,P) Ánh xạ X: Ω → R được gọi
là một biến ngẫu nhiên nếu ∀B ∈ BR thì X−1(B) = {ω ∈ Ω : X (ω) ∈ B} ∈F
Định lý 1.1.1 Cho ánh xạ X :Ω → R khi đó các khẳng định sau là tương đương
1 X là biến ngẫu nhiên.
từ đó (1)⇒(2)
Trang 91.1.2 Biến ngẫu nhiên rời rạc
Định nghĩa 1.1.2 Phân phối xác suất: Hàm tập PX= P(ω ∈ Ω : X (ω) ∈ B), B ∈ BR
được gọi là phân phối xác suất của biến ngẫu nhiên X.
Định nghĩa 1.1.3 Giả sử (Ω, F ,P) là không gian xác suất, X: Ω → R là biến ngẫu
nhiên Khi đó, hàm số F(x) = P(X < x) = P(ω : X (ω) <x) được gọi là hàm phân
phối của X
Định nghĩa 1.1.4 Biến ngẫu nhiên X được gọi là biến ngẫu nhiên rời rạc nếu hàm
phân phối xác suất F(x) có hữu hạn hoặc không quá đếm được các điểm gián đoạn.
• Tính chất của hàm phân phối xác suất
Trang 101.1.3 Biến ngẫu nhiên liên tục
Định nghĩa 1.1.5 Biến ngẫu nhiên X được gọi là biến ngẫu nhiên liên tục nếu hàm
phân phối xác suất F(x) là tuyệt đối liên tục với độ đo Lebesgue của đường thẳng thực Tức là FX(x) =
x
R
−∞
fX(u)du, x ∈ R Hàm fX(x) được gọi là hàm mật độ xác suất
của biến ngẫu nhiên X
Trang 11Định nghĩa 1.2.1 Giả sử X : (Ω, F ,P) → (R,B) là biến ngẫu nhiên Khi đó tích
phân Lebesgue của X theo độ đo P (nếu tồn tại) được gọi là kì vọng của X và kí hiệu
3 Nếu tồn tại EX với mọi C ∈ R ta có E(CX) = CEX
4 Nếu tồn tại EX và EY thì E(X +Y ) = EX + EY và E(X −Y ) = EX − EY
x f(x)dx Nếu X là biến ngẫu nhiên liên tục có hàm mật độ f(x)
6 ( Định lí P.Levi về hội tụ đơn điệu)
Nếu Xn↑ ( tương ứng Xn↓ X) và tồn tại n để EXn−< ∞ (tương ứng EX+<
∞) thì EXn ↑ EX (tương ứng EXn↓ EX)
7 (Bổ đề Fatou)
Nếu Xn≥ Y với mọi n≥1 và EY > −∞ thì ElimXn≤ limEXn
Nếu Xn≤ Y với mọi n≥1 và EY < ∞ thì ElimXn≥ limEXn.
Trang 12Nếu|Xn| ≤ Y với mọi n ≥ 1 và EY < ∞ thì
ElimXn≤ limEXn ≤ limEXn ≤ ElimXn
Định nghĩa 1.2.2 Cho X là biến ngẫu nhiên xác định trên không gian xác suất(Ω, F ,P)
giả sử biến ngẫu nhiên X tồn tại kì vọng EX = µ Phương sai của biến ngẫu nhiên
X (nếu tồn tại) là một số kí hiệu là DX hoặc Var(X) được xác định bởi:
Var(X ) = E(X − µ)2
Ta có
• Nếu X là biến ngẫu nhiên rời rạc có phân phối xác suất pn= P(X = xn), n =
1, 2, thì phương sai của X được xác định bởi:
Trang 13b− a.
b2− a22
Trang 14Ví dụ 1.2.2 Cho X là biến ngẫu nhiên có phân phối chuẩn Tìm EX, DX.
−(x − µ)22.σ2
−(x − µ)22.σ2 dx
√2π .e
Trang 15−(x − µ)22σ2 dx
√2π e
= µ2+ σ
2
√2π
Trang 17Chương 2
TRUNG BÌNH HIỆU GINI
2.1 Trung bình hiệu Gini với hàm phân phối lý thuyết 2.1.1 Bài toán mở đầu
Giả sử X , X0 là hai biến ngẫu nhiên độc lập và có cùng phân phối xác suất Trongmục này, chúng ta sẽ chứng minh được bất đẳng thức
E
X− X0
≤ √2
3.
pVar(X )
Định nghĩa 2.1.1 Cho F là hàm phân phối xác suất ta định nghĩa hàm G(x) như
Trang 22(iii)VarG(X ) = E[G(X )]2− [EG(X)]2≤ 1
= 4E
g(X )
G(X ) −1
Trang 23dF(x) = 4E
g(X )
G(X ) −1
2
Hệ quả 2.1.1 Với giả thiết được trình bày ở Mệnh đề 2.1.2 các đẳng thức dưới đây
đúng
Trang 24E
≤ √23
pVar(X )
Đẳng thức xảy ra khi và chỉ khi X có phân phối đều trên đoạn [a,b].
Chứng minh. Theo bất đẳng thức Cauchy-Schwarz, Hệ quả 2.1.1 và (2.1.1), ta thuđược
pVar(X ) ≤ √2
3
pVar(X ).Đẳng xảy ra khi và chỉ khi X và G(X) phụ thuộc tuyến tính hay khi và chỉ khi X cóphân phối đều trên đoạn [a,b]
Trang 25Mệnh đề 2.1.3 E
Trang 26
Mặt khác, khi tập {x ∈ R : F(x) 6= G(x)} có nhiều nhất một số đếm được các điểmgián đoạn, ta có
2.2 Trung bình hiệu Gini với hàm phân phối thưc nghiệm
Để đo sự phân tán của phân bố xác suất, trung bình hiệu Gini và chỉ số Gini được
sử dụng rỗng rãi nhất Đặc biệt là hàm phân phối thực nghiệm
Kí hiệu Fa là hàm phân phối thực nghiệm ứng với mẫu a1≤ · · · ≤ ancó xác suất đều.Đặt a = (a1, , an) và ¯a= 1
là chỉ số Gini của biến a.
Tính chất Chỉ số Gini của a bằng trung bình hiệu Gini của mẫu ˜a = (a1
ai
¯
a −aj
¯a
Các tính chất cơ bản của chỉ số Gini cho phân phối của biến không âm:
R(a1+ λ , , an+ λ ) = a¯
¯
a+ λR(a1, a2, , an) với λ > 0.
Trang 272 R là hàm số liên tục trên Rn+.
Trong mục này, chúng ta sẽ đánh giá chặn trên của trung bình hiệu Gini với a =(a1, , an) ∈ Rn Cho a =(a1, , an) ∈ Rn và p = (p1, , pn) là các dãy xác suất,nghĩa là pi ≥ 0 (i ∈ {1, , n}) và ∑n
Đặc biệt đối với phân phối xác suất đều chúng ta có kết quả sau:
Hệ quả 2.2.1 Nếu a ∈ Rn , thỏa mãn các giả thuyết của Định lý 2.2.1 chúng ta có bất đẳng thức
trong đó brc là phần nguyên của r ∈ R.
Trang 28Chứng minh. Theo Định lý 2.2.1 cho pi= 1
n, ta có
M(a) ≤ max
1≤i≤n
in
1 − in
k
n−jn2
ki(A − a)
Bất đẳng thức được chứng minh
Định nghĩa 2.2.2 Cho a ∈ Rn và p là hàm phân bố xác suất, ta định nghĩa Kp(a)
là độ lệch tuyệt đối trung bình
Rõ ràng, sử dụng bất đẳng thức Cauchy-Bunyakovsky- Schwarz, ta có K p (a) ≤
Định lý 2.2.2 Với mọi a ∈ Rn và hàm phân phối p bất kì , ta có bất đẳng thức
!
≥ 12
= 1
2Kp(a)
Ta chứng minh được bất đẳng thức đầu tiên trong (2.2.7)
Sử dụng bất đẳng thức tam giác ta có với mỗi i, j ∈ {1, , n} thì
xi− xj ≤ |xi− γ| + xj− γ ... điểmgián đoạn, ta có
2.2 Trung bình hiệu Gini với hàm phân phối thưc nghiệm
Để đo phân tán phân bố xác suất, trung bình hiệu Gini số Gini
sử dụng rỗng rãi Đặc biệt... (a1, , an) ¯a= 1
là số Gini biến a.
Tính chất Chỉ số Gini a trung bình hiệu Gini mẫu ˜a = (a1
ai... data-page="27">
2 R hàm số liên tục Rn+.
Trong mục này, đánh giá chặn trung bình hiệu Gini với a =(a1, , an) ∈ Rn Cho a =(a1,