Kiến thức cơ bản về xác suất
Trong phần này, chúng ta sẽ khám phá các khái niệm cơ bản về lý thuyết xác suất, cần thiết cho việc thảo luận về các tập ngẫu nhiên trong các chương tiếp theo Định nghĩa 1.1.1 sẽ giới thiệu mô hình toán học cho các hiện tượng ngẫu nhiên.
Mô hình toán học cho một phép thử ngẫu nhiên là không gian xác suất (Ω,
A, P), trong đó: α) Ω là một tập, biểu diễn không gian mẫu của phép thử. β) A là một σ-đại số (biểu diễn các biến cố), tức là :
(iii) NÕu An ∈ Avíi n≥ 1 th× S n≥1
Trong lý thuyết xác suất, cặp (Ω,A) được định nghĩa là không gian đo được, trong đó A là một tập hợp con của Ω Độ đo xác suất P : A → [0,1] phải thỏa mãn hai điều kiện quan trọng: thứ nhất, P(Ω) = 1, và thứ hai, nếu {A_n, n ≥ 1} là một dãy các phần tử rời nhau từng đôi một (tức là Ai ∩ Aj = ∅ với i ≠ j), thì độ đo xác suất của tổng hợp các phần tử này cũng phải được xác định.
Tính chất này được gọi là σ - cộng tính của P Định nghĩa 1.1.2 (Phần tử ngẫu nhiên)
Trong không gian xác suất (Ω,A,P), một biến ngẫu nhiên X được định nghĩa là một ánh xạ từ Ω tới R, với điều kiện rằng X −1 (B(R)) thuộc A Điều này có nghĩa là với mọi tập B trong B(R), thì X −1 (B) cũng nằm trong A Tóm lại, X là một ánh xạ đo được giữa A và B(R).
Trong đó B(R) là σ - trường Borel được sinh ra bởi các tập mở của R,
X −1 (B) = {ω : X(ω) ∈ B} Định nghĩa 1.1.3 (Luật xác suất của các phần tử ngẫu nhiên)
Trong không gian xác suất (Ω, A, P) và không gian đo được (U, U), ánh xạ X : Ω → U được coi là A - U - đo được Luật xác suất của biến ngẫu nhiên X được xác định bởi độ đo xác suất trên U, ký hiệu là PX = P X −1.
Cho một biến ngẫu nhiên X : (Ω,A, P) → (R,B(R)) và luật xác suất của nó: P X = P X −1 trên B(R) Hàm phân bố của biến ngẫu nhiên X là hàm
F(x) = P X ((−∞, x]) Tính chất 1 Hàm F này thỏa mãn các tính chất cơ bản sau:
(i) F là đơn điệu không giảm, tức là, nếu x ≤ y thì F(x) ≤F(y),
(iii) F là liên tục phải trên R, tức là, với mỗi x ∈ R, F(x) = lim y&xF(y) F(x + ), và có giới hạn trái tại mọi x ∈ R.
Tất cả các hàm trên R đều thỏa mãn các tính chất (i), (ii), (iii) được coi là hàm phân bố của các độ đo xác suất trên B(R) Điều này có nghĩa là tồn tại một sự song ánh giữa các hàm thỏa mãn các tính chất này và các độ đo xác suất trên B(R) Định nghĩa 1.1.5 đề cập đến hàm phân bố của véc tơ ngẫu nhiên.
ChoX : (Ω,A, P) → (R d ,B(R d ))(X = (X 1 ,ã ã ã , X d )là véc tơ ngẫu nhiên d chiều) Hàm phân bố F của X là hàm: F : R d → [0,1]
Tính chất 2 Từ các tính chất cơ bản của P, F thỏa mãn các tính chất sau:
(ii) lim x j →−∞F(x 1 ,ã ã ã , x d ) = 0 với ít nhất một j nào đó, và x j lim→+∞F(x 1 ,ã ã ã , x d ) = 1 với tất cả j = 1,2,ã ã ã , d.
(iii) F là liên tục phải trên R d , tức là lim y&xF(y) = F(x),∀x ∈ R d
Một vài tập ngẫu nhiên trong thống kê
MiÒn tin cËy
Xét một mô hình thống kê tham số hóa.
{f(x, θ) : x ∈ X ⊆ R m , θ ∈ ⊆ R d }, và một tham số mà ta quan tâm ϕ(θ) X là biến ngẫu nhiên có hàm mật độ f(x, θ), cho trước một mẫu ngẫu nhiên
Bản chất của ước lượng miền tin cậy là xác định một tập ngẫu nhiên C(X1, X2, , Xn) chứa tham số thực θ0 với xác suất cao Cụ thể, tập C(X1, X2, , Xn) được coi là tin cậy cho ϕ(θ) với mức tin cậy 1−α ∈ (0,1) nếu với mọi θ ∈ : Pθ(ϕ(θ) ∈ C(X1, X2, , Xn)) ≥ 1−α, trong đó dPθ = f(x, θ)dx.
Trong những trường hợp đơn giản, việc xây dựng miền tin cậy tối ưu cho ϕ(θ) có thể thực hiện mà không cần dựa vào khái niệm hình thức về các tập ngẫu nhiên và phân bố của chúng.
Ví dụ: Cho biến ngẫu nhiên X có phân bố chuẩn N(à, σ 2 ) , ở đây θ = (à, σ 2 ) Xét ϕ(θ) = à Khi đó √ n(X n − à)/V có phân phối Student với n− 1 bậc tự do, trong đó X n = X 1 + ã ã ã+X n n và V 2 = 1 n−1 n
Trung bình mẫu và phương sai mẫu hiệu chỉnh được tính bằng công thức (X i −X n ) 2, dựa trên một mẫu ngẫu nhiên X1, X2, , Xn được lấy từ tổng thể X Từ đó, ta có thể xác định khoảng tin cậy (1−α) % cho giá trị cần ước lượng.
Hiển nhiên, có nhiều điểm(t 1 , t 2 ) sao cho: P(t 1 0, ta cũng có P g (A) > 0 nên mật độ có điều kiện của X với S = A đã cho được định nghĩa tốt Mật độ chung của (S, X) là:
Do đó, mật độ biên duyên của X là:
Tiếp theo, X là một bộ chọn hầu chắc chắn của S Thật vậy, ta có
Theo sự xây dựng, P(X = x, S = A) 6= 0 chỉ khi x ∈ A và f(A) > 0.
P(X = x, S = A) = 1 (mật độ chung) nênP(X ∈ S) = 1 Cuối cùng, vì P(X = x, S = A) =g(x)π(A) và vì g(ã) là mật độ biên duyên của X, ta có
P(X = x) = π(A) nghĩa là giả thiết CAR là đúng.
Khi mô hình thống kê cho biến X được xác định là C(F), nhiệm vụ là tìm phần tử tối ưu nhất trong C(F) để biểu diễn các quan sát của X; điều này có thể thực hiện thông qua nguyên lý entropy cực đại Tuy nhiên, từ những phân tích trước đó, chúng ta có thể chuyển đổi bài toán thành một bài toán mới.
Cho S là một sự làm thô của X, tìm một phần tử của C(F) mà làm cho S là một mô hình CAR cho X.
Q(A) ∈ [0,1] Sự tồn tại của một mô hình CAR là sự tồn tại của một độ đo Q∈ C(F) sao cho:
Ví dụ: Cho(Ω,A, P)là một không gian xác suất vàU = {x 1 , x2, x3, x4}. Giả sử X : Ω → U là một biến ngẫu nhiên với độ đo xác suất PX và
S : Ω → 2 U \{∅} là một tập ngẫu nhiên với mật độ f(A) = P(S = A) được cho bởi: f({x 1 }) = f({x 2 }) = 16, f({x 3 }) = 14, f({x 4 }) = 112, f({x 1 , x2, x3}) = 16 , f(U) = 16 , f(A) = 0, với A là các tập con khác của U.
Giả sử rằng S là một mô hình CAR cho X Khi đó:
Do đó, theo (2.5) thì : π({x 1 }) = π({x 2 }) =π({x 3 }) = 3554, π({x 4 }) = 56 π({x 1 , x 2 , x 3 }) = 1054 , π(U) = 16 , π(A) = 0 với A là các tập con khác của
Xác suất không chính xác
Để hiểu rõ về biến ngẫu nhiên X, cần xác định luật phân phối xác suất của nó Nếu xác suất của X không chính xác, chẳng hạn như chỉ biết rằng nó thuộc về một lớp các độ đo xác suất đã biết, thì lý thuyết về tập ngẫu nhiên sẽ giúp rút ra kết luận từ những dữ liệu không chính xác này.
Trong một hộp chứa 30 quả cầu đỏ và 60 quả cầu trắng và đen, khi rút ngẫu nhiên một quả cầu, giá phải trả cho quả cầu đỏ là 5, quả cầu đen là 10 và quả cầu trắng là 20 Để tính giá phải trả trung bình cho việc rút cầu, ta cần xem xét xác suất rút từng loại cầu và tính toán giá trị kỳ vọng tương ứng.
Chúng ta không thể trả lời câu hỏi này một cách chính xác do thiếu thông tin về phân bố xác suất của các quả cầu đỏ, đen và trắng Tuy nhiên, chúng ta có một tập hợp các mật độ xác suất khả thi mà mật độ xác suất thực sự phải thuộc về Tập hợp này được thể hiện qua bảng với các giá trị x cho quả cầu đỏ, đen và trắng, cụ thể là f(k) với k từ 30 đến 90, và k từ 60-k đến 90.
Hàm mật độ xác suất đúng là một trong 61 mật độ này.
Trường hợp tổng quát: Cho P biểu thị lớp tất cả các độ đo xác suất trên
U Độ đo xác suất đúng P 0 chỉ được biết là thuộc vào một lớp con đã cho
P ⊆ P Từ sự hiểu biết về P, ta có thể thu được các chặn của P 0 , cụ thể
Trong lý thuyết xác suất, ta có mối quan hệ F ≤ P và 0 ≤ T, với F là infimum của P và T là supremum của P Do T(A) = 1−F(A c ) cho thấy T và F là các hàm liên hợp, nên chỉ cần xem xét một trong hai chặn, ở đây chúng ta tập trung vào F, với F là hàm phân bố của một tập ngẫu nhiên trên không gian U.
Do thông tin về độ đo xác suất trên các trạng thái tự nhiên không đầy đủ, cần thiết phải xử lý thông tin trên các phần tử ngẫu nhiên được định giá đa trị, tức là các tập ngẫu nhiên.
Ví dụ dưới đây minh họa trường hợp khi P không được biết đầy đủ.
Ví dụ 2: Cho = {θ 1 , θ2, θ3} Độ đo xác suất "đúng" P0 chỉ được biết
P 0 ({θ 1 }) = 1/3, khi đó P 0 ({θ 2 , θ 3 }) = 2/3 Đặt P biểu thị lớp các độ đo xác suất P có tính chất này Khi đó P = {P : F ≤ P}, với F được định nghĩa trên : F(A) = inf{P(A) : P ∈ P} Hơn nữa, F(A) = P
B ⊆A m(B) (F là hàm phân bố của tập ngẫu nhiên nào đó trên ) với m({θ 1 }) 1/3;m({θ 2 , θ 3 }) = 2/3;m(A) = 0 cho tất cả các tập con khác của Chú ý rằng hàm khối m là một mật độ trên 2
Cho một mật độ f trên , P f là xác suất được sinh ra từ f Khi đó
P f (A) = P θ∈A f(θ) Lớp P bao gồm các độ đo xác suất này được sinh ra từ các mật độ F m = {f : F ≤P f }.
Trong ví dụ này, một hộp chứa 30 quả cầu đỏ và 60 quả cầu đen và trắng với tỷ lệ chưa xác định Khi rút ra một quả cầu, giá trị phải trả cho quả cầu đỏ, đen và trắng lần lượt là 5, 10 và 20 Để tính giá phải trả trung bình, ta đặt θ = {θ1, θ2, θ3}, trong đó θ1, θ2, θ3 lần lượt đại diện cho các quả cầu đỏ, đen và trắng Mật độ của các quả cầu này là không xác định, nhưng được biết là nằm trong một tập hợp các mật độ Cụ thể, mô hình này nhỏ hơn Fm vì khối {θ2, θ3} chỉ có thể phân bố theo tỷ lệ k, với k thuộc {0, 1, , 60}.
90 , thay vì theo các tỉ lệ bất kì. Để giải quyết bài toán trên, trước tiên ta xét giá trị kỳ vọng của một hàm ph©n bè.
Giả sử u là một biến ngẫu nhiên khả tích được định nghĩa trên không gian xác suất (U,A, P), khi đó giá trị kì vọng của u được viết như sau:
Thay P bằng một hàm phân bố của một tập ngẫu nhiên F, thì ta có:
Chú ý rằng EF không phải là một toán tử cộng tính.
KhiU hữu hạn thì việc tính toánE F (u)là đơn giản Giả sửU = {θ 1 , θ 2 ,ã ã ã , θ n }.
Ta có thể sắp xếp lại các phần tử trong U để u(θ 1 ) ≤ u(θ 2 ) ≤ ã ã ã ≤ u(θ n ). Khi đó:
Đặt g(θ i ) = F({θ i ,ã ã ã , θ n })−F({θ i+1 ,ã ã ã , θ n }), ta có g là một mật độ xác suất trên U Do đó, E F (u) trở thành một kỳ vọng xác suất thông thường, trong đó mật độ sử dụng cho kỳ vọng này chỉ phụ thuộc vào F và không phụ thuộc vào thứ tự của các phần tử trong U.
Giả sử g là một mật độ xác suất trên U, với P g biểu thị độ đo xác suất sinh ra từ g trên 2 U, và F F là lớp các mật độ g trên U sao cho P g ≥ F Theo định lý 2.3.7, cho U là một tập hữu hạn và u : U → R, cùng với F là hàm phân bố trên một tập ngẫu nhiên S, thì tồn tại một mật độ g ∈ F F thỏa mãn điều kiện này.
Chứng minh Theo trên , đặt g(θi) =F({θ i ,ã ã ã , θn})−F({θ i+1 ,ã ã ã , θn}). Cho Ai = {θ i ,ã ã ã , θn}, g(θ i ) =F(A i )−F(A i \{θ i }) = P
Tiếp theo, ta chỉ cần chỉ ra rằng ∀t∈ Rvà ∀f ∈ F F , ta có:
Thật vậy, cho (u > t) = {θ i ,ã ã ã , θ n } Khi đó, theo phép xây dựng của g, ta cã:
B⊆{θ i ,ããã ,θ n } m(B) =F(u > t) với tổng lấy trên tất cả các tập con của {θ i ,ã ã ã , θ n } Nếu f ∈ F F , thì
Từ sự phân tích ở trên, trở lại ví dụ 1, ta có: g(θ1) =F({θ 1 , θ2, θ3})−F({θ 2 , θ3}) = 1−m(θ2, θ3) = 1− 2 3 = 1 3 g(θ2) =F({θ 2 , θ3})−F({θ 3 }) = 2 3 g(θ3) =F({θ 3 }) = 0 g(θ 4 ) =F({θ 4 }) = 0.1.
Vậy giá phải trả trung bình thấp nhất là:
Phân bố entropy cực đại
Phần này thảo luận về việc lựa chọn một phân bố xác suất chính tắc từ một tập hợp các phân bố phù hợp cho một biến ngẫu nhiên, dựa trên nguyên lý entropy cực đại Đối với một tập hữu hạn U, khi thực hiện phép thử, thông tin về sự xuất hiện của các phần tử trong U vẫn chưa rõ ràng Do đó, chúng ta gán cho các phần tử trong U khả năng xuất hiện như nhau, tức là áp dụng phân bố đều, phản ánh nguyên lý không đủ lý của Laplace.
Nếu các phần tử trong tập hợp U xuất hiện theo một hàm mật độ xác suất f, thì entropy của hàm mật độ xác suất này được định nghĩa như sau: Định nghĩa 2.4.14 Cho f là hàm mật độ xác suất trên U, biểu thức:
H(f) =−X θ f(θ) log(f(θ)) được gọi là entropy của f.
Nguyên lý không đủ lý Laplace tương đương với nguyên lý entropy cực đại, vì phân bố đều có entropy cao nhất trong tất cả các mật độ trên U Theo Laplace, mật độ đúng là mật độ tối ưu hóa H(f) trong tập hợp tất cả các mật độ f trên U Hơn nữa, nếu F là tập hợp các hàm mật độ xác suất trên U, được xác định bởi các quy luật chi phối U, thì nguyên lý entropy cực đại dẫn đến việc tìm một hàm f ∈ F để tối đa hóa H(f).
Dựa vào lý thuyết về tập ngẫu nhiên, hạn chế trên F được xác định là F m = {f : F ≤ Pf} Nguyên lý không đủ lý Laplace cho thấy rằng việc chọn f có entropy lớn nhất từ tất cả các mật độ trên U sẽ dẫn đến việc chọn một hàm mật độ xác suất f có entropy lớn nhất trong tập hợp đó.
F m Trong ví dụ 1 của phần trước
Trong hệ thống X với các tham số θ1, θ2, θ3 và f, khi k nằm trong khoảng từ 0 đến 60, mật độ trong F m đạt entropy cực đại với mật độ đều Điều này có nghĩa là xác suất xuất hiện của mỗi quả cầu đỏ, đen và trắng đều bằng nhau, cụ thể là 1/3.
Nếu m là một mật độ xác suất trên 2 U và các phần tử của m là rời nhau, thì mật độ trong F m với entropy cực đại được xác định bởi công thức f(θ) = P.
|A| Nghĩa là, khối của A được phân bố như nhau tới tất cả các phần tử trong A.
Tiếp theo, ta sẽ nghiên cứu bài toán entropy cực đại trong trường hợp tổng quát.
Trường hợp đầu tiên được xem xét là cho U = {θ1, θ2, , θn} và m là một mật độ trên U với m({θi}) = αi và m(U) = 1 - P i αi = ε Bài toán đặt ra là phân chia ε giữa các αi nhằm tối đa hóa entropy của mật độ kết quả trên U Điều này có nghĩa là ε cần được phân bố sao cho đạt được giá trị lớn nhất cho entropy.
P i=1 ε i , ε i ≥ 0, entropy của mật độ f được cho bởi f(θ i ) = α i +ε i là cực đại Ta có phát biểu chính xác cho bài toán như sau:
Bài toán: Choi = 1,2,ã ã ã , n, choα i ≥ 0, ε i ≥0và P n i=1 α i + n
P i=1 ε i = 1 Xác định các ε i sao cho:
Bản chất của vấn đề nằm trong bổ đề đơn giản theo sau.
Bổ đề 2.4.1 Cho x và c−x là dương Khi đó:
L(x) = −[(c−x) log(c−x) +xlog(x)] là tăng theo x nếu c−x > x.
Chứng minh Đạo hàm L 0 (x) = 1 + log(c−x)−1−log(x)
Giả sử rằng ta có các α i và ε i thỏa mãn điều kiện của bài toán Ta quan tâm đến việc làm cực đại đại lượng:
(αi +εi) log(αi +εi) với α i + ε i < α j +ε j , ε j > 0 (Ta cũng có thể lấy i < j) Giả sử tồn tại δ sao cho δ > 0, ε j −δ >0 , và α i +ε i +δ < α j +ε j −δ Áp dụng bổ đề với c = α i +ε i +α j +ε j và x 1 = α i +ε i < α i +ε i +δ = x 2 , ta có:
Kết luận: Nếu một sự phân chia ε 1 , ε 2 ,ã ã ã , ε n của ε tớiα 1 , α 2 ,ã ã ã , α n làm cực đại H, thì bất cứ khi nào có α i +ε i < α j +ε j , ta phải có ε j = 0.
Giờ ta giả sử rằng các α i được chỉ số hóa để α 1 ≤ α 2 ≤ ã ã ã ≤ α n Khi đó, để làm cực đại H, ta phải có: α 1 +ε 1 = α 2 +ε 2 = ã ã ã = α k + ε k ≤ α k+1 ≤ ã ã ã ≤α n (2.9)
Với ε k+i = 0 cho i > 0 Tất nhiên, k có thể bằng n Có nhiều nhất một sự phân chia các ε i như vậy.
Cho bất kỳ sự phân chia nào γ₁, γ₂, , γₙ của ε, với εᵢ < γᵢ và εⱼ > γⱼ, ta có αⱼ + γⱼ < αⱼ + εⱼ và αᵢ + εᵢ < αᵢ + γᵢ khi γᵢ > 0, dẫn đến γ₁, γ₂, , γₙ không thỏa mãn điều kiện (2.9) Do đó, chỉ có tối đa một phân hoạch thỏa mãn (2.9) Để tìm các εᵢ thỏa mãn (2.9), ta đặt δᵢ = αₖ − αᵢ với i = 1, 2, , k và k là cực đại sao cho Pᵢ δᵢ ≤ ε Tiếp theo, ta đặt εᵢ = δᵢ + (ε − Pᵢ δᵢ)k cho i = 1, 2, , k, và εᵢ = 0 với i > k.
Do đó, tồn tại duy nhất một tập các εi thỏa mãn (2.9) Ta gọi sự phân chia này là sự phân chia chuẩn.
Tập hợp các điểm {(ε 1 , ε 2 , , ε n ) : ε i ≥ 0, P i ε i = c} với hằng số c bất kỳ là một tập con đóng và bị chặn trong R n Do đó, ảnh của tập hợp này trong R được xác định bởi một hàm liên tục.
(α i +ε i ) log(α i +ε i ) có một giá trị cực đại
Trong bài viết này, chúng ta có mối quan hệ giữa các đại lượng α và ε, với điều kiện tổng P i α i + P i ε i = 1 không phải là yếu tố quyết định trong các thảo luận trước đó, mà chỉ cần tổng này là một số dương Điều này cho thấy rằng các giá trị α và ε có thể được điều chỉnh mà không làm ảnh hưởng đến tính chất tổng thể của hệ thống.
Giả sử rằng γ 1 , γ 2 , , γ n là một phân chia của ε, với điều kiện α 1 ≤ α 2 ≤ ≤ α n Giả sử i là chỉ số nhỏ nhất sao cho ε i không bằng γ i Nếu ε i lớn hơn γ i, thì tồn tại các chỉ số i 1 , i 2 , , i m sao cho ε i j nhỏ hơn γ i j, thỏa mãn điều kiện P j γ i j − P j ε i j ≥ ε i − γ i.
( εi j nào đó có thể bằng 0) vì ta có P j γj = P j εj = ε Do đó: αi j +γi j > αi j +εi j ≥ αi +εi > αi+ γi
P k=1 δ i k và αi + εi = αi + γi + P j δi j Theo bổ đề, sự phân chia từ các γi có thể đạt được bằng cách thay γ i j bằng γ i j − δ i j cho mọi i, j, và thay γ i bằng γ i + P j δ i j, dẫn đến entropy lớn hơn Sự phân chia mới này có i số hạng đầu tiên ε1, ε2, , εi thỏa mãn điều kiện (2.9).
Nếu ε i < γ i ta làm hoàn toàn tương tự.
Chúng ta có thể chuyển đổi bất kỳ phân chia nào thành phân chia chuẩn trong tối đa n bước, với mỗi bước làm tăng entropy Điều này dẫn đến một chứng minh có tính xây dựng cho thấy phân chia chuẩn tạo ra entropy tối đa.
Sự phân chia chuẩn là phương pháp phân chia duy nhất giúp tối đa hóa H Việc tính toán cho sự phân chia này, như đã được mô tả ở trên, là một quy trình thông thường và có thể dễ dàng lập trình.
Tóm tắt thảo luận, Định lý 2.4.8 chỉ ra rằng với tập hợp U = {θ 1, θ 2, , θ n} và mật độ m trên 2U, trong đó m({θ i }) = α i và m(U) = 1 - P i α i, thì tồn tại duy nhất một mật độ f trên tập hợp này.
U mà tương thích vớim và có entropy lớn nhất
Nếu α 1 ≤ α 2 ≤ ã ã ã ≤ α n , thì mật độ được cho bởi f(θ i ) = α i + ε i , với ε i ≥0 , P k i=1 ε i = m(U), và α 1 +ε 1 = α 2 +ε 2 = ã ã ã = α k + ε k ≤ α k+1 ≤ ã ã ã ≤α n
Mật độ này được xây dựng bằng cách đặt các α i theo thứ tự tăng dần, đặt δ i = α k − α i , i = 1,2,ã ã ã , k với k cực đại sao cho P i δ i ≤ m(U) , ε i = δ i + (m(U)−P i δ i )k , i = 1,2,ã ã ã , k, và ε i = 0 với i > k.
Tập đóng ngẫu nhiên và tôpô liên quan
Trong chương 1, chúng ta đã nghiên cứu các tập ngẫu nhiên với giá trị trên một tập hữu hạn U Ở phần này, chúng ta sẽ chuyển sang xem xét các tập ngẫu nhiên nhận giá trị trong một tập vô hạn không đếm được, cụ thể là khi U = R^d.
Một véctơ ngẫu nhiên X : Ω → R d được định nghĩa là một tập ngẫu nhiên nhận các giá trị từ các tập đơn {x} trong tập lũy thừa của R d, với các tập đơn này là các tập đóng trong R d Do đó, véctơ ngẫu nhiên có thể coi là một tập ngẫu nhiên nhận các giá trị từ các tập đóng Tương tự, các quá trình điểm cũng là những tập ngẫu nhiên như vậy Nếu X : Ω → R + là một biến ngẫu nhiên không âm, thì S(ω) = [0, X(ω)] là một tập ngẫu nhiên trên R +, nhận các giá trị trong lớp các tập đóng của R +.
Miền tin cậy được xác định là tập đóng ngẫu nhiên, với các tập con đóng của R d là các giá trị Điều này cho thấy rằng các tập đóng ngẫu nhiên đủ tổng quát cho nhiều ứng dụng khác nhau Việc định nghĩa chặt chẽ các tập ngẫu nhiên là cần thiết để đảm bảo tính chính xác và hiệu quả trong các nghiên cứu liên quan.
Giả sử U là một tập và B ⊆ 2 U , B là một lớp con đặc biệt các tập con của
Trong không gian xác suất (Ω, A, P), để xác định các phần tử ngẫu nhiên trên Ω, cần phải định rõ một σ-trường σ(B) các tập con của B Cụ thể, chúng ta sẽ lấy U = R^d, với B là F(R^d) hay đơn giản là F, lớp tất cả các tập con đóng của R^d Hai câu hỏi còn lại cần được giải đáp.
Để xác định các độ đo xác suất trên σ(F), cần xây dựng một tôpô phù hợp trên F và xác định σ(F) là σ-trường Borel tương ứng.
Chúng tôi đang tìm kiếm một tôpô T trên không gian F, sao cho các luật xác suất trên các tập đóng ngẫu nhiên có thể được mô tả bằng các đối tượng đơn giản hơn.
Khi xem một tập hữu hạn U như một không gian tôpô với tôpô rời rạc, tất cả các tập con của U được coi là tập mở Trong bối cảnh này, một tập ngẫu nhiên hữu hạn X trên U trở thành một tập đóng ngẫu nhiên Luật xác suất của X được xác định như một độ đo xác suất trên σ-trường của 2^U, và cụ thể, nó được xác định duy nhất thông qua phiếm hàm khả năng T: 2^U → [0,1].
Khi U = R^d và X: Ω → F, chúng ta xem xét các tập con của F có dạng F_A = {F ∈ F : F ∩ A ≠ ∅} với A ⊆ R^d, thuộc vào σ-trường Borel σ(F) được sinh ra bởi tôpô T Tập phần bù của F_A cũng cần được xác định trong bối cảnh này.
Từ sự xem xét này dẫn tới cách dưới đây để định nghĩa một tôpô thích hợp trên F.
Các khoảng mở trong R tạo thành cơ sở cho tôpô của nó, do đó không gian của các tập đóng F trong R d có thể được tôpô hóa theo cách tương tự.
Cho F,G,K lần lượt biểu thị lớp các tập con đóng, mở, và compac của R d Cho A ⊆ R d , F A = {F ∈ F : F ∩ A6= ∅}, F A = {F ∈ F : F ∩ A= ∅}. Đặt B = {F G K 1 ,G 2 ,ããã ,G n : K ∈ K, G i ∈ G, n 6= 0}
1 ,G 2 ,ããã ,G n = F K Hơn nữa, với G ∈ G, ta có:
B trong bài viết là cơ sở cho tôpô T trên không gian F, và tôpô được sinh ra từ B được gọi là tôpô hit-or-miss của F Ngoài ra, σ-trường Borel được xác định trên không gian F được ký hiệu là B(F).
Tập đóng ngẫu nhiên trên R d được định nghĩa trong không gian xác suất (Ω,A,P) với ánh xạ X : Ω → R d là A − B(F).
Theo định nghĩa về tập đóng ngẫu nhiên, luật xác suất của tập ngẫu nhiên được xác định trong không gian xác suất (Ω, A, P) Cụ thể, nếu X là một tập đóng ngẫu nhiên trên R^d, thì ánh xạ X: Ω → R^d là A − B(F) - đo được Luật xác suất của X được biểu diễn bằng độ đo xác suất P_X trên B(F), với P_X = P_X^−1.
Ví dụ về tập mức được ngẫu nhiên hóa: Giả sử ϕ: R^d → [0,1] là một hàm nửa liên tục dưới, có nghĩa là với mọi a ∈ R, tập hợp {x ∈ R^d: ϕ(x) ≥ a} là một tập đóng trong R^d Đặt α: Ω → [0,1] là một biến ngẫu nhiên với phân bố đều.
S : Ω → F(R d ) bởi S(ω) = {x ∈ R d : ϕ(x) ≥ α(ω)} Khi đó, rõ ràng S là một tập đóng ngẫu nhiên trên R d
Tập ngẫu nhiên và các vấn đề liên quan
3.1 Mối quan hệ 1-1 giữa hàm phân bố và hàm mật độ
Phần này thiết lập một khung tổng quát để nghiên cứu các hàm tập, với các hàm được định nghĩa trên tập hữu hạn U Đại số liên thuộc của một tập trên vành giao hoán có đơn vị là cần thiết để chỉ ra mối quan hệ 1-1 giữa hàm phân bố và hàm mật độ của một tập đóng ngẫu nhiên Định nghĩa 3.1.17 nêu rõ rằng, với U là tập hữu hạn và F = {f : 2 U → R}, nếu f, g ∈ F và r ∈ R, thì có những quan hệ nhất định giữa các hàm này.
(f +g)(X) =f(X) +g(X) (rf)(X) =r(f(X)), X ⊆ U Mệnh đề 3.1.1 F là một không gian véctơ trên R.
Chứng minh Theo Định nghĩa 3.1.17 về phép cộng hai hàm tập và phép nhân một hàm tập với một số thực ta có thể suy ra được:
Một cơ sở cho F là tập hợp các hàm {f Y : Y ⊆ U}, trong đó f Y (Y) = 1 và f Y (X) = 0 nếu X khác Y Do đó, F có 2 |U| chiều trên R Định nghĩa 3.1.18 cho biết A là tập các hàm (2 U ) [2] → R, với (2 U ) [2] = {(X, Y) : X ⊆ Y ⊆ U} Trên A, phép cộng được định nghĩa theo từng điểm và phép nhân theo công thức cụ thể.