1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phương pháp bayes ước lượng tham số đại lượng ngẫu nhiên

39 7 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phương Pháp Bayes Ước Lượng Tham Số Đại Lượng Ngẫu Nhiên
Tác giả Nguyễn Thị Phương Thảo
Người hướng dẫn ThS. Lê Văn Dũng
Trường học Đại học Đà Nẵng
Chuyên ngành Khoa Toán
Thể loại Khóa luận tốt nghiệp
Năm xuất bản 2013
Thành phố Đà Nẵng
Định dạng
Số trang 39
Dung lượng 339,98 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

  • Chng Kiến Thức Cơ Sở

    • Không gian xác suất

      • Phép thử

      • Không gian mẫu

      • Độ đo xác suất

    • Công thức Bayes

      • Xác suất có điều kiện

      • Công thức Bayes

    • Đại lượng ngẫu nhiên

      • Hàm phân phối xác suất

      • Đại lượng ngẫu nhiên rời rạc

      • Đại lượng ngẫu nhiên liên tục

    • Đại lượng ngẫu nhiên độc lập

    • Các tham số đặc trưng của đại lượng ngẫu nhiên

      • Kỳ vọng toán

      • Phương sai.

      • Độ lệch tiêu chuẩn.

    • Các phân phối xác suất sử dụng trong chương sau

      • Phân phối Bernoulli

      • Phân phối Nhị Thức

      • Phân phối Poisson

      • Phân phối Đều

      • Phân phối Beta

      • Phân phối Gamma

      • Phân phối inverse - Gamma

      • Phân phối Student

      • Phân phối khi bình phương

      • Phân phối khi inverse - khi bình phương

    • Vectơ ngẫu nhiên

      • Định nghĩa

      • Hàm phân phối xác suất đồng thời

      • Hàm mật độ xác suất đồng thời

    • Mẫu số liệu và mẫu ngẫu nhiên

  • Chng Phương pháp Bayes ước lượng tham số

    • Phân phối xác suất có điều kiện

      • Định nghĩa

      • Trường hợp Y là đại lượng ngẫu nhiên rời rạc

      • Trường hợp Y là đại lượng ngẫu nhiên liên tục

    • Ước lượng tham số phân phối Bernoulli

      • Công thức ước lượng khoảng tham số

    • Ước lượng tham số phân phối nhị thức

      • Công thức ước lượng khoảng tham số

    • Ước lượng tham số phân phối Poisson

      • Công thức ước lượng tham số

    • Ước lượng khoảng kì vọng của phân phối chuẩn

      • Công thức ước lượng khoảng

    • Ước lượng khoảng kì vọng và phương sai

      • Công thức ước lượng khoảng kì vọng

      • Công thức ước lượng khoảng phương sai

Nội dung

Không gian xác suất

Phép thử

Trong toán học, có nhiều khái niệm không có định nghĩa cụ thể mà chỉ có thể được mô tả qua hình ảnh hoặc tư duy trực quan, như điểm, đường thẳng và mặt phẳng trong hình học Một khái niệm quan trọng khác trong xác suất là phép thử, được hiểu là việc thực hiện một nhóm điều kiện cơ bản để quan sát hiện tượng xảy ra hay không Phép thử được coi là ngẫu nhiên khi không thể dự đoán chính xác kết quả trước khi thực hiện.

Không gian mẫu

Tập hợp tất cả các kết quả có thể xảy ra của một phép thử ngẫu nhiên được gọi là không gian mẫu Ta thường kí hiệu là Ω.

Cho không gian mẫu Ω Một lớp F các tập con của Ω thoã mãn 3 điều kiện:

+ Nếu A 1 , A 2 , , A n , ∈ F thì S∞ n=1A n ∈ F Lớp F như vậy được gọi là σ-đại số các tập con của Ω

Độ đo xác suất

Một hàm tập hợp P : F → R được gọi là độ đo xác suất nếu thoã mãn

+ Nếu A 1 ,A 2 , ,A n , đôi một không giao nhau(A i ∩ A i = ∅ với mọi i 6= j) thì P( S∞ n=1A n ) ∞

Khi đó mỗi phần tử của F được gọi là biến cố và P(A) được gọi là xác suất xảy ra biến cố A Bộ ba (Ω,F, P) gọi là không gian xác suất.

Công thức Bayes

Xác suất có điều kiện

Xác suất có điều kiện của biến cố A, ký hiệu P(A/B), là xác suất xảy ra của biến cố A khi biết rằng biến cố B đã xảy ra.

P(A 1 ,A 2 , ,A n ) =P(A 1 )P(A 2 /A 1 )P(A 3 /A 1 A 2 ) P(A n /A 1 A 2 A n−1 ) Công thức trên được gọi là công thức nhân xác suất

Công thức Bayes

Giả sử A 1 , A 2 , , A n là nhóm biến cố đầy đủ xung khắc từng đôi và

B là biến cố bất kỳ có thể xảy ra đồng thời với một trong các biến cố A i Khi đó ta có công thức:

P(A i ).P(B/A i ) Định lý Bayes điều chỉnh các xác suất khi được cho bằng chứng mới theo cách sau đây:

+ H 0 đại diện cho một giả thuyết, gọi là một giả thuyết, giả thuyết này được suy luận trước khi có được bằng chứng mới E.

+ P(H 0 ) được gọi là xác suất tiên nghiệm của H 0

P(E|H 0) là xác suất có điều kiện cho thấy bằng chứng E được quan sát nếu giả thuyết H 0 là đúng Đại lượng này còn được gọi là hàm khả năng khi được biểu diễn dưới dạng một hàm của

Xác suất biên duyên P(E) của sự kiện E là xác suất để quan sát bằng chứng mới E dưới tất cả các giả thuyết loại trừ nhau Để tính toán giá trị này, ta cần tổng hợp tích của tất cả các xác suất của các giả thuyết loại trừ và các xác suất có điều kiện tương ứng.

Xác suất hậu nghiệm của H0, được ký hiệu là P(H0|E), được tính dựa trên công thức P(E|H i )P(H i ) Suy luận Bayes là công cụ hữu ích để xác định các xác suất trong các tình huống không chắc chắn Ngoài việc tính toán xác suất, việc xây dựng một hàm mất mát cũng rất quan trọng, nhằm phản ánh những hậu quả có thể xảy ra khi mắc sai lầm Các xác suất thể hiện khả năng hoặc niềm tin về việc xảy ra sai lầm, trong khi hàm mất mát mô tả các hậu quả liên quan đến những sai lầm đó.

Đại lượng ngẫu nhiên

Hàm phân phối xác suất

Cho đại lượng ngẫu nhiên X, hàm số F(x) = P(X < x), x ∈ R được gọi là hàm phân phối xác suất của X.

Đại lượng ngẫu nhiên rời rạc

Đại lượng ngẫu nhiên rời rạc X có thể nhận các giá trị x1, x2, , xn với xác suất tương ứng là p1, p2, , pn Điều này có thể được biểu diễn bằng công thức p(X = xi) = pi Như vậy, đại lượng ngẫu nhiên rời rạc được thể hiện qua một bảng số.

Ta gọi nó là bảng phân phối đại lượng ngẫu nhiên X.

Trong định nghĩa trên, lẽ đương nhiên ta phải có: pi > 0,∀i ≥ 1,X k pk = 1

Kí hiệu E là miền giá trị của đại lượng ngẫu nhiên rời rạc X, hàm số f : E → R xác định bởi f(x) = P(X = x) được gọi là hàm mật độ của

Đại lượng ngẫu nhiên liên tục

Đại lượng ngẫu nhiên X được xem là liên tục khi hàm phân phối của nó có đạo hàm Điều này tương đương với việc tồn tại một hàm số f: R → R khả tích không âm, thỏa mãn điều kiện cho mọi y ∈ R.

−∞ f(x)dx, trong đó : F(y) là hàm phân phối của X.

Khi đó, f(x) được gọi là hàm mật độ của X.

Đại lượng ngẫu nhiên độc lập

Cho n đại lượng ngẫu nhiên X 1 , , X n xác định trên cùng một không gian mẫu Ta nói X 1 , , X n độc lập nếu với mọi a 1 , , a n ∈ R ta có các biến cố {X < a 1 }, ,{X < a n } độc lập.

Các tham số đặc trưng của đại lượng ngẫu nhiên

Kỳ vọng toán

+ Nếu đại lượng ngẫu nhiên rời rạc X có bảng phân phối xác suất

+ Nếu đại lượng ngẫu nhiên liên tục X có hàm mật độ f(x) thì:

Phương sai

Cho đại lượng ngẫu nhiên X, số D(X) = E(X −E(X)) 2 được gọi là phương sai của đại lượng ngẫu nhiên X.

+ Nếu đại lượng ngẫu nhiên rời rạc X có bảng phân phối xác suất

+ Nếu đại lượng ngẫu nhiên liên tục X có hàm mật độ f(x) thì :

Độ lệch tiêu chuẩn

Độ lệch tiêu chuẩn của đại lượng ngẫu nhiên X, kí hiệuσ(X) được xác định bởi công thức: σ(X) = D(X).

Các phân phối xác suất sử dụng trong chương sau

Phân phối Bernoulli

Cho đại lượng ngẫu nhiên rời rạc X có miền giá trị E = {0,1} được gọi là có phân phối Bernoulli với tham số θ (0 < θ < 1) nếu có hàm mật độ xác suất: f(x) = dbern(x) = θ x (1−θ) 1−x , x ∈ E = {0,1}.

Phân phối Nhị Thức

Đại lượng ngẫu nhiên rời rạc X có miền giá trị E = {0,1,2, , n} được gọi là có phân phối nhị thức với tham số n và θ Hàm mật độ của nó được biểu diễn bằng công thức f(x) = C * n x * θ^x * (1−θ)^(n−x), với x thuộc miền giá trị E.

Phân phối Poisson

Đại lượng ngẫu nhiên rời rạc X có miền giá trị E = N = {0,1,2, , n, } được gọi là có phân phối Poisson với tham số θ nếu hàm mật độ xác suất của nó được xác định bởi công thức: f(x) = dpois(x) = e^(-θ) (θ^x) / x!, với x thuộc E = {0,1,2, }.

+ Nếu X 1 , X 2 độc lập, X 1 ∼ ρ(a 1 ) và X 2 ∼ ρ(a 2 ) thì :

Phân phối Đều

* Định nghĩa Đại lượng ngẫu nhiên liên tục X có hàm mật độ xác suất: f(x) 

0 nếu x /∈ [a, b] được gọi là có luật phân phối đều trên đoạn [a, b].

Phân phối Beta

* Định nghĩa Đại lượng ngẫu nhiên X có phân phối Beta với tham số a và b nếu có hàm mật độ: f(x) = dbeta(x) 

Phân phối Gamma

* Định nghĩa Đại lượng ngẫu nhiên liên tục X có phân phối Gamma với tham số a và b (a > 0, b > 0) nếu có hàm mật độ f(x) =dgamma(x, a, b) = b a Γ(a)x a−1 e −bx , x >0.

Phân phối inverse - Gamma

* Định nghĩa Đại lượng ngẫu nhiên liên tụcX có phân phối Inverse Gamma với tham số a và b (a > 0, b > 0) nếu có hàm mật độ f(x) = dgamma(x, a, b) = b a Γ(a)x −a−1 e −b/x , x > 0.

Kí hiệu là : X ∼ Inv−Gamma(a, b). Định lý 1.6.1 Đại lượng ngẫu nhiên X có phân phối Gamma(a,b) khi và chỉ khi 1/X có phân phối Inv-Gamma(a,b).

Phân phối Student

* Định nghĩa Đại lượng ngẫu nhiên liên tục X được gọi là có phân phối Student n bậc tự do nếu có hàm mật độ f n (x) = Γ( n+1 2 )

∀x ∈ R, trong đó Γ(x) là hàm Gamma.

Phân phối khi bình phương

* Định nghĩa Đại lượng ngẫu nhiên liên tục X được gọi là có phân phối khi bình phương n bậc tự do nếu có hàm mật độ f n (x) 

0 nếu x ≤ 0 trong đó Γ(x) là hàm Gamma.

Phân phối khi inverse - khi bình phương

Biến ngẫu nhiên liên tục X được gọi là có phân phối khi bình phương n bậc tự do nếu có hàm mật độ fn(x) 

0 nếu x ≤ 0 trong đó Γ(x) là hàm Gamma.

Kí hiệu X ∼ χ 2 n (n). Định lý 1.6.2 Đại lượng ngẫu nhiên X có phân phối χ 2 (n) khi và chỉ khi 1/X có phân phối Inv−χ 2 (n).

Vectơ ngẫu nhiên

Định nghĩa

Giả sử X 1 , X 2 , , X n là n biến ngẫu nhiên xác định trên cùng một không gian mẫu Ω.

Ký hiệu: X = (X 1 , X 2 , , X n ) Ánh xạ X : Ω →R n xác định bởi :

X(ω) = (X1(ω), X2(ω), , Xn(ω)), ω ∈ Ω.Khi đó X được gọi là véctơ ngẫu nhiên n chiều.

Hàm phân phối xác suất đồng thời

Hàm phân phối của vecto ngẫu nhiên X là một hàm số n biến được xác định như sau:

Hàm mật độ xác suất đồng thời

Cho véctơ ngẫu nhiênX = (X 1 , X 2 , , X n )có hàm phân phốiF(x 1 , x 2 , , x n ). Nếu tồn tại hàm số f(x1, x2, , xn) ≥ 0 với mọi (x1, x2, xn) ∈ R n sao cho:

Khi đó hàm số f(x 1 , x 2 , , x n ) được gọi là hàm mật độ của véctơ ngẫu nhiên X

Phương pháp Bayes ước lượng tham số 20

Phân phối xác suất có điều kiện

Cho hai đại lượng ngẫu nhiên X và Y, trong mục này tôi trình bày khái niệm phân phối xác suất của đại lượng ngẫu nhiên X dưới điều kiện

Cho hai đại lượng ngẫu nhiên X và Y, y là một giá trị của Y Hàm phân phối xác suất của đại lượng ngẫu nhiên X dưới điều kiện Y = y là

P(y ≤ Y ≤ y +ε)) , x ∈ R nếu giới hạn bên phải tồn tại với mọi x ∈ R.

2.1.2 Trường hợp Y là đại lượng ngẫu nhiên rời rạc

Cho hai đại lượng ngẫu nhiên X và Y, với y là một phần tử thuộc miền giá trị E của Y (P(Y = y) > 0) Hàm phân phối xác suất của X khi có điều kiện Y = y được biểu diễn bằng một hàm số.

2.1.3 Trường hợp Y là đại lượng ngẫu nhiên liên tục

Cho đại lượng ngẫu nhiên X có hàm mật độ fX(x) và đại lượng ngẫu nhiên Y có hàm mật độ f Y (x) thỏa mãn f Y (x) 6= 0 với mọix ∈ R, y là giá

Hàm mật độ xác suất đồng thời của vectơ ngẫu nhiên (X, Y) được ký hiệu là f X,Y (x, y) Đối với đại lượng ngẫu nhiên X, hàm phân phối xác suất của nó dưới điều kiện Y = y được biểu diễn dưới dạng một hàm số.

Định lý 2.1.1 nêu rằng cho hai đại lượng ngẫu nhiên X và Y với các hàm mật độ fX(x) và fY(y), hàm mật độ xác suất đồng thời fX,Y(x, y) của vectơ ngẫu nhiên (X, Y) có thể được biểu diễn qua hàm mật độ có điều kiện Cụ thể, hàm mật độ của X dưới điều kiện Y = y là fX/Y=y(x), trong khi hàm mật độ của Y dưới điều kiện X = x là fY/X=x(y) Mối quan hệ giữa các hàm mật độ này được thể hiện qua công thức: f(x/y) = fX(x)f(y/x)fY(y).

Ước lượng tham số phân phối Bernoulli

Đại lượng ngẫu nhiên rời rạc X có phân phối Bernoulli với tham số θ (0≤ θ ≤ 1), có hàm mật độ f(x/θ) = θ^x (1−θ)^(1−x) với x thuộc tập {0,1} Tham số θ chưa biết, và (x1, x2, , xn) là một mẫu số liệu của X.

Giả sử θlà đại lượng ngẫu nhiên có phân phối đều trên đoạn [0; 1] Hàm mật độ của θ là : f(θ) 1 nếu θ ∈ [0; 1]

Giả sử (X₁, X₂, , Xn) là một mẫu ngẫu nhiên của X, với hàm mật độ đồng thời f(x₁, x₂, , xₙ/θ) của vectơ ngẫu nhiên (X₁, X₂, , Xn) có điều kiện θ Để xác định hàm mật độ f(θ/x₁, x₂, , xₙ), chúng ta áp dụng Định lý 2.1.1, từ đó có được công thức: f(θ/x₁, x₂, , xₙ) = f(θ)f(x₁, x₂, , xₙ/θ) / f(x₁, x₂, , xₙ).

P i=1 x i nên ta cần tìm f (x1, x2, , xn).

Theo tính chất của hàm mật độ ta có

Do đó : f(θ/x1, x2, , xn) = Γ(n+ 2) Γ(k+ 1)Γ(n−k + 1)θ k (1−θ) n−k Như vậy, nếu θ có phân phối đều trên đoạn [0; 1] thì với điều kiện mẫu số liệu x 1 , x 2 , , x n p có phân phối Beta với tham số a = k + 1 và b = n−k+ 1 với k n

2.2.1 Công thức ước lượng khoảng tham số

Cho x1, x2, , xn là mẫu số liệu của đại lượng ngẫu nhiên X với phân phối Bernoulli và tham số θ Khi θ có phân phối đều trên khoảng [0; 1], ta có thể ước lượng khoảng của θ với độ tin cậy 1−α như sau: θ α/2 ≤ θ ≤ θ 1−α/2.

Trong đó, θ α/2 và θ 1−α/2 là các phân vị của phân phối Beta :

Beta(k + 1, n−k+ 1) với k = y1 +y2 + +yn xác định bởi :

Trong một cuộc khảo sát về cảm nhận hạnh phúc của phụ nữ từ 65 tuổi trở lên, 129 người đã được thăm dò ngẫu nhiên để thu thập dữ liệu.

118 người trả lời là hạnh phúc Với độ tin cậy 95% hãy ước lượng khoảng tỉ lệ phụ nữ tuổi từ 65 trở lên cảm thấy hạnh phúc.

Theo giả thiết ta có : n = 129 , k = 118 , α = 0.05.

Ta tìm θ α/2 và θ 1−α/2 bằng phần mềm R :

Như vậy ta có ước lượng khoảng của p với độ tin cậy 95% là [0.85; 0.95].

Nếu áp dụng phương pháp ước lượng cổ điển k n −1.96 v u u t k n(1− k n) n ≤p ≤ k n −1.96 v u u t k n(1− k n) n ta được ước lượng khoảng của là [0.86; 0.963].

Chọn ngẫu nhiên 10 sản phẩm từ một nhà máy cho thấy có 2 phế phẩm Với độ tin cậy 95%, ta tiến hành ước lượng tỷ lệ phế phẩm của nhà máy.

Theo giả thiết ta có : n = 10 , k = 2 , α = 0.05

Ta tìm θ α/2 và θ 1−α/2 bằng phần mềm R :

Như vậy ta có ước lượng khoảng của p với độ tin cậy 95% là [0.06; 0.52].

Ước lượng tham số phân phối nhị thức

Cho đại lượng ngẫu nhiên X có phân phối nhị thức Bin(n, θ) với hàm mật độ f(x/θ) = C n x θ^x (1−θ)^(n−x), trong đó x thuộc {1,2, ,n} Tham số n đã biết, trong khi tham số θ vẫn chưa được xác định Khi X nhận giá trị x, đây là một giá trị quan sát được của X.

Giả sử θlà đại lượng ngẫu nhiên có phân phối đều trên đoạn [0; 1] Hàm mật độ của θ là : f(θ) 1 nếu θ ∈ [0; 1]

Với giá trị quan sát X = x, hàm mật độ của θ là: f(θ/x) = f(x/θ)f(θ) f(x) = C n x θ x (1−θ) n−x f(θ) f(x)

= c(x)θ x (1−θ) n−x f(θ) Khi c(x) là hàm phụ thuộc vào x và không phụ thuộc vào θ, với f(θ) = 1 chúng ta có thể tìm được c(x) qua công thức sau :

Thay c(x) vào công thức f(θ/x) ta được : f(θ/x) = Γ(n+ 2) Γ(x+ 1)Γ(n−x+ 1)θ x (1−θ) n−x

= Γ(n+ 2) Γ(x+ 1)Γ(n−x+ 1)θ (x+1)−1 (1−θ) (n−x+1)−1 Như vậy, nếu xem θ có phân phối đều trên đoạn [0; 1] thì với giá trị quan sát X = x, θ có phân phối xác suất Beta(y + 1, n−y + 1)

2.3.1 Công thức ước lượng khoảng tham số

Giá trị quan sát x của đại lượng ngẫu nhiên X có phân phối nhị thức B(n, θ) với tham số θ Khi θ có phân phối đều trên đoạn [0; 1], khoảng ước lượng cho θ với độ tin cậy 1−α được xác định bởi: θ α/2 ≤ θ ≤ θ 1−α/2.

Trong đó, θ α/2 và θ 1−α/2 là các phân vị của phân phối Beta :

Trong ví dụ 2.3.1, sản phẩm của nhà máy A được đóng gói thành hộp với mỗi hộp chứa 20 sản phẩm Khi chọn ngẫu nhiên một hộp, phát hiện có 5 phế phẩm Dựa trên dữ liệu này, với độ tin cậy 95%, ta tiến hành ước lượng tỷ lệ phế phẩm của nhà máy.

Theo giả thiết ta có : n = 20 , y = 5 , α = 0.05

Ta tìm θ α/2 và θ 1−α/2 bằng phần mềm R :

Như vậy ta có ước lượng khoảng của θ với độ tin cậy 95% là [0.11; 0.47]

Ước lượng tham số phân phối Poisson

Cho đại lượng ngẫu nhiên rời rạc X có phân phối Poisson với tham số θ (θ > 0), hàm mật độ được biểu diễn là f(x/θ) = θ^x e^(-θ) / x! với x thuộc tập N = {0, 1, 2, } Giả sử (x1, x2, , xn) là một mẫu số liệu của X và tham số θ là một đại lượng ngẫu nhiên có hàm mật độ f(θ).

Giả sử (X₁, X₂, , Xn) là một mẫu ngẫu nhiên từ X, hàm mật độ xác suất đồng thời của (X₁, X₂, , Xn) được ký hiệu là f(x₁, , xₙ) Hàm mật độ xác suất đồng thời của (X₁, X₂, , Xn) với điều kiện θ là f(x₁, x₂, , xₙ | θ), trong khi hàm mật độ của đại lượng ngẫu nhiên θ với điều kiện (X₁, , Xn) = (x₁, , xₙ) được biểu diễn là f(θ | x₁, , xₙ) Theo đó, ta có công thức: f(θ | x₁, , xₙ) = f(θ)f(x₁, , xₙ | θ) / f(x₁, , xₙ) Từ đó, suy ra rằng f(θ | x₁, , xₙ) có thể được viết dưới dạng c₁(x₁, , xₙ)f(θ)f(x₁, , xₙ | θ).

Vì vậy, nếu chọn f(θ) = dgamma(θ, a, b) = b a Γ(a)θ a−1 e −bθ thì f(θ/x 1 , , x n ) =c 2 (x 1 , , x n ) b a Γ(a)θ a+ P n i=1 x i −1 e −(n+b)θ

−∞ f(θ/x 1 , , x n )dθ = 1 nên C(x1, , xn, a, b) = 1 Do đó, f(θ/x 1 , x n ) =dgamma(θ, a+ n

Như vậy, nếu xem θ có phân phối Gamma(a, b) thì với điều kiện mẫu số liệu x 1 , , x n , θ có phân phối Gamma(a+P n k=1 x k , b+n).

2.4.1 Công thức ước lượng tham số

Cho x1, x2, , xn là một mẫu số liệu của đại lượng ngẫu nhiên X có phân phối Poisson(θ) Nếu tham số θ có phân phối Gamma(a, b), thì với độ tin cậy 1−α, ước lượng khoảng của θ dựa trên mẫu số liệu là f(x/θ) = C n x θ x (1−θ) n−x, với x thuộc tập hợp {1, 2, , n}.

Trong đó,θ α/2 và θ 1−α/2 là các phân vị của phân phối

Trong ví dụ 2.4.1, số lượng khách hàng vào mua hàng tại một cửa hàng trong một ngày tuân theo phân phối Poisson Sau khi theo dõi trong 15 ngày, tổng số khách hàng ghi nhận là 165 Với mức độ tin cậy 95%, chúng ta sẽ ước lượng số khách trung bình vào cửa hàng mỗi ngày.

Gọi X là số khách vào mua hàng ở cửa hàng trong 1 ngày và X ∼

Theo giả thiết ta có : n= 15 , n

Sử dụng công thức ước lượng tham số phân phối Poisson ta có:

28 θ| {n= 15,Pxi = 165} ∼ gamma (2 + 165,1 + 15) = gamma (167,16) Chúng ta tìm θ với độ tin cậy là 95% bằng phần mềm R :

Như vậy ước lượng khoảng khách trong 1 ngày của cửa hàng là[8.91,12.07]

Trong cuộc điều tra của General Social Survey vào những năm 1990, 155 phụ nữ 40 tuổi đã được khảo sát về trình độ giáo dục và số con cái của họ Kết quả cho thấy mối liên hệ giữa trình độ giáo dục và số lượng con cái mà họ có.

- 111 phụ nữ không có bằng đại học thì có tổng cộng 217 đứa con

- 44 phụ nữ có bằng đại học thì có tổng cộng 66 đứa con

Giả sử số con của phụ nữ tuân theo phân phối Poisson với độ tin cậy 95%, chúng ta cần ước lượng khoảng số con trung bình giữa hai nhóm: phụ nữ có bằng đại học và phụ nữ không có bằng đại học Kết quả sẽ giúp hiểu rõ hơn về sự khác biệt trong sinh đẻ giữa hai nhóm này.

Gọi X là số con của một phụ nữ có bằng đại học, Y là số con của một phụ nữ không có bằng đại học Khi đó, X ∼ P ois(θ 1 ),Y ∼ P ois(θ 2 ).

Từ giả thiết ta có:

+ Nhóm phụ nữ không có bằng đại học : n 1 = 111 , n 1

P i=1 x i = 217. + Nhóm phụ nữ có bằng đại học : n 2 = 44 , n 2

Sử dụng công thức ước lượng chúng ta có: θ1| {n 1 = 111,Pxi = 217} ∼ gamma (2 + 217,1 + 111) = gamma (219,112) θ 2 | {n 2 = 44,Py i = 66} ∼ Gamma (2 + 66,1 + 44) = Gamma (68,45)

Chúng ta tìm θ 1 , θ 2 với độ tin cậy là 95% bằng phần mềm R :

Ước lượng khoảng kì vọng của phân phối chuẩn

N (à; σ 2 ) với điều kiện đó biết σ 2

Cho đại lượng ngẫu nhiờn X cú phõn phối chuẩn N(à, σ 2 ) cú hàm mật độ xỏc suất f(x/à, σ) = 1 σ √

Hàm mật độ xác suất của biến ngẫu nhiên X được định nghĩa bởi công thức 2Πe −(x−à)2 / (2σ²), trong đó tham số à chưa biết và σ đã được xác định Giả sử (x₁, x₂, , xₙ) là một mẫu số liệu của X, với (X₁, X₂, , Xₙ) là mẫu ngẫu nhiên từ X có hàm mật độ xác suất đồng thời f(x₁, x₂, , xₙ) Hàm mật độ xác suất đồng thời của (X₁, X₂, , Xₙ) trong điều kiện à là f(x₁, x₂, , xₙ | à) = 1.

−( xk −à)2 2σ 2 Nếu xem à là đại lượng ngẫu nhiờn cú phõn phối chuẩn N(à 0 , σ 0 2 ) cú hàm mật độ xỏc suất của à là f(à) = 1 σ 0 √ 2Πe

Mặt khác, theo định lý 2.1.1 ta có: f à (à/x 1 , x 2 , , x n ) = f(à).f(x 1, x 2 , , x n /à) f(x 1 , x 2 , , x n )

Theo tính chất hàm mật độ ta có:

Vỡ vậy ta cú: f(à/x1, x2, , xn) = 1 σ n

Kết luận: Nếuàcú phõn phối chuẩnN(à0, σ 0 2 )thỡ với điều kiệnx1, x2, , xn và đó biết σ thỡ à cú phõn phối chuẩn N(à n , σ n 2 ) với à n = b a 1 σ 2 0 à 0 + σ n 2.x

2.5.1 Công thức ước lượng khoảng

Cho x 1 , x 2 , , x n là một mẫu số liệu của X ∼N(à, σ 2 ) với σ 2 đó biết. Nếu à cú phõn phối chuẩn N(à 0 , σ 2 0 ) thỡ à/x 1 , x 2 , , x n ∼ N(à n , σ n 2 )

Do đú với độ tin cậy 1−α ta cú ước lượng khoảng của à là: à n −z(α

2).σ n Trong đó: z( α 2 ) xác định bởi: R+∞ z( α 2 )

Trong nghiên cứu này, chúng tôi đã chọn ngẫu nhiên 25 nam thanh niên và đo chiều cao trung bình là x = 1,68m với độ tin cậy 95% Dựa trên phân phối chuẩn N(μ, σ²) với σ = 0,1, chúng tôi ước lượng khoảng chiều cao trung bình của nam thanh niên.

Giả sử à cú phõn phối chuẩn N(à 0 , σ 0 2 )

−(à− àn )2 2σ 2 n với à n = a b và σ n = √ 1 a Chọn à 0 = 1,65 và σ 0 = 0,8 thừa đk: à 0 > 2σ 0

Do đú với độ tin cậy 1−α ta cú ước lượng khoảng à là: à n −z(α

⇒1,639 ≤ à≤ 1,717Vậy ta cú ước lượng khoảng à với độ tin cõy 95% là: [1,639;1,717].

2.6 Ước lượng khoảng tham số à và σ 2 của phõn phối chuẩn N (à; σ 2 ) với à và σ 2 chưa biết

Xột đại lượng ngẫu nhiờn X ∼ N(à, σ 2 ) với àvà σ 2 đều chưa biết Cho {x 1 , x 2 , , x n } là một mẫu số liệu của X.

Giả sử à và σ 2 là cỏc đại lượng ngẫu nhiờn lần lượt cú hàm mật độ xỏc suất f(à)và f(σ 2 ), giả sử rằng à và σ 2 độc lập.

Khi đú f(à;σ 2 ) = f(à).f(σ 2 ) là hàm mật độ xỏc suất đồng thời của (à;σ 2 ).

Giả sử (X₁, X₂, , Xn) là mẫu ngẫu nhiên của biến ngẫu nhiên X với hàm mật độ xác suất đồng thời f(x₁, x₂, , xₙ) Hàm mật độ xác suất đồng thời của mẫu ngẫu nhiên (X₁, X₂, , Xn) với điều kiện à và σ² được ký hiệu là f(x₁, x₂, , xₙ | à; σ²) Bên cạnh đó, hàm mật độ xác suất của Xₖ (với 1 ≤ k ≤ n) được biểu diễn bằng f(xₖ | à, σ²).

⇒ f(x 1 , x 2 , , x n /à, σ 2 ) = 1 σ√ 2Π ne P n k=1 −( xk 2σ −à)2 2 Theo định lý 2.1.1 ta có: f(à;σ 2 /x 1 , x 2 , , x n ) = f(à;σ 2 ).f(x 1 , x 2 , , x n /à;σ 2 ) f(x1, x2, , xn) f(à;σ 2 /x 1 , x 2 , , x n ) = f(à).f(σ 2 ).f(x 1 , x 2 , , x n /à;σ 2 ) f(x 1 , x 2 , , x n )

Nếu xem à là đại lượng ngẫu nhiờn cú phõn phối đều và σ 2 cú phõn phối Inv −Gamma(0,0) thì f(à;σ 2 /x 1 , x 2 , , x n ) = C(x 1 , , x n ) 1

Ước lượng khoảng kì vọng và phương sai

2# −n 2 Đặt x = à−x s √ n ta được: f(x/x1, x2, , xn) = C(x1, , xn).

Vậy à−x s √ n∼ T n−1 Mặt khác ta có: f(σ 2 /x 1 , x 2 , , x n ) Z +∞

Do đó σ 2 /x (n−1)s 1 , x 2 , ,x 2 n ∼ Inv−χ 2 (n−1) Suy ra σ 2 |x (n−1)s 2

Trong trường hợp biến ngẫu nhiên x1, x2, , xn tuân theo phân phối chi-squared với bậc tự do n-1, phương pháp Bayes cung cấp công thức ước lượng cho kỳ vọng và phương sai tương tự như công thức ước lượng cổ điển.

Nếu xột à cú phõn phối chuẩn và σ 2 cú phõn phối Inv-Gamma thỡ ta cũng có kết quả như trên.

2.6.1 Công thức ước lượng khoảng kì vọng

Cho x1, x2, , xn là một mẫu số liệu của đại lượng ngẫu nhiên X có phõn phối chuẩn N(à, σ 2 ) với σ 2 chưa biết.

Nếu xem xét hai phân phối đều và σ² có phân phối Inv-Gamma(0,0), và nếu à và σ² là độc lập, thì với độ tin cậy 1−α, ta có công thức ước lượng khoảng cho kì vọng à là:

Trong đó: s 2 = n−1 1 P n k=1 (xk−x) 2 vàtn−1( α 2 ) là giá trị tới hạn của bảng phân phối Student n−1 bậc tự do.

Một bài báo trong tạp chí Materials Engineering (1989, Vol.II, No.4, pp.275-281) đã trình bày kết quả kiểm tra độ bền của 22 mẫu hợp kim U-700, với giá trị trung bình x = 13,71 MPa và độ lệch chuẩn s = 3,55 MPa Dựa trên độ tin cậy 95%, có thể ước lượng khoảng độ bền trung bình của hợp kim này, với giả thiết rằng độ bền của hợp kim là một đại lượng ngẫu nhiên chuẩn.

Với độ tin cậy 1−α ta cú ước lượng khoảng của à là: x−t n−1 (α

⇒12,13 ≤ à≤ 15,27 Vậy ta cú ước lượng khoảng à với độ tin cậy 95% là: [12,13;15,27]

2.6.2 Công thức ước lượng khoảng phương sai

Cho x1, x2, , xn là một mẫu số liệu của đại lượng ngẫu nhiên X có phõn phối chuẩn N(à, σ 2 ) với σ 2 chưa biết.

Nếu xem rằng σ² là biến ngẫu nhiên theo phân phối Inv-Gamma(0,0) và σ² độc lập, thì với độ tin cậy 1−α, ta có công thức ước lượng khoảng cho phương sai σ².

Trong đó: k n−1 ( α 2 ) và k n−1 (1− α 2 ) là các giá trị tới hạn của phân phối khi bình phương n−1 bậc tự do.

Để nghiên cứu độ ổn định của máy gia công, một nghiên cứu đã tiến hành lấy ngẫu nhiên 25 chi tiết do máy thực hiện, sau đó tiến hành đo đạc và thu thập kết quả.

Để ước lượng độ phân tán của kích thước các chi tiết do máy gia công với độ tin cậy 95%, cần xem xét rằng kích thước chi tiết được gia công theo phân phối chuẩn Việc này sẽ giúp xác định các thông số thống kê cần thiết để đảm bảo chất lượng sản phẩm.

Với độ tin cậy 1−α ta có ước lượng khoảng của σ 2 là:

⇒ 1,48 ≤ σ 2 ≤4,67Vậy ta có ước lượng khoảng σ 2 với độ tin cậy 95% là: [1,48;4,67]

1 Nêu tóm tắt được các nội dung cơ bản và quan trọng cần cho nội dung chính

Phân tích các ước lượng tham số là một phần quan trọng trong thống kê, giúp chúng ta hiểu rõ hơn về các phân phối xác suất Đối với phân phối Bernoulli, công thức ước lượng tham số thường được xác định bằng tỷ lệ thành công trong một chuỗi thử nghiệm Trong khi đó, phân phối Nhị Thức sử dụng công thức ước lượng dựa trên số lần thành công trong n lần thử Đối với phân phối Poisson, tham số ước lượng được tính từ trung bình số sự kiện xảy ra trong một khoảng thời gian nhất định Cuối cùng, đối với phân phối chuẩn, các tham số ước lượng bao gồm trung bình và độ lệch chuẩn, được tính từ dữ liệu mẫu Các công thức này đóng vai trò quan trọng trong việc đưa ra các khoảng ước lượng chính xác cho từng loại phân phối.

Phương pháp Bayes là một công cụ mạnh mẽ trong ước lượng tham số của đại lượng ngẫu nhiên, và có thể được áp dụng trong nhiều lĩnh vực thực tế Bài viết này sẽ đưa ra các ví dụ cụ thể để minh họa cách sử dụng phương pháp Bayes, đồng thời thực hiện các tính toán thông qua phần mềm R Những đóng góp chính của khóa luận sẽ làm rõ tính hiệu quả và ứng dụng của phương pháp này trong việc ước lượng tham số.

1 Tìm hiểu và trình bày lại nội dung kiến thức cơ sở về xác suất thống kê.

2 Đề cập một số phân phối được dùng trong nội dung chính.

3 Nêu ra các ước lượng tham số của phân phối Bernoulli, phân phốiNhị Thức, phân phối Poisson và phân phối chuẩn.

Ngày đăng: 26/06/2021, 13:32

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Lê Văn Dũng, Tôn Thất Tú (2012), Bài giảng Lý thuyết xác suất và ứng dụng Sách, tạp chí
Tiêu đề: Bài giảng Lý thuyết xác suất và ứng dụng
Tác giả: Lê Văn Dũng, Tôn Thất Tú
Năm: 2012
[3] Đặng Hùng Thắng (2009), Thống kê và ứng dụng, NXB Giáo dục Sách, tạp chí
Tiêu đề: Thống kê và ứng dụng
Tác giả: Đặng Hùng Thắng
Nhà XB: NXB Giáo dục
Năm: 2009
[4] Carlin, B. P., Louis, T. A. (2000) Bayes And Empirical Bayes Methods For Data Analysis, Chapman &amp; Hall/CRC Sách, tạp chí
Tiêu đề: Bayes And Empirical Bayes Methods For Data Analysis
Tác giả: B. P. Carlin, T. A. Louis
Nhà XB: Chapman & Hall/CRC
Năm: 2000
[5] Fienberg, S.E. , van der Linden, W.J. (2007) Statistics for Social and Behavioral Sciences, Springer Sách, tạp chí
Tiêu đề: Statistics for Social and Behavioral Sciences
Tác giả: Fienberg, S.E., van der Linden, W.J
Nhà XB: Springer
Năm: 2007
[6] Hoff, P.D. (2009) A First Course In Bayesian Statistical Methods, Springer Sách, tạp chí
Tiêu đề: A First Course In Bayesian Statistical Methods
Tác giả: P.D. Hoff
Nhà XB: Springer
Năm: 2009
[2] Nguyễn Duy Tiến (2007), Cơ sở lý thuyết xác suất, NXB ĐHQG Hà Nội Khác

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w