1. Trang chủ
  2. » Luận Văn - Báo Cáo

Cơ sở thống kê bayes trong lý thuyết tìm kiếm

92 7 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 92
Dung lượng 802,17 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Đối với một bài toán tìm kiếm có thể chưa biết thông tin chính xác của đối tượng tìm kiếm, khi đó khái niệm xác suất chủ quan được sử dụng, cụ thể là phương pháp hợp lý tương đối.. Trong

Trang 1

NGUYỄN MAI HƯNG

CƠ SỞ THỐNG KÊ BAYES TRONG LÝ

Trang 2

CÔNG TRÌNH ĐƯỢC HÌNH THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH

Cán bộ hướng dẫn khoa học: Thầy NGUYỄN VĂN THU

Giáo Sư - Tiến Sĩ Khoa Học

Cán bộ chấm nhận xét 1: TS TÔ ANH DŨNG

Cán bộ chấm nhận xét 2: TS NGUYỄN BÁ THI

Luận văn Thạc sĩ được bảo vệ tại HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC SĨ

TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày 04 tháng 02 năm 2010

Trang 3

TRƯỜNG ĐH BÁCH KHOA TP HCM CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM

PHÒNG ĐÀO TẠO SĐH UĐộc lập - Tự do - Hạnh phúcU

Tp HCM, ngày 04 tháng 02 năm 2010

NHIỆM VỤ LUẬN VĂN THẠC SĨ

Ngày, tháng, năm sinh: 15/01/1983 Nơi sinh: Đăk Lăk

I- TÊN ĐỀ TÀI

CƠ SỞ THỐNG KÊ BAYES TRONG LÝ THUYẾT TÌM KIẾM

II - NHIỆM VỤ VÀ NỘI DUNG

Đọc các tài liệu về xác suất, thống kê Bayes, lý thuyết tìm kiếm và các kiến thức liên quan

Chương 1: Xác suất chủ quan

Chương 2: Hàm tiện ích

Chương 3: Thống kê quyết định

Chương 4: Bài toán quyết định liên tiếp

III - NGÀY GIAO NHIỆM VỤ: Ngày 08 tháng 12 năm 2008

IV- NGÀY HOÀN THÀNH NHIỆM VỤ: Ngày 15 tháng 01 năm 2010

V - CÁN BỘ HƯỚNG DẪN: Giáo sư - Tiến sĩ khoa học Nguyễn Văn Thu

GS - TSKH NGUYỄN VĂN THU PGS -TS NGUYỄN ĐÌNH HUY

CÁN BỘ PHẢN BIỆN 1: TS TÔ ANH DŨNG

CÁN BỘ PHẢN BIỆN 2: TS NGUYỄN BÁ THI

Trang 4

LỜI CẢM ƠNLời đầu tiên tôi trân trọng kính gửi đến Thầy hướng dẫn, GS.TSKH.Nguyễn Văn Thu, người Thầy hết lòng vì học trò, lòng biết ơn chân thành và sâu sắc nhất

Thầy đã rất ân cần và tận tình hướng dẫn, giúp đỡ tôi nắm được từng bước nghiên cứu và giải đáp những thắc mắc khi tôi gặp phải Từ Thầy, tôi càng hiểu thêm được

ý nghĩa, hứng thú và lòng say mê của việc nghiên cứu Toán học tưởng chừng như rất khô khan và ít ứng dụng Tôi xin khắc ghi những lời dạy, sự chỉ bảo ân cần của Thầy trong suốt quá trình học tập và hoàn thành luận văn này

Tôi cũng xin bày tỏ lòng biết ơn sâu sắc đến quý Thầy, Cô trong và ngoài bộ môn Toán học trường Đại học Bách Khoa TP Hồ Chí Minh đã tận tình truyền đạt kiến thức, kinh nghiệm quý báu cho tôi trong suốt thời gian học tập tại trường Chân thành cảm ơn Ban chủ nhiệm khoa khoa học ứng dụng, quý Thầy, Cô thuộc Phòng Quản lý Sau Đại học, thư viện trường Đại học Bách Khoa TP Hồ Chí Minh đã tạo điều kiện thuận lợi để tôi hoàn thành chương trình học cũng như trong quá trình làm thủ tục bảo vệ luận văn tốt nghiệp

Xin cảm ơn các anh chị lớp Cao học Toán Ứng Dụng Khóa 2007, các anh chị trong nhóm seminar do Thầy Mẫn tổ chức đã động viên và nhiệt tình giúp đỡ tôi trong suốt thời gian qua

Tôi cũng không quên gửi lời biết ơn đến gia đình tôi, những người đã hết lòng

lo lắng và luôn ở bên tôi trong những lúc khó khăn nhất

Sau cùng, vì kiến thức bản thân còn hạn chế nên luận văn khó tránh khỏi thiếu xót Tôi rất mong được sự chỉ bảo của quý Thầy, Cô và sự góp ý chân thành của các bạn bè đồng nghiệp Tôi xin chân thành cảm ơn

Nguyễn Mai Hưng

Trang 5

Từ đó, luận văn đi vào nghiên cứu bài toán quyết định liên tiếp nhằm áp

dụng xây dựng mô hình tìm kiếm tối ưu

Trang 6

MỤC LỤC

Trang

TỔNG QUAN ĐỀ TÀI 8

CHƯƠNG 0: CÁC KÍ HIỆU VÀ ĐẶC TRƯNG CÔNG VIỆC TÌM KIẾM 10

0.1 Biến ngẫu nhiên và các phân phối 10

0.2 Định lý Bayes 11

0.3 Sơ lược về lý thuyết tìm kiếm Bayes 11

CHƯƠNG 1: XÁC SUẤT CHỦ QUAN 13

1.1 Mở đầu 13

1.2 Sự hợp lý tương đối 13

1.3 Kinh nghiệm bổ trợ 16

1.4 Cấu trúc của phân phối xác suất 17

1.5 Kiểm tra tính chất của một phân phối xác suất 19

1.6 Hợp lý có điều kiện 21

CHƯƠNG 2: HÀM TIỆN ÍCH 22

2.1 Lời mở đầu 22

2.2 Các khái niệm có liên quan 22

2.3 Định nghĩa hàm tiện ích 23

2.4 Tính chất hàm tiện ích 26

2.5 Tiền đề phát triển của tính tiện ích 32

2.6 Cấu trúc hàm tiện ích 35

2.7 Kiểm tra những tính chất của hàm tiện ích 38

CHƯƠNG 3: THỐNG KÊ QUYẾT ĐỊNH 42

3.1 Những thành phần của một vấn đề quyết định 42

3.2 Rủi ro Bayes và quyết định Bayes 44

3.3 Hàm tổn thất không âm 46

3.4 Tính lõm của rủi ro Bayes 46

Trang 7

3.5 Sự ngẫu nhiên hóa và quyết định hỗn hợp 48

3.6 Tập lồi 50

3.7 Bài toán quyết định khi Ω và D hữu hạn 51

3.8 Bài toán quyết định khi có sự quan sát 55

3.9 Cấu trúc hàm quyết định Bayes 56

3.10 Chi phí của sự quan sát 60

3.11 Bài toán quyết định khi Ω và d chứa hai điểm 65

3.12 Tính toán phân phối hậu nghiệm khi quan sát được thực hiện trong 67

nhiều bước

CHƯƠNG 4: QUYẾT ĐỊNH LIÊN TIẾP 69

4.1 Lợi ích của việc lấy mẫu liên tiếp 69

4.2 Quá trình quyết định liên tiếp 73

4.3 Rủi ro của một quá trình quyết định liên tiếp 76

4.4 Quy nạp lùi 78

4.5 Quá trình quyết định liên tiếp bị chặn tối ưu 79

4.6 Bài toán tìm kiếm 82

4.7 Bài toán tìm kiếm với chi phí bằng nhau 86

HƯỚNG PHÁT TRIỂN – KẾT LUẬN 89

TÀI LIỆU THAM KHẢO 90

Trang 8

TỔNG QUAN ĐỀ TÀI

Tính cấp thiết đề tài

Khoa học thống kê đề cập đến sự phát triển của các lý thuyết và kỹ thuật để suy diễn hợp lý dưới những điều kiện không chắc chắn Các bài toán thống kê hiện nay phụ thuộc chủ yếu vào công thức của các mô hình xác suất, phương pháp thu thập và phân tích số liệu Lý thuyết quyết định xem xét lớp các bài toán thống kê trong đó các nhà thống kê phải nhận được thông tin về những tham số nào đó, để đưa ra các quyết định có hiệu quả trong tình huống mà kết quả của quyết định sẽ dựa trên giá trị của những tham số này Trong kĩ thuật, kinh tế đã có rất nhiều kết quả quan trọng được thực hiện dựa trên lý thuyết tìm kiếm Việc nghiên cứu và ứng dụng lý thuyết này có ý nghĩa trong phát triển khoa học và ứng dụng thực tiễn ở Việt Nam

Xác định vấn đề nghiên cứu

Thống kê Bayes là một phương pháp thống kê mới phát triển nhưng có nhiều ứng dụng thực tiễn Luận văn đưa ra cơ sở lý thuyết thống kê Bayes nhằm ứng dụng vào lý thuyết tìm kiếm

Đối với một bài toán tìm kiếm có thể chưa biết thông tin chính xác của đối tượng tìm kiếm, khi đó khái niệm xác suất chủ quan được sử dụng, cụ thể là phương pháp hợp lý tương đối

Hàm tiện ích chỉ ra cách xác định sự ưu tiên hoặc sở thích liên quan đến phần thưởng và phân phối xác suất Trong phần này, luận văn thảo luận và phát triển những tính chất cần có của một hàm tiện ích trên những phân phối xác suất đã có và phương pháp xây dựng hàm tiện ích

Tiếp theo, luận văn trình bày về các vấn đề liên quan đến thống kê quyết định Nhiều ví dụ cụ thể được trình bày để làm rõ các khái niệm trong phần này

Trang 9

Phần cuối của luận văn trình một phương pháp tìm quá trình tối ưu của bài

toán quyết định liên tiếp trong trường hợp số quan sát hữu hạn, và trình bày một mô hình tìm kiếm lý thuyết

Luận văn được trình bày với các chương sau đây:

Chương 0 trình bày các ký hiệu, các kiến thức cơ bản về lý thuyết xác suất

và đặc trưng công việc tìm kiếm

Chương 1 trình bày phương pháp xây dựng xác suất chủ quan

Chương 2 khảo sát các tính chất của hàm tiện ích

Chương 3 trình bày khái niệm của bài toán thống kê quyết định, và xem xét

các ví dụ làm rõ các khái niệm đó

Chương 4 thảo luận về bài toán quyết định liên tiếp

Hướng phát triển của luận văn được trình bày trong phần kết luận

Cuối cùng là phần tài liệu tham khảo

Trang 10

Chương 0: CÁC KÍ HIỆU VÀ ĐẶC TRƯNG CÔNG VIỆC TÌM KIẾM

0.1 Biến ngẫu nhiên và các phân phối

Xét ( , , )S Q P là một không gian xác xuất, trong đó:

S : không gian mẫu

Q : σ − đại số trên S

P : phân phối xác suất trên ( , ) S Q

Với biến cố A bất kì, Pr( ) A : xác suất xảy ra biến cố A

Một biến ngẫu nhiên X là một hàm thực, Q -đo được và xác định s S∀ ∈ Mọi

biến ngẫu nhiên X đều sinh ra một phân phối xác suất P X trên đường thẳng thực

Mọi tập Borel B⊂ , xác suất P B X( ) được xác định như sau:

Trang 11

( ) ( ) ( )

B g x f x d x

nếu X là biến ngẫu nhiên liên tục

Nếu F là hàm phân phối (d.f) của biến ngẫu nhiên X , đôi khi ta sử dụng kí

0.3 Sơ lược về lý thuyết tìm kiếm Bayes

Lý thuyết tìm kiếm Bayes là một ứng dụng của thống kê Bayes để tìm kiếm những vật bị thất lạc Nó đã từng được sử dụng để tìm tàu đắm (USS Scorpion, MV Derbyshire, SS Central America), bom H ở Tây Ban Nha, đường hầm Triều Tiên… Quá trình tìm kiếm thông thường là:

1 Phát triển một số giả thiết đã xảy ra với vật cần tìm kiếm

2 Tương ứng với mỗi giả thiết, ta xây dựng một phân phối xác suất cho những khu vực tìm kiếm

3 Xây dựng xác suất tìm thấy vật thất lạc khi ta tìm kiếm tại một khu vực nào

đó Ví dụ: trong việc tìm kiếm ở đại dương, nó thường là một hàm số theo độ sâu đáy biển

4 Kết hợp các thông tin đó một cách mạch lạc để đưa ra một phân phối xác suất toàn diện Và điều này cho ta một phân phối xác suất trên những vùng có thể được tìm kiếm

Trang 12

5 Nếu không tính đến chi phí, thường là ta sẽ xây dựng một quá trình tìm kiếm bắt đầu từ những vùng có xác suất cao đến vùng có xác suất thấp hơn

6 Tính toán lại phân phối xác suất sau mỗi lần tìm kiếm không thành công Quá trình tính toán lại được thực hiện bằng cách sử dụng định lý Bayes

Trang 13

Chương 1: XÁC SUẤT CHỦ QUAN

1.1 Mở đầu

Rất nhiều công việc trong xác suất và thống kê đề cấp đến nguồn gốc xác suất của một biến cố phức tạp từ xác suất của những biến cố đơn giản hơn Trong phần này, chúng ta sẽ quan tâm đến câu hỏi sau:

“Làm thế nào mà một người làm thống kê vào lúc ban đầu có thể ấn định xác suất cho những biến cố làm cơ sở cho hầu hết những tính toán tiếp theo ? ’’

Sự ấn định này thường dựa trên sự kết hợp của những phương pháp cũ và kinh nghiệm Trong một vài bài toán, một mô hình xác suất tự nhiên miêu tả những trường hợp đó Do đó, những xác suất phù hợp có thể thường được chỉ định một cách chủ quan và nhanh chóng bởi vì sự đồng ý rộng rãi dựa trên sự thích hợp của một phân phối xác suất xác định cho một bài toán cụ thể

Mặt khác, trong một vài trường hợp, có thể có nhiều khó khăn để tìm ra sự tương đồng giữa hai người trong việc đồng ý một phân phối xác suất nào đó Trong trường hợp này, sự chỉ định xác suất của nhà thống kê có tính chủ quan cao và phản ánh chính thông tin có được và độ tin cậy của anh ấy Chúng ta sẽ thảo luận chi tiết những điều kiện mà những nhà thống kê có thể đưa ra những thông tin và độ tin cậy của anh ta trong giới hạn của những phân phối xác suất

1.2 Sự hợp lý tương đối

Xét mộtσ -đại số Q những biến cố của không gian mẫu S, ta muốn ấn định một

xác suất cho mỗi biến cố trong Q

Một ý tưởng là tồn tại một biến cố có khả năng xuất hiện thấp nhất so với các biến cố khác Và ý tưởng này được chấp nhận như là nguồn gốc của những phát triển sẽ được trình bày sau đây

Định nghĩa: Khi hai biến cố A và B có thể so sánh, chúng ta viết:

A B > biểu thị cho sự xuất hiện của A hợp lý hơn B

A B ∼ biểu thị sự xuất hiện A và B hợp lý như nhau

A B ≥ khi A > B hoặc A B

Trang 14

Cuối cùng ta định nghĩa A < B và A B≤ tương tự như trên

Vì xác suất của một biến cố được giả sử là một số đo sự hợp lý mà biến cố sẽ

xuất hiện nên bất kì phân phối xác suất P nào được chỉ định cho những biến cố

trong σ - đại số Q , sẽ có tính chất P(A) P(B) nếu và chỉ nếu A B≤ Một phân phối xác suất có tính chất trên được gọi là phù hợp với quan hệ “≤ ” Chúng ta sẽ tìm hiểu điều kiện để thỏa mãn bởi quan hệ “≤ ” sao cho tồn tại duy nhất một phân phối xác suất phù hợp với nó Những giả định về quan hệ “≤ ” sẽ được đưa ra bởi ý tưởng có tính trực giác về sự hợp lí tương đối của sự xuất hiện hai biến cố và bởi tính chất toán học của phân phối xác suất

Giả định SP1: Với hai biến cố bất kì A và B, một trong 3 quan hệ sau xảy ra:

AB D c cAB D c = ∅ , ABD cA BD c c = ∅ và

A BD c cA BD c = ∅ , AB D cA B D c c = ∅ nên theo SP2 ta có:

Trang 15

ABD cA BD c cAB D c cAB D AB D ccA B D c cA BD c cA BD c (1.2.3) ⇔ ABD cAB D c cA B D c cA BD c (theo bổ đề 1) (1.2.4)

Định lý này dễ dàng được chứng minh bằng phương pháp chứng minh quy nạp

Định lý 1.2.3: Với hai biến cố A và B bất kỳ, A B ≤ nếu và chỉ nếu A cB c

Tương tự, ta chứng minh được chiều đảo của định lý

Giả định SP3: Nếu A là biến cố bất kì thì ∅ ≤ ; hơn nữa, A ∅ < S

Định lý 1.2.4: Nếu A và B là hai biến cố thỏa A ⊂ thì A B B ≤ Tổng quát hơn, nếu A là một biến cố bất kì thì ∅ ≤ ≤ A S

Chứng minh:

Vì A ⊂ nên ta có B A D B = ∪ Theo giả định SP2 và SP3 ta suy ra A A D≤ ∪

Nếu A là một biến cố bất kì, theo giả định SP3 và chứng minh trên ta có:

Trang 16

A1⊂A2⊂ , theo định lý 1.2.3 ta có: A1cA2c ⊃ là một dãy hữu hạn các biến cố thỏa c c

áp dụng định lý 1.2.3 ta có điều phải chứng minh

Định lý 1.2.6: Nếu A A1, 2 là một dãy vô hạn các biến cố đôi một xung khắc, và

1, 2

B B là một dãy vô hạn các biến cố đôi một xung khắc khác thỏa A i ≤ với i = B i

1, 2…, thì i∞=1A i ≤ ∪i∞=1B i Hơn nữa, nếu tồn tại i (i = 1, 2….) thỏa A i < thì B i

biến cố khả thi là A và A' Chúng ta có thể cảm thấy rằng A > A' , nhưng rõ ràng là

Trang 17

chúng ta không thể để chỉ định những xác suất rõ ràng cho 2 biến cố mà không

thêm giả thiết Hơn nữa, chúng ta có thể so sánh sự hợp lí tương đối của A và A' ,

không những cho chúng mà còn cho những biến cố khác mà xác suất của chúng đã được thành lập

tính chất sau: mỗi biến cố trong lớp B có một xác suất đã biết và bất kì một số p

(0≤ ≤ đều tồn tại một biến cố B∈ p 1) B mà có xác suất là p Do đó, khi ấn định

một xác suất cho một vài biến cố A mà chúng ta quan tâm, chúng ta tìm được một biến cố B ∈ B sao cho A ~ B và chỉ định để A có cùng xác suất với B Sự giả định

này là cần thiết, tuy nhiên nó không thể trình bày rõ ràng theo cách này bởi vì những mô tả này không cung cấp một cách xác định những xác suất của biến cố trong lớp B được ta chọn hoặc đã biết

Như ta đã biết, một biến ngẫu nhiên X là một hàm Q -đo được mà giá trị của

nó được xác định tại mọi điểm s S ∈ Do đó, với một biến ngẫu nhiên X bất kì và

một khoảng I1 và I2 bất kì của đường thẳng thực Biến cố {XI1} và {XI2}

thuộc σ -đại số Q và theo giả định SP1 ta có:

{XI1} {≤ XI2} hoặc {XI1} {≥ XI2}

Cho một khoảng I =( , )a b với a b≤ , đặt ( )λ I = − là độ dài của I b a

Chú ý rằng (( , ))λ a b =λ(( , ])= ([ , ))a b λ a b =λ([ , ])a b

Định nghĩa:

Nếu X là một biến ngẫu nhiên thỏa 0X s( ) 1,≤ ∀ ∈s S thì biến ngẫu nhiên X

được gọi là có phân phối đều trên [0,1] nếu thỏa tính chất sau:

Với I1⊂⎡⎣0,1⎤⎦ và I2⊂⎡⎣0,1⎤⎦; {XI1} {≤ XI2}⇔λ( )I1 ≤λ( )I2

Giả định SP5: Tồn tại một biến ngẫu nhiên có phân phối đều trên 0, 1⎡⎣ ⎤⎦

1.4 Cấu trúc của phân phối xác suất

Trang 18

Giả sử X là một biến ngẫu nhiên có một phân phối đều trên 0,1⎡⎣ ⎤⎦ Với ( , )a b ⊂⎡⎣0,1⎤⎦, đặt ( , )G a b biểu thị cho biến cố biến ngẫu nhiên X nằm trong ( , ) a b Với hai khoảng bất kì ( , ), ( , )a b1 1 a b2 2 sao cho 0≤ ≤ ≤ (i = 1, 2) thì: a i b i 1

Trang 19

Định nghĩa:

Với A là một biến cố, đặt P A( )=a*, với a được xác định theo định lý 1.4.1 *

Hay P A( ) được xác định bởi quan hệ sau:

1.5 Kiểm tra tính chất của một phân phối xác suất

Ta cần kiểm tra lại hàm P được định nghĩa ở trên phải thỏa mãn yêu cầu của một phân phối xác suất Rõ ràng, từ định nghĩa của P thì ( ) 0 P A ≥ với mọi biến cố

A Hơn nữa, vì S G= [0,1] nên ( ) 1P S = Để hoàn tất việc kiểm tra, ta cần phải chứng minh rằng: bất kì dãy biến cố đôi một xung khắc nhau A A1, , 2 thì:

A B G∪ < ⎡⎣0,P A( )⎤⎦ ∪G P⎡⎣ ( ) (A ,P A B∪ )⎤⎦=G⎡⎣0,P A B( ∪ )⎤⎦(mâu thuẫn(1.5.3) Tương tự giả sử B G P A P A B> ( ( ) (, ∪ )⎤⎦, cũng dẫn đến mâu thuẫn

Trang 20

Vì ( ( ) ( ) ( ) ( )

( )

0,

,0,

Theo hệ quả 1.5.1 và định lý 1.5.2 ta chứng minh được (1.5.1) đúng

Định lý 1.5.3: Hàm P là một phân phối xác suất

Chứng minh: Giả sử A1, ,A n là dãy những biến cố đôi một xung khắc, theo hệ quả 1.5.1 ta có:

Trang 21

Vì các biến cố A i (i = 1, 2,…) đôi một xung khắc nên dãy các biến

cốB n = ∪i n∞= +1A i (n = 1, 2,… ) là một dãy tăng thỏa n1 n B

=

∩ = ∅ Khi đó, theo định lý 1.5.2 ta có: lim ( )n 0

Chứng minh: Giả sử có phân phối xác suất P' phù hợp với quan hệ ≤ Từ tính chất của phân phối đều ta có :

Định lý 1.6.1: Nếu quan hệ “ ≤ ” thỏa các giả định từ SP1 đến SP5 và giả định

CP thì hàm P đã được định nghĩa bởi phương trình 1.4.3 là phân phối xác suất duy nhất có tính chất sau:

Với ba biến cố bất kì A, B và D thỏa P (D) > 0 thì:

( ) ( )A DB DP A D( ) ( )≤P B D

Chứng minh: Theo giả định CP và định lý 1.5.4 ta dễ dàng chứng minh định lý trên

Trang 22

Chương 2: HÀM TIỆN ÍCH

2.1 Lời mở đầu

Xác suất chủ quan được định nghĩa và phát triển ở chương 1 là những mô tả về

niềm tin và thông tin ta có được Những tiện ích của ta được định nghĩa và phát

triển trong chương này là những mô tả về sở thích và sự ưu tiên của ta

Trong phần này, chúng tôi cố gắng đưa ra định nghĩa và các khái niệm liên quan

tới hàm tiện ích cũng như chứng minh hoặc lí giải các tính chất của hàm tiện ích

2.2 Các khái niệm liên quan

R: tập lợi nhuận có thể có được từ các danh mục đầu tư (phần thưởng)

A

g r dP r

Trang 23

Gọi P ={P P1, , ,2 P k} là tập hợp các phân phối xác suất thắng lợi trong một tập

phần thưởng (hoặc một danh mục đầu tư)

So sánh hai phân phối xác suất P1 và P2:

PP : P1 và P2 tương đương nhau

Với r1 và r2 là hai phần thưởng bất kì sao cho r1≤*r2, ⎡⎣r r1 2, ⎤⎦ là tập con của R

Cho P là phân phối bất kì thuộc P, g là hàm khả tích trên R Gọi E g P( ) là kì

vọng của g trong điều kiện P là hàm phân phối xác suất trên R

Trang 24

Với P1,P2 thuộc P là hai phân phối xác suất bất kì sao cho E U P( 1) và E U P( 2)

PPE U PE U P

U r( ) gọi là tiện ích của r

Trong trường hợp phần thưởng là các giá trị rời rạc ta có:

P j thuộc P ={P P1, , ,2 P k} là tập hợp các ph

ân phối xác suất thắng lợi trong tập phần thưởng

Ví dụ : ta có một trò chơi xổ số gồm 4 giải thưởng và 3 luật chơi như sau:

Phần thưởng R Ppxs thắng của luật

chơi 1

Ppxs thắng của luật chơi 2

Ppxs thắng của luật chơi 3

Trang 25

Trong trường hợp tổng quát, ta cũng chứng minh tương tự

b) Sự tồn tại hàm tiện ích bảo đảm cho một lớp rộng lớn của những phân phối xác suất trong P Nếu PE là lớp của toàn bộ các phân phối sao cho E U P( ) tồn tại thì hai phân phối bất kì trong PE có thể so sánh được

Lớp PE phải bao gồm cả các lớp phân phối bị chặn PB

Trang 26

Chứng minh: Cho hai phân phối xác suất bất kì P1 và P2 mà kì vọng tiện ích của nó tồn tại

Xét tập R gồm ba phần thưởng r r r1 2, , 3 riêng biệt

Mỗi phân phối xác suất trong P được biểu diễn bởi một véctơ xác suất

(p p p1, ,2 3), trong đó p i > 0 (i=1, ,3) và p1+p2+ p3= Không mất tính tổng 1quát, giả sử:

i) r1>* r2 >* r3

ii) Tồn tại hàm tiện ích U trên R

iii) U r( )1 = ;1 U r( )2 = ; u U r( )3 = 0

Chúng ta sẽ nghiên cứu các kết quả từ những giả định này

Với P=(p p p1, ,2 3) và Q=(q q q1, ,2 3) là hai phân phối xác suất bất kì:

Trang 27

gì cả

Khi một người thích ván 4 hơn ván 3, anh ấy có lí do là: việc không nhận được

gì trong ván 4 có xác suất cao hơn một chút so với ván 3 Tuy nhiên, số tiền thưởng trong ván 4 thì lớn hơn rất nhiều so với ván 3 Nét đặc biệt của ví dụ là: chỉ có 3 khoản tiền duy nhất xuất hiện trong 4 ván chơi do đó thảo luận về ví dụ 1 là xác đáng

Giả sử rằng hàm tiện ích của một người là U thỏa mãn:

U(2,500.000$) > U(500,000$) > U(0$)

Phân phối xác suất thắng cuộc của từng ván chơi là :

Trang 28

(0;1;0) > (0.01;0.89;0.1) ⇔(0.89;0.11;0) > (0.9;0;0.1)

Tức là nếu ta thích ván 1 hơn ván 2 thì ta cũng phải thích ván 3 hơn ván 4 Vậy mâu thuẫn do đâu mà có? Sự mâu thuẫn dường như đòi hỏi rằng hàm tiện ích không tồn tại cho nhiều người có quyết định trong những điều kiện đã được giả định Tuy nhiên, nó có thể thích hợp hơn để kết luận rằng hàm tiện ích của một người trong ví

dụ này dựa trên nhiều hơn những món tiền thưởng

Mục đích của những thảo luận trước là nhấn mạnh sự cần thiết cho những chú

ý liên quan đến tiền đề là có một hàm hàm tiện ích riêng biệt, khi anh ta có một lựa chọn, chỉ dựa vào một vài tập hợp những phần thưởng đơn giản, như là một khoản tiền kiếm được Một quyết định riêng lẻ, có thể xem như tiền thưởng anh ấy có được thì phức tạp hơn nhiều Và hàm tiện ích của anh ấy có thể được xác định bởi nhiều yếu tố Đây thực sự là một xác suất khi mà một người đưa ra sự lựa chọn dựa vào kinh nghiệm không tự nhiên của của một dạng như trong ví dụ 2.4.2 Một sự minh họa khác cho những tham khảo này, anh ta không chỉ nghĩ về lợi ích của việc thắng hay thua mà còn nghĩ về lợi ích của việc giải trí (tức là mục đích tham dự ván bài của anh ấy chỉ mang tính giải trí, anh ấy không xem trọng việc thắng thua)

Tính tiện ích của giá trị tiền thưởng:

Trong phần này, chúng ta sẽ tìm cách chỉ ra một vài khó khăn liên quan đến tiện ích của một lợi nhuận, cũng như sự đo được của nó Tuy nhiên, nếu lợi nhuận

có thể kiếm được và sự thua lỗ trong hoàn cảnh được đưa ra thì không quá rộng và nếu ta giả sử các yếu tố khác có thể cực tiểu hóa, thì nó không vô lí để thảo luận những hàm tiện ích được định nghĩa trên tập hợp giá trị tiền thưởng Hàm tiện ích

đã đề cập ở trên được sử dụng rộng rãi, và chúng sẽ được thảo luận trong phần này Nghịch lý St Petersburg:

Ví dụ mà chúng ta sẽ đưa ra bây giờ là một trong những minh họa sớm nhất về hàm tiện ích của một người, sẽ không phải là một hàm tuyến tính Giả sử là một người có cơ hội chơi trò chơi sau: một đồng xu cân đối mặt sấp và ngửa có cùng xác suất xuất hiện, được gieo cho tới khi mặt ngửa xuất hiện lần đầu tiên Nếu mặt ngửa

Trang 29

xuất hiện lần đầu sau n lần gieo (ở lần gieo thứ n), thì phần thưởng của người chơi

là 2 $n Người chơi sẽ phải trả bao nhiêu cho một lần chơi?

Vì xác suất lần đầu tiên xuất hiện mặt ngửa ở lần thứ n là 1

n n n

dù quan niệm về tính tiện ích chỉ ra rằng đó không phải là nghịch lý

Tính lồi lõm của hàm tiện ích:

Trang 30

a) Hàm lồi ngặt b) Hàm lồi không ngặt

Bất đẳng thức Jensen: Cho g x( ) là một hàm lồi trong khoảng (a, b), và cho X

là một biến ngẫu nhiên thỏa {P X∈( , )} 1a b = và kì vọng E X và ( ) E g X⎡⎣ ( )⎤⎦ tồn tại Ta có:

E g X [ ( )] ≥ g E X [ ( )] (2.4.2) Hơn nữa, nếu g x( ) là lồi ngặt và {P X =E X( )} 1≠ thì ta có :

E g X [ ( )] > g E X [ ( )]

Chứng minh:

Nếu phân phối xác suất của X suy biến và hội tụ về một giá trị, thì hai kì vọng

trong bất đẳng thức (2.4.2) là bằng nhau Giả sử rằng phân phối trên là không suy biến, ta có a E X< ( )< Nó là một tính chất của hàm lồi là tồn tại một đường b thẳng tựa y ax bx= + tiếp xúc với đường cong y g x= ( ) tại điểm x E X= ( ) và nó

không cao hơn đường cong tại mọi điểm thuộc khoảng (a, b)

Trang 31

Hình biểu diễn đường thẳng tiếp tuyến của y g x= ( ) tại x E X= ( )

Xét tập những phần thưởng R là một khoảng (a,b), và giả sử rằng hàm tiện ích

U của một người là lồi ngặt trong khoảng (a,b) Theo bất đẳng thức Jensen thì người này sẽ lựa chọn một ván chơi mà sinh ra một khoản lợi nhuận ngẫu nhiên X trong khoảng (a, b) hơn là một kì vọng lợi nhuận E X xác định chắc chắn Nó thể hiện ( )

rằng anh ấy là một người yêu thích rủi ro

Hàm lõm:

Định nghĩa: Một hàm thực g xác định trên khoảng (a, b) của đường thẳng thực được gọi là lõm nếu (– g) là hàm lồi trên (a, b)

Trang 32

Do đó, g là lõm trên (a, b) nếu, cho hai điểm bất kì x và y thuộc (a, b) và bất kì

số α bất kì thuộc (0, 1) thì:

g xα + −α y ≥αg x + −α g y (2.4.6)

Ta cũng nói g là lõm ngặt khi (– g) là lồi ngặt

Ta giả sử hàm tiện ích U của một người là lồi ngặt trên khoảng giá trị giải thưởng (a, b), như trong hình sau:

Theo bất đẳng thức Jensen thì một người sẽ ưu tiên chọn một khoản tiền nhận

được cố định x trong khoảng (a, b) hơn là nhận một khoản tiền ngẫu nhiên mang tính may rủi X trong khoảng (a, b) mà E X( )= Một người có hàm tiện ích là hàm x

lõm được gọi là có thái độ tránh rủi ro

Ví dụ về bài toán bảo hiểm:

Hàm tiện ích của hầu hết mọi người có khuynh hướng là hàm lõm, ít ra là cho lợi nhuận nhiều nhất hoặc tổn thất nhiều nhất Người ta lựa chọn bảo hiểm vì họ thích trả một khoản tiền cố định x > hơn là rủi ro mất một khoản tiền lớn h với 0

một xác suất rất nhỏ E Nói một cách khác, khi một người mua bảo hiểm, anh ta ưu

tiên chọn một lợi nhuận cố định ( )− hơn là nhận được x ( )− với xác suất E và h không có lợi nhuận với xác suất 1 – E Sự ưu tiên này được xác định bởi ràng buộc

sau:

U(−x) > EU(–h) + (1 – E)U(0) (2.4.7) Hàm U không cần thiết phải là lõm trên toàn khoảng hợp lệ cho ràng buộc (2.4.7) đúng cho giá trị đặc biệt x

Trang 33

Một công ty bảo hiểm có rất nhiều hợp đồng bảo hiểm và có rất nhiều vốn Vì thế, liên quan tới bất kì một hợp đồng riêng biệt nào, hàm tiện ích U t của công ty bảo hiểm xấp xỉ với một hàm tuyến tính theo lợi nhuận (U t có thể được chọn sao cho U y t( )= trên một khoảng hợp lí) Khi mà công ty bán một hợp đồng bảo y

hiểm, thì dĩ nhiên lợi nhuận mong muốn của họ phải lớn hơn 0 Vì lợi nhuận mong

muốn từ việc bán bảo hiểm là khoản tiền x trừ đi khoản tiền kì vọng Eh mà họ phải trả theo hợp đồng bảo hiểm, công ty bảo hiểm sẽ cố định một khoản tiền x cao đủ để

họ có lợi nhuận là:

x Eh− > (2.4.8) 0Nếu hai ràng buộc (2.4.7) và (2.4.8) thỏa thì hợp đồng bảo hiểm sẽ được kí kết

2.5 Tiền đề phát triển tính tiện ích

Giả sử, trong phần 2.2 mối quan hệ “≤ ” có thể được sử dụng để thiết lập một *

thứ tự toàn phần trong lớp PB của tất cả các phân phối xác suất bị chặn trên toàn tập

phần thưởng R Trong phần này chúng ta sẽ bắt đầu kiểm tra các điều kiện xa hơn

được áp đặt trên mối quan hệ “≤ ”để tồn tại hàm U được định nghĩa trên tập R và *

có tính chất sau:

Tính chất Π : Với P1 và P2 là hai phân phối bất kì trong lớp PB , *

1 2

PP nếu

và chỉ nếu E U P( ) (1E U P Nói một cách khác, hàm U là một hàm tiện ích cho 2)

các phân phối trong lớp PB

Chú ý sau đây sẽ được sử dụng trong việc thảo luận Cho P1 và P2 là hai phân phối bất kì trong P, và α là một số bất kì thỏa 0< < Thì phân phối được chỉ α 1định cho xác suất αP A1( ) (1+ −α) ( )P A2 cho mỗi tập của những phần thưởng A∈Q

sẽ được kí hiệu bởi biểu thức αP1+ −(1 α)P2

Trong trường hợp đặc biệt, nếu r1 và r2 là hai phần thưởng bất kì trong R,α là một số bất kì thỏa 0< < thì α 1 αr1+ −(1 α)r2 định nghĩa phân phối trong P mà phần thưởng r1 được nhận với xác suất là α và phần thưởng r2 được nhận với xác

Trang 34

suất là 1− Hơn nữa, nên chú ý rằng nếu cả α P1 và P2 là hai phân phối trong lớp PB

thì phân phối αP1+ −(1 α)P2 cũng thuộc lớp PB Bây giờ, chúng ta có thể phát biểu giả định đầu tiên

Giả định U 1: Giả sử P1, P2 và P là ba phân phối bất kì trong lớp PB , và α là một

1 2 (1 )1 2

r < αr + −α r < r (2.5.2) Chứng minh:

Với mỗi phần thưởng r i có thể được viết dưới dạng:

Trang 35

Bổ đề 2.5.3: Giả sử r1 và r2 là hai phần thưởng bất kì trong R thỏa *

Chứng minh:

Với 0≤ < ≤ , đặt α β 1 (1 )

(1 )

βγ

α

=

− ⇒ ≤ < 0 γ 1 ⇒βr2+ −(1 β)r1=γ α⎡⎣ r2+ −(1 α)r1⎤⎦+ −(1 γ)r2 (2.5.4) ⇒αr2+ −(1 α)r1=γ α⎡⎣ r2+ −(1 α)r1⎤⎦+ −(1 γ α)⎡⎣ r2+ −(1 α)r1⎤⎦

Giả định U 2:

Giả sử rằng P 1 , P 2 và P là ba phân phối bất kì trong lớp PB sao cho * *

P < P< P Tồn tại ,α β ( 0 <α<1 và 0 <β<1) thỏa :

Trang 36

Nếu α1∈ và S1 α2 > thì α1 α2∈ Nếu S1 α1∈ và S2 α2 > thì α1 α2∈ Và S2 S1,

2

S đều khác rỗng vì 1∈ và S1 0∈ Vì thế S2 S1 có dạng (β,1⎤⎦, S2 có dạng ⎡⎣0,α) Hơn nữa, theo giả định U2 thì nếu β1∈ thì tồn tại S2 β2<β1, vàβ2∈ Do đó, S2 β

không thể thuộc S1 Tương tự, ta cũng có α không thể thuộc S2

S1∩S2 = ∅ nên α β≤ Vì vậy, tồn tại v thỏa α ≤ ≤ Vì v không thuộc v β

s < t Bây giờ, chúng ta có thể xây

dựng hàm U đáp ứng với hàm tiện ích của chúng ta Nếu r là phần thưởng bất kì trong R thỏa * *

Trang 37

Định lý tiếp theo chứng minh tính tuyến tính của hàm U thể hiện trong đẳng thức (2.6.3) và (2.6.6) thậm chí giữ vững trên toàn tập R

Định lý 2.6.1: Nếu r1, r2và r3 là ba phần thưởng trong R sao cho ∃ ∈α [0,1] thỏa

trong quan hệ (2.6.10) khi r r= Khi đó: 2

U r1( )2 =αU r1( ) (3 + −1 α)U r1( )1 (2.6.12)

Trang 38

Để hoàn tất chứng minh, ta phải chỉ ra rằng U r là một hàm tuyến tính của 1( )i U r ( )i

với i=1, 2, 3 Trong trường hợp đó, đẳng thức (2.6.12) cũng sẽ đúng cho hàm U Với r i là phần thưởng bất kì trong r1, r2, r3 Ta giả sử rằng * *

0 i 0

srt , thì theo đẳng thức (2.6.1) ta có:

* ( ) ( )

rU r t + −⎡⎣ U r s⎤⎦ Theo (2.6.8) và (2.6.12), ta thay thế r2bởi r1, r3 bởi t0, r1 bởi s0, và α bởi U r ta ( )i

có:

U r1( )i =U r U t1( )i 1( )0 + −⎡⎣1 U r U s( )i ⎤⎦ 1( )0 (2.6.13) Tiếp theo, ta giả sử rằng *

Trang 39

Trong phần này, chúng ta đưa ra hai giả định để bảo đảm hàm U sẽ thỏa tính chất

Π Tính chất Π đòi hỏi kì vọng E U P( )cho mỗi phân phối PP và giả định đầu B

tiên bảo đảm rằng hàm U là đo được đối với σ - đại số Q các tập con của R Tính

đo được cần thiết để chắc chắn rằng kì vọng E U P( ) có nghĩa cho mọi PP Giả B

định thứ hai bảo đảm rằng những quan hệ tương đương đơn giản đòi hỏi giá trị

0

r< s Theo (2.6.2) và (2.6.4) và bổ đề 2.5.3 ta có: U r( )≤ nếu và chỉ nếu x

Tiếp theo giả sử rằng 0≤ ≤ Khi đó, x 1 U r( )≤ nếu và chỉ nếu x

Trang 40

Quan hệ tương đương cho những phân phối bị chặn

Cho r1 và r2là hai phần thưởng bất kì trong R thỏa r1<*r2, và xét ⎡⎣r r1 2, ⎤⎦ như đã định nghĩa bởi đẳng thức (2.2.2) Theo định lý 2.5.1, với mỗi r r r⎡1 2, ⎤

U r( )=α( )r U r( )2 + −⎡⎣1 α( )r U r⎤⎦ ( )1 (2.7.7) ( ) ( ) ( )

( ) ( )2 11

U r U r r

U r U r

− (2.7.8)

Giả định sẽ được đưa ra sau đây có thể được giải thích như sau: xét một phân phối

P bất kì thỏa P([r , ]) = 11 2r Vì mỗi phần thưởng r∈⎡⎣r r1 2, ⎤⎦ thì tương đương với ván chơi may rủi mà nhận phần thưởng r2 với xác suất α( )r và phần thưởng r1 với xác suất 1−α( )r , thì Pcũng tương đương với một ván chơi may rủi mà nhận r2 hoặc r1

với những xác suất chắc chắn Thật vậy, xét ván chơi gồm hai bước trong đó bước thứ nhất trong ván chơi có dạng ⎡⎣α( )r r⎤⎦ 2+ −⎡⎣1 α( )r r⎤⎦ 1 được chọn đầu tiên theo phân phối P trên ⎡⎣r r1 2, ⎤⎦ và sau đó một trong hai phần thưởng r2 hoặc r1 được chọn theo ván chơi này Xác suất nhận phần thưởng r2 được xác định như sau:

α là một hàm tuyến tính của hàm đo được Uvà giá trị của nó trên ⎡⎣r r1 2, ⎤⎦ bị chặn

Ngày đăng: 04/04/2021, 06:56

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] De Groot, Morris H., Optimal Statistical Decisions,Wiley Classic Library, 2004 Khác
[2] Heny R.Richardson. Search Theory, Center for Naval Analyses (1986) [3] Herman Chernoff &amp; Lincoln E Moses, Elementary Decision Theory, Dover Publication, 1959 Khác
[4] Iida, Koji. Studies on the Optimal Search Plan, Vol 70, Lecture Notes in Statistics, Springer_Verlag, (1992) Khác
[5] James O.Berger, Statistical Decision Theory And Bayesian Analysis, Springer_Verlag, 1985 Khác
[7] Koopman, B.O. Search and Screening, Operation Research Evaluation Group Report, Center for Naval Analyses, Alexandria Virginia, 1946 Khác
[8] Stone, L.D (1989). Theory of Optimal Search (2nd). Lithicum: Informs Khác

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w