Bài viết cung cấp một số dạng luật mạnh số lớn trong khuôn khổ lí thuyết trò chơi xác suất của Shafer và Vovk (2001). Các dạng luật mạnh số lớn trong lí thuyết trò chơi được thiết lập với hàng rào bậc hai có sẵn.
Trang 1TẠP CHÍ ĐẠI HỌC SÀI GÒN Số 20 - Tháng 4/2014
MỘT SỐ DẠNG LUẬT MẠNH SỐ LỚN TRONG LÍ THUYẾT TRỊ CHƠI XÁC SUẤT
ĐỖ THẾ SƠN (*)
LÊ HỒNG SƠN (**)
TĨM TẮT
Bài báo cung cấp một số dạng luật mạnh số lớn trong khuơn khổ lí thuyết trị chơi
xác suất của Shafer và Vovk (2001) Các dạng luật mạnh số lớn trong lí thuyết trị chơi được thiết lập với hàng rào bậc hai cĩ sẵn
Từ khố: luật mạnh số lớn, lí thuyết, xác suất, trị chơi xác suất
ABSTRACT
The paper presents some versions of the strong law of large numbers in the framework of the game-theoretic probability of Shafer and Vovk (2001) Game-theoretic versions of the strong law of large numbers are established under the availability of the quadratic hedge
Keywords: the strong law of large numbers, theory, probability, probability game
1 GIỚI THIỆU*
Trong khuơn khổ của lí thuyết trị chơi
xác suất, việc chứng minh các nước đi của
Thực tế (Reality) tuân theo luật mạnh số
lớn (LMSL) trong trường hợp các nước đi
này b chặn là khá dễ dàng Tuy nhiên, khi
các nước đi của Thực tế khơng b chặn,
việc chứng minh trở nên phức tạp hơn Bên
cạnh đĩ, tương ứng với một số dạng phổ
biến nhất của LMSL trong lí thuyết xác
suất cần phải được nghiên cứu trong lí
thuyết trị chơi xác suất (nếu cĩ)
Bài báo cung cấp một số dạng LMSL
trong trị chơi dự báo khơng bị chặn
(unbounded forecasting game) đã được giới
thiệu trong chương 4 của [1] Tiếp theo, khi
hạn chế nước đi của Thực tế trong trị chơi
dự báo khơng b chặn là các số thực dương,
(*) ThS, Trường ĐH Cơng nghiệp TP Hồ Chí Minh, Cơ sở
Thanh Hĩa
(**) TS, Khoa Giáo dục đại cương, Trường ĐH Sư phạm
Kĩ thuật Vinh
chúng tơi đưa ra một giao thức mới, gọi là
trị chơi dự báo khơng bị chặn một phía
(One-sided unbounded forecasting game) Sau đĩ, chúng tơi chứng minh một số kết quả dạng LMSL đối với giao thức này
2 MỘT SỐ KHÁI NIỆM VÀ KẾT QUẢ
SƠ BỘ Trong mục này, chúng tơi tĩm tắt một
số khái niệm cơ bản của trị chơi dự báo khơng b chặn Sau đĩ, chúng tơi đưa ra hai kết quả dạng LMSL đối với trị chơi này Xét trị chơi hồn hảo thơng tin giữa ba
người: Dự báo (Forecaster), Hồi nghi (Skeptic) và Thực tế (Reality) Trước khi bắt
đầu trị chơi, Hồi nghi cơng bố số vốn ban đầu của mình K0 1 (K0 D 0 trong mục
2 của [2]) Sau đĩ, ở mỗi vịng n1, 2, của
trị chơi, người chơi lần lượt cơng bố các nước
đi (move) của mình theo thứ tự: Dự báo, Hồi
nghi và Thực tế Tại mỗi vịng, đầu tiên Dự báo cơng bố nước đi m và n v của mình, n
Trang 2chúng được hiểu lần lượt như là giá cho nước
đi x của Thực tế và giá cho bình phương độ n
(x nm n) Căn cứ vào các giá mà Dự
báo đưa ra, Hoài nghi sau đó sẽ công bố số
lượng M và n V mà anh ta đặt cược lần lượt n
cho x và n (x n m n)2 Cuối cùng, Thực tế
công bố nước đi x của mình Số phải trả n
(payoff) cho Hoài nghi tại vòng thứ n là
2
n n n n n n n
M x m V x m v và số vốn
(capital) của Hoài nghi khi kết thúc vòng thứ
n được cập nhật là:
2 1
K K M x m V x m v
Giao thức của trò chơi dự báo không b
chặn được viết như sau
TRÒ CHƠI DỰ BÁO KHÔNG BỊ CHẶN
(UNBOUNDED FORECASTING GAME)
Người chơi: Dự báo, Hoài nghi, Thực tế Giao thức:
0 1
K
Dự báo công bố m n và v n 0 Hoài nghi công bốM n và V n 0 Thực tế công bố x n
2 1
K K M x m V x m v
Nhiệm vụ ràng buộc: Hoài nghi phải
giữ K không âm n
Thực tế phải giữ K không tiến đến vô n
cùng
Một chiến lược (strategy) P{P }n n1 của Hoài nghi xác đ nh M và n V dựa vào n
các nước đi trước của Dự báo và Thực tế,
và nước đi hiện tại của Dự báo
P
M M m x m x m x m
( , v , , , v , , , , v , , , v )
P
P
n
K là số vốn tích lũy (cumulative) của
Hoài nghi với chiến lược P sau vòng n,
với K0P=0
Chúng ta gọi một dãy hàm giá tr thực
1 1 1
( , v , , , , v , )
S m x m x của các nước đi
1, v , , ,1 1 n, v ,n n
m x m x , n0 là một quá
trình vốn (capital process) nếu S n K n P đối
với một chiến lược P nào đó
Một dãy vô hạn
(m, v , ,x m , v ,x , )
đi của Dự báo và Thực tế được gọi là một
đường đi (path) Tập tất cả các đường đi
{ (m, v , ,x m , v ,x , ), n 1}
gọi là không gian mẫu (sample space), tập
con bất kỳ E gọi là một biến cố
(event) Chúng ta nói rằng Hoài nghi có thể
buộc (force) biến cố E nếu tồn tại một chiến lược P của Hoài nghi sao cho
( ) 1, , n 0
P n
K (1)
n K
Chú ý rằng Hoài nghi có thể buộc biến cốE, tức là E xảy ra hầu chắc chắn (xem [1])
Một chiến lược P của Hoài nghi thỏa
mãn (1) được gọi là thận trọng (prudent)
Chúng ta cũng gọi hàm thực (h x nm n)của hiệu các nước đi x và n m là một hàng rào n
(hedge) nếu 0h(xnm )n Cho hai biến cố E F, biến cố
Trang 3EF được xác đ nh là E F E cF
Chúng ta cũng nói rằng một quá trình A là
dự báo được (predictable) nếu với mọi số
nguyênn1,
1 1 1 2 2 2
(m , , ,m , , , ,m , , )
không phụ thuộc vào x n
Một supermartingale T là một quá
trình có dạng T S B, với S là một quá
trình vốn vàBlà một quá trình tăng
(B n( ) B n1( ), n, ) Một quá trình
0
B có thể xem là tăng nên bản thân một
quá trình vốn S là một supermartingale
Một semimartingale là một quá trình có thể
viết dưới dạng U T A, với Tlà một
supermartingale và A là một quá trình tăng
dự báo được; quá trình A được gọi là
compensator đối với U
Bây giờ chúng ta chứng minh đ nh lí
dưới đây:
Định lí 2.1 Trong trò chơi dự báo
không b chặn, Hoài nghi có thể buộc
1
n n
x
v
Trước khi chứng minh đ nh lí này,
chúng ta thảo luận về ý nghĩa của đ nh lí và
đặc trưng của giao thức trò chơi dự báo
không b chặn
Trong giao thức của trò chơi dự báo
không b chặn, chúng ta xét hàng rào
phương sai (còn gọi là hàng rào bậc hai
2
(xn m )n (xn m )n
h ) Do đó, giao thức
này được gọi chính xác là trò chơi dự báo
không b chặn với hàng rào bậc hai Trong
trò chơi này, hàng rào bậc hai được cố đ nh
sẵn đối với Hoài nghi còn các giá của hàng
rào v sẽ được Dự báo công bố ở mỗi vòng, n
trước khi Thực tế công bố nước đi của
mình Vì vậy, sẽ rất hữu ích nếu chúng ta
thay hàng rào bậc hai bởi hàng rào tổng quát hcòn giá của hàng rào là một hằng số dương cố đ nh (xem [3])
Đ nh lí 3.1 của [3] cho thấy rằng trong trò chơi dự báo không b chặn với hàng rào đơn 1
h x x thì Hoài nghi có thể buộc x n 0, với
1 2 n
n
x x x x
n
đề 2.1 của [3] cũng khẳng đ nh rằng trong trò chơi dự báo không b chặn với hàng rào đơn ( )h x x r, r0 thì Hoài nghi không thể buộc 1 2 1/
0
n r
x x x n
Tuy nhiên, cả đ nh lí và mệnh đề này đều được phát biểu đối với trò chơi dự báo không b chặn với hàng rào đơn h, trong
đó giá của hàng rào đơn hlà hằng số dương (tức là: v n v 0, n 1) Do vậy, khi xem xét trò chơi dự báo không b chặn với hàng rào bậc hai, có hai câu hỏi chính
mà chúng ta cần quan tâm là có thể thay n trong Đ nh lí 3.1 của [3] bằng n hay
không và nếu có thể, thì chúng ta cần phải thêm điều kiện gì? Đ nh lí 2.1 đã đưa ra một câu trả lời cho hai câu hỏi trên
Việc tiếp theo của chúng ta bây giờ là đưa ra chứng minh cho Đ nh lí 2.1
Chứng minh Không mất tính tổng
quát, chúng ta giả sử rằng m n 0, n Đặt
1
n k n
k
x S
k
1
n k n
k
v A
k
,
1
k k
v A
k
Trang 4
Xét
2 2
1
2
x x v
U S A S
k k
=
2
x x v
U S
n n
= U n1M x n nV x n( n2v n)
1
k
k
x
1
n
V
n
Suy ra, U là một quá trình vốn, n
do đó U cũng là một supermartingale n
Từ
1 1
n
k
Chúng ta có S là một quá trình vốn, với n
1
n
M
n
và V n 0 nên S cũng là một n
supermartingale
Chú ý rằng S n2 U nA n, do đóA là n
compensator đối với semimartingale 2
n
S
Khi đó từ Bổ đề 4.7 của [1], nếu A
thì S hội tụ h.c.c, tức là n
n
n Kết hợp với bổ đề Kronecker, ta được:
1
n n
k x
v
Trong các giáo trình về lí thuyết xác suất, tốc độ hội tụ của LMSL có thể được đánh giá bằng một dãy số ( )b tăng dương n
(0b n ) Tuy nhiên, trong lí thuyết trò chơi xác suất, dãy số dương tăng trở nên đặc biệt hơn, như trong Đ nh lí 2.2 dưới đây
Định lí 2.2 Gọi 2
1
n
k
, trong trò chơi
dự báo không b chặn, Hoài nghi có thể buộc
1
n n
v
và 2
1
n n
x
v
x m
Chứng minh Chú ý rằng, không mất tính
tổng quát, chúng ta giả sử m n 0, n Xét
quá trình vốn
1
n k n
x S
B
Compensator
của S n2 là 2
1
n k n
v A
B
Từ hai bổ đề 4.6
và 4.7 của [1] kết hợp với bổ đề Kronecker,
ta dễ dàng suy ra
1
1
n
k x
k n
x B
3 TRÒ CHƠI DỰ BÁO KHÔNG BỊ CHẶN MỘT PHÍA
Với trò chơi dự báo không b chặn ở mục trước, chúng ta thấy rằng nước đi x n
của Thực tế là một số thực bất kỳ Trong mục này, chúng tôi hạn chế nước đi của Thực tế là các số thực dương và đưa ra giao
thức trò chơi dự báo không bị chặn một phía với hàng rào bậc hai (One-sided unbounded
forecasting game with quadric hedge) Sau
đó, chúng tôi chứng minh một số kết quả dạng LMSL đối với giao thức này
Giao thức trò chơi dự báo không b
Trang 5chặn một phía với hàng rào bậc hai được
viết như sau:
ONE-SIDED UNBOUNDED
FORECASTING (OUF)
Người chơi: Dự báo, Hoài nghi, Thực tế
Giao thức:
K0 1
Với n1, 2, :
Dự báo công bố m n 0 và v n 0
Hoài nghi công bốM n và V n 0
Thực tế công bốx n 0
2 1
K K M x m V x m v
Nhiệm vụ ràng buộc: Hoài nghi phải
giữ K không âm n
Thực tế phải giữ K không tiến đến n
vô cùng
Đ nh lí dưới đây được phát triển dựa vào Đ nh lí 4.4 của [2] phát biểu cho trò chơi dự báo không b chặn
Định lí 3.1 Đặt
1
n
k
, giả sử rằng glà một hàm số dương tăng trên
[0; ) với g( ) Trong OUF, Hoài nghi có thể buộc
1
n
n
m
1
n n
k k x
v
x m
Chứng minh Đặt
n
k k n
x m U
g B
n k n
k k
v A
g B
,
1 (B )
k
k k
v A
g
Xét
2 2
1
(B ) ( )
g
g B
=
2
n n
g B
g B
= T n1M x n( nm n)V n[(x nm n)2v n]
với
1 1
1
n
n
k
M
g B g B g B
và
1 ( )
n
n
V
g B
Do đó T là một quá trình vốn, suy ra n
n
T cũng là một supermartingale Mặt khác
1
n
suy ra U cũng là một quá trình vốn với n
1
n
n
M
g B
và V n 0
Lưu ý rằng U n2 T n A n nên A là n
compensator đối với 2
n
U Khi đó, theo Bổ
đề 4.7 của [1], ta có
n
hội tụ h.c.c, khi n
Trang 6Kết hợp với bổ đề Kronecker, ta được
1
1 lim ( ) 0
( )
n
k k x
k n
g B
Đ nh lí được chứng minh
Như chúng ta đã biết trong lí thuyết xác
suất, luật mạnh số lớn Kolmogorov đã được
nghiên cứu với các biến ngẫu nhiên độc lập
cùng phân phối Trong trường hợp đó, kỳ
vọng và phương sai của các biến ngẫu nhiên
đó là những hằng số không phụ thuộc vào n
Tương ứng với điều đó, trong lí thuyết trò
chơi xác suất, ta xét luật mạnh số lớn với
các nước đi của Thực tế là những hằng số
và thu được hệ quả dưới đây
Hệ quả 3.2 Trong OUF, giả sử rằng
n
m , v n 2 với mọi n, đặt
1
n
k
Khi đó, Hoài nghi có thể buộc
lim n x
S
Chứng minh Trong Đ nh lí 3.1, lấy
hàm g x( )x2 Khi đó
1
n
v
,
g B
Do đó
1
1
n k x
k
x
hay
lim n x
S
TÀI LIỆU THAM KHẢO
1 G Shafer, V Vovk, Probability and Finance: It's Only a Game! Wiley, 2001
2 Kenshi Miyabe, Akimichi Takemura, Convergence of random series and the rate of convergence of the strong law of large numbers in game-theoretic probability, Stochastic Process Appl 122 (2012) 1-30
3 M Kumon, A Takemura, K Takeuchi, Game-theoretic versions of strong law of large numbers for unbounded variables, Stochastic 79 (5) (2007) 449-468
* Ngày nhận bài: 6/3/2014 Biên tập xong: 16/5/2014 Duyệt đăng: 22/5/2014