Quá trình phân nhánh có nhiều ứng dụng trong sinh học quần thể, sinhhọc phân tử, sinh y, dân số học,.... 1.3 Tính chất cơ bản của hàm sinhCác tính chất của hàm sinh fns chứa các tính chấ
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
NGUYỄN THỊ THU
QUÁ TRÌNH PHÂN NHÁNH
VÀ ỨNG DỤNG
LUẬN VĂN THẠC SĨ KHOA HỌC
Chuyên ngành: Lí thuyết xác suất và thống kê toán học
NGƯỜI HƯỚNG DẪN KHOA HỌC
TS TẠ NGỌC ÁNH
HÀ NỘI - 2017
Trang 3Mục lục
1.1 Định nghĩa 3
1.2 Mômen 5
1.3 Tính chất cơ bản của hàm sinh 6
1.4 Xác suất tuyệt chủng 8
1.5 Các định lý giới hạn 10
1.5.1 Các định lý về tỉ lệ 13
1.5.2 Trường hợp dưới tới hạn 14
1.5.3 Trường hợp tới hạn 16
1.5.4 Trường hợp siêu tới hạn 19
1.5.5 Tính chất cấp 2 của Zn/mn 21
1.6 Quá trình Q 23
2 Quá trình phân nhánh Markov thời gian liên tục 26 2.1 Định nghĩa 26
2.2 Phương trình hàm 27
2.3 Hàm sinh 29
2.4 Xác suất tuyệt chủng và mômen 30
2.5 Ví dụ 32
2.6 Nhúng vào quá trình Galton - Watson 33
2.7 Định lý giới hạn 35
2.7.1 Trường hợp trên tới hạn λ > 0 35
2.7.2 Trường hợp tới hạn λ = 0 36
2.7.3 Trường hợp dưới tới hạn 38
Trang 43 Quá trình phụ thuộc tuổi 39
3.1 Giới thiệu 39
3.2 Xác suất tuyệt chủng 41
3.3 Mômen 43
3.4 Tiệm cận của F (s, t) 44
3.4.1 Trường hợp tới hạn 44
3.4.2 Không tới hạn : trường hợp Malthusian 45
3.4.3 Không tới hạn: trường hợp sub-exponential 46
3.5 Các định lý giới hạn 46
3.5.1 Trường hợp tới hạn 46
3.5.2 Trường hợp dưới tới hạn 47
3.5.3 Trường hợp trên tới hạn 48
4 Ứng dụng 50 4.1 Chuỗi phản ứng PCR và quá trình phân nhánh 50
4.1.1 Cơ chế hoạt động của PCR 50
4.1.2 Mô hình toán học 51
4.1.3 Ước lượng thống kê của tỉ lệ đột biến 52
4.2 Khuếch đại gen 53
4.2.1 Khuếch đại gen và kháng thuốc 53
4.2.2 Quá trình Galton - Watson cho mô hình khuếch đại và suy giảm gen 54
4.2.3 Mô hình toán học của mất sức đề kháng 55
Trang 5Mở đầu
Quá trình phân nhánh là một quá trình ngẫu nhiên mô tả sự phát triểncủa một quần thể Các cá thể sinh sản và chết đi độc lập với nhau theomột số phân bố xác suất nào đó
Quá trình phân nhánh có nhiều ứng dụng trong sinh học quần thể, sinhhọc phân tử, sinh y, dân số học,
Có nhiều kiểu quá trình phân nhánh: thời gian không liên tục (quátrình Galton - Watson), thời gian liên tục (quá trình Markov, quá trìnhphụ thuộc tuổi, quá trình Bellman - Harris) Nhưng trong khuôn khổ luậnvăn em trình bày ba quá trình phân nhánh cơ bản là: quá trình Galton -Watson, quá trình Markov, quá trình phụ thuộc tuổi và một số ứng dụngđơn giản của quá trình phân nhánh
Luận văn “Quá trình phân nhánh và ứng dụng” gồm: Mở đầu, bốnchương nội dụng, kết luận và tài liệu tham khảo
Em xin cảm ơn đến các thầy cô giáo trong Khoa Toán - Cơ - Tin học,Phòng Sau đại học trường Đại học Khoa học Tự nhiên - Đại học Quốc gia
Hà Nội, các thầy, cô giáo trực tiếp giảng dạy lớp cao học chuyên ngành Lýthuyết xác suất và thống kê toán học, khóa học 2013 - 2015 đã giúp đỡ emtrong suốt quá trình học tập Đặc biệt, em xin chân thành cảm ơn TS TạNgọc Ánh người đã trực tiếp hướng dẫn em hoàn thành luận văn thạc sĩnày
Hà Nội, ngày 29 tháng 11 năm 2016
Học viên
Nguyễn Thị Thu
Trang 6- δij là ký hiệu delta Kronecker.
- Phân bố xác suất {pk} là toàn bộ dữ liệu của bài toán
Quá trình có thể được miêu tả như là sự phát triển thành quần thể củacác cá thể Bắt đầu tại thời điểm 0 với số lượng cá thể là Z0, mỗi cá thể(sau một đơn vị thời gian) sẽ phân tách độc lập thành các cá thể khác,tạo ra được một lượng ngẫu nhiên con theo quy luật xác suất {pk} Nhưvậy, số lượng các cá thể ở thế hệ thứ nhất Z1 là tổng của Z0 biến ngẫunhiên(bnn) độc lập có phân bố xác suất {pk} Cũng như vậy, thế hệ thứ
2, 3, được sinh ra Tất cả các cá thể là độc lập với nhau Số lượng cáthể trong thế hệ thứ n là bnn Zn
Trang 7Từ (1.1) ta thấy nếu Zn = 0 thì Zn+k = 0 ∀k ≥ 0 Do đó 0 là trạngthái ổn định và khi đó thì quá trình trở thành tuyệt chủng.
Chú ý 1.1.2 Khi muốn chú ý đến số lượng cá thể khởi đầu, chúng ta sẽđặt
Trang 8trong đó m là số con cái trung bình của một cá thể.
Từ quy luật của chuỗi ta có
EZn = XPn(1, j)j = fn0(1) = fn−10 (1)f0(1)
= · · · = [f0(1)]n = mn (1.6)Tương tự từ công thức
Trang 91.3 Tính chất cơ bản của hàm sinh
Các tính chất của hàm sinh fn(s) chứa các tính chất của hàm chuyển
Pn(i, j), do đó thay vì nghiên cứu giới hạn của {fn(s)} ta nghiên cứu giớihạn của {Zn} Chúng ta bắt đầu nghiên cứu các vấn đề này bằng các tínhchất cơ bản sau:
Cho t là một số thực Từ định nghĩa f (t) là một chuỗi với các hệ sốkhông âm {pk} và p0 + p1 < 1 suy ra f (t) có các tính chất sau
1 f (s) là lồi và tăng trong [0, 1]
Trang 10Bổ đề 1.3.2.
• Nếu t ∈ [0, q) thì fn(t) ↑ q khi n → ∞
• Nếu t ∈ (q, 1) thì fn(t) ↓ q khi n → ∞
• Nếu t = q hoặc t = 1 thì fn(t) = t ∀n.Một ví dụ quan trọng:
Trường hợp hàm tuyến tính là một ví dụ mà chúng ta có thể tính toánđược hàm lặp fn(s)
và do đó (1.8) trở thành
f (s) − q
f (s) − 1 =
1m
s − q
Trang 11Định lý 1.4.2 Xác suất tuyệt chủng của quá trình {Zn} là nghiệm không
âm, nhỏ nhất q của phương trình
Trang 12số lượng con trung bình của một cá thể.
Quá trình G - W là một xích Markov, trạng thái của nó là số lượng cáthể hiện tại Chúng ta chia ra làm hai trạng thái “tạm thời” (transient) và
Trang 13Định nghĩa 1.4.4 Nếu m < 1, m = 1, m > 1 thì quá trình được gọitương ứng là dưới tới hạn (subcritical), tới hạn (critical) và siêu tới hạn(supercritical).
Trong phần này chúng ta sẽ nghiên cứu các định lý giới hạn của Zn Từ
đó cho thấy sự phân bố của quần thể trong tương lai Chúng ta bắt đầuvới việc trình bày cách dạng định lý giới hạn sẽ được nghiên cứu Từ tínhchất cộng tính đã được đề cập đến trong Mục 1.1, cụ thể cho Zn = i, quátrình ngẫu nhiên {Zn+k, k = 0, 1, 2, } là tổng của i bản sao độc lập củaquá trình {Z0 = 1, Z1, Z2, } Sử dụng tính chất Markov ta có:
Trang 14n→∞Wn = W(h.k.n)
Như vậy, trong trường hợp tới hạn và dưới tới hạn W = 0 vì q = 1 Do
đó, W chỉ có thể không suy biến khi m > 1 Điều này là đúng nếu ta bổsung giả thiết phương sai của số lượng con cháu là hữu hạn
Trang 15Trong trường hợp dưới tới hạn, có hai cách để nghiên cứu Zn với n lớn.
Rõ ràng nhất là giả sử quá trình là một trường hợp không suy biến bởiđiều kiện tuyệt chủng của quá trình Ta có
Ở phần sau chúng ta sẽ chỉ ra rằng hàm này hội tụ tới một hàm sinh, và
sẽ nghiên cứu tính chất của giới hạn
Trường hợp tới hạn đóng một vai trò quan trọng trong lý thuyết Trongtrường hợp này chúng ta sẽ thấy điều kiện để hàm sinh dần tới 0 khi
n → ∞, tức là điều kiện để chuỗi {Zn | Zn > 0} dần tới ∞ theo phân bố.Một ý tưởng như tỉ lệ phân kì được đưa ra bởi việc tính mômen:
Trang 16và do đó kì vọng có điều kiện là tăng tuyến tính Điều này dẫn đến nghiêncứu điều kiện của quá trình
Để chứng minh các định lí giới hạn ta cần một số kết quả của hàmchuyển Markov P (i, j)
1.5.1 Các định lý về tỉ lệ
Trong mục này chúng ta sẽ đưa ra các định lý về tỉ lệ của hàm chuyển
Và nó sẽ là công cụ hữu ích để chứng minh các định lí giới hạn trong phầntiếp theo
Trang 17Định lý 1.5.5 {πj, j = 1, 2, } luôn thỏa mãn phương trình
1.5.2 Trường hợp dưới tới hạn
Khi m < 1 thì xác suất tuyệt chủng là bằng 1 Để mô tả các giới hạntrong trường hợp này Kolmogorov (1938) và Yaglom (1947) đã đưa ranhững điều kiện của Zn để {Zn > 0} Kết quả chính của mục này là hệquả của định lí 1.5.14 Nó phát biểu rằng khi m < 1 thì phân bố của
{Zn | Zn > 0} hội tụ tới một phân bố chính xác
Đặt T là thời gian tuyệt chủng của quá trình G-W, tức là
= γB(s) + (1 − γ) (1.22)Chứng minh Giả sử m ≤ 1 thì P {T < ∞} = 1 và do đó
Bn(s) = E(sZn | n < T < ∞) = E(sZn | n < T )
Trang 19Do đó những lập luận trong trường hợp dưới giới hạn cho f (s) cũng đúngcho f∗(s) Thay f bởi f∗ vào (1.24) được (1.22)
Hệ quả 1.5.8 (Định lý Yaglom) Nếu m < 1 thì P {Zn = j | Zn > 0}
hội tụ khi n → ∞ tới một phân bố xác suất có hàm sinh B(s) thỏa mãnphương trình
B[f (s)] = mB(s) + (1 − m)
1.5.3 Trường hợp tới hạn
Khi m = 1 thì Zn → 0 với xác suất 1 Hay giới hạn xác suất bj củachuỗi phân bố có điều kiện {Zn | Zn > 0} là 0 và do đó quá trình nàyphân kì tới ∞ Chúng ta sẽ thấy rằng cần thêm điều kiện để quá trình hội
tụ tới một giới hạn không suy biến
Cách tiếp cận của chúng ta là dùng giải tích để nghiên cứu kĩ các giớihạn của fn(t) Chúng ta đã biết fn(t) ↑ 1, và bây giờ ta sẽ tìm hiểu về tỉ
lệ hội tụ Chúng ta bắt đầu bằng một bổ đề cơ bản quan trọng
Bổ đề 1.5.9 Nếu m = E(Z1) = 1 và σ2 = Var(Z1) < ∞ thì
lim
n→∞
1n
t→1
f0(t) − 12(t − 1) =
Trang 21bổ đề đặt t = 0 và chú ý rằng P {Zn > 0} = 1 − fn(0), chúng ta sẽ cóđược tỉ lệ hội tụ tới 0.
lim
n→∞Ehe−α(Znn ) | Zn > 0i= 1
1 + ασ22. (1.31)
Ta thấy vế phải của (1.31) là biến đổi Laplace của (1.30) Nhưng kì vọng
có điều kiện trong (1.31) là
σ22
Trang 22Phần này chúng ta sẽ nghiên cứu kĩ hơn trạng thái củaZn và phát triểncác tính chất giới hạn tốt hơn, sử dụng giả thiết yếu hơn phần đầu.
Chúng ta bắt đầu với chuỗi Wn = Zn
mn hội tụ hầu khắp nơi (h.k.n).Chúng ta đã biết rằng P {W = 0} = 1 khi m ≤ 1 Khi m > 1 thì σ2 < ∞
là điều kiện đủ để P {W = 0} < 1 Levinson (1959) đã đưa ra nhận xétđầu tiên rằng nếu σ2 = ∞ thì P {W = 0} có thể bằng 1 nhưng khôngmạnh như khi σ2 < ∞
Các điều kiện cần và đủ cho bởi định lý sau đây chỉ hơi mạnh hơn sựtồn tại của giá trị trung bình Đối với sự phân bố của W, nó hoàn toànliên tục trên tập số thực dương và có hàm mật độ dương, liên tục
Trong toàn bộ phần này ta sẽ luôn giả sử rằng Z0 = 1, m > 1 và
pj 6= 1 ∀j
Trang 23Định lý 1.5.14.
• Nếu EZ1log Z1 < ∞ thì EW = 1
• Nếu EZ1log Z1 = ∞ thì EW = 0 hoặc P {W = 0} = 1
Nhận xét 1.5.15 1 Định lý trên nói rằng nếu EZ1log Z1 = ∞ thì
P {lim Zn
mn = 0} = 1
Từ đó dẫn đến khả năng tồn tại chuỗi tiêu chuẩn khác {cn} sao cho
{Zn/cn} hội tụ tới một giới hạn không suy biến Tuy nhiên chúng ta vẫncần chứng minh rằngcn ∼ mn khi EZ1log Z1 < ∞ Ngoài ra phương phápchứng minh trực tiếp định lý trên cũng được áp dụng cho các quá trìnhtổng quát hơn ở Chương 3 Vì vậy chúng ta nghiên cứu định lý 1.5.15 độclập và sau đó sẽ tổng quát nó ở Định lý 1.5.16
Chú ý rằng Wn hội tụ h.k.n tới W
ϕn(u) ≡ Ee−uWn → Ee−uW ≡ ϕ(u), u ≥ 0
trong đó ϕ(u) được chỉ ra thỏa mãn phương trình cơ bản
ϕ(u) = f (ϕ(u
Đây là chìa khóa để chứng minh định lý 1.5.15[K.B.Athreya, P.E.Ney(1972)]
Định lý 1.5.16 Giả sử {Zn; n = 0, 1, 2, } là một quá trình GW với
1 < m < ∞ Thì luôn luôn tồn tại một chuỗi hằng số {cn} với cn → ∞
và c−1n cn+1 → m khi n → ∞, sao cho bnn Wn = c−1n Zn→W h.c.c với
thì Znm−n hội tụ theo quy luật tới một giới hạn không suy biến (định
Trang 24lý 1.5.16) Hơn nữa, chúng ta cũng thấy rằng EW < ∞ nếu và chỉ nếuP
pjj log j < ∞ Do đó chúng ta có: Ppjj log j < ∞ khi và chỉ khi
cn ∼ const · mn [ Seneta (1969)]
2 Phương trình hàm (1.32) thường khó có thể giải chính xác ϕ(z) vàthậm chí nếu có giải được thì cũng hiếm khi có thể đảo ngược ϕ(z) để cóđược hàm phân phối của W Tuy nhiên chúng ta có thể sử dụng (1.32) đểxác định tất cả các mômen của W có cấp ≥ 2 (khi chúng tồn tại)
3 Giả sử{Zn(m); n = 0, 1, 2, }, m = 2, 3, là một chuỗi của quá trìnhphân nhánh với chỉ số trung bình m và được định nghĩa trên không gian
xác suất như nhau Giả sử Z1(m)
σm
hội tụ tới một bnn Z khi m → ∞ trong
đó σm = VarZ1(m)/Z0 ≡ 1) Đặt W(m) là giới hạn h.c.c của Zn(m)/mn
σm
!2
+ 2E Z
(m) 1
Trong phần 1.5.4 chúng ta thấy rằng không có giới hạn nào của chuỗi
{Zn/mn; n = 0, 1, } là một mac-tin-gan không âm, hội tụ h.c.c tới mộtb.n.n W Do đó ta xấp xỉ Zn bởi mnW với n đủ lớn Điều này đặt ra câuhỏi về tầm quan trọng của hiệu Zn − mnW Trong phần này chúng ta sẽ
Trang 25xây dựng một biểu diễn đơn giản cho Zn− mnW và sử dụng nó để trả lờicâu hỏi này.
Không gian xác suất (Ω,F, P ) vẫn ký hiệu là không gian cơ bản củaquá trình phân nhánh {Zn, n = 0, 1, 2, } Giả sử P {Z0 = 1} = 1
Định lý 1.5.18 Giả sử p0 = 0 và P∞
j=1pj(j log j) < ∞ thì với mỗi n
tồn tại a tập An ∈ F với P {An} = 1 và biến ngẫu nhiên Wn(j)(w) với
j = 1, 2, , Zn(w) sao cho với mỗi w trong An:
Hệ quả 1.5.20 Giả sử p0 = 0 và P∞
j=1pj(j log j) < ∞ thì tồn tại a tập
A trong F sao cho P {A} = 1 và các bnn Wn(j)(w) với j = 1, 2, , Zn(w);
n = 0, 1, 2, sao cho với w ∈ A:
EW(j) = 1 và Var(1 − W(j)) = σ
2
m2 − m.
Trang 26
1.6 Quá trình Q
Phần này chúng ta sẽ nghiên cứu điều kiện của quá trình {Zn} khôngtuyệt chủng trong tương lai xa và tuyệt chủng trong tương lai xa hơn bằngcách xây dựng quá trình {Q} từ quá trình {Zn}
(i) Nếu m > 1 thì quá trình Q là lặp dương (positive recurrent)
(ii) Nếu m = 1 thì quá trình Q là tạm thời (transient)
(iii) Nếu m < 1thì quá trình Q là lặp dương nếu và chỉ nếu P
(k log k)pk <
∞.Cũng như trong quá trình G-W, trường hợp m = 1 đóng vai trò đặcbiệt trong quá trình Q Trong suốt trạng thái chuyển của nó, Zˆn → ∞ vớixác suất 1 Nhưng Zˆn/n sẽ hội tụ tới 1 quy luật giới hạn không suy biến.
Định lý 1.6.4 Nếu m = 1 và σ2 < ∞ thì (2σ2) ˆZn/n hội tụ theo phân
Trang 27Bổ đề 1.6.5 Nếu Fn phân bố trên [0, ∞) với kỳ vọng µn, hội tụ yếu tớimột phân bố F với kỳ vọng µ > 0 và µn → µ thì
Ta muốn nvà n + k có độ lớn tương ứng Để thuận lợi quá trình được viếtlại {Z[nt] | Zn > 0} trong đó 0 ≤ t ≤ 1 Để cho đơn giản ta bỏ dấu ngoặcvuông nhưg nt vẫn phải luôn hiểu là [nt]
Định lý 1.6.6 Nếu m = 1 và f00(1) < ∞ thì với mỗi t < 1 cố định
{Znt/n | Zn > 0} hội tụ theo phân bố tới một biến ngẫu nhiên U + V khi
n → ∞ Trong đó U và V là các bnn độc lập có hàm mật độ mũ với tham
| Zn > 0, Z0 = 1
Trang 29
Tài liệu tham khảo
[1] Athreya, K B and P.E Ney, P.E (1972), Branching Processes,Springer, Berlin
[2] Doob, J.L (1953), stochastic processes, Wiley, Newyork [3] Haccou, P Jagers, V.A (2005), Branching Processes: Variation,Growth and Extinction of Populations, Cambridge University Press,Cambridge
[4] Harris, T.E (1963), The Theory of Branching Processes, Springer,Berlin
[5] Kesten, H., Ney,P , Spitzer, F (1966), "The Galton - Watson processwith mean one and finite varience", TPA11
[6] Kimmel, M and Axelrod, D.E (1990), "Mathematical models of geneamplification with applications to cellular drug resistance and tumori-genicity", Genetics 125
[7] Kimmel, M and Axelrod, D.E (2002), Branching Processes in ogy, Springer, New York
Biol-[8] Levinson, N (1959), "Limiting theorems for Galton - Watson ing processes, IJM 4
branch-[9] Mode, C.J (1971), Multitype Branching Processes, Elsevier, NewYork
[10] Seneta, E (1969), "Functional equations and the Galton - Watsonprocess", Adv
Trang 30[11] Saiki, R K , Gelfand, D.H.,toffel, S.S, Scharf, S.J.,Higuchi, R.,Horn,G.T , Mullis, K.B and Erlich , H.A (1988), "Primer-directedenzymatic amplification of DNA with a thermostable DNA poly-merase", Science 239.
[12] Weiss, G and Haeseler , A (1997), "A coalescent approach to thepolymerase chain reaction", Nucleic Acids Research 25