ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KHOA HỌC ——————–o0o——————– LÊ THỊ THÚY NGÀ BÀI TOÁN ĐUỔI BẮT TRONG TRÒ CHƠI TUYẾN TÍNH VỚI HẠN CHẾ HÌNH HỌC TRÊN THANG THỜI GIAN THÁI NGUYÊN, THÁNG 11 NĂM 2017 ĐẠI H[.]
Trang 1ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KHOA HỌC
——————–o0o——————–
LÊ THỊ THÚY NGÀ
BÀI TOÁN ĐUỔI BẮT TRONG TRÒ CHƠI TUYẾN TÍNH VỚI HẠN CHẾ HÌNH HỌC
TRÊN THANG THỜI GIAN
THÁI NGUYÊN, THÁNG 11 NĂM 2017
Trang 2ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KHOA HỌC
——————–o0o——————–
LÊ THỊ THÚY NGÀ
BÀI TOÁN ĐUỔI BẮT TRONG TRÒ CHƠI TUYẾN TÍNH VỚI HẠN CHẾ HÌNH HỌC
TRÊN THANG THỜI GIAN
Chuyên ngành: TOÁN ỨNG DỤNG
Mã số: 60 46 01 12
LUẬN VĂN THẠC SĨ TOÁN HỌC
GIÁO VIÊN HƯỚNG DẪN PGS.TS TẠ DUY PHƯỢNG
THÁI NGUYÊN, THÁNG 11 NĂM 2017
Trang 3Mục lục
1.1 Giải tích trên thang thời gian 6
1.1.1 Định nghĩa thang thời gian và những khái niệm cơ bản 6 1.1.2 Tôpô trên thang thời gian 12
1.1.3 Đạo hàm trên thang thời gian 12
1.1.4 Phép tính tích phân trên thang thời gian 18
1.1.5 Tính hồi quy trên thang thời gian 22
1.2 Hệ động lực trên thang thời gian 24
1.2.1 Phương trình động lực tuyến tính bậc nhất 24
1.2.2 Công thức nghiệm của phương trình và hệ phương trình động lực tuyến tính bậc nhất 25
2 Trò chơi đuổi bắt tuyến tính với hạn chế hình học trên thang thời gian 27 2.1 Trò chơi đuổi bắt tuyến tính với hạn chế hình học trên thang thời gian 27
2.2 Trò chơi đuổi bắt tuyến tính với hạn chế hình học và thông tin chậm trên thang thời gian 31
2.3 Trò chơi đuổi bắt tuyến tính với hạn chế hỗn hợp trên thang thời gian 35
2.3.1 Trò chơi đuổi bắt tuyến tính với hạn chế hỗn hợp trên thang thời gian 35
2.3.2 Trò chơi đuổi bắt tuyến tính rời rạc với hạn chế hỗn hợp 37
1
Trang 42.3.3 Trò chơi đuổi bắt tuyến tính liên tục với hạn chế hỗn
hợp 38 2.4 Trò chơi đuổi bắt tuyến tính với thông tin chậm và hạn chế
hỗn hợp trên thang thời gian 39
Trang 5Mở đầu
Phương trình sai phân là một mô hình của nhiều bài toán thực tế Đồng thời có thể coi phương trình sai phân là sự rời rạc hóa của phương trình vi phân và là mô hình xấp xỉ của phương trình sai phân Lý thuyết phương trình vi phân và phương trình sai phân phát triển song song Khá nhiều kết quả của phương trình vi phân (tính ổn định, tính điều khiển được, bài toán trò chơi, ) được phát biểu lại một cách tương tự cho phương trình sai phân Vậy một câu hỏi tự nhiên đặt ra là: Liệu có thể hợp nhất hai mô hình phương trình sai phân và phương trình vi phân trong một mô hình thống nhất được không?
Năm 1988, trong luận án Tiến sĩ của mình (dưới sự hướng dẫn của Bernd Aulbach), nhằm mục đích thống nhất nghiên cứu các hệ động lực liên tục (hệ phương trình vi phân) và hệ động lực rời rạc (hệ phương trình sai phân), Stefan Hilger đã đưa ra khái niệm thang thời gian Từ đó tới nay, đã có một số quyển sách, hàng chục luận án Tiến sĩ và hàng nghìn bài báo nghiên cứu về giải tích (phép toán vi phân và tích phân) và hệ động lực trên thang thời gian
Thang thời gian có ý nghĩa triết học sâu sắc: Thang thời gian cho phép nghiên cứu hai mặt bản chất của thực tế, đó là tính liên tục và tính rời rạc Trong toán học, thang thời gian cho phép thống nhất nhiều mô hình khác nhau dưới cùng một khái niệm và công cụ
Giải tích trên thang thời gian và hệ động lực trên thang thời gian đang được nhiều nhóm các nhà toán học trong nước (GS Nguyễn Hữu Dư và các học trò, xem thí dụ [1]) và ngoài nước (Đức, Mỹ, Nga, Trung Quốc, ) quan tâm nghiên cứu Đã có một số bài viết ứng dụng thang thời gian trong nghiên cứu kinh tế vĩ mô, trong mô tả hệ sinh thái, bài toán tối ưu
Lý thuyết trò chơi ra đời từ những năm 1950-1960 với những công trình
3
Trang 6nền móng của các nhà toán học Isaacs R., Pontriagin L S, Kraxopxkii N
E Sau đó lý thuyết trò chơi đã phát triển mạnh mẽ, rất nhiều các nhà toán học trên thế giới nghiên cứu vấn đề này Lý thuyết trò chơi có nguồn gốc từ các bài toán thực tế: Khảo sát hệ động lực có nhiều đối tượng điều khiển, trong đó mỗi đối tượng có một mục đích riêng, thậm chí trái ngược nhau; nghiên cứu các đối tượng điều khiển khi không có đầy đủ thông tin
về trạng thái pha của nó; đưa một đối tượng điều khiển chịu những tác động bởi ngẫu nhiên không biết trước về một trạng thái cho trước; bài toán đuổi bắt một đối tượng này bởi một đối tượng khác,
Bài toán đuổi bắt là một trong các bài toán cơ bản của lý thuyết trò chơi Bài toán này có thể phát biểu như sau: cho hai đối tượng (người đuổi
và người chạy) mà chuyển động của chúng được mô tả bởi các hệ phương trình vi phân có tham gia biến điều khiển Mục tiêu của người đuổi là làm sao để tiến gần đến người chạy càng nhanh càng tốt Mục đích của người chạy là làm thế nào để tránh được người đuổi càng lâu càng tốt, càng xa càng tốt Vì vậy có thể nói mục đích của người đuổi là làm cực tiểu một hàm nào đó, còn của người chạy là làm cực đại hàm ấy Để giải quyết vấn
đề này người ta thường tập trung vào tìm điều kiện đủ hoặc điều kiện cần
đề kết thúc trò chơi
Luận văn "BÀI TOÁN ĐUỔI BẮT TRONG TRÒ CHƠI TUYẾN TÍNH VỚI HẠN CHẾ HÌNH HỌC TRÊN THANG THỜI GIAN" nghiên cứu về trò chơi tuyến tính trên thang thời gian Luận văn gồm phần Mở đầu, 2 chương, phần Kết luận và các Tài liệu tham khảo
Chương 1 Nhắc lại khái niệm thang thời gian, các khái niệm về toán
tử nhảy tiến, toán tử nhảy lùi, hàm hạt, các điểm trù mật và các điểm cô lập; các khái niệm và tính chất của các phép tính vi phân, tích phân trên thang thời gian cũng như đối chiếu kết quả trên một số thang thời gian thường gặp Tiếp đó đưa ra công thức nghiệm của hệ động lực tuyến tính trên thang thời gian
Chương 2 Trình bày khái niệm trò chơi đuổi bắt tuyến tính trên thang thời gian với hạn chế hình học và điều kiện kết thúc trò chơi; chứng minh điều kiện đủ kết thúc trò chơi đuổi bắt tuyến tính trên thang thời gian với hạn chế hình học hoặc hạn chế hỗn hợp với thông tin chậm Các định lí trong chương này là kết quả chung của ba tác giả Vi Diệu Minh, Lê Thị
Trang 7Thúy Ngà và Lê Văn Quý được hoàn thành dưới sự hướng dẫn của PGS
TS Tạ Duy Phượng
Tác giả xin được gửi lời cảm ơn sâu sắc tới PGS TS Tạ Duy Phượng, người thầy đã dành thời gian hướng dẫn, tận tình chỉ bảo, tạo điều kiện
và giúp đỡ trong trang bị kiến thức, trong nghiên cứu và tổng hợp tài liệu
để hoàn thành luận văn
Tác giả cũng xin gửi lời cảm ơn chân thành tới các thày, cô trong Ban giám hiệu, Phòng Sau đại học, Phòng Đào tạo, Khoa Toán-Tin trường Đại học Khoa học, Đại học Thái Nguyên đã tạo điều kiện thuận lợi về mọi mặt trong suốt quá trình học tập tại trường và trong qua trình làm luận văn Xin được cảm ơn Ban giám hiệu, Ban chuyên môn cùng các đồng nghiệp trong Trường trung học phổ thông Hưng Yên, tỉnh Hưng Yên, nơi tôi công tác, đã tạo mọi điều kiện để tôi hoàn thành nhiệm vụ học tập
Xin chân thành cảm ơn Thạc sĩ Vi Diệu Minh, giảng viên môn Toán, trường Đại học Nông Lâm, Đại học Thái Nguyên đã cùng cộng tác và giúp
đỡ tôi về chuyên môn trong suốt quá trình làm luận văn
Cuối cùng tác giả xin gửi lời cảm ơn đặc biệt đến những người thân, gia đình, đồng nghiệp và những người bạn đã tạo mọi điều kiện thuận lợi, động viên, giúp đỡ tôi trong suốt quá trình học tập và hoàn thiện luận văn
Thái Nguyên, ngày 10 tháng 11 năm 2017
Tác giả luận văn
Lê Thị Thúy Ngà
Trang 8Chương 1
Thang thời gian
Trong chương này, chúng tôi trình bày một số vấn đề về giải tích trên thang thời gian và hệ động lực trên thang thời gian có liên quan đến nội dung nghiên cứu của đề tài Các kiến thức trong chương được tham khảo trong các tài liệu [1], [4], [5], [7], [8], [9]
1.1 Giải tích trên thang thời gian
1.1.1 Định nghĩa thang thời gian và những khái niệm cơ bản Định nghĩa 1.1 Thang thời gian (time scale) là tập con đóng tùy ý khác rỗng trong tập số thực R Thang thời gian thường được ký hiệu là T
Ví dụ 1.1
1) Các tập hợp R, Z là thang thời gian vì chúng là các tập đóng trong R 2) Các tập hợp
T1 =
∞
[
k=0,k∈N
[2k, 2k + 1] ; Pa,b =
∞
[
k=0,k∈N
[k (a + b) , k (a + b) + a]
(với a, b là các số thực dương) là thang thời gian vì chúng là các tập đóng trong R
3) Các khoảng mở trong R không là tập đóng trong R nên chúng không phải là thang thời gian
4) Các tập Q, R\Q; [0, 1) không phải là thang thời gian vì chúng không phải là tập đóng trong R
6
Trang 9Thật vậy, tập Q không phải là tập đóng trên R vì trên Q dãy 1, 7; 1, 73; 1, 732;
có giới hạn là √
3 không thuộc Q Tập R\Q không là tập đóng trên R vì dãy số √
2;
√ 2 2
√ 2
3 ;
√ 2
4 trên R\Q nhưng có giới hạn là 0 không thuộc R\Q Tập [0, 1) không là tập đóng vì có dãy 1
2;
2
3;
3
4;
4
5; trên [0, 1) nhưng có giới hạn là 1 không thuộc [0, 1)
5) Cho số cố định h ∈ R, h > 0 T được xác định như sau
T = hZ = {hn, n ∈ Z} = { , −3h, −2h, −h, 0, h, 2h, 3h }
T là thang thời gian vì nó là tập đóng trong trong R
6) Cho số cố định q ∈ R, q > 1 T được xác định như sau
T = qZ = {qn, n ∈ Z} = , q−3, q−2, q−1, 1, q, q2, q3,
T không là thang thời gian Thật vậy, xét dãy số un = 1q
n
trong T có giới hạn bằng 0 không thuộc T nên T không là tập đóng
7) Cho số cố định q ∈ R, q > 1 T được xác định như sau
T = qZ∪ {0} = {qn, n ∈ Z} ∪ {0} = , q−3, q−2, q−1, 1, q, q2, q3, ∪ {0}
T là thang thời gian vì T là tập đóng
8) Tập số phức C không phải thang thời gian vì C không phải là tập con của R mặc dù C là tập đóng
Định nghĩa 1.2 Cho T là thang thời gian
Toán tử nhảy tiến (forward jump) là toán tử
σ : T → T được xác định bởi công thức
σ(t) := inf{s ∈ T, s > t}
Toán tử nhảy lùi (backward jump) là toán tử
ρ : T → T được xác định bởi công thức
ρ(t) := sup{s ∈ T, s < t}
Trang 10Quy ước
inf ∅ = sup T; sup ∅ = inf T
Nhận xét
Nếu T có giá trị lớn nhất là M thì σ(M ) = M
Nếu T có giá trị nhỏ nhất là m thì ρ(m) = m
Định nghĩa 1.3 Cho T là thang thời gian
Điểm t ∈ T được gọi là điểm cô lập phải (right-scattered) nếu σ(t) > t; Điểm t ∈ T được gọi là điểm cô lập trái (left-scattered) nếu ρ(t) < t; Điểm t ∈ T được gọi là điểm cô lập (insolated) nếu ρ(t) < t < σ(t) Định nghĩa 1.4 Cho T là thang thời gian
Điểm t ∈ T được gọi là điểm trù mật phải (right-dence) nếu σ(t) = t; Điểm t ∈ T được gọi là điểm trù mật trái (left-dence) nếu ρ(t) = t; Điểm t ∈ T được gọi là điểm trù mật (dence) nếu ρ(t) = t = σ(t) Định nghĩa 1.5 Cho thang thời gian T Hàm hạt (grainiess) là toán tử
µ : T → [0; ∞) được xác định bởi công thức
µ(t) := σ(t) − t
Ví dụ 1.2
1) Khi T = Z (thang thời gian rời rạc) thì
σ(t) = t + 1; ρ(t) = t − 1; µ (t) = 1, với mọi t thuộc Z
Do t − 1 < t < t + 1, với mọi t thuộc Z nên mọi điểm trong Z đều là điểm
cô lập
2) Khi T = R (thang thời gian liên tục) thì
σ(t) = t; ρ(t) = t; µ (t) = 0, với mọi t thuộc R
Do σ(t) = ρ(t) = t, với mọi t thuộc R nên mọi điểm trong R đều là điểm
Trang 11trù mật
3) Cho thang thời gian T1
T1 =
∞
[
k=0,k∈N
[2k, 2k + 1]
Nếu t ∈ (2k; 2k + 1) thì
σ(t) = t; ρ(t) = t; µ (t) = 0
Vậy mọi t ∈ (2k; 2k + 1) đều là điểm trù mật
Nếu t = 2k thì
σ(t) = 2k = t; ρ(t) = 2k − 1; µ (t) = 0
Dẫn đến σ(t) = t, ρ(t) < t nên t = 2k là điểm trù mật phải, đồng thời là điểm cô lập trái
Nếu t = 2k + 1 thì
σ(t) = 2k + 2 = t + 1; ρ(t) = 2k + 1 = t; µ (t) = 1
Dẫn đến σ(t) > t, ρ(t) = t nên t = 2k + 1 là điểm trù mật trái, đồng thời
là điểm cô lập phải
4) Cho a, b là các số thực dương Xét thang thời gian
Pa,b =
∞
[
k=0,k∈N
[k (a + b) , k (a + b) + a]
Nếu t ∈ (k(a + b); k(a + b) + a) thì
σ(t) = t; ρ(t) = t; µ (t) = 0
Mọi t ∈ (k(a + b); k(a + b) + a) đều là điểm trù mật
Nếu t = k(a + b) thì
σ(t) = t; ρ(t) = t − b; µ (t) = 0
Dẫn đến σ(t) = t, ρ(t) < t nên t = k(a + b) là điểm trù mật phải, đồng thời là điểm cô lập trái
Trang 12Nếu t = k(a + b) + a thì
σ(t) = t + b; ρ(t) = t; µ (t) = b
Dẫn đến σ(t) > t, ρ(t) = t nên t = k(a + b) + a là điểm trù mật trái, đồng thời là điểm cô lập phải
5) Cho số cố định h ∈ R, h > 0 Thang thời gian T được xác định như sau
T = hZ = {hn, n ∈ Z} = { , −3h, −2h, −h, 0, h, 2h, 3h }
Ta có
σ(t) = t + h; ρ(t) = t − h; µ (t) = h, nên ρ(t) < t < σ(t) với mọi t thuộc T Vậy mọi t thuộc T đều là điểm cô lập
6) Cho số cố định q ∈ R, q > 1 Thang thời gian T được xác định như sau
T = qZ∪ {0} = {qn, n ∈ Z} ∪ {0} = , q−3, q−2, q−1, 1, q, q2, q3, ∪ {0} Với t khác 0, ta có
σ(t) = t.q; ρ(t) = t
q; µ (t) = t(q − 1).
Suy ra ρ(t) < t < σ(t) với mọi t thuộc T Vậy mọi t thuộc T đều là điểm
cô lập
Với t = 0 ta có
σ(0) = 0; ρ(0) = 0; µ (0) = 0
Do vậy t = 0 là điểm trù mật
Định nghĩa 1.6 Cho T là thang thời gian và hàm f := T → R Ta ký hiệu hàm
fσ : T → R xác định theo công thức fσ(t) := f (σ(t))
Trang 13Chú ý rằng T là tập đóng nên σ(t) := inf{s ∈ T, s > t} thuộc T
Khi T là thang thời gian liên tục thì σ(t) := t nên fσ(t) = f (t), với mọi t thuộc T
Khi T là thang thời gian rời rạc thì σ(t) := t + 1 nên fσ(t) = f (t + 1), với mọi t thuộc T
Định nghĩa 1.7 Cho thang thời gian T Tập Tk được xác định như sau: Nếu T có phần tử lớn nhất M là điểm cô lập trái thì đặt Tk := T\{M } và
Tk := T trong trường hợp còn lại
Trang 141.1.2 Tôpô trên thang thời gian
Giả sử (X, τ ) là một không gian tôpô, M ⊂ X là một tập con nào đó
Kí hiệu τM là họ tất cả các tập có dạng UM = M ∩ U trong đó U ⊂ τ Khi ấy τM = {UM : UM = M ∩ U, U ⊂ τ } là một tôpô trên M Thật vậy, ta có
1) Vì ∅ và X đều thuộc τ nên dễ dàng suy ra ∅ và M đều thuộc τM 2) Giả sử V1, V2 ∈ τM là hai tập hợp bất kì, tức là tồn tại U1, U2 ∈ τ sao cho V1 = M ∩ U1 và V2 = M ∩ U2 Ta có
V1 ∩ V2 = (M ∩ U1) ∩ (M ∩ U2) = M ∩ (U1 ∩ U2)
Vì U1∩ U2 ∈ τ nên suy ra V1 ∩ V2 ∈ τM (theo định nghĩa tập τM)
3) Giả sử {Vα}α∈I là một họ bất kì các tập thuộc τM Khi đó ta có S
α∈I
Vα = S
α∈I
(M ∩ Uα) = M ∩ S
α∈I
Uα với Uα ∈ τ, ∀α ∈ I Vì S
α∈I
Uα ∈ τ nên suy ra S
α∈I
Vα ∈ τM
Từ 1), 2), 3) suy ra τM là một tôpô và ta gọi τM là tôpô cảm sinh từ
τ trên M Cặp (M, τM) được gọi là không gian tôpô cảm sinh từ không gian tôpô (X, τ )
Trong luận văn này ta luôn giả thiết rằng thang thời gian T được trang bị một tôpô cảm sinh từ tôpô thông thường của tập số thực (là tôpô tạo bởi các khoảng mở cùng với giao hữu hạn và hợp bất kì của chúng), nghĩa là các tập mở của T là giao của các tập mở trong R với T Các khái niệm lân cận, giới hạn, liên tục, được hiểu là lân cận, giới hạn, liên tục, trong tôpô cảm sinh
1.1.3 Đạo hàm trên thang thời gian
Định nghĩa 1.8 Giả sử f : T → R và t ∈ Tk ∆− đạo hàm (đạo hàm Hilger) của f tại t ∈ Tk là một số (nếu tồn tại) kí hiệu là f∆(t) nếu với mỗi ε > 0 cho trước, tồn tại một lân cận ∪T(t, δ) của t (nghĩa là:
∪T(t, δ) = (t − δ; t + δ) ∩ T với δ > 0 nào đó) sao cho
|[f (σ(t)) − f (s)] − f∆(t)[σ(t) − s]| ≤ ε|σ(t) − s|,
Trang 15với mọi s thuộc ∪T(t, δ)
Dưới đây ta cũng dùng kí hiệu a ≥ b và được hiểu là a, b ∈ T và a ≥ b Định nghĩa 1.9 Hàm f được gọi là ∆− khả vi (ngắn gọn là khả vi ) trên
Tk nếu có đạo hàm tại mọi điểm t ∈ Tk
Nhận xét 1.1
1) Xét thang thời gian liên tục T = R Ta có, với mỗi ε > 0, tồn tại δ > 0 sao cho
[f (σ(t)) − f (s)] − f∆(t).(σ(t) − s)| ≤ ε|(σ(t) − s)|, đúng với mọi s thuộc ∪T(t, δ) = (t − δ; t + δ) ∩ R
Vì σ(t) = t với mọi t thuộc R nên ta được
f (t) − f (s)
t − s − f∆(t)
≤ ε
Suy ra f∆(t) = lim
s→t
f (t) − f (s)
t − s = f
0
(t)
Vậy đạo hàm Hilger chính là đạo hàm thông thường khi T = R
2) Xét thang thời gian rời rạc T = Z Ta có σ(t) = t + 1 với mọi t thuộc Z Với mọi ε > 0, tồn tại một lân cận của t là
∪T(t, δ) = (t − δ; t + δ) ∩ Z = {t}
Do đó ta có
[f (σ(t)) − f (s)] − f∆(t).(σ(t) − s)| ≤ ε|(σ(t) − s)|, đúng với mọi s ∈ ∪T(t, δ) Từ đó ta được
|[f (t + 1) − f (t)] − f∆(t).(t + 1 − t)| ≤ ε.|t + 1 − t|
⇔ [f (t + 1) − f (t)] − f∆(t)| ≤ ε
Do bất đẳng thức trên đúng với mọi ε nên
f∆(t) = f (t + 1) − f (t)
Vậy f∆(t) chính là sai phân tiến của f tại t: f∆(t) = ∆f = f (t + 1) − f (t) hay đạo hàm Hilger chính là sai phân tiến khi T = Z
Kết luận
...Vậy đạo hàm Hilger đạo hàm thơng thường T = R
2) Xét thang thời gian rời rạc T = Z Ta có σ(t) = t + với t thuộc Z Với ε > 0, tồn lân cận t
∪T(t, δ) = (t − δ;... s)|, với s ∈ ∪T(t, δ) Từ ta
|[f (t + 1) − f (t)] − f∆(t).(t + − t)| ≤ ε.|t + − t|
⇔ [f (t + 1) − f (t)] − f∆(t)| ≤ ε
Do bất đẳng thức với. .. t: f∆(t) = ∆f = f (t + 1) − f (t) hay đạo hàm Hilger sai phân tiến T = Z
Kết luận