Tối ưu hóa cơ hội truyền tải cho mạng vô tuyến sử dụng lý thuyết trò chơi Tối ưu hóa cơ hội truyền tải cho mạng vô tuyến sử dụng lý thuyết trò chơi Tối ưu hóa cơ hội truyền tải cho mạng vô tuyến sử dụng lý thuyết trò chơi
TỔNG QUAN
Đặt vấn đề
Sự bùng nổ của công nghệ đã dẫn đến sự phát triển đáng kinh ngạc của các thiết bị điện tử Hơn nữa, chi phí phần cứng đã được giảm dần Kết quả là số lượng ngày càng tăng của các thiết bị đã được trang bị phần cứng giao tiếp vô tuyến và một số lượng lớn các thiết bị di động có mặt ở khắp nơi trong đời sống của chúng ta Hầu hết các thiết bị như điện thoại di động, máy tính xách tay của chúng ta truy cập internet thông qua mạng WLAN, các viễn cảnh tương lai cho chúng ta thấy sự đa dạng các ứng dụng cho thông tin vô tuyến Nhiều ứng dụng như vậy dựa vào các nút cảm biến, là các thiết bị vô tuyến có khả năng nhận biết các hiện tượng vật lý Các ứng dụng dự kiến bao gồm một loạt các lĩnh vực, chẳng hạn như chăm sóc sức khỏe, vận tải, hậu cần
Tuy nhiên, hiệu suất của mạng vô tuyến phụ thuộc vào sự tương tác hiệu quả của một số thành phần Chúng ta cần xác định được những đặc tính của các thiết bị vô tuyến, là nguồn gốc của hầu hết các vấn đề trong mạng Trong đó có ba vấn đề chính sau đây: nhiễu, giới hạn năng lượng và tính ích kỷ của các thành phần tham gia mạng [1] Hiệu quả dò tìm thiết bị là một vấn đề cơ bản trong các mạng vô tuyến Trước khi một nút thực hiện bất kỳ tác vụ cụ thể nào, nút phải tìm kiếm vùng lân cận của nó các đối tác truyền thông tiềm năng và các nguồn tài nguyên Mặc dù các giao thức hiện có khá nhanh trong các điều kiện bình thường nhưng thời gian trễ khi hai thiết bị gặp nhau bị ảnh hưởng bởi nhiễu Bởi vì các tín hiệu được truyền bởi sóng vô tuyến, nhiễu có chủ ý và ngẫu nhiên có ảnh hưởng cực kỳ bất lợi trên mạng vô tuyến Nhiễu ngẫu nhiên xảy ra thường xuyên, do tính chất chia sẽ chung dải tần số trong các mạng Bên cạnh đó các thiết bị vô tuyến thường có nguồn cung cấp năng lượng hạn chế vì chúng được cung cấp năng lượng từ pin hoặc pin mặt trời Do đó, đòi hỏi
Trang 2 các thuật toán hiệu quả về năng lượng Mức tiêu thụ năng lượng của hệ thống truyền dữ liệu thường lớn hơn năng lượng được sử dụng để xử lý dữ liệu Vì thế, cách đơn giản nhất để tiết kiệm năng lượng là giảm số lần truyền dữ liệu hơn là chi phí cho xử lý dữ liệu Ngoài ra, nếu người dùng quá tăng cường quyền kiểm soát thiết bị của mình thì người dùng có thể gây ra điều chỉnh để tối đa hóa lợi ích của họ Hành vi ích kỷ này có thể làm giảm đáng kể hiệu suất của mạng hoặc thậm chí làm tê liệt mạng hoàn toàn Vấn đề tối ưu cơ hội truyền tải cho mạng vô tuyến để giảm số lần truyền dẫn không thành công dựa trên lý thuyết trò chơi cần được nghiên cứu
Với phân tích tổng quan trên, người thực hiện lựa chọn tên đề tài “Tối ưu cơ hội truyền tải trong mạng vô tuyến sử dụng lý thuyết trò chơi”
Tình hình nghiên cứu
Trong những năm gần đây, lý thuyết trò chơi đã trở thành một công cụ thiết yếu, hiệu quả để phân tích và thiết kế mạng vô tuyến Giao thức đa truy cập cảm nhận sóng mang (CSMA) dựa trên lý thuyết trò chơi [2] của mạng vô tuyến gần đây đã nổi lên như là một giải pháp thay thế CSMA cổ điển dựa trên giao thức MAC Ưu điểm của phương pháp dựa trên lý thuyết trò chơi nằm trong phạm vi phân tích toán học chính xác và do đó có thể dự đoán hiệu suất so với các phương pháp tiếp cận dựa trên các tham số và suy nghiệm mạng ad-hoc Trong bài báo này, các tác giả [2] đưa ra một thiết kế dựa trên lý thuyết trò chơi của mạng vô tuyến trên cơ sở giao thức MAC và thực hiện mạng vô tuyến trong nhà với 22 nút lập trình được dựa trên chuẩn IEEE 802.11 Các phép đo của tác giả cho thấy hiệu suất tốt của thiết kế (ở cân bằng Nash duy nhất) về tổng thông lượng và độ cân bằng ngắn hạn so với thuật toán DCF chuẩn Các tác giả [3] đề xuất một phương pháp tiếp cận mới dựa trên lý thuyết trò chơi để thay đổi tốc độ, điều chế và công suất trong thuật toán trò chơi Tất cả người dùng đều hài lòng với việc kết hợp các quy tắc trò chơi Tính ích kỷ của người sử dụng độc lập bị hạn chế trong khuôn khổ này Tính ích kỷ trò chơi đạt đến điểm mong muốn được gọi là điểm cân bằng Nash Thông qua các kết quả khác nhau, tác giả thấy rằng tất cả người dùng đều có một sự cân bằng giữa tối đa hóa lợi ích và tối thiểu năng
Trang 3 lượng truyền, giữa tốc độ và kiểu điều chế trong chiến lược của họ Trong các mạng vô tuyến đa chặng (multi-hop) [4], các nút bị hạn chế năng lượng và nguồn tài nguyên có thể gây ra hiện tượng không sẵn sàng chuyển tiếp gói tin cho các nút lân cận để tiết kiệm nguồn năng lượng Trạng thái này của các nút có thể làm giảm thông lượng mạng và có thể làm giảm hiệu suất mạng Trong các thiết kế thuật toán lý thuyết trò chơi cho việc chuyển tiếp lặp lại gói tin, hầu hết các công trình trước đây đã bỏ qua các yếu tố nhiễu của môi trường vô tuyến đối với hoạt động của các nút Thuật toán của các tác giả được so sánh với các thuật toán lý thuyết trò chơi nổi tiếng khác và kết quả mô phỏng được thực hiện để chứng minh sự tối ưu của thuật toán ngay cả dưới môi trường nhiễu
Tác giả Y.Cho và các cộng sự [5] đã trình bày một cách tiếp cận lý thuyết trò chơi để thiết kế giao thức kiểm soát truy cập ngẫu nhiên cho mạng vô tuyến với kênh truyền fading Cụ thể, cơ hội truyền tải trong ALOHA phân khe và CSMA theo các trạng thái thông tin kênh là mô hình như các trò chơi Bayesian trong đó mỗi ngưỡng truyền là cân bằng Bayesian Nash của trò chơi Các tác giả [6] đã xây dựng một trò chơi truy cập kênh truyền cho chiến lược truyền dẫn với nhận biết nhiễu giữa các cụm theo phương pháp phân tán và chứng minh sự tồn tại của cân bằng Bayesian Nash Các tác giả [7] đã xây dựng bài toán tìm kiếm một cơ chế truyền cho mỗi nút trong mạng ALOHA phân khe để ánh xạ trạng thái thông tin kênh truyền đến xác suất truyền tải để tối đa hoá tiện ích riêng của nút như là một trò chơi bất hợp tác Điều kiện cho sự tồn tại của chính sách truyền tải cân bằng Nash đã được đưa ra và một thuật toán dựa trên gradient ngẫu nhiên đã được sử dụng để xử lý các quá trình đáp ứng động tốt nhất cho các trò chơi truyền tải Mô hình lý thuyết trò chơi [8] khai thác thông tin trạng thái kênh truyền tại mỗi nút để đưa ra quyết định truyền tải gói tin trong mạng ALOHA phân khe trong môi trường fading Trong mô hình này, mỗi nút đưa ra một ngưỡng kênh và chỉ gửi gói tin khi độ lợi kênh là cao hơn ngưỡng để tối đa hóa hiệu năng mạng
Bên cạnh các phương pháp tiếp cận liên quan đến chiến lược truyền ở trên, một số cách tiếp cận khác ( [9], [10], [11], [12], [13]) áp dụng trò chơi lý thuyết để
Trang 4 nghiên cứu kiểm soát tranh chấp cho mạng vô tuyến Các tác giả [9] đã trình bày tổng quan mô hình lý thuyết trò chơi để nghiên cứu sự tương tác giữa các nút cho các kênh vô tuyến phổ biến Ngoài ra, các tác giả đã nghiên cứu sự cân bằng Nash của trò chơi này và thiết kế một phương pháp để đạt được nó theo phương pháp phân phối Việc mở rộng bài toán này đã được thảo luận [10] Trong bài báo này, các tác giả đã khái quát hóa kiểm soát truy cập trò chơi cho trường hợp mỗi nút có thể quan sát nhiều tín hiệu tranh chấp để hướng dẫn chúng cân bằng Nash và đưa ra các điều kiện cho sự tồn tại duy nhất của sự cân bằng này Một khái niệm mới của lý thuyết trò chơi ( [11],
[12], [13]) không hoàn toàn hợp tác đã được đề xuất để cải thiện hiệu suất của CSMA/CA trong mạng di động ad-hoc Trong mô hình trò chơi này, mỗi nút ước lượng trạng thái trò chơi và thay đổi trạng thái cân bằng bằng cách thay đổi các tham số tranh chấp để đạt được hiệu suất tối ưu Các mở rộng này đã được trình bày trong
[13] Trong bài báo này, các tác giả đã trình bày một phương pháp ước lượng điều kiện xác suất va chạm dựa trên kỹ thuật ảo hóa - CSMA và đề xuất một giao thức lý thuyết trò chơi MAC đơn giản mà có thể được thực hiện trong các mạng vô tuyến Một kỹ thuật đảo ngược của giao thức truy cập ngẫu nhiên MAC dựa trên backoff sử dụng cách tiếp cận lý thuyết trò chơi đã được trình bày trong [14] Như trình bày trong bài báo, giao thức backoff hàm mũ là kỹ thuật đảo ngược thông qua một trò chơi không hợp tác trong đó mỗi liên kết cố gắng tối đa hoá một hàm lợi ích cục bộ Ngoài ra, các tác giả đã chứng minh sự tồn tại của cân bằng Nash và đã cung cấp các điều kiện cho tính đơn trị đó và ổn định cho các trò chơi
Gần đây bài toán về sự tồn tại của các hành vi ích kỷ trong kiểm soát truy cập môi trường mạng vô tuyến cũng đã thu hút sự chú ý của một số nhà nghiên cứu ( [15],
[16], [17], [18]) Các tác giả [15] đã nghiên cứu hành vi ích kỷ của các nút trong mạng CSMA/CA bằng cách sử dụng lý thuyết trò chơi và phát triển một giao thức cục bộ và phân tán để điều khiển hành vi ích kỷ các nút cho đến khi cân bằng Nash tối ưu Pareto Một bài toán tương tự đã được nghiên cứu trong [16], trong đó các cuộc tấn công backoff trong các mạng ad-hoc với các trạm nặc danh đã được phân tích trong hai mô hình trò chơi không hợp tác khác nhau: duy nhất và lặp lại các trò chơi
CSMA/CA Hơn nữa, các tác giả đã phát triển một chiến lược cho các trạm, cung cấp một hiệu suất Pareto và sự cân bằng Nash hoàn hảo của việc tái lập lại trò chơi CSMA/CA Trong [17], các tác giả đã nghiên cứu sự ổn định của CSMA/CA trên nền tảng mạng vô tuyến với người dùng ích kỷ tham gia vào trò chơi CSMA/CA không hợp tác Trong trò chơi này, giá trị của mỗi người dùng có thể tự động thay đổi theo tình trạng nghẽn mạng và tình trạng tiêu thụ năng lượng Thêm vào đó, một phương pháp lặp lại có mục đích nhằm đảm bảo sự hội tụ cân bằng Nash đơn trị Trong [18], một trò chơi truy cập ngẫu nhiên cho mạng vô tuyến đã được trình bày để nghiên cứu hành vi ích kỷ của nút mạng Hơn nữa, các tác giả đã phân tích kỹ lưỡng thông lượng kênh ở cân bằng Nash và cung cấp các phân tích tiệm cận của trò chơi vì số lượng các máy phát ích kỷ đạt đến vô cùng Ngoài ra, trò chơi có ràng buộc chi phí ngẫu nhiên trong đó mỗi người chơi kết hợp với một chuỗi Markov của riêng mình được kiểm soát bởi hành động của chính nó đã được nghiên cứu [19] Tại mỗi thời điểm, mỗi người chơi sẽ xác định một hành động theo cho một số chiến lược nhằm giảm thiểu hàm chi phí trong một số ràng buộc các chiến lược của nó Sự tương tác giữa một số người chơi khác nhau được kết hợp trong hàm chi phí của họ.
Mục tiêu nghiên cứu
Mô hình hóa cơ chế chiến lược truyền thông (OTS) với điều kiện trễ trong bối cảnh kênh vô tuyến biến thiên theo thời gian Trong hệ thống OTS, trước khi gửi một gói tin, nút đưa ra quyết định có nên gửi gói tin tại khe thời gian hiện tại hay trì hoãn việc truyền này dựa trên trạng thái kênh để giảm thiểu mức tiêu thụ năng lượng Các trạng thái của hệ thống OTS được xây dựng như là trò chơi ngẫu nhiên kết hợp chi phí dựa trên quá trình Markov để có được chính sách truyền tải tối ưu.
Nhiệm vụ nghiên cứu và giới hạn đề tài
1.4.1 Nhiệm vụ nghiên cứu Đề tài này đề xuất một mô hình lý thuyết trò chơi cho chiến lược truyền thông cơ hội cho các mạng vô tuyến hoạt động trong một môi trường hạn chế năng lượng nghiêm ngặt Để giảm số lần truyền không thành công do lỗi kênh và xung đột gói
Trang 6 tin gây ra một sự lãng phí năng lượng, chiến lược truyền thông cơ hội cố gắng truyền ở điều kiện kênh tốt trong khi gặp ràng buộc trễ của kênh vô tuyến biến thiên theo thời gian Đề tài xây dựng trò chơi ngẫu nhiên kết hợp với chi phí để có được ngưỡng tối ưu cho sự truyền thành công theo phương pháp truyền thông cơ hội
Thực hiện mô phỏng, phân tích, đánh giá, so sánh mô hình hiện tại
1.4.2 Giới hạn của đề tài
Người thực hiện chỉ nghiên cứu tối ưu hóa truyền thông cơ hội cho mạng tùy biến vô tuyến ad-hoc dựa trên mô hình kênh truyền Markov trạng thái hữu hạn Về mô hình kênh truyền có rất nhiều mô hình kênh truyền như là fading phẳng, fading chọn lọc tần số, fading nhanh và fading chậm Người thực hiện chủ yếu phân tích và mô phỏng trên mô hình kênh truyền fading phẳng.
Đóng góp của đề tài
Đã có rất nhiều công trình nghiên cứu về vấn đề lý thuyết trò chơi, truyền thông cơ hội nhưng chưa có công trình nào nghiên cứu về tối ưu hóa cơ hội truyền tải cho mạng vô tuyến sử dụng lý thuyết trò chơi với cơ chế truyền lại đối với các gói tin lỗi và các nút mạng có thông tin về xác suất xung đột gói tin Trong đề tài này, người thực hiện nghiên cứu tối ưu hóa cơ hội truyền tải cho mạng vô tuyến dựa trên mô hình kênh truyền Markov trạng thái hữu hạn và sau đó thực hiện mô phỏng để đánh giá cơ hội truyền tải trong mạng vô tuyến.
Phương pháp nghiên cứu
Đề tài được thực hiện dựa trên một số phương pháp nghiên cứu:
- Tham khảo từ một số bài báo khoa học
- Sử dụng phương pháp phân tích
Bố cục đề tài
Với đề tài “Tối ưu hóa cơ hội truyền tải cho mạng vô tuyến sử dụng lý thuyết trò chơi” người thực hiện đề nghị 5 chương:
Chương 1: Tổng quan ở chương này người thực hiện trình bày giới thiệu đề tài, tình hình, mục tiêu, nhiệm vụ nghiên cứu, đóng góp, giới hạn đề tài, nội dung thực hiện, bố cục đề tài
Chương 2: Cơ sở lý thuyết ở chương này người thực hiện trình bày các lý thuyết liên quan như tổng quan mạng vô tuyến ad-hoc, kênh truyền fading, quá trình quyết định Markov, kênh Markov trạng thái hữu hạn, chức năng điều phối phối hợp trong giao thức IEEE 802.11, lý thuyết trò chơi, quy hoạch tuyến tính
Chương 3: Tối ưu cơ hội truyền tải cho mạng vô tuyến ad-hoc
Chương 4: Thực hiện mô phỏng và đánh giá các kết quả đạt được
Chương 5: Trình bày kết luận và đề xuất hướng phát triển
2.1 Tổng quan mạng tùy biến vô tuyến ad-hoc
Mạng tùy biến vô tuyến ad-hoc [20] bao gồm tập hợp các nút kết nối bằng các liên kết vô tuyến tạo thành các topo mạng vô tuyến tùy biến mà không cần sử dụng bất kỳ điểm truy cập tập trung Mạng vô tuyến ad-hoc vốn tự sắp xếp và tự quản lý Các nút được tự do di chuyển một cách tùy ý và tự tổ chức một cách ngẫu nhiên Do đó cấu trúc liên kết của mạng có thể thay đổi nhanh chóng và không thể đoán trước Thách thức lớn nhất trong các loại mạng này là tìm ra con đường giữa hai điểm kết cuối truyền tin của các nút di động Do phạm vi truyền dẫn hạn chế của mạng vô tuyến, truyền dữ liệu phải được mở rộng qua một số nút trung gian để tạo điều kiện giao tiếp giữa hai nút Do đó, các loại mạng này còn được gọi là các mạng đa chặng (multi-hop) ad-hoc Mỗi nút hoạt động cả hai vai trò vừa là máy chủ và vừa như một bộ định tuyến Một hạn chế khác liên quan đến thiết bị vô tuyến là hạn chế năng lượng của các nút, tức là mỗi nút có giới hạn năng lượng pin cần được sử dụng một cách hiệu quả giúp cho nút tồn tại được lâu hơn
Mạng ad-hoc không yêu cầu bất kỳ cơ sở hạ tầng nào để hoạt động, mỗi nút có khả năng giao tiếp trực tiếp với các nút khác Hình 2.1 minh họa mô hình mạng vô tuyến ad-hoc với ba nút mỗi mô hình Trong đó, mỗi nút mạng ad-hoc đặc biệt chỉ có thể giao tiếp, nếu chúng có thể liên kết với nhau về mặt vật lý, tức là, nếu chúng trong phạm vi sóng vô tuyến của nhau hoặc nếu các nút khác chuyển tiếp thông báo Các nút từ hai mạng ah-hoc thể hiện trong hình 2.1 không thể liên lạc với nhau nếu chúng không nằm trong cùng một dải vô tuyến
Hình 2 1 Mô hình mạng vô tuyến ad-hoc 2.1.2 Đặc tính mạng ad-hoc a Tính di động
Các nút tham gia trong mạng ad-hoc sử dụng sóng vô tuyến để truyền tin và không bị ràng buộc vật lý với nhau Bởi vậy chúng có thể tự do di chuyển và có thể triển khai ở những địa hình hiểm trở Nhưng nó cũng có nhược điểm là khiến topo mạng luôn bị thay đổi, các nút phải thường xuyên phải cập nhật lại bảng định tuyến b Tính đa chặn (multi-hop)
Một nút nguồn muốn truyền một gói tin đến nút đích cần phải đi qua một hay nhiều nút khác Trong điều kiện sử dụng mạng ad-hoc để truyền tin trong quân sự, số nút trung gian cần được giảm tối đa để tránh sự phát hiện của kẻ thù c Tự tổ chức
Không cần cơ sở hạ tầng hỗ trợ, mạng ad-hoc phải tự động tính toán các cấu hình của nó bao gồm: địa chỉ mạng, định tuyến, xếp nhóm, phát hiện vị trí, điều khiển năng lượng,…Trong một số trường hợp, một số nút đặc biệt (các nút đường trục) phải tự động di chuyển đến những vị trí xác định trong vùng địa lý để cung cấp vùng phủ sóng rộng khắp d Tiết kiệm năng lượng
Hầu hết các nút (ví dụ: máy tính xách tay, PDA, các cảm biến, v.v.) trong mạng được vận hành bằng các nguồn năng lượng hạn chế như pin, ắc quy và không có khả năng tạo ra năng lượng Việc nạp lại năng lượng cho các nút trong mạng thường khó khăn và không thể thực hiện thường xuyên, do đó khả năng tiết kiệm năng lượng của các giao thức sử dụng trong mạng ad-hoc là yếu tố quan trọng để đánh giá hiệu quả của giao thức e Khả năng mở rộng
Trong một số ứng dụng (ví dụ: quan sát môi trường xung quanh như nhiệt độ, độ ẩm, triển khai chiến trường, hệ thống xe đô thị, vv) mạng ad-hoc có thể phát triển lên đến hàng ngàn nút f An ninh
Mạng ad-hoc tiếp xúc với các cuộc tấn công nhiều hơn so với cơ sở hạ tầng mạng đối tác Các cuộc tấn công chủ động và thụ động đều có thể xảy ra Cuộc tấn công chủ động cố gắng làm gián đoạn hoạt động (kiểm soát các gói dữ liệu, tái xuất các gói kiểm soát không có thật; làm hỏng các bảng định tuyến; mở các cuộc tấn công từ chối dịch vụ, vv) Các cuộc tấn công thụ động thì không phổ biến trong mạng ad- hoc và có thể nguy hiểm hơn các cuộc tấn công chủ động Các cuộc tấn công chủ động dễ bị phát hiện và bị ngăn chặn Tấn công thụ động trong mạng không bao giờ được phát hiện Nó giám sát dữ liệu và kiểm soát lưu lượng và do đó làm mạng hoạt động bình thường Để bảo vệ từ các cuộc tấn công thụ động đòi hỏi phải có những kỹ thuật mã hoá mới cùng với việc thận trọng thiết kế giao thức mạng g Kết nối với Internet
Có rất nhiều ưu điểm trong việc mở rộng cơ sở hạ tầng mạng vô tuyến ad-hoc Việc tích hợp các giao thức ad-hoc với các tiêu chuẩn về cơ sở hạ tầng trở thành một vấn đề nóng
Phân bố Rayleigh là mô hình phổ biến để mô tả đường bao của tín hiệu nhận được trong môi trường fading, nơi có số lượng đường phản xạ lớn và không có thành phần LOS (line of sight), ví dụ như môi trường đô thị Tín hiệu phát tại tần số 𝜔 𝑐 tới bộ thu thông qua một số đường, đường 𝑖 𝑡ℎ có biên độ 𝑋 𝑖 và pha 𝑍 𝑖 Tính hiệu nhận 𝑋(𝑡) như sau:
Với N là số lượng đường truyền, Zi là pha của đường truyền Pha thì được phân bố đều trong khoảng [0;2 ] Xi là phân bố Rayleigh và Zi là phân bố đều Hiệu ứng Doppler của dạng sóng thì được cho bởi phương trình: c cos di i v c
(2.2) Với v là tốc độ của đối tượng khi di chuyển, c là tốc độ của ánh sáng, i là phân bố đều trong khoảng [0;2 ] Tín hiệu nhận có thể được viết như sau:
(2.3) Biểu diễn dưới dạng đồng pha và cầu phương
(2.6) Hàm phân bố xác suất:
Hình 2 2 Mô phỏng PDF của kênh truyền Rayleigh fading với phương sai bằng 0.5
Hình 2 3 Mô phỏng PDF của kênh truyền Rayleigh fading với phương sai bằng 1
2.3 Quá trình quyết định Markov (MDP)
Một MDP là một quá trình ngẫu nhiên dựa trên các biến ngẫu nhiên của trạng thái 𝑥 𝑡 , hành động 𝑎 𝑡 , phần thưởng 𝑟 𝑡 , được cho bởi mạng Dynamic Bayesian như minh họa hình 2.4 [21] Quá trình được xác định bởi các xác suất có điều kiện
Trong phần tiếp theo chúng ta sẽ giả thiết quá trình là ổn định, không có một xác suất điều kiện nào phụ thuộc vào thời gian