Bài viết giới thiệu mô hình mạng truyền thông IoT không đồng nhất tán xạ ngược và cấp nguồn không dây, trong đó, chúng tôi giả thiết nguồn phát (PB) thuộc nhà cung cấp dịch vụ năng lượng (ESP) và các thiết bị IoT thuộc nhà cung cấp dịch vụ IoT (ISP).
Trang 1Lập lịch cho mạng truyền thông tán xạ ngược cấp nguồn không dây sử dụng trò chơi Stackelberg
Ngoc-Tan Nguyen1, Nam-Hoang Nguyen2, and Quoc-Tuan Nguyen3 Khoa Điện tử - Viễn thông, Trường Đại học Công Nghệ, ĐHQGHN, Hanoi, Việt Nam
Email: 115028004@vnu.edu.vn,2hoangnn@vnu.edu.vn,3tuannq@vnu.edu.vn
Tóm tắt nội dung—Trong bài báo này, chúng tôi giới thiệu mô
hình mạng truyền thông IoT không đồng nhất tán xạ ngược và
cấp nguồn không dây, trong đó, chúng tôi giả thiết nguồn phát
(PB) thuộc nhà cung cấp dịch vụ năng lượng (ESP) và các thiết
bị IoT thuộc nhà cung cấp dịch vụ IoT (ISP) Để tối đa đồng thời
lợi nhuận của hai nhà cung cấp dịch vụ về mặt hiệu quả năng
lượng và thông lượng mạng, mô hình trò chơi Stackelberg được
sử dụng để nghiên cứu các tương tác giữa ISP và ESP Trong bài
báo này, chúng tôi sẽ giới thiệu một thuật toán tối ưu hoá luân
phiên để giải quyết bài toán tối ưu không lồi của ISP Thông qua
các mô phỏng máy tính, chúng tôi chỉ ra rằng phương pháp đề
xuất có thể nâng cao được lợi nhuận cho cả hai nhà cung cấp so
với các phương pháp thông thường, ví dụ như các phương pháp
tán xạ ngược song phân và "thu hoạch-truyền" (HTT) Ngoài
ra, các kết quả mô phỏng cũng xác thực độ phức tạp của thuật
toán tối ưu luân phiên là thấp và có thể hoàn thành trong thời
gian đa thức.
Index Terms—Tán xạ ngược, thu hoạch năng lượng.
I GIỚITHIỆU Internet vạn vật (IoTs) được định nghĩa là một mô hình
mạng thông minh sử dụng các công nghệ hiện đại cho phép
các thiết bị IoT kết nối với nhau [1] Trong thập kỷ vừa qua,
với tốc độ phát triển vũ bão, IoT đã được ứng dụng trong
nhiều lĩnh vực như thành phố/nhà thông minh, nông nghiệp,
chăm sóc sức khỏe, và giao thông nhằm mang lại những tiện
ích cao cấp cho cuộc sống của chúng ta [1]- [2] Để đáp ứng
các yêu cầu như chi phí thấp và kích thước gọn nhẹ, các thiết
bị IoT thường được cấp nguồn bằng pin có dung lượng nhỏ
để hỗ trợ hoạt động của chúng Tuy nhiên, việc thường xuyên
sạc lại hoặc thay thế pin cho một lượng lớn số lượng thiết bị
IoT như vậy thường không hiệu quả vì nó rất tốn kém, bất
tiện, và thậm chí không khả thi trong một số trường hợp (ví
dụ như trong cấy ghép y sinh) [3]
Mạng WPBC tích hợp hai công nghệ đó là phương pháp Thu
hoạch năng lượng-Truyền (HTT) [4] và truyền thông tán xạ
ngược [5] Trong mạng WPBC, thiết bị cấp nguồn không dây
(WPD) được thiết kế để thực hiện truyền thông tán xạ ngược
(tức là truyền dữ liệu thụ động) hoặc truyền thông bằng cách
sử dụng mạch vô tuyến (RF) của nó (tức là truyền dữ liệu chủ
động) và năng lượng thu được từ một nguồn phát sóng RF, ví
dụ như “Power beacon" (PB)
Hầu hết các nghiên cứu hiện tại về WPBC đều tập trung
tối ưu hóa việc lập lịch cho các thiết bị để thực hiện các tác
vụ như thu hoạch năng lượng, truyền dữ liệu chủ động và
thụ động theo giao thức ghép kênh phân chia theo thời gian
(TDM) với giả định là các thiết bị IoT đồng nhất về cấu hình
phần cứng và các yêu cầu về năng lượng [6]- [7] Trên thực
tế có nhiều loại WPD khác nhau với các chức năng và cấu hình phần cứng khác nhau, ví dụ như chúng có thể thực hiện truyền thông tán xạ ngược hoặc HTT hoặc cả hai Hơn nữa, các thiết bị IoT thường thuộc về một nhà cung cấp dịch vụ IoT (ISP) và nó phải trả chi phí cho việc mua năng lượng để vận hành các dịch vụ của mình Trong trường hợp này, các giao dịch năng lượng giữa ISP và nhà cung cấp dịch vụ năng lượng (ESP) nên được tính đến trong khi tối ưu hóa việc lập lịch cho các thiết bị IoT
Trong bài báo này, mục tiêu của chúng tôi là giới thiệu một giải pháp cho việc tối ưu hóa việc giao dịch năng lượng và lập lịch thời gian cho mạng WPBC (HWPBC) không đồng nhất bằng cách nghiên cứu sự tương tác giữa ISP và ESP Cụ thể, chúng tôi sử dụng lý thuyết trò chơi Stackelberg để nắm bắt tương tác chiến lược giữa PB và các thiết bị IoT [8]- [7] Trong trò chơi này, ISP đóng vai trò là người chơi thứ nhất (NC1) làm chủ trò, nó có thể chủ động chọn một dịch vụ năng lượng bằng cách gửi yêu cầu năng lượng của mình với giá cả và thời gian sạc Sau đó, ESP được mô hình hoá là người chơi thứ hai (NC2) sẽ đưa ra chiến lược để đối phó với chiến lược từ NC1 Do đó, trong trò chơi này, nó có nhiệm vụ tìm ra công suất truyền tối ưu để có thể tối đa hóa lợi ích của nó trong khi vẫn đáp ứng các yêu cầu từ ISP Mô hình chi phí có dạng hàm bậc hai được áp dụng cho giao dịch năng lượng [9] để tối ưu hóa lợi nhuận của ESP, tức là NC2, đạt được bằng cách bán năng lượng dựa trên chi phí và thời gian hoạt động của
PB do ISP (hay là NC1) đưa ra Lợi nhuận của ISP thu được
từ doanh thu của việc cung cấp dịch vụ (ví dụ như thu thập
dữ liệu) sau khi đã trừ đi chi phí năng lượng Đây là một hàm không lồi đa biến theo đơn giá mua năng lượng và thời gian hoạt động của các thiết bị PB và IoT được đề xuất bởi ISP Để tối đa hàm lợi nhuận này, chúng tôi giới thiệu một thuật toán tối ưu luân phiên Cuối cùng, các kết quả mô phỏng xác minh hiệu quả của phương pháp được đề xuất so với các phương pháp khác (BBCM [11] và HTTCM [4])
II MÔ HÌNH HỆ THỐNG
A Thiết lập mạng
Như được minh hoạ trong Hình 1a, chúng tôi xem xét mô hình mạng HWPBC có hai nhà cung cấp dịch vụ, đó là ISP
và ESP Ở phía ISP, chúng tôi xem xét ba loại thiết bị IoT có giá thành thấp và cấu hình phần cứng khác nhau có thể hỗ trợ hai chức năng: BBCM và HTTCM Loại thiết bị IoT đầu tiên được đại diện bởiA=∆{AWPDa|∀a = {1, , A}} là các thiết bị IoT cấp nguồn không dây chủ động (được kí hiệu là AWPD), chúng được trang bị mạch thu năng lượng và truyền
Trang 2RF
Power Beacon
RF signal
RF signal
RF signal
RF signal
PWPD AWPD
HWPD
Backscatter signal Transmit signal
Energy supply
service
Communication service
(a)
Sleeping period (1 − 𝛽) Normalized time frame of the HWPBCN
Operating period 𝛽
Energy Harvesting
Backscattering Self Transmitting
A ∪ H\{HWPDH}
A ∪ H
A ∪ H
(b) Hình 1: (a) Mô hình của hệ thống (b) Khung thời gian chuẩn
hoá
dữ liệu không dây Với cấu hình phần cứng này, AWPD chỉ có
thể hoạt động trong chế độ HTTCM Tiếp theo, chúng tôi ký
hiệu P=∆{PWPDp|∀p = {1, , P }} là một tập hợp các thiết
bị IoT cấp nguồn không dây thụ động (PWPD), chúng được
thiết kế với mạch truyền thông tán xạ ngược để thực hiện chế
độ BBCM Cuối cùng, các thiết bị IoT cấp nguồn không dây
kết hợp (HWPD) thuộc loạiH=∆{HWPDh|∀h = {1, , H}},
chúng được trang bị tất cả các thành phần phần cứng để hỗ trợ
cả hai chế độ hoạt động nói trên Mặt khác, ESP sử dụng một
bộ phát sóng vô tuyến chuyên dụng (PB) để cung cấp năng
lượng cho các thiết bị IoT
Dịch vụ IoT hoạt động trong hai khoảng thời gian làm việc
liên tiếp của PB, tức là, thời gian phát sóng vô tuyến β và
thời gian ngủ (1− β) như được hiển thị trong Hình 1b Để
đơn giản và đạt được tính hiệu quả trong việc phân bổ tài
nguyên thời gian cho nhiều thiết bị IoT, khung thời gian TDM
được áp dụng ở đây để tránh xung đột giữa các lần truyền của
các thiết bị IoT Chúng tôi ký hiệu θ= (θ1, , θ∆ p, , θP)T
và τ = (τ∆ 1, , τh, , τH)Tlần lượt là các véc-tơ thời gian
truyền thông tán xạ ngược của các thiết bị PWPD và HWPD
trong chu kỳ phát sóng vô tuyến của PB Tương tự, ν =∆
(ν1, , νa, , νA)Tvà µ= (µ1, , µ∆ h, , µH)Tlần lượt
là các véc-tơ thời gian truyền dữ liệu chủ động của các thiết
bị AWPD và HWPD trong khoảng thời gian ngủ của PB Khi
PB đang trong chu kỳ phát sóng vô tuyến, nó truyền tín hiệu
RF không điều chế, do đó, các thiết bị IoT (PWPD và HWPD)
với khả năng truyền thông tán xạ ngược có thể truyền dữ liệu
của chúng một cách thụ động bằng cách tận dụng các tín hiệu
đó Trong khi đó, các thiết bị AWPD và HWPD được trang
bị mạch thu năng lượng có thể thu hoạch năng lượng cho quá
trình truyền dữ liệu chủ động của chúng trong giai đoạn hoạt
động tiếp theo của PB (giai đoạn ngủ) Lưu ý rằng thiết bị AWPDa có thể thực hiện thu hoạch năng lượng trong toàn bộ thời gian phát sóng vô tuyến của PB (tức là β), trong khi đó thời gian thu hoạch năng lượng của HWPDhlà (β− τh) vì nó phải thực hiện truyền thông tán xạ ngược trong khoảng thời gian τh Trong giai đoạn ngủ của PB, các AWPD và HWPD
có thể thực hiện truyền dữ liệu chủ động để cung cấp dữ liệu cho gateway dựa trên giao thức TDMA
B Phân Tích Thông Lượng Mạng 1) Giai đoạn phát sóng vô tuyến của PB: Trong mô hình
hệ thống mà chúng tôi đề xuất, có ba kênh truyền bao gồm: (1) kênh truyền từ PB đến các thiết bị IoT, (2) kênh truyền
từ các thiết bị IoT đến IoT gateway, và (3) kênh truyền từ PB đến IoT gateway Vì phạm vi truyền thông của các mạng IoT thường giới hạn, nên chúng ta chỉ xem xét các kênh truyền trên là truyền thẳng (LOS), do đó, độ lợi của chúng là:
gc=GBGDλ
2 (4πdBD)2, gd=
GDGGλ2 (4πdDG)2, gg=
GBGGλ2 (4πdBG)2, (1) trong đó, gc, gd, và gg lần lượt là độ lợi của các kênh truyền
1, 2, và 3 GB, GD, và GG lần lượt là độ lợi ăng-ten của
PB, IoT devices, và IoT gateway λ là bước sóng của sóng vô tuyến, và dBD, dDG, và dBG lần lượt là khoảng cách truyền của các kênh truyền kể trên Tốc độ tán xạ ngược có thể đạt được (tính bằng bit/s) của PWPDp và HWPDh là [14]:
W = ΛBlog2
1 + ζP
ep R
N0
trong đó, công suất nhận tại IoT gateway là:PRep =
η2gcgd 4
π 2(Γ0− Γ1)2PS ζ là hệ số bù so với điều chế thực
tế, và N0 là phân bố phổ công suất (psd) của nhiễu đường truyền Tổng thông lượng thu được qua truyền thông tán xạ ngược trong khoảng thời gian phát sóng vô tuyến của PB là:
Rep=
P X
p=1
Wpθp+
H X
h=1
Whτh
=
P X
p=1 ΛBθplog2(1+κpPS)+
H X
h=1 ΛBτhlog2(1+κhPS) ,
(3)
where κp = ζη2pgc,pgd,p(Γ0− Γ1)2π24N 0
a and κh =
ζη2
hgc,hgd,h(Γ0− Γ1)2π24N0
h
2) Giai đoạn ngủ của PB: Như được đề cập trong phần trên, chỉ có các thiết bị AWPD và HWPD là có khả năng truyền thông với gateway trong giai đoạn này bằng việc sử dụng các mạch truyền thông vô tuyến của chúng Tổng lương năng lượng thu hoạch được của các thiết bị AWPDa và HWPDh
từ PB lần lượt là Ea = βPaR và Eh = (β− τh) PhR Trong
đó, PR,aB = ϕagc,aPS và PR,hB = ϕhgc,hPS lần lượt là công suất tín hiệu nhận được ở AWPDa và HWPDh từ PB [12]
PS là công suất truyền của PB và {ϕa, ϕh} lần lượt là hiệu quả thu hoạch năng lượng của AWPDa và HWPDh Để cho đơn giản, chúng tôi giả sử năng lượng tiêu hao bởi quá trình truyền chủ động của AWPDs và HWPDs chiếm tỉ trọng lớn nhất, do đó, năng lượng tiêu hao bởi mạch điện được bỏ qua
Do đó, toàn bộ năng lượng thu hoạch được sử dụng cho quá
Trang 3trình truyền dữ liệu của AWPDs và HWPDs khi PB không
phát sóng Công suất truyền của AWPDa và HWPDh lần lượt
là Pat= Ea/νa và Pht= Eh/µh Vì vậy, tổng thông lượng đạt
được do việc truyền dữ liệu chủ động của AWPD và HWPD
khi PB ở trạng thái ngủ được xác định như sau:
Rsp=
A
X
a=1
νaΛDlog2
1+ζgd,aP
t a
N0 a
+
H X
h=1
µhΛDlog2
1+ζgd,hP
t h
N0 h
=
A
X
a=1
νaΛDlog2
1+δaβPS νa
+
H X
h=1
µhΛDlog2
1+δh(β−τh)PS
µh
, (4) trong đó, δa=ζϕa g c,a g d,a
N a
0 và δh=ζϕh g c,h g d,h
N h 0
ΛD là băng thông sử dụng trong giao thức HTT, và{N0
a, Nh} lần lượt là0
ồn trên các kênh truyền từ AWPDa và HWPDh đến gateway
Cuối cùng, thông lượng mạng (Rsum) được tính như trong
công thức (5) và được mô hình hoá là lợi nhuận đạt được của
ISP để từ đó xây dựng bài toán tối đa đồng thời lợi nhận của
cả hai nhà cung cấp dịch vụ
III THỰC HIỆN GIAO DỊCH NĂNG LƯỢNG VÀ LẬP LỊCH
ĐỒNG THỜI DỰA TRÊN LÝ THUYẾT TRÒ CHƠI
STACKELBERG
A Thiết lập trò chơi
1) Hàm lợi nhuận của ISP: Hàm lợi nhuận đạt được của
ISP được định nghĩa như sau:
UISP(pl, β, ψ) = prRsum− plβPS, (6)
trong đó, pr là số tiền được trả trên mỗi bit thông tin được
truyền bởi các thiết bị IoT, pllà đơn giá năng lượng được trả
bởi ISP cho ESP Do đó, ISP cần tối đa hàm lợi nhuận của nó
ULtheo đơn giá năng lượng pl, thời gian hoạt động của PB β,
và thời gian hoạt động của các thiết bị IoT ψ= (θ, ν, τ , µ).∆
2) Hàm lợi nhuận của ESP: Trong trò chơi này, PB đóng
vai trò là NC2, nó tối ưu công suất truyền của nó dựa trên
yêu cầu của ISP, đó là đơn giá năng lượng và thời gian hoạt
động từ ISP Hàm lợi nhuận của NC2 được xác định dựa trên
lợi nhuận của nó thu được từ việc bán năng lượng cho ISP và
giá thành của việc tạo ra năng lượng:
UESP(PS) = β [plPS− F (PS)] , (7)
trong đó, F (x) = amx2+ bmx là một hàm bậc hai được dùng
để tính giá thành của việc tạo ra năng lượng ở PB [9]
B Nghiệm của trò chơi Stackelberg
Định nghĩa cân bằng Stackelberg (SE) được phát biểu là:
là cân bằng Stackelberg (SE) nếu các điều kiện sau đây thoả
mãn [13]:
UISP(PS∗, p∗l, β∗, ψ∗)≥ UISP(PS∗, pl, β, ψ) ,
UESP(PS∗, p∗l, β∗, ψ∗)≥ UESP(PS, p∗l, β∗, ψ∗) (9)
Để tìm được cân bằng Stackelberg, chúng tôi sử dụng kỹ
thuật quy nạp ngược trong hai bổ đề sau
Bổ đề 1 Nếu biết được chiến lược của NC1 (ở đây là ISP),
NC2 (ở đây là ESP) có thể tìm được một giá trị tối ưu duy nhất của PS∗ theo chiến lược đó.
Chứng minh. Thật vậy, hàm lợi nhuận của NC2 trong công thức (7) là một hàm bậc hai theo PS Do đó, nếu biết được chiến lược (pl, β, ψ) của NC1, nghiệm tối ưu và duy nhất PS
là PS∗=pl −bm
2a m
tồn tại một tập nghiệm tối ưu cho NC1 (ISP), và do đó, chiến lược tốt nhất mà ISP có thể đưa ra được tìm thông qua một thuật toán lặp.
Chứng minh. Với chiến lược PS∗của NC2, hàm lợi nhuận của NC1 có thể được biểu diễn lại như trong công thức (8) Bài toán tối ưu lợi nhuận của NC1 được biểu diễn như sau:
max
Pimin≤ Pit≤ Pimax, i∈ {a, h} , (10b)
Eimin≤ Ei≤ Eimax, i∈ {a, h} , (10c)
γibb≥ γmin
0≤XPp=1θp+XH
h=1τh≤ β ≤ 1, ∀θp,∀τh≥0, (10e)
0≤XAa=1νa+XH
h=1µh≤1−β ≤1, ∀νa,∀µh≥0 (10f) trong đó, PS = (pl −b m )
2a m , Pat = ϕa g c,a β(p l −b m )
2a m ν a , and Pht =
ϕ h g c,h (β−τ h )(p l −b m ) 2a m µ h Trong bài toán tối ưu trên, (10a)-(10f) là các ràng buộc về mặt thời gian và công suất của PB và các thiết bị IoT Để tìm nghiệm tối ưu χ∗= (p∗l, β∗, ψ∗) cho bài toán không lồi (10), chúng tôi sẽ giới thiệu một thuật toán có
độ phức tạp thấp áp dụng kỹ thuật BCD trong phần sau
IV THUẬT TOÁN TỐI ƯU LUÂN PHIÊN
Để giải bài toán tối ưu không lồi trong (10), chúng tôi
đề xuất một thuật toán tối ưu luân phiên để chia nhỏ tập biến χ thành hai tập biến nhỏ hơn, đó là đơn giá mua năng lượng và thời gian phát năng lượng của PB pl, β, và thời gian hoạt động của các thiết bị IoT ψ = (θ, τ , ν, µ) Cụ thể là,∆ thuật toán sẽ khởi chạy tại điểm khởi tạo{pl(0), β(0), ψ(0)} Hai bước sau đây sẽ được thực hiện tuần tự và lặp lại cho đến khi nào hàm lợi nhuận của ISP không tăng lên nữa: (i) Tối ưu đồng thời đơn giá mua năng lượng và thời gian phát năng lượng của PB pl(n), β(n)từ điểm tối ưu ở vòng lặp trước {p(n−1)l , β(n−1), ψ(n−1)}; (ii) Tối ưu thời gian hoạt động của các thiết bị IoT ψ(n) và giữ nguyên pl(n), β(n)
A Tối ưu đồng thời đơn giá mua năng lượng và thời gian phát của PB
Trong mục này, chúng ta sẽ tối ưu đồng thời đơn giá mua năng lượng pl và thời gian phát năng lượng của β dựa trên
Trang 4Rsum(θ, ν, τ , µ)= Rep+Rsp=
P X
p=1
γpWpθp+
A X
a=1
νaκalog2
1+δaβPS
νa
+
H X
h=1
γhWhτh+µhκhlog2
1+δh(β−τh)PS
µh
(5)
UL(pl, β, ψ) = pr
( P X
p=1
ΛBθplog2
1+κp(pl− bm)
2am
+
A X
a=1
ΛDνalog2
1+δaβ (pl− bm) 2νaam
+
H X
h=1
ΛBτhlog2
1+κh(pl−bm)
2am
+ΛDµhlog2
1+δh(β−τh)(pl−bm)
2µham
)
−plβ(p2al−bm)
m
(8)
nghiệm tối ưu trong vòng lặp trước {p(n−1)l , β(n−1), ψ(n−1)}
thông qua bài toán tối ưu phụ sau:
max
0≤ pl− bm≤ 2amPSmax, (11b)
Pamin≤ ϕagc,aβ
2νa(n−1)am
(pl− bm)≤ Pamax, (11c)
Phmin≤
ϕhgc,hβ− τh(n−1)
2µ(hn−1)am
(pl− bm)≤Pmax
h , (11d)
Emina ≤ ϕa2agc,aβ
m (pl−bm)≤ Emax
Eminh ≤
ϕhgc,hβ− τh(n−1)
2am (pl− bm)≤ Emax
h , (11f)
κa(pl−bm)≥ 2amγminp , κh(pl−bm)≥ 2amγminh , (11g)
trong đó, G (pl, β) ở trong biểu thức (12), và c1 = prΛB,
c2= prΛD Tuy nhiên, hàm mục tiêu G là một hàm không lồi
vì xuất hiện tích βpl(pl− bm) Do đó, ta phải tuyến tính hoá
tích này bằng cách đặt biến phụ q1 = 1/2 (pl− bm) (1 + β)
và q2= 1/2 (pl− bm) (1− β) Bài toán (11) trở thành:
max
q 1 ,q 2
0≤ q1+ q2≤ 2amPSmax, (13b)
Pamin≤ ϕagc,a
2νa(n−1)am
(q1−q2)≤Pamax, (13c)
Phmin≤
ϕhgc,hh1−τh(n−1)
q1−1+τh(n−1)q2i 2µ(n−1)h am ≤Pmax
h , (13d)
Eamin≤ϕa2agc,a
m (q1−q2)≤Emax
Ehmin≤
ϕhgc,hh1−τh(n−1)
q1−1+τh(n−1)q2i
h , (13f)
κp(q1+q2)≥ 2amγminp , κh(q1+q2)≥ 2amγhmin, (13g)
trong đó, Q(q1, q2) được biểu diễn trong biểu thức (14) Tuy
nhiên, bài toán tối ưu phụ (13) là bài toán
difference-of-convex-function (DC) nên chúng ta có thể dễ dàng giải được bằng
phương pháp convex-concave procedure (CCCP) [15].
B Tối ưu thời gian hoạt động của các thiết bị IoT
Tiếp theo, chúng ta sẽ thực hiện tối ưu thời gian hoạt động của các thiết bị IoT ψ(n)với các giá trị cố định {p(n)l , β(n)} Bài toán tối ưu ban đầu (10) được đơn giản hoá thành: max
ψ
˜
s.t Pamin≤c3ϕagc,aβ
( n)
νa ≤ Pmax
Phmin≤c3ϕhgc,h β
( n)
− τh
Ehmin≤ c3ϕhgc,hβ(n)− τh
≤ Ehmax, (15c)
0≤XPp=1θp+XH
h=1τh≤1 − β( n),∀θp, τh≥0, (15d)
0≤XAa=1νa+XH
h=1µh≤β( n),∀νa, µh≥0, (15e) trong đó, c3=
p(n)l −b m
2a m ,
˜ G(ψ) =
P X
p=1 c1θplog2(1 + c3κp)+
A X
a=1 c2νalog2
1+c3δaβ
( n)
νa
+
H X
h=1
"
c1τhlog2(1+c3κh)+c2µhlog21+c3δh β
( n)
−τh
µh
!#
− c3p(n)l β(n)
(16) Chúng ta có thể dễ dàng nhận thấy rằng các ràng buộc về SNR của các thiết bị tán xạ ngược (PWPDs và HWPDs) và các thiết bị truyền chủ động (AWPDs và HWPDs) bị triệt tiêu với các giá trị cố định của {p(n)l , β(n)} Vì hàm mục tiêu ˜G
là một hàm lõm theo ψ, do đó, ta có thể giải dễ dàng bằng phương pháp “Interior-point"
C Thuật toán lặp tìm nghiệm cho bài toán tối ưu hàm lợi nhuận của ISP
Thuật toán 1 được sử dụng để tìm nghiệm tối ưu cho bài
toán tối ưu hàm lợi nhuận của ISP
V KẾT QUẢ MÔ PHỎNG Trong phần này, chúng tôi sẽ thực hiện các mô phỏng để minh hoạ nghiệm tối ưu và đánh giá lợi nhuận của NC1 (ở đây là mạng IoT) đạt được bởi phương pháp đề xuất và các phương pháp truyền thống Chúng tôi sử dụng tần số sóng mang là 2.4 GHz Băng thông của tín hiệu vô tuyến và độ lợi
Trang 5G (pl, β) =
P
X
p=1
c1θp(n−1)log2
1+ κp 2am(pl−bm)
+
A X
a=1 c2νa(n−1)log2
"
1+ δaβ 2νa(n−1)am
(pl−bm)
#
+
H
X
h=1
( c1τh(n−1)log2
1+ κp 2am(pl−bm)
+c2µ(n−1)h log2
"
1+δh(β−τh(n−1)) 2µ(n−1)h am
(pl−bm)
#)
−βpl(p2al−bm)
m ,
(12)
Q(q1, q2) =
P
X
p=1
c1θ(n−1)p log2
1 + κp(q1+ q2) 2am
+
A X
a=1 c2νa(n−1)log2
"
1+δa(q1−q2) 2νa(n−1)am
#
+
H
X
h=1
c1τh(n−1)log2
1+κh(q1+q2) 2am
+c2µ(hn−1)log2
1+
δhh(1−τh(n−1))q1−(1+τh(n−1))q2i
2µ(n−1)h am
− q
2
1+bmq1 2am +
q22+bmq2 2am ,
(14)
Transmission Power of the Power Beacon PS -1000
0 1000 2000 3000 4000 5000 6000 7000
Profit of the Follower
pl = 29752
Hình 2: Lợi nhuận của NC2 theo (a) công suất truyền của PB, (b) giá và thời gian mua năng lượng đề xuất
1: Đầu vào: Đầu ra của vòng lặp trước
{pl(n−1), β(n−1), ψ(n−1)}
}, sai số ξ1> 0
5: Tìm{pl(n), β( n)
} từ {pl(n−1), β( n−1), ψ( n−1)
} bằng việc sử dụng phương pháp CCCP;
6: Tìm ψ( n)với giá trị cố định của{pl(n),β(n)} bằng việc
giải quyết bài toán phụ 2 (15);
7: Nếu:
8: UL pl( n), β( n), ψ( n) −UL pl( n−1), β( n−1), ψ( n−1)
< ξ1;
9: Thì:
10: Đặt{pl∗, β∗, ψ∗} = {pl(n), β(n), ψ(n)} và dừng lại
12: Cập nhật n← n + 1 và tiếp tục
hàm lợi nhuận của ISP
ăng-ten của PB lần lượt là 10 MHz và 6 dBi Băng thông của
các tín hiệu vô tuyến phát bởi AWPDs và HWPDs là 1 MHz
và độ lợi ăng-ten của chúng là 1.8 dBi Khoảng cách giữa PB
và các thiết bị IoT được thiết lập mặc định là 10 mét Hiệu
quả thu hoạch năng lượng của AWPDs và HWPDs là ϕ = 0.6,
trong khi đó, hiệu quả tán xạ η gây ra sự suy hao 1.1 dB ở
PWPDs và HWPDs Ngoài ra, hệ số bù hiệu năng và psd của
ồn của các thiết bị IoT lần lượt là ζ =−5 dB và N0=−100 dBm Laptop Dell với cấu hình: CPU Intel core i7-8565U, 16
GB RAM, và GPU Radeon RX 540 series, được sử dụng để
mô phỏng Đầu tiên, chúng ta sẽ đánh giá lợi nhuận của NC2 (ở đây là ESP) ở trong Hình 2 Đầu tiên chúng ta mô phỏng lợi nhuận này như một hàm bậc 2 theo công suất truyền của
PB như ở trong biểu thức (7) Hình 2(a) biểu diễn giá năng lượng đề xuất tương ứng với điểm tối ưu của đường cong lợi nhuận Sau khi thiết lập công suất truyền tối ưu cho PB, lợi nhuận của ESP phụ phuộc vào giá năng lượng và thời gian hoạt động của PB được đề xuất bởi ISP Hình 2(b)đề xuất Có thể nhận thấy rằng, lợi nhuận của ESP sẽ tăng tuyến tính theo thời gian mua năng lượng và phi tuyến theo giá năng lượng
đề xuất
Tiếp theo, chúng ta sẽ đánh giá lợi nhuận của ISP khi thay đổi lợi nhuận thu được trên mỗi bit được truyền trong khoảng 0.1 đến 1 (Hình 3) Trong mô phỏng này chúng ta giả sử mỗi loại thiết bị sẽ có 10 thiết bị Rõ ràng, lợi nhuận của ISP đạt được bởi tất cả các phương pháp đều tăng khi lợi nhuận thu được trên mỗi bit truyền tăng Ngoài ra, lợi nhuận thu được bởi phương pháp đề xuất cũng cao hơn các phương pháp khác Ngược lại, vì hiệu quả tán xạ thấp nên phương pháp BBCM cho kết quả là lợi nhuận của ISP thấp hơn nhiều so với các phương pháp khác
Trong Hình 4, chúng tôi biểu diễn lợi nhuận của NC1 thay đổi theo khoảng cách giữa PB và các thiết bị IoT Ở khoảng cách 2 mét, lợi nhuận của NC1 (ISP) đạt được bằng phương
Trang 60.1 0.2 0.3 0.4 0.5
Benefit per bit transmitted pr
0
1
2
3
4
Proposed Approach
BBCM
HTTCM
TDMA
Hình 3: Lợi nhuận của NC2 theo
lợi ích trên mỗi bit truyền được
Distance between the PB and IoT devices (m) 0
0.5 1 1.5 2 2.5
105
Proposed Approach BBCM HTTCM TDMA
Hình 4: Lợi nhuận của NC2 theo khoảng cách từ PB đến các thiết bị IoT
1 2 3 4 5 6 7 8
N = 5
N = 10
Hình 5: Thời gian chạy của các phương pháp
pháp BBCM lớn hơn rất nhiều so với các phương pháp khác vì
công suất truyền của PB có ảnh hưởng rất lớn đến các thiết bị
tán xạ ngược Tuy nhiên, hiệu quả của phương pháp này giảm
một cách nhanh chóng khi khoảng cách này tăng lên Ngược
lại, lợi nhuận của ISP đạt được bởi các phương pháp đề xuất,
TDMA, và HTTCM thì giảm nhẹ khi khoảng cách tăng lên
nhưng vẫn nhỏ hơn 10 mét Khi khoảng cách lớn hơn 4 mét
thì lợi nhuận của ISP đạt được bởi phương pháp đề xuất lớn
hơn tất cả các phương pháp khác
Cuối cùng, Hình 5 biểu diễn thời gian chạy (độ phức tạp)
của thuật toán đề xuất khi thay đổi số lượng các thiết bị IoT
Chúng ta sẽ thực hiện đo thời gian chạy của thuật toán đề
xuất trong 1000 lần chạy với số lượng các thiết bị IoT trong
mỗi loại lần lượt là N = 5, N = 10, N = 15 Nhìn chung,
thời gian chạy của thuật toán đề xuất là khá thấp, ngay cả với
trường hợp tổng số các thiết bị là 45 (tương ứng N = 15) thì
thời gian chạy vẫn nhỏ hơn 5 giây Rõ ràng khi chúng ta tăng
số lượng thiết bị IoT lên thì thời gian chạy cũng sẽ tăng lên,
chủ yếu do bài toán lập lịch cho các thiết bị IoT
VI KẾTLUẬN Như vậy, trong bài báo này, chúng tôi đã giới thiệu lý thuyết
trò chơi Stackelberg trong việc tối đa lợi nhuận của hai nhà
cung cấp dịch vụ trong các mạng truyền thông IoT không
đồng nhất cấp nguồn không dây, đó là nhà cung cấp dịch vụ
IoT (ISP) và nhà cung cấp năng lượng (ESP) Điểm cân bằng
Stackelberg đạt được bao gồm một công suất phát sóng vô
tuyến tối ưu của ESP và đơn giá mua năng lượng, thời gian
phát sóng vô tuyến của PB, và thời gian hoạt động của các
thiết bị IoT được đề xuất bởi ISP thông qua thuật toán tối ưu
luân phiên Thuật toán này được chứng minh thông qua cả lý
thuyết và mô phỏng là có tốc độ hội tụ nhanh và hiệu quả tính
toán cao trong thời gian đa thức Các kết quả mô phỏng cũng
chỉ ra rằng lợi nhuận đạt được của phương pháp đề xuất cao
hơn các phương pháp khác
TÀI LIỆU [1] D Bandyopadhyay and J Sen, “Internet of Things: Applications
and Challenges in Technology and Standardization," Wireless Pers.
Commun.,vol 58, no 1, pp 49–69, Apr 2011.
[2] A A Fuqaha et al., “Internet of Things: A Survey on Enabling
Technologies, Protocols, and Applications," IEEE Commun Surv &
Tut., vol 17, no 4, pp 2347-2376, Jun 2015.
[3] D W K Ng et al., “The Era of Wireless Information and Power
Transfer," in Wireless Information and Power Transfer: Theory and Practice,Wiley, pp.1-16, 2019.
[4] H Ju and R Zhang, “Throughput maximization in wireless powered
communication networks,” IEEE Trans Wireless Commun., vol 13, no.
1, pp 418-428, Jan 2014.
[5] N Van Huynh et al., “Ambient Backscatter Communications: A
Con-temporary Survey," IEEE Commun Surv & Tut., vol 20, no 4, pp.
2889-2922, May 2018.
[6] S Gong et al., “Backscatter Relay Communications Powered by
Wire-less Energy Beamforming," IEEE Trans Commun., vol 66, no 7, pp.
3187-3200, July 2018.
[7] W Wang et al., "Stackelberg Game for Distributed Time Scheduling in
RF-Powered Backscatter Cognitive Radio Networks," IEEE Trans on Wireless Commun., vol 17, no 8, pp 5606-5622, Aug 2018 [8] D T Hoang et al.,“Overlay RF-powered backscatter cognitive radio
networks: A game theoretic approach," in IEEE Inter Conf on Com-mun.,Paris, May 2017, pp 1-6.
[9] A M Rad et al., “Autonomous demand-side management based on game-theoretic energy consumption scheduling for the future smart
grid," IEEE Trans Smart Grid, vol 1, no 3, pp 320-331, Dec 2010.
[10] P Tseng, “Convergence of a block coordinate descent method for
nondifferentiable minimization,” Jour Optim Theory Appl., vol 109,
no 3, pp 475–494, June 2001.
[11] N F Hilliard, P N Alevizos and A Bletsas,“Coherent Detection and
Channel Coding for Bistatic Scatter Radio Sensor Networking," IEEE Trans Commun.,vol 63, no 5, pp 1798-1810, May 2015.
[12] C A Balanis, Antenna Theory: Analysis and Design NY, Wiley, 2012 [13] D Fudenberg, J Tirole, Game Theory, MIT Press, 1991.
[14] S H Kim and D I Kim, “Hybrid Backscatter Communication for Wireless-Powered Heterogeneous Networks," in IEEE Transactions on Wireless Communications, vol 16, no 10, pp 6557-6570, Oct 2017 [15] A L Yuille and A Rangarajan, “The Concave-Convex Procedure
(CCCP)," in Proc Adv Neural Inf Process Syst., Apr 2001, pp.
1033–1040.
... hai nhàcung cấp dịch vụ mạng truyền thông IoT không
đồng cấp nguồn khơng dây, nhà cung cấp dịch vụ
IoT (ISP) nhà cung cấp lượng (ESP) Điểm cân
Stackelberg đạt bao... tăng lên,
chủ yếu toán lập lịch cho thiết bị IoT
VI KẾTLUẬN Như vậy, báo này, chúng tơi giới thiệu lý thuyết
trị chơi Stackelberg việc tối đa lợi... pháp khác
cơng suất truyền PB có ảnh hưởng lớn đến thiết bị
tán xạ ngược Tuy nhiên, hiệu phương pháp giảm
một cách nhanh chóng khoảng cách tăng lên Ngược
lại, lợi nhuận