Thuật toán lập kế hoạch mạng WiMAX trên địa hình 3D GIS Thuật toán lập kế hoạch mạng WiMAX trên địa hình 3D GIS Thuật toán lập kế hoạch mạng WiMAX trên địa hình 3D GIS luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-
PHẠM HUY THÔNG
THUẬT TOÁN LẬP KẾ HOẠCH MẠNG WiMAX
TRÊN ĐỊA HÌNH 3D – GIS
LUẬN VĂN THẠC SĨ KHOA HỌC
Hà Nội – 2013
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-
PHẠM HUY THÔNG
THUẬT TOÁN LẬP KẾ HOẠCH MẠNG WiMAX
TRÊN ĐỊA HÌNH 3D – GIS
Chuyên ngành: Cơ sở toán học cho tin học
Trang 3Lời cảm ơn
Tôi xin chân thành gửi lời cảm ơn đến quý thầy cô, các anh chị em đồng nghiệp của Trung tâm Tính toán Hiệu Năng Cao và khoa Toán – Cơ – Tin học, trường Ðại học Khoa học Tự nhiên đã quan tâm giúp đỡ, tạo điều kiện về nhiều mặt, chỉ bảo tận tình trong quá trình tôi thực hiện luận văn Nhờ đó tôi đã tiếp thu được nhiều ý kiến đóng góp và nhận xét quí báu thông qua các buổi thảo luận seminar
Tôi xin được gửi lời cảm ơn sâu sắc nhất tới giáo viên hướng dẫn là
TS Nguyễn Thị Hồng Minh đã trực tiếp hướng dẫn, định hướng chuyên môn, giúp đỡ để tôi có thể hoàn thành luận văn này
Cuối cùng xin cảm ơn gia đình, bạn bè đã cổ vũ và động viên tôi trong công việc và học tập cũng như trong quá trình thực hiện luận văn này
Xin chúc mọi người luôn mạnh khoẻ, đạt được nhiều thành tích cao trong
công tác, học tập và nghiên cứu khoa học!
Hà Nội, ngày 25 tháng 11 năm 2013
Tác giả
Phạm Huy Thông
Trang 4Mục lục
Danh mục viết tắt i
Danh mục các hình iii
Danh mục các bảng iv
Lời nói đầu v
Chương 1 – Một số kiến thức cơ sở về bài toán lập kế hoạch mạng WiMAX trên 3D–GIS 1
1.1 Hệ thống thông tin địa lý 3D–GIS 1
1.1.1 Định nghĩa 1
1.1.2 Các chuẩn của địa hình độ cao số 3D–GIS 2
1.2 Cơ bản về WiMAX 3
1.2.1 Khái niệm về WiMAX 3
1.2.2 Các chuẩn WiMAX 4
1.2.3 Cấu hình mạng 6
1.2.4 Ưu điểm của mạng WiMAX 8
1.3 Bài toán lập kế hoạch mạng WiMAX 9
1.3.1 Mô hình hóa bài toán 9
1.3.2 Tính toán chất lượng sóng trên địa hình 3D–GIS 13
1.3.3 Một số nghiên cứu liên quan 17
1.4 Kết luận chương 19
Chương 2 – Nhận dạng địa hình độ cao số 21
2.1 Giới thiệu về bài toán nhận dạng địa hình độ cao số 21
2.2 Trích chọn đặc trưng 22
2.3 Thuật toán phân loại rừng ngẫu nhiên 24
2.4 Kết luận chương 27
Chương 3 – Thuật toán lai lập kế hoạch mạng WiMAX trên địa hình 3D–GIS 28
3.1 Ý tưởng chính 28
3.2 Thuật toán BTP 28
3.3 Thuật toán PSO cải tiến 29
Trang 53.3.1 Khởi tạo 29
3.3.2 Đánh giá, cập nhật vận tốc và vị trí 30
3.3.3 Tối ưu số sector 33
3.3.4 Đột biến 34
3.3.5 Điều kiện dừng 34
3.4 Thuật toán WNPA–3DT 35
3.5 Kết luận chương 36
Chương 4 – Một số kết quả thực nghiệm 37
4.1 Mục tiêu và môi trường thực nghiệm 37
4.2 Kết quả thực nghiệm so sánh với các thuật toán khác về độ hiệu quả 41
4.3 Kết quả thực nghiệm so sánh với các thuật toán khác về thời gian chạy.49 4.4 Kết quả thực nghiệm so sánh trên các bộ tham số khác nhau 55
4.5 Kết luận chương 61
KẾT LUẬN 62
Danh mục các công trình công bố có liên quan đến luận văn 63
TÀI LIỆU THAM KHẢO 64
Trang 6i
Danh mục viết tắt
International Association
Hiệp hội quốc tế thẻ nhớ máy tính
cá nhân
nhiên
gian
thiết
Trang 7ii
địa cầu
Trang 8iii
Danh mục các hình
Hình 1.1: Hệ thống GIS 1
Hình 1.2: Mô hình hoạt động WiMAX mạng điểm – đa điểm PMP 7
Hình 1.3: Mô hình hoạt động WiMAX mạng mắt lưới 8
Hình 1.4: Mô hình tính toán độ suy hao trong trường hợp một vật cản 15
Hình 2.1: Ví dụ về các đặc trưng của việc nhận dạng địa hình độ cao số 24
Hình 3.1: Sơ đồ hoạt động của thuật toán WNPA-3DT 35
Hình 4.1: Phân bố đều của 4000 người dùng trên địa hình nhỏ 38
Hình 4.2: Phân bố đều của 10000 người dùng trên địa hình lớn 39
Hình 4.3: Phân bố không đều của 4000 người dùng trên địa hình nhỏ 40
Hình 4.4: Phân bố không đều của 10000 người dùng trên địa hình lớn 41
Hình 4.5: So sánh giá trị hàm lượng giá fitness ở kịch bản 1 và kịch bản 2 44
Hình 4.6: So sánh giữa kịch bản 1 và kịch bản 3 47
Hình 4.7: So sánh giá trị fitness với bốn kịch bản 49
Hình 4.8: Biểu đồ tăng tốc và hiệu quả của các trường hợp trong kịch bản 1 51
Hình 4.9: So sánh thời gian chạy trung bình giữa kịch bản 1 và kịch bản 2 52
Hình 4.10: So sánh thời gian chạy trung bình giữa kịch bản 1 và kịch bản 3 53
Hình 4.11: So sánh thời gian chạy trung bình giữa kịch bản 1 và kịch bản 4 55
Hình 4.12: So sánh giá trị Fitness giữa các bộ tham số qua các trường hợp trong cả bốn kịch bản 60
Trang 9iv
Danh mục các bảng
Bảng 1: So sánh kết quả chạy của các thuật toán với địa hình nhỏ và người dùng
phân bố đều 42
Bảng 2: So sánh kết quả chạy của các thuật toán với địa hình lớn và người dùng phân bố đều 45
Bảng 3: So sánh kết quả chạy của các thuật toán với địa hình nhỏ và người dùng phân bố không đều 46
Bảng 4: So sánh kết quả chạy của các thuật toán với địa hình lớn và người dùng phân bố không đều 48
Bảng 5: Thời gian tính toán song song của WNPA-3DT với kịch bản 1 50
Bảng 6: Thời gian tính toán song song của WNPA-3DT với kịch bản 2 52
Bảng 7: Thời gian tính toán song song của WNPA-3DT với kịch bản 3 53
Bảng 8: Thời gian tính toán song song của WNPA-3DT với kịch bản 4 54
Bảng 9: Kết quả chạy WNPA-3DT với các tham số khác nhau ở kịch bản 1 56
Bảng 10: Kết quả chạy WNPA-3DT với các tham số khác nhau ở kịch bản 2 57
Bảng 11: Kết quả chạy WNPA-3DT với các tham số khác nhau ở kịch bản 3 58
Bảng 12: Kết quả chạy WNPA-3DT với các tham số khác nhau ở kịch bản 4 59
Trang 10v
Lời nói đầu
Sự phát triển không ngừng của công nghệ thông tin đã đưa tin học thâm nhập sâu vào nhiều lĩnh vực khoa học và đời sống, mở ra một giai đoạn mới trong quá trình phát triển khoa học Hệ thống thông tin địa lý ba chiều (3D–GIS) là một trong những ứng dụng rất có giá trị của công nghệ tin học trong ngành địa lý, điều tra cơ bản, quy hoạch đô thị và cảnh báo môi trường Với sự phát triển không ngừng của thế giới cũng như của đất nước ta hiện nay, việc tổ chức quản lý thông tin địa lý một cách tổng thể có đóng góp không nhỏ vào việc sử dụng hiệu quả hơn các nguồn lực
và tài nguyên
Trong số các ứng dụng của 3D–GIS, chúng tôi quan tâm hơn cả đến việc lập
kế hoạch mạng không dây, đặc biệt là WiMAX trên địa hình 3D–GIS Vấn đề này
được nhóm nghiên cứu của chúng tôi quan tâm và thực hiện tại Trung tâm tính toán Hiệu Năng Cao, trường Đại học Khoa học Tự nhiên từ năm 2011
Như chúng ta đã biết, mạng Internet đóng một vai trò vô cùng quan trọng trong đời sống hiện đại Nhờ có Internet, chúng ta có thể cập nhật tin tức, trao đổi thông tin một cách nhanh chóng, dễ dàng và mọi lúc Hơn nữa, với sự ra đời của mạng không dây, bằng việc sử dụng các trạm thu phát sóng phủ sóng trong một vùng rộng lớn đến vài chục km2, Internet đã “vươn” đến những vùng miền xa xôi nhất Tuy nhiên, mạng không dây cũng có những nhược điểm của nó Các sóng mạng không dây chủ yếu là các sóng radio, dễ dàng bị cản trở bởi các vật cản như
núi, đồi, nhà cửa, vv Do đó, bài toán đặt ra là phải đặt các trạm thu phát sóng một
cách hợp lý sao cho chất lượng sóng tại mọi điểm đủ “tốt” và chi phí cho số lượng trạm thu phát là nhỏ nhất có thể Bài toán này đã được nghiên cứu khá nhiều trong thời gian gần đây Tuy nhiên các phương pháp giải còn nhiều hạn chế, như chỉ áp dụng trên bản đồ hai chiều, lập kế hoạch mạng thủ công hoặc chỉ chú trọng đến một mục tiêu như chất lượng sóng hoặc chi phí, một vài phương pháp có thời gian tính toán lớn và đặc biệt là không xác định được các vị trí có thể đặt trạm thu phát Nếu
có một phương pháp giải đủ tốt, bài toán này sẽ đặc biệt hữu ích đối với các nhà
Trang 11vi
cung cấp dịch vụ mạng trong việc phủ sóng một vùng địa lý sao cho hiệu quả với một chi phí thấp nhất Việc lập kế hoạch mạng không dây trên một địa hình cụ thể đòi hỏi hai quá trình chính sau: Quá trình thứ nhất là nhận dạng địa hình độ cao số,
từ đó sẽ tìm được các vị trí đặt trạm Quá trình còn lại là mô hình hóa bài toán và các thuật toán lập kế hoạch
Rõ ràng đây là một bài toán tối ưu đa mục tiêu với rất nhiều các điều kiện ràng buộc Trước hết là phần tiền xử lý, với địa hình ba chiều, việc nhận dạng địa hình là hết sức khó khăn Với đầu vào là mô hình độ cao số (DEM), cần có một thuật toán hiệu quả để phân biệt đâu là núi, sông, ao, hồ, đồng bằng, thung lũng, vv
Từ đó, mới xác định được vị trí nào có thể đặt trạm thu phát sóng bởi các trạm thu phát không thể đặt giữa sông, giữa hồ, trên các sườn núi dốc thẳng đứng, vv Sau khi có được các vị trí có thể đặt trạm, chúng ta cần lựa chọn một thuật toán lập kế hoạch mạng phù hợp Các thuật toán tham thường chạy nhanh song lại không cho kết quả “tốt” so với các thuật toán dựa theo kinh nghiệm (meta heuristic) [16] Ngoài ra, bài toán lập kế hoạch mạng không dây cũng thường làm việc trên dữ liệu lớn nên tốc độ tính toán, xử lý là vấn đề rất đáng được quan tâm
Một số kết quả trong quá trình nghiên cứu về phần nhận dạng địa hình độ cao số đã được nhóm trình bày trong bài báo [14] Một phần trong phần nghiên cứu còn lại của nhóm về mô hình hóa bài toán và thuật toán lập kế hoạch mạng cũng đã được báo cáo trong bản khóa luận tốt nghiệp của sinh viên Nguyễn Đình Nhật [1] Trong bản luận văn này, chúng tôi sẽ trình bày một cách hệ thống và đầy đủ cả hai quá trình nghiên cứu trên trong việc giải quyết bài toán lập kế hoạch mạng WiMAX trên địa hình 3D–GIS một cách tổng thể
Bố cục của luận văn gồm 4 chương Chương 1 giới thiệu về các kiến thức cơ
sở về 3D–GIS, WiMAX và mô hình hóa bài toán lập kế hoạch mạng WiMAX trên địa hình 3D–GIS Tiếp theo chương 2 trình bày về bài toán nhận dạng địa hình độ cao số, từ đó chúng tôi sẽ có được những vị trí đặt trạm làm tiền đề cho chương 3 với thuật toán lập kế hoạch mạng WiMAX trên địa hình 3D–GIS Chương cuối
Trang 12vii cùng sẽ trình bày một số kết quả thực nghiệm để kiểm chứng hiệu quả của thuật toán trên hệ thống máy tính hiệu năng cao
Trang 131
Chương 1 – Một số kiến thức cơ sở về bài toán lập kế hoạch
mạng WiMAX trên 3D–GIS
1.1 Hệ thống thông tin địa lý 3D–GIS
1.1.1 Định nghĩa
Hệ thống thông tin địa lý (Geographic Information System- GIS) là một hệ thống bao gồm bốn thành phần [3]:
- Máy tính và các thiết bị ngoại vi có khả năng thực hiện các chức năng vào,
ra và xử lý thông tin của phần mềm
- Một cơ sở dữ liệu chứa thông tin không gian và thông tin thuộc tính được tổ
chức theo một ý đồ chuyên ngành nhất định
- Một phần mềm có các chức năng: quản lý thông tin không gian và thuộc
tính, phân tích và hiển thị thông tin
- Các kiến thức chuyên gia, chuyên ngành
Ta có thể hình dung GIS theo định nghĩa trên bằng hình mô phỏng dưới đây:
Hình 1.1: Hệ thống GIS
Hệ thống thông tin địa lý ba chiều 3D–GIS chính là một hệ thống thông địa
lý làm việc trên mô hình địa hình ba chiều, với các chức năng hiển thị ba chiều,
Trang 14điển hình vẫn là các kiểu dữ liệu TIN hoặc DEM
Hiện nay tại Việt Nam cũng như trên toàn thế giới, 3D–GIS đang được sử dụng như một công cụ hỗ trợ đắc lực trong rất nhiều lĩnh vực của cuộc sống Ví dụ như hỗ trợ thực hiện các phép phân tích không gian, phân loại địa hình, dự báo biến đổi tài nguyên, lập kế hoạch phát triển hệ thống điện, mạng viễn thông hay quản lý môi trường, vv Hệ thông tin địa lý ba chiều trợ giúp, mô phỏng cho người dùng một cái nhìn trực quan và rõ ràng nhất về thế giới thực, từ đó hỗ trợ người dùng đưa
ra các quyết định hợp lý, hiệu quả
1.1.2 Các chuẩn của địa hình độ cao số 3D–GIS
Hiện nay có nhiều chuẩn cho địa hình độ cao số [3] nhưng điển hình vẫn là mạng TIN và lưới độ cao DEM
- Mạng TIN: Là một dạng biểu diễn địa hình bằng mạng lưới tam giác không
đều Sử dụng mạng TIN sẽ đem lại tính hiệu quả và chính xác trong mô hình hóa bề mặt liên tục
- Lưới độ cao DEM: Là một dữ liệu trái đất có dạng lưới ô vuông đều nhau
với giá trị độ cao Mô hình DEM do cục đo đạc địa hình địa lý của Mỹ đề xuất là một tệp chứa đựng các dãy giá trị độ cao sử dụng phép chiếu UTM hoặc là phép chiếu toạ độ nào đó Một mảnh địa hình được xác định ở dạng hình tứ giác và một lưới xác định sẽ được phủ lên mảnh địa hình đó Mỗi mắt lưới sẽ xác định một độ cao của mảnh địa hình đó Do vậy, bất kỳ cao độ điểm nào trên bề mặt cũng có thể tính toán và tạo ra đường đồng mức
Trong mô hình hóa không gian ba chiều thì việc mô hình hóa bề mặt đóng vai trò vô cùng quan trọng bởi từ đó ta có thể xác định được dạng địa hình của đối tượng Trong đó, mô hình dạng TIN có ưu điểm về độ chính xác Tuy nhiên, mô
Trang 153
hình này lại khá phức tạp trong việc tổ chức dữ liệu Mô hình độ cao số DEM được
sử dụng chủ yếu bởi tính thuận lợi trong việc tổ chức cũng như truy xuất dữ liệu Trong khuôn khổ luận văn này, mô hình DEM được sử dụng làm đầu vào của các thuật toán
Dữ liệu DEM chỉ thể hiện bề mặt địa hình ba chiều Do đó chúng tôi tiến hành tìm hiểu sâu hơn về DEM để có thêm thông tin phục vụ cho các bài toán phía sau Một trong những bài toán quan trọng về DEM đó là nhận dạng địa hình mà một
dữ liệu DEM thể hiện
1.2 Cơ bản về WiMAX
1.2.1 Khái niệm về WiMAX
WiMAX [8] là một công nghệ truy cập không dây băng thông rộng Công nghệ WiMAX dựa trên cơ sở tương thích toàn cầu được kết hợp bởi bộ chuẩn IEEE 802.16 và ETSI HiperMAN Đây là các tiêu chuẩn cho mạng mạng đô thị không dây
WiMAX sử dụng kỹ thuật sóng vô tuyến để kết nối các máy tính trong mạng Internet thay vì dùng dây để kết nối như DSL hay cáp modem Nếu như Wireless LAN được phát triển để cung cấp dịch vụ truy nhập Internet cho mạng LAN không dây, nâng cao tính linh hoạt trong việc truy cập Internet cho những vùng tập trung đông dân cư trong những phạm vi hẹp thì với WiMAX ngoài khả năng cung cấp dịch vụ ở vùng đô thị nó còn giải quyết được những vấn đề khó khăn trong việc cung cấp dịch vụ Internet cho những vùng thưa dân, ở những khoảng cách xa mà công nghệ xDSL sử dụng dây đồng không thể đạt tới
WiMAX như một tổng đài trong vùng lân cận hợp lý đến một trạm chủ mà
nó được yêu cầu thiết lập một đường dữ liệu đến Internet Người sử dụng trong phạm vi từ 3 đến 5 dặm so với trạm chủ sẽ được thiết lập một đường dẫn công nghệ NLOS với tốc độ truyền dữ liệu rất cao là 75Mbps Còn nếu người sử dụng trong phạm vi lớn hơn 30 dặm so với trạm chủ thì sẽ có anten sử dụng công nghệ LOS với tốc độ truyền dữ liệu gần bằng 280Mbps WiMAX là một chuẩn không dây đang
Trang 164
phát triển rất nhanh, hứa hẹn tạo ra khả năng kết nối băng thông rộng tốc độ cao cho
cả mạng cố định lẫn mạng không dây di động, phạm vi phủ sóng được mở rộng
Một hệ thống WiMAX gồm hai thành phần sau:
- Trạm phát (BS): Giống như các trạm BTS trong mạng thông tin di động với công suất lớn Trên lý thuyết, một trạm thu phát này có thể phủ sóng một vùng rộng tới 8000km2
- Trạm thu: Có thể là các bộ phận ăngten thu, các thẻ card hoặc được tích hợp sẵn có trên Mainboard của các máy tính, theo cách mà Wifi đã dùng
Các trạm BS được kết nối tới mạng Internet thông qua các đường truyền hữu tuyến tốc độ cao (cáp quang) dành riêng hoặc thông qua các trạm chuyển tiếp Nhờ việc sử dụng các trạm chuyển tiếp, phạm vi phủ sóng rộng và chi phí rẻ nên WiMAX có khả năng phủ sóng rất rộng Các ăngten thu/phát có thể trao đổi thông tin với nhau qua các đường truyền LOS hoặc NLOS Đường truyền LOS thường sử dụng tần số cao lến đến 66GHz và ăngten thường được đặt ở vị trí cao, do đó đường truyền sẽ ổn định và tốc độ có thể đạt cực đại Ngược lại, với đường truyền NLOS, băng tần từ 2-11 GHz được sử dụng bởi ở tần số thấp, tín hiệu dễ dàng xuyên qua các vật cản, có thể phản xạ, nhiễu xạ, uốn cong, vòng qua các vật thể để đến đích
1.2.2 Các chuẩn WiMAX
a Chuẩn IEEE 802.16 – 2001
Chuẩn IEEE 802.16 – 2001 được hoàn thành vào tháng 10/2001 và được công bố vào 4/2002 Định nghĩa đặc tả kỹ thuật giao diện không gian WireLessMANTM cho các mạng vùng đô thị
Những đặc điểm chính của chuẩn này là [8]:
- Giao diện không gian cho hệ thống truy cập không dây băng rộng cố định hoạt động ở dải tần 10 – 66GHz
- Lớp vật lý PHY: WirelessMAN-SC
- Tốc độ bit: 32 – 134 Mbps với kênh 28 MHz
Trang 175
- Bán kính phủ sóng: 2 – 5km
- Hỗ trợ QoS để đảm bảo chất lượng dịch vụ
- Kết nối cố định
- Kiến trúc bảo mật được xây dựng trong lớp con MAC – PS
b Chuẩn IEEE 802.16a
Là bộ chuẩn được sửa đổi, bổ sung từ chuẩn 802.16-2001, chuẩn này được hoàn thành vào tháng 11/2002 và được công bố vào tháng 4/2003 Chuẩn này nhằm mục đích hỗ trợ đường truyền không trong tầm nhìn thẳng NLOS [8]
- Bổ sung các hiệu chỉnh MAC và các đặc điểm PHY với việc mở rộng thêm dải tần 2 – 11 GHz
- Hỗ trợ đường truyền trong tầm nhìn không thẳng NLOS
- Tốc độ bit: tới 75Mbps với kênh 20 MHz
- Dải thông kênh có thể thay đổi giữa 1.25 MHz và 20 MHz
- Kỹ thuật đa truy nhập OFDM – TDMA hoặc sử dụng kỹ thuật đa truy nhập OFDMA, lớp vật lý vô tuyến MAN – OFDM
- Độ rộng băng tần có thể lựa chọn từ 1.25 đến 20 MHz
- Tốc độ dữ liệu tối đa 75Mb/s với độ rộng băng tần 20 MHz
- Kỹ thuật điều chế đa sóng mang FFT 256 – OFDM (256 sóng mang phụ)
d Chuẩn IEEE 802.16e
Đầu năm 2005, chuẩn không dây băng thông rộng 802.16e với tên gọi Mobile WiMAX đã được phê chuẩn, cho phép trạm gốc kết nối tới những thiết bị
Trang 186
đang di chuyển Chuẩn này giúp cho các thiết bị từ các nhà sản xuất này có thể làm việc, tương thích tốt với các thiết bị từ các nhà sản xuất khác Chuẩn này được chứng nhận vào tháng 12/2005 [8] Chuẩn WiMAX di động có thay đổi và bổ sung
so với chuẩn cố định để hỗ trợ tính di động và chuyển giao Các đặc điểm cơ bản của WiMAX di động:
- Hỗ trợ handoff và roaming
- Kỹ thuật đa truy nhập phân chia theo tần số trực giao theo tỉ lệ S – OFDMA, lớp vật lý vô tuyến MAN – OFDMA
- Dải tần dưới 11GHz
- Đường truyền trong tầm nhìn không thẳng NLOS
- Hỗ trợ truy nhập di động, chuyển giao ở tốc độ di chuyển cao
Mạng điểm – đa điểm là cấu hình mạng cơ bản cho mạng WiMAX Hình 1.2
mô tả cụ thể mô hình hoạt động WiMAX với cấu hình mạng điểm – đa điểm PMP [21] Cấu hình mạng này tương tự mạng thông tin di động tế bào Mạng PMP bao gồm một trạm gốc BS kết nối với mạng công cộng và một số lượng lớn các trạm thuê bao xung quanh Mỗi ăngten chia theo sector tại mỗi trạm gốc BS có độ định hướng cao, được hướng theo từng cung và được sắp xếp xung quanh cột ăngten
Như vậy, các trạm thuê bao hay người dùng trong mạng PMP chỉ trao đổi thông tin trực tiếp với trạm gốc BS Các kết nối trao đổi thông tin này đều được
Trang 197
thông qua nhận dạng kết nối CID Các trạm thuê bao hay người dùng sẽ kiểm tra CID trong các PDU nhận được và giữ lại các PDU có địa chỉ tới chúng Việc truyền dữ liệu sẽ được tiến hành ngay hoặc phải chời đợi sự cho phép của trạm gốc Điều này tùy thuộc vào loại dịch vụ mà người dùng đăng ký Mạng PMP sử dụng tần số thấp dưới 6GHz để có phạm vi phủ sóng lớn Chi phí xây dựng và lắp đặt một mạng điểm – đa điểm là khá kinh tế trong khi nó có thể phục vụ được số lượng người dùng lớn
Hình 1.2: Mô hình hoạt động WiMAX mạng điểm – đa điểm PMP
Cấu hình mạng còn lại chính là mạng mắt lưới [21] Mạng này bao gồm các trạm mắt lưới gốc là các trạm BS được kết nối với mạng bên ngoài và các mắt lưới
SS là các thành phần còn lại trong mạng mà chỉ có các kết nối bên trong mạng mắt lưới (có thể là các trạm thuê bao SS hoặc trạm gốc BS) Việc liên lạc và trao đổi thông tin trong mạng từ trực tiếp đến gián tiếp đều được thực hiện tại các mắt lưới (nút lưới) Các kết nối trong mạng mắt lưới cũng thông qua nhận dạng kết nối CID, mắt lưới thuê bao sẽ kiểm tra CID trong các PDU nhận được và chỉ giữ các PDU có
địa chỉ tới chúng
Trang 208
Hình 1.3: Mô hình hoạt động WiMAX mạng mắt lưới
Một bộ định tuyến được đặt tại các mắt lưới để định tuyến qua các mắt lưới Nhờ đặc điểm này các mắt lưới SS có thể trao đổi dữ liệu với nhau và trao đổi dữ liệu trực tiếp với mắt lưới gốc, đây là khác biệt cơ bản so với cấu hình PMP Hoạt động của cấu hình mạng mắt lưới được miêu tả trong Hình 1.3
Cấu hình mạng mắt lưới là tùy chọn cho WiMAX do chi phí cho thiết bị đầu cuối lớn và quản lý mạng phức tạp Mạng mắt lưới chỉ thích hợp cho các dịch vụ cố định Trên thực tế, người ta sử dụng kết hợp mạng mắt lưới và mạng điểm – đa điểm để đạt được hiệu quả sử dụng cao nhất
1.2.4 Ưu điểm của mạng WiMAX
Chính những đặc điểm trên mà mạng WiMAX có những ưu điểm sau:
- WiMAX có thể đáp ứng được các nhu cầu truy cập khác nhau, cung cấp các dịch vụ băng rộng đến các thuê bao
- WiMAX có thể hỗ trợ được các giải pháp băng thông rất cao (lớn hơn 10 MHz)
Trang 219
- WiMAX có thể cung cấp vùng phủ sóng rộng và chất lượng dịch vụ tốt cho các ứng dụng thời gian thực VoIP
- WiMAX là công nghệ băng rộng dựa trên IP, có thể được tích hợp trong
cả hai mạng di động thế hệ thứ ba diện rộng (3G) và mạng không dây và
có dây, cho phép nó trở thành một phần của giải pháp truy cập băng rộng bất cứ thời gian nào, bất cứ thời điểm nào một cách liên tục
1.3 Bài toán lập kế hoạch mạng WiMAX
1.3.1 Mô hình hóa bài toán
Những ưu việt của mạng WiMAX so với các mạng khác cũng kéo theo những yêu cầu về đầu tư cho mạng này nhiều hơn Một trong những yêu cầu đó là việc lập kế hoạch đặt các trạm thu phát WiMAX sao cho hiệu quả cao nhất khi sử dụng Một phương án hiệu quả phải có chất lượng dịch vụ đủ “tốt” cho khách hàng nhưng đồng thời phải tiết kiệm được chi phí Bài toán lập kế hoạch mạng WiMAX trên địa hình 3D–GIS đã được chúng tôi xây dựng và giới thiệu tại bài báo [B] trong danh mục các công trình liên quan tới luận văn Bài báo gửi đăng tại tạp chí
Computer Networks, đã nhận được ý kiến phản biện, đang trong giai đoạn hoàn
thiện Nội dung bài toán được phát biểu như sau:
Trên một bản đồ địa hình ba chiều, bao gồm các vị trí có thể đặt được trạm thu phát sóng WiMAX BS và vị trí của người dùng trong vùng Mỗi trạm BS có thể gắn được một số sector vào những hướng khác nhau Sector gắn vào BS sẽ có độ phủ sóng khác nhau phụ thuộc vào địa hình tại vị trí đặt trạm Hãy lập kế hoạch xây dựng các BS thỏa mãn các tiêu chí sau:
- Độ phủ sóng cho người dùng lớn hơn một ngưỡng cho trước ,
- Chất lượng dịch vụ trung bình của người dùng lớn hơn một ngưỡng cho trước ,
- Quá tải cho phép trên một sector nhỏ hơn một ngưỡng cho trước ,
- Tối thiểu hóa số trạm BS và số sector
Trang 22Ncols và mỗi ô khoản cách có kích thước height, width Một bản đồ
U cho biết vị trí phân bố của người dùng trong vùng và một bản đồ Rock cho biết những vị trí có thể đặt trạm BS Lưu ý rằng bản đồ Rock được thành lập
từ địa hình T thông qua dữ liệu độ cao số DEM và phương pháp phân loại địa hình
- Các tham số mạng: Độ cao của BS và một số ngưỡng ( ,,) Giả sử độ cao của các cột BS là như nhau, và tất cả các sector là cùng một loại
MAXSERV là khả năng tín hiệu phục vụ tối đa của một sector, tính bằng dBm MAXQoS là tín hiệu tốt nhất mà một sector có thể cung cấp cho người dùng, tính bằng dBm
Output:
- Chất lượng kỹ thuật gồm cả Coverage và QoS
- Chi phí thấp nhất với số lượng BS và sector
- Hướng của các sector trên BS
Mô hình hóa:
- B {b1,b2,b3, ,b N} là tập các BS
} ,
, , , { b b b i max_i sec
x , , là vị trí của BS b i trên địa hình
h i là chiều cao của BS b i
Nmax_i sec là số lượng Sector cực đại có thể gắn trên BS b i
Trang 2311
- U u1,u2, ,u M là tập vị trí người dùng
} , , { u i u i u i
x , , là vị trí của người dùng u i trên địa hình
- S{s1 s2 sNsec} là tập các sector
} L , G T), , u , (s P , feq b
i là góc mở của ăngten, một trong các giá trị (60, 90, 120, 180) độ
i là hướng của ăngten với giá trị từ 0 đến 360 độ
feqi là tần số của sector s i, tính bằng MHz
Gi là độ lợi ăngten của sector s i, tính bằng dBi
Fade
i
L là hệ số suy giảm ăngten của sector s i, tính bằng dB
Prec(si, uk, T) là độ mạnh tín hiệu của sector s i tới người dùng u k trên địa hình T, được tính bằng dBm, được tính bằng công thức dưới đây [11]:
Fade i i k
i i k
Trang 24rec er
0
0 ) , , (
if 1 )
) ( cov cov
T u s P Max
j
u
i j rec s QoS
i j rec j
),,()
d F d F d
F d
F
N
N F
N
N F
M F
M F
N
j j Max
QoS erage
1 1
1 sec max_
sec 4
3
2
cov 1
) 1 ( )
1 (
Trang 25b b b
b b
b
D z
z y
y x
- Nếu phạm vi (10 – 12), (14) không được quy định, S không tồn tại và y i 0
trong b i và y j 0 trong u j do đó chúng tôi sử dụng mô hình của Taplin và các cộng sự [16] Ngoài ra, nếu không có công thức (9) thì mô hình của chúng tôi chính là mô hình của Carneiro và các cộng sự [9]
- Nếu giới hạn (10 – 12), (14) không được cung cấp thì công thức (9) không được bao gồm và S không tồn tại, y i 0 tại b i do đó mô hình trở về với mô hình của Admed [23] và Sapumohotti [6] Ngoài ra, nếu thay đổi hàm mục tiêu F F1F2 Max trong công thức (9) thì chúng ta nhận được mô hình của Abichar [25], Sebastiao [15] and Prommak & Wechtaison [5]
- Có hạn chế (14) và S không tồn tại, y i 0 ở b i và y j 0 ở u j thì chúng ta
sẽ được mô hình của Hu [19]
1.3.2 Tính toán chất lượng sóng trên địa hình 3D–GIS
Như chúng ta đã biết, sóng radio hay còn gọi là sóng vô tuyến là một kiểu bức xạ điện từ với bước sóng trong phổ điện từ dài hơn ánh sáng hồng ngoại Sóng
Trang 2614
vô tuyến truyền đi theo vận tốc ánh sáng và có tần số từ 3 kHz tới 300 GHz Trong quá trình truyền đi, sóng sẽ bị nhiễu xạ bởi những vật cản trên đường truyền sóng của nó và do đó làm cho độ suy hao tăng lên, chất lượng sóng giảm đi Trong trường hợp này thì công thức tính toán độ hao hụt sóng theo đường thẳng sẽ không chính xác nữa
Để có thể tính toán chất lượng sóng mà người dùng u j nhận được, trước hết chúng ta phải xác định được người dùng đó sẽ nhận được sóng từ trạm BS b i nào Sau đó các vật cản giữa một người dùng u j và trạm BS b i cần phải được xác định Thông qua tính khả kiến của hai điểm, ta có thể xác định được có bao nhiêu vật cản trên đường truyền từ b i đến u j và từ đó xác định được đâu là vật cản chính (vật cản
có độ cao lớn nhất) Đối với bài toán xác định tính khả kiến giữa hai điểm, chúng tôi xác định bằng cách chia độ dài đoạn thẳng nối hai điểm theo kích thước ô lưới với mỗi đoạn là height width/2 Việc tiếp theo chỉ cần xác định xem điểm chia
đó nằm trong ô lưới nào và xác định xem độ cao của điểm trong ô lưới có lớn hơn
độ cao của đường thẳng đó không Nếu độ cao lớn hơn tức ô lưới đó chính là vật cản Tọa độ của ô lưới đại diện cho vật cản được xác định như sau:
z
z
height height
1 2
z
z
height x
z
x
x
1 2
1 2
z
height x
x
1 2
1 2
Trang 2715
Với là phép chia lấy phần nguyên Công thức tính toán độ suy hao sóng từ sector s i (đặt trên BS b i) đến người dùng u j trên địa hình độ cao số T trong môi trường có vật cản sử dụng mô hình của Deygout [7] cải tiến như sau:
1),,u,RAD(s if )
,,
* 20 ) log(
* 20 4
i
R là khoảng cách từ BS b i chứa sector s i đến u j tính theo km và feq i là tần
số phát sóng của sector s i tính theo MHz
Hình 1.4: Mô hình tính toán độ suy hao trong trường hợp một vật cản
Hình 1.4 thể hiện mô hình tính toán độ suy hao khi có một vật cản, bao gồm:
- Độ cao của BS b i, vật cản và người dùng u j tương ứng là h1,h2,h3 ,
Trang 281 2 2 3 2 1 ' 2
) (
) (
) (
) (
d d h
h
h h d h h d h
' 2 ' 1
' 2 ' 1 ' 2 ' 2 ' 2 '
1 , , ) (
d d
d d h h d d
Với là bước sóng và v là hệ số phản xạ Fresnel của vật cản
Trong trường hợp có nhiều hơn một vật cản, chúng ta quy về mô hình một vật cản bằng cách như sau:
Trang 2917
- Xác định vật cản có độ cao lớn nhất giữa trạm phát sóng b i và vật cản chính Tính toán độ suy hao với mô hình trạm phát sóng b i, vật cản tìm được ở trên
Như vậy, độ suy hao sóng WiMAX trên địa hình sẽ được tính toán chi tiết và chúng ta sẽ xác định được chất lượng sóng mà người dùng sẽ nhận được Do đó, độ phủ sóng và chất lượng dịch vụ cho một phương án sẽ hoàn toàn được xác định
1.3.3 Một số nghiên cứu liên quan
Taplin và các tác giả khác [16] đã giới thiệu một số phương pháp lập kế hoạch mạng WiMAX một cách tự động trên bản đồ như FTP, BTP, Hill Climb (HC) và Tabu Search (TS) Hai thuật toán đầu tiên thuộc về cách tiếp cận tham Trong khi FTP cố gắng tăng hoặc giảm số sector trên mỗi BS để có thể tìm được phương án tốt nhất, BTP thì sắp xếp tất cả các BS theo thứ tự giảm dần về khả năng phục vụ người dùng và đặt các sector lần lượt lên nó để đảm bảo rằng mỗi người dùng được phục vụ bởi BS tốt nhất Hai thuật toán còn lại là thuật toán tìm kiếm theo lân cận Việc thử nghiệm trên ba bản đồ khác nhau đã chỉ ra rằng TS đạt được kết quả tốt nhất, tuy nhiên nó lại phải trả giá bằng thời gian tính toán lớn Ngược lại, BTP cho thời gian chạy khá nhanh với kết quả có thể chấp nhận đc Hu [19] đã đưa
ra một thuật toán lập kế hoạch mạng tự động dựa trên thuật toán di truyền bầy đàn Từng cá thể đại diện và hoạt động biến thể của gen được thiết kế để tìm ra cá thể tốt nhất Kết quả mô phỏng chỉ ra rằng thuật toán là mạnh đối với các kịch bản khác nhau của bài toán lập kế hoạch mạng và có khả năng tìm kiếm tốt hơn Tương tự như vậy, Hurley và các cộng sự [17], Tsourakis and Voudouris [18] và Zhang [22] cũng đề xuất một vài thuật toán lập kế hoạch mạng cho bài toán này Tuy nhiên, các
Trang 30cụ để tính toán hiệu năng mạng trên bản đồ sử dụng phần mềm ArcGIS và mô hình SUI Sebastiao và các cộng sự [15] sử dụng các làm lập kế hoạch mạng trong ArcGIS để tìm ra vị trí thích hợp đặt các trạm thu phát Wifi hay WiMAX với số lượng các thiết bị được cho trước Admed và các cộng sự [23] đã tổng hợp các mô hình tính toán độ suy hao như Okumura & Hata, ECC – 33 và SUI để thiết kế một công cụ lập kế hoạch mạng mới Sapumohotti và các cộng sự [6] nghiên cứu cả việc tính toán hiệu năng mạng và khoản cách giữa các BS bằng việc sử dụng một cài công cụ như Google Maps, SRTM Data and MATLAB Thậm chí nhiều phần mềm lập kế hoạch có một vài ưu điểm như thuận tiện và dễ sử dụng, tuy nhiên chúng không thể được mở rộng để nghiên cứu bài toán này bởi sự giới hạn về khả năng phân tích
Một vài nghiên cứu gần đây đã chú trọng nghiên cứu mở rộng bài toán này Abichar và các cộng sự [25] đã giới thiệu một mô hình cho việc xác định số lượng các trạm chuyển phát sóng và vị trí của chúng Prommak and Wechtaison [4] đã đề xuất một mô hình tuyến tính nguyên để giải quyết bài toán lập kế hoạch mạng cho các trạm chuyển tiếp (Multi-Hop) với mục tiêu là chi phí tốt và vị trí thích hợp Gong và các cộng sự [24] đã đề xuất một cải tiến của thuật toán tối ưu bầy đàn cho bài toán lập kế hoạch mạng phát hiện sóng radio Cải tiến này tập trung vào hàm loại bỏ các trạm đọc (TRE), giúp cho việc tối ưu hóa các trạm đọc mà vẫn đảm bảo được hiệu năng của mạng
Tổng hợp lại một số nghiên cứu liên quan như sau:
Trang 3119
- Tất cả các thuật toán trên được cài đặt trên các môi trường mô phỏng là bản
đồ hai chiều chứ không phải trên địa hình
- Các phương pháp lập kế hoạch thủ công được áp dụng hầu hết
- Các thuật toán chỉ tập trung vào một mục tiêu như là hiệu năng mạng hoặc chi phí xây dựng
- Một vài phương pháp đòi hỏi chi phí tính toán lớn và phức tạp, ví dụ như thuật toán TS
- Tất cả các thuật toán không chú ý đến vị trí trên bản đồ mà tại đó không thể đặt được BS lên như vùng hồ, sông
Trong luận văn này, chúng tôi giải quyết bài toán lập kế hoạch mạng trên địa hình 3D–GIS một cách tổng thể, bao gồm bước tiền xử lý là việc nhận dạng địa hình độ cao số, cho biết những vị trí có thể đặt được trạm thu phát sóng, tiếp đến là thuật toán lập kế hoạch mạng đặt các trạm thu phát trên địa hình Các kết quả của luận văn đã được nhóm nghiên cứu của chúng tôi trình bày trên hai công trình [A], [B] trong danh mục các công trình liên quan tới luận văn
1.4 Kết luận chương
Như vậy, chương 1 đã tổng quan một số vấn đề về 3D–GIS, WiMAX và mô hình hóa bài toán lập kế hoạch mạng trên 3D–GIS Đây là những kiến thức cơ sở chuẩn bị cho những nghiên cứu tiếp theo của bản luận văn này
Phần đầu của chương giới thiệu những khái niệm cơ bản về hệ thống thông tin địa lý ba chiều 3D-GIS, một số chuẩn cũng như đặc tính, dữ liệu của 3D-GIS, đặc biệt với hai loại dữ liệu điển hình là DEM và TIN
Tiếp theo là những vấn đề về mạng không dây WiMAX, các chuẩn của mạng
và các cấu hình mạng để có một cái nhìn tổng quan nhất về mạng này Qua những phân tích về cấu tạo, mô hình hoạt động của WiMAX chúng tôi có một số nhận xét
và đánh giá như sau:
Trang 3220
- Chuẩn WiMAX 802.16d có một số đặc điểm nổi trội hơn hai chuẩn 802.16 –
2001 và 802.16e Đó là: khả năng truyền trong tầm nhìn không thẳng NLOS,
độ phủ sóng lớn hơn, dải tần số cho phép cao hơn khi so với chuẩn 802.16 – 2001; khả năng phủ sóng cao hơn, dải tần số cho phép lớn hơn khi so với chuẩn 802.16e
- Trong hai mô hình hoạt động WiMAX là điểm - đa điểm và mạng mắt lưới, thì mô hình mạng mắt lưới có ưu điểm hơn là tránh được các nốt ẩn, tuy nhiên chi phí lắp đặt mạng này cao và phức tạp nên các nghiên cứu của luận văn tập trung vào mô hình mạng điểm - đa điểm
Nội dung chính của chương tập trung vào mô hình hóa bài toán lập kế hoạch mạng WiMAX trên 3D–GIS trên cơ sở sử dụng chuẩn WiMax 802.16d và mô hình hoạt động điểm - đa điểm và có tính đến độ suy hao sóng khi truyền phát trên địa hình Đây là những cơ sở quan trọng để tiến hành cải tiến các thuật toán lập kế hoạch mạng đảm bảo tính hiệu quả, sẽ được trình bày ở các chương tiếp theo
Trang 3321
Chương 2 – Nhận dạng địa hình độ cao số
2.1 Giới thiệu về bài toán nhận dạng địa hình độ cao số
Trước khi lập kế hoạch mạng WiMAX trên địa hình 3D–GIS, chúng ta cần phải nhận dạng được địa hình DEM – những vị trí có thể đặt trạm Chúng ta có thể thấy địa hình độ cao số có khá nhiều dạng khác nhau như sườn núi dốc, vùng sông,
hồ, đồng bằng, thung lũng, vv Vậy phải làm thế nào để nhận diện những khu vực như vậy trong khi đầu vào của bài toán chỉ là dữ liệu độ cao số DEM đơn thuần? Từ câu hỏi trên, chúng tôi đã tiến hành tìm hiểu về bài toán nhận dạng địa hình với mục đích để phân loại địa hình DEM Đây là một đóng góp quan trọng của nhóm nghiên cứu làm tiền đề cho bài toán phía sau
Trái đất được phân chia làm nhiều loại địa hình khác nhau, tuy nhiên có một
số loại địa hình chính như sau:
- Núi: là dạng địa hình phổ biến nhất của trái đất, nó là một vùng đất lồi, có sườn dốc và độ cao lớn ( 610m)
- Cao nguyên: là vùng đất phẳng, có độ cao khá lớn ( 500m)
- Đồi: là vùng đất lồi, có đỉnh tròn, sườn thoải, có độ cao khá thấp ( 200m) Đồi ít khi đứng riêng lẻ mà thường tập trung đứng thành vùng
- Đồng bằng: là một vùng đất rộng lớn với địa hình tương đối thấp, nghĩa là nó tương đối phẳng và độ cao 500m và độ dốc o
5
- Sông: là một dòng nước thường xuyên chảy, lưu lượng lớn, thường đổ ra biển và có độ cao cũng như độ dốc thấp, có bề mặt tương đối dài
- Hồ: là 1 vùng nước được bao quanh bởi đất liền
Trong nghiên cứu này chúng tôi chỉ nhận dạng 6 loại địa hình chính là: núi, đồi, sông, hồ, đồng bằng và cao nguyên
Vậy bài toán đặt ra là với một địa hình trong mô hình độ cao số được đại diện bởi một ma trận của các giá trị độ cao Thông qua một tập các dữ liệu đã được
Trang 34- Bước 1: Xây dựng một mô hình xác định một tập các lớp dữ liệu Mô hình
này được xây dựng bằng cách phân tích các dữ liệu của cơ sở dữ liệu, mỗi bộ
dữ liệu được xác định bằng giá trị của các thuộc tính Mô hình thu được sau khi phân tích xong tập dữ liệu thường có dạng những quy tắc phân lớp, cây quyết định và các công thức toán học
- Bước 2: Sử dụng mô hình phân lớp đã xây dựng ở Bước 1 để phân lớp dữ
liệu Bước này được chia làm 2 giai đoạn:
Đánh giá độ chính xác của mô hình hay bộ phân lớp bằng cách sử dụng một bộ mẫu đã được phân lớp để thử gọi là bộ thử, những mẫu này được xác định hoàn toàn ngẫu nhiên và độc lập Ta lần lượt so sánh các mẫu trong bộ thử, nếu lớp của mẫu đó thuộc vào trùng với lớp mà mô hình đó
dự đoán thì bộ phân lớp là chính xác với mẫu đó Ta xác định độ chính xác của bộ thử ban đầu
Nếu độ chính xác là chấp nhận được thì áp dụng mô hình phân lớp để phân lớp cho các bộ (mẫu) chưa được phân lớp
Ở quá trình xây dựng cây, chúng tôi định nghĩa một số tiêu chí cho việc phân loại của sáu loại địa hình trên Mỗi địa hình trong tập huấn luyện được duyệt với các tiêu chí để phân loại Các tiêu chí phân loại như sau:
- Biên: Là một tập các điểm bao ngoài của một vùng Về cơ bản thì số lượng
các điểm này nên đủ lớn để giúp cho việc phân lớp chính xác hơn Tuy vậy,
để giảm phức tạp tính toán, chúng tôi lưu một số lượng các điểm nhất định
Trang 3523
và sử dụng thuật toán BandWidth thích nghi [10] để xấp xỉ chúng vào một đường biên của đối tượng với một ngưỡng sai số cho trước
- Các giá trị nội tại:
Giá trị độ cao lớn nhất và nhỏ nhất của vùng Chú ý rằng một vùng là tập hợp của các điểm có giá trị độ cao
Góc giữa đường thẳng nối điểm cao nhất và thấp nhất của vùng với lưới chiếu của nó
Tọa độ x, y của điểm cao nhất của vùng
Số lượng và giá trị độ cao của các điểm trong vùng
- Lân cận: Thông tin về bốn vùng lân cận theo bốn hướng: Bắc, Nam, Đông và
Tây Đặc điểm này thể hiện mối quan hệ về không gian trên địa hình, ví dụ cao nguyên thì thường gần với đồng bằng hơn là sông
- Các tham số tham chiếu: Một số giá trị địa lý như lưới chiếu, mã của địa
hình trong hệ thống tham chiếu được sử dụng để chuyển tất cả các thuộc tính trên về một đơn vị chuẩn
Hình 2.1 dưới đây nêu rõ các đặc trưng của bài toán nhận dạng địa hình độ cao số thông qua một file dữ liệu dạng chuẩn XML (EXtensible Markup Language) Trước hết thẻ <ID> để chỉ ID của địa hình file DEM Tiếp theo các thẻ <Hmax> và
<Hmin> thể hiện các giá trị độ cao lớn và nhỏ nhất của địa hình này Tiếp đến là thẻ
<projection> thể hiện các tham số về lưới chiếu như tên lưới chiếu, đơn vị (unit), tự cầu (spheroid), vùng (zone)
Thẻ <object> thể hiện từng vùng trên địa hình DEM Thẻ <Classid> chỉ loại địa hình của vùng đó (các vùng núi, cao nguyên, đồi, đồng bằng, sông, hồ được đánh số từ 1 đến 6), <nvertices> thể hiện số điểm cần để khoanh vùng đó với các điểm cụ thể được thể hiện trong thẻ <point> <Hmax> và <Hmin> là giá trị độ cao lớn và nhỏ nhất của vùng <Slope> chỉ độ dốc còn <Center> là tọa độ tâm của vùng
<Density> là số điểm độ cao của vùng Tiếp đến <AdjEast>, <AdjWest>,
<AdjNorth>, <AdjSouth> chứa dạng địa hình của các vùng lân cận của vùng đang xét Ở đây, vùng phía đông là núi, vùng phía tây là cao nguyên, vùng phía bắc là đồi còn cùng phía nam là đồng bằng
Trang 3624
Hình 2.1: Ví dụ về các đặc trưng của việc nhận dạng địa hình độ cao số
2.3 Thuật tốn phân loại rừng ngẫu nhiên
Để thực hiện bài tốn này cĩ khá nhiều kỹ thuật phân lớp như: phương pháp dựa trên cây quyết định, dựa trên luật, dựa trên thể hiện, Nạve Bayes, mạng nơron, vv Tuy nhiên do đặc thù của bài tốn nên chúng tơi sử dụng phương pháp cây quyết định mà đặc biệt là Random Forest (RF) [12] cho cả hai quá trình là xây dựng cây và kiểm thử mơ hình
Random Forest được đề xuất lần đầu tiên bởi Breiman [12], một thuật tốn học máy dựa trên cây quyết định cho việc phân lớp ảnh vệ tinh và viễn thám Ưu điểm của thuật tốn ở chỗ nĩ lựa chọn tập huấn luyện một cách độc lập, độ chính
Trang 3725
xác cao, khá tốt trong việc tách và được hỗ trợ bởi một số công cụ hữu ích như công
cụ tính toán tầm quan trọng của biến và lỗi phân lớp Về bản chất, RF bao gồm một tập các cây quyết định, được xây dựng từ một tập con ngẫu nhiên của cơ sở dữ liệu gốc, và kết quả phân lớp cuối cùng phụ thuộc vào kết quả trả về nhiều nhất trong số tất cả các cây
Quá trình xây dựng các cây trong RF không cần phải tỉa nhánh, quá trình mà phần lớn các thuật toán cây quyết định truyền thống phải thực hiện Thậm chỉ độ chính xác phân lớp của RF còn tốt hơn những thuật toán cây phân loại truyền thống Đoạn mã giả dưới đây chỉ rõ các bước tạo một cây quyết định
Input: Dữ liệu XN,rvà số lượng cây - N trees
Output: N trees cây quyết định
Thuật toán Random Forest:
1: No_trees = 0
2: Repeat
3: No_trees = No_trees + 1
4: N child rand( 2 ,N) ; r child rand( 2 ,r)
5: Chọn N child dữ liệu ngẫu nhiên và r child thuộc tính ngẫu nhiên từ tập huấn luyện
6: Giả sử bảng hiện tại là S Phân chia mỗi thuộc tính và các lớp của nó trong bảng S thành các bảng con S với i i là một thuộc tính của bảng S
7: Tính giá trị Entropy của S :
giá trị trung bình đại diện cho S i j; j 1 ,k
9: Tính toán Gain(S,i) với i là một thuộc tính của S theo công thức:
) (
|
|
|
| )
( )
, (
A Values v
v
v Entropy S S
S S
Entropy A
S
Với Values ( A) là tập các giá trị có thể có của thuộc tính A , S v là một tập
con của S bao gồm các giá trị của các thuộc tính là A mang giá trị v
10: Chọn thuộc tính i có giá trị lớn nhất của Gain(S,i) là nút gốc
Trang 3826
11: Chia S thành các bảng con D j là miền giá trị của thuộc tính i
12: Nếu Entropy(D j) 0 thì lớp của tất cả dữ liệu trong D j là nút lá
13: Xóa thuộc tính i khỏi bảng S và thực hiện lại từ bước 6 tới bước 12 để lập
bảng mới cho đến khi giá trị Entropy của tất cả các bảng con bằng 0
14: Until No_trees = N trees
Cách xác định N trees
Giả sử: K là số lượng các lớp có trên tập dữ liệu huấn luyện Hiện chưa có công thức cụ thể nào cho việc xác định N trees bởi việc xác định này phụ thuộc rất nhiều vào tập huấn luyện Song theo đề xuất của Breiman [12], số lượng cây cần xây dựng được ước lượng theo công thức sau để hiệu suất phân loại là tốt hơn cả trong đa số các trường hợp: 2
K
N trees
Đánh giá độ phức tạp của thuật toán:
Giả sử T (n) là độ phức tạp của thuật toán với n là số biến (số thuộc tính trên tập huấn luyện) Trước hết, thuật toán sẽ cần thời gian là O (n) lấy ngẫu nhiên một tập thuộc tính trong tập n thuộc tính
Trường hợp tốt nhất: tất cả các bộ dữ liệu trên tập huấn luyện đều thuộc về cùng 1 lớp Tức Entropy(S)0, khi đó: T(n)O(n)O(1)O(n)
Trường hợp xấu nhất: Nếu Entropy(S)0, chọn thuộc tính tốt nhất trong số
n thuộc tính để phân chia tập huấn luyện và sau đó gọi đệ quy với các bảng con tương ứng thu được Ta có công thức truy hồi sau:
1
(
2 );
1 ( )
(
T
n n T n n
T
2
) 1 ( 1
) 1 (
) 1 ( ) 1 ( ) 1 (
Trang 3927
Do độ phức tạp của thuật toán cỡ O(n ) nên rõ ràng thời gian tính toán của
nó cũng thế mà tăng lên đáng kể khi n càng lớn Đây vẫn chính là nhược điểm của
RF Chính vì vậy, chúng tôi sẽ tăng tốc độ tính toán của thuật toán bằng việc song song hóa thuật toán RF song song Tức là thuật toán RF sẽ được tính toán đồng thời trên nhiều bộ xử lý Mỗi bộ xử lý sẽ đảm nhận việc sinh một số cây quyết định từ các tập con ngẫu nhiên của tập huấn luyện, đồng thời sẽ tìm kiếm lớp xuất hiện nhiều nhất trong tất cả các cây quyết định của bộ xử lý này trong tập kiểm tra Sau
đó toàn bộ kết quả thu được sẽ được tổng hợp bởi một bộ xử lý chủ rồi đưa ra kết quả phân lớp cuối cùng Nhờ các quá trình xây dựng và kiểm tra các cây quyết định được song song hóa, thời gian tính toán của toàn bộ thuật toán đã giảm đi đáng kể Các kết quả thực nghiệm của bài toán này được nhóm nghiên cứu trình bày rõ hơn trong [14]
Việc sử dụng thuật toán song song này hứa hẹn sẽ mang lại hiệu quả tốt trong việc phân loại dữ liệu địa hình, đặc biệt là việc nhận biết các địa hình khác nhau như sông, núi, hồ, đồng bằng, cao nguyên Thuật toán này sẽ hỗ trợ rất nhiều cho những bài toán lập kết hoạch mạng WiMAX trên địa hình ba chiều phía sau
2.4 Kết luận chương
Chương 2 đã trình bày mô hình hóa bài toán nhận dạng địa hình độ cao số Sau phần đặt bài toán, một phương pháp song song giải bài toán dựa trên thuật toán phân loại rừng ngẫu nhiên Random Forest đã được trình bày chi tiết Những kết quả của bài toán này là quan trọng trong giai đoạn tiền xử lý của bài toán lập kế hoạch mạng trên địa hình 3D – GIS sẽ được trình bày ở chương tiếp theo