Khái niện “không rõ ràng – mờ” là đặc trưng vốn có của dữ liệu địa lý và có thể sinh ra do: Thông tin tương ứng với chúng không đầy đủ; sự xuất hiện không ổn định khi thu thập; tập hợp
Trang 1TRƯỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THÔNG
NGUYỄN NHƯ QUỲNH
NGHIÊN CỨU MỘT SỐ THUẬT TOÁN TRONG GIS
ỨNG DỤNG LOGIC MỜ
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Thái Nguyên, 2012
Trang 2TRƯỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THÔNG
NGUYỄN NHƯ QUỲNH
NGHIÊN CỨU MỘT SỐ THUẬT TOÁN TRONG GIS
ỨNG DỤNG LOGIC MỜ
Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học: PGS TS Đặng Văn Đức
Thái Nguyên, 2012
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan bản luận văn “Nghiên cứu một số thuật toán trong
GIS ứng dụng logic mờ” là công trình nghiên cứu của tôi, dưới sự hướng dẫn
khoa học của PGS.TS Đặng Văn Đức, tham khảo các nguồn tài liệu đã được chỉ rõ trong trích dẫn và danh mục tài liệu tham khảo Các nội dung công bố
và kết quả trình bày trong luận văn này là trung thực và chưa từng được ai công bố trong bất cứ công trình nào
Thái Nguyên, tháng 8 năm 2012
Nguyễn Nhƣ Quỳnh
Trang 4Xin cảm ơn các bạn cùng lớp và đồng nghiệp nơi tôi công tác đã tạo điều kiện cho tôi hoàn thành luận văn này
Xin gửi lời cảm ơn tới gia đình tôi đã động viên tôi trong suốt quá trình học tập và hoàn thành luận văn
Trang 5MỤC LỤC
MỞ ĐẦU 1
Chương 1 TỔNG QUAN VỀ HỆ THỐNG THÔNG TIN ĐỊA LÝ VÀ LOGIC MỜ 3
1.1 Tổng quan về hệ thông tin địa lý 3
1.1.1 Định nghĩa về hệ thông tin địa lý 3
1.1.2 Biểu diễn dữ liệu địa lý 6
1.1.2.1 Các thành phần của dữ liệu địa lý 6
1.1.2.2 Mô hình biểu diễn dữ liệu không gian 11
1.1.3 Phân tích và xử lý dữ liệu không gian 13
1.1.3.1 Tìm kiếm theo vùng 14
1.1.3.2 Tìm kiếm lân cận 14
1.1.3.3 Phân tích đường đi và dẫn đường 14
1.1.3.4 Tìm kiếm hiện tượng và bài toán chồng phủ 15
1.1.3.5 Nắn chỉnh dữ liệu không gian 19
1.1.3.6 Tổng quát hóa dữ liệu không gian 19
1.1.4 Ứng dụng của hệ thông tin địa lý 20
1.2 Tổng quan về logic mờ 21
1.2.1 Giới thiệu 21
1.2.2 Tập mờ và các hàm thuộc 23
1.2.2.1 Khái niệm tập mờ 23
1.2.2.2 Các dạng hàm liên thuộc của tập mờ 26
1.2.3 Các phép toán logic 27
1.2.3.1 Phép hợp hai tập mờ 27
1.2.3.2 Phép giao hai tập mờ 28
1.2.3.3 Phép bù của một tập mờ 29
1.2.4 Hệ suy diễn mờ 29
Trang 6Chương 2 ỨNG DỤNG LOGIC MỜ TRONG HỆ THỐNG THÔNG
TIN ĐỊA LÝ 33
2.1 Giới thiệu 33
2.2 Nghiên cứu một số thuật toán trong GIS có ứng dụng logic mờ 38
2.2.1 Một số thuật toán tìm đường đi tối ưu ứng dụng trong GIS 38
2.2.1.1 Phát biểu bài toán 38
2.2.1.2 Thuật toán Dijkstra 39
2.2.1.3 Thuật toán Bellman-Ford 43
2.2.1.4 Thuật toán A* 45
2.2.1.5 Hàm heuristic 50
2.2.2 Ứng dụng logic mờ trong bài toán tìm đường 51
2.2.2.1 Thuật toán FSA 52
2.2.2.2 Thuật toán tìm đường đi ngắn nhất trên cơ sở số mờ 54
Chương 3 PHÁT TRIỂN CHƯƠNG TRÌNH THỬ NGHIỆM 60
3.1 Môi trường phát triển chương trình 60
3.2 Các chức năng của chương trình 60
3.3 Một số giao diện của chương trình 61
3.4 Một số kết quả thử nghiệm 62
KẾT LUẬN 66
TÀI LIỆU THAM KHẢO 68
Trang 7DANH MỤC CÁC HÌNH VẼ
Hình 1.1 Hệ thống thông tin địa lý 5
Hình 1.2 Tầng (layer) bản đồ 6
Hình 1.3 Ví dụ biểu diễn vị trí nước bị ô nhiễm 8
Hình 1.4 Ví dụ biểu diễn đường 8
Hình 1.5 Ví dụ biểu diễn khu vực hành chính 9
Hình 1.6 Biểu diễn vector của đối tượng địa lý 11
Hình 1.7 Biểu diễn thế giới bằng mô hình raster 12
Hình 1.8 Chồng phủ đa giác 16
Hình 1.9 Tiến trình phủ đa giác 18
Hình 1.10 Hàm phụ thuộc A (x) của tập kinh điển A 24
Hình 1.11 Hàm liên thuộc B (x) của tập “mờ” B 24
Hình 1.12 Độ cao, miền xác định, miền tin cậy của tập mờ 25
Hình 1.13 Hàm mờ tuyến tính 26
Hình 1.14 Hàm mờ hình sin 27
Hình 1.15 Hợp của hai tập mờ có cùng cơ sở 27
theo quy tắc Max (a); theo Lukasiewwiez (b) 27
Hình 1.16 Giao của hai tập mờ có cùng cơ sở 29
theo quy tắc Min (a) và theo tích đại số (b) 29
Hình 1.17 Bù của tập mờ 29
Hình 1.18 Mô hình tổng quát hệ suy diễn mờ 30
Hình 1.19 Quy trình xây dựng hệ suy diễn mờ 31
Hình 2.1 Tính chất không rõ ràng phát sinh khi xác định ranh giới 36
Hình 2.2 Đồ thị minh hoạ thuật toán Dijkstra 42
Hình 2.3 Đồ thị minh họa thuật toán Bellman-Ford 43
Hình 2.4 Đồ thị mờ G minh họa thuật toán FSA 53
Hình 2.5 Các đường đi mờ ngắn nhất của đồ thị mờ G 53
Trang 8Hình 2.6 Số mờ tam giác 55
Hình 2.7 Ví dụ mạng lưới 56
Hình 3.1 Giao diện chính của chương trình thử nghiệm 61
Hình 3.2 Giao diện chức năng nhập dữ liệu 61
Hình 3.3 Giao diện chức năng tính toán 62
Hình 3.4 Ví dụ mạng lưới 62
Hình 3.5 Nhập dữ liệu cho cung (1,2) 63
Hình 3.6 Kết quả thử nghiệm 64
Hình 3.7 Kết quả thử nghiệm với trường hợp không tồn tại đường đi 64
Hình 3.8 Kết quả thử nghiệm với đồ thị đầy đủ 65
Trang 9MỞ ĐẦU
Hệ thống thông tin địa lý (Geographic Information System – GIS) ra đời trên cơ sở phát triển của khoa học máy tính và được ứng dụng rộng rãi trong nhiều ngành khoa học có liên quan đến xử lý dữ liệu không gian GIS được hình thành từ những năm 70 của thế kỷ trước và phát triển mạnh mẽ trong một hai chục năm trở lại đây GIS đã trở thành công cụ hỗ trợ ra quyết định hầu hết trong các hoạt động kinh tế – xã hội, an ninh – quốc phòng, trong quản lý, quy hoạch, thăm dò, khai thác…
Đối với GIS, các dữ liệu thu thập thường không đầy đủ, không rõ ràng, không chắc chắn và mập mờ, điều đó dẫn đến dữ liệu và thông tin trong GIS
là dữ liệu “không rõ ràng” hay dữ liệu “mờ”
Phân tích dữ liệu không gian bằng cách kết hợp nhiều nguồn dữ liệu được khai thác từ các hệ thống thông tin địa lý là mục tiêu cao nhất của hầu hết các dự án GIS để diễn tả, phân tích các ảnh hưởng lẫn nhau, đưa ra các mô
hình dự báo và hỗ trợ ra quyết định Khái niện “không rõ ràng – mờ” là đặc
trưng vốn có của dữ liệu địa lý và có thể sinh ra do: Thông tin tương ứng với chúng không đầy đủ; sự xuất hiện không ổn định khi thu thập; tập hợp các dữ liệu thuộc tính; việc sử dụng các diễn tả định tính đối với các giá trị thuộc tính
và các mối quan hệ dữ chúng Các hệ GIS thường không sẵn sàng cho việc xử
lý với các dữ liệu mờ Vì thế cần phải có sự mở rộng cả về mô hình dữ liệu, các phép toán và lập luận để giải quyết với dữ liệu mờ trong GIS làm cho hệ thống trở nên mềm dẻo hơn trong việc giải các bài toán không gian mà dữ liệu của chúng là các dữ liệu dạng mờ
Theo phương pháp truyền thống khi xử lý, phân tích dữ liệu trong GIS các thao tác dữ liệu thực hiện một cách cứng nhắc đối với các thủ tục lập luận
và phân tích Quyết định tổng thể được thực hiện theo từng bước cụ thể và
Trang 10quy về kết quả ngay lập tức Những ứng viên nào thoả điều kiện được dữ lại
và các ứng viên không thoả điều kiện sẽ bị loại bỏ phụ thuộc vào giá trị ngưỡng Thêm vào đó các quyết định đưa ra là bắt buộc để biểu diễn các ràng buộc của chúng dưới dạng các điều kiện số học và các ký hiệu toán học trong các quan hệ rõ, chúng không cho phép sử dụng các điều kiện cú pháp dưới dạng ngôn ngữ tự nhiên Mặt khác kết quả lựa chọn dựa trên các điều kiện được xác định là ngang nhau, không có giá trị trọng số của các đối tượng
Một trong các phương pháp toán học nghiên cứu tính chất “không rõ
ràng” của không gian là lý thuyết tập mờ Zadeh (1965) Nó sử dụng độ thuộc
để diễn tả một cá thể tham gia trong một tập hợp Sự kết hợp lý thuyết tập mờ
và GIS là các đối tượng không gian “mờ” đều có đặc trưng chung là chúng có ranh giới “không rõ ràng” so với đối tượng không gian “rõ”
Lý thuyết tập mờ là giải pháp thích hợp nhất cho việc mô hình hoá dữ
liệu “không rõ ràng” và đưa ra cơ sở lý thuyết để hỗ trợ các lập luận trên dữ liệu này Vì vậy, học viên đã thực hiện luận văn: “Nghiên cứu một số thuật
toán trong GIS ứng dụng Logic mờ”
Trang 11Chương 1 TỔNG QUAN VỀ
HỆ THỐNG THÔNG TIN ĐỊA LÝ VÀ LOGIC MỜ
1.1 Tổng quan về hệ thông tin địa lý
Khái niệm Địa lý (Geography) đề cập lĩnh vực nghiên cứu mô tả Trái đất (Geo-Earth) Ngày nay, khái niệm này và khái niệm “không gian (Space)” được sử dụng thay thế nhau trong một số trường hợp Tuy nhiên, về mặt bản chất thì Địa lý là tập các mô tả về không gian (hai chiều), khí quyển (ba chiều), … của Trái đất Còn “không gian” là cho phép mô tả bất kỳ cấu trúc
đa chiều nào, không quan tâm đến vị trí địa lý của nó Như vậy có thể xem Địa lý như là một phần cấu trúc nhỏ trong tập cấu trúc “không gian”
Khi mô tả Trái đất, các nhà địa lý luôn đề cập đến quan hệ không gian (spatial relationship) của các đối tượng trong thế giới thực Mối quan hệ này được thể hiện thông qua các bản đồ (map) trong đó biểu diễn đồ họa của tập các đặc trưng trừu tượng và quan hệ không gian tương ứng trên bề mặt trái đất, ví dụ: bản đồ dân số biểu diễn dân số tại từng vùng địa lý
Dữ liệu bản đồ còn là loại dữ liệu có thể được số hóa Để lưu trữ và phân tích các số liệu thu thập được, cần có sự trợ giúp của hệ thông tin địa lý (Geographic Information System-GIS)
1.1.1 Định nghĩa về hệ thông tin địa lý
Có nhiều cách diễn giải khác nhau cho từ viết tắt GIS, tuy nhiên các cách diễn giải đó đều mô tả việc nghiên cứu các thông tin địa lý và các khía cạnh khác liên quan
GIS cũng giống như các hệ thống thông tin khác là có khả năng nhập, tìm kiếm và quản lý các dữ liệu lưu trữ, để từ đó đưa ra các thông tin cần thiết cho người sử dụng Ngoài ra, GIS còn cho phép lập bản đồ với sự trợ giúp của
Trang 12máy tính, giúp cho việc biểu diễn dữ liệu bản đồ tốt hơn so với cách truyền
thống Theo Khoa Địa lý, Trường Đại học Texas thì GIS là cơ sở dữ liệu số
chuyên dụng trong đó hệ trục tọa độ không gian là phương tiện tham chiếu chính GIS bao gồm các công cụ để thực hiện những công việc sau:
Nhập dữ liệu từ bản đồ giấy, ảnh vệ tinh, ảnh máy bay, số liệu điều tra và các nguồn khác
Lưu trữ dữ liệu, khai thác, truy vấn cơ sở dữ liệu
Biến đổi dữ liệu, phân tích, mô hình hóa, bao gồm cả dữ liệu thống kê và dữ liệu không gian
Lập báo cáo, bao gồm bản đồ chuyên đề, bảng biểu, biểu đồ và kế hoạch
Từ định nghĩa trên, ta thấy: Thứ nhất, GIS có quan hệ với ứng dụng cơ
sở dữ liệu Thông tin trong GIS đều liên kết với tham chiếu không gian và GIS sử dụng tham chiếu không gian như phương tiện chính để lưu trữ và truy nhập thông tin Thứ hai, GIS là công nghệ tích hợp, cung cấp các khả năng phân tích như phân tích ảnh máy bay, ảnh vệ tinh hay tạo lập mô hình thống
kê, vẽ bản đồ Cuối cùng, GIS có thể được xem như một hệ thống cho phép trợ giúp quyết định Cách thức nhập, lưu trữ, phân tích dữ liệu trong GIS phải phản ánh đúng cách thức thông tin sẽ được sử dụng trong công việc lập quyết định hay nghiên cứu cụ thể
Theo David Cowen, NCGIA, Mỹ thì GIS là hệ thống phần cứng, phần
mềm và các thủ tục được thiết kế để thu thập, quản lý, xử lý, phân tích, mô hình hóa và hiển thị các dữ liệu qui chiếu không gian để giải quyết các vấn đề quản lý và lập kế hoạch phức tạp
Một cách đơn giản, có thể hiểu GIS như một sự kết hợp giữa bản đồ (map) và cơ sở dữ liệu (database)
GIS = Bản đồ + Cơ sở dữ liệu
Trang 13Bản đồ trong GIS là một công cụ hữu ích cho phép chỉ ra vị trí của từng địa điểm Với sự kết hợp giữa bản đồ và cơ sở dữ liệu, người dùng có thể xem thông tin chi tiết về từng đối tượng/thành phần tương ứng với địa điểm trên bản đồ thông qua các dữ liệu đã được lưu trữ trong cơ sở dữ liệu Ví dụ, khi xem bản đồ về các thành phố, người dùng có thể chọn một thành phố để xem thông tin về thành phố đó như diện tích, số dân, thu nhập bình quân, số quận/huyện của thành phố, …
Độ phức tạp của thế giới thực là không gian hữu hạn Càng quan sát thế giới gần hơn càng thấy được chi tiết hơn Con người mong mỏi lưu trữ, quản
lý đầy đủ các dữ liệu về thế giới thực Nhưng sẽ dẫn đến phải có cơ sở dữ liệu lớn vô hạn để lưu trữ mọi thông tin chính xác về chúng Do vậy, để lưu trữ được dữ liệu không gian của thế giới thực vào máy tính thì phải giảm số lượng dữ liệu đến mức có thể quản lý được bằng tiến trình đơn giản hoá hay trừu tượng hoá (Hình 1.1) Trừu tượng là đơn giản hoá một cách thông minh Trừu tượng cho ta tổng quát hoá và “ý tưởng” hoá vấn đề đang xem xét Chúng loại bỏ đi các chi tiết dư thừa mà chỉ tập trung vào các điểm chính, cơ bản Các đặc trưng địa lý phải được biểu diễn bởi các thành phần rời rạc hay các đối tượng để lưu vào CSDL máy tính
Hình 1.1 Hệ thống thông tin địa lý
Trang 14GIS lưu trữ thông tin thế giới thực thành các tầng (layer) bản đồ chuyên
đề mà chúng có khả năng liên kết địa lý với nhau Giả sử ta có vùng quan sát như trên Hình 1.2
dụng tiến trình tự động, gọi là mã hoá địa lý (geocoding) để liên kết dữ liệu
bên ngoài với dữ liệu bản đồ Thí dụ sử dụng mã hoá địa lý để ánh xạ thông tin bán hàng bằng mã bưu điện (ZIP) hay chỉ ra địa chỉ khách hàng trên bản
đồ bằng các điểm
1.1.2 Biểu diễn dữ liệu địa lý
1.1.2.1 Các thành phần của dữ liệu địa lý
Trong GIS, dữ liệu được chia làm hai loại: thành phần không gian và thành phần phi không gian (thuộc tính) Hai loại thành phần dữ liệu này được kết hợp thông qua một chỉ số chung để mô tả một đối tượng thực Sự kết hợp này thể hiện đặc trưng không gian của đối tượng, nó cho phép:
Trang 15 Mô tả “vị trí, hình dạng”: vị trí tham chiếu, đơn vị đo, dạng hình học của thực thể địa lý
Mô tả “quan hệ và tương tác” giữa các thực thể địa lý: những thửa đất nào liền kề với khu công nghiệp ?
Mô tả “thông tin” của các đối tượng địa lý: ai là chủ sở hữu của thửa đất này?
a Thành phần không gian
Thành phần dữ liệu không gian hay còn gọi là dữ liệu bản đồ, là dữ liệu
về đối tượng mà vị trí của nó được xác định trên bề mặt trái đất Dữ liệu không gian sử dụng trong hệ thống địa lý luôn được xây dựng trên một hệ thống tọa độ, bao gồm tọa độ, quy luật và các ký hiệu dùng để xác định một hình ảnh bản đồ cụ thể trên mỗi bản đồ
Hệ thống GIS dùng thành phần dữ liệu không gian để tạo ra bản đồ hay hình ảnh bản đồ trên màn hình hoặc trên giấy thông qua thiết bị ngoại vi Mỗi
hệ thống GIS có thể dùng các mô hình khác nhau để mô hình hóa thế giới thực sao cho giảm thiểu sự phức tạp của không gian nhưng không mất đi các
dữ liệu cần thiết để mô tả chính xác các đối tượng trong không gian Hệ thống GIS hai chiều 2D dùng ba kiểu dữ liệu cơ sở sau để mô tả hay thể hiện các đối tượng trên bản đồ vector, đó là:
đồ, các vị trí của bệnh viện, các trạm rút tiền tự động ATM, các cây xăng,…
có thể được biểu diễn bởi các điểm
Hình 1.3 là ví dụ về vị trí nước bị ô nhiễm Mỗi vị trí được biểu diễn bởi 1 điểm gồm cặp tọa độ (x, y) và tương ứng với mỗi vị trí đó có thuộc tính
Trang 16độ sâu và tổng số nước bị nhiễm bẩn Các vị trí này được biểu diễn trên bản
đồ và lưu trữ trong các bảng dữ liệu
Hình 1.3 Ví dụ biểu diễn vị trí nước bị ô nhiễm
Ðường – Cung (Line - Arc)
Đường được xác định bởi dãy các điểm hoặc bởi 2 điểm đầu và điểm cuối (Hình 1.4) Đường dùng để mô tả các đối tượng địa lý dạng tuyến như đường giao thông, sông ngòi, tuyến cấp điện, cấp nước…
Hình 1.4 Ví dụ biểu diễn đường
Trang 17Các đối tượng được biểu diễn bằng kiểu đường thường mang đặc điểm
là có dãy các cặp tọa độ, các đường bắt đầu và kết thúc hoặc cắt nhau bởi điểm, độ dài đường bằng chính khoảng cách của các điểm Ví dụ, bản đồ hệ thống đường bộ, sông, đường biên giới hành chính, … thường được biểu diễn
bởi đường và trên đường có các điểm (vertex) để xác định vị trí và hình dáng
của đường đó
Vùng (Polygon)
Vùng được xác định bởi ranh giới các đường, có điểm đầu trùng với điểm cuối Các đối tượng địa lý có diện tích và được bao quanh bởi đường thường được biểu diễn bởi vùng
Các đối tượng biểu diễn bởi vùng có đặc điểm là được mô tả bằng tập
các đường bao quanh vùng và điểm nhãn (label point) thuộc vùng để mô tả,
xác định cho mỗi vùng Ví dụ, các khu vực hành chính, hình dạng các công viên, … được mô tả bởi kiểu dữ liệu vùng Hình 1.5 mô tả ví dụ cách lưu trữ một đối tượng vùng
Hình 1.5 Ví dụ biểu diễn khu vực hành chính
Một đối tượng có thể biểu diễn bởi các kiểu khác nhau tùy thuộc vào tỷ
lệ của bản đồ đó Ví dụ, đối tượng công viên có thể được biểu diễn bởi điểm trong bản đồ có tỷ lệ nhỏ, và bởi vùng trong bản đồ có tỷ lệ lớn
Trang 18b Thành phần phi không gian
Thành phần dữ liệu phi không gian hay còn gọi là dữ liệu thuộc tính, là những diễn tả đặc tính, số lượng, mối quan hệ của các hình ảnh bản đồ với vị trí địa lý của chúng thông qua một cơ chế thống nhất Hệ thống GIS có cơ chế liên kết dữ liệu không gian và phi không gian của cùng một đối tượng với nhau
Có thể nói, một trong những chức năng đặc biệt của công nghệ GIS chính là khả năng liên kết và xử lý đồng thời dữ liệu bản đồ và dữ liệu thuộc tính
Dữ liệu thuộc tính trong hệ thống GIS bất kỳ thường phân thành 4 loại sau:
Bộ xác định: có thể là một số duy nhất, liên tục, ngẫu nhiên hoặc chỉ
báo địa lý, số liệu xác định vị trí lưu trữ chung Bộ xác định cho một thực thể chứa tọa độ phân bố của nó, số hiệu mảnh bản đồ, mô tả khu vực hay con trỏ đến vị trí lưu trữ của số liệu liên quan Bộ xác định thường lưu trữ với các bản ghi tọa độ hay mô tả khác của hình ảnh không gian và các bản ghi số liệu thuộc tính liên quan
Số liệu hiện tượng, tham khảo địa lý: miêu tả thông tin danh mục, các
hoạt động liên quan đến các vị trí địa lý xác định (ví dụ như: cho phép xây dựng, báo cáo tai nạn, nghiên cứu y tế,…) Thông tin này được lưu trữ và quản
lý trong các tệp/ bảng độc lập, trong đó mỗi bản ghi chứa yếu tố xác định vị trí của sự kiện hay hiện tượng quản lý
Chỉ số địa lý: bao gồm tên, địa chỉ, khối, phương hướng định vị, …
liên quan đến các đối tượng địa lý Một chỉ số có thể bao gồm nhiều bộ xác định cho thực thể địa lý Ví dụ: chỉ số địa lý về đường phố và địa chỉ địa lý liên quan đến phố đó
Quan hệ giữa các đối tượng tại một vị trí địa lý cụ thể trong không
gian Đây là thông tin quan trọng cho các chức năng xử lý của hệ thống thông tin địa lý Các mối quan hệ không gian có thể là mối quan hệ đơn giản hay lôgic, ví dụ tiếp theo số nhà 101 phải là số nhà 103
Trang 191.1.2.2 Mô hình biểu diễn dữ liệu không gian
Như đã đề cập ở trên, dữ liệu địa lý bao gồm thành phần dữ liệu không gian và thành phần dữ liệu thuộc tính Ở phần này, chúng ta sẽ xem xét cách thức biểu diễn thành phần dữ liệu không gian trong hệ thông tin địa lý
Hệ thông tin địa lý biểu diễn các thực thể địa lý trong tự nhiên bằng dữ liệu của nó, hệ thống GIS chứa càng nhiều dữ liệu thì khả năng mang lại thông tin càng lớn Dữ liệu của GIS có được thông qua việc mô hình hóa các thực thể địa lý Mô hình biểu diễn dữ liệu địa lý là cách thức chúng ta biểu diễn trừu tượng các thực thể địa lý Mô hình biểu diễn dữ liệu địa lý đóng vai trò quan trọng vì cách thức biểu diễn thông tin sẽ ảnh hưởng tới khả năng thực hiện phân tích dữ liệu và khả năng hiển thị đồ họa của một hệ thống thông tin địa lý
Hai nhóm mô hình dữ liệu không gian thường gặp trong các hệ GIS thương mại là mô hình dữ liệu vector và mô hình dữ liệu raster
Mô hình vector
Mô hình vector sử dụng tọa độ 2 chiều (x, y) để lưu trữ hình khối của các thực thể không gian trên bản đồ 2D Mô hình này sử dụng các đặc tính rời rạc như điểm, đường, vùng để mô tả không gian, đồng thời cấu trúc topo của các đối tượng cũng cần được mô tả chính xác và lưu trữ trong hệ thống
Hình 1.6 Biểu diễn vector của đối tượng địa lý
Trang 20Theo Hình 1.6, các đối tượng không gian được lưu trữ dưới dạng vertor, đồng thời các thuộc tính liên quan đến lĩnh vực cần quản lý (dữ liệu
chuyên đề - thematic data) của đối tượng đó cũng cần kết hợp với dữ liệu
trên Các nhân tố chỉ ra sự tác động qua lại lẫn nhau giữa các đối tượng cũng được quản lý, các nhân tố đó có thể là quan hệ topo (giao/ không giao nhau, phủ, tiếp xúc, bằng nhau, chứa, …), khoảng cách và hướng (láng giềng về hướng nào)
Mô hình raster
Mô hình raster hay còn gọi mô hình dạng ảnh (image) biểu diễn các đặc tính dữ liệu bởi ma trận các ô (cell) trong không gian liên tục (Hình 1.7) Mỗi
ô có chỉ số tọa độ (coordinate) và các thuộc tính liên quan Mỗi vùng được
chia thành các hàng và cột, mỗi ô có thể là hình vuông hoặc hình chữ nhật và chỉ có duy nhất một giá trị
Hình 1.7 Biểu diễn thế giới bằng mô hình raster
Trên thực tế, chọn kiểu mô hình nào để biểu diễn bản đồ là câu hỏi luôn đặt ra với người sử dụng Việc lưu trữ kiểu đối tượng nào sẽ quyết định mô hình sử dụng Ví dụ nếu lưu vị trí của các khách hàng, các trạm rút tiền hoặc
dữ liệu cần tổng hợp theo từng vùng như vùng theo mã bưu điện, các hồ chứa nước,… thì sử dụng mô hình vector Nếu đối tượng quản lý được phân loại
Trang 21liên tục như loại đất, mức nước hay độ cao của núi,… thì thường dùng mô hình raster Đồng thời, nếu dữ liệu thu thập từ các nguồn khác nhau được dùng một mô hình nào đó thì có thể chuyển đổi từ mô hình này sang mô hình khác để phục vụ tốt cho việc xử lý của người dùng
Mỗi mô hình có ưu điểm và nhược điểm khác nhau Về mặt lưu trữ, việc lưu trữ giá trị của tất cả các ô/điểm ảnh trong mô hình raster đòi hỏi không gian nhớ lớn hơn so với việc chỉ lưu các giá trị khi cần trong mô hình vector Cấu trúc dữ liệu lưu trữ của raster đơn giản, trong khi vector dùng các cấu trúc phức tạp hơn Dung lượng lưu trữ trong mô hình raster có thể lớn hơn gấp 10 đến 100 lần so với mô hình vector Đối với thao tác chồng phủ, mô hình raster cho phép thực hiện một cách dễ dàng, trong khi mô hình vector lại phức tạp và khó khăn hơn Về mặt hiển thị, mô hình vector có thể hiển thị đồ họa vector giống như bản đồ truyền thống, còn mô hình raster chỉ hiển thị ảnh nên có thể xuất hiện hình răng cưa tại đường biên của các đối tượng tùy theo
độ phân giải của tệp raster Với dữ liệu vector, người dùng có thể bổ sung, co dãn hoặc chiếu bản đồ, thậm chí có thể kết hợp với các tầng bản đồ khác thuộc các nguồn khác nhau Hiện nay, mô hình vector được sử dụng nhiều trong các hệ thống GIS bởi các lý do trên, ngoài ra mô hình này cho phép cập
nhật và duy trì đơn giản, dễ truy vấn dữ liệu
1.1.3 Phân tích và xử lý dữ liệu không gian
Các phép phân tích và xử lý dữ liệu không gian là một trong năm yếu tố cấu thành nên một hệ thông tin địa lý Mục này đề cập đến một số phép phân tích xử lý dữ liệu cơ bản nhất của một hệ GIS Các thao tác trên dữ liệu không gian thường chia làm hai lớp bài toán cơ bản là các bài toán về tìm kiếm và phân tích không gian và các bài toán về xử lý dữ liệu không gian
Lớp bài toán tìm kiếm và phân tích không gian: bao gồm các bài toán liên quan đến việc khai thác thông tin và tri thức từ dữ liệu không gian Ví dụ
Trang 22như bài toán tìm kiếm đối tượng trên bản đồ theo thuộc tính, bài toán phân tích đường đi, tìm đường…
Lớp bài toán xử lý dữ liệu không gian: bao gồm các bài toán thao tác trực tiếp tới khuôn dạng, giá trị của dữ liệu không gian, làm thay đổi dữ liệu không gian Ví dụ như các thao tác nắn chỉnh dữ liệu, tổng quát hóa dữ liệu, chuyển đổi hệ tọa độ, chuyển đổi khuôn dạng dữ liệu…Dưới đây đề cập khái quát một số phép phân tích và xử lý dữ liệu không gian chính
1.1.3.1 Tìm kiếm theo vùng
Là phép phân tích không gian đơn giản nhất, phép phân tích này thực hiện tìm kiếm đối tượng bản đồ trong một vùng không gian cho trước Vùng này có thể là một cửa sổ hình chữ nhật Đây là phép truy vấn không gian cơ bản trong GIS, tuy nhiên mức độ phức tạp của nó cao hơn truy vấn query trong cơ sở dữ liệu cổ điển bởi khả năng cắt xén đối tượng nếu đối tượng đó chỉ nằm một phần trong cửa sổ truy vấn
1.1.3.2 Tìm kiếm lân cận
Phép phân tích này thực hiện tìm kiếm các đối tượng địa lý trong vùng cận kề với một hoặc một tập đối tượng địa lý biết trước Có một vài kiểu tìm kiếm cận kề như:
Tìm kiếm trong vùng mở rộng (vùng đệm) của một đối tượng: Ví dụ: Tìm các trạm thu phát sóng điện thoại di động BTS nằm trong vùng phủ sóng của một trạm BTS nào đó
Tìm kiếm liền kề: Ví dụ như tìm các thửa đất liền kề với thửa đất X nào đó
1.1.3.3 Phân tích đường đi và dẫn đường
Phân tích đường đi là tiến trình tìm đường đi ngắn nhất, giá rẻ nhất giữa hai vị trí trên bản đồ Giải pháp cho bài toán này dựa trên việc sử dụng
mô hình dữ liệu mạng hay mô hình dữ liệu raster trên cơ sở lưới vùng Mô
Trang 23hình dữ liệu mạng lưu trữ đối tượng đường đi dưới dạng cung và giao của chúng dưới dạng nút, việc tìm đường bao gồm việc duyệt qua các đường đi từ điểm đầu tới điểm cuối qua các cung nút và chỉ ra cung đường nào ngắn nhất Trong mô hình raster, việc tìm đường thực hiện bởi sự dịch chuyển từ một tế bào sang tế bào lân cận của nó
1.1.3.4 Tìm kiếm hiện tượng và bài toán chồng phủ
Việc tìm kiếm hiện tượng trong GIS bao gồm tìm kiếm hiện tượng độc lập hoặc tìm kiếm tổ hợp các hiện tượng
Tìm kiếm hiện tượng độc lập là bài toán đơn giản, chỉ bao hàm tìm kiếm một hiện tượng, thực thể mà không quan tâm đến một hiện tượng, thực thể khác Việc tìm kiếm đơn giản chỉ là truy nhập dữ liệu không gian dựa trên thuộc tính đã xác định trước Ví dụ như tìm các tỉnh, thành phố có dân số lớn hơn 2 triệu người…
Tìm kiếm tổ hợp thực thể là bài toán phức tạp hơn, nhưng lại là bài toán hấp dẫn và là thế mạnh của GIS, việc tìm kiếm liên quan đến nhiều thực thể hay lớp thực thể, chẳng hạn, tính diện tích đất nông nghiệp của quận Thanh Trì, Hà Nội Bài toán này đòi hỏi phải tổ hợp 2 lớp thực thể địa lý là lớp đất nông nghiệp của thành phố Hà Nội và lớp ranh giới hành chính thành phố Hà Nội Kiểu bài toán này trong GIS gọi là bài toán chồng phủ bản đồ
Bài toán chồng phủ bản đồ
Như trên đã đề cập, nhiều vấn đề trong GIS đòi hỏi sử dụng lớp chồng xếp của các lớp dữ liệu chuyên đề khác nhau Chẳng hạn như chúng ta muốn biết vị trí của các căn hộ giá rẻ nằm trong khu vực gần trường học; hay khu vực nào là các bãi thức ăn của cá voi trùng với khu vực có tiềm năng dầu khí lớn có thể khai thác; hoặc là vị trí các vùng đất nông nghiệp trên các khu vực đất đai bị xói mòn,… Trong ví dụ liên quan đến đất xói mòn trên, một lớp
dữ liệu đất đai có thể được sử dụng để nhận biết các khu vực đất đai bị xói mòn, đồng thời lớp dữ liệu về hiện trạng sử dụng đất cũng được sử dụng để
Trang 24nhận biết vị trí các vùng đất sử dụng cho mục đích nông nghiệp Thông thường thì các đường ranh giới của vùng đất bị xói mòn sẽ không trùng với các đường ranh giới của các vùng đất nông nghiệp, do đó, dữ liệu về loại đất và sử dụng đất sẽ phải được kết hợp lại với nhau theo một cách nào đó Chồng phủ bản đồ chính là phương tiện hàng đầu hỗ trợ việc thực hiện phép kết hợp dữ liệu đó
Theo mô hình vector, các đối tượng địa lý được biểu diễn dưới dạng các điểm, đường và vùng Vị trí của chúng được xác định bởi các cặp tọa độ
và thuộc tính của chúng được ghi trong các bảng thuộc tính
Với từng kiểu bản đồ, người ta phân biệt ba loại chồng phủ bản đồ vector sau:
Chồng phủ đa giác trên đa giác
Chồng phủ đa giác là một thao tác không gian trong đó một lớp bản đồ chuyên đề dạng vùng chứa các đa giác được chồng xếp lên một lớp khác để hình thành một lớp chuyên đề mới với các đa giác mới Mỗi đa giác mới là một đối tượng mới được biểu diễn bằng một dòng trong bảng thuộc tính Mỗi đối tượng
có một thuộc tính mới được biểu diễn bằng một cột trong bảng thuộc tính
Hình 1.8 Chồng phủ đa giác
Trang 25Việc chồng phủ và so sánh hai bộ dữ liệu hình học có nguồn gốc và độ chính xác khác nhau thường sinh ra một số các đa giác nhỏ Các đa giác này có thể được loại bỏ theo diện tích, hình dạng và các tiêu chuẩn khác Tuy nhiên, trong thực tế, khó đặt ra các giới hạn để giảm được số đa giác nhỏ không mong muốn đồng thời giữ lại các đa giác khác có thể nhỏ hơn nhưng hữu ích
Chồng phủ điểm trên đa giác
Các đối tượng điểm cũng có thể được chồng xếp trên các đa giác Các điểm sẽ được gán các thuộc tính của đa giác mà trên đó chúng được chồng lên Các bảng thuộc tính sẽ được cập nhật sau khi tất cả các điểm được kết hợp với đa giác
Chồng phủ đường trên đa giác
Các đối tượng đường cũng có thể được chồng xếp trên các đa giác để tạo
ra một bộ các đường mới chứa các thuộc tính của các đường ban đầu và của các đa giác Cũng như trong chồng xếp đa giác, các điểm cắt được tính toán, các nút và các liên kết được hình thành, topo được thiết lập và cuối cùng là các bảng thuộc tính được cập nhật
Minh họa cụ thể cho vấn đề chồng xếp bản đồ chúng ta sẽ xét tới tiến trình phủ đa giác Tiến trình này được minh họa bởi hình 1.9
Trang 26Hình 1.9 Tiến trình phủ đa giác
Tiến trình tổng quát của phủ đa giác là tạo ra các đa giác mới từ các đa giác cho trước bao gồm các bước nhỏ sau:
Nhận dạng các đoạn thẳng
Lập chữ nhật bao tối thiểu đa giác
Khẳng định các đoạn thẳng của một đa giác thuộc lớp bản đồ này ở
trong đa giác của lớp bản đồ khác (phủ) bằng tiến trình “điểm trong đa giác”
Tìm giao của các đoạn thẳng là cạnh đa giác
Lập các bản ghi cho đoạn thẳng mới và lập quan hệ topo của chúng
Trang 27 Lập các đa giác mới từ các đoạn thẳng phù hợp
Gán lại nhãn và các dữ liệu thuộc tính nếu có cho đa giác
1.1.3.5 Nắn chỉnh dữ liệu không gian
Dữ liệu bản đồ ngoài việc được kiểm tra độ chính xác về mặt hình học còn cần được kiểm tra hiệu chỉnh về độ chính xác không gian Các sai lệch về mặt không gian thường phát sinh trong quá trình đo đạc hoặc số hoá bản đồ giấy, dẫn đến việc toạ độ các điểm trên bản đồ không trùng khớp với toạ độ
đo thực địa, do đó cần có thao tác nắn chỉnh toạ độ bản đồ
Có nhiều phương pháp nắn chỉnh bản đồ, một phương pháp phổ biến là
phương pháp sử dụng điểm điều khiển mặt đất, hay còn gọi là phương pháp
tấm cao su Phương pháp này dựa trên ý tưởng là chọn một số điểm thực tế
trên mặt đất, đo đạc chính xác tọa độ của điểm đó, dùng các điểm này làm điểm khống chế Đối chiếu với bản đồ để tìm ra các điểm tương ứng với các điểm khống chế, thường chọn các điểm khống chế là những điểm dễ đánh dấu mốc, ví dụ như các ngã tư, giao lộ, sân bay, bờ biển để có thể dễ dàng tìm thấy điểm tương ứng trên bản đồ Lúc này, việc nắn chỉnh bản đồ tương đương với việc làm biến dạng bản đồ để đưa các điểm tương ứng về trùng với các điểm khống chế Ta có thể tưởng tượng cả bản đồ giống như một tấm cao
su, sử dụng các đinh ghim cắm tại các điểm tương ứng với điểm khống chế, sau đó dịch chuyển các đinh ghim này về đúng vị trí của các điểm khống chế, khi đó, cả bản đồ sẽ như một tấm cao su bị co kéo bởi các đinh ghim để về đúng tọa độ thực tế Như vậy, cần có một hàm số để biến đổi toàn bộ các giá trị của các điểm bản đồ sang giá trị mới sao cho các điểm tương ứng với điểm
khống chế trở về gần điểm khống chế nhất
1.1.3.6 Tổng quát hóa dữ liệu không gian
Với một bản đồ có tỷ lệ nhất định, nhu cầu biểu diễn chi tiết các đối tượng là khác nhau tùy thuộc vào mục đích sử dụng và khai thác thông tin từ
Trang 28bản đồ đó Ví dụ: với các ứng dụng không đòi hỏi độ chính xác tọa độ của đối tượng bản đồ mà chỉ quan tâm đến mối quan hệ không gian giữa các đối tượng bản đồ thì việc đơn giản hóa dữ liệu bản đồ, giúp giảm không gian lưu trữ và tăng tốc độ xử lý bản đồ là cần thiết Việc giản lược dữ liệu bản đồ trong GIS gọi là tổng quát hóa dữ liệu Việc giản lược dữ liệu ở đây không làm ảnh hưởng tới số lượng đối tượng bản đồ mà chỉ làm đơn giản dữ liệu biểu diễn của từng đối tượng bản đồ đó, cụ thể là giảm bớt số lượng điểm biểu diễn đối tượng bản đồ Việc giản lược dữ liệu đương nhiên sẽ ảnh hưởng đến
độ chi tiết hay nói cách khác độ chính xác của bản đồ Do đó mức độ giản lược cần được khảo sát và tính toán sao cho dung hòa được 2 yếu tố: dung lượng và sai số của bản đồ
Có nhiều thuật toán sử dụng cho việc đơn giản hóa đường cong như thuật toán Lang, thuật toán Reumann và Witkam, giải thuật Douglas-Peucker, thuật toán đơn giản hóa đường cong phân cấp Cromley
1.1.4 Ứng dụng của hệ thông tin địa lý
Các lĩnh vực liên quan với hệ thông tin địa lý
Công nghệ GIS được sử dụng trong nhiều lĩnh vực khác nhau như bản đồ học, đầu tư, quản lý nguồn tài nguyên, quản lý tài sản, khảo cổ học
(archaeology), phân tích điều tra dân số, đánh giá sự tác động lên môi trường,
kế hoạch đô thị, nghiên cứu tội phạm,… Việc trích rút thông tin từ dữ liệu địa
lý thông qua hệ thống GIS bao gồm các câu hỏi cơ bản sau:
Nhận diện (identification): Nhận biết tên hay các thông tin khác của
đối tượng bằng việc chỉ ra vị trí trên bản đồ Ví dụ, có cái gì tại tọa độ (X, Y)
Vị trí (location): Câu hỏi này đưa ra một hoặc nhiều vị trí thỏa mãn
yêu cầu Nó có thể là tập tọa độ hay bản đồ chỉ ra vị trí của một đối tượng cụ thể, hay toàn bộ đối tượng Ví dụ, cho biết vị trí các văn phòng của công ty nào đó trong thành phố
Trang 29 Xu thế (trend): Câu hỏi này liên quan đến các dữ liệu không gian tạm
thời Ví dụ, câu hỏi liên quan đến xu hướng phát triển thành thị dẫn tới chức năng hiển thị bản đồ của GIS để chỉ ra các vùng lân cận được xây dựng từ
1990 đến 2000
Tìm đường đi tối ưu (optimal path): Trên cơ sở mạng lưới đường đi
(hệ thống đường bộ, đường thủy ), câu hỏi là cho biết đường đi nào là tối ưu nhất (rẻ nhất, ngắn nhất, ) giữa 2 vị trí cho trước
Mẫu (pattern): Câu hỏi này khá phức tạp, tác động trên nhiều tập dữ
liệu Ví dụ, cho biết quan hệ giữa khí hậu địa phương và vị trí của các nhà
máy, công trình công cộng trong vùng lân cận
Mô hình (model): Câu hỏi này liên quan đến các hoạt động lập kế
hoạch và dự báo.Ví dụ, cần phải nâng cấp, xây dựng hệ thống mạng lưới giao thông, điện như thế nào nếu phát triển khu dân cư về phía bắc thành phố
1.2 Tổng quan về logic mờ
1.2.1 Giới thiệu
Trong cuộc sống, con người truyền thông tin cho nhau chủ yếu bằng ngôn ngữ tự nhiên, ngôn ngữ tự nhiên thường đa nghĩa hoặc thậm chí có lúc còn thiếu tính chính xác, nhưng nó vẫn là phương tiện chính mà con người dùng
để truyền thông tin cho nhau Với khả năng đặc biệt của mình con người thường vượt qua những hạn chế của ngôn ngữ tự nhiên (đa nghĩa, thiếu chính xác, không rõ ràng) và thường là hiểu đúng các thông tin nhận được Đây là điều mà máy tính chưa thực hiện được Tham vọng của các nhà khoa học là mong muốn máy tính có khả năng hiểu được ngôn ngữ tự nhiên, có khả năng suy diễn, có khả năng xử lý thông tin tương tự như bộ óc con người, để con người có thể ra lệnh cho máy móc bằng ngôn ngữ tự nhiên, yêu cầu đến sự trợ giúp của máy tính mà qua đó đòi hỏi máy tính phải xử lý các dữ liệu mang
Trang 30nhiều ý nghĩa khác nhau, có khi chúng thiếu tính chính xác, chưa được xác định một cách rõ ràng giống như ngôn ngữ tự nhiên
Ví dụ như chúng ta có thể yêu cầu máy tính chỉ ra một đường đi “tốt nhất” để đi từ vị trí A đến vị trí B nào đó Việc có tồn tại một đường đi từ A đến B hay không thường là có thể được xác định một cách rõ ràng, thậm trí có thể chỉ ra nhiều đường đi khác nhau từ A đến B Vấn đề là xác định con đường nào là đường “tốt nhất” để đi từ A đến B? Ở đây ngay mệnh đề “tốt nhất” bản thân đã không được xác định một cách rõ ràng, thế nào là tốt nhất? Một con đường tốt có thể là con đường ngắn nhất nhưng cũng có thể không phải vậy Nếu đường đi ngắn nhưng dễ xảy ra tắc đường thì chưa hẳn đã “tốt” thậm chí còn “tệ” hơn con đường dài hơn nhưng luôn thông suốt Độ tốt của con đường phụ thuộc vào nhiều yếu tố, có những yếu tố cố định và xác định được ngay từ đầu, nhưng cũng có những yếu tố khác như tắc đường, sự cố bất thường khiến đường đi bị nghẽn,… ảnh hưởng đến đường đi
Để máy tính có thể hiểu và xử lý được những tri thức diễn đạt bằng ngôn ngữ tự nhiên, người ta cần phải xây dựng một lý thuyết logic toán cho phép
mô tả chính xác ý nghĩa của các mệnh đề không rõ ràng, đa nghĩa chẳng hạn như: đường tốt, đường rộng, đường hẹp, giàu, nghèo, đắt, rẻ,… Năm 1965 Lotfi Zadeh, một nhà toán học và cũng là nhà logic học người Mỹ, đã xây dựng thành công lý thuyết tập mờ và hệ thống logic mờ Công trình này của Lotfi Zadeh cho phép người ta có thể lượng hoá giá trị các mệnh đề mờ, qua
đó có thể truyền đạt một số thông tin cho máy tính bằng ngôn ngữ tự nhiên,
có thể yêu cầu máy tính xử lý các dữ liệu mang nhiều thông tin, có thể là thiếu chính xác, không rõ ràng
Để thực thi logic của con người trong kỹ thuật cần phải có một mô hình toán học của nó Từ đó logic mờ ra đời như một mô hình toán học cho phép
mô tả các quá trình quyết định và ước lượng của con người theo dạng giải
Trang 31thuật Dĩ nhiên có cũng có giới hạn; đó là logic mờ không thể bắt chước trí tưởng tượng và khả năng sáng tạo của con người Tuy nhiên, logic mờ cho phép ta rút ra kết luận khi gặp những tình huống không có mô tả trong luật nhưng có sự tương đương Vì vậy, nếu ta mô tả những mong muốn của mình đối với hệ thống trong những trường hợp cụ thể vào luật thì logic mờ sẽ tạo ra
giải pháp dựa trên tất cả những mong muốn đó
Cho một tập hợp A, một phần tử x thuộc A được ký hiệu: x A Thông thường ta dùng hai cách để biểu diễn tập hợp kinh điển, đó là:
Liệt kê các phần tử của tập hợp, ví dụ tập A1 = {xe đạp, xe máy, xe ca,
A x khi 1 ) x
(
A A(x) chỉ nhận một trong 2 giá trị “1” hoặc “0”
Ký hiệu A = {xX| x thoả mãn một số tính chất nào đó} Ta nói: Tập
A được định nghĩa trên tập nền X
Trang 32Hình 1.10 Hàm phụ thuộc A (x) của tập kinh điển A
Hình 1.10 mô tả hàm phụ thuộc A(x) của tập các số thực từ -5 đến 5
A = {xR-5 x 5}
b Định nghĩa tập mờ [4]
Trong khái niệm tập hợp kinh điển hàm phụ thuộc A(x) của tập A, chỉ
có một trong hai giá trị là “1” nếu xA hoặc “0” nếu xA
Cách biểu diễn hàm phụ thuộc như trên sẽ không phù hợp với những tập được mô tả “mờ” như tập B gồm các số thực gần bằng 5:
B = {xRx 5}
Khi đó ta không thể khẳng định chắc chắn số 4 có thuộc B hay không?
mà chỉ có thể nói nó thuộc B bao nhiêu phần trăm Để trả lời được câu hỏi này, ta phải coi hàm phụ thuộc B(x) có giá trị trong khoảng từ 0 đến 1 tức là:
0 B(x) 1
Hình 1.11 Hàm liên thuộc B (x) của tập “mờ” B
Trang 33Từ phân tích trên ta có định nghĩa: Tập mờ B xác định trên tập kinh
điển M là một tập mà mỗi phần tử của nó được biểu diễn bởi một cặp giá trị (x, B (x)) Trong đó x M và B (x) là ánh xạ
Ánh xạ B(x) được gọi là hàm liên thuộc của tập mờ B (Hình 1.11) Tập kinh điển M được gọi là cơ sở của tập mờ B
c Các thông số đặc trưng cho tập mờ
Các thông số đặc trưng cho tập mờ là độ cao, miền xác định và miền tin cậy (Hình 1.12)
Hình 1.12 Độ cao, miền xác định, miền tin cậy của tập mờ
Độ cao của một tập mờ B (Định nghĩa trên cơ sở M ) là giá trị lớn
nhất trong các giá trị của hàm liên thuộc:
H = B( x )
M x
Một tập mờ có ít nhất một phần tử có độ phụ thuộc bằng 1 được gọi là tập mờ chính tắc (H = 1) Ngược lại, một tập mờ B với H < 1 gọi là tập mờ không chính tắc
Miền xác định của tập mờ B (Định nghĩa trên cơ sở M) được ký hiệu
bởi S là tập con của M có giá trị hàm liên thuộc khác không:
S = {xMB(x) > 0}
Trang 34Miền tin cậy của tập mờ B (Định nghĩa trên cơ sở M) được ký hiệu
bởi T, là tập con của M có giá trị hàm liên thuộc bằng 1
T = {xMB(X) = 1 }
1.2.2.2 Các dạng hàm liên thuộc của tập mờ
Chúng ta biết hai kiểu hàm mờ: Kiểu hàm mờ tuyến tính và kiểu hàm mờ hình sin Hàm mờ tuyến tính có bốn tham số xác định hình dạng của hàm:
Hình 1.13 Hàm mờ tuyến tính
Bằng việc lựa chọn giá trị thích hợp a, b, c, d chúng ta có thể tạo các hàm với các hình dạng khác nhau như: hình thang, hình tam giác, hình chữ L, hình chữ S
Để chính xác hơn không bị gấp khúc tại các nút ta sử dụng hàm mờ hình sin Giống như với hàm tuyến tính hình dạng của nó cũng có thể là hình chữ S, hình L, hình chuông và cũng có bốn tham số thích hợp theo hình vẽ sau:
Trang 351 A B(x) = Max{A(x), B(x)}
2 (x) = min{1, (x) + (x)} phép hợp Lukasiewiez)
Trang 360 ) x ( ), x ( min khi ) x ( ), x ( max
B A
B A B
A
4 A B(x) =
) x ( ) x ( 1
) x ( ) x (
B A
B A
Chú ý: có nhiều công thức khác nhau được dùng để tính hàm liên thuộc
A B(x) của hai tập mờ Song trong kỹ thuật điều khiển mờ ta chủ yếu dùng hai công thức hợp, đó là lấy Max và phép hợp Lukasiewiez
b Hợp hai tập mờ khác cơ sở
Để thực hiện phép hợp 2 tập mờ khác cơ sở, về nguyên tắc ta phải đưa chúng về cùng một cơ sở Xét tập mờ A với hàm liên thuộc A(x) được định nghĩa trên cơ sở M và B với hàm liên thuộc B(y) được định nghĩa trên cơ sở
N, hợp của 2 tập mờ A và B là một tập mờ xác định trên cơ sở MN với hàm liên thuộc: A B(x,y) = Max{A(x,y), B(x,y)}
Với A(x,y) = A(x) với mọi y N và B(x,y) = B(y) với mọi x M
1.2.3.2 Phép giao hai tập mờ
a Giao hai tập mờ cùng cơ sở
Giao của hai tập mờ A và B có cùng cơ sở M là một tập mờ cũng xác định trên cơ sở M với hàm liên thuộc A B(x) được tính:
1 ) x ( ), x ( min khi ) x ( ), x ( min
B A
B A B
A
4 A B(x) = max{0, A(x)+B(x)-1} (Phép giao Lukasiewiez)
5 A B(x) =
) x ( ) x ( )) x ( ) x ( ( 2
) x ( ).
x (
B A B
A
B A
Trang 37Hình 1.16 Giao của hai tập mờ có cùng cơ sở theo quy tắc Min (a) và theo tích đại số (b)
Cũng giống như trong phép hợp, ta thường sử dụng công thức 1 và công thức 2 để thực hiện phép giao 2 tập mờ
b Giao hai tập mờ khác cơ sở
Để thực hiện phép giao 2 tập mờ khác cơ sở, ta cần phải đưa về cùng cơ
sở Khi đó, giao của tập mờ A có hàm liên thuộc A(x) định nghĩa trên cơ sở
M với tập mờ B có hàm liên thuộc B(x) định nghĩa trên cơ sở N là một tập
mờ xác định trên cơ sở MN có hàm liên thuộc được tính:
A B(x,y) = MIN{A(x,y),B(x,y)}
trong đó: A(x,y) = A(x) với mọi yN và B(x,y) = B(y) với mọi xM
1.2.3.3 Phép bù của một tập mờ
Hình 1.17 Bù của tập mờ
Bù của tập mờ A có cơ sở M và hàm liên thuộc A(x) là một tập mờ AC
xác định trên cùng cơ sở M với hàm liên thuộc: Ac(x) =1- A(x)
1.2.4 Hệ suy diễn mờ
Trang 38Hệ suy diễn mờ bao gồm các đầu vào, đầu ra cùng với bộ xử lý
(hình 1.17) Các đầu vào của hệ nhận giá trị số rõ, còn đầu ra có thể là một tập
mờ hoặc một tập rõ Bộ xử lý thực chất là một ánh xạ phản ánh sự phụ thuộc của biến đầu ra hệ thống với biến đầu vào Quan hệ ánh xạ của đầu ra đối với các đầu vào của suy diễn mờ được mô tả bằng một tập mờ
Hình 1.18 Mô hình tổng quát hệ suy diễn mờ
Cấu trúc cơ bản của hệ suy diễn mờ gồm 4 thành phần chủ đạo
Giao diện mờ hoá: có chức năng thực hiện việc chuyển đổi các đầu
vào rõ thành mức độ trực thuộc các ngôn ngữ
Cơ sở tri thức: gồm hai thành phần bộ tham số và cơ sở luật
+ Bộ tham số (Database or dictionary): định nghĩa những hàm thuộc
của giá trị ngôn ngữ được dùng để biểu diễn mờ và các luật mờ Giá trị của các tham số có thể đánh giá bằng kinh nghiệm của các chuyên gia, con người
+ Cơ sở luật (rule base): chứa các luật mờ if-then, thực chất là một
tập các phát biểu hay quy tắc mà con người có thể hiểu được, cơ sở luật là thành phần quan trọng nhất của bất kỳ mô hình mờ nào
Cơ chế suy diễn (A reasoing mechanism): có chức năng thực hiện
thủ tục suy diễn mờ dựa trên cơ sở chi thức và các giá trị đầu vào để đưa ra một giá trị dự báo ở đầu ra
Giao diện giải mờ (Difuzzinfucation): có chức năng thực hiện
chuyển đổi kết quả suy diễn mờ thành giá trị đầu ra rõ Hệ suy diễn mờ thực hiện việc suy luận để tạo ra các quyết định từ các thông tin mơ hồ, không đầy
đủ, thiếu chính xác