Nghiên cứu và xây dựng hệ thống phân đoạn ảnh màu sử dụng thuật toán jseg
Trang 1KHOA CÔNG NGHỆ THÔNG TIN
BÁO CÁO THỰC TẬP HỆ THỐNG THÔNG TIN QUẢN LÝ
Hà Nội - 2013
Trang 2tình của TS Nguyễn Hữu Quỳnh, giảng viên công nghệ thông tin trường Đại họcĐiện Lực, thầy đã giành nhiều thời gian hướng dẫn, giúp đỡ tận tình cho em trongquá trình thực tập.
Em xin chân thành cảm ơn sâu sắc tới các thầy cô giáo trong trường Đại họcĐiện Lực và đặc biệt các thầy cô trong khoa Công Nghệ Thông Tin, những ngườithầy, cô đã tận tình giảng dạy và truyền đạt cho em những kiến thức, những kinhnghiệm quý báu trong suốt những năm học tập và rèn luyện ở trường Đại học ĐiệnLực
Xin chân thành cảm ơn các bạn sinh viên lớp Đại Học Đ4 - CNTT - trườngĐại học Điện Lực đã luôn động viên, giúp đỡ và nhiệt tình chia sẻ những kinhnghiệm học tập trong suốt quá trình học tập ở trường
Em xin được bày tỏ lòng biết ơn sâu sắc tới những người thân trong gia đình
và người thân xung quanh đã luôn động viên, khích lệ và tạo điều kiện tốt nhất cho
em trong suốt quá trình học tập và trong quá trình thực tập
Hà nội, ngày 14 tháng 06 năm 2013
Sinh viên thực hiệnPhương Văn Cảnh
Trang 3Cán bộ hướng dẫn: TS Nguyễn Hữu Quỳnh.
Hiện công tác tại: Khoa Công Nghệ Thông Tin – Trường Đại Học Điện Lực Nhận hướng dẫn sinh viên: Phương Văn Cảnh
Ngành: Công nghệ thông tin
Hệ: Đại học chính quy
Trong thời gian hướng dẫn sinh viên thực tập, tôi có một số ý kiến nhận xét như sau:
………
Hà Nội, ngày 17 tháng 06 năm 2013.
CÁN BỘ HƯỚNG DẪN
TS Nguyễn Hữu Quỳnh
Trang 4LỜI NÓI ĐẦU 0
LỜI CẢM ƠN 0
CHƯƠNG 1: TỔNG QUAN VỀ PHÂN ĐOẠN ẢNH MÀU 1
1.1 GIỚI THIỆU PHÂN ĐOẠN ẢNH 2
1.2 CÁC HƯỚNG TIẾP CẬN PHÂN ĐOẠN ẢNH 21.2.1 Các phương pháp dựa trên không gian đặc trưng31.2.2 Các phương pháp dựa trên không gian ảnh 31.2.3 Các phương pháp dựa trên mô hình vật lý 41.3 KẾT LUẬN CHƯƠNG 1 5
CHƯƠNG 2: PHÂN ĐOẠN ẢNH MÀU SỬ DỤNG JSEG 8
2.1 GIỚI THIỆU VỀ JSEG 8
2.2 TIÊU CHÍ ĐỂ PHÂN ĐOẠN 9
Trang 5DANH MỤC CÁC HÌNH
Hinh 1 1: Các phương pháp phân đoạn ảnh 4
Hinh 2 1: Sơ đồ thuật toán JSeg 8
Hinh 2 2: Một ví dụ khác nhau của class-map và các độ đo J tương ứng của chúng '+', 'o', và '*' chỉ ra ba lớp học của điểm dữ liệu 9
Hinh 2 3: Phân đoạn class-map và giá trị tương ứng của chúng 11
Hinh 2 4: (a) cửa sổ cơ bản để tính toán giá trị J địa phương (b) minh họa xuống lấy mẫu cho các cửa sổ ở quy mô 2 Chỉ điểm '+' được sử dụng để tính toán giá trị J địa phương, hình thành các cửa sổ cơ bản tương tự như trong (a) 12
Hinh 2 5: Biểu đồ luồng của các bước trong phân đoạn không gian 14
Hinh 3 1: Ví dụ về lượng hóa màu 20
Hinh 3 2: Ví dụ tính toán giá trị J 20
Hinh 3 3: Kết quả Lượng hóa màu và ảnh J-Image của ảnh màu 22
Hinh 3 4: Kết quả tính toán J thông qua hệ thống 22
Trang 6Bảng 1 2: Bảng ưu nhược điểm của các phương pháp phân đoạn ảnh 4
Bảng 2 1: Kích thước cửa sổ với các quy mô khác nhau 13
Bảng 3 1: Bảng tra màu 19
Bảng 3 2: Bảng giá trị m và tương ứng với 3 màu 20
Bảng 3 3: Bảng giá trị .21
Bảng 3 4: Bảng giá trị .21
Trang 8LỜI NÓI ĐẦU
Trong vài năm trở lại đây, chúng ta đã thấy cùng với sự bùng nổ của các ứngdụng Internet là sự tăng nhanh lượng dữ liệu ảnh Khi số lượng ảnh còn ít, việcnhận diện một bức ảnh hay so sánh giữa các bức ảnh có thể thực hiện được bằngmắt thường, tuy nhiên khi có số lượng rất lớn dữ liệu ảnh thì việc nhận diện bằngmắt thường sẽ trở nên khó khăn, Vì vậy, vấn đề đặt ra là phải có những phươngpháp tổ chức cơ sở dữ liệu ảnh tốt cùng với những kỹ thuật tìm kiếm, tra cứu ảnhhiệu quả, có độ chính xác cao và hiệu năng tốt
Lý do chọn đề tài:
Vấn đề tra cứu ảnh và quản trị cơ sở dữ liệu ảnh được cộng đồng nghiên cứuquan tâm đến từ năm 1970 [9] Với sự tăng nhanh về tốc độ máy tính và giảm chiphí bộ nhớ, các cơ sở dữ liệu ảnh chứa hàng nghìn thậm chí hàng triệu ảnh được sửdụng trong nhiều lĩnh vực ứng dụng khác nhau như y học, ảnh vệ tinh, các cơ sở dữliệu ảnh sinh học Các ứng dụng này đòi hỏi độ chính xác tra cứu cao Với sự tăngnhanh về số lượng ảnh, cách tiếp cận tra cứu ảnh dựa vào chú thích ảnh thủ công trởnên không khả thi về cả thời gian và chi phí Tra cứu ảnh dựa vào nội dung (ContentBase Image Retrieval - CBIR) là một công cụ mạnh do nó tìm kiếm cơ sở dữ liệuảnh bằng việc sử dụng dấu hiệu trực quan Các hệ thống tra cứu ảnh dựa vào nộidung trích rút các đặc trưng từ bản thân các ảnh thô và tính toán độ đo kết hợp giữaảnh truy vấn và các ảnh cơ sở dữ liệu dựa trên các đặc trưng này
Phân đoạn ảnh là một thao tác ở mức thấp trong toàn bộ quá trình xử lý ảnh.Quá trình này thực hiện việc phân vùng ảnh thành các vùng rời rạc và đồng nhất vớinhau hay nói cách khác là xác định các biên của các vùng ảnh đó Các vùng ảnhđồng nhất này thông thường sẽ tương ứng với toàn bộ hay từng phần của các đốitượng thật sự bên trong ảnh Chính vì vậy việc phân đoạn ảnh bước tiền xử lý đầutiên trong toàn bộ quá trình trước khi thực hiện các thao tác khác ở mức cao hơnnhư nhận dạng đối tượng, biểu diễn đối tượng, nén ảnh dựa trên đối tượng, hay truyvấn ảnh dựa vào nội dung …
Vì vậy, đề tài tra phân đoạn ảnh được đưa ra để tìm hiểu, nghiên cứu và ứngdụng
Tên đề tài : “Nghiên cứu và xây dựng hệ thống phân đoạn ảnh màu sử dụng
thuật toán JSEG”
Đối tượng nghiên cứu: ảnh màu.
Trang 9CHƯƠNG 1: TỔNG QUAN VỀ PHÂN ĐOẠN ẢNH MÀU
1.1 GIỚI THIỆU PHÂN ĐOẠN ẢNH
Phân đoạn ảnh là một thao tác ở mức thấp trong toàn bộ quá trình xử lý ảnh.Quá trình này thực hiện việc phân vùng ảnh thành các vùng rời rạc và đồng nhất vớinhau hay nói cách khác là xác định các biên của các vùng ảnh đó Các vùng ảnhđồng nhất này thông thường sẽ tương ứng với toàn bộ hay từng phần của các đốitượng thật sự bên trong ảnh Vì thế, trong hầu hết các ứng dụng của lĩnh vực xử lýảnh (image processing), thị giác máy tính, phân đoạn ảnh luôn đóng một vai trò cơbản và thường là bước tiền xử lý đầu tiên trong toàn bộ quá trình trước khi thực hiệncác thao tác khác ở mức cao hơn như nhận dạng đối tượng, biểu diễn đối tượng, nénảnh dựa trên đối tượng, hay truy vấn ảnh dựa vào nội dung … Vào những thời gianđầu, các phương pháp phân vùng ảnh được đưa ra chủ yếu làm việc trên các ảnhmức xám do các hạn chế về phương tiện thu thập và lưu trữ Ngày nay, cùng với sựphát triển về các phương tiện thu nhận và biểu diễn ảnh , các ảnh màu đã hầu nhưthay thế hoàn toàn các ảnh mức xám trong việc biểu diễn và lưu trữ thông tin do các
ưu thế vượt trội hơn hẳn so với ảnh mức xám Do đó, các kỹ thuật, thuật giải mớithực hiện việc phân vùng ảnh trên các loại ảnh màu liên tục được phát triển để đápứng các nhu cầu mới Các thuật giải, kỹ thuật này thường được phát triển dựa trên
nền tảng các thuật giải phân vùng ảnh mức xám đã có sẵn
1.2 CÁC HƯỚNG TIẾP CẬN PHÂN ĐOẠN ẢNH
Phân đoạn ảnh là chia ảnh thành các vùng không trùng lắp Mỗi vùng gồm mộtnhóm pixel liên thông và đồng nhất theo một tiêu chí nào đó [1] Tiêu chí này phụthuộc vào mục tiêu của quá trình phân đoạn Ví dụ như đồng nhất về màu sắc, mứcxám, kết cấu, độ sâu của các layer… Sau khi phân đoạn mỗi pixel chỉ thuộc về mộtvùng duy nhất Để đánh giá chất lượng của quá trình phân đoạn là rất khó Vì vậytrước khi phân đoạn ảnh cần xác định rõ mục tiêu của quá trình phân đoạn là gì Xétmột cách tổng quát, ta có thể chia các hướng tiếp cận phân đoạn ảnh thành ba nhómchính như sau:
Các kỹ thuật phân đoạn ảnh dựa trên không gian đặc trưng
Các kỹ thuật dựa trên không gian ảnh
Các kỹ thuật dựa trên các mô hình vật lý
Trang 101.2.1 Các phương pháp dựa trên không gian đặc trưng
Nếu chúng ta giả định màu sắc bề mặt của các đối tượng trong ảnh là mộtthuộc tính bất biến và các màu sắc đó được ánh xạ vào một không gian màu nào đó,
vậy thì chúng ta sẽ có một cái nhìn đối với mỗi đối tượng trong ảnh như là một cụm
(cluster) các điểm trong không gian màu đó Mức độ phân tán của các điểm trongtrong một cụm được xác định chủ yếu bởi sự khác biệt về màu sắc Một cách khác,thay vì ánh xạ các pixel trong ảnh vào một không gian màu cụ thể, ta xây dựng một
histogram dựa trên các đặc trưng màu dạng ad-hoc cho ảnh đó (ví dụ như Hue), và
thông thường, các đối tượng trong ảnh sẽ xuất hiện như các giá trị đỉnh tronghistogram đó Do đó, việc phân vùng các đối tượng trong ảnh tương ứng với việcxác định các cụm – đối với cách biểu diễn thứ nhất – hoặc xác định các vùng cực trịcủa histogram – đối với cách biểu diễn thứ hai
Các phương pháp tiếp cận này chỉ làm việc trên một không gian màu xác địnhchẳng hạn phương pháp của Park áp dụng trên không gian màu RGB, còn phươngpháp của Weeks và Hague thì áp dụng trên không gian màu HIS Dựa trên khônggian đặc trưng, ta có các phương pháp phân đoạn: phương pháp phân nhóm đốitượng không giám sát, phương pháp phân lớp trung bình-k thích nghi, phương pháplấy ngưỡng histogram
1.2.2 Các phương pháp dựa trên không gian ảnh
Hầu hết những phương pháp được đề cập trong phần trên đều hoạt động dựatrên các không gian đặc trưng của ảnh(thông thường là màu sắc) Do đó, các vùngảnh kết quả là đồng nhất tương ứng với các đặc trưng đã chọn cho từng không gian.Tuy nhiên, không có gì đảm bảo rằng tất cả các vùng này thể hiển một sự cô đọng(compactness) về nội dung xét theo ý nghĩa không gian ảnh (ý nghĩa các vùng theo
sự cảm nhận của hệ thần kinh con người) Mà đặc tính này là quan trọng thứ hai sauđặc tính về sự thuần nhất của các vùng ảnh Do các phương pháp gom cụm cũngnhư xác định ngưỡng histogram đã nêu đều bỏ qua thông tin về vị trí của các pixeltrong ảnh
Trong các báo cáo khoa học về phân vùng ảnh mức xám, có khá nhiều kỹthuật cố thực hiện việc thoả mãn cùng lúc cả hai tiêu chí về tính đồng nhất trongkhông gian đặc trưng của ảnh và tính cô đọng về nội dung ảnh Tuỳ theo các kỹthuật mà các thuật giải này áp dụng, chúng được phân thành các nhóm sau:
Các thuật giải áp dụng kỹ thuật chia và trộn vùng
Trang 11 Các thuật giải áp dụng kỹ thuật tăng trưởng vùng.
Các thuật giải áp dụng lý thuyết đồ thị
Các giải thuật áp dụng mạng neural
Các giải thuật dựa trên cạnh
1.2.3 Các phương pháp dựa trên mô hình vật lý
Tất cả các giải thuật được xem xét qua, không ít thì nhiều ở mặt nào đó đều cókhả năng phát sinh việc phân vùng lỗi trong các trường hợp cụ thể nếu như các đốitượng trong ảnh màu bị ảnh hưởng quá nhiều bởi các vùng sáng hoặc bóng mờ, cáchiện tượng này làm cho các màu đồng nhất trong ảnh thay đổi nhiều hoặc ít mộtcách đột ngột Và kết quả là các thuật giải này tạo ra các kết quả phân vùng quámức mong muốn so với sự cảm nhận các đối tượng trong ảnh bằng mắt thường Đểgiải quyết vấn đề này, các giải thuật phân vùng ảnh áp dụng các mô hình tương tácvật lý giữa bề mặt các đối tượng với ánh sáng đã được đề xuất Các công cụ toánhọc mà các phương pháp này sử dụng thì không khác mấy so với các phương pháp
đã trình bày ở trên, điểm khác biệt chính là việc áp dụng các mô hình vật lý để minh hoạ các thuộc tính phản chiếu ánh sáng trên bề mặt màu sắc của các đối
tượng
Cột mốc quan trọng trong lĩnh vực phân vùng ảnh màu dựa trên mô hình vật lý
được Shafer đặt ra Ông giới thiệu mô hình phản xạ lưỡng sắc cho các vật chất điện
môi không đồng nhất Dựa trên mô hình này, Klinker đã đặt ra một giải thuật đặt ramột số giả thiết quang học liên quan đến màu sắc, bóng sáng, bóng mờ của các đốitượng và cố gắng làm phù hợp chúng với hình dạng của các cụm Hạn chế chính củagiải thuật này là nó chỉ làm việc trên các vật chất điện môi không đồng nhất Haiông cùng tên Tsang đã áp dụng mô hình phản xạ lưỡng sắc trong không gian HSV
để xác định các đường biên trong ảnh màu
Healey đề xuất một mô hình phản xạ đơn sắc cho các vật chất kim loại Các
phương pháp đề cập trong phần này chỉ áp dụng cho hai loại vật chất là kim loại vàđiện môi không đồng nhất Một thuật toán tổng quát và phức tạp hơn cũng đượcMaxwell và Shafer đề xuất trong
Trang 121.3 KẾT LUẬN CHƯƠNG 1.
Tóm lại, một cái nhìn tổng quan về các phưong pháp phân đoạn ảnh như sau:
Hinh 1 1: Các phương pháp phân đoạn ảnh
Mỗi phương pháp đều có những ưu nhược điểm nhất định:
Bảng 1 1: Bảng ưu nhược điểm của các phương pháp phân đoạn ảnh
Phương pháp phân
Featured-based techniques Clustering Phân loại không cần giám
sát
Tồn tại các phương pháp heuristic và hữu hạn.
Không quan tâm đến các thông tin trong không gian ảnh.
Có vấn đề trong việc xác định số lượng các cụm ban đầu.
Khó khăn trong việc điều chỉnh các cụm sao cho phù hợp với các vùng trong ảnh.
Adaptive Clustering Sở hữu tính liên tục trong
không gian ảnh và tính thích nghi cục bộ đối với các vùng ảnh.
Sử dụng các ràng buộc về không gian ảnh.
Cực đại hoá một xác suất hậu điều kiện có thể bị sai do các cực trị địa phương.
Trang 13Phương pháp phân
Histogram thresholding Không cần biết trước bất kỳ
thông tin nào từ ảnh.
Các giải thuật nhanh và dễ dàng cài đặt.
Bỏ qua các thông tin về không gian ảnh.
Lấy ngưỡng trong các histogram đa chiều là một quá trình phức tạp.
Ảnh hưởng dễ dàng bởi nhiễu xuất hiện trong ảnh.
Spatial-based techniques Spit and Merge Sử dụng các thông tin về
không gian ảnh là chính
Cho kết quả tốt với các ảnh chứa nhiều vùng màu đồng nhất.
Định nghĩa mức độ đồng nhất về màu sắc có thể phức tạp
và khó khăn.
Quadtree có thể gây ra các kết quả không như mong muốn.
Gặp khó khăn trong việc thu thập tập các điểm mầm và xác định các điều kiện đồng nhất đầy đủ.
Chịu ảnh hưởng bởi các đặc tính tự nhiên của kỹ thuật này.
Graph theories Thể hiện tốt không gian ảnh
Neural networks Mức độ song song hoá cao
và có tốc độ thực thi nhanh.
Khả năng chống chịu tốt trước các thay đổi xấu.
Một công cụ hữu hiệu cho các ứng dụng nhận dạng và xử
lý ảnh y khoa.
Màu sắc có thể làm tăng độ phức tạp của mạng.
Quá trình học cần phải biết trước số lượng các phân lớp/cụm.
Edge-based Là phương pháp được hỗ trợ
mạnh bởi các toán tử dò biên.
Khó khăn trong việc định nghĩa một hàm gradient cho các
Trang 14 Có hiệu năng tốt với các ứng dụng dò biên đối tượng theo đường cong.
ảnh màu.
Nhiễu hoặc các ảnh có độ tương phản kém ảnh hưởng xấu đến kết quả phân vùng.
Phương pháp phân
Physics-based techniques
Khẳng định tính chắc chắn đối với các vùng bóng sáng/tối,
và vùng bóng chuyển tiếp (diffuse hoặc shade)
Phân vùng các đối tượng dựa vào thành phần vật liệu cấu tạo
Bị giới hạn vào một số lượng nhất định các loại vật chất hình thành nên đối tượng.
Khó khăn trong việc xác định vùng bóng sáng và bóng chuyển tiếp trong các ảnh thực.
Một vài giải thuật đòi hỏi các thông tin về hình dạng đối tượng (không luôn luôn đáp ứng được).
Chi phí tính toán khá cao.
Trang 15CHƯƠNG 2: PHÂN ĐOẠN ẢNH MÀU SỬ DỤNG JSEG
2.1 GIỚI THIỆU VỀ JSEG
Phân đoạn ảnh màu rất hữu ích trong nhiều ứng dụng Từ các kết quả phânđoạn, nó có thể xác định các khu vực quan tâm và đối tượng trong cảnh, nó rất cólợi cho việc phân tích hình ảnh tiếp theo hoặc chú thích Công việc gần đây baogồm một loạt các kỹ thuật: ví dụ, các cách tiếp cận dựa trên mô hình ngẫu nhiên [1],[4], [8], [11], [12], hình thái khu vực đầu nguồn dựa trên phát triển [9], khuếch tánnăng lượng [7], và đồ thị phân vùng [10] Phương pháp đánh giá định lượng cũng
đã được đề nghị [2] Tuy nhiên, do tính chất khó khăn của vấn đề, có rất ít các thuậttoán tự động có thể làm việc tốt trên một lượng lớn các dữ liệu
Các vấn đề của phân đoạn gặp khó khăn với hình ảnh kết cấu Nếu một hìnhảnh có chứa các vùng màu chỉ đồng nhất, phương pháp phân nhóm trong khônggian màu sắc như [3] là đủ để xử lý vấn đề Trong thực tế, những cảnh thiên nhiênrất giàu màu sắc và kết cấu Rất khó để xác định các khu vực hình ảnh có chứa cácmẫu màu sắc kết cấu Các cách tiếp cận trong việc này giả định như sau:
• Mỗi khu vực trong các hình ảnh có chứa một mô hình màu sắc kết cấu phân
bố đồng đều
• Các thông tin màu trên từng khu vực hình ảnh có thể được đại diện bởi mộtvài màu sắc lượng tử, đó là sự thật đối với hầu hết các hình ảnh màu sắc của cảnhquan thiên nhiên
• Những màu sắc giữa hai khu vực lân cận được phân biệt - một giả định cơbản của bất kỳ màu sắc cho ảnh thuật toán phân đoạn
Hương giải quyết được đưa ra:
• Tìm hiểu một tiêu chuẩn mới cho phân đoạn ảnh Tiêu chí này liên quan đếngiảm thiểu chi phí liên quan đến việc phân vùng của hình ảnh dựa trên nhãn pixel.Các nhãn điểm ảnh có nguồn gốc từ lượng tử hóa màu sắc, như được giải thíchtrong mục 2 và mở rộng các tính năng hình ảnh khác là có thể
• Một thuật toán thực tế, được gọi là JSEG, được đề xuất nhằm đạt được mụctiêu phân khúc này Khái niệm "J-Images" được giới thiệu trong phần 4 J-Imagestương ứng với số đo không đồng nhất hình ảnh địa phương ở các quy mô khác nhau.Các thung lũng trong hình ảnh tương ứng với khu vực đồng nhất và các đỉnh núi
Trang 16tương ứng với vị trí ranh giới tiềm năng Một thuật toán phân chia không gian sau
đó được mô tả trong phần 5, trong đó phát triển vùng từ thung lũng của J-hình ảnh
để đạt được phân đoạn
Hình 2.1 cho thấy một sơ đồ của thuật toán JSEG
Hinh 2 1: Sơ đồ thuật toán JSeg
2.2 TIÊU CHÍ ĐỂ PHÂN ĐOẠN
Đầu tiên, màu sắc trong bức ảnh được lượng tử thô mà không làm giảm đáng
kể chất lượng màu sắc Mục đích là để trích xuất một vài màu sắc đại diện có thểđược sử dụng để phân biệt các vùng lân cận trong hình ảnh Thông thường, 10-20màu sắc là cần thiết trong những hình ảnh của cảnh quan thiên nhiên Một lượng tửmàu sắc tốt quan trọng đối với quá trình phân đoạn sau này
Trang 17Sau khi lượng tử hóa, màu sắc lượng tử được gán nhãn Một lớp màu là tậphợp các điểm ảnh của hình ảnh đã lượng tử có cùng màu Các pixel màu sắc củahình ảnh được thay thế bằng nhãn lớp màu tương ứng của chúng Hình ảnh mớiđược xây dựng của nhãn được gọi là một class-map Ví dụ về các lớp bản đồ đượcthể hiện trong Hình 2.2, nơi mà các giá trị nhãn được đại diện bởi ba biểu tượng, '*','+', và 'o' Các thông tin màu sắc cần thiết để phân đoạn được trích xuất và được lưutrữ trong một đơn giản class-map sau khi lượng tử hóa màu sắc Thông thường, mỗikhu vực hình ảnh có những điểm ảnh từ một tập hợp nhỏ của các lớp màu và mỗilớp được phân phối trong một vài khu vực hình ảnh.
Hinh 2 2: Một ví dụ khác nhau của class-map và các độ đo J tương ứng của
chúng '+', 'o', và '*' chỉ ra ba lớp học của điểm dữ liệu
Các lớp bản đồ có thể được xem như là một tập hợp các điểm dữ liệu khônggian nằm trong một mặt phẳng 2-D Giá trị của mỗi điểm là vị trí điểm ảnh, mộtvector 2-D (x, y) Các điểm dữ liệu đã được phân loại và mỗi điểm được chỉ địnhmột nhãn, đó là giá trị của lớp bản đồ tại vị trí hình ảnh Trong phần tiếp theo, mộttiêu chuẩn "tốt" để phân đoạn sử dụng các điểm dữ liệu không gian được đề xuất.Trước khi tiếp tục, chúng ta đầu tiên hãy xem xét giá trị J được định nghĩa nhưsau Gọi Z là tập hợp của tất cả các điểm dữ liệu tồn tại trong các lớp bản đồ Gọi
z = (x, y), z Z và m là được định nghĩa là :
(2.1)