MỞ ĐẦUNgày nay, xử lý ảnh đã trở thành một ngành khoa học lớn và có nhiềuứng dụng trong các lĩnh vực: Y tế xử lý ảnh siêu âm, ảnh chụp cắt lớp, tìmkiếm tội phạm nhận dạng ảnh tội phạm, d
Trang 1MỞ ĐẦU
Ngày nay, xử lý ảnh đã trở thành một ngành khoa học lớn và có nhiềuứng dụng trong các lĩnh vực: Y tế (xử lý ảnh siêu âm, ảnh chụp cắt lớp), tìmkiếm tội phạm (nhận dạng ảnh tội phạm, dấu vân tay), thị giác máy tính (dùng
xử lý ảnh phát hiện đối tượng chuyển động), tra cứu ảnh… Xử lý ảnh nghiêncứu các quá trình xử lý thông tin dạng hình ảnh, mà hình ảnh lại là một trongnhững dạng thông tin phong phú nhất đối với con người Quá trình xử lý ảnhbao gồm các bước: thu nhận ảnh, tiền xử lý, phân đoạn ảnh, biểu diễn và mô
tả, nhận dạng và nội suy dựa trên cơ sở tri thức Phân đoạn ảnh là một trongnhững công việc quan trọng và khó khăn nhất của xử lý ảnh, quyết định sựthành công hay thất bại của toàn bộ công việc phân tích ảnh Nếu bước phânđoạn ảnh không tốt thì sẽ dẫn đến việc nhận diện sai về các đối tượng trongảnh Chính vì vậy phải có những phương pháp phân đoạn ảnh tốt cùng vớinhững kỹ thuật phân tích ảnh phù hợp để quá trình xử lý ảnh đạt hiệu quả tốtnhất
Phân đoạn ảnh là quá trình phân hoạch một ảnh số thành nhiều đoạn(tập các pixel) Mục tiêu của phân đoạn là đơn giản hóa hoặc thay đổi biểudiễn của một ảnh thành biểu diễn có ý nghĩa và dễ phân tích Phân đoạn ảnhđược sử dụng để xác định các đối tượng và các đường biên (đường thẳng,đường cong, ) trong ảnh Nói cách khác, phân đoạn ảnh là quá trình gánnhãn cho mỗi pixel trong ảnh sao cho các pixel có cùng nhãn có chung cácthuộc tính trực quan nào đó
Cho đến nay có nhiều hướng tiếp cận để phân đoạn ảnh, có thể chiathành ba nhóm chính như sau: Dựa trên không gian đặc trưng, dựa trên khônggian ảnh, dựa trên các mô hình vật lý Mỗi hướng tiếp cận có ưu và nhượcđiểm riêng và phụ thuộc nhiều vào lĩnh vực ứng dụng cụ thể Do đó, việc
Trang 2nghiên cứu các phương pháp phân đoạn ảnh và tiến hành cài đặt các phươngpháp phân đoạn ảnh là rất cần thiết
Vấn đề này chính là động lực để luận văn tìm hiểu các phương phápphân đoạn ảnh số và ứng dụng trong tra cứu ảnh Khi người sử dụng cung cấpmột ảnh đầu vào (gọi là ảnh truy vấn), hệ thống phân đoạn ảnh truy vấn nàythành các vùng và tính toán độ tương tự của ảnh truy vấn và các ảnh trong cơ
sở dữ liệu ảnh dựa trên các vùng đã được phân đoạn này Sau khi tính toán độtương tự, hệ thống dựa trên độ tương tự của ảnh truy vấn với mỗi ảnh trong cơ
sở dữ liệu ảnh để phân hạng các ảnh theo thứ tự giảm dần của độ tương tự Do
đó chất lượng của kỹ thuật phân đoạn sẽ ảnh hưởng rất nhiều đến độ chínhxác của hệ thống tra cứu
Luận văn trình bày tổng quan về xử lý ảnh số và các phương pháp phânđoạn ảnh số đi sâu vào phương pháp tách cây tứ phân, tách theo vùng đồngnhất, phương pháp K-means và HAC Trên cơ sở các phương pháp phân đoạnảnh này tiến hành xây dựng chương trình phân đoạn ảnh sử dụng ngôn ngữlập trình C# trên môi trường Visual Studio 2010 và SQL Server 2008
Nội dung luận văn gồm có ba chương:
Chương 1: Giới thiệu tổng quan về xử lý ảnh và phân đoạn ảnh.
Chương 2: Trình bày phân đoạn ảnh theo mô hình tách, ghép vùng Chương 3: Chương trình phân đoạn ảnh và ứng dụng phân đoạn
ảnh trong tra cứu ảnh.
Xử lý ảnh cũng là vấn đề trừu tượng liên quan đến nhiều thuật toán, kỹ thuật
xử lý cũng như viết chương trình Em đã cố gắng hết sức để hoàn thiện luậnvăn, tuy nhiên do thời gian có hạn nên không thể tránh khỏi những thiếu sót
Em rất mong nhận được sự đóng góp ý kiến của các thầy cô giáo trong Hộiđồng chấm luận văn để luận văn được hoàn thiện hơn
Trang 3CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ PHÂN ĐOẠN ẢNH
1.1 Tổng quan về xử lý ảnh
1.1.1 Giới thiệu về xử lý ảnh
Ngày nay, xử lý ảnh [2] đã trở thành một ngành khoa học lớn và có mặttrong nhiều lĩnh vực của cuộc sống như trong y tế, tìm kiếm tội phạm, khítượng thủy văn, thị giác máy tính, v.v Xử lý ảnh là ngành khoa học nghiêncứu các quá trình xử lý thông tin dạng hình ảnh, mà hình ảnh lại là một trongnhững dạng thông tin phong phú nhất đối với con người Trong quá trình xử
lý ảnh, phân đoạn ảnh là bước quan trọng nhất và cũng là khó khăn nhất.Phân đoạn nhằm mục đích phân tích ảnh thành những thành phần có cùng tínhchất nào đó để có thể sử dụng cho các ứng dụng về sau
Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng caochất lượng ảnh, phân đoạn ảnh và phân tích ảnh Ứng dụng đầu tiên được biếtđến là nâng cao chất lượng ảnh báo được truyền qua cáp từ London đến NewYork từ những năm 1920 Vấn đề nâng cao chất lượng ảnh có liên quan tớiphân bố mức sáng và độ phân giải của ảnh Việc nâng cao chất lượng ảnhđược phát triển vào khoảng những năm 1955 Điều này có thể giải thích được
vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện cho quá trình
xử lý ảnh số thuận lợi Năm 1964, máy tính đã có khả năng xử lý và nâng caochất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao gồm: làm nổiđường biên, lưu ảnh Từ năm 1964 đến nay, các phương tiện xử lý, nâng caochất lượng, phân đoạn ảnh và nhận dạng ảnh phát triển không ngừng
Trang 4Ảnh trong xử lý ảnh có thể xem như ảnh n chiều Bởi vì, ảnh có thể
xem là tập hợp các điểm ảnh Trong đó, mỗi điểm ảnh được xem như là đặctrưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối
tượng trong không gian và do đó nó có thể xem như một hàm n biến
P(c1,c2, ,cn)
Quá trình xử lý ảnh [2] có thể được mô tả bằng sơ đồ sau:
Hình 1.2 Quá trình xử lý ảnh
Thu nhận ảnh: Đây là bước đầu tiên của quá trình xử lý ảnh song kết
quả của nó có ảnh hưởng rất nhiều đến các bước kế tiếp Đầu tiên, ảnh
tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu như
Phân đoạn
Nhận dạng vànội suyTiền xử lý ảnh
Biểu diễn và
mô tả ảnh
CƠ SỞ TRI THỨC
Thu nhận
Xử lý ảnh
Kết luận
Trang 5camera, máy chụp ảnh, v.v Trước đây, ảnh thu nhận qua camera là tínhiệu tương tự (loại camera ống kiểu CCIR) Gần đây, với sự phát triểncủa công nghệ, ảnh màu hoặc đen trắng được lấy ra từ camera, sau đó
nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo.Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh qua các bộ cảm ứng hayảnh, tranh được quét trên máy quét ảnh (scanner)
Tiền xử lý: Ở bước này, ảnh sẽ được cải thiện về độ tương phản, khử
nhiễu, khôi phục ảnh, nắn chỉnh hình học, v.v Với mục đích làm chochất lượng ảnh trở nên tốt hơn nữa, chuẩn bị cho các bước xử lý phứctạp kế tiếp sau đó
* Khử nhiễu: Nhiễu được chia thành hai loại: nhiễu hệ thống vànhiễu ngẫu nhiên Đặc trưng của nhiễu hệ thống là tính tuần hoàn Dovậy, có thể khử nhiễu này bằng việc sử dụng phép biến đổi Fourier vàloại bỏ các đỉnh điểm Đối với nhiễu ngẫu nhiên, trường hợp đơn giản
là các vết bẩn tương ứng với các điểm sáng hay tối, có thể khử bằngphương pháp nội suy, lọc trung vị và trung bình
* Chỉnh mức xám: Đây là kỹ thuật nhằm chỉnh sửa tính khôngđồng đều của thiết bị thu nhận hoặc độ tương phản giữa các vùng ảnh
* Chỉnh tán xạ: Ảnh thu nhận được từ các thiết bị quang học hayđiện tử có thể bị mờ, nhoè Phương pháp biến đổi Fourier dựa trên tíchchập của ảnh với hàm tán xạ cho phép giải quyết việc hiệu chỉnh này
* Nắn chỉnh hình học: những biến dạng hình học thường do cácthiết bị điện tử và quang học gây ra Do đó, phương pháp hiệu chỉnhảnh dựa trên mô hình được mô tả dưới dạng phương trình biến đổi ảnhbiến dạng f(x,y) thành ảnh lý tưởng f(x',y') như sau:
) , ( '
y x h y
y x h x
y x
Trong đó h , h là các phương trình tuyến tính (biến dạng do phối cảnh)
Trang 6hay bậc hai (biến dạng do ống kính camera).
Phân đoạn ảnh: Phân đoạn ảnh là bước then chốt trong xử lý ảnh, giai
đoạn này nhằm phân tích ảnh thành những thành phần có cùng tínhchất nào đó, dựa theo biên hay các vùng liên thông Tiêu chuẩn để xácđịnh các vùng liên thông có thể là cùng màu, cùng mức xám hay cùng
độ nhám, v.v Mục đích của phân đoạn ảnh là để có một miêu tả tổnghợp từ nhiều phần tử khác nhau cấu tạo nên ảnh thô Vì lượng thôngtin chứa trong ảnh rất lớn, trong khi đó trong đa số các ứng dụng chúng
ta chỉ cần trích chọn một vài đặc trưng nào đó, do vậy cần có một quátrình để giảm lượng thông tin khổng lồ ấy Quá trình này bao gồmphân vùng ảnh và trích chọn đặc tính chủ yếu
Biểu diễn và mô tả ảnh: Ảnh đầu ra sau phân đoạn chứa các điểm ảnh
của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lâncận Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho
xử lý tiếp theo bằng máy tính Việc chọn các tính chất để thể hiện ảnhgọi là trích chọn đặc trưng gắn với việc tách các đặc tính của ảnh dướidạng các thông tin định lượng hoặc làm cơ sở để phân lớp đối tượngnày với đối tượng khác trong phạm vi ảnh nhận được Ví dụ: trongnhận dạng các ký tự, ta miêu tả các đặc trưng của từng ký tự, giúpphân biệt ký tự này với ký tự khác Một số phương pháp biểu diễnthường dùng:
o Biểu diễn bằng mã chạy (Run-Length Code)
o Biểu diễn bằng mã xích (Chaine Code)
o Biểu diễn bằng mã tứ phân (Quad-Tree Code)
Nhận dạng và nội suy: Đây là bước cuối cùng trong quá trình xử lý
ảnh Nhận dạng ảnh là quá trình xác định ảnh Quá trình này thường thu
Trang 7được bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từtrước Có 2 kiểu nhận dạng ảnh cơ bản:
− Nhận dạng theo tham số
− Nhận dạng theo cấu trúc
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụngtrong khoa học và công nghệ là: Nhận dạng ký tự (chữ in, chữ viết tay,chữ ký điện tử), nhận dạng văn bản , nhận dạng vân tay, nhận dạng mãvạch, nhận dạng mặt người, v.v
Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng
Cơ sở tri thức: Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối,
dung lượng điểm ảnh, v.v Trong nhiều khâu xử lý và phân tích ảnh, ngoàiviệc đơn giản hóa các phương pháp toán học đảm bảo tiện lợi cho xử lý,người ta mong muốn bắt chước quy trình tiếp nhận và xử lý ảnh theo cách củacon người Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo cácphương pháp trí tuệ con người Vì vậy, ở đây các cơ sở tri thức được phát huy
Không phải bất kỳ một ứng dụng xử lý ảnh nào cũng bắt buộc phảituân theo các bước xử lý đã nêu ở trên, ví dụ như các ứng dụng chỉnh sửa ảnhnghệ thuật chỉ dừng lại ở bước tiền xử lý Một cách tổng quát thì những chứcnăng xử lý bao gồm cả nhận dạng và nội suy thường chỉ có mặt trong hệthống phân tích ảnh tự động hoặc bán tự động, được dùng để rút trích ranhững thông tin quan trọng từ ảnh, ví dụ như các ứng dụng nhận dạng kí tựquang học, nhận dạng chữ viết tay, v.v
1.1.3 Một số khái niệm cơ bản
1.1.3.1 Điểm ảnh - Pixel
Ảnh trong thực tế [1] là một ảnh liên tục về không gian và vềgiá trị độ sáng Để có thể xử lý ảnh bằng máy tính, ảnhcần phải được sốhoá Số hoá ảnh là sự biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông
Trang 8qua quá trình lấy mẫu (rời rạc hoá về không gian) và lượng hoá thành phầngiá trị mà về nguyên tắc bằng mắt thường không phân biệt được hai điểm
kề nhau Trong quá trình này người ta sử dụng khái niệm Picture element
mà ta quen gọi là Pixel - phần tử ảnh Ảnh được xem như là tập hợp hữu hạncác điểm ảnh, thường được biểu diễn bằng một mảng hai chiều I(n,m) với n là
số hàng, m là số cột Ta ký hiệu P(x,y) – 1 phần tử trong ma trận là một điểmảnh tại vị trí (x,y)
- Ảnh nhị phân: Là ảnh có 2 mức trắng đen phân biệt, tức là dùng 1bit
mô tả 21 mức khác nhau Nói cách khác: Mỗi bit điểm ảnh nhị phân chỉ có thể
là 0,1
-Ảnh màu: Trong khuôn khổ lý thuyết 3 màu (Red, Green, Blue) để tạonên thế giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó cácgiá trị màu: 28*3=224≈16,7 triệu màu
1.1.3.3 Biên
Biên là một đặc tính rất quan trọng của đối tượng trong ảnh, nhờ vàobiên mà chúng ta phân biệt được đối tượng này với đối tượng kia Một điểmảnh có thể gọi là điểm biên nếu ở đó có sự thay đổi đột ngột về mức xám.Tập hợp các điểm biên gọi là biên hay còn gọi là đường bao ảnh
Trang 9N4((x,y)) = {(x+1,y), (x-1,y), (x,y+1), (x,y-1)}
Trong hình 1.3 các điểm P0, P2, P4, P6 là các 4-láng gi ng c a P ềng của P ủa P.
P2(x,y-1)
P4(x-1,y) P(x,y) P0(x+1,y)
P6(x,y+1)Hình 1.3 Khái niệm 4-láng giềng
- 8 láng giềng của (x,y) là một tập cha của 4 láng giềng và bao gồm
láng giềng ngang, dọc và chéo:
N8((x,y)) = N4((x,y)) {(x+1,y+1), (x-1,y-1), (x+1,y-1), (x-1,y+1)}
Trong hình 1.4 các điểm P0, P1, P2, P3, P4, P5, P6, P7 là các 8-láng giềng của P.
P3(x-1,y-1) P2(x,y-1) P1(x+1,y-1)
P4(x-1,y) P(x,y) P0(x+1,y)
P5(x-1,y+1) P6(x,y+1) P7(x+1,y+1)Hình 1.4 Khái niệm 8-láng giềng
1.1.3.5 Vùng liên thông
Một vùng R được gọi là liên thông nếu bất kỳ hai điểm (xA,yA) và(xB,yB) thuộc vào R có thể được nối bởi một đường (xA,yB) (xi-1,yi-1), (xi,yi),(xi+1,yi+1) (xB,yB), mà các điểm (xi,yi) thuộc vào R và bất kỳ điểm (xi,yi) nàođều kề sát với điểm trước (xi-1,yi-1) và điểm tiếp theo (xi+1,yi+1) trên đường đó.Một điểm (xk,yk) được gọi là kề với điểm (xl,yl) nếu (xl,yl) thuộc vào lánggiềng trực tiếp của (xk,yk)
Trang 101.1.3.6 Vùng ảnh (Segment)
Vùng ảnh là một chi tiết, một thực thể trong toàn cảnh Nó là một tậphợp các điểm có cùng hoặc gần cùng một tính chất nào đó : mức xám, mứcmàu, độ nhám, v.v Vùng ảnh là một trong hai thuộc tính quan trọng của ảnh.1.1.3.7 Đối tượng ảnh
Quan hệ k-liên thông [3] trong E (k=4,8) là một quan hệ phản xạ, đối
xứng và bắc cầu Bởi vậy đó là một quan hệ tương đương Mỗi lớp tươngđương được gọi là một thành phần k-liên thông của ảnh Ta sẽ gọi mỗi thànhphần k-liên thông của ảnh là một đối tượng ảnh
1.1.3.8 Chu tuyến ảnh
Chu tuyến của một đối tượng ảnh là dãy các điểm của đối tượng ảnhP1,…,Pn sao cho Pi và Pi+1 là các 8-láng giềng của nhau (i=1, ,n-1) và P1 là8-láng giềng của Pn, ∀i ∃Q không thuộc đối tượng ảnh và Q là 4-láng giềngcủa Pi (hay nói cách khác ∀i thì Pi là biên 4) Kí hiệu <P1P2 Pn>
Tổng các khoảng cách giữa hai điểm kế tiếp của chu tuyến là độ dài của chutuyến và kí hiệu Len(C) và hướng PiPi+1 là hướng chẵn nếu Pi và Pi+1 là các
4 – láng giềng (trường hợp còn lại thì PiPi+1 là hướng lẻ) Hình 1.3 dưới đâybiểu diễn chu tuyến của ảnh, trong đó, P là điểm khởi đầu chu tuyến
Hình 1.5 Ví dụ về chu tuyến của đối tượng ảnh
1.1.4 Các định dạng cơ bản trong xử lý ảnh
Trang 11Trong quá trình xử lý ảnh [1], một ảnh thu nhận vào máy tính phảiđược mã hóa Hình ảnh khi lưu trữ dưới dạng tệp tin sẽ được số hóa Một sốdạng ảnh đã được chuẩn hóa như: Ảnh IMG, PCX, JPEG, TIFF, GIF, …
• Ảnh IMG: Là ảnh đen trắng, phần đầu của ảnh có 16 bytes chứa cácthông tin cần thiết Ảnh IMG được nén theo từng dòng Mỗi dòng bao gồmcác gói Các dòng giống nhau cũng nén thành một gói
• Ảnh PCX: Định dạng ảnh PCX là một trong những định dạng ảnh cổđiển nhất, phần đầu của ảnh có 128 bytes chứa các thông tin cần thiết nóthường được dùng để lưu trữ ảnh vì thao tác đơn giản, cho phép nén và giảinén nhanh Quá trình nén và giải nén được thực hiện trên từng dòng ảnh
• Ảnh JPEG: Là định dạng tập tin hầu hết các loại máy ảnh số và phầnmềm xử lý ảnh đều hỗ trợ tương thích JPEG chứa thông tin trung thực củamàu sắc: 24 bit cho một điểm (pixel) JPEG là một tiêu chuẩn của kỹ thuậtnén ảnh Tỷ lệ nén có thể đạt tới 10:1 [17] nhưng phải trả giá bằng chất lượng
• Ảnh TIFF: Phần đầu của ảnh có 8 bytes chứa các thông tin cần thiết
Nó là ảnh mà dữ liệu chứa trong tệp thường được tổ chức thành các nhómdòng ( cột) quét của dữ liệu ảnh TIFT là lựa chọn cho mục đích lưu trữ ảnhlâu dài tuy nhiên dung lượng cồng kềnh
• Ảnh GIF: Với định dạng ảnh GIF những vướng mắc mà các địnhdạng khác gặp phải khi số màu trong ảnh tăng lên không còn nữa Dạng ảnhGIF cho chất lượng cao độ phân giải đồ họa cũng đạt cao, cho phép hiển thịtrên hầu hết các phần cứng Do dung lượng nhỏ gọn nên GIFT là lựa chọn lýtưởng cho các ứng dụng web nhưng không phù hợp để lưu trữ ảnh
Trang 121.2.1.1 Không gian màu
Không gian màu là sự biểu diễn tập các màu, một số không gian màu được
sử dụng rộng rãi trong đồ họa máy tính Màu sắc thường được xác định trongkhông gian màu 3 chiều
Không gian màu RGB
Không gian màu RGB là không gian màu được sử dụng nhiều nhất cho
đồ hoạ máy tính Đây là không gian màu cộng: đỏ, xanh lục và xanh lơ đượckết hợp lại để tạo ra các màu khác Không gian này không đồng nhất về nhậnthức Không gian màu RGB có thể được trực quan hoá như một hình khối,như được minh hoạ trong Hình 1.6
Trang 13Hình 1.6 Không gian màu RGB được trực quan hoá như một hình khối
Mỗi trục màu (R, G, B) có độ quan trọng như nhau Do đó, mỗi trục nênđược lượng hoá với cùng một độ chính xác Khi không gian màu RGB đượclượng hoá, số các bin sẽ luôn luôn là một hình khối Thông thường, 8 (23), 64(43), 216 (63), 512 (83) bin được sử dụng trong lượng hoá không gian màuRGB Chuyển đổi từ một ảnh RGB sang một ảnh cấp xám nhận được tổngcủa R, G và B rồi chia kết quả cho ba
Không gian màu HSx
Không gian màu HSI, HSV, HSB và HSL [15] thường được gọi là HSx
có mối liên quan gần gũi với sự nhận thức về màu sắc của con người hơn làkhông gian màu RGB Những trục từ không gian màu HSx mô tả những đặctính của màu như sắc độ, độ bão hoà và độ sáng Sự khác nhau giữa nhữngkhông gian màu HSx là sự biến đổi của chúng từ không gian màu RGB,chúng thường được mô tả bằng những hình dạng khác nhau (như hình nón,hình trụ) Trong hình 1.7 không gian màu HSV được mô tả như hình nón
Trang 14Hình 1.7 Mô tả không gian màu HSV
Sắc độ là thành phần của không gian màu HSx Sắc độ là góc giữanhững đường tham chiếu và điểm gốc màu trong không gian màu RGB Vùnggiá trị này từ 00 đến 3600 Theo uỷ ban quốc tế về màu sắc CIE thì sắc độ làthuộc tính của cảm giác có liên quan đến thị giác, qua đó một vùng xuất hiệntương tự với một màu được cảm nhận như red, green, blue hoặc là sự kết hợpcủa hai trong số những màu được cảm nhận Cũng theo CIE độ bão hoà làmàu được đánh giá theo tỷ lệ độ sáng của nó Trong hình nón độ bão hoà làkhoảng cách từ tâm đến cạnh hình nón Chiều cao của đường cắt chính là giátrị đây chính là độ sáng hoặc độ chói của màu Khi độ bão hoà S bằng 0 thì Hkhông xác định, giá trị nằm trên trục V biểu diễn ảnh xám Không gian màuHSV dễ dàng lượng tử hoá Mức lượng tử hoá thông dụng trong không gianmàu này là 162 mức với H nhận 18 mức, S và V nhận 3 mức
Trang 15 Không gian màu YUV và YIQ
Các không gian màu YUV và YIQ được phát triển cho truyền hình vôtuyến Không gian màu YIQ là giống như không gian màu YUV, ở đây mặtphẳng I-Q là một mặt phẳng quay 33 0của mặt phẳng U-V Tín hiệu Y biểudiễn độ chói của một pixel và là kênh duy nhất được sử dụng trong ti vi đentrắng U và V cho YUV và I và Q cho YIQ là các thành phần màu
Kênh Y được định nghĩa bởi các giá trị năng lượng có trọng số củaR(0.299), G(0.587) và B(0.144) Các không gian màu YUV và YIQ không làđồng nhất nhận thức Khi các không gian màu YUV và YIQ được lượng hoá,mỗi trục được lượng hoá với cùng độ chính xác
Không gian màu CIE XYZ và LUV
Không gian màu [13] được phát triển đầu tiên bởi CIE là không gianmàu XYZ Thành phần Y là thành phần độ chói được định nghĩa bởi tổngtrọng số của R(0.212671), G(0.715160), B(0.072169), X và Z là các thànhphần màu Không gian màu CIE LUV là sự biến đổi của không gian màuXYZ Kênh L là độ chói của màu, kênh U và V là những thành phần màu Vìvậy khi U và V được đặt bằng 0 thì kênh L biểu diễn ảnh xám Trong lượng tửhoá không gian màu LUV mỗi trục được lượng tử hoá với mức xác định Sơ
đồ lượng tử hoá thường được sử dụng cho hai không gian màu này là 64, 125,
216 mức
1.2.1.2 Lược đồ màu
Lược đồ màu được xác định bằng một tập các bin, trong đó mỗi bin biểuthị xác suất của các pixel trong ảnh Một lược đồ màu H của một ảnh đã chođược xác định bởi véc tơ:
H={H[0], H[1], H[2], , H[i], H[N]}
Trang 16Ở đây i biểu diễn một màu trong lược đồ màu và tương ứng với một khối con trong không gian màu RGB, H[i] là số các pixel có màu i trong ảnh và N
là số các bin trong lược đồ màu
Mỗi pixel trong ảnh sẽ thuộc về một bin của lược đồ màu của ảnh, vì thếvới lược đồ màu của một ảnh, giá trị của mỗi bin là số các pixel cùng màu Để
so sánh các ảnh có các kích cỡ khác nhau, các lược đồ màu được chuẩn hóa.Lược đồ màu chuẩn hóa H’ được xác định bằng:
H’={H’[0], H’[1], H’[2], , H’[i], H’[N]},
Ở đây H' [i] H p[i], P là tổng số các pixel trong ảnh
Trong lược đồ lượng hóa không gian màu lý tưởng, các màu riêng biệtkhông được định vị trong cùng hình khối con và các màu tương tự được gánvào cùng hình khối con Sử dụng một số màu sẽ giảm khả năng các màutương tự được gán vào các bin khác nhau, nhưng cũng tăng khả năng các màuriêng biệt được gán vào cùng các bin, nội dung thông tin của các ảnh sẽ giảm.Mặt khác, các lược đồ màu với một số lượng lớn các bin sẽ chứa nhiều thôngtin về nội dung của ảnh, theo đó giảm khả năng các màu riêng biệt sẽ đượcgán vào cùng các bin Tuy nhiên, chúng tăng khả năng các màu tương tự sẽđược gán vào các bin khác nhau và tăng không gian lưu trữ biểu diễn ảnh vàthời gian tính toán khoảng cách giữa các lược đồ màu Do đó, cần có sự thỏahiệp trong việc xác định số lượng các bin sẽ được sử dụng trong các lược đồ màu
1.2.2 Kết cấu
Kết cấu là một mô tả vùng trợ giúp tốt trong quá trình tra cứu Kết cấukhông có khả năng tìm ra các ảnh tương tự, nhưng nó có thể được sử dụng đểphân lớp các ảnh kết cấu từ các ảnh không kết cấu và sau đó được kết hợp vớicác thuộc tính đặc trưng khác như màu để làm cho tra cứu hiệu quả hơn Mộttrong những biểu diễn phổ biến nhất của đặc trưng kết cấu là ma trận đồngkhả năng được đề xuất bởi Haralick và cộng sự Ma trận dựa trên hướng và
Trang 17khoảng cách pixel Các thống kê từ ma trận đồng khả năng được trích rút vàđược biểu diễn như thông tin kết cấu Tamura và cộng sự [6] đã đề xuấtphương pháp trích rút sáu thuộc tính kết cấu đặc trưng: Độ nhám(coarseness), tương phản (contrast), hướng (directionality), khả năng(likeliness), đều (regularity) và thô (roughness).
Bước tiếp theo là sử dụng các mô tả thích hợp cho các vùng này sao chochúng có thể được sử dụng trong khi đối sánh các vùng của các ảnh khácnhau Các mô tả hình được chia thành ba loại: Các mô tả dựa vào đường biênxác định các thuộc tính của đường biên Các kỹ thuật dựa vào đường biên sửdụng các phác thảo vùng để tính toán hình Mô tả Fourier là một trong nhữngphương pháp phổ biến thuộc về loại này Trong kỹ thuật này, đường biên củamột vùng đã cho được thu và được biến đổi Fourier Các hệ số Fourier trộiđược sử dụng như các mô tả hình Các mô tả khác trong loại này là các mômen hình
Nếu một vùng có một hình phức hợp, nó có thể được phân tách tiếp thànhcác hình đơn giản hơn như các hình chữ nhật hoặc các hình tròn và một sốthuộc tính của các hình đơn giản này và các quan hệ của chúng có thể được sử
Trang 18dụng cho các mô tả hình Các mô tả vùng khác gồm màu và kết cấu Một sốđặc tính của vùng như trọng tâm, không cụ thể đối với đường biên hoặc nộidung của vùng.
1.3 Tổng quan về phân đoạn ảnh
1.3.1 Phân đoạn ảnh
Phân đoạn ảnh [1] là một thao tác ở mức thấp trong toàn bộ quá trình
xử lý ảnh Quá trình này thực hiện việc phân vùng ảnh thành các vùng rời rạc
và đồng nhất với nhau hay nói cách khác là xác định các biên của các vùngảnh đó Các vùng ảnh đồng nhất này thông thường sẽ tương ứng với toàn bộhay từng phần của các đối tượng thật sự bên trong ảnh Vì thế, trong hầu hếtcác ứng dụng của lĩnh vực xử lý ảnh, thị giác máy tính, phân đoạn ảnh luônđóng một vai trò cơ bản và thường là bước tiền xử lý đầu tiên trong toàn bộquá trình trước khi thực hiện các thao tác khác ở mức cao hơn như nhận dạngđối tượng, biểu diễn đối tượng, nén ảnh dựa trên đối tượng, hay truy vấn ảnhdựa vào nội dung, v.v Ở thời gian đầu, các phương pháp phân vùng ảnh đượcđưa ra chủ yếu làm việc trên các ảnh mức xám do các hạn chế về phương tiệnthu thập và lưu trữ Ngày nay, cùng với sự phát triển về các phương tiện thunhận và biểu diễn ảnh, các ảnh màu hầu như thay thế hoàn toàn các ảnh mứcxám trong việc biểu diễn và lưu trữ thông tin do các ưu thế vượt trội hơn hẳn
so với ảnh mức xám Do đó, các kỹ thuật, thuật giải mới thực hiện việc phânvùng ảnh trên các loại ảnh màu liên tục được phát triển để đáp ứng các nhucầu mới Các thuật giải, kỹ thuật này thường được phát triển dựa trên nền tảng
các thuật giải phân vùng ảnh mức xám đã có sẵn
Phân đoạn ảnh là chia ảnh thành các vùng không trùng lặp Mỗi vùnggồm một nhóm pixel liên thông và đồng nhất theo một tiêu chí nào đó Tiêuchí này phụ thuộc vào mục tiêu của quá trình phân đoạn Ví dụ như đồng nhất
về màu sắc, mức xám, kết cấu, độ sâu của các layer
Trang 191.3.2 Một số phương pháp phân đoạn ảnh
Để đánh giá chất lượng của quá trình phân đoạn là rất khó Vì vậy trướckhi phân đoạn ảnh cần xác định rõ mục tiêu của quá trình phân đoạn là gì Xétmột cách tổng quát, ta có thể chia các hướng tiếp cận phân đoạn ảnh thành banhóm chính như sau:
• Các phương pháp phân đoạn ảnh dựa trên không gian đặc trưng
• Các phương pháp dựa trên không gian ảnh
• Các phương pháp dựa trên các mô hình vật lý
Các phương pháp dựa trên không gian đặc trưng
Nếu chúng ta giả định màu sắc bề mặt của các đối tượng trong ảnh làmột thuộc tính bất biến và các màu sắc đó được ánh xạ vào một không gianmàu nào đó, vậy thì chúng ta sẽ có một cái nhìn đối với mỗi đối tượng trongảnh như là một cụm các điểm trong không gian màu đó Mức độ phân tán củacác điểm trong trong một cụm được xác định chủ yếu bởi sự khác biệt về màusắc Một cách khác, thay vì ánh xạ các pixel trong ảnh vào một không gianmàu cụ thể, ta xây dựng một histogram dựa trên các đặc trưng màu cho ảnh
đó (ví dụ như Hue), và thông thường, các đối tượng trong ảnh sẽ xuất hiệnnhư các giá trị đỉnh trong histogram đó Do đó, việc phân vùng các đối tượngtrong ảnh tương ứng với việc xác định các cụm hoặc xác định các vùng cực trịcủa histogram
Các phương pháp tiếp cận này chỉ làm việc trên một không gian màuxác định Dựa trên không gian đặc trưng, ta có các phương pháp phân đoạn:
- Phương pháp phân nhóm đối tượng không giám sát
- Phương pháp phân lớp thích nghi k -trung bình
- Phương pháp lấy ngưỡng lược đồ
Các phương pháp dựa trên không gian ảnh
Trang 20Hầu hết những phương pháp được đề cập trong phần trên đều hoạtđộng dựa trên các không gian đặc trưng của ảnh (thông thường là màu sắc).
Do đó, các vùng ảnh kết quả là đồng nhất tương ứng với các đặc trưng đãchọn cho từng không gian Tuy nhiên, không có gì đảm bảo rằng tất cả cácvùng này thể hiện một sự cô đọng về nội dung xét theo nghĩa không gian ảnh(ý nghĩa các vùng theo sự cảm nhận của hệ thần kinh con người) Mà đặc tínhnày là quan trọng thứ hai sau đặc tính về sự thuần nhất của các vùng ảnh Docác phương pháp gom cụm cũng như xác định ngưỡng lược đồ đã nêu đều bỏqua thông tin về vị trí của các pixel trong ảnh
Trong các báo cáo khoa học về phân vùng ảnh mức xám, có khá nhiều
kỹ thuật cố thực hiện việc thoả mãn cùng lúc cả hai tiêu chí về tính đồng nhấttrong không gian đặc trưng của ảnh và tính cô đọng về nội dung ảnh Tuỳtheo các kỹ thuật mà các thuật giải này áp dụng, chúng được phân thành cácnhóm sau:
- Các thuật giải áp dụng kỹ thuật chia và trộn vùng
- Các thuật giải áp dụng kỹ thuật tăng trưởng vùng
- Các thuật giải áp dụng lý thuyết đồ thị
- Các giải thuật áp dụng mạng neural
- Các giải thuật dựa trên cạnh
Các phương pháp dựa trên mô hình vật lý
Tất cả các giải thuật được xem xét qua, không ít thì nhiều ở mặt nào đóđều có khả năng phát sinh việc phân vùng lỗi trong các trường hợp cụ thể nếunhư các đối tượng trong ảnh màu bị ảnh hưởng quá nhiều bởi các vùng sánghoặc bóng mờ, các hiện tượng này làm cho các màu đồng nhất trong ảnh thayđổi nhiều hoặc ít một cách đột ngột Kết quả là các thuật giải này tạo ra cáckết quả phân vùng quá mức mong muốn so với sự cảm nhận các đối tượngtrong ảnh bằng mắt thường Để giải quyết vấn đề này, các giải thuật phân
Trang 21vùng ảnh áp dụng các mô hình tương tác vật lý giữa bề mặt các đối tượng vớiánh sáng đã được đề xuất Các công cụ toán học mà các phương pháp này sửdụng thì không khác mấy so với các phương pháp đã trình bày ở trên, điểmkhác biệt chính là việc áp dụng các mô hình vật lý để minh hoạ các thuộc tínhphản chiếu ánh sáng trên bề mặt màu sắc của các đối tượng
Phân đoạn là bước then chốt trong xử lý ảnh, nếu phân đoạn không tốt
sẽ dẫn đến sai lệch kết quả ở các bước tiếp theo Có nhiều phương pháp đểphân đoạn ảnh, tuy nhiên không có một phương pháp phân đoạn nào là vạnnăng – theo nghĩa là có thể áp dụng cho mọi loại ảnh và cũng không có mộtphương pháp phân đoạn ảnh nào là hoàn hảo
Chương 2 PHÂN ĐOẠN ẢNH THEO MÔ HÌNH TÁCH, GHÉP VÙNG
Trang 222.1 Phân đoạn ảnh theo mô hình tách vùng
2.1.1 Tách vùng theo phương pháp tách cây tứ phân
Phương pháp tách cây tứ phân [1] dựa trên nguyên tắc kiểm tra tínhhợp thức của tiêu chuẩn đồng nhất một cách tổng thể trên miền lớn của ảnh.Nếu tiêu chuẩn được thoả việc phân đoạn coi như kết thúc Trong trường hợpngược lại, chia miền đang xét thành 4 miền nhỏ hơn, áp dụng đệ quy bằngphương pháp trên cho mỗi miền nhỏ hơn cho đến khi tất cả các miền đềuthoả mãn tiêu chuẩn đồng nhất Thuật toán được mô tả như sau:
Thuật toán tách cây tứ phân
Input : Ảnh I coi là một miền
Chia miền đang xét thành 4 miền: Z1, Z2, Z3, Z4
For i=1 to 4 Do PhanDoan(Zi)
End
Else Exit
End;
Hình 2.1 Thuật toán tách cây tứ phân
Tiêu chuẩn xét miền đồng nhất ở đây có thể dựa vào mức xám Có thểdựa vào độ lệch chuẩn (6-8) hay độ chênh giữa giá trị mức xám lớn nhất và
Trang 23giá trị mức xám nhỏ nhất Giả sử Max và Min là giá trị mức xám lớn nhất vànhỏ nhất trong miền đang xét Nếu:
Max - Min T(ngưỡng)
Ta coi miền đang xét là miền đồng nhất, trong trường hợp ngược lại, miềnđang xét là không đồng nhất và sẽ được chia làm 4 phần
Thuật toán kiểm tra tiêu chuẩn dựa vào độ chênh max, min được viếtnhư sau:
Giả thiết ảnh có tối đa 255 mức xám
(N1,M1)( N2,M2) là tọa độ điểm đầu và điểm cuối của miền
If I[i,j] Min then Min = I[i,j];
If I[i,j] Max then Max = I[i,j];
If ABS(Max-Min) T then KT_vung = 0 Else KT_vung = 1;
End
Nếu hàm trả về giá trị 0 có nghĩa vùng đang xét là đồng nhất, trườnghợp ngược lại nghĩa là vùng đang xét là không đồng nhất Trong giải thuậttrên, khi miền là đồng nhất cần tính lại giá trị trung bình và cập nhật lại ảnhđầu ra Giá trị trung bình được tính bởi:
Tổng giá trị mức xám/ tổng số điểm trong vùngThuật toán này tạo nên một cây mà mỗi nút cha có 4 nút con ở mọimức, trừ mức ngoài cùng Vì thế cây này có tên là cây tứ phân Cây này
Trang 24cho ta hình ảnh rõ nét về cấu trúc phân cấp của các vùng tương ứngvới tiêu chuẩn.
Hình 2.2 Minh họa thuật toán tách cây tứ phân
Hình 2 2 m inh họa thuật toán tách cây tứ phân: ảnh gốc (a) được chiathành 4 phần được kết quả phân mức 1 (b), tiếp tục thực hiện đối với cácphần nhỏ ta được phân mức 2 (c), phân mức 3 (d)
a Ảnh
gốc
b Phân mức 1
Trang 25Hình 2.3 Cây tứ phân tương ứng
Gốc của cây là ảnh ban đầu, một vùng thoả tiêu chuẩn tạo nên một nút
lá, nếu không sẽ tạo nên một nút nhánh và có 4 nút con tương ứng với việcchia làm 4 vùng Ta cứ tiếp tục như vậy cho đến khi cây phân xong Các nút
lá của cây biểu diễn số vùng đã phân theo tiêu chuẩn
Giả sử chọn tiêu chuẩn phân vùng là màu sắc và quy ước mọi điểmcủa vùng là màu trắng sẽ tạo nên một nút lá trắng và tương tự như vậy vớinút lá đen Nút màu ghi có nghĩa là vùng không thuần nhất và phải tiếp tục chia
2.1.2 Tách theo vùng đồng nhất
Trong phần này, tôi trình bày thuật toán CSI tách ảnh thành các vùngđồng nhất [7] Tôi áp dụng thuật toán cân bằng lược đồ để phân cụm các màuđược chọn Với mỗi màu được chọn, thuật toán được áp dụng với một không
gian ảnh theo cả trục x và y Kết quả của thuật toán là một tập các vùng với mỗi màu Vùng BR i được biểu diễn bởi hình chữ nhật (x , y , x , y i )
br i br i tl i
Trang 26Thuật toán CSI được mô tả như sau:
Đầu tiên, toàn bộ ảnh đã cho Img được coi như một vùng Trong bước
đầu tiên, ảnh có thể được tách thành hai vùng phụ thuộc vào hàm giá trị
Cost(BR i) và màu phân cụm sử dụng kỹ thuật cân bằng lược đồ Với mỗivùng, một điều kiện tách được sử dụng để xác định một vùng có được phânhoạch hay không Nếu các mẫu quan sát rơi vào vùng lệch đáng kể so với kỳvọng, vùng cần phân hoạch tiếp, với mỗi vùng cần xác định hàm giá trị
Cost(BR i ), để xác định vùng BR i hoặc được phân hoạch theo chiều ngang hoặcphân hoạch theo chiều dọc
Kỳ vọng có thể được tính toán theo kinh nghiệm về phân bố mẫu Nếucác mẫu quan sát quá xa kỳ vọng, phân hoạch vùng cần được tiếp tục và với
mỗi vùng cần xác định giá trị hàm giá, để xác định BR i sẽ được phân hoạchtheo chiều ngang hay dọc Phương pháp dựa trên tri thức về phân bố phụthuộc vào kinh nghiệm chuyên gia sẽ đánh giá kỳ vọng được mô tả như dưới
Độ lệch giữa một quan sát i và kỳ vọng được tính theo công thức:
) i ( E
) i ( E ) i ( obs
(2.1)
Nếu DX vượt quá một ngưỡng T, vùng bị bỏ qua đối với phân hoạch tiếp
theo Trong trường hợp ngược lại, vùng hiện tại sẽ được thêm vào Stack chophân hoạch tiếp theo Quá trình phân hoạch được lặp cho đến khi một trongcác điều kiện sau được thoả mãn: tất cả các vùng là thuần nhất hoặc số cácmẫu trong một vùng nhỏ hơn một ngưỡng đã cho
Giá trị Cost(BR i) được tính như sau:
) DX
, Max(DX
)
Ký hiệu DX selectedrow là kỳ vọng trong dòng selectedrow, DX selectedcol là kỳ
vọng trong cột selectedcol
) DX
, Max(DX
DX selectedro w toprow bottomrow (2.3)
Trang 27Ký hiệu DX toprow và DX bottomrow là kỳ vọng trong dòng toprow và bottomrow theo các hướng trên xuống/dưới lên và các giá trị này được tính
toán theo công thức ở dưới:
(i) E
(i) E
(i) obs
DX
toprow
toprow toprow
toprow
(i) E
(i) E
(i) obs
DX
bottomrow
bottomrow bottomrow
) DX
, Max(DX
DX selectedco l leftcol rightcol (2.6)
Tương tự, ký hiệu DX leftcol , DX rightcol là kỳ vọng trong dòng
leftcol/rightcol theo các hướng trái sang phải/phải sang trái và các giá trị này
được tính theo công thức sau:
(i) E
(i) E
(i) obs
DX
leftcol
leftcol leftcol
leftcol
(i) E
(i) E
(i) obs
DX
rightcol
rightcol rightcol
rightcol
Nếu Cost(BR i ) bằng DX selectedrow, thì BR i được phân hoạch theo chiều
dọc Trong trường hợp ngược lại, nếu Cost(BR i ) bằng DX selectedcol , BR i đượcphân hoạch theo chiều ngang
Thuật toán trích rút màu và thông tin không gian CSI được mô tả như sau:
(2.8)
Trang 28Thuật toán CSI
Input: Img - ảnh
minarea – ngưỡng diện tích của vùng
T – ngưỡng nhiễu
C - Tập màu
Output: BR - thông tin không gian của vùng màu
For (i=1; i<=|C|; i++) {
Hình 2.4 Thuật toán CSI
Trong thuật toán CSI có ba tham số minarea, Cost(BR i ) và T, trong đó:
- Tham số minarea là diện tích tối thiểu của một vùng Nếu diện tích của một vùng nhỏ hơn minarea, vùng không được sử dụng cho
phân hoạch tiếp theo
- Nếu Cost(BR i ) bằng DX selectedrow, vùng này được phân hoạch theo
chiều dọc Trong trường hợp ngược lại, nếu Cost(BR i) bằng
DX selectedcol vùng được phân hoạch theo chiều ngang
- Tham số T là ngưỡng nhiễu được chấp nhận của mỗi vùng
Trang 29Kết quả của thuật toán này là thông tin không gian của mỗi màu của ảnh
được biểu diễn bởi một danh sách <(c 1 ; br 1 ),(c 2 ; br 2 ), ,(c n ; br n )>, trong đó:
độ góc trên bên trái và góc dưới bên phải của hình chữ nhật tương ứng
Ví dụ: Cho ảnh nhị phân I có cỡ 1010 điểm ảnh.
a/ Vùng BR1 b/Vùng BR2
Hình 2.6 Ảnh I sau khi được tách ra thành hai vùng BR1 và BR2
Trang 30Bảng 2.1 Tính độ lệch DX selectedrow cho phân hoạch theo dòng của ảnh I .
Ảnh I được tách ra thành hai vùng BR 1và BR 2 như được chỉ ra trong
Hình 2.6 ở trên là do giá trị độ lệch theo cột DX selectedcol lớn hơn giá trị độ lệch
theo dòng DX selectedrow Hơn nữa, DX selectedcol đạt giá trị lớn nhất tại cột thứ 3 tính
từ bên trái Do đó, vùng được tạo ra từ cột thứ 1 đến cột thứ 3 của ảnh I tính
từ bên trái có độ thuần nhất lớn nhất (xem Bảng 2.1 và Bảng 2.2)
Trang 31Bảng 2.2 Tính độ lệch DX selectedcol cho phân hoạch theo cột của ảnh I .
Ở đây vùng BR 2 được tách ra thành hai vùng con theo chiều ngang vàhướng từ phải qua trái như được chỉ ra ở Hình 2.7
Trang 32a/ Vùng BR 2,1 b/ Vùng BR 2,2
Hình 2.7 Vùng BR 2 sau khi được tách ra thành hai vùng BR2,1 và BR2,2
Bảng 2.3 Tính độ lệch DX selectedrow cho phân hoạch theo dòng của vùng BR 2.
Trang 33Vùng BR 2 được tách ra thành hai vùng BR 2 , 1 và BR 2 , 2 như được chỉ ra
trong Hình 2.7 ở trên là do giá trị độ lệch theo cột DX selectedcol lớn hơn giá trị độ
lệch theo dòng DX selectedrow Hơn nữa, DX selectedcol đạt giá trị lớn nhất tại cột thứ 6tính từ bên trái Do đó, vùng được tạo ra từ cột thứ 6 đến cột thứ 7 của vùng
2
BR tính từ bên trái có độ thuần nhất lớn nhất (xem Bảng 2.3; Bảng 2.4)
Bảng 2.4 Tính độ lệch DX selectedcol cho phân hoạch theo cột của vùng BR 2.
2.2 Phân đoạn ảnh theo mô hình ghép vùng
2.2.1 Ghép vùng theo phương pháp HAC
Phương pháp phân cụm phân cấp xây dựng một cấu trúc cây phân cấpcho các đối tượng và có hai phương pháp chính là xây dựng cây theo hướng
từ trên xuống (top-down) và xây dựng theo hướng từ dưới lên (bottom-up).
Với phương pháp bottom-up, đầu tiên mỗi đối tượng được coi như một