2. Tìm kiếm ảnh dựa vào hình dạng
2.3. So khớp với ảnh phát họa
Kh oa CNTT -
ÐH KHT
N TP.HCM
Kh oa CNTT -
ÐH KHT
N TP.HCM
1. Hình dạng:
1.1. Khái niệm vềhình dạng:
Màu sắc và vân là những thuộc tính có khái niệm toàn cục của một bức ảnh.
Trong khi đó, hình dạng không phải là một thuộc tính của ảnh. Thay vì vậy, hình dạng có khuynh hướng chỉ định tới một khu vực đặc biệt của ảnh. Hay hình dạng chỉlà biên củađối tượng nàođó trongảnh.
1.2.Đặcđiểm hình dạng với việc tìm kiếmảnh
Hình dạng là một cấp cao hơn màu sắc và vân. Nó đòi hỏi sự phân biệt giữa các vùng để tiến hành xử lý về độ đo của hình dạng. Trong nhiều trường hợp, sự phân biệt này cần thiết phải làm bằng tay. Nhưng sự tự động hóa trong một số trường hợp có thể khả thi. Trong đó, vấn đề chính yếu nhất là quá trình phân đoạn ảnh. Nếu quá trình phânđoạn ảnh được làm một cách chính xác, rõ ràng và nhất là hiệu quả thì sự tìm kiếm thông tin dựa vào hình dạng có thể có hiệu lực rất lớn.
Nhận dạng ảnh hai chiều là một khía cạnh quan trọng của quá trình phân tích ảnh. Tính chất hình dạng toàn cục ám chỉ đến hình dạng ảnh ở mức toàn cục.
Hai hình dạng có thể được so sánh với nhau theo tính chất toàn cục bởi những phương pháp nhận dạng theo hoa văn, mẫu vẽ. Sự so khớp hình dạng ảnh cũng có thể dùng những kỹ thuật về cấu trúc, trong đó một ảnh được mô tả bởi những thành phần chính của nó và quan hệ không gian của chúng. Vì sự hiển thị ảnh là một quá trình liên quan đến đồ thị, do đó những phương pháp so khớp về đồ thị có thể được dùng cho việc so sánh hay so khớp. Sự so khớp về đồ thị rất chính xác, vì nó dựa trên những quan hệ không gian hầu như bất biến trong toàn thể các phép biến đổi hai chiều. Tuy nhiên, quá trình so khớp về đồ thị diễn ra rất chậm, thời gian tính toán tăng theo cấp số mũ tương ứng với số lượng các phần tử. Trong việc tìm kiếm dữ liệu ảnh dựa
Kh oa CNTT -
ÐH KHT
N TP.HCM
Kh oa CNTT -
ÐH KHT
N TP.HCM
vào nội dung, ta cần những phương pháp có thể quyết định sự giống và khác nhau một cách nhanh chóng. Thông thường, chúng ta luôn đòi hỏi sự bất biến cả đối với kích thước của ảnh cũng như hướng của ảnh trong không gian. Vì vậy, một đối tượng có thể được xác định trong một số hướng. Tuy nhiên, tính chất này không thường được yêu cầu trong tìm kiếm ảnh. Trong rất nhiều cảnh vật, hướng của đối tượng thường là không đổi. Ví dụ như: cây cối, nhà cửa, ...
Độ đo về hình dạng rất nhiều trong phạm vi lý thuyết của bộ môn xử lýảnh. Chúng trải rộng từ những độ đo toàn cục dạng thô với sự trợ giúp của việc nhận dạng đối tượng, cho tới những độ đo chi tiết tự động tìm kiếm những hình dạng đặc biệt. Lượt đồ hình dạng là một ví dụ của độ đo đơn giản, nó chỉ có thể loại trừ những đối tượng hình dạng không thể so khớp, nhưng điều đó sẽ mang lại khẳng định sai, vì chỉ như là việc làm của lượt đồ màu. Kỹ thuật dùng đường biên thì đặc hiệu hơn phương pháp trước, chúng làm việc với sự hiện hữu của đường biên của hình dạng đối tượng và đồng thời cũng tìm kiếm những hình dạng đối tượng gần giống với đường biên nhất. Phương pháp vẽ phác họa có thề là phương pháp có nhiều đặc trưng rõ ràng hơn, không chỉ tìm kiếm những đường biên đối tượng đơn, mà còn đối với tập những đối tượng đã được phân đoạn trong một ảnh mà người dùng vẽ hay cung cấp. Ta sẽ đi vào chi tiết trong chương sau mô tả về hình dạng đối tượng.
2. Tìm kiếm ảnh dựa vào hình dạng:
2.1. Lượt đồ hình dạng:
Lượtđồhình dạngđược cho rằng là dễdàng trong tính toán và nhanh trong thi hành. Chúng sửdụng cảsựso sánh vềmàu sắc và vân. Vấnđềchính làđịnh nghĩa biến cho lượtđồhình dạngđượcđịnh nghĩa. Xem nhưhình dạng trongảnh là một vùng những giá trịmột trongảnh nhịphân, trong khi toàn thểnhững giá trịkhác
Kh oa CNTT -
ÐH KHT
N TP.HCM
Kh oa CNTT -
ÐH KHT
N TP.HCM
thông qua hình chiếuđứng và hình chiếu nằm của hình dạng. Giảsửrằng hình dạng có n hàng và có m cột. Mỗi hàng và mỗi cột là một bin trong lượtđồhình dạng.
Tổng số được lưu trữtrong một bin là tổng sốnhững giá trị1 được lưu trữtrong dòng hoặc cột tươngứngđó.Điều nàyđưađến một lượtđồgồm có m+n bin, nhưngđiều này cũng chỉcó ý nghĩa khi tất cảnhữngảnh chúng ta xem xét phải có cùng một kích thước.Đểlàm cho việc so khớp hình chiếu bất biếnđối với kích thước, sốlượng bin của dòng và sốlượng bin của cột phảiổnđịnh. Bằng cáchđịnh nghĩa những bin từgóc trái trênđến góc phải dưới của hình dạng, sựchuyểnđổi bất biếnđãđạt được. Việc so khớp hình chiếu không bất biến đối với phép xoayảnh, nhưng nó có thểlàm việc tốt với sựxoay nhỏvà sựthiếu chính xác thuộc vềhình họcởmứcđộnhỏ. Một cách khácđểlàm nó bất biếnđối với phép quay là tính toán theo trục toạ độêlíp
vừa nhất và xoay chúng chođến khi trục chính là trục nằm ngang. Vì chúng ta không biết nơiđâu là phía trên cùng của hình dạng, xoay hai khảnăng có thểxảy ra đểthử. Hơn nữa, nếu trục chính và trục phụcó cùng chiều dài, thì 4 khảnăng xoay phảiđược xem xét. So khớp hình chiếuđược sửdụng thành công trong tìm kiếm ảnh logo.
Những khảnăng khácđểxây dựng lượtđồthông qua góc tiếp tuyến tại mỗi điểmảnh trên đường bao của hình dạng.Độ đo này thì hoàn toàn tự động vềmặt kích thước và bất biếnđối với sựdịch chuyển, nhưng nó cũng không bất biếnđối với xoay đối tượng, bởi vì góc tiếp tuyếnđượctính từhình dạngđối với một hướng xácđịnh. Có một sốcách khác nhauđểgiải quyết vấnđềnày. Cách thứnhất là xoay hình dạng vềtrục chính như đã mô tả ởtrên. Một cách khácđơn giản hơn là xoay lượtđồhình dạng. Nếu lượtđồcó K bin, thì sẽcó K khảnăng xoay. Những vị trí xoay không đúng có thểlàmảnh hưởng tốcđộcủa việc tính toán, đặc biệt là trong trường hợp lượtđồvàảnh có kích thước lớn. Hoặc là lượtđồcó thể được tiêu chuẩn hoá bởi cách chọn bin với số đếm lớn nhất là binđầu tiên. Một vài bin lớn nhất nênđược thửvì có thểcó sựtồn tại của nhiễu.
2.2. Độ so khớp đường biên của hình dạng:
Thuật toán so khớpđường biênđòi hỏi sựtrích rút và trình bày đường biên của cả
Kh oa CNTT -
ÐH KHT
N TP.HCM
Kh oa CNTT -
ÐH KHT
N TP.HCM
một dãy nhữngđiểmảnh hay có thể được xấp xỉbởi mộtđa giác.Đối với một dãy nhữngđiểmảnh, một loại so khớp cổ điển là dùng mô tảFourierđểso sánh hai hình dạng với nhau. Trong toán học hàm liên tục, mô tảFourier là những hệsốcủa dãy triển khai Fourier của hàm màđịnh nghĩađường biên của hình dạngảnh. Trong trường hợpđặc biệt, hình dạngđược trình bày bởi dãy của mđiểm<V0,V1,...,Vm-1>.
Từnhững dãyđiểm này, một dãy của vectơ đơn vị:
k k
k k
k V V
V v V
−
= −
+ + 1 1
và một dãy của những sai phân:
∑= − −
= k
i
i i
k V V
l
1
1 , k>0
0 =0 l
có thể được tính.
Mô tảFourier {a-M,...,a0,...,aM} sau đóđược xấp xỉbởi:
∑=
−
− −
= m
k
l L jn k k
n v v e k
L L n a
1
) / 2 ( 1
2
) (
2 ) (
1 π
π
Những mô tảnày có thể được dùngđể định nghĩađộ đo khoảng cách hình dạng.
GiảsửQ làảnh truy vấn và I làảnh mang hình dạngđược so sánh với Q. Gọi {anQ} là dãy của những mô tảFourier choảnh truy vấn, và {aQn } là mô tảFourier cho ảnh. Khiđóđộ đo khoảng cách Fourier nhưsau:
2 / 2 1
) ,
(
−
= ∑
−
= M
M n
Q n I n
Fourie I Q a a
d
Kh oa CNTT -
ÐH KHT
N TP.HCM
Kh oa CNTT -
ÐH KHT
N TP.HCM
Như đã mô tả, khoảng cách này chỉbất biếnđối với phép tịnh tiến. Nếu mà những bất biến khácđòi hỏi, có thểdùng sựkết hợp với nhiều hàm sốhọc thểgiải quyết vấnđềtỷlệ, xoay, vàđiểm bắtđầuđểcực tiểu hoá dFourier(I,Q)
Nếu màđường biên được trình bày dưới dạng mộtđa giác, chiều dài của các cạnh và góc giữa chúng có thể được tính và dùngđểtrình bày hình dạng. Một hình dạng có thể được trình bày bởi một dãy nhữngđiểm nối liền nhau (Xi, Yi, αi), với cặpđường thẳng giao nhau tạiđiểm (Xi, Yi) với góc lớn αi. Cho một dãy Q = Q1, Q2, ..., Qncủa nhữngđiểm nối liền nhau trình bày đường biên củađối tượng truy vấn Q và một dãy tương tựI=I1, I2, ..., Imtrình bày đường biên củađối tượng I, mục tiêu là tìm một ánh xạtừQ tới I mà ánh xạtừdãy phânđoạn củaảnh truy vấn tới dãy có chiều dài tương tựphânđoạn củaảnh và sao cho cặp của dãy phânđoạn truy vấn gần kềmà gặp tại một gócđặc biệt α nên ánh xạtới một cặp những dãy phân đoạn gần kềmà gặp nhau tại một góc α' tương tự.
Một kỹthuật so khớpđường biên khác là so khớp mềm dẻo (elastic matching) trongđó hình dạng truy vấnđược làm biến dạngđểtrởnên càng giống với hình dạngảnh mẫu càng tốt. Sựcách biệt giữa hình dạngảnh truy vấn và hình dạng củaảnh mẫu dựa vào hai thành phần chính: (1) năng lượngđòi hỏi trong quá trình biến dạng từhình dạngảnh truy vấn tới mức độphù hợp nhất với hình dạng trongảnh mẫu. Và (2) sự đo lường về độgiống nhau giữa hình dạngảnh truy vấn sau khi bịbiến dạng khớp với hình dạng trongảnh mẫu.
2.3. So khớp ảnh phát họa :
Hệthống so khớp phát họa cho phép người dùng nhập vào một bản phát họa của nhữngđường biên chính trong mộtảnh và sau đó hệthống sẽtìm kiếm những ảnh màu hayảnh xám mà cóđường biên khớp nhất. Nhữngảnh màu được tiền xử lý nhưsauđể đạtđược một dạng trung gian gọi làảnhđược trích rút (abstract image).
- Áp dụng phép biếnđổi affineđểgiảm kích thướcảnh vềkích thước chỉ định trước. Dùng một mặt nạtrung vị đểlọc nhiễu. Kết quảcủa bước này cho ra mộtảnhđược tiêu chuẩn hóa
Kh oa CNTT -
ÐH KHT
N TP.HCM
Kh oa CNTT -
ÐH KHT
N TP.HCM
- Dò biên sửdụng thuật toán dò tìm đường biên dựa trên gradient. Dò biên được tiến hành qua hai bước: những biên toàn cục sẽ được tìm thấy trước tiên với một ngưỡng toàn cục dựa trên giá trịtrung bình và biếnđổi của gradient; sauđó, nhữngđường biên cục bộsẽ được chọn từtoàn cục theo những ngưỡng cục bộ. Kết quảcủa bước này cho raảnh gọi làảnhđãđược lọc biên (refined edge image).
- Tiến hành làm mảnh và rút ngắn trênảnhđãđược lọc biên. Kết quảcuối cùngđược gọi làảnhđược trích rút.
Khi người sửdụng nhập vào một bứcảnh phát họaởdạng thô nhưlà mộtảnh truy vấn, nó cũng lần lượtđượcđưa qua các giaiđoạn chuẩn hóa kích thước, nhịphân hóa, làm mảnh hoá, và rút gọn. Kết quảcủa quá trình xửlý này cho ra mộtảnh gọi là bản phát họađều nét. Giờ đây, bản phát họađều nét phảiđược so khớp với nhữngảnhđược trích rútởtrên. Thuật giải so khớp là thuật giải dựa vào mối tương quan. Haiảnh sẽ được chia ra làm những hệthống lưới ô vuông.Đối với mỗi hệ thống lưới ô vuông củaảnh truy vấn, tương quan cục bộvới hệthống lưới ô vuông tươngứng củaảnh cơsởdữliệu sẽ được tính.Đểthiết thực hơn, tương quan cục bộ được tính cho một vài những dịch chuyển khác biệt trong vịtrí trong hệthống ô lưới trên nhữngảnh cơsởdữliệu và giá trịtương quan cựcđại qua tất cảnhững dịch chuyển là kết quảcủa cho hệthống ô lướiđó.Độ đo sựgiống nhau cuối cùng là tổng của mỗi tương quan cục bộ.Độ đo khoảng cách là nghịchđảo củađộ đo sự giống nhau này.
Từnhững chú giải trên, nó có thể được biểu diển lại dưới dạng sau:
))]
( )), ( ( ˆ (
[ ) 1
,
( 1
g L g A shift d
ax Q m
I
d Q
n n correlatio g n
sketch
= ∑
trongđó AI(g) quy cho hệthống ô lưới g củaảnhđược trích rútđược tính từ ảnh cơ sởdữliệu I,shift(AI(g)) quy cho phiên bản được dịch chuyển của hệthống lưới g
Kh oa CNTT -
ÐH KHT
N TP.HCM
Kh oa CNTT -
ÐH KHT
N TP.HCM
của cùngảnhđược trích rút, và LQ(g) quy cho hệthống ô lưới g của bản họađều nét có kết quảtừ ảnh truy vấn Q.
Kh oa CNTT -
ÐH KHT
N TP.HCM
Kh oa CNTT -
ÐH KHT
N TP.HCM
PHẦN 3 CÀI ĐẶT VÀ
KẾT QUẢ THỬ NGHIỆM