Ý tưởng cốt lõi của việc nhận dạng và phân loại hình ảnh là phân tích ảnh từ các dữ liệu thu được bởi các cảm biến hình ảnh như camera, Webcam,.... Để thực hiện tốt công việc nhận dạng v
Trang 1LỜI GIỚI THIỆU
Trong những năm gần đây, xử lý hình ảnh (image processing) đã đạt được nhiều
thành tựu và tiến bộ vượt bậc Trong đó, nhận dạng và phân loại hình ảnh là một trong
những lĩnh vực được theo đuôi một cách tích cực nhất Ý tưởng cốt lõi của việc nhận dạng và phân loại hình ảnh là phân tích ảnh từ các dữ liệu thu được bởi các cảm biến hình ảnh như camera, Webcam, Nhờ các hệ thống xử lý ảnh, con người đã giảm được khối lượng công việc cũng như tăng sự chính xác trong việc đưa ra các quyết
định liên quan đến xử lý hình ảnh trên nhiều lĩnh vực: quân sự và quốc phòng, các hệ
thống kỹ nghệ hoá sinh, giải phẫu, các hệ thống giao thông thông minh, robotics, các
hệ thống an ninh
Nhận dạng và phân tích ảnh là một lĩnh vực liên ngành Để thực hiện tốt công việc nhận dạng và phân tích này, đòi hỏi người nghiên cứu phải am hiểu nhiều lĩnh vực trong đó đặc biệt là các lĩnh vực liên quan tới cảm biến, các hệ thống xử lý ảnh,
các giải thuật xử lý hình ảnh/tín hiệu, VLSI, phần cứng và phan mém, cdc hé thống
tích hợp
Mục đích của luận văn này là trình bầy một phương pháp nhận dạng vật thể dựa
trên thuật toán kth-law ECP-SDE Theo đó, tôi sẽ lần lượt trình bày về cơ sở lý thuyết của việc xử lý ảnh, nhận dạng vật thể,chương trình MATLAB với các hộp công cụ về khảo sát và xử ly anh(image acquisition toolbox va image processing toolbox), cac giai thuật liên quan: FFT, Kth-law ECP-SDF và chương trình mô phỏng nhận dạng vật bat
biến theo tỉ lệ
Bởi thời gian hạn hẹp cũng và nhiều hạn chế về kiến thức trong lĩnh vực hết sức mới mẻ này, tôi mong luận văn này sẽ trình bày một sự hiểu biết tương đối về xử lý ảnh nói chung và nhận dạng vật thể nói riêng Đồng thời, hy vọng rằng trong một tương lai không xa sẽ có điều kiện ứng dụng những nghiên cứu đã đạt được trong luận văn này vào thực tê
Trong quá trình hoàn thành luận văn, tôi xin đặc biệt cảm ơn tới Ths Nguyễn thị
Thanh Vân và PGS.TS Trần Quanh Vinh Đồng thời tôi cũng xin cảm ơn tất cả các thầy cô giáo đã dạy tôi trong suốt 4 năm học qua tại trường Đại học Công Nghệ, Đại
học Quốc gia Hà Nội
Trang 2CHƯƠNG 1
MỞ ĐẦU
1.1 Bài toán nhận dạng vật thể và mục đích của luận văn
Cho đến nay việc sử dụng các cảm biến hình ảnh như camera, Webcam đã trở
nên hết sức phô biến trong đời thường cũng như trong lĩnh vực xử lý ảnh Việc sử
dụng chương trình MATLAB như một công cụ hữu ích trong xử lý hình ảnh cũng không còn xa lạ đối với nhiều người Tuy vậy, nhận dạng vật thê vẫn là một lĩnh vực hêt sức hâp dân và còn nhiêu điêu cân khám phả
Dù cho các công nghệ về nhận dạng và phân loại ảnh đã đạt được nhiều thành tựu đáng chú ý, lĩnh vực này vẫn phải đối mặt với nhiều vẫn đề lớn về kỹ thuật cần giải quyết Các vấn đề này thường bao gồm: sự “méo' của vật thê do môi trường có nhiễu, góc quay từ cảm biến hình ảnh tới vật thể Đôi khi sự thay đổi của vật thể cần nhận dạng không được biểu diễn một cách chính xác do các giải thuật được ứng dụng
với tập dữ liệu hạn chế Ngoài ra, còn nhiều vẫn đề nảy sinh trong thực tế làm cho vật
cân nhận dạng bị 'méo” trong quá trình xử lý hình ảnh Trong các điều kiện thực tế khó khăn này, một hệ thống nhận dạng đáng tin cậy cần phải thực thi được chức năng nhận dạng và phân loại theo thời gian thực với tỉ lệ chuẩn xác cao Do đó, việc cái tiến
và phát triển các hệ thống xử lý ảnh cũng như các giải thuật là điều hết sức cần thiết đôi với nhận dạng và phân loại vật thê cân sự chính xác và tôc độ cao
Đã có nhiều kỹ thuật được phát triển và ứng dụng trong lĩnh vực nhận dạng và
phân loại vật thể: nhận dạng đường biên, nhận dạng qua mẫu sắc vật thể, các thuật
toán lọc nhiễu, tuy nhiên phần lớn các kỹ thuật này gặp khó khăn đo vật thể bi thay đổi về hình dạng đưới các góc quay khác nhau của cảm biến hình ảnh Luận văn này trình bày một kỹ thuật hiệu quả để giải quyết vẫn đề đó Đó là kỹ thuật nhận dạng vật thê dựa trên thuật toán kth-law ECP-SCF Đông thời, trong khuôn khổ luận văn này tôi cũng giới thiệu chương trình nhận dạng vật thể theo thời gian thực dùng thuật toán này
được viết trên MATLAB
1.2 Tổ chức luận văn
Luận văn được trình bày thành chương
Chương 1, tác giá trình bày tóm tắt về vẫn đề cần giải quyết cũng như tổ chức của luận văn
Trang 3Chương 2 Tổng quan về xử lý ảnh — Nhận dạng vật thẻ, tác giả trình bày về các khái niệm thường gặp và các giai đoạn trong xử lý ảnh nói chung và nhận dạng vật thê nói riêng
Chương 3 Nhận dạng vật bằng xử lý ảnh, tác giả giới thiệu về các phương pháp
chung nhất trong nhận dạng vật thể qua việc sử dụng các hàm: tương quan tuyến tính
và tương quan phi tuyến Đồng thời trình bày về lý thuyết của biến đổi Fourier rời rạc(DFT), biến đổi Fourier nhan (FFT) cũng như thuật toán của bộ lọc tổng hợp ECP-
SDF bac k
Chương 4 Xử lý ảnh với Matlab, tác giả giới thiệu về chương trình matlab và ứng dụng Matlab trong xử lý ảnh Đồng thời tác giả đã giới thiệu về các hộp công cụ xử lý anh (image processing toolbox) va thu nhan anh (image acquisition toolbox) cung cac lệnh thường dùng
Chương 5 Thực nghiệm và kết quả, tác giả trình bày về các bộ lọc đơn, bộ lọc tổng hop ECP-SDF bac k và thí nghiệm áp dụng các bộ lọc trong nhận dạng vật Đồng
thời, trong chương này tác giả cũng đưa ra các ý kiến đánh giá về các khó khăn, giải pháp khắc phục và các ứng dụng có thể dùng tới bộ lọc tổng hợp ECP-SDF bậc k
Trang 4CHƯƠNG 2
TONG QUAN VE XU’ LY ANH - NHAN DANG VAT THE
2.1 Xử lý ảnh (số) và các khái niệm liên quan:
2.1.1 Xử lý ảnh (số)
Xử lý ảnh (số) là một dạng của xử lý tín hiệu trong đó đầu vào là một hình ảnh (các bức ảnh, các khung hình) và đầu ra của quá trình xử lý ảnh có thể là một hình ảnh khác hoặc là một tập chứa các tính chất hoặc tham số liên quan tới hình ảnh đó Phần
lớn các kỹ thuật xử lý ảnh thì thường qui về việc xử lý hình ảnh như là một tín hiệu 2 chiều rồi sử dụng các kỹ thuật xử lý tín hiệu để xử lý nó
2.1.2 Cac khai njiém lién quan:
* Diém anh(Picture Element)
Gốc của ảnh(ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng Để xử lý bằng máy tính(số), ảnh cần phải được số hoá Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí(không gian) và độ sáng (mức xám) Khoảng cách giữa điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay goi tat là Pixel Trong khuôn khổ ảnh hai chiều, mỗi Pixel ứng với cap toa dé (x,y)
Như vậy, điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x,y) với độ xám hoặc màu nhất định Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về kkhong gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh
* Độ phân giải của ảnh
Theo định nghĩa ở trên thi mỗi Pixel gồm một cặp toạ độ (x,y) và màu Độ phân giải của ảnh chính là tích số của giá trị lớn nhất của x với giá trị lớn nhất của y
VD: Màn hình máy tính có nhiều loại với độ phân giảI khác nhau: màn hình
CGA (Color Graphic Adaptor) có độ phân giải 320 x 200; màn hình VGA (Video
Graphic Array) độ phân giải 1280 x 800;
Trang 5Rõ ràng màn hình có độ phân giải càng cao thì ta có cảm giác nó càng “mịn” hơn
so với loại có độ phân giáI thấp hơn
ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác ) với mức
xám ở các diém ảnh có thê khác nhau
ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức ding 1 bit mô tả 2Ì mức
khác nhau hay mỗi điểm ảnh nhị phân chi có 1 trong 2 giá trị hoặc là 1 hoặc là 2 ảnh màu: với mỗi điểm ảnh thì người ta dung 3 byte để mô tả mức màu (do thế giới màu được tạo nên từ 3 màu cơ bản: đỏ(red), lục(blue) và lơ(green)) Do đó có 2Ÿ”
=2”'=16,7 triệu màu
* Biểu diễn ảnh
Trong biểu diễn ảnh, người ta thường dùng các phần tử đặc trưng của ảnh là pixel Do đó ta có thê biểu diễn một ảnh bởi một hàm 2 biến chứac thông tin Các mô hình biểu diễn ảnh cho ta một mô tả lô gic hay định lượng các tính chất của hàm này Chất lượng ảnh hoặc tính hiệu quả của các kỹ thuật xử lý phụ thuộc vào nhiều yếu tố như: độ phân giải, nhiễu
Để xử lý được ảnh, thì ảnh đó phal được lẫy mẫu (sample) rôI lượng tử hoá (quantization) Tức là đầu tiên chuyển từ ánh tương tự sang ảnh số sau đó lưu giá trị của từng điểm ảnh với một số hữu hạn các mức xám
* Tăng cường và khôi phục ảnh
Tang cuong anh (image enhancement):
Khi ảnh được chuyén từ dạng này sang dạng khác bởi các quá trình như: truyền
ảnh, quét ảnh, thì ảnh nhận được thường có chất lượng thấp hơn so với ảnh ban đầu
Để giúp người ta có thể quan sát bức ảnh một cách chính xác hơn thì đòi hỏi phải có biện pháp để nâng cao chất lượng ảnh Qúa trình này được gọi là tăng cường ảnh
(image enhancement).
Trang 6Tăng cường ảnh giúp loại bỏ các suy giảm (degradation) gây ra bởi hệ thống xử
lý hoặc kênh xử lý ảnh Ngày nay, nhu cầu phát triển các hệ thống tự động cho việc
xử lý hình ảnh ngày càng phát triển, kéo theo nó là sự cần thiết trong việc loại bỏ sai
số cũng như các yếu tô nhiễu trong qúa trình xử lý Do đó, tăng cường ảnh có thể được coi như một tập hợp các kỹ thuật để nâng cao chất lượng hình ảnh đồng thời tập hop
này cũng được ding để nâng cao độ chính xác trong quá trình tìm kiếm tự động và
chuyên đôi dạng của bức ảnh
Các kỹ thuật tăng cường ảnh có thê kế đến: kỹ thuật tương phản (contrast), ánh
xạ (mapping- gán mỗi mức xám từ ảnh gốc với một mức xám khác của ảnh đã được
biên dịch), Nói chung, các kỹ thuật tăng cường ảnh này đều nhăm mục đích đạt được kết qủa tốt nhất Những kỹ thuật này thường dựa trên các sự kết hợp giữa các phương pháp biến đổi trên miền không gian và miễn tần số
Khôi phục ảnh (image restoration):
Khôi phục ảnh là quá trình loại bỏ các suy giảm (degradation) trong ảnh Có nhiều nguyên nhân dẫn đến sự suy giảm
Khi camera không tập trung tiêu cự một cách hợp lý có thê dẫn đến bức ảnh bị
“nhòc"
Khi chụp ảnh trong điều kiên thời tiết không thuận lợi: sương mù, qúa nắng
nóng, cũng có thê làm cho bức ảnh bị “nhòc'
Chụp ảnh các vật đang chuyển động cũng có thể gây ‘nhde’ cho bite ảnh
Do có nhiều nguyên nhân gây nên suy giảm ảnh vì vậy, đối với mỗi loại nguyên nhân phải có các cách phục hồi khác nhau Khôi phục ảnh phần lớn được thực hiện bằng cách tìm ra các giải thuật nhằm phục hồi lại các thông tin bị thất lạc trong quá
trình xử lý ảnh
Chúng ta cũng cần phân biệt tăng cường ảnh với khôI phục ảnh: trong khi tăng
cường ảnh nhằm tăng chất lượng của bức ảnh thì khôI phục ảnh nhằm đưa lại hình ảnh
gốc của bức ảnh đã bị suy giảm Các kỹ thuật tăng cường ảnh không áp dụng được với
khô[T phục ảnh
*, Biến đổi ảnh (image transformation)
Thuật ngữ biến đôi ảnh thường dùng để nói tới các kỹ thuật dùng để biến đổi ảnh
Ơ đây ảnh có thê được co1 như một chuỗi các tín hiệu một chiêu được biêu diễn bởi
Trang 7các hàm cơ sở Có nhiêu biên đôi được dùng như: biên đôi Fourier, cosin, sin,
karhumen loeve,
Trong khuôn khô luận văn này, ở phần sau tôI sẽ trình bày về các biến đổi Fourier: DFT, FFT, IDFT, Day là các bién déi rat phô dụng và đã được tôI thực tế
ap dung trong qua trình nghiên cứu
* Phan tich anh (image analysis)
Sau các bước tiền xử lý ảnh, ảnh đã được tăng cường hay được khôi phục để làm
nổi các đặc trưng chủ yếu Lúc này nó bắt đầu được đưa vào quá trình phân tích Quá
trình phân tích ảnh gom các công đoạn: trích chọn các đặc tinh (feature extraction),
phân đoạn ảnh (segmentation) thành các phần tử Tuỳ theo mục đích của việc xử lý, các giai đoạn tiếp theo của quá trình phân tích ảnh có thể là nhận dạng ảnh (phân thành các lớp có miêu tả) hay là giảI thích và miêu tả ảnh Hình 1 mô tả tóm lược các bước của quả trình phân tích ảnh:
ảnh đầu ra của | Trích chọn Phân Phân
quá trình tiên XL] ac tinh đoạn loai
Hình 1 Các bước trong phân tích anh
Phân tích ảnh thường dựa trên việc phân tích các đặc trưng của ảnh: mật độ xám,
phân bố xác suất, phân bố không gian, biên ảnh,
2.1.3.Nhận dạng và phân loại ảnh (recognition and classification of image partterns)
* Nhan dang anh (recognition of image partterns):
Khi một bức ảnh đã được phân đoạn, nhiệm vụ tiếp theo là nhận dạng vật thê
hoặc vùng đã được phân đoạn Mỗi một vật thê là một thành phần ở trong ảnh và các
Trang 8giá trị đo được là các đặc tính của thành phần đó Một tập các vật thê cùng có các đặc tính giống nhau được gọi là m6t ‘lop vat thé’(pattern class)
Theo đó có thể định nghĩa, nhận dạng là quá trình phân loại các đối tượng được
biểu diễn theo một mô hình nào đó và gán cho chúng vào một lớp (gán cho đối tượng một tên gọi) dựa theo những quy luật và các mẫu chuẩn
Sự nhận dạng ảnh thường dựa trên nhiều tính chất của vật và với mỗi tính chất
đều có các kỹ thuật nhận dạng khác nhau VD: Mỗi chữ cáiI trong tiếng Anh đều là một
tập các đường thăng đứng, ngang, chéo hoặc cong Trong khi chữ “A° được mô tả bởi
2 đường chéo và một đường năm ngang thì chữ “B' được mô tả bởi một đường thắng đứng với 2 đoạn cong Một số tính chất của các vật thể 2 hoặc 3 chiều là diện tích, thể tích, chu vi, bề mặt, có thể đo được thông qua việc tính toán số “pixel° Tương tự như vậy, bang của một vật được đặc trưng bởi đường biên của nó Một số tham số để xác định bang của một vật là cac mô-ment bắt biến (invariant moment), đường trung bình (medial axis) của vật thể
Mau của một vật cũng là đặc điểm hết sức quan trọng được dùng trong nhận dạng Kỹ thuật dùng để phát hiện các đặc tính của vật thê gọi là kỹ thuật trích chọn đặc tính (feature extraction) Khi đó vật thê được miêu tả như một tập các đặc tính Sự lựa
chọn và tách lay các tính chất thích hợp được coi như là van dé co bản đầu tiên trong nhận dạng ảnh
* Phân loại thành phần anh (classification of image patterns)
Phân loại là một công đoạn quan trọng trong quá trình nhận dạng vật Đã có
nhiều kỹ thuật phân loại được sử dụng trong việc nhận dạng thành phan Một số kỹ thuật phân loại được biết như là những kỹ thuật lý thuyết chính xác Với những kỹ
thuật lý thuyết chính xác này, phân loại một thành phần chưa biết được quyết định dựa
trên một số nguyên tắc hoặc đã xác định hoặc có ý nghĩa thống kê hoặc thậm chí đôi
khi còn chưa được xác định rõ Hình 1 thê hiện quá trính phân loại
Trang 9
Vật cần Trích chọn Bộ phân loại Kết quả
kiểm tra đặc tính đã phân
Các kỹ thuật nhận dạng vật có mẫu chuẩn được chia làm 2 loại chính:
1.Phương pháp phân loại dựa trên việc thu nhận có giám sát(supervised learning)
2.Phuong pháp phân loại sử dụng các kỹ thuật không cần giám sát(nonsupervised learning)
Các giải thuật phân loại có giám sát có thể được phân thành các loại nhỏ hơn:
* Phân loại dựa vào tham số (Parametric classifiers)
* Phan loai khéng can tham s6 (Nonparametric classifiers)
Đối với phân loại có giám sát dựa trên tham số, thiết bị phân loại lay mẫu với
một tập gồm nhiều mẫu thành phần xác định nhằm tính toán các thông số thống kê của
mỗi loại thành phần như: trung bình số học, cong sai Cac vector đặc tính dau vao
đạt được trong thời gian lẫy mẫu của phân loại có giám sát được coi như các biến Guass
Các giải thuật không cần giám sát thường được sử dụng trong các bộ phân loại
theo khoảng cách nhỏ nhất (minimum distance classifer) và bộ phân loại tương đồng lớn nhất (maximum likelihood classifier)
Ngược lại, một số thông số không được quan tâm trong phương pháp phân loại
co giám sát không cần tham số Một số kỹ thuật của loại này là: K điểm lân cận gan
nhat (K-nearest neighbors), ctra s6 Parzen (Parzen window)
Đối với các phương pháp phân loại không cần giám sát, bộ phân loại sẽ chia toàn
bộ tập thông tin dựa trên một số tiêu chuẩn tương đồng Điều này cho kết quả là một
tập các thành phần trong đó mỗi thành phần thuộc về một lớp cụ thể nào đó.
Trang 10CHƯƠNG 3 NHẬN DẠNG VẬT BẰNG XỬ LÝ ẢNH
3.1.Tương quan tuyến tính và tương quan phi tuyến
Một đại lượng tương quan cho phép tính tóa mức độ giống nhau giữa 2 vật Biểu thức toán học thể hiện sự tương quan giữa 2 hàm số s(x,y) và r(x,y) được định nghĩa
bởi:
*
Trong biểu thức thỡ dấu hoa thị biêu diễn cho tớnh liờn hợp phức và @ thé hién tương quan chéo Nếu như các hàm số s(x,y) và r(x,y) thể hiện một bức ảnh được phân tích và một mẫu tham chiếu thỡ tương quan giữa chúng chính là phét đo sự trùng khớp
giữa các vật trong bức ảnh đối với mẫu tham chiếu Theo đó, sự tương quan có thể
được coi như một sự tính toán cấp độ giống nhau giữa chúng
Sự tương quan cũng có thể được biểu điển bởi các biến đôi Fourier Nếu như ký hiệu ^ biểu diễn cho biến đổi Fourier, hàm tương quan được biểu diễn bởi (3.1.1) có thê được biểu diễn bởi phương trình:
Trong đó TE' là biến đôi Fourier
Phương trình (3.1.2) cho thấy tỉ lệ tương quan giữa 2 hàm số có thể tính toán được bằng cách nhân các biến đổi fourier trong miền tần số và sau đó nghịch đỏa tích
số này Các hệ thể hiện sự tương quan được gọi là các hàm tương quan Mỗi hàm tương quan cho phép xử lý theo thời gian thực một dữ lượng thông tin lớn
Các hàm tương quan được mô tả bởi phương trình(2.1.1) cú rất nhiều hạn chế khi
cú thờm cóc thành phần nhiễu nền Thêm vào đó, các hàm tương quan này không còn chính xác khi bức ảnh bị 'méo' do tỉ lệ thay đổi, vật bị di chuyển hay điều kiện ánh sáng không ổn định Áp dụng các kỹ thuật lọc trong không gian khác nhau trước khi thực hiện biến hồi Fourier trong miền tần số cho phép khắc phục những vấn đề này Ví dụ: việc nhận dạng các vật bị ảnh hưởng bởi các biến đổi tỉ lệ cũng như góc quay là hoàn toàn có thể thực hiện.
Trang 11Một toán tử phi tuyến tác động đến các biến đổi Fourier của bức ánh và mẫu
tham chiếu được gọi là một hàm tương quan phi tuyến Hàm tương quan phi tuyến thường được sử dụng do các đặc tính ưu việt của nó so với hàm tương quan tuyến tính trên nhiều khía cạnh như khử nhiễu, khả năng phân biệt Với các bộ xử ly bậc k, toán
tử phi tuyến được áp dụng một cách đối xứng với bức ảnh cũng nhuew với biến đổi
Fourier tham chiếu:
e(f) =sen(f)| f IF exo i, | ; k<1 (4.1.3)
Tham số k kiểm soát khả năng của hàm phi tuyến được áp dụng VD: với k=l
tương ứng với một kỹ thuật lọc tuyến tính; với k=0 tương ứng với một kỹ thuật phi
tuyến nhị phân; các giá trị khác của k cho phép thay đổi đặc tính của toán tử phi tuyến ø{) cũng như thay đổi tính chất của hàm tương quan (VD khả năng phân biệt hoặc bat biên đôi với cường độ sang) Chỉ sô k chính xác chỉ đạt được khi có một sự biêu
diễn chính xác của hàm tương quan.
Trang 12:
Biên đôi Fourier
Cac ky thuat loc
II TS See
THEY ARE THE 5TH AND
ALPHABET Biên đôi Các kỹ thuật
Biểu đồ của một bộ xử lý tương quan phi tuyến 3.2 Các kỹ thuật lọc phi tuyến trong nhận dạng theo tỉ lệ
Dé xây dựng các hệ thống nhận dạng vật theo tỉ lệ thỡ có nhiều cách tiếp cận
khóc nhau Điểm chung nhất giữa các hường tiếp cận là yêu cầu của việc lưu trữ thong
tin dựa trên các điều kiện “méo? khác nhau ảnh hưởng tới đối tượng
Cách thông dụng nhất để lưu giữ thông tin của sự “méo' của đối tượng là thiết kế một bộ lọc đơn giản cho mỗi loại “méo Khi đó ta nhắc tới việc thiết lập một bộ lọc thông dái Để xác định liệu đối tượng có bị méo hay không trong bức ảnh cần xử lý cần phải tương quan bức ảnh với nhiều bộ lọc với các dải thông khác nhau Do đó, kỹ thuật này thường tốn nhiều thời gian Các bộ lọc tổng hợp được đưa ra như là một đấp
án cho vân dé nay
Trang 13Thông tin trong bộ lọc tổng hợp thường chứa các cách nhỡn khỏc nhau đối với
đối tượng ở trong các điều kiện khác nhau (điều kiện về góc nhỡn, tỉ lệ tương quan, độ
chói ) Việc tông hợp tất cả những thông tỉn này trong một bộ lọc tông hợp được thực hiện trong một điều kiện với các giới hạn nhất định
Ưu điểm lớn nhất của việc dung các bộ lọc tong hợp so với các bộ lọc thông dải
là việc tiết kiệm được thời gian trong quá trỡnh xử lý Chỉ với một phép tương quan
đơn giản có thể so sánh bức ảnh của đối tượng với tất cả các bức anh trong tap anh
tham chiếu Mặc dù vậy, các bộ lọc tong hợp thường thiếu tính chính xác và khả năng
phân biệt trong nhận đạng Số lượng bức ảnh mẫu được dung để tham chiếu trong bộ
lọc tổng hợp được giới hạn nhăm đưa lại kết quả xử lý tốt nhất
Trong khuôn khô luận văn này, các bộ lọc phi tuyến sử dụng mặt phẳng Fourier được sử dụng như các bộ lọc phi tuyến tổng hợp Các kết quả thí nghiệm đó cho thay cóc bộ lọc phi tuyến trên mặt phẳng Fourier có thê thực thi tốt công việc ngay cả trong trường hợp có nhiều loại nhiễu khác nhau Hàm ECP-SDEF bậc k đó được sử dụng và phát triển trong nhiều ứng dụng thực tế và đó đưa lại những kết quả đáng tin cậy Vì
vậy, tụi xin phộp được sử dụng kết quả của thuật toán này đưa vào chương trình xử lý
ảnh của mạch nhằm đưa ra một giải pháp cho công việc xử lý ảnh
3.3 Thuật toán Kth_law ECP-SDEF (equal-correlation-peak synthetic
discriminant function) tam dịch là hàm phân biệt và tổng hợp ảnh tuân theo tỉ lệ
tương quan
Đặt s¡(x.y),s;¿(x.y) su(x,y) để biểu điễn cho N bức ảnh được chọn Đặt P là tổng số pixel của mỗi bức ảnh Thay cho một ma trận biểu diễn một bức ảnh ta sử dụng một khái niệm vector cú trật tự lexico* Mỗi vector cột gồm p phan tử đại diện cho mỗi bức ảnh bằng cách tái sắp xếp các hàng trong ma trận Các phân tử của vector được sắp xếp từ trái qua phải và từ trên xuống dưới Tiếp đến chúng ta sẽ xây dựng
một bức ảnh dữ liệu mẫu S có vector s; là cột thứ i của nó Khi đó S sé là một ma trận kích thước PxN Khi đó, một bộ lọc tổng hợp có trật tự lexico h(x,y) được biểu diễn
bởi công thức:
Trong đó:
S” là ma trận chuyên vị phức liờn hợp của S
() biéu dién sy nghịch đảo của ma trận
Trang 14Vector c chứa giá trị tương quan chéo mong muốn lớn nhất cho mỗi bức ảnh
C* là vector phức liên hợp của c Trong miễn tần số, (1) trở thành:
A A(/A+A N1
ký hiệu ^ biểu diễn cho biến đổi Fourier Khi đó bộ lọc phi tuyến
tông hợp h đạt được bang cách thay % ở (3.3.2) bởi S* Với S* là một ma trận phi
tuyến đối với mỗi phần tử Toán tử tuyến tính biểu diễn cho phần tử của hàng thứ r và
3.4 BIEN DOI FOURIER ROI RAC
Việc phân tích tín hiệu rời rạc theo thời gian trong miền tần số thường được thực hiện rất hiệu quả và tiện lợi băng bộ vi xử lý tín hiệu số Bộ vi xử lý này có thể là máy tính được sử dụng cho các mục đích chung hoặc là một thiết bị số chuyên dụng
Đề thực hiện việc phân tích này, tín hiệu rời rạc theo thời gian {x(n} cần được chuyển
từ miền thời gian sang miễn tần số tương ứng thông qua bién déi Fourier X (w) của
day Tuy vay, do X (@) 1a ham liên tục của biến tần số nên có thê thấy việc xử lý bằng máy tính của cách biểu diễn này là không thuận tiện
Trang 15Đề tránh nhược điểm nêu trên có thê đưa ra một cách biểu diễn khác của {x(n}
— biểu diễn thông qua việc lây mẫu phô X (@) của tín hiệu Như vậy, từ biểu diễn của
tín hiệu trong miền tần số liên tục ta đã đưa đến biến đổi Fourier rời rạc (DFT) Biến đổi này là một công cụ rất hiệu quả trong việc phân tích các tín hiệu rời rạc theo thời gian
3.4.1 Lấy mẫu trong mién tan sé va bién déi Fourier roi rac
Trước khi nghiên cứu DFT, ta hãy xét việc lẫy mẫu của biến đổi Fourier đôi với
dãy tín hiệu rời rạc theo thời gian không tuần hoàn và qua đây có thể thiết lập được quan hệ giữa biến đổi Fourier đã được lây mẫu và DFT
* Lấy mẫu trong miền tan số và khôi phục lại tín hiệu rời rạc theo thời gian
Chúng ta đã biết rằng mọi tín hiệu không tuần hoàn có năng lượng hữu hạn đều
có phô liên tục Hãy xét một tín hiệu không tuần hoàn rời rạc theo thời gian x (n) với
biến đôi Fourier:
Gia str tin hiéu X (w) được lấy mẫu tuần hoàn và khoảng cách giữa hai lần lẫy
mẫu liên tiếp là bằng nhau và bằng ồo radian Bởi vì X (@) là tuần hoàn với chu kỳ 2m
do vậy chỉ cần xét đến các mẫu được lẫy trong miền tần số cơ bản Nếu chọn khoảng
tần số cơ bản là 0 < œ < 2œ và số lượng mẫu được lấy trong khoảng này là N thì
khoảng cách giữa các lần lẫy mẫu sẽ là ồœ = 2z/N — xem hình 4.1
Nếu đánh giá (3.4.1) tại œ = 2xk /N, ta nhận được:
và đây chính là n mẫu được lẫy của X (œ)
Ta hãy chia tổng trong (3.4.2) thành một số lượng vô hạn các tổng, trong đó
mỗi tông có chứa N phân tử Như vậy công thức (3.4.2) có thê được viết thành:
Trang 16Nếu chỉ số n của tổng bên trong được thay đổi thành n - IN và vị trí của hai tổng được thay đổi cho nhau ta sẽ nhận được kết qua sau:
là tín hiệu nhận được do sự xếp chồng của vô tín hiệu x (n) đặt lệch nhau một chu kỳ
là N Rõ ràng rằng Xp (n) 1a tin hiệu tuần hoàn với chu kỳ cơ bản là N và do vậy nó có thể được khai triển qua chuỗi Fourier bằng công thức sau:
Bởi vì theo công thức (3.4.4) x; (n) là sự mở rộng một cách tuần hoàn của x (n)
do vậy x (n) có thể được khôi phục lại từ Xp (n) néu khéng c6 su “trim thoi gian” gitta các thanh phan cia x, (n) Điều này đòi hỏi x (n) phải có độ dài hữu hạn và độ dài L phải nhỏ hơn chu kỳ N của x, (n), Trên hình 4.2 mô tả hai trường hợp của tín higu x, (n) ứng với các trường hợp N > L và N < L Ở đây không làm mắt tính tổng quát ta có
Trang 17thê xem x (n) là một đãy có độ dài hữu hạn với các giá trị khác không trong khoảng 0
<n <L-1 Có thể đưa ra nhận xét rằng khi N >L thì:
X (n) = xX, (n), 0 <n <N-1
vì vậy x (n) có thể được khôi phục từ x; (n) mà không có sự sai lệch Mặt khác nếu N
< L thì sẽ không có khả năng khôi phục x (n) từ x; (n) do có sự tùm tín hiệu trong miền thời gian
Từ kết quả thu được ở trên ta suy ra phổ của tín hiệu không tuần hoàn rời rạc
theo thời gian không tuần hoàn với độ dài hữu hạn L có thể được khôi phục một cách
chính xác thông qua các mẫu của nó tại các tần số œ„ = 2xk/N nếu N > L Quá trình
này được thực hiện trước hết bằng việc xác định x; (n), n = 0, 1, 2, , N-1 thông qua
công thức (3.4.8) Khi N > L thì x(n) được xác định thông qua x,(n):
với các giá trị khác của n
và do vậy:
s(n) = YX Za eres O<n<N-l (4.1.10) Noe N 5 ¬ ¬ - oie
Nếu sử dụng công thức (3.4.1) và thay thế x(n) bằng (3.4.10) ta nhận được:
Trang 18Như vậy, có thể thấy cũng giống như trường hợp tín hiệu liên tục theo thời gian,
X(ø) có thê được xác định thông qua các mẫu X(2zk/N) của nó thông qua công thức
nội suy (3.4.12), với k = 0, 1, 2, , N-1 Điểm khác biệt ở đây là ở chỗ P(ø) không
có đạng của (sinÐ)/0 mà thay vào đó nó sẽ phụ thuộc vào tính chất tự nhiên của X(øœ)
Độ lệch pha trong (3.4.12) phản ánh tính chất của tín hiệu x(n) — nhân quá và là dãy có
độ dài hữu hạn N Đồ thị sin(œ@N/2)/(Nsin(œ/2) được thê hiện trên hình 4.3 với N = 5
Có thê thay rang ham P(@) có đặc tính:
của các mẫu phô
* Biến đôi Fourier rời rạc (DET)
Phần 4.1.1 đã xem xét việc lấy mẫu trong miền tần số của tín hiệu không tuần hoàn x(n) với năng lượng hữu hạn Trong trường hợp tông quát, các mẫu được lay
cách đều nhau theo tần số X(2zk/N), k = 0, 1,2, , N-1 sẽ không cho phép khôi phục
tín hiệu gốc x(n) có độ dài vô hạn Thay vào đó các mẫu này sẽ tương ứng với day tuần hoàn Xp(n) voi chu ky N Ở đây x;(n) là tín hiệu xấp xỉ của x(n) và quan hệ của chúng được biểu diễn qua công thức:
j=-œ
Khi day x(n) co độ dài hữu hạn L < N thì x;(n) đơn giản chỉ là sự lặp lại có chu
kỳ của x(n) và trong một chu kỳ đơn thì x;(n) sẽ được xác định bởi:
Boi vi x(n) = x,(n) trên một chu kỳ đơn (tin hiéu x(n) được đưa thêm N-L điểm mẫu không) do vậy tín hiệu gốc x(n) với độ đài hữu hạn sẽ có thể nhận được từ các mẫu tần số {X(2xk/N} thông qua công thức (3.4.8) Điều này chứng tỏ các mẫu tần số, X(2rnk/N), k= 0, 1,2, , N-1 sẽ cho phép xác định tín hiệu với độ dài hữu hạn x(n) một cách duy nhất
Trang 19Một điều quan trọng cần lưu ý là các giá trị không được đưa thêm vào sẽ không
cung cấp thêm bất kỳ một thông tin nào về phố X(@) của dãy x(n) và để có thể khôi phục lại X(œ) có thể sử dụng công thức (3.4.13) với L mẫu được lẫy cách đều nhau của X(œ) Tuy vậy việc đưa thêm N-L không vào x(n) và tính N điểm DFT sẽ làm cho
đồ thị của biên đôi Fourier trở nên tôt hơn
Nói tóm lại, đãy số x(n) với độ dài hữu hạn L (nghĩa là x(n) = 0 với n < 0 và n > L) có biến đổi Fourier:
L-1
n=0
Khi việc lay mau cua X(w) được thực hiện ở các tần số cách đều nhau œy =
2nk/N, k= 0, 1,2, , N-1 voi N>L thi cdc mau nhan duoc sé là:
£-1
X(k)= x( 7%) = Y x(nje 7%
N n=0 N-1
XŒ&)=Ð _x(me *, k =0,1,2, ,N—-1
n=0
Đề cho thuận tiện thì trong công thức này chỉ số trên của tổng được tăng từ L - llênN- I1 bởi vì x(n) =0 khin >L
Quan hệ (3.4.18) chính là công thức dùng để biến đổi dãy {x(n)} với độ dài L <
N thành đãy của các mẫu tần số {X(k)} với độ dài N Bởi vì các mẫu tần số nhận được bằng cách đánh giá giá trị của biến đôi Fourier X(@) tại N tần số rời rạc cách đều nhau
đo vậy quan hệ (3.4.18) được gọi là biến đổi Fourier rời rạc (DFT) của x(n) Ngược lại quan hệ (3.4.18) sẽ cho phép khôi phục dãy x(n) từ các mẫu tần số Biểu thức:
NI
n=0