1. Trang chủ
  2. » Luận Văn - Báo Cáo

TÌM HIẾU PHƯƠNG PHÁP NHẬN DẠNG ĐÓI TƯỢNG HÌNH HỌC 2D VÀ XÂY DỰNG CHƯƠNG TRÌNH MÔ PHÓNG ĐƠN GIẢN

50 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 50
Dung lượng 1,87 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

T đ đến nay, l nh vực này đã phát triển rộng lớn lên các ứng dụng c t nh thực tiễn rộng khắp trong nhiều l nh vực khác như trong hệ thống chụp hình gắn trên tàu vũ trụ, hệ thống nhận dạn

Trang 1



BÁO CÁO LUẬN VĂN

ĐỐI TƯỢNG HÌNH HỌC 2D VÀ XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG ĐƠN GIẢN

NGƯỜI THỰC HIỆN ĐỀ TÀI

 Nguyễn Hồng Khánh – 060207T

GIẢNG VIÊN HƯỚNG DẪN ĐỒ ÁN ThS NGUYỄN NGỌC LONG

TPHCM, ngày 21 tháng 6 năm 2010

Trang 2

LỜI CÁM ƠN

Em này xin chân thành cảm ơn khoa Công nghệ thông tin – Toán ứng dụng, trường Đại học Tôn Đức Thắng, TP.HCM đã tạo điều kiện cho em hoàn thành đồ án này

Đồng thời, em cũng xin gửi lời cảm ơn đến thầy Nguyễn Ngọc Long đã tận tình hướng dẫn, chỉ bảo cho em thực hiện đồ án này

Mặc dù em đã hết sức cố gắng, nhưng với vốn kiến thức còn hạn chế em không tránh khỏi những sai sót Em rất mong nhận được sự góp ý, chỉ dẫn của thầy cô để

có thể mở rộng và hoàn thiện hơn trong tương lai

Trang 3

NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

Trang 4

NHẬN XÉT CỦA GIẢNG VIÊN PHẢN BIỆN

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

Trang 5

MỤC LỤC

LỜI CÁM ƠN 2

NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN 3

NHẬN XÉT CỦA GIẢNG VIÊN PHẢN BIỆN 4

DANH MỤC HÌNH ẢNH 7

TÓM TẮT ĐỀ TÀI 8

Chương 1 : TỔNG QUAN VỀ ĐỀ TÀI 9

1.1 Giới thiệu đề tài : 9

1.2 Mục tiêu đề tài : 9

Chương 2 : SƠ LƯỢC VỀ ẢNH 10

2.1 Căn bản về dữ liệu ảnh : 10

2.2 Một số kiểu dữ liệu ảnh cơ bản : 13

2.3 Phương pháp đọc ảnh vào bộ nhớ : 15

CHƯƠNG 3 : CHUYỂN ĐỔI ẢNH MÀUTHÀNH ẢNH GRAYSCALE 16

3.1 Các phương pháp chuyển đổi : 16

3.2 Phương pháp BT709 : 19

3.3 Phương pháp RMY : 19

3.4 Phương pháp Y (YIQ/NTFS) : 20

CHƯƠNG 4 : PHƯƠNG PHÁP NHẬN DẠNG BIÊN 21

4.1 Một số phương pháp nhận dạng biên cổ điển : 21

4.2 Phương pháp Sobel : 24

4.3 Phương pháp Canny : 24

CHƯƠNG 5: CÁC PHƯƠNG PHÁP NHẬN DẠNG ẢNH 26

5.1 Sơ lược về nhận dạng ảnh : 26

5.2 Phân vùng ảnh : 31

5.2.1 Phương pháp phân vùng biên : 31

5.2.2 Phương pháp phân vùng dựa trên miền đồng nhất : 35

5.3 Nhận dạng dựa trên phân hoạch không gian : 35

5.4 Nhận dạng dựa trên cấu trúc ảnh : 43

5.4.1 Biểu diễn định tính : 43

5.4.2 Phương pháp ra quyết định dựa vào cấu trúc: 43

5.4.3 Phương pháp nhận dạng: 44

Trang 6

5.5 Luật ra quyết định : 45

Chương 6: TỔNG KẾT 48

6.1 Các vấn đề đạt được của đề tài : 48

6.2 Các vấn đề chưa đạt được của đề tài : 48

6.3 Hướng phát triển của đề tài : 48

6.4 Ý nghĩa của đề tài : 48

Phụ lục A : DANH MỤC TÀI LIỆU 49

THAM KHẢO 49

Phụ lục B : PHƯƠNG PHÁP ĐỌC ẢNH 50

VÀO BỘ NHỚ 50

Trang 7

DANH MỤC HÌNH ẢNH

Hình 1 : Gray level 10

Hình 2 : RGB color model 11

Hình 3 : CMYK model 11

Hình 4 : HSL - HSV color model 12

Hình 5 : YUV (Y=0.5) 12

Hình 6 : Header 13

Hình 7 : Bitmap header 15

Hình 8 : Thresholding 16

Hình 9 : Fixed threshold 17

Hình 10 : Histogram-Derived threshold 18

Hình 11 : Triangle algorithm 19

Hình 12 : Structure model 29

Hình 13 : Sơ đồ nhận dạng ảnh 31

Hình 14 : Lân cận Gradient của ảnh 32

Hình 15 : Ảnh làm mảnh bởi loại bỏ điểm cực đại 33

Hình 16 : Mô tả biên ảnh 34

Trang 8

TÓM TẮT ĐỀ TÀI

Xử l ảnh là một l nh vực không mới trên thế giới, tuy nhiên đây cũng là một

l nh vực c n non tr tại nước ta Lần đầu tiên xử l ảnh được xuất hiện, n chỉ là một dự án trong ph ng th nghiệm và ứng dụng sớm nhất là t nhiệm vụ Ranger 7 tại ph ng th nghiệm Jet Propulsion vào những n m đầu của thập k 60 T đ đến nay, l nh vực này đã phát triển rộng lớn lên các ứng dụng c t nh thực tiễn rộng khắp trong nhiều l nh vực khác như trong hệ thống chụp hình gắn trên tàu vũ trụ, hệ thống nhận dạng khuôn mặt người, hệ thống theo d i sự di tr của cá voi để c thể nhận dạng cá voi thông qua vô số bức ảnh chụp mặt biển,

Với những ứng dụng thực tiễn trên cùng với l ng đam mê tìm hiểu, khai phá tri thức, em chọn tìm hiểu phương pháp nhận dạng hình học 2D để làm luận v n như một tiền đề, một bước đệm để có thể được tìm hiểu sâu hơn, khai phá nhiều chân trời mới hơn trong chủ đề đầy ắp sự kỳ diệu, thú vị này Phương pháp nhận dạng hình học 2D này chỉ là một phần nhỏ trong l nh vực lớn hơn đ ch nh là nhận dạng các đối tượng có các ứng dụng đặc thù như nhận dạng vân tay, nhận dạng khuôn mặt, nhận dạng vật thể, Trong khuôn khổ luận v n, em chỉ nhận dạng các dạng hình học 2D đơn giản : hình tròn, hình vuông, hình ellipse, hình thoi, hình tam giác đều, hình bán nguyệt, hình chữ nhật, hình tam giác vuông cân và cài đặt minh họa

Trang 9

Chương 1 : TỔNG QUAN VỀ ĐỀ TÀI

1.1 Giới thiệu đề tài :

Với niềm đam mê và sự tò mò, ham học hỏi, khai phá về một l nh vực đầy ắp

sự kỳ diệu đ ch nh là l nh vực xử lý ảnh, em tìm hiểu về phương pháp để nhận dạng hình học 2D và xây dựng một chương trình ứng dụng đơn giản

1.2 Mục tiêu đề tài :

- Hiểu, nắm được phương pháp nhận dạng hình học

- Xây dựng được chương trình ứng dụng đơn giản

Trang 10

Chương 2 : SƠ LƯỢC VỀ ẢNH

2.1 Căn bản về dữ liệu ảnh :

Về cơ bản, hình ảnh là một mảng hai chiều, lưu trữ các số liệu, thông tin về

t ng pixel trên ảnh Màu sắc, độ xám của ảnh phụ thuộc vào các con số nằm trong mảng điểm ảnh này Kiểu dữ liệu đơn giản nhất là kiểu dữ liệu của các ảnh đen trắng N được gọi là ảnh nhị phân vì mỗi điểm ảnh chỉ lưu một trong hai giá trị 0 hoặc 1

Kiểu dữ liệu ảnh phức tạp hơn là ảnh xám, vì mỗi điểm ảnh nằm trong khoảng t 0 đến số mức xám mà thiết bị đọc ảnh có thể ghi nhận Hiện này, phần lớn ảnh xám mà chúng ta sử dụng có mức xám nằm trong khoảng t 0 đến

255 Ta có thể xem một sơ đồ mức ảnh xám thông thường như sau:

Hình 1 : Gray level

Những hình ảnh loại này trông như những ảnh trắng đen thông thường Bên cạnh đ c n c những ảnh màu Những ảnh loại này sở hữu trong mình kiểu dữ liệu phức tạp nhất Thông thường nhất, chúng ta gặp ảnh màu theo chuẩn RGB, tức mỗi điểm ảnh sẽ lưu trữ ba giá trị màu tương ứng với ba màu :

đỏ (Red), xanh lá(Green), xanh dương (Blue) Bên cạnh đ c n c các kiểu màu khác như CMYK (Cyan Magneta Yellow blacK), HSL (Hue Saturation

Lightness), HSV (Hue Saturation Value),

0

255

Trang 11

Hình 2 : RGB color model

Hình 3 : CMYK model

Trang 12

Hình 4 : HSL - HSV color model

Hình 5 : YUV (Y=0.5)

Trang 13

2.2 Một số kiểu dữ liệu ảnh cơ bản :

Qua phần trên, ch ng ta đã tìm hiểu những kiến thức c n bản về ảnh Ở phần này, chúng ta tìm hiểu thêm về ảnh, nhất là các kiến tr c lưu trữ ảnh Tính tới thời điểm hiện tại, đã c nhiều cách lưu trữ dữ liệu ảnh, t đ , ch ng ta c nhiều kiểu dữ liệu ảnh Một số kiểu dữ liệu ảnh mà ch ng ta thường dùng hiện nay : JPEG/JPG, BMP, PNG, TIFF,

Ở phần này chúng ta sẽ lấy kiểu dữ liệu chuẩn là BMP (Bitmap) để phân tích cấu trúc của kiểu dữ liệu này Định dạng BMP, ta có thể gọi là Bitmap hay cũng

có thể gọi là DIB (Device–independent bitmap) là định dạng hình ảnh c n bản trong Windows Định dạng này đơn giản nhất trong các định dạng ảnh, cho nên BMP dễ ghi và dễ đọc hơn các định dạng khác

Tâp tin BMP thường được chia làm bốn phần : Header, Bitmap header, Color palette, Bitmap data Header lưu trữ các thông tin cơ bản về ảnh như định dạng ảnh, k ch thước ảnh, Bitmap header lưu trữ các thông tin về ảnh Color palette lưu trữ bảng tra màu gán mức xam hay màu sắc cho một số trong Bitmap data, Bitmap data lưu trữ toàn bộ dữ liệu ảnh

Header chiếm 14 byte trong mọi file BMP Hai byte đầu lưu trữ kiểu tập tin, luôn luôn có giá trị hexa là 4D42 tương ứng với ký tự “BM” tượng trưng cho BMP file Bốn byte tiếp theo là k ch thước của tập tin BMP Bốn byte tiếp theo được để dành và luôn có giá trị Zero Bốn byte cuối cùng của header cho biết địa chỉ offset tới dữ liệu ảnh Giá trị này trỏ tới nơi mà dữ liệu ảnh bắt đầu (Giá trị này luôn luôn dương)

Hình 6 : Header

Trang 14

Bitmap header chiếm 40 byte trong dữ liệu BMP Bitmap header bắt đầu với

k ch thước của header (luôn là 40) Tiếp theo là chiều rộng và chiều cao của dữ liệu ảnh (là số dòng và cột) Nếu chiều cao là một số âm, hình ảnh được lưu trữ

t dưới lên (bottom-up) Đ là định dạng thông thường cho các tập tin BMP Số bit trên mỗi điểm ảnh cũng rất quan trọng Hai trường tiếp theo thể hiện việc nén dữ liệu ảnh Giá trị 0 ngh a là dữ liệu không được nén, 1 ngh a là hình ảnh được nén theo kiểu run length encoding K ch thước của trường bitmap cho biết dung lượng dữ liệu ảnh khi ảnh bị nén Nếu ảnh không bị nén thì giá trị này bằng 0 Hai trường tiếp theo làm việc với độ phân giải của hình ảnh và hai trường cuối cùng làm việc với màu sắc hoặc mức xám của hình ảnh Độ phân giải ngang và dọc được thể hiện bằng số điểm ảnh trên mỗi đơn vị Trường màu sắc giúp phần mềm có thể giải mả được bảng màu Trường này cho biết số màu sắc hoặc mức xám của hình ảnh Hình ảnh không luôn có 256 mức xám Nếu chỉ có 30, giá trị của trường này là 30 và bảng màu có 30 entry

Trang 16

CHƯƠNG 3 : CHUYỂN ĐỔI ẢNH MÀUTHÀNH

ẢNH GRAYSCALE 3.1 Các phương pháp chuyển đổi :

- Thresholding là một phương pháp phân t ch ảnh ở chế độ trắng đen

thành dử liệu dạng binary Với các bit màu, thông thường thì màu trắng (1) sẽ là nền và màu đen (0) là các đối tượng

VD :

Hình 8 : Thresholding

- Với phương thức thresholding, khi quét qua một điểm ảnh, ngoài giá

trị 0 hoặc 1, còn có một giá trị khác là cường độ của điểm ảnh Ta sẽ

so sánh nếu cường độ của điểm đ lớn hơn cường độ của mức cường

độ trung bình thì sẽ gán giá trị là 0, còn nếu thấp hơn ta sẽ gán giá trị

là 1

- Các phương pháp chuyển đổi ảnh thành ảnh trắng đen :

o Fixed threshold : Fixed threshold : với phương pháp này, ta c thể chọn một giá trị threshold độc lập với ảnh Tuy nhiên, ảnh phải có

độ tương phản cao, tức là các đối tượng và màu nền có thể dễ dàng phân biệt được, và màu nền phải đồng nhất Ở đây, ta c thể chọn threshold là 128 nằm trong khoảng giá trị của threshold (0 -

Trang 17

>255) Tuy nhiên, với cách này, ta có thể nhận được một số pixel không được nhận diện đ ng

VD : Có 1 hình ở 2 trường hợp có sự khác nhau về contrast Sau đ cùng dùng pp threshold với giá trị 128 ta nhận được 2 kết quả khác nhau :

Hình 9 : Fixed threshold

o Histogram-derived threshold : với phương pháp này, ta sẽ sử dụng một lược đồ xám hiển thị mức độ xám của t ng vùng trên ảnh Với đồ thị này, trục tung sẽ hiển thị pixel thứ i, và trục hoành hiển thị mức xám tương ứng trong khoảng (0 -> 255) của pixel thứ i

VD :

Trang 18

Với phương pháp này, ta c thể có nhiều hướng xử lý do sự khác nhau về giá trị mặc định ban đầu của thresold, h(b)|b =

T = maxp – (p - maxp) Với : maxp : Mức xám của điểm cao nhất

p : Mức xám của điểm cao thứ 2 trên phần background

o Triangle althologrim : Với phương pháp này, trước tiên ta cũng phải tìm pixel lớn nhất trong histogram, sau đ tìm điểm thấp nhất T 2 pixel trên ta có một khoảng giá trị mức xám bmin

bmax Trong đoạn thằng nối t điểm có bmin bmax ta tính khoảng cách t đường thẳng đến pixel hiện tại Giả sử tại bi có dmax thì bi

chính là giá trị ngưỡng threshold mà ta cần tìm

Hình 10 : Histogram-Derived threshold

Trang 19

VD :

Hình 11 : Triangle algorithm

o Ngoài ra, chúng ta còn có một phương pháp đơn giản nhất, đ là chúng ta sẽ làm việc trực tiếp trên 3 đối số màu : red, green, blue Với phương pháp này, ch ng ta cũng c nhiều cách thức xử lý có thể kể đến như : BT709, RMY, Y(YIQ/NTFS), NTSC/PAL Phương pháp này, c một cách làm đơn giản nhất, tuy nhiên lại là một phương thức tệ hại nhất đ là ch ng ta sẽ lấy giá trị xám như sau :

grey = sqrt(red*red + green*green + blue*blue)

Trang 20

3.4 Phương pháp Y (YIQ/NTFS) :

Phương pháp này được sử dụng trong các tivi hệ NTSC, được lưu hành chủ yếu tại Bắc, Trung Mỹ và Nhật Bản Việc chuyển đổi t màu RGB sang Grayscale được thực hiện đơn giản thông qua công thức sau :

grey = (0.299*R + 0.587*G + 0,114*B)/255

Trang 21

CHƯƠNG 4 : PHƯƠNG PHÁP NHẬN DẠNG

BIÊN

4.1 Một số phương pháp nhận dạng biên cổ điển :

Trong suốt quá trình nhận dạng ảnh, phương pháp nhận dạng biên là một khâu quan trọng nhất trong cả quá trình Vì với một phương pháp ch nh xác, hiệu quả, chúng ta có thể phát hiện ra được đường biên của hình ảnh một cách chính xác nhất và nhanh nhất Và dựa vào các biên ch nh xác đ , ch ng

ta có thể dễ dàng xác định được hình ảnh đ như thế nào tùy vào mục đ ch nhận dạng của chúng ta mà ở đây đ là nhận dạng các đối tượng hình học 2D

Vậy biên là gì? Biên là một tập hợp các điểm biên tạo nên biên hay đường bao quanh đối tượng Dựa trên cơ sở này, ch ng ta c hai phương pháp phát hiện biên chủ đạo sau :

- Phát hiện trực tiếp : Phương pháp này làm nổi biên dựa vào sự biến

thiên mức xám của ảnh Kỹ thuật chủ yếu dùng để phát hiện biên ở đây là dựa vào sự biến đổi cấp xám theo hướng Cách tiếp cận theo đạo hàm bậc nhất của ảnh dựa trên kỹ thuật Gradient, nếu lấy đạo hàm bậc hai của ảnh dựa trên biến đổi gia ta có kỹ thuật Laplace

- Phát hiện gián tiếp : Nếu bằng cách nào đ ta phân được ảnh thành

các vùng thì ranh giới giữa các vùng đ gọi là biên Kỹ thuật dò biên

và phân vùng ảnh là hai bài toán đối ngẫu nhau vì d biên để thực hiện phân lớp đối tượng mà khi đã phân lớp xong ngh a là đã phân vùng được ảnh và ngược lại, khi đã phân vùng ảnh đã được phân lớp thành các đối tượng, do đ c thể phát hiện được biên

a Gradient :

- Theo định ngh a, gradient là một véctơ c các thành phần biểu thị

tốc độ thay đổi giá trị của điểm ảnh, ta có:

Trang 22

- Trong đ , dx, dy là khoảng cách (tính bằng số điểm) theo hướng x

và y

- Nhận xét : Tuy ta nói là lấy đạo hàm nhưng thực chất chỉ là mô

phỏng và xấp xỉ đạo hàm bằng các kỹ thuật nhân chập (cuộn theo mẫu) vì ảnh số là tín hiệu rời rạc nên đạo hàm không tồn tại

VD: Với dx = dy = 1, ta có:

Do đ , mặt nạ nhân chập theo hướng x là A= ( )và hướng y

là B =( )

Chẳng hạn, ta có : (

)

Ta có :

Trang 23

- Đại diện cho phương pháp này c thể kể đến như phương pháp

Prewitt, Sobel, la bàn,

b Laplace :

- Các phương pháp đánh giá gradient ở trên làm việc khá tốt khi mà

độ sáng thay đổi rõ nét Khi mức xám thay đổi chậm, miền chuyển tiếp trải rộng, phương pháp cho hiệu quả hơn đ là phương pháp sử dụng đạo hàm bậc hai Laplace Với phương pháp này, ch ng ta c thể phát hiện được biên với độ dày là 1 pixel

- Toán tử Laplace được định ngh a như sau:

( ) ( ) ( )

- Tương tự, với

) ( ( ) ( )) [ ( ) ( )] [ ( ) ( )]

( ) ( ) ( )

- Vậy, ta có :

( ) ( ) ( ) ( ) ( )

- Một số phương pháp c thể đại diện cho phương pháp này như :

Canny,

Trang 24

) √ hay | | | | | |

Hướng dịch chuyển, chúng ta có thể t nh toán như sau :

Nếu Gx bằng 0 thì hướng dịch chuyển bằng 900 hoặc 00, phụ thuộ vào giá trị Gy

Nếu Gy bằng 0 thì hướng dịch chuyển bằng 00

Trang 25

Ngoài hai trường hợp trên, chúng ta sẽ t nh hướng dịch chuyển bằng

công thức sau :

( )

- Bước 3 : Non-maximum

Sau khi ch ng ta đã biết được hướng dịch chuyển của đường biên, bước

tiếp theo, chúng ta sẽ tìm hướng dịch chuyển cục bộ để chúng ta có thể

lần theo đ và đi hết biên ảnh

Lấy ví dụ pixel a trong một ma trận 5x5 như sau :

thể xác định hướng cạnh này thông qua phương thức sau :

Hướng dịch chuyển rơi vào trong khoảng (0, 22.5) và (157.5, 180) thì chúng ta

Bước cuối cùng, chúng ta sử dụng hyteresis để loại bỏ các điểm đứt quãng trên

đường biên do một yếu tố nào đ tác động Phương pháp này làm việc dực trên

hai ngưỡng T1 và T2 Nếu pixel c ngưỡng lớn hơn T1 thì được cho là biên và

các điểm cạnh điểm biên đ nếu c ngưỡng lớn hơn T2 cũng được coi là biên và

việc này sẽ được làm tới khi nào gặp điểm c ngưỡng nhỏ hơn T1

Ngày đăng: 30/10/2022, 15:52

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w