thiết bị tập ngắm, bắn bằng laser và xử lý ảnh phục vụ huấn luyện

- 5 - Trong thực tế, lỗ có một kích thước nào đó mặc dù nhỏ, và mỗi điểm trong mặt phẳng ảnh tập hợp ánh sáng từ một hình nón của những tia sáng trương một góc đặc hữu hạn, vì vậy mô hìn

Trang 1

báo cáo tổng kết đề tài

thiết bị tập ngắm, bắn bằng laser và xử lý ảnh phục vụ huấn luyện

Chủ nhiệm đề tài:Nguyễn Văn Long

Trung Tâm Triển Khai Công Nghệ

5969

28/8/2006

Hà nội, tháng 12 – 2005

Trang 2

Mục Lục

Chương 1: tổng quan về xử lý tín hiệu ảnh số 3

1.1 Mở đầu 3

1.2 Quá trình tạo ảnh và các mô hình ảnh 4

1.2.1 Camera 4

1.2.2 Màu sắc và biểu diễn ảnh màu 17

1.3 Một số khái niệm cơ bản 21

1.4 Phép xử lý điểm ảnh dựa trên bảng tìm kiếm LUT 22

1.4.1 Kéo căng độ tương phản 23

1.4.2 Làm bằng lược đồ mức xám 24

1.5 Phép xử lý vùng ảnh 24

1.6 Xử lý hình thái học ảnh nhị phân 26

1.6.1 Phép biết đổi “trúng hoặc trượt” 26

1.6.2 Phương pháp lập bảng tìm kiếm 26

1.6.3 Phép dãn lân cận 8 27

1.6.4 Phép co lân cận 8 27

1.6.5 Phép lấp đầy đường chéo 28

1.6.6 Phép mở 28

1.6.7 Phép đóng 28

1.7 Đặc tính đường biên 28

1.7.1 Phát hiện biên dựa vào đạo hàm bậc nhất 29

1.7.2 Phát hiện biên dựa vào đạo hàm bậc hai 31

1.7.3 Phương pháp Canny để phát hiện biên 32

1.8 Đặc tính góc 33

1.9.Hệ thống phát hiện mục tiêu tự động 35

1.9.1 Tổng quan về hệ thống bám video tự động 35

Trang 3

1.9.2 Kiến trúc vòng bám 37

1.9.3 ước lượng vị trí mục tiêu 39

1.9.4 Cửa mục tiêu và tìm breaklock 41

1.9.4.1 Xây dựng cửa 42

1.9.4.2 Phân đoạn mục tiêu 46

1.9.4.3 Các thuật toán tìm breaklock 47

1.9.5 Bù vòng bám và xác định LOS 49

1.9.5.1 Xác định LOS 49

1.9.5.2 Bù vòng bám 50

Chương 2: thiết kế tổng thể về hệ thống bắn tập trên cơ sở xử lý tín hiệu và có trợ giúp của mạch điện tử và quang học 53

2.1 Các khối chính trong hệ thống tập ngắm bắn 53

2.2 Mô tả tóm tắt hoạt động của hệ thống tập ngắm bắn 55

Chương 3: giải bài toán phát hiện vết laser xuất hiện trên hệ bia trong phông nền cố định 56

3.1 Mở đầu 56

3.2 Phát hiện vùng thay đổi 57

3.3 Các phương pháp chọn ngưỡng 58

3.3.1 Phương pháp chọn ngưỡng cố định 58

3.3.2 Phương pháp chọn ngưỡng kép toàn cục của trigơ smitt 59

3.3.3 Phân ngưỡng thích nghi 62

3.3.4 Giải pháp ngưỡng kép kết hợp với phân ngưỡng thích nghi cục bộ. 63

3.3.5 Phương pháp bó k trung bình cho vùng đối tượng xuất hiện 65

3.5 Nhận dạng vết laser theo một số đặc tính đặc trưng 67

3.5.1 Nhận dạng theo các đặc tính hình học 67

3.5.2 Nhận dạng theo các đặc tính mômen 68

Trang 4

3.5.3 Chọn lại đối tượng duy nhất bằng các phép so sánh mômen 69

Chương 4 Thực nghiệm về giải pháp nhận dạng bia, tính điểm và báo điểm 75

4.1 Thực nghiệm về xác định kiểu bia bằng phương pháp hình thể 78

4.2 Thực nghiệm về phương pháp tính điểm 83

4.3 Sai số về hệ thống tính điểm 86

Chương 5: Xây dựng hệ quản lý quá trình tập luyện và giải pháp bảo mật 87

5.1.Thiết kế các bảng dữ liệu 89

5.2 Thiết kế giao diện 91

5 3.Vấn đề bảo vệ bản quyền cho hệ thống phần mềm 97

5.3.1 Giao tiếp USB 97

5.3.2 HID (Human Interface Device) 103

5.3.3 HID là gì ? 10

5.3.4 Các yếu tố cần thiết để phát triển thiết bị HID 103

5.3.5 Phương thức hoạt động của HID 104

5.4 Giải thuật bảo vệ cho chương trình 106

Chương 6: Thiết kế hệ thống cơ khí, quang học và điện tử phụ trợ 108

6.1 Thiết kế mạch điện phát laser và phát tín hiệu hồng ngoại điều khiển cho khối tạo giả tiếng súng 109

6.2 Lựa chọn đầu phát laser cho hệ thống bắn tập 112

6.3 Thiết kế mạch khoá cứng cho phần mềm xử lý ảnh 113

Một số phụ lục về phần mềm kèm theo

- Một số module mã nguồn quan trọng

Trang 5

Danh môc c¸c tõ viÕt t¾t

ADC Analog-Digital Converter

ATR Automatic Target Recognition

CCD Charge Couple Device

CCIR Consultative Committe on International Radio

CIE Commission International de L'Eclairage

CONDENSATION CONdition DENSity PropagATION

DSP Digital Signal Processing

EIA Electronics Industries Association

FIFO First In First Out

FOV Field Of View

HIS Hue-Saturation-Intensity

HSV Hue-Saturation-Value

INS Inertial Navigation System

ISA Industry Standard Architecture

KLT Kanade-Lucas-Tomasi

LOS Line Of Sight

LUT Look-Up Table

PCI Peripheral Component Interconnection

PID Proportional Integral Derivative

PSoC Programmable System on Chip

Trang 6

Lời giới thiệu

Trên thế giới, công nghệ mô phỏng có vai trò chủ đạo trong hoạt

động công nghệ cao, con người bay vào vũ trụ an toàn nhờ thử nghiệm trên các thiết bị mô phỏng dưới mặt đất Mô phỏng còn cho phép nghiên cứu, thử nghiệm các loại vũ khí mà trong điều kiện thực không được phép thực hiện do hoàn cảnh chính trị, xã hội, môi trường v…v… như tiến hành nổ hạt nhân …

Từ khi có cuộc cách mạng công nghệ thông tin, công nghệ mô phỏng cũng nhanh chóng phát triển trong mọi lĩnh vực khác nhau cả về quân sự lẫn dân sự Công nghệ mô phỏng trong công tác đào tạo huấn luyện đã trở thành xu hướng chủ đạo của các nước

Ngay những cường quốc về quân sự, việc ứng dụng công nghệ mô phỏng chế tạo các thiết bị phục vụ huấn luyện chiến đấu là một trong những giải pháp tối ưu nâng cao chất lượng và hiệu quả huấn luyện chiến

đấu, mang lại nhiều lợi ích trên mọi phương diện, lợi ích lớn nhất là tiết kiệm nguồn tài chính dùng cho huấn luyện

Ngày nay trên thế giới, các thiết bị mô phỏng dùng trong huấn luyện chiến đấu thường rất đắt, nhiều thiết bị chỉ phù hợp chiến thuật của từng nước sản xuất, đồng thời nhiều thiết bị cũng không cho phép chuyển giao vì lý do quân sự …

Thực trạng trang thiết bị mô phỏng dùng trong huấn luyện chiến đấu ở nước ta chiếm tỷ lệ rất thấp Những thiết bị trước kia được viện trợ, nhập ngoại … nay đều đã lâu năm, thô sơ, lạc hậu, hỏng, xuống cấp … mặc dù các đơn vị cố gắng trong việc bảo dưỡng, sửa chữa cũng không đáp ứng huấn luyện vì sai số, mất an toàn

Trang 7

Chính vì vậy, ngay từ những năm 1997, Bộ Tổng tham mưu coi giải pháp này là nhiệm vụ mang tính cấp bách, nhiều Dự án về trang thiết

bị mô phỏng dùng trong huấn luyện chiến đấu được thực hiện với nhiều giai đoạn đã cho những kết quả tiền khả thi mang tính thực tiễn đã khẳng

định cần đầu tư trong những năm tiếp theo Với những nội dung: Huấn luyện không quân, Hải quân, Tăng thiết giáp, Công binh, Thông tin, Pháo binh, Hoá học, Bộ binh, Thể thao thành tích cao … Việc thực hiện các

Dự án này ngoài những thiết bị nhập ngoại cũng đã thu hút nhiều đơn vị trong và ngoài quân đội tham gia nghiên cứu, chế thử, đi đến sản xuất nhiều chủng loại thiết bị mới, rất phù hợp yêu cầu thực tế huấn luyện, song cho đến nay việc đáp ứng yêu cầu huấn luyện còn rất yếu cần đầu tư tiếp

Đã từ hơn 10 năm nay, Cục Quân Huấn - BTTM đã phối hợp với Viện ứng dụng công nghệ hợp tác chặt chẽ về KHKT, cho ra đời nhiều thiết bị huấn luyện có hiệu quả, độ chính xác cao, độ bền, độ ổn

định, đơn giản hoá các thao tác cho người sử dụng, phù hợp tính cơ động, sẵn sàng chiến đấu và đáp ứng yêu cầu thực tế huấn luyện

Đã tổ chức nhiều đợt tập huấn toàn quân trên thiết bị của Viện ứng dụng công nghệ cho những kết quả rất tốt

Đề tài : “Nghiên cứu, thiết kế, chế thử hệ tập ngắm, bắn trên bia

có tính điểm bằng phương pháp laser và xử lý ảnh phục vụ Quốc phòng,

an ninh “ thực hiện từ những yêu cầu trên, nhằm đưa đội ngũ nghiên cứu

đi sâu vào lĩnh vực công nghệ xử lý ảnh đồng thời nâng cao nhận thức của các chiến sĩ với khoa học công nghệ, tất cả đều hướng về mục tiêu hiện đại hoá Quốc phòng, an ninh

Trang 8

được đặt vấn đề từ rất sớm Đồng thời con người cũng đặt vấn đề trang bị thị giác cho các máy móc phục vụ con người

Với sự phát triển của kỹ thuật tính toán số, các ảnh thu nhận được từ các thiết

bị tạo ảnh đã được số hoá và được xử lý trực tiếp bằng máy tính số Trong những năm gần đây, xử lý ảnh số đã được phát triển và trở thành một lĩnh vực khoa học Xử

lý ảnh số đã nâng cao chất lượng của ảnh đồng thời phân tích và lý giải nó phục vụ các mục đích riêng biệt Trong chương này ta sẽ giới thiệu các mô hình tạo ảnh, biển diễn ảnh và các khái niệm cơ bản về xử lý ảnh số Hình 1.1 chỉ ra hệ thống thu nhận

và xử lý ảnh số thông thường

Hình 1.1 Hệ thống thu nhận và xử lý ảnh số

Để mở đầu chương này, các quá trình tạo ảnh, biểu diễn ảnh và quá trình số hoá ảnh sẽ được đề cập đến một cách sơ lược Phần tiếp theo sẽ trình bày vắn tắt một

số khái niệm cơ bản của thị giác mày tính và xử lý ảnh Phần còn lại của chương này

sẽ trình bày chi tiết hơn về việc xử lý nâng cao chất lượng ảnh số lối vào bằng chương trình máy tính Cũng để tạo tiền đề cho phần tiếp theo thì các đặc tính của

ảnh cũng được đề cập tới

Trang 9

1.2 Quá trình tạo ảnh và các mô hình ảnh

1.2.1 Camera

Có nhiều kiểu thiết bị tạo ảnh, từ mắt động vật đến những ống kính camera

ghi hình và radio Chúng có thể có hoặc không trang bị thấu kính Mô hình buồng

tối camera đầu tiên được phát minh vào thế kỷ 16 không có các thấu kính, nhưng

thay vào đó là một lỗ (pinhole) để hội tụ các tia sáng lên trên tường hoặc tấm mờ

Các lỗ dần dần được thay thế bởi các thấu kính càng ngày càng phức tạp

Nói chung camera thường có hai bộ phận cơ bản một là hệ thống tạo ảnh và

hai là bề mặt tạo ảnh có chứa chất nhạy cảm quang Bề mặt tạo ảnh của một camera

thông thường là hình chữ nhật, nhưng các camera toàn cảnh có thể trang bị mặt tạo

ảnh hình trụ để tăng trường nhìn Những phần tử nhạy tạo ảnh có những đặc trưng

khác nhau Chúng có thể ghi nhận một ảnh rời rạc hoặc một ảnh liên tục về mặt

không gian Hệ thống tạo ảnh có thể là lỗ hoặc là hệ thấu kính trong các camera

hiện đại Ta sẽ khảo sát các quá trình tạo ảnh và các phần từ nhạy tạo ảnh dưới đây

Phép chiếu phối cảnh

Hãy tưởng tượng ta cầm một cái hộp, châm một lỗ nhỏ vào một trong số các

mặt của hộp bằng một đinh ghim, và thay thế mặt đối diện bằng một tấm mờ Nếu ta

đặt nguồn sáng nào đó (một ngọn nến chẳng hạn), ta sẽ nhìn thấy hình ngọn nến lộn

ngược xuất hiện trên tấm mờ (hình 1.2a)

Hình 1.2 Mô hình tạo ảnh qua lỗ (a) và minh hoạ cách tính phương trình phối cảnh (b)

ảnh này được hình thành bởi những tia sáng phát ra từ cảnh gần với mặt hộp

Nếu lỗ được giảm nhỏ tới một điểm (dĩ nhiên không thể đạt được về mặt vật lý), thì

chính xác một tia sáng sẽ đi qua xuyên qua mỗi điểm trong mặt phẳng tấm mờ (mặt

phẳng ảnh), lỗ và một điểm cảnh tương ứng nào đó

(a) (b)

Trang 10

- 5 -

Trong thực tế, lỗ có một kích thước nào đó (mặc dù nhỏ), và mỗi điểm trong

mặt phẳng ảnh tập hợp ánh sáng từ một hình nón của những tia sáng trương một góc

đặc hữu hạn, vì vậy mô hình được lý tưởng hoá và đơn giản vô cùng này của tạo ảnh

hình học có ít hiệu quả Tuy vậy, mô hình chiếu phối cảnh lỗ (cũng được gọi là phối

cảnh trọng tâm), đầu tiên được đề xuất bởi Brunelleschi hồi đầu thế kỷ 15, rất tiện

lợi về toán học Bất chấp sự đơn giản, nó thường cung cấp một sự xấp xỉ chấp nhận

được của quá trình tạo ảnh Đôi khi để dễ tính ta thay ảnh thật bằng một ảnh ảo đối

xứng với ảnh thật qua lỗ (hình 1.2a)

Bằng các phép tính hình học đơn giản, ta dễ dàng thu được các phương trình

cho phép chiếu phối cảnh (hình 1.2b) Trong hình điểm C’ là giao điểm của trục

quang và ∏’ được gọi là tâm ảnh Điểm này có thể được sử dụng như là gốc toạ độ

ảnh và là điểm tâm để tính trong các thủ tục chuẩn hoá (calibration) camera

Lấy điểm P là một điểm thuộc quang cảnh có toạ độ (x,y,z) và P’ là ảnh của

P có toạ độ là (x’,y’,z’) Do P’ nằm trên mặt phẳng ảnh ta có z’=f’ Từ ba điểm P, O,

và P’ cùng nằm trong một đường thẳng, ta có OP'=λOP, do vậy

x f x

''

(1.1)

Phép chiếu Affine

Như đã nói trong phần trên, phối cảnh lỗ chỉ là một xấp xỉ của quá trình tạo

ảnh hình học Phần này mô tả một lớp xấp xỉ thô hơn được gọi là mô hình chiếu

affine, nó cũng được sử dụng trong một số trường hợp Hai phép chiếu affine có thể

kể ra là phép chiếu phối cảnh yếu và phép chiếu trực giao Phép chiếu phối cảnh yếu

là một mô hình có thể chấp nhận được trong nhiều điều kiện tạo ảnh, nhưng phép

chiếu trực giao thuần tuý thường không thực tế Ta sẽ không mô tả chi tiết mà kể tên

chúng vì chúng chỉ có ý nghĩa mang tính lịch sử

Các camera có thấu kính

Trang 11

Đa số các camera được trang bị hệ thấu kính Có hai lý do chính là: Trước hết

là để tập hợp ánh sáng từ một tia sáng đơn lẻ sẽ đến mỗi điểm khác nhau trong mặt

phẳng ảnh dưới phép chiếu lỗ lý tưởng Thực tế các lỗ tất nhiên có một kích thước

hữu hạn, vì vậy mỗi điểm trong mặt phẳng ảnh được chiếu bởi một hình nón của

những tia sáng trương một góc đặc hữu hạn Lỗ lớn hơn hình nón rộng hơn và ảnh

sáng hơn, nhưng một pinhole lớn sẽ cho ảnh không rõ nét Làm co lỗ tạo ra ảnh sắc

nét, nhưng làm giảm số lượng ánh sáng đến mặt phẳng ảnh, và có thể đưa đến hiệu

ứng nhiễu xạ Lý do chính thứ hai là khi sử dụng một thấu kính sẽ giữ ảnh sắc nét

trong khi tập hợp được ánh sáng từ một vùng lớn

Bỏ qua sự nhiễu xạ, giao thoa và các hiện tượng quang học vật lý khác, hoạt

động của thấu kính tuân theo các định luật quang hình

Ta minh hoạ quá trình tạo ảnh của điểm P qua thấu kính mỏng trong hình

1.3a Ta có được phương trình 1.2 để tính vị trí ảnh P’

f z z

11'

ở đó

)1(

Hình 1.3 Quá trình tạo ảnh qua thấu kính mỏng (a) và thấu kính dầy (b)

Ta thấy rằng phương trình thể hiện qua hệ vị trí của P và P’ là chính xác

giống như phép chiếu phối cảnh lỗ nếu ta lấy z’=f’ Từ P và P’ nằm trên đường

thẳng xuyên qua tâm của thấu kính và các điểm ở vị trí –z chỉ hội tụ sắc nén khi mặt

phẳng ảnh ở ví trí z’ Khi z→ ư∞, là các vật như các vì sao, sẽ được ảnh tại vị trí

(a) (b)

Trang 12

phép chiếu thấu kính mỏng ngoại trừ một sai khác (hình 1.3b) Nếu H và H’ là hai

điểm chính của thấu kính, thì phương trình 1.2 giữ nguyên khi –z (tương ứng là z’) là khoảng cách giữa điểm P (tương ứng là P’) và mặt phẳng chứa điểm H (tương ứng là

H’) trực giao với trục quang

Trong thực tế, các vật nằm trong một phạm vi khoảng cách hội tụ nhỏ (được gọi là chiều sâu của trường hoặc chiều sâu tiêu điểm) Chiều sâu trường tăng theo số

f của thấu kính (số f là tỷ lệ giữa tiêu cự của thấu kính và đường kính nó) Trường

nhìn của một camera là phần của không gian cảnh mà thật sự chiếu lên trên phim của camera Nó không được định nghĩa chỉ bởi tiêu cự, mà còn phụ thuộc vào vùng

có hiệu quả của võng mạc (hoặc vùng phim có thể được lộ sáng trong một camera chụp ảnh, hoặc vùng nhạy CCD trong một camera số hình 1.4)

Hình 1.4 Minh hoạ trường nhìn của camera

Các thấu kính đơn bị một số quang sai Tại sao vậy? Ta hãy nhớ lại trong

phương trình quang hình chỉ là xấp xỉ, có hiệu lực khi góc α nhỏ sao cho sinα≈ α Cho nhưng góc lớn hơn, ta sử dụng khai triển Taylor bậc 3 thu được phương trình cận trục tinh vi hơn

Trang 13

Các hiện tượng tương tự xảy ra với thấu kính và là hai loại quang sai cầu

(hình 1.5a): Xét điểm P nằm trên trục quang và ảnh cận trục P’ của nó Khoảng

cách giữa điểm P’ và giao điểm của trục quang với với một tia xuất phát từ P và bị

khúc xạ bởi thấu kính được gọi là quang sai cầu dọc của tia Nếu mặt phẳng ảnh ∏’

được dựng trên P’, tia khúc xạ sẽ cắt mặt phẳng này tại điểm cách trục quang một

khoảng được gọi là quang sai cầu ngang của tia này Đồng thời, tất cả các tia xuyên

qua P và bị khúc xạ bởi thấu kính tạo thành một hình tròn rối loạn Kích thước của

hình tròn đó thay đổi khi ta di chuyển ∏’ dọc theo trục quang Hình tròn có đường

kính nhỏ nhất được gọi là hình tròn rối loạn tối thiểu, và nói chung là không tại vị

trí điểm P’

Bên cạnh quang sai cầu, có 4 loại quang sai cơ bản khác do sự khác nhau

giữa quang học bậc nhất và bậc 3 là: coma, loạn thị, cong trường và méo Các định

nghĩa chính xác các khái niệm này vượt quá khuôn khổ luận văn nay Nói chung,

giống như quang sai cầu nó làm giảm chất lượng ảnh Sự méo làm thay đổi hình

dạng của ảnh như trong hình 1.5b ảnh hưởng này phù hợp với thực tế rằng các

vùng khác nhau của thấu kính có tiêu cự khác nhau nhỏ Quang sai phải được kể đến

nữa là sự đơn sắc (chúng phụ thuộc vào đáp ứng của thấu kính với các bước sóng

thay đổi) Tuy nhiên, chiết suất của môi trường trong suốt phụ thuộc vào bước sóng

(hình 1.5c) và nó kéo theo phương trình thấu kính mỏng (1.2) là tiêu cự cũng phụ

thuộc vào bước sóng Điều này sinh ra hiện tượng sắc sai: các tia khúc xạ tương ứng

với các bước sóng khác nhau sẽ cắt trục quang ở các điểm khác nhau (sắc sai dọc)

và tạo ra các đường tròn rối loạn khác nhau trong mặt phẳng ảnh như nhau (sắc sai

Trang 14

- 9 -

Các quang sai có thể giảm thiểu bằng cách sắp xếp một vài thấu kính đơn với hình dạng và chiết suất được chọn tốt và được phân tách bằng khoảng chặn thích hợp Các thấu kính phức tạp vẫn có thể được làm theo các phương trình thấu kính dày Chúng lại bị thêm khuyết tật liên quan đến thị giác máy: Chùm sáng phát ra từ các điểm vật nằm ngoài trục bị chặn một phần bởi các kẽ hở giữa thấu kính để hạn chế quang sai (hình 1.6)

Hình 1.6 Hiện tượng vignetting

Hiện tượng này được gọi là làm mờ nét ảnh (vignetting), sinh ra do sự chiếu sáng

giảm tại mép ảnh Hiện tượng này có thể nảy sinh vấn đề cho các chương trình phân tích ảnh tự động, nhưng nó không quan trọng trong chụp ảnh nhờ sự trợ giúp của mắt người không cảm giác rõ ràng các độ dốc chiếu sáng mịn

Mắt người

ở đây ta mô tả vắn tắt về cấu trúc giải phẫu của mắt Hình 1.7 (trái) là một phác hoạ mặt được cắt thẳng đứng của nhãn cầu bao gồm các thành phần chính của

mắt: mống mắt và con ngươi sẽ điều khiển lượng ánh sáng xuyên vào nhãn cầu; giác

mạc và thấu kính cùng với nhau làm khúc xạ ánh sáng để tạo ảnh lên võng mạc và

cuối cùng là võng mạc ở đó ảnh được tạo thành

Mặc dù nó có dạng hình cầu, nhãn cầu về chức năng giống với một camera

với trường nhìn (viết tắt là FOV-Field Of View) bao phủ một vùng 1600 (rộng)ì135 (cao) Giống bất kỳ hệ thống quang học khác, nó bị quang sai hình học và sắc sai

Một vài mô hình mắt được đề xướng tuân theo luật quang hình bậc nhất, hình

1.7 (phải) minh hoạ một trong số đó, mô hình mắt sơ lược của Helmoltz Chỉ có ba mặt khúc xạ là giác mạc rất mỏng và một thấu kính đồng nhất Các hằng số cho trên

Trang 15

hình là trong trường hợp mắt nhìn ở vô cùng (mắt không điều tiết) Tất nhiên mô

hình này chỉ là xấp xỉ của các đặc tính quang học thực của mắt

Hình 1.7 Cấu tạo của mắt (trái) và mô hình mắt Helmoltz (phải)

Ta hãy mô tả sâu hơn về các thành phần của mắt Giác mạc là một cửa sổ khúc xạ trong suốt và có độ cong cao ánh sáng tới mắt sẽ xuyên qua nó trước khí bị ngăn chặn một phần bởi mống mắt đục Đồng tử mắt là một lỗ hổng ở tâm của mống mắt, đường kính của nó thay đổi khoảng từ 1 tới 8 mm tương ứng với sự thay đổi của

độ chiếu sáng, nó dãn ra khi ánh sáng thấp để làm tăng thêm năng lượng đến võng mạc và co lại trong điều kiện chiếu sáng bình thường để giới hạn sự mờ ảnh do quang sai cầu của mắt Khả năng khúc xạ (nghịch đảo của tiêu cự) của mắt, phần lớn là do hiệu ứng khúc xạ của mặt giao tiếp không khí – giác mạc, và được hiệu chỉnh bởi sự biến dạng của thuỷ tinh thể sao cho vật hội tụ sắc nét Trong những người khoẻ mạnh, nó thay đổi giữa 60 (không điều tiết) và 68 diopter (1 diopter = 1

m-1) tương ứng với dải tiêu cự giữa 15 và 17 mm

Hình 1.8 Phân bố của các tế bào hình nón và hình que trên võng mạc

Gúc cõn đối với điểm vàng (deg)

Trang 16

- 11 -

Bản thân võng mạc là một màng mỏng được xếp thành từng lớp cư trú bởi hai loại tế

bào nhận sáng – hình que và hình nón – đáp ứng với ánh sáng có bước sóng từ 330

tới 730 (từ tím tới đỏ) Các tế bào hình nón kém nhạy sáng hơn và chủ yếu là để nhìn ban ngày Chúng có trách nhiệm cảm nhận màu sắc Có ba loại tế bào hình nón tương ứng nhạy với các phổ ánh sáng khác nhau (đỏ, lục, lam) giữ vai trò chủ đạo trong nhận thức màu Có khoảng 100 triệu tế bào hình que và 5 triệu tế bào hình nón trong mắt người Phân bố không gian của chúng thay đổi về hai phía của võng mạc

Vùng trung tâm (macula lutea) ở chính giữa võng mạc ở đó tập trung các tế bào hình

nón đặc biệt cao và ảnh được hội tụ sắc nét hễ khi nào mắt tập trung sự chú ý của nó

vào một đối tượng Các tế bào hình nón tập trung cao nhất tại điểm vàng (fovea), là

một chỗ lõm giữa vùng trung tâm, đạt tới 1.6ì105/mm2 (hình 1.8) Ngược lại, không

có các tế bào hình que trong điểm vàng, nhưng mật độ tế bào hình que tăng về phía rìa của trường nhìn Cũng có một điểm mù trên võng mạc, ở đó các sợi tế bào hạch

đi vào võng mạc và tạo dây thần kinh quang học

Các tế bào hình que là các tế bào nhận kính thích ánh sáng cực kỳ nhạy: chúng có khả năng đáp ứng với chỉ một photon, nhưng chúng đem đến chi tiết không gian tương đối kém bởi vì nhiều tế bào hình que cùng đổ về neuron giống nhau trong võng mạc Trái lại, các tế bào hình nón trở thành tích cực tại mức ánh sáng cao hơn, nhưng tín hiệu lối ra của mỗi tế bào hình nón trong điểm vàng được mã hoá bởi một vài neuron, đem lại độ phân giải cao trong vùng đó

Cảm biến ảnh CCD (Charge Couple Device)

Như chúng ta biết Niepce phát minh ra kỹ thuật chụp ảnh từ đầu thế kỷ 19, nhưng Daguerre mới là người giới thiệu nó với công chúng Sau hai lần cùng cộng tác trong năm 1826, Daguerre tiếp tục phát triển phương pháp chụp ảnh của riêng mình sử dụng hơi thuỷ ngân để khuếch đại và để lộ ra ảnh được tạo trên miếng đồng mạ bạc được bôi i-ốt Phép chụp ảnh Daguerre ngay lập tức thành công khi Arago biểu diễn phương pháp Daguerre ở viện hàn lâm khoa học Pháp năm 1839 Những cột mốc khác trong lịch sử lâu dài của phương pháp chụp ảnh bao gồm phương pháp tấm ướt âm/dương của Legray và Archer năm 1850, phương pháp gelatin (chất lỏng trong suốt không có vị để chế tạo phim ảnh) của Maddox năm 1870, Eastman giới

Trang 17

thiệu phim chụp ảnh năm 1889, và phát minh kỹ thuật điện ảnh (cinema) của Lumiere năm 1895 và chụp ảnh màu năm 1908

Vô tuyến truyền hình (viết tắt là TV) được phát minh vào nhưng năm 20 của thế kỷ 20 đã trở thành yếu tố chính thúc đẩy sự phát triển của các bộ cảm biến điện

tử Vidicon là một loại ống chân không TV phổ biến Nó là một vỏ bọc bằng thuỷ tinh có một súng điện tử ở một đầu và một màn hình (faceplate) ở đầu kia Phía sau

của màn hình được phủ một lớp màng mỏng chất quang dẫn lại phủ lên một film

kim loại trong suốt tích điện dương Sự phủ kép này tạo thành bia ống được bao

quanh bởi các cuộn hội tụ và lái để quét bia lặp đi lặp lại bằng chùm điện tử được phát ra từ súng Chùm này đặt một lớp điện tử lên bia để cân bằng điện tích dương của nó Khi một vùng nhỏ của màn hình được chiếu sáng, các điện tử chạy xuyên qua làm xả hết điện tích cục bộ của bia Khi chùm điện tử quét vùng này, nó thay thế các điện tử đã mất, tạo ra dòng điện tỉ lệ với cường độ ánh sáng tới Sự thay đổi của dòng điện sau đó được chuyển đổi thành tín hiệu hình ảnh bằng mạch vidicon Vidicon và các thiết bị cùng họ được dùng đến tận đầu những năm 1980 trong mọi ứng dụng truyền hình, bao gồm camera quảng bá, camera xách tay, camera theo dõi

Các camera CCD (Charge Couple Device) được đề xuất năm 1970 và đã thay

thế các camera vidicon trong hầu hết các ứng dụng hiện đại Cảm biến CCD sử dụng

một lưới hình chữ nhật của các điểm (site) thu thập điện tử phủ trên một đế silic

mỏng để ghi lại năng lượng ánh sáng đến mỗi điểm trong chúng (hình 1.15) Mỗi một điểm được tạo thành bằng cách cấy một lớp SiO2 trên đế và sau đó lắng đọng một cấu trúc cổng dẫn lên trên Khi photon đập vào silic, thì cặp điện tử lỗ trống

được tạo ra (chuyển đổi quang) và điện tử bị bắt giữ bằng giếng điện thế được tạo

thành bởi tác động của một điện thế dương ở cổng tương ứng Các điện tử được tạo

ra ở mỗi điểm được tập hợp qua một chu kỳ thời gian T cố định

Các điện tích được lưu trữ ở những điểm riêng biệt sẽ được di chuyển sử dụng

cách mắc tích nạp điện (charge coupling): Các gói điện tích được truyền từ điểm

này đến điểm kia bằng cách vận chuyển các điện thế cổng và bảo tồn các gói riêng biệt ảnh được đọc ra khỏi CCD một hàng một lần, mỗi hàng được truyền song song

Trang 18

- 13 -

tới một thanh ghi lối ra nối tiếp Giữa hai lần đọc hàng, thanh ghi truyền một ô điện tích của nó một lần (hình 1.9) tới một bộ khuếch đại lối ra tạo ra một tín hiệu tỷ lệ với điện tích nó nhận được Quá trình này tiếp tục cho tới khi toàn bộ ảnh đã được

đọc ra Nó có thể được lặp lại 30 lần trong một giây (tốc độ TV) cho các ứng dụng ghi hình hoặc ở tốc độ thấp hơn nhiều, bỏ đi nhiều thời gian (giây, phút, thậm chí hàng giờ) để thu thập điện tử trong các ứng dụng mức sáng thấp như thiên văn học Lưu ý rằng lối ra số của hầu hết các CCD camera được chuyển đổi bên trong thành

một tín hiệu ghi hình tương tự trước khi được chuyển tới một bộ bắt hình (frame

grabber) ở đó tạo dựng ảnh số cuối cùng

Hình 1.9 Thiết bị CCD

Các CCD camera mầu cấp độ dân dụng thực chất sử dụng các chip giống như các camera đen trắng, chỉ khác là các hàng hoặc các cột liên tiếp của cảm biến được tạo ra nhạy cảm với ánh sáng đỏ, lục hoặc lam thường sử dụng một bộ lọc phủ để bù

ánh sáng Các mẫu lọc khác có thể thực hiện được bao gồm các khối khảm (mosaic)

2ì2 được tạo bởi các bộ cảm nhận hai lục, một đỏ và một lam (mẫu Bayer) Độ phân giải không gian của camera một CCD tất nhiên là có giới hạn, các camera chất lượng cao hơn sử dụng một bộ chia chùm tia để chuyển ảnh tới 3 CCD khác nhau thông qua các bộ lọc màu Các kênh màu riêng biệt sau đó được số hoá hoặc là riêng biệt (lối ra RGB) hoặc kết hợp thành tín hiệu ghi hình màu hỗn hợp (NTSC, SECAM

hoặc PAL) hoặc thành định dạng ghi hình thành phần tách rời thông tin màu và độ

chiếu sáng

Truyền pixel Thanh ghi dịch

Mảng cỏc điểm thu

Trang 19

Quá trình số hoá ảnh và các bộ xử lý

Các tín hiệu hình ảnh từ CCD sẽ được số hoá qua các bộ bắt hình rồi đưa tiếp

vào bộ xử lý Hình 1.10 là cấu trúc cơ bản của một bộ bắt hình

Dồn kờnh tớn hiệu vào Tỏch xung đồng bộ mẫu & A/DTrớch-giữ

Bộ đệm hỡnh ảnh FIFO

Mỏy phỏt xung đồng bộ

Hình 1.10 Cấu tạo của bộ bắt hình (frame grabber)

Tín hiệu video được đưa đến bộ tách các xung đồng bộ dòng và mành ra khỏi tín hiệu thị tần hình ảnh Tuỳ theo chuẩn video mà mạch trích giữ mẫu tín hiệu sẽ trích 767 pixel trên một dòng cho chuẩn CCIR và 647 pixel trên một dòng cho chuẩn EIA để số hoá chúng Khi bộ bắt hình được nối với bus mở rộng có tốc độ chậm như bus ISA thì cần phải sử dụng các bộ nhớ phụ trên bản mạch nhưng khi nối với các bus nhanh như PCI thì chỉ cần bộ nhớ đệm FIFO để đệm cho một dòng quét Thường sau khi tín hiệu video vào đến bộ bắt hình, cần đến 3 khung ảnh để khởi

động

Các bộ xử lý có thể là các mạch vi xử lý chuyên dụng (DSP), vi điều khiển hoặc các máy vi tính PC Ngoài nhiệm vụ thu thập dữ liệu, chúng có nhiệm vụ xử lý

các dữ liệu này bằng các chương trình được nhúng trong bộ xử lý hoặc chạy trên các

máy PC Một vi điều khiển (microcontroller) là một máy tính trên một chip (computer-on-a-chip, single-chip computer) Thường các vi điều khiển còn được gọi

là các bộ điều khiển nhúng (embedded controller) vì rằng chúng và các mạch điện

hỗ trợ thường được thiết kế lắp đặt (nhúng) ngay bên trong các thiết bị được điều khiển Hiện có rất nhiều loại vi điều khiển được sản xuất như họ 80x51,

Trang 20

- 15 -

MC68HCxx, Basic Stamp hay PSoC Một vi điều khiển tương tự như một vi xử lý

bên trong một máy tính cá nhân Cả hai loại, vi xử lý và vi điều khiển đều chứa một

đơn vị xử lý trung tâm CPU có nhiệm vụ chạy các lệnh cho phép thực hiện các chức

năng logic, toán học và chuyển số liệu cơ bản trong máy tính Để tạo một máy tính

hoàn chỉnh, ngoài vi xử lý còn phải có bộ nhớ để lưu trữ số liệu và chương trình, các

ghép nối vào/ra Ngược lại, một vi điều khiển là một máy tính trên một chip nghĩa là

nó chứa cả bộ nhớ và giao diện vào/ra bên cạnh CPU Tuy nhiên, vì cần được thiết

kế chỉ trên một chip nên lượng bộ nhớ và các giao diện vào/ra trong vi điều khiển

được thiết kế nhỏ

Mô hình cảm biến

Để đơn giản, ta hạn chế sự chú ý tới các CCD camera đen trắng: các camera

màu có thể được giải quyết tương tự bằng cách xem xét mỗi kênh màu riêng biệt và

tính đến hiệu ứng lọc màu Gọi I là số các điện tử ghi được tại tế bào có vị trí ở hàng

r và cột c của mảng CCD thì I có thể được mô hình là:

,)()(),()

,(

) (

∫ ∫∈

c r S

T c r

ở đó T là thời gian thu thập điện tử và tích phân được tính trên miền không gian

S(r,c) của tế bào và dải bước sóng mà đáp ứng của CCD khác không Trong tích

phân E là công suất trên đơn vị diện tích và đơn vị bước sóng đến điểm p, R là đáp

ứng không gian của điểm, và q là hiệu ứng lượng tử của thiết bị Trong trường hợp

tổng quát, E và q phụ thuộc vào bước sóng ánh sáng λ, và E và R phụ thuộc vào vị trí

điểm p trong S(r,c)

Bộ khuếch đại lối ra của CCD chuyển đổi điện tích được thu thập tại mỗi

điểm thành điện áp có thể đo lường được Trong hầu hết các camera, điện áp này sau

đó được chuyển đổi thành một tín hiệu ghi hình được lọc thông thấp có biên độ tỷ lệ

với I ảnh tương tự có thể được chuyển đổi lại một lần nữa thành ảnh số sử dụng

một khối bắt hình ở đó lấy mẫu không gian và lượng tử hoá giá trị chiếu sáng ở mỗi

điểm ảnh hoặc gọi là pixel (hoặc thành phần ảnh – picture element)

Trang 21

Có một vài hiện tượng vật lý làm thay đổi mô hình camera lý tưởng chẳng

hạn nhèo ảnh sẽ xuất hiện khi nguồn sáng chiếu vào các điểm thu thập là quá mạnh

đến mức điện tích được lưu trữ ở các điểm đó tràn qua các điểm gần kề Có thể ngăn chặn việc này bằng cách điều khiển sự chiếu sáng, nhưng các yếu tố khác như khuyết tật sản xuất, các hiệu ứng nhiệt và lượng tử và ồn lượng tử hoá là gắn liền với quá trình tạo ảnh Các yếu đó đó có thể kiểm soát được bằng các mô hình xác suất thích hợp

Hiệu ứng vật lý lượng tử đưa vào sự không chắc chắn vốn có trong quá trình chuyển đổi photon ở mỗi điểm thu thập Để chính xác, số điện tử được tạo ra bởi quá

trình này có thể được mô hình bằng một biến tự nhiên ngẫu nhiên N I (r,c) tuân theo

phân bố Poisson có giá trị trung bình là β(r,c)I(r,c) ở đó β(r,c) là một số giữa 0 và

1 tương ứng với sự biến đổi của đáp ứng không gian và hiệu ứng lượng tử trong ảnh Các điện tử được giải phóng từ silic nhờ năng lượng nhiệt làm tăng thêm điện tích

của mỗi điểm thu thập (hiệu ứng nhiệt) Phân bố của chúng được gọi là dòng tối và

nó có thể được mô hình bằng biến tự nhiên ngẫu nhiên NDC(r,c) có giá trị trung bình

là àDC (r,c) tăng theo nhiệt độ Hiệu ứng dòng tối có thể được khống chế bằng cách làm lạnh camera Các điện tử cộng thêm được đưa vào bởi mạch điện tử CCD (bias)

và cũng được mô hình bằng biến ngẫu nhiên có phân bố Poisson N B (r,c) với giá trị

trung bình là àB (r,c) Bộ khuếch đại lối ra sẽ thêm vào ồn đọc ra và có thể mô hình bằng biến ngẫu nhiên thực R tuân theo phân bố Gauss với giá trị trung bình là àR và

độ lệch chuẩn là σR Có những nguồn khác gây ra sự không chắc chắn (như hiệu ứng truyền điện tích), nhưng chúng được bỏ qua Cuối cùng, sự rời rác hoá điện áp tương

tự bởi b bắt hình đưa vào cả hiệu ứng hình học (line jitter), có thể hiệu chỉnh thông

qua thủ tục chuẩn hoá camera, và ồn lượng tử hoá, có thể được mô hình như một

biến ngẫu nhiên Q(r,c) trung bình 0 phân bố đều trong đoạn ]

2

1,2

1[ư δ δ và phương

sai là 2

12

1 δ , ở đó δ là bước lượng tử hoá Điều này sinh ra mô hình hồn hợp cho tín

hiệu số D(r,c) sau:

Trang 22

- 17 -

),(r c N r c N r c N r c R r c Q r c

Trong phương trình này, γ là hệ số khuếch đại tổ hợp của mạch camera Các tính

chất xác suất của mô hình này có thể được ước lượng thông qua định cỡ camera phát

xạ: ví dụ, dòng tối có thể được ước lượng bằng cách lấy một số các ảnh mẫu trong

môi trường tối (I=0)

1.2.2 Màu sắc và biểu diễn ảnh màu

Mọi vật mà chúng ta quan sát được là nhờ ánh sáng Bề mặt của các vật đó là

sáng hay tối có hai nguyên nhân chính: năng suất phản xạ của nó và số lượng ánh

sáng mà chúng nhận được từ nguồn Có hai loại nguồn sáng Loại thứ nhất tự nó

phát ra ánh sáng gọi là nguồn sơ cấp (như mặt trời, đèn điện, cây nến…) Loại thứ

hai chỉ phản xạ hay khuếch tán ánh sáng mà nó nhận được từ các nguồn sáng khác

gọi là nguồn thứ cấp (mặt trăng, đám mây, cây cối…)

Hình 1.11 Các loại sóng điện từ (trên) và dải ánh sáng được phóng to (dưới)

ánh sáng là một phần của dải phổ liên tục bức xạ sóng điện từ (hình 1.11)

ánh sáng khác với các sóng điện từ khác là mắt người nhận biết được nó Mắt người

nhậy cảm với những sóng điện từ trong một dải cực kỳ hẹp của λ, khoảng từ 350nm

đến 750nm Hình 1.11 biểu diễn các loại sóng điện từ theo bước sóng và dải nhìn

thấy được phóng to hơn Mắt người không những cảm nhận được độ sáng tối của mà

còn có khả năng cảm nhận được màu sắc của ánh sáng Cảm nhận màu có được do 3

loại tế bào hình chóp trong võng mạc mắt người Mỗi tế bào nhạy với một dải phổ

nhất định tương ứng với các màu đỏ, xanh lục và xanh dương Nguồn sáng có thành

phần phổ f(λ) được biến đổi bởi bề mặt phản xạ của vật thể Giả thử r(λ) là hàm

phản xạ này Khi đó số đo R được tạo bởi các tế bào màu đỏ sẽ là:

Trang 23

= f(λ)r(λ)h (λ)d(λ)

Tức là tín hiệu hình ảnh trên các lối ra sensor (tế bào) trong thực tế chính

bằng tích phân của 3 thành phần phụ thuộc bước sóng khác nhau: nguồn sáng f,

phản xạ bề mặt vật r và đặc tính sensor h R

Như vậy, mọi màu sắc tự nhiên đều có thể được tổ hợp từ 3 màu cơ bản: đỏ R

(red), xanh lục G (green) và xanh dương B (blue) Để tiêu chuẩn hoá việc đo màu

trên thế giới, dựa vào kết quả thực nghiệm người ta đã quy định 3 màu cơ bản này

ứng với các bước sóng 700 nm (R), bước sóng 546,8 nm (G) và 435,8 nm (B) Mỗi

màu cơ bản này có một màu phụ tương ứng, mà khi trộn với màu cơ bản của nó sẽ

tạo ra màu trắng

Có 3 thuộc tính chủ yếu trong cảm nhận màu:

- Sắc màu (brightness), còn gọi là độ chói

- Sắc lượng (hue), còn gọi là sắc thái màu

- Độ bão hoà màu (saturation)

Với nguồn sáng đơn sắc, sắc lượng tương ứng với bước sóng ánh sáng của

nguồn Độ bão hoà thay đổi nhanh nếu lượng ánh sáng trắng được thêm vào

Hình 1.12 Mô hình không gian màu RGB

Có thể biến đổi từ sơ đồ RGB sang các sơ đồ lập mã màu khác như

YIQ/YUV trong đó Y là tín hiệu độ chói, nó như thể độ sáng của ảnh toàn sắc được

Trang 24

- 19 -

hiện bởi TV đen trắng Nó kết hợp các tín hiệu đỏ, xanh lục và xanh dương theo tỷ

lệ độ nhạy mắt người đối với chúng Các thành phần I và Q (U và V) của tín hiệu màu để tương thích với phần cứng được dùng trong truyền thông: tín hiệu I là lượng màu đỏ trừ đi lam, Q là lượng đỏ tươi trừ xanh lục Mối quan hệ giữa YIQ và RGB

Q

I

Y

311 0 523 0 212 0

321 0 275 0 596 0

114 0 587 0 299 0

B G R

703 1 106 1 000 1

647 0 272 0 000 1

621 0 956 0 000 1

(1.6)

Hình 1.12 là không gian được xác định bởi các tín hiệu RGB: đó là một không gian khối hộp trong toạ độ đề-cac vì rằng các tín hiệu R, G, B là độc lập và có thể được dùng để tạo nên bất kỳ màu nào bên trong khối hộp, trong đó có các chuỗi biến đổi

từ màu đen tới màu trắng Kết hợp màu đỏ và xanh lục sẽ cho màu vàng Xanh lục cộng với xanh dương sẽ sản ra màu lục lam (cyan) và xanh dương cộng đỏ sẽ cho màu đỏ tươi Các màu xám nằm dọc theo đường chéo khối hộp

Hình 1.13 Đồ thị sắc màu CIE Đường đen bên ngoài chứa các màu khả kiến

bão hoà toàn phần với các số là bước sóng nm Hình tam giác chỉ ra các

màu điển hình mà ống hình TV có thể tạo ra bởi việc trộn 3 màu cơ bản.

Có những sơ đồ lập mã khác gần gũi với bản chất của con người hơn Ra đời sớm nhất là giản đồ sắc độ của uỷ ban CIE Đây là giản đồ 2 chiều như được trình

Trang 25

bày trên hình 1.13 Trục thứ ba là độ chói phù hợp với độ sáng toàn sắc Y cho phép sản ra một ảnh đơn sắc (thang độ xám) Hai trục khác x và y luôn dương và được kết hợp để xác định bất kỳ màu cần thiết nào

Sơ đồ trên cho một công cụ để định nghĩa màu nhưng không phù hợp với hoạt

động của phần cứng cũng như không phù hợp trực tiếp với thị giác người Cách tiếp cận khác là các hệ thống HSV (hue, saturation and value), HSI (hue, saturation and intensity) và HLS (hue, lightness and saturation) Không gian mà 3 giá trị này được

vẽ có thể là một hình tròn hoặc hình nón sáu cạnh hoặc hình nón kép như hình 1.14 chỉ ra Có thể tưởng tượng không gian đó như một hình nón kép trong đó trục của hình nón là cấp độ xám từ đen tới trắng Khoảng cách đến tâm trục là độ bão hoà và

hướng là hue

Hình 1.14 Mô hình không gian màu HSI.

Phương trình 1.7 thực hiện chuyển từ không gian RGB thành HSI và bảng 1.1

là phương pháp chuyển từ không gian HSI thành RGB phụ thuộc vào H.

)(

3

1)]

,,[min(

)(

31

))(

()(

)()(2

1cos

,

1 0

B G R I

B G R B

G R S

B G B R G R

B R G R G

B if

G B if H

++

=+

ư

ư+

(1.7)

Trang 26

- 21 -

Bảng 1 Các trường hợp chuyển đổi từ không gian mầu HSI thành RGB

RG (00 ≤ H ≤ 1200) GB (1200 ≤ H ≤ 2400) BR (2400 ≤ H ≤ 3600)

) (

cos

1 0

B R

=

) ( 1

) 60 cos(

cos 1

) 1 ( 120

0 0

G R B

H

H S I

G

S I R

H H

) 1 (

) 60 cos(

cos 1

240

0 0

B G R

S I G

H

H S I B

H H

=

ư

=

1.3 Một số khái niệm cơ bản

ảnh phẳng, ảnh một thị kính một vật kính (monocular) được tạo bởi hệ thống

như camera lỗ (pinhole camera) Trong đó ảnh được tạo bởi phép chiếu các điểm

trên vật thể tới mặt phẳng ảnh qua 1 lỗ ảnh phẳng không cho các thông tin về độ sâu của các điểm trên vật thể trong không gian 3 chiều

ảnh nổi, ảnh hai thị kính hai vật kính (binocular) được tạo bởi hệ thống có

hai điểm nhìn Hệ thống này có các ống kính không đồng quy mà được sắp đặt song

song nhìn ra điểm vô cực theo hướng z nào đó Thông tin độ sâu của một điểm được

giải mã bởi các vị trí khác nhau của điểm đó trong hai mặt phẳng ảnh

Tín hiệu điện của một ảnh trong thực tế thường là liên tục về không gian và cường độ sáng Khi được số hoá, các tín hiệu này được rời rạc hoá thông qua quá trình lấy mẫu và lượng tử hoá thành phần độ sáng Mặc dù các mẫu không gian có

Trang 27

thể được đại diện cho các điểm nhưng sẽ thực tế hơn khi coi các mẫu này như các

mẫu ảnh có kích thước hữu hạn và có mức xám không đổi trong toàn mẫu Những

mẫu ảnh này gọi là các pixel (picture element) và ảnh trở thành ảnh số gồm một tập

hợp các pixel Trong thị giác máy tính, thường coi một pixel cần khảo sát ở trung

tâm có hình chữ nhật thì có 4 pixel hoặc 8 pixel lân cận như mô tả trên hình 1.15

Thường biểu diễn trực tiếp các số đo mức xám của các pixel như hình 1.15c

ảnh số được biểu diễn toán học bằng một hàm ảnh (image function) Nói

chung nó là một hàm vectơ với m hướng Hầu hết các ảnh được biểu diễn bằng hàm

của 2 biến không gian f(x) = f(x,y), trong đó f(x,y) là độ sáng của mức xám ảnh tại

toạ độ (x,y) của các pixel Mức xám (gray level) là kết quả của sự mã hoá tương ứng

một cường độ sáng của mỗi điểm ảnh với một giá trị số Thông thường ảnh đơn sắc

thường được mã hoá bằng 8 bit tương ứng sẽ có 256 mức xám (từ 0 đến 255)

(a) (b) (c)

Hình 1.15 Pixel trung tâm và 4 pixel lân cận (a) và 8 pixel lân cận (b)

Một ảnh đa phổ f là một hàm vectơ với các thành phần (f1, f2, , fn) Một ảnh

đa phổ đặc biệt là ảnh màu trong đó các thành phần đo các giá trị độ sáng của mỗi

một trong 3 bước sóng, đó là:

Với trường hợp ảnh ba chiều 3-D, x = (x,y,z) Thường giá trị của f được lưu

trữ trên 1 bit (với ảnh đen trắng), 8 bit (ảnh đa mức xám) hay 16, 24 hay 32 bit (ảnh

giả màu, màu thật, )

Như thảo luận ở trên, các ảnh thu nhận từ cảm biến ảnh thường bị hư do

nhiều nguyên nhân có thể kể ra như: điều kiện chiếu sáng, nhiễu loạn khí quyển, các

lỗi trong quá trình tạo ảnh, ống kính không hội tụ, chuyển động của các đối tượng,

ồn điện tử của cảm biến, ồn mã hoá và truyền thông Ngày nay, các cảm biến ảnh

15 7 3

9 16 18

2 20 98

Trang 28

- 23 -

trong hệ thống camera đều đã được tích hợp các phần cứng cải thiện chất lượng ảnh ngay trong quá trình thu nhận Tuy nhiên, để có thể nâng chất lượng hình ảnh lên thêm một bước cũng như trích chọn ra những thông tin có ích cần phải tiến hành những nghiên cứu sâu rộng hơn Trong phần tiếp theo tôi sẽ đề cập một cách vắn tắt các phương pháp cải xử lý cải thiện ảnh Phần cuối của chương trình bày một số đặc tính của ảnh có thể dùng trong các hệ thống bám ảnh

1.4 Phép xử lý điểm ảnh dựa trên bảng tìm kiếm LUT

Phép xử lý điểm ảnh chỉ xử lý từng pixel đơn lẻ để thay đổi độ đen trắng (mức xám) và độ tương phản của ảnh Phép xử lý điểm ảnh dựa vào hai công cụ

chính là lược đồ mức xám (histogram) và bảng tìm kiếm LUT (Look-Up-Table)

Lược đồ mức xám cho ta biết sơ lược tình trạng của ảnh như độ tương phản, sự phân

bố năng lượng của ảnh Bảng tìm kiếm là công cụ chính thực hiện các thuật toán xử

lý điểm ảnh, vì nó rút ngắn được khối lượng tính toán, một ảnh có cỡ bất kỳ được biểu diễn trong 256 giá trị và do đó chỉ phải xử lý 256 giá trị

Hình 1.16 minh hoạ phương pháp xử lý ảnh dựa vào bảng tìm kiếm Giả thiết

ảnh đầu vào là ảnh 8 mức xám (từ 0 đến 7), khi đó bảng tìm kiếm được thiết lập là một mảng một chiều 8 phần tử các phần tử ban đầu được gán bằng chỉ số tương ứng Sau đó các thao tác xử lý điểm ảnh như cộng, trừ, nhân… được thực hiện trên bảng tìm kiếm Phép xử lý trong hình 1.16 là phép trừ mức xám với giá trị trừ là 2

ảnh thu được từ camera thường không lấp đầy dải động giá trị mức xám và

có thể năng lượng tập trung tại một vùng hẹp của giá trị xám do điền kiện chiếu sáng của môi trường phức tạp Để lấp đầy thang mức xám của ảnh nhằm tăng độ

tương phản ta sử dụng thuật toán kéo căng độ tương phản (contrast stretching) Khi

phát hiện năng lượng ảnh tập trung trong một vùng giá trị xám ta sử dụng thuật toán

làm bằng lượng đồ mức xám (histogram equalization) Dưới đây sẽ mô tả chi tiết hai

thuật toán trên

Trang 29

Hình 1.16 Hoạt động của bảng tìm kiếm 3 bit

1.4.1 Kéo căng độ tương phản

Sự tương phản của một ảnh là sự khác biệt giữa những pixel sáng và tối cạnh

nhau Thang mức xám của ảnh có độ tương phản thấp thì trong lược đồ của nó các

pixel tập trung vào bên phải, trái hoặc giữa Trên đồ thị lược đồ ảnh bị bó chặt chẽ

xít nhau và có rất ít các mẫu nhỏ ở tất cả những vị trí khác Một ảnh có độ tương

phản cao có những vùng cả sáng và tối Những ảnh có độ tương phản cao thì lấp đầy

dải giá trị có thể có và có những vùng lớn tối và sáng Lược đồ mức xám của một

ảnh có độ tương phản cao thường có hai đỉnh Một đỉnh là trung tâm của vùng thấp

và một đỉnh là trung tâm của vùng cao Phương trình (1.9) mô tả quan hệ của ảnh lối

vào I [ j i, ] và lối ra I [' j i, ] qua phép xử lý kéo căng độ tương phản Trong đó: high

và low là giá trị xám tương ứng lớn nhất và nhỏ nhất của ảnh lối vào

255

*]

,[],[

'

low high

low j i I j i I

ư

Tăng độ tương phản nhằm làm cho ảnh có lược đồ lấp đầy dải động của ảnh

Phép toán này là một kỹ thuật rất hiệu quả trong nâng cao chất lượng ảnh Đặc biệt

với những ảnh có phân bố gauss và gần gauss

1.4.2 Làm bằng lược đồ mức xám

Một ảnh có phân bố cường độ không đồng đều thường được cải thiện nhờ

một phép xử lý được gọi là làm bằng lược đồ mức xám Mục đích cuối cùng của

Trang 30

- 25 -

phép làm bằng là để có một biểu đồ phân bố đều Phép toán này thực hiện việc phân

bố lại sự phân bố cường độ ảnh Nếu như một biểu đồ ảnh có nhiều đỉnh và lõm nó

sẽ vẫn có nhiều đỉnh và lõm sau khi làm bằng Nhưng đỉnh và lõm đã được dịch đi

Cũng như các phép toán xử lý điểm khác, giá trị điểm ảnh đang tồn tại sẽ ánh xạ tới

giá trị mới

Thuật toán làm bằng có thể được thực hiện trong 3 bước là: Tính biểu đồ ảnh,

tính tổng chuẩn hoá của biểu đồ ảnh, biến đổi ảnh lối vào thành ảnh lối ra Thuật

toán này làm việc tốt nhất trên ảnh có những có tiết nhỏ trong vùng tối

1.5 Phép xử lý vùng ảnh

Phép xử lý vùng sử dụng những pixel lân cận nhau của ảnh đầu vào I ( j i, )để

tạo ra một pixel của ảnh đầu ra I'(i,j) Phép xử lý vùng chủ yếu dựa trên phép toán

nhân chập (convolution) Phương trình (1.10) dưới đây là biển diễn toán học của

l j k i I l k w j

i

trong đó: w ( l k, )là mặt nạ nhân chập và là ma trận vuông (2r+1)ì(2r+1) Với mỗi

pixel I ( j i, ) được xử lý thì các pixel lân cận của nó được xem xét để tính toán giá trị

ảnh lối ra I'(i,j) Chẳng hạn ta xét mặt nạ 3ì3 tức là r = 1 thì 8 lân cận của I ( j i, )là

từ I1 tới I8 và trọng số của mặt nạ sẽ là từ W0 tới W8 Hình 1.17 mô tả phép tính cho

pixel I ( j i, )

Trang 31

Hình 1.17 Nhân chập ảnh với mặt nạ

Trong ảnh video thường có hai nguồn nhiễu chính là: nhiễu muối tiêu và

nhiễu cuộn Nhiễu muối tiêu (salt-and-pepper) xuất hiện khi một hình ảnh được mã

hoá và truyền qua một kênh có nhiễu hoặc ồn điện tử của bộ cảm biến trong camera

video Nhiễu cuộn (convolutional) do thấu kính không hội tụ, sự chuyển động, hoặc

sự nhiễu loạn khí quyển trong những điều kiện thời tiết bất lợi Cả hai nguồn nhiễu này phân bố ở các thành phần tần số cao Nhằm mục đích loại bỏ hai nhiễu trên ta thường dùng bộ lọc gauss hoặc lọc trung vị

Lọc gauss cho phép loại bỏ nhiễu tần số cao nhưng nó lại làm mờ biên ảnh Lọc gauss được thực hiện qua phép toán nhân chập với mặt nạ gauss

Lọc trung vị (median) được sử dụng để giảm bớt tiếng ồn tần số cao và nó giữ

được thông tin biên của đối tượng Nhưng phép lọc này mất khá nhiều thời gian

Đây là kỹ thuật lọc không gian phi tuyến, không dùng phương pháp nhân chập Có

thể mô tả vắn tắt thuật toán lọc như sau Xét pixel I 0 và các lân cận (lân cận 8 chẳng

hạn) của nó, xắp xếp các giá trị I 0 và các giá trị của các pixel lân cận theo thứ tự

tăng dần Giá trị nằm chính giữa sẽ được gán cho pixel I 0

Trang 32

- 27 -

1.6 Xử lý hình thái học ảnh nhị phân

1.5.1 Phép biết đổi “trúng hoặc trượt”

Những toán tử hình thái học nhị phân như dãn lân cận 8, co lân cận 8 và làm

đầy đường chéo có thể được phân vào loại biến đổi “trúng hoặc trượt” Biến đổi

trúng hoặc trượt sử dụng khái niệm nhân chập một mặt nạ nhỏ (gọi là phần tử cấu trúc) với một ảnh nhị phân để tạo ảnh lối ra Nếu mẫu trong ảnh phù hợp với mẫu

của mặt nạ thì được gọi là “trúng” và đặt pixel ở vị trí đó có giá trị nhị phân mong muốn (1 chẳng hạn) Nếu ngược lại được gọi là “trượt” và pixel được đặt giá trị

ngược lại (0)

Những phép biến đổi trúng hoặc trượt thảo luận trong phần này làm việc với một mặt nạ cỡ 3x3 Điều này có nghĩa rằng giá trị của mỗi pixel chỉ phụ thuộc vào 8 pixel lân cận của nó Phép nhân chập có thể được thực hiện bằng cách sử dụng một bảng tìm kiếm chỉ có 29 = 512 mẫu trong ảnh nhị phân Điều này nhằm tăng tốc độ

xử lý

1.5.2 Phương pháp lập bảng tìm kiếm

Mỗi pixel và 8 lân cận của nó trong ảnh nhị phân có thể được biểu diễn một cách đầy đủ bởi một số nguyên dương 9 bit Điều này được hoàn thành bởi việc gán mỗi điểm trong khu lân cận cho một vị trí bit riêng biệt trong một số nguyên 9 bit, hình 1.18 mô tả cách biểu diễn này

Hình 1.18 Phương pháp lập bảng tìm kiếm

Bây giờ, thật dễ để định nghĩa và sử dụng một bảng tìm kiếm cho thao tác hình thái học mong muốn Trước khi nhân chập với ảnh, ta hãy định nghĩa một bảng tìm kiếm với 512 mục bảng Lấy mỗi mẫu có thể có định nghĩa chỉ số vào trong bảng tìm kiếm Sau đó giá trị ở mỗi vị trí đó sẽ được đánh dấu là “trúng” hoặc

Trang 33

“trượt” dựa vào chỉ số Để thực hiện nhân chập mặt nạ 3x3 với ảnh, thực hiện quét

qua ảnh, tính số nguyên tương ứng tại mỗi điểm và sử dụng số đó như một chỉ số

trong bảng tìm kiếm, sau đó đặt giá trị của pixel hiện hành bằng giá trị trong bảng

tìm kiếm Ta định nghĩa pixel thuộc đối tượng (mặt) có giá trị là 1 và pixel nền là 0

1.5.3 Phép d∙n lân cận 8

Phép dãn lân cận 8 tạo ra một pixel mặt nếu ít nhất một pixel lân cận 8 là

pixel mặt Phép này có hiệu ứng làm phình ra phía ngoài đường biên của một đối

tượng nhị phân với độ rộng một pixel Nếu ứng dụng lặp đi lặp lại, những đối tượng

nhị phân có thể lớn lên và chồng lên nhau cho đến khi toàn bộ ảnh là những pixel

đối tượng Mỗi điểm, Y, trong ảnh đầu ra là tập hợp theo mối quan hệ với ảnh lối vào

theo phương trình

7 6 5 4 3 2 1

X X

1.5.4 Phép co lân cận 8

Phép co lân cận 8 xoá bỏ một pixel mặt nếu ít nhất một lân cận 8 của nó là

một điểm nền Phép này có hiệu ứng làm co đối tượng trong ảnh Nếu lặp đi lặp lại,

những đối tượng sẽ dần dần co lại cho đến khi chúng hoàn toàn biến mất Mỗi điểm,

Y, trong ảnh đầu ra là tập hợp theo mối quan hệ như phương trình dưới đây

7 6 5 4 3 2 1

X X

1.5.5 Phép lấp đầy đường chéo

Phép lấp đầy đường chéo tạo ra một pixel mặt bất cứ khi nào sự tạo thành nó

sẽ loại trừ kết nối 8 pixel nền Toán tử này loại bỏ bất kỳ sự không rõ ràng nào từ

ảnh cần thiết để áp dụng những thao tác hình thái học khác Mỗi điểm, Y, trong ảnh

đầu ra là tập hợp theo mối quan hệ trong phương trình dưới đây

)(P1 P2 P3 P4X

ở đó P1= X∩X0∩X1∩X2 P2 = X ∩X2 ∩X3∩X4

6 5 4

P = ∩ ∩ ∩ P4 = X ∩X6 ∩X7 ∩X0

Trang 34

1.5.7 Phép đóng

Phép đóng ảnh được tạo từ phép dãn ảnh sau đó là một phép làm co ảnh Số lượng các bước làm co ảnh lớn đúng bằng số các bước làm dãn ảnh Qua phép đóng các đối tượng nằm sát nhau cùng lớn lên, có lỗ trống trong các đối tượng được khép kín lại và các cấu trúc lõm ở mép đối tượng được làm đầy

1.6 Đặc tính đường biên

Biên trong ảnh là một đường biên giới hay một đường bao mà ở đó xuất hiện

sự thay đổi đáng kể một vài tính chất vật lý của ảnh, như độ phản xạ bề mặt, độ chiếu sáng hoặc khoảng cách từ những bề mặt nhìn thấy đưa đến vị trí quan sát Thay đổi tính chất vật lý biểu hiện bằng nhiều cách bao gồm: thay đổi cường độ, thay đổi màu, kết cấu bề mặt… Trong phát hiện biên chỉ quan tâm đến sự thay đổi của cường độ ảnh

Với I(i,j) là hàm cường độ ảnh, và f(i,j) là hàm hai chiều biểu diễn đường biên trong ảnh I(i,j) Như định nghĩa ở trên, biên ảnh là điểm có sự thay đổi đột ngột

về cường độ ảnh Vậy nếu I(i,j) là một vị trí biên thì tại đó gradient cường độ sẽ đạt cực đại và đồng thời đạo hàm bậc hai (laplacian) sẽ qua điểm không như minh hoạ

trong hình 1.19 Hình 1.19a là hàm bậc nhất biểu diễn một kiểu đường biên, hình 1.19b và 1.19c tương ứng là đạo hàm bậc nhất và bậc hai

Trang 35

Hình 1.19 Hàm f(x) và đạo hàm bậc nhất và bậc 2 của nó

1.6.1 Phát hiện biên dựa vào đạo hàm bậc nhất

Đạo hàm bậc nhất một hàm hai chiều tương tự f(x,y) được tính như sau:

y

y x f i x

y x f y x f

∂

∂+

∂

= ( , ) ( , ))

,(

trong đó, i x và i y tương ứng là vector đơn vị theo hướng x và y Việc dựa vào f’(x,y)

để phát hiện đường biên được minh hoạ trong hình 1.5 Đầu tiên tính biên độ của

f’(x,y) sau đó đem so sánh với một ngưỡng để xác định điểm biên Phân ngưỡng như

trên sẽ tạo ra một dải biên chứ không phải một đường biên, do đó thuật toán làm

mảnh biên có thể được áp dụng đối với một số ứng dụng

Tớnh đạo hàm Tớnh biờn độ Phõn ngưỡng Làm mảnh biờn

Cỏc điểm biờn

Hình 1.20 Tuần tự các bước xử lý tìm biên

Trang 36

- 31 -

Đối với ảnh số hàm f(x,y) là một hàm rời rác và được ký hiệu là I(i,j) thì đạo

hàm theo phương trình (1.14) được tính xấp xỉ Với các phương pháp xấp xỉ khác

nhau ta thu được các kết quả khác nhau tuỳ theo từng ứng dụng Để thực hiện tính

đạo hàm bậc nhất ta có thể sử dụng phép nhân chập ảnh I(i,j) với mặt nạ G, mặt nạ

này phụ thuộc vào phương pháp lấy xấp xỉ

Chẳng hạn Roberts thực hiện phép xấp xỉ như sau để tính biên độ gradient:

01

10

y

G

Sobel sử dụng cách tính nội suy điểm giữa dùng lân cận 3ì3 (hình 1.21) Sau

đó biên độ gradient được tính theo công thức (1.14)

2 2

)(

4 5 6 2 1 0

6 7 0 4 3 2

a ca a a ca a G

y

x

++

ư++

=

++

ư++

2 0 2

1 0 1

0 0 0

1 2 1

y

G

Với mặt nạ Prewitt sử dụng hằng số c=1 ta thu được các ma trận G như sau:

Trang 37

1 0 1

0 0 0

1 1 1

y

G

1.6.2 Phát hiện biên dựa vào đạo hàm bậc hai

Toán tử Laplacian của hàm hai chiều liên tục được tính như sau:

2

2 2

2 ( , ) ( , ))

,(

"

y

y x f x

y x f y

x f

∂

∂+

∂

Với phương pháp lấy xấp xỉ tương tự như trên ta thu được các mặt nạ nhân

chập cho hàm ảnh rời rạc hai chiều Đây là đạo hàm bậc hai không có hướng, ta phải

xác định các điểm qua 0 để xác định điểm biên

1 4 1

0 1 0

1 8 1

1 1 1

2

L

Do đạo hàm bậc hai rất nhạy với nhiễu nên ta thường sử dụng một bộ lọc

gauss để loại bỏ nhiễu trước, đây là bộ tìm biên LoG (Laplacian of Gaussian) Ma

trận nhân chập được xác định như phương trình (1.20) sau:

[ ( , )* ( , )] [ ( , )]* ( , ))

,

y x f y x g y

x f y x g y

x

ở đó

2 2 2

2 ) (

4

2 2 2

),

σ

y x y x g

1.6.3 Phương pháp Canny để phát hiện biên

Năm 1986, John Canny đã đưa ra một tập các tiêu chuẩn mà một phương

pháp tìm biên phải đạt được và qua đó trình bày một phương pháp tối ưu để thực

hiện chúng Canny đã chỉ rõ ba tiêu chuẩn cần phải thực hiện là : (1) Mức lỗi: Một

phương pháp tìm biên chỉ phải tìm tất cả các cạnh, không cạnh nào tìm được lại bị

lỗi; (2) Định vị: Độ lệch mức xám trên cùng một đường biên càng nhỏ càng tốt; và

(3) Hiệu quả: Tách biên không được nhận ra nhiều biên trong khi đó chỉ có một biên

thực sự tồn tại Phương pháp canny là một thủ tục tìm biên nhiều bước

Trang 38

- 33 -

Bước 1: Làm trơn ảnh với bộ lọc gauss để giảm ồn và các chi tiết, các kết cấu không

mong muốn

),(

*),(),(i j G i j I i j

1

σπσ

σ

j i G

Bước 2: Tính gradient của g(i,j) sử dụng một trong các toán tử gradient (Roberts,

Sobel, Prewitt, …) và lấy:

),(),()

,

j i g j i g j i

j i g j i g j

),(if)

,()

,(i j M i j M i j T

ở đó T được chọn sao cho tất cả các thành phần biên được giữ trong khi hầu

hết ồn bị khử

Bước 4: Loại bỏ những pixel không cực đại của biên thu được trong M T để làm

mỏng biên Để làm việc này, kiểm tra xem liệu mỗi điểm khác 0 trong

M T (i,j) có lớn hơn hai lân cận theo hướng gradient θ( j i, ) Nếu lớn hơn thì

giữ lại MT(i,j) còn trường khác thì đặt bằng 0

Bước 5: Mặc dù làm trơn ảnh được áp dụng trong bước 1 nhưng kết quả tính

gradient vẫn chứa nhưng pixel không cực đại Để khắc phục, hai ngưỡng

khác nhau τ và 1 τ (thường chọn 2 τ2 ≈ 2τ1) được áp dụng trong bước 3 để

thu được hai ảnh nhị phân T 1 và T 2 ảnh T 2 có các khoảng trống trong

đường biên chứa một vài biên sai Với thuật toán phân ngưỡng kép các biên

trong T 2 được kết nối thành đương biên Khi đạt đến cuối đường biên, thuật

toán sẽ xem trong T1 ở các vị trí lân cận 8 để có thể kết nối với đường biên

Thuật toán tiếp tục cho đến khi khoảng trống được kết nối tới biên T2

Trang 39

Thuật toán thực hiện kết nối biên như một kết quả phụ của phân ngưỡng và

một số giả thuyết về chọn ngưỡng

1.7 Đặc tính góc

Cũng như đặc tính biên, góc thường được sử dụng cho sự đoán nhận và bám

đối tượng Những đặc tính như vậy tỏ ra ổn định qua chuỗi các ảnh, và do đó cũng

được quan tâm trong các ứng dụng theo dõi những đối tượng qua chuỗi ảnh

Vậy, phương pháp phát hiện ra những góc như thế nào? Ta xét hai ảnh

gradient, G x và G y của điểm ảnh p, một khu lân cận W của p, và một ma trận C được

y x W

x

G G

G

G G G

C

2

(1.25)

Ma trận C mô tả đặc điểm cấu trúc của các mức xám thông qua các giá trị riêng của

C và sự thể hiện tính chất hình học của chúng Chú ý rằng C là đối xứng, và bởi vậy

có thể được chéo hoá bằng cách quay trục toạ độ; như vậy, không mất tính tổng

quát, chúng ta có thể cho C như một ma trận đường chéo:

Cả hai giá trị riêng λ1 và λ2 là không âm Chúng ta có ba trường hợp : (1) W

là đồng dạng hoàn hảo, λ1 = λ2 vì gradien ảnh triết tiêu ở mọi nơi; (2) W chứa một

biên nhẩy bậc đen và trắng lý tưởng, ta có λ2 = 0 và λ1 > 0, và vectơ riêng liên quan

đến λ1 là song song với gradien ảnh; và (3) W chứa góc của một hình vuông đen trên

nền trắng; khi có hai phương chính trong W, chúng ta chờ đợi λ1 ≥ λ2 > 0, và những

giá trị riêng lớn hơn, mạnh hơn (tương phản cao hơn) tương ứng với những đường

ảnh của chúng Một góc như vậy được xác định bởi hai biên mạnh, bởi vậy, khi λ1 ≥

λ2 , một góc là một vị trí ở đó giá trị riêng λ2 nhỏ hơn là đủ lớn Thủ tục để định vị

kiểu đặc tính ảnh mới này có thể được tổng kết như sau: Đầu vào được hình thành

Trang 40

- 35 -

bởi một ảnh I(x,y), hai ngưỡng λ2 và t và cỡ của khu lân cận, cho một cửa sổ vuông, (2N+1) pixel

1 Tính gradien qua toàn bộ ảnh I(x,y)

2 Cho mỗi điểm chỉ p:

(a) Hình thành ma trận C qua một lân cận (2N+1)ì(2N+1) W của p

(b) Tính λ2 , giá trị riêng nhỏ hơn của C

(c) Nếu λ2 > t, lưu trữ những toạ độ của p vào trong một danh sách, L

3 Xắp xếp L theo sự giảm của λ2

4 Quét danh sách được xắp xếp từ trên xuống; cho mỗi điểm, p, xoá tất cả các điểm xuất hiện thêm trong danh sách mà thuộc vào khu lân cận của p

Các đặc tính được thảo luận trên đâu đều có khả năng bám để phát hiện chuyển động của các đối tượng di động Việc chọn các đặc tính tốt để tạo ra bộ bám bền vững sẽ được thảo luận trong phần 3.4.3

1.7.Hệ thống phát hiện mục tiêu tự động

Khi công nghệ bám bắt đầu xuất hiện, nó đã được phát triển từ các thiết kế với phần cứng rất hạn chế tới các giải pháp dựa trên các mô hình toán học của môi trường bám và dữ liệu cảm biến Ngày này, các hệ thống bám hiện đại đã được cải tiến được phát triển sử dụng các công cụ là lý thuyết phát hiện và ước lượng Phương pháp thiết kế dựa trên mô hình này là nền tảng cho các thế hệ của những hệ thống bám hình ảnh hiện tại và tương lai

Các hệ thống bám video tự động được dùng rộng rãi và đa dạng trong các môi trường bám khác nhau với các nhiệm vụ rất khác nhau Chúng được sử dụng trong nhiều ứng dụng bao gồm: dẫn đường và điều khiển hoả lực, giám sát, phân luồng điều khiển giao thông, phân biệt mục tiêu một cách tự động và robot hoạt

Định dạng
Số trang	213
Dung lượng	6,83 MB