- 5 - Trong thực tế, lỗ có một kích thước nào đó mặc dù nhỏ, và mỗi điểm trong mặt phẳng ảnh tập hợp ánh sáng từ một hình nón của những tia sáng trương một góc đặc hữu hạn, vì vậy mô hìn
Trang 1báo cáo tổng kết đề tài
thiết bị tập ngắm, bắn bằng laser và xử lý ảnh phục vụ huấn luyện
Chủ nhiệm đề tài:Nguyễn Văn Long
Trung Tâm Triển Khai Công Nghệ
5969
28/8/2006
Hà nội, tháng 12 – 2005
Trang 2Mục Lục
Chương 1: tổng quan về xử lý tín hiệu ảnh số 3
1.1 Mở đầu 3
1.2 Quá trình tạo ảnh và các mô hình ảnh 4
1.2.1 Camera 4
1.2.2 Màu sắc và biểu diễn ảnh màu 17
1.3 Một số khái niệm cơ bản 21
1.4 Phép xử lý điểm ảnh dựa trên bảng tìm kiếm LUT 22
1.4.1 Kéo căng độ tương phản 23
1.4.2 Làm bằng lược đồ mức xám 24
1.5 Phép xử lý vùng ảnh 24
1.6 Xử lý hình thái học ảnh nhị phân 26
1.6.1 Phép biết đổi “trúng hoặc trượt” 26
1.6.2 Phương pháp lập bảng tìm kiếm 26
1.6.3 Phép dãn lân cận 8 27
1.6.4 Phép co lân cận 8 27
1.6.5 Phép lấp đầy đường chéo 28
1.6.6 Phép mở 28
1.6.7 Phép đóng 28
1.7 Đặc tính đường biên 28
1.7.1 Phát hiện biên dựa vào đạo hàm bậc nhất 29
1.7.2 Phát hiện biên dựa vào đạo hàm bậc hai 31
1.7.3 Phương pháp Canny để phát hiện biên 32
1.8 Đặc tính góc 33
1.9.Hệ thống phát hiện mục tiêu tự động 35
1.9.1 Tổng quan về hệ thống bám video tự động 35
Trang 31.9.2 Kiến trúc vòng bám 37
1.9.3 ước lượng vị trí mục tiêu 39
1.9.4 Cửa mục tiêu và tìm breaklock 41
1.9.4.1 Xây dựng cửa 42
1.9.4.2 Phân đoạn mục tiêu 46
1.9.4.3 Các thuật toán tìm breaklock 47
1.9.5 Bù vòng bám và xác định LOS 49
1.9.5.1 Xác định LOS 49
1.9.5.2 Bù vòng bám 50
Chương 2: thiết kế tổng thể về hệ thống bắn tập trên cơ sở xử lý tín hiệu và có trợ giúp của mạch điện tử và quang học 53
2.1 Các khối chính trong hệ thống tập ngắm bắn 53
2.2 Mô tả tóm tắt hoạt động của hệ thống tập ngắm bắn 55
Chương 3: giải bài toán phát hiện vết laser xuất hiện trên hệ bia trong phông nền cố định 56
3.1 Mở đầu 56
3.2 Phát hiện vùng thay đổi 57
3.3 Các phương pháp chọn ngưỡng 58
3.3.1 Phương pháp chọn ngưỡng cố định 58
3.3.2 Phương pháp chọn ngưỡng kép toàn cục của trigơ smitt 59
3.3.3 Phân ngưỡng thích nghi 62
3.3.4 Giải pháp ngưỡng kép kết hợp với phân ngưỡng thích nghi cục bộ. 63
3.3.5 Phương pháp bó k trung bình cho vùng đối tượng xuất hiện 65
3.5 Nhận dạng vết laser theo một số đặc tính đặc trưng 67
3.5.1 Nhận dạng theo các đặc tính hình học 67
3.5.2 Nhận dạng theo các đặc tính mômen 68
Trang 43.5.3 Chọn lại đối tượng duy nhất bằng các phép so sánh mômen 69
Chương 4 Thực nghiệm về giải pháp nhận dạng bia, tính điểm và báo điểm 75
4.1 Thực nghiệm về xác định kiểu bia bằng phương pháp hình thể 78
4.2 Thực nghiệm về phương pháp tính điểm 83
4.3 Sai số về hệ thống tính điểm 86
Chương 5: Xây dựng hệ quản lý quá trình tập luyện và giải pháp bảo mật 87
5.1.Thiết kế các bảng dữ liệu 89
5.2 Thiết kế giao diện 91
5 3.Vấn đề bảo vệ bản quyền cho hệ thống phần mềm 97
5.3.1 Giao tiếp USB 97
5.3.2 HID (Human Interface Device) 103
5.3.3 HID là gì ? 10
5.3.4 Các yếu tố cần thiết để phát triển thiết bị HID 103
5.3.5 Phương thức hoạt động của HID 104
5.4 Giải thuật bảo vệ cho chương trình 106
Chương 6: Thiết kế hệ thống cơ khí, quang học và điện tử phụ trợ 108
6.1 Thiết kế mạch điện phát laser và phát tín hiệu hồng ngoại điều khiển cho khối tạo giả tiếng súng 109
6.2 Lựa chọn đầu phát laser cho hệ thống bắn tập 112
6.3 Thiết kế mạch khoá cứng cho phần mềm xử lý ảnh 113
Một số phụ lục về phần mềm kèm theo
- Một số module mã nguồn quan trọng
Trang 5
Danh môc c¸c tõ viÕt t¾t
ADC Analog-Digital Converter
ATR Automatic Target Recognition
CCD Charge Couple Device
CCIR Consultative Committe on International Radio
CIE Commission International de L'Eclairage
CONDENSATION CONdition DENSity PropagATION
DSP Digital Signal Processing
EIA Electronics Industries Association
FIFO First In First Out
FOV Field Of View
HIS Hue-Saturation-Intensity
HSV Hue-Saturation-Value
INS Inertial Navigation System
ISA Industry Standard Architecture
KLT Kanade-Lucas-Tomasi
LOS Line Of Sight
LUT Look-Up Table
PCI Peripheral Component Interconnection
PID Proportional Integral Derivative
PSoC Programmable System on Chip
Trang 6
Lời giới thiệu
Trên thế giới, công nghệ mô phỏng có vai trò chủ đạo trong hoạt
động công nghệ cao, con người bay vào vũ trụ an toàn nhờ thử nghiệm trên các thiết bị mô phỏng dưới mặt đất Mô phỏng còn cho phép nghiên cứu, thử nghiệm các loại vũ khí mà trong điều kiện thực không được phép thực hiện do hoàn cảnh chính trị, xã hội, môi trường v…v… như tiến hành nổ hạt nhân …
Từ khi có cuộc cách mạng công nghệ thông tin, công nghệ mô phỏng cũng nhanh chóng phát triển trong mọi lĩnh vực khác nhau cả về quân sự lẫn dân sự Công nghệ mô phỏng trong công tác đào tạo huấn luyện đã trở thành xu hướng chủ đạo của các nước
Ngay những cường quốc về quân sự, việc ứng dụng công nghệ mô phỏng chế tạo các thiết bị phục vụ huấn luyện chiến đấu là một trong những giải pháp tối ưu nâng cao chất lượng và hiệu quả huấn luyện chiến
đấu, mang lại nhiều lợi ích trên mọi phương diện, lợi ích lớn nhất là tiết kiệm nguồn tài chính dùng cho huấn luyện
Ngày nay trên thế giới, các thiết bị mô phỏng dùng trong huấn luyện chiến đấu thường rất đắt, nhiều thiết bị chỉ phù hợp chiến thuật của từng nước sản xuất, đồng thời nhiều thiết bị cũng không cho phép chuyển giao vì lý do quân sự …
Thực trạng trang thiết bị mô phỏng dùng trong huấn luyện chiến đấu ở nước ta chiếm tỷ lệ rất thấp Những thiết bị trước kia được viện trợ, nhập ngoại … nay đều đã lâu năm, thô sơ, lạc hậu, hỏng, xuống cấp … mặc dù các đơn vị cố gắng trong việc bảo dưỡng, sửa chữa cũng không đáp ứng huấn luyện vì sai số, mất an toàn
Trang 7Chính vì vậy, ngay từ những năm 1997, Bộ Tổng tham mưu coi giải pháp này là nhiệm vụ mang tính cấp bách, nhiều Dự án về trang thiết
bị mô phỏng dùng trong huấn luyện chiến đấu được thực hiện với nhiều giai đoạn đã cho những kết quả tiền khả thi mang tính thực tiễn đã khẳng
định cần đầu tư trong những năm tiếp theo Với những nội dung: Huấn luyện không quân, Hải quân, Tăng thiết giáp, Công binh, Thông tin, Pháo binh, Hoá học, Bộ binh, Thể thao thành tích cao … Việc thực hiện các
Dự án này ngoài những thiết bị nhập ngoại cũng đã thu hút nhiều đơn vị trong và ngoài quân đội tham gia nghiên cứu, chế thử, đi đến sản xuất nhiều chủng loại thiết bị mới, rất phù hợp yêu cầu thực tế huấn luyện, song cho đến nay việc đáp ứng yêu cầu huấn luyện còn rất yếu cần đầu tư tiếp
Đã từ hơn 10 năm nay, Cục Quân Huấn - BTTM đã phối hợp với Viện ứng dụng công nghệ hợp tác chặt chẽ về KHKT, cho ra đời nhiều thiết bị huấn luyện có hiệu quả, độ chính xác cao, độ bền, độ ổn
định, đơn giản hoá các thao tác cho người sử dụng, phù hợp tính cơ động, sẵn sàng chiến đấu và đáp ứng yêu cầu thực tế huấn luyện
Đã tổ chức nhiều đợt tập huấn toàn quân trên thiết bị của Viện ứng dụng công nghệ cho những kết quả rất tốt
Đề tài : “Nghiên cứu, thiết kế, chế thử hệ tập ngắm, bắn trên bia
có tính điểm bằng phương pháp laser và xử lý ảnh phục vụ Quốc phòng,
an ninh “ thực hiện từ những yêu cầu trên, nhằm đưa đội ngũ nghiên cứu
đi sâu vào lĩnh vực công nghệ xử lý ảnh đồng thời nâng cao nhận thức của các chiến sĩ với khoa học công nghệ, tất cả đều hướng về mục tiêu hiện đại hoá Quốc phòng, an ninh
Trang 8được đặt vấn đề từ rất sớm Đồng thời con người cũng đặt vấn đề trang bị thị giác cho các máy móc phục vụ con người
Với sự phát triển của kỹ thuật tính toán số, các ảnh thu nhận được từ các thiết
bị tạo ảnh đã được số hoá và được xử lý trực tiếp bằng máy tính số Trong những năm gần đây, xử lý ảnh số đã được phát triển và trở thành một lĩnh vực khoa học Xử
lý ảnh số đã nâng cao chất lượng của ảnh đồng thời phân tích và lý giải nó phục vụ các mục đích riêng biệt Trong chương này ta sẽ giới thiệu các mô hình tạo ảnh, biển diễn ảnh và các khái niệm cơ bản về xử lý ảnh số Hình 1.1 chỉ ra hệ thống thu nhận
và xử lý ảnh số thông thường
Hình 1.1 Hệ thống thu nhận và xử lý ảnh số
Để mở đầu chương này, các quá trình tạo ảnh, biểu diễn ảnh và quá trình số hoá ảnh sẽ được đề cập đến một cách sơ lược Phần tiếp theo sẽ trình bày vắn tắt một
số khái niệm cơ bản của thị giác mày tính và xử lý ảnh Phần còn lại của chương này
sẽ trình bày chi tiết hơn về việc xử lý nâng cao chất lượng ảnh số lối vào bằng chương trình máy tính Cũng để tạo tiền đề cho phần tiếp theo thì các đặc tính của
ảnh cũng được đề cập tới
Trang 91.2 Quá trình tạo ảnh và các mô hình ảnh
1.2.1 Camera
Có nhiều kiểu thiết bị tạo ảnh, từ mắt động vật đến những ống kính camera
ghi hình và radio Chúng có thể có hoặc không trang bị thấu kính Mô hình buồng
tối camera đầu tiên được phát minh vào thế kỷ 16 không có các thấu kính, nhưng
thay vào đó là một lỗ (pinhole) để hội tụ các tia sáng lên trên tường hoặc tấm mờ
Các lỗ dần dần được thay thế bởi các thấu kính càng ngày càng phức tạp
Nói chung camera thường có hai bộ phận cơ bản một là hệ thống tạo ảnh và
hai là bề mặt tạo ảnh có chứa chất nhạy cảm quang Bề mặt tạo ảnh của một camera
thông thường là hình chữ nhật, nhưng các camera toàn cảnh có thể trang bị mặt tạo
ảnh hình trụ để tăng trường nhìn Những phần tử nhạy tạo ảnh có những đặc trưng
khác nhau Chúng có thể ghi nhận một ảnh rời rạc hoặc một ảnh liên tục về mặt
không gian Hệ thống tạo ảnh có thể là lỗ hoặc là hệ thấu kính trong các camera
hiện đại Ta sẽ khảo sát các quá trình tạo ảnh và các phần từ nhạy tạo ảnh dưới đây
Phép chiếu phối cảnh
Hãy tưởng tượng ta cầm một cái hộp, châm một lỗ nhỏ vào một trong số các
mặt của hộp bằng một đinh ghim, và thay thế mặt đối diện bằng một tấm mờ Nếu ta
đặt nguồn sáng nào đó (một ngọn nến chẳng hạn), ta sẽ nhìn thấy hình ngọn nến lộn
ngược xuất hiện trên tấm mờ (hình 1.2a)
Hình 1.2 Mô hình tạo ảnh qua lỗ (a) và minh hoạ cách tính phương trình phối cảnh (b)
ảnh này được hình thành bởi những tia sáng phát ra từ cảnh gần với mặt hộp
Nếu lỗ được giảm nhỏ tới một điểm (dĩ nhiên không thể đạt được về mặt vật lý), thì
chính xác một tia sáng sẽ đi qua xuyên qua mỗi điểm trong mặt phẳng tấm mờ (mặt
phẳng ảnh), lỗ và một điểm cảnh tương ứng nào đó
(a) (b)
Trang 10- 5 -
Trong thực tế, lỗ có một kích thước nào đó (mặc dù nhỏ), và mỗi điểm trong
mặt phẳng ảnh tập hợp ánh sáng từ một hình nón của những tia sáng trương một góc
đặc hữu hạn, vì vậy mô hình được lý tưởng hoá và đơn giản vô cùng này của tạo ảnh
hình học có ít hiệu quả Tuy vậy, mô hình chiếu phối cảnh lỗ (cũng được gọi là phối
cảnh trọng tâm), đầu tiên được đề xuất bởi Brunelleschi hồi đầu thế kỷ 15, rất tiện
lợi về toán học Bất chấp sự đơn giản, nó thường cung cấp một sự xấp xỉ chấp nhận
được của quá trình tạo ảnh Đôi khi để dễ tính ta thay ảnh thật bằng một ảnh ảo đối
xứng với ảnh thật qua lỗ (hình 1.2a)
Bằng các phép tính hình học đơn giản, ta dễ dàng thu được các phương trình
cho phép chiếu phối cảnh (hình 1.2b) Trong hình điểm C’ là giao điểm của trục
quang và ∏’ được gọi là tâm ảnh Điểm này có thể được sử dụng như là gốc toạ độ
ảnh và là điểm tâm để tính trong các thủ tục chuẩn hoá (calibration) camera
Lấy điểm P là một điểm thuộc quang cảnh có toạ độ (x,y,z) và P’ là ảnh của
P có toạ độ là (x’,y’,z’) Do P’ nằm trên mặt phẳng ảnh ta có z’=f’ Từ ba điểm P, O,
và P’ cùng nằm trong một đường thẳng, ta có OP'=λOP, do vậy
x f x
''
''
(1.1)
Phép chiếu Affine
Như đã nói trong phần trên, phối cảnh lỗ chỉ là một xấp xỉ của quá trình tạo
ảnh hình học Phần này mô tả một lớp xấp xỉ thô hơn được gọi là mô hình chiếu
affine, nó cũng được sử dụng trong một số trường hợp Hai phép chiếu affine có thể
kể ra là phép chiếu phối cảnh yếu và phép chiếu trực giao Phép chiếu phối cảnh yếu
là một mô hình có thể chấp nhận được trong nhiều điều kiện tạo ảnh, nhưng phép
chiếu trực giao thuần tuý thường không thực tế Ta sẽ không mô tả chi tiết mà kể tên
chúng vì chúng chỉ có ý nghĩa mang tính lịch sử
Các camera có thấu kính
Trang 11Đa số các camera được trang bị hệ thấu kính Có hai lý do chính là: Trước hết
là để tập hợp ánh sáng từ một tia sáng đơn lẻ sẽ đến mỗi điểm khác nhau trong mặt
phẳng ảnh dưới phép chiếu lỗ lý tưởng Thực tế các lỗ tất nhiên có một kích thước
hữu hạn, vì vậy mỗi điểm trong mặt phẳng ảnh được chiếu bởi một hình nón của
những tia sáng trương một góc đặc hữu hạn Lỗ lớn hơn hình nón rộng hơn và ảnh
sáng hơn, nhưng một pinhole lớn sẽ cho ảnh không rõ nét Làm co lỗ tạo ra ảnh sắc
nét, nhưng làm giảm số lượng ánh sáng đến mặt phẳng ảnh, và có thể đưa đến hiệu
ứng nhiễu xạ Lý do chính thứ hai là khi sử dụng một thấu kính sẽ giữ ảnh sắc nét
trong khi tập hợp được ánh sáng từ một vùng lớn
Bỏ qua sự nhiễu xạ, giao thoa và các hiện tượng quang học vật lý khác, hoạt
động của thấu kính tuân theo các định luật quang hình
Ta minh hoạ quá trình tạo ảnh của điểm P qua thấu kính mỏng trong hình
1.3a Ta có được phương trình 1.2 để tính vị trí ảnh P’
f z z
11'
ở đó
)1(
Hình 1.3 Quá trình tạo ảnh qua thấu kính mỏng (a) và thấu kính dầy (b)
Ta thấy rằng phương trình thể hiện qua hệ vị trí của P và P’ là chính xác
giống như phép chiếu phối cảnh lỗ nếu ta lấy z’=f’ Từ P và P’ nằm trên đường
thẳng xuyên qua tâm của thấu kính và các điểm ở vị trí –z chỉ hội tụ sắc nén khi mặt
phẳng ảnh ở ví trí z’ Khi z→ ư∞, là các vật như các vì sao, sẽ được ảnh tại vị trí
(a) (b)
Trang 12phép chiếu thấu kính mỏng ngoại trừ một sai khác (hình 1.3b) Nếu H và H’ là hai
điểm chính của thấu kính, thì phương trình 1.2 giữ nguyên khi –z (tương ứng là z’) là khoảng cách giữa điểm P (tương ứng là P’) và mặt phẳng chứa điểm H (tương ứng là
H’) trực giao với trục quang
Trong thực tế, các vật nằm trong một phạm vi khoảng cách hội tụ nhỏ (được gọi là chiều sâu của trường hoặc chiều sâu tiêu điểm) Chiều sâu trường tăng theo số
f của thấu kính (số f là tỷ lệ giữa tiêu cự của thấu kính và đường kính nó) Trường
nhìn của một camera là phần của không gian cảnh mà thật sự chiếu lên trên phim của camera Nó không được định nghĩa chỉ bởi tiêu cự, mà còn phụ thuộc vào vùng
có hiệu quả của võng mạc (hoặc vùng phim có thể được lộ sáng trong một camera chụp ảnh, hoặc vùng nhạy CCD trong một camera số hình 1.4)
Hình 1.4 Minh hoạ trường nhìn của camera
Các thấu kính đơn bị một số quang sai Tại sao vậy? Ta hãy nhớ lại trong
phương trình quang hình chỉ là xấp xỉ, có hiệu lực khi góc α nhỏ sao cho sinα≈ α Cho nhưng góc lớn hơn, ta sử dụng khai triển Taylor bậc 3 thu được phương trình cận trục tinh vi hơn
Trang 13Các hiện tượng tương tự xảy ra với thấu kính và là hai loại quang sai cầu
(hình 1.5a): Xét điểm P nằm trên trục quang và ảnh cận trục P’ của nó Khoảng
cách giữa điểm P’ và giao điểm của trục quang với với một tia xuất phát từ P và bị
khúc xạ bởi thấu kính được gọi là quang sai cầu dọc của tia Nếu mặt phẳng ảnh ∏’
được dựng trên P’, tia khúc xạ sẽ cắt mặt phẳng này tại điểm cách trục quang một
khoảng được gọi là quang sai cầu ngang của tia này Đồng thời, tất cả các tia xuyên
qua P và bị khúc xạ bởi thấu kính tạo thành một hình tròn rối loạn Kích thước của
hình tròn đó thay đổi khi ta di chuyển ∏’ dọc theo trục quang Hình tròn có đường
kính nhỏ nhất được gọi là hình tròn rối loạn tối thiểu, và nói chung là không tại vị
trí điểm P’
Bên cạnh quang sai cầu, có 4 loại quang sai cơ bản khác do sự khác nhau
giữa quang học bậc nhất và bậc 3 là: coma, loạn thị, cong trường và méo Các định
nghĩa chính xác các khái niệm này vượt quá khuôn khổ luận văn nay Nói chung,
giống như quang sai cầu nó làm giảm chất lượng ảnh Sự méo làm thay đổi hình
dạng của ảnh như trong hình 1.5b ảnh hưởng này phù hợp với thực tế rằng các
vùng khác nhau của thấu kính có tiêu cự khác nhau nhỏ Quang sai phải được kể đến
nữa là sự đơn sắc (chúng phụ thuộc vào đáp ứng của thấu kính với các bước sóng
thay đổi) Tuy nhiên, chiết suất của môi trường trong suốt phụ thuộc vào bước sóng
(hình 1.5c) và nó kéo theo phương trình thấu kính mỏng (1.2) là tiêu cự cũng phụ
thuộc vào bước sóng Điều này sinh ra hiện tượng sắc sai: các tia khúc xạ tương ứng
với các bước sóng khác nhau sẽ cắt trục quang ở các điểm khác nhau (sắc sai dọc)
và tạo ra các đường tròn rối loạn khác nhau trong mặt phẳng ảnh như nhau (sắc sai
Trang 14- 9 -
Các quang sai có thể giảm thiểu bằng cách sắp xếp một vài thấu kính đơn với hình dạng và chiết suất được chọn tốt và được phân tách bằng khoảng chặn thích hợp Các thấu kính phức tạp vẫn có thể được làm theo các phương trình thấu kính dày Chúng lại bị thêm khuyết tật liên quan đến thị giác máy: Chùm sáng phát ra từ các điểm vật nằm ngoài trục bị chặn một phần bởi các kẽ hở giữa thấu kính để hạn chế quang sai (hình 1.6)
Hình 1.6 Hiện tượng vignetting
Hiện tượng này được gọi là làm mờ nét ảnh (vignetting), sinh ra do sự chiếu sáng
giảm tại mép ảnh Hiện tượng này có thể nảy sinh vấn đề cho các chương trình phân tích ảnh tự động, nhưng nó không quan trọng trong chụp ảnh nhờ sự trợ giúp của mắt người không cảm giác rõ ràng các độ dốc chiếu sáng mịn
Mắt người
ở đây ta mô tả vắn tắt về cấu trúc giải phẫu của mắt Hình 1.7 (trái) là một phác hoạ mặt được cắt thẳng đứng của nhãn cầu bao gồm các thành phần chính của
mắt: mống mắt và con ngươi sẽ điều khiển lượng ánh sáng xuyên vào nhãn cầu; giác
mạc và thấu kính cùng với nhau làm khúc xạ ánh sáng để tạo ảnh lên võng mạc và
cuối cùng là võng mạc ở đó ảnh được tạo thành
Mặc dù nó có dạng hình cầu, nhãn cầu về chức năng giống với một camera
với trường nhìn (viết tắt là FOV-Field Of View) bao phủ một vùng 1600 (rộng)ì135 (cao) Giống bất kỳ hệ thống quang học khác, nó bị quang sai hình học và sắc sai
Một vài mô hình mắt được đề xướng tuân theo luật quang hình bậc nhất, hình
1.7 (phải) minh hoạ một trong số đó, mô hình mắt sơ lược của Helmoltz Chỉ có ba mặt khúc xạ là giác mạc rất mỏng và một thấu kính đồng nhất Các hằng số cho trên
Trang 15hình là trong trường hợp mắt nhìn ở vô cùng (mắt không điều tiết) Tất nhiên mô
hình này chỉ là xấp xỉ của các đặc tính quang học thực của mắt
Hình 1.7 Cấu tạo của mắt (trái) và mô hình mắt Helmoltz (phải)
Ta hãy mô tả sâu hơn về các thành phần của mắt Giác mạc là một cửa sổ khúc xạ trong suốt và có độ cong cao ánh sáng tới mắt sẽ xuyên qua nó trước khí bị ngăn chặn một phần bởi mống mắt đục Đồng tử mắt là một lỗ hổng ở tâm của mống mắt, đường kính của nó thay đổi khoảng từ 1 tới 8 mm tương ứng với sự thay đổi của
độ chiếu sáng, nó dãn ra khi ánh sáng thấp để làm tăng thêm năng lượng đến võng mạc và co lại trong điều kiện chiếu sáng bình thường để giới hạn sự mờ ảnh do quang sai cầu của mắt Khả năng khúc xạ (nghịch đảo của tiêu cự) của mắt, phần lớn là do hiệu ứng khúc xạ của mặt giao tiếp không khí – giác mạc, và được hiệu chỉnh bởi sự biến dạng của thuỷ tinh thể sao cho vật hội tụ sắc nét Trong những người khoẻ mạnh, nó thay đổi giữa 60 (không điều tiết) và 68 diopter (1 diopter = 1
m-1) tương ứng với dải tiêu cự giữa 15 và 17 mm
Hình 1.8 Phân bố của các tế bào hình nón và hình que trên võng mạc
Gúc cõn đối với điểm vàng (deg)
Trang 16- 11 -
Bản thân võng mạc là một màng mỏng được xếp thành từng lớp cư trú bởi hai loại tế
bào nhận sáng – hình que và hình nón – đáp ứng với ánh sáng có bước sóng từ 330
tới 730 (từ tím tới đỏ) Các tế bào hình nón kém nhạy sáng hơn và chủ yếu là để nhìn ban ngày Chúng có trách nhiệm cảm nhận màu sắc Có ba loại tế bào hình nón tương ứng nhạy với các phổ ánh sáng khác nhau (đỏ, lục, lam) giữ vai trò chủ đạo trong nhận thức màu Có khoảng 100 triệu tế bào hình que và 5 triệu tế bào hình nón trong mắt người Phân bố không gian của chúng thay đổi về hai phía của võng mạc
Vùng trung tâm (macula lutea) ở chính giữa võng mạc ở đó tập trung các tế bào hình
nón đặc biệt cao và ảnh được hội tụ sắc nét hễ khi nào mắt tập trung sự chú ý của nó
vào một đối tượng Các tế bào hình nón tập trung cao nhất tại điểm vàng (fovea), là
một chỗ lõm giữa vùng trung tâm, đạt tới 1.6ì105/mm2 (hình 1.8) Ngược lại, không
có các tế bào hình que trong điểm vàng, nhưng mật độ tế bào hình que tăng về phía rìa của trường nhìn Cũng có một điểm mù trên võng mạc, ở đó các sợi tế bào hạch
đi vào võng mạc và tạo dây thần kinh quang học
Các tế bào hình que là các tế bào nhận kính thích ánh sáng cực kỳ nhạy: chúng có khả năng đáp ứng với chỉ một photon, nhưng chúng đem đến chi tiết không gian tương đối kém bởi vì nhiều tế bào hình que cùng đổ về neuron giống nhau trong võng mạc Trái lại, các tế bào hình nón trở thành tích cực tại mức ánh sáng cao hơn, nhưng tín hiệu lối ra của mỗi tế bào hình nón trong điểm vàng được mã hoá bởi một vài neuron, đem lại độ phân giải cao trong vùng đó
Cảm biến ảnh CCD (Charge Couple Device)
Như chúng ta biết Niepce phát minh ra kỹ thuật chụp ảnh từ đầu thế kỷ 19, nhưng Daguerre mới là người giới thiệu nó với công chúng Sau hai lần cùng cộng tác trong năm 1826, Daguerre tiếp tục phát triển phương pháp chụp ảnh của riêng mình sử dụng hơi thuỷ ngân để khuếch đại và để lộ ra ảnh được tạo trên miếng đồng mạ bạc được bôi i-ốt Phép chụp ảnh Daguerre ngay lập tức thành công khi Arago biểu diễn phương pháp Daguerre ở viện hàn lâm khoa học Pháp năm 1839 Những cột mốc khác trong lịch sử lâu dài của phương pháp chụp ảnh bao gồm phương pháp tấm ướt âm/dương của Legray và Archer năm 1850, phương pháp gelatin (chất lỏng trong suốt không có vị để chế tạo phim ảnh) của Maddox năm 1870, Eastman giới
Trang 17thiệu phim chụp ảnh năm 1889, và phát minh kỹ thuật điện ảnh (cinema) của Lumiere năm 1895 và chụp ảnh màu năm 1908
Vô tuyến truyền hình (viết tắt là TV) được phát minh vào nhưng năm 20 của thế kỷ 20 đã trở thành yếu tố chính thúc đẩy sự phát triển của các bộ cảm biến điện
tử Vidicon là một loại ống chân không TV phổ biến Nó là một vỏ bọc bằng thuỷ tinh có một súng điện tử ở một đầu và một màn hình (faceplate) ở đầu kia Phía sau
của màn hình được phủ một lớp màng mỏng chất quang dẫn lại phủ lên một film
kim loại trong suốt tích điện dương Sự phủ kép này tạo thành bia ống được bao
quanh bởi các cuộn hội tụ và lái để quét bia lặp đi lặp lại bằng chùm điện tử được phát ra từ súng Chùm này đặt một lớp điện tử lên bia để cân bằng điện tích dương của nó Khi một vùng nhỏ của màn hình được chiếu sáng, các điện tử chạy xuyên qua làm xả hết điện tích cục bộ của bia Khi chùm điện tử quét vùng này, nó thay thế các điện tử đã mất, tạo ra dòng điện tỉ lệ với cường độ ánh sáng tới Sự thay đổi của dòng điện sau đó được chuyển đổi thành tín hiệu hình ảnh bằng mạch vidicon Vidicon và các thiết bị cùng họ được dùng đến tận đầu những năm 1980 trong mọi ứng dụng truyền hình, bao gồm camera quảng bá, camera xách tay, camera theo dõi
Các camera CCD (Charge Couple Device) được đề xuất năm 1970 và đã thay
thế các camera vidicon trong hầu hết các ứng dụng hiện đại Cảm biến CCD sử dụng
một lưới hình chữ nhật của các điểm (site) thu thập điện tử phủ trên một đế silic
mỏng để ghi lại năng lượng ánh sáng đến mỗi điểm trong chúng (hình 1.15) Mỗi một điểm được tạo thành bằng cách cấy một lớp SiO2 trên đế và sau đó lắng đọng một cấu trúc cổng dẫn lên trên Khi photon đập vào silic, thì cặp điện tử lỗ trống
được tạo ra (chuyển đổi quang) và điện tử bị bắt giữ bằng giếng điện thế được tạo
thành bởi tác động của một điện thế dương ở cổng tương ứng Các điện tử được tạo
ra ở mỗi điểm được tập hợp qua một chu kỳ thời gian T cố định
Các điện tích được lưu trữ ở những điểm riêng biệt sẽ được di chuyển sử dụng
cách mắc tích nạp điện (charge coupling): Các gói điện tích được truyền từ điểm
này đến điểm kia bằng cách vận chuyển các điện thế cổng và bảo tồn các gói riêng biệt ảnh được đọc ra khỏi CCD một hàng một lần, mỗi hàng được truyền song song
Trang 18- 13 -
tới một thanh ghi lối ra nối tiếp Giữa hai lần đọc hàng, thanh ghi truyền một ô điện tích của nó một lần (hình 1.9) tới một bộ khuếch đại lối ra tạo ra một tín hiệu tỷ lệ với điện tích nó nhận được Quá trình này tiếp tục cho tới khi toàn bộ ảnh đã được
đọc ra Nó có thể được lặp lại 30 lần trong một giây (tốc độ TV) cho các ứng dụng ghi hình hoặc ở tốc độ thấp hơn nhiều, bỏ đi nhiều thời gian (giây, phút, thậm chí hàng giờ) để thu thập điện tử trong các ứng dụng mức sáng thấp như thiên văn học Lưu ý rằng lối ra số của hầu hết các CCD camera được chuyển đổi bên trong thành
một tín hiệu ghi hình tương tự trước khi được chuyển tới một bộ bắt hình (frame
grabber) ở đó tạo dựng ảnh số cuối cùng
Hình 1.9 Thiết bị CCD
Các CCD camera mầu cấp độ dân dụng thực chất sử dụng các chip giống như các camera đen trắng, chỉ khác là các hàng hoặc các cột liên tiếp của cảm biến được tạo ra nhạy cảm với ánh sáng đỏ, lục hoặc lam thường sử dụng một bộ lọc phủ để bù
ánh sáng Các mẫu lọc khác có thể thực hiện được bao gồm các khối khảm (mosaic)
2ì2 được tạo bởi các bộ cảm nhận hai lục, một đỏ và một lam (mẫu Bayer) Độ phân giải không gian của camera một CCD tất nhiên là có giới hạn, các camera chất lượng cao hơn sử dụng một bộ chia chùm tia để chuyển ảnh tới 3 CCD khác nhau thông qua các bộ lọc màu Các kênh màu riêng biệt sau đó được số hoá hoặc là riêng biệt (lối ra RGB) hoặc kết hợp thành tín hiệu ghi hình màu hỗn hợp (NTSC, SECAM
hoặc PAL) hoặc thành định dạng ghi hình thành phần tách rời thông tin màu và độ
chiếu sáng
Truyền pixel Thanh ghi dịch
Mảng cỏc điểm thu
Trang 19Quá trình số hoá ảnh và các bộ xử lý
Các tín hiệu hình ảnh từ CCD sẽ được số hoá qua các bộ bắt hình rồi đưa tiếp
vào bộ xử lý Hình 1.10 là cấu trúc cơ bản của một bộ bắt hình
Dồn kờnh tớn hiệu vào Tỏch xung đồng bộ mẫu & A/DTrớch-giữ
Bộ đệm hỡnh ảnh FIFO
Mỏy phỏt xung đồng bộ
Hình 1.10 Cấu tạo của bộ bắt hình (frame grabber)
Tín hiệu video được đưa đến bộ tách các xung đồng bộ dòng và mành ra khỏi tín hiệu thị tần hình ảnh Tuỳ theo chuẩn video mà mạch trích giữ mẫu tín hiệu sẽ trích 767 pixel trên một dòng cho chuẩn CCIR và 647 pixel trên một dòng cho chuẩn EIA để số hoá chúng Khi bộ bắt hình được nối với bus mở rộng có tốc độ chậm như bus ISA thì cần phải sử dụng các bộ nhớ phụ trên bản mạch nhưng khi nối với các bus nhanh như PCI thì chỉ cần bộ nhớ đệm FIFO để đệm cho một dòng quét Thường sau khi tín hiệu video vào đến bộ bắt hình, cần đến 3 khung ảnh để khởi
động
Các bộ xử lý có thể là các mạch vi xử lý chuyên dụng (DSP), vi điều khiển hoặc các máy vi tính PC Ngoài nhiệm vụ thu thập dữ liệu, chúng có nhiệm vụ xử lý
các dữ liệu này bằng các chương trình được nhúng trong bộ xử lý hoặc chạy trên các
máy PC Một vi điều khiển (microcontroller) là một máy tính trên một chip (computer-on-a-chip, single-chip computer) Thường các vi điều khiển còn được gọi
là các bộ điều khiển nhúng (embedded controller) vì rằng chúng và các mạch điện
hỗ trợ thường được thiết kế lắp đặt (nhúng) ngay bên trong các thiết bị được điều khiển Hiện có rất nhiều loại vi điều khiển được sản xuất như họ 80x51,
Trang 20- 15 -
MC68HCxx, Basic Stamp hay PSoC Một vi điều khiển tương tự như một vi xử lý
bên trong một máy tính cá nhân Cả hai loại, vi xử lý và vi điều khiển đều chứa một
đơn vị xử lý trung tâm CPU có nhiệm vụ chạy các lệnh cho phép thực hiện các chức
năng logic, toán học và chuyển số liệu cơ bản trong máy tính Để tạo một máy tính
hoàn chỉnh, ngoài vi xử lý còn phải có bộ nhớ để lưu trữ số liệu và chương trình, các
ghép nối vào/ra Ngược lại, một vi điều khiển là một máy tính trên một chip nghĩa là
nó chứa cả bộ nhớ và giao diện vào/ra bên cạnh CPU Tuy nhiên, vì cần được thiết
kế chỉ trên một chip nên lượng bộ nhớ và các giao diện vào/ra trong vi điều khiển
được thiết kế nhỏ
Mô hình cảm biến
Để đơn giản, ta hạn chế sự chú ý tới các CCD camera đen trắng: các camera
màu có thể được giải quyết tương tự bằng cách xem xét mỗi kênh màu riêng biệt và
tính đến hiệu ứng lọc màu Gọi I là số các điện tử ghi được tại tế bào có vị trí ở hàng
r và cột c của mảng CCD thì I có thể được mô hình là:
,)()(),()
,(
) (
∫ ∫∈
c r S
T c r
ở đó T là thời gian thu thập điện tử và tích phân được tính trên miền không gian
S(r,c) của tế bào và dải bước sóng mà đáp ứng của CCD khác không Trong tích
phân E là công suất trên đơn vị diện tích và đơn vị bước sóng đến điểm p, R là đáp
ứng không gian của điểm, và q là hiệu ứng lượng tử của thiết bị Trong trường hợp
tổng quát, E và q phụ thuộc vào bước sóng ánh sáng λ, và E và R phụ thuộc vào vị trí
điểm p trong S(r,c)
Bộ khuếch đại lối ra của CCD chuyển đổi điện tích được thu thập tại mỗi
điểm thành điện áp có thể đo lường được Trong hầu hết các camera, điện áp này sau
đó được chuyển đổi thành một tín hiệu ghi hình được lọc thông thấp có biên độ tỷ lệ
với I ảnh tương tự có thể được chuyển đổi lại một lần nữa thành ảnh số sử dụng
một khối bắt hình ở đó lấy mẫu không gian và lượng tử hoá giá trị chiếu sáng ở mỗi
điểm ảnh hoặc gọi là pixel (hoặc thành phần ảnh – picture element)
Trang 21Có một vài hiện tượng vật lý làm thay đổi mô hình camera lý tưởng chẳng
hạn nhèo ảnh sẽ xuất hiện khi nguồn sáng chiếu vào các điểm thu thập là quá mạnh
đến mức điện tích được lưu trữ ở các điểm đó tràn qua các điểm gần kề Có thể ngăn chặn việc này bằng cách điều khiển sự chiếu sáng, nhưng các yếu tố khác như khuyết tật sản xuất, các hiệu ứng nhiệt và lượng tử và ồn lượng tử hoá là gắn liền với quá trình tạo ảnh Các yếu đó đó có thể kiểm soát được bằng các mô hình xác suất thích hợp
Hiệu ứng vật lý lượng tử đưa vào sự không chắc chắn vốn có trong quá trình chuyển đổi photon ở mỗi điểm thu thập Để chính xác, số điện tử được tạo ra bởi quá
trình này có thể được mô hình bằng một biến tự nhiên ngẫu nhiên N I (r,c) tuân theo
phân bố Poisson có giá trị trung bình là β(r,c)I(r,c) ở đó β(r,c) là một số giữa 0 và
1 tương ứng với sự biến đổi của đáp ứng không gian và hiệu ứng lượng tử trong ảnh Các điện tử được giải phóng từ silic nhờ năng lượng nhiệt làm tăng thêm điện tích
của mỗi điểm thu thập (hiệu ứng nhiệt) Phân bố của chúng được gọi là dòng tối và
nó có thể được mô hình bằng biến tự nhiên ngẫu nhiên NDC(r,c) có giá trị trung bình
là àDC (r,c) tăng theo nhiệt độ Hiệu ứng dòng tối có thể được khống chế bằng cách làm lạnh camera Các điện tử cộng thêm được đưa vào bởi mạch điện tử CCD (bias)
và cũng được mô hình bằng biến ngẫu nhiên có phân bố Poisson N B (r,c) với giá trị
trung bình là àB (r,c) Bộ khuếch đại lối ra sẽ thêm vào ồn đọc ra và có thể mô hình bằng biến ngẫu nhiên thực R tuân theo phân bố Gauss với giá trị trung bình là àR và
độ lệch chuẩn là σR Có những nguồn khác gây ra sự không chắc chắn (như hiệu ứng truyền điện tích), nhưng chúng được bỏ qua Cuối cùng, sự rời rác hoá điện áp tương
tự bởi b bắt hình đưa vào cả hiệu ứng hình học (line jitter), có thể hiệu chỉnh thông
qua thủ tục chuẩn hoá camera, và ồn lượng tử hoá, có thể được mô hình như một
biến ngẫu nhiên Q(r,c) trung bình 0 phân bố đều trong đoạn ]
2
1,2
1[ư δ δ và phương
sai là 2
12
1 δ , ở đó δ là bước lượng tử hoá Điều này sinh ra mô hình hồn hợp cho tín
hiệu số D(r,c) sau:
Trang 22- 17 -
),(r c N r c N r c N r c R r c Q r c
Trong phương trình này, γ là hệ số khuếch đại tổ hợp của mạch camera Các tính
chất xác suất của mô hình này có thể được ước lượng thông qua định cỡ camera phát
xạ: ví dụ, dòng tối có thể được ước lượng bằng cách lấy một số các ảnh mẫu trong
môi trường tối (I=0)
1.2.2 Màu sắc và biểu diễn ảnh màu
Mọi vật mà chúng ta quan sát được là nhờ ánh sáng Bề mặt của các vật đó là
sáng hay tối có hai nguyên nhân chính: năng suất phản xạ của nó và số lượng ánh
sáng mà chúng nhận được từ nguồn Có hai loại nguồn sáng Loại thứ nhất tự nó
phát ra ánh sáng gọi là nguồn sơ cấp (như mặt trời, đèn điện, cây nến…) Loại thứ
hai chỉ phản xạ hay khuếch tán ánh sáng mà nó nhận được từ các nguồn sáng khác
gọi là nguồn thứ cấp (mặt trăng, đám mây, cây cối…)
Hình 1.11 Các loại sóng điện từ (trên) và dải ánh sáng được phóng to (dưới)
ánh sáng là một phần của dải phổ liên tục bức xạ sóng điện từ (hình 1.11)
ánh sáng khác với các sóng điện từ khác là mắt người nhận biết được nó Mắt người
nhậy cảm với những sóng điện từ trong một dải cực kỳ hẹp của λ, khoảng từ 350nm
đến 750nm Hình 1.11 biểu diễn các loại sóng điện từ theo bước sóng và dải nhìn
thấy được phóng to hơn Mắt người không những cảm nhận được độ sáng tối của mà
còn có khả năng cảm nhận được màu sắc của ánh sáng Cảm nhận màu có được do 3
loại tế bào hình chóp trong võng mạc mắt người Mỗi tế bào nhạy với một dải phổ
nhất định tương ứng với các màu đỏ, xanh lục và xanh dương Nguồn sáng có thành
phần phổ f(λ) được biến đổi bởi bề mặt phản xạ của vật thể Giả thử r(λ) là hàm
phản xạ này Khi đó số đo R được tạo bởi các tế bào màu đỏ sẽ là:
Trang 23= f(λ)r(λ)h (λ)d(λ)
Tức là tín hiệu hình ảnh trên các lối ra sensor (tế bào) trong thực tế chính
bằng tích phân của 3 thành phần phụ thuộc bước sóng khác nhau: nguồn sáng f,
phản xạ bề mặt vật r và đặc tính sensor h R
Như vậy, mọi màu sắc tự nhiên đều có thể được tổ hợp từ 3 màu cơ bản: đỏ R
(red), xanh lục G (green) và xanh dương B (blue) Để tiêu chuẩn hoá việc đo màu
trên thế giới, dựa vào kết quả thực nghiệm người ta đã quy định 3 màu cơ bản này
ứng với các bước sóng 700 nm (R), bước sóng 546,8 nm (G) và 435,8 nm (B) Mỗi
màu cơ bản này có một màu phụ tương ứng, mà khi trộn với màu cơ bản của nó sẽ
tạo ra màu trắng
Có 3 thuộc tính chủ yếu trong cảm nhận màu:
- Sắc màu (brightness), còn gọi là độ chói
- Sắc lượng (hue), còn gọi là sắc thái màu
- Độ bão hoà màu (saturation)
Với nguồn sáng đơn sắc, sắc lượng tương ứng với bước sóng ánh sáng của
nguồn Độ bão hoà thay đổi nhanh nếu lượng ánh sáng trắng được thêm vào
Hình 1.12 Mô hình không gian màu RGB
Có thể biến đổi từ sơ đồ RGB sang các sơ đồ lập mã màu khác như
YIQ/YUV trong đó Y là tín hiệu độ chói, nó như thể độ sáng của ảnh toàn sắc được
Trang 24- 19 -
hiện bởi TV đen trắng Nó kết hợp các tín hiệu đỏ, xanh lục và xanh dương theo tỷ
lệ độ nhạy mắt người đối với chúng Các thành phần I và Q (U và V) của tín hiệu màu để tương thích với phần cứng được dùng trong truyền thông: tín hiệu I là lượng màu đỏ trừ đi lam, Q là lượng đỏ tươi trừ xanh lục Mối quan hệ giữa YIQ và RGB
Q
I
Y
311 0 523 0 212 0
321 0 275 0 596 0
114 0 587 0 299 0
B G R
703 1 106 1 000 1
647 0 272 0 000 1
621 0 956 0 000 1
(1.6)
Hình 1.12 là không gian được xác định bởi các tín hiệu RGB: đó là một không gian khối hộp trong toạ độ đề-cac vì rằng các tín hiệu R, G, B là độc lập và có thể được dùng để tạo nên bất kỳ màu nào bên trong khối hộp, trong đó có các chuỗi biến đổi
từ màu đen tới màu trắng Kết hợp màu đỏ và xanh lục sẽ cho màu vàng Xanh lục cộng với xanh dương sẽ sản ra màu lục lam (cyan) và xanh dương cộng đỏ sẽ cho màu đỏ tươi Các màu xám nằm dọc theo đường chéo khối hộp
Hình 1.13 Đồ thị sắc màu CIE Đường đen bên ngoài chứa các màu khả kiến
bão hoà toàn phần với các số là bước sóng nm Hình tam giác chỉ ra các
màu điển hình mà ống hình TV có thể tạo ra bởi việc trộn 3 màu cơ bản.
Có những sơ đồ lập mã khác gần gũi với bản chất của con người hơn Ra đời sớm nhất là giản đồ sắc độ của uỷ ban CIE Đây là giản đồ 2 chiều như được trình
Trang 25bày trên hình 1.13 Trục thứ ba là độ chói phù hợp với độ sáng toàn sắc Y cho phép sản ra một ảnh đơn sắc (thang độ xám) Hai trục khác x và y luôn dương và được kết hợp để xác định bất kỳ màu cần thiết nào
Sơ đồ trên cho một công cụ để định nghĩa màu nhưng không phù hợp với hoạt
động của phần cứng cũng như không phù hợp trực tiếp với thị giác người Cách tiếp cận khác là các hệ thống HSV (hue, saturation and value), HSI (hue, saturation and intensity) và HLS (hue, lightness and saturation) Không gian mà 3 giá trị này được
vẽ có thể là một hình tròn hoặc hình nón sáu cạnh hoặc hình nón kép như hình 1.14 chỉ ra Có thể tưởng tượng không gian đó như một hình nón kép trong đó trục của hình nón là cấp độ xám từ đen tới trắng Khoảng cách đến tâm trục là độ bão hoà và
hướng là hue
Hình 1.14 Mô hình không gian màu HSI.
Phương trình 1.7 thực hiện chuyển từ không gian RGB thành HSI và bảng 1.1
là phương pháp chuyển từ không gian HSI thành RGB phụ thuộc vào H.
)(
3
1)]
,,[min(
)(
31
))(
()(
)()(2
1cos
,
1 0
B G R I
B G R B
G R S
B G B R G R
B R G R G
B if
G B if H
++
=+
ư
ư+
(1.7)
Trang 26- 21 -
Bảng 1 Các trường hợp chuyển đổi từ không gian mầu HSI thành RGB
RG (00 ≤ H ≤ 1200) GB (1200 ≤ H ≤ 2400) BR (2400 ≤ H ≤ 3600)
) (
cos
1 0
B R
=
) ( 1
) 60 cos(
cos 1
) 1 ( 120
0 0
G R B
H
H S I
G
S I R
H H
) 1 (
) 60 cos(
cos 1
240
0 0
B G R
S I G
H
H S I B
H H
=
ư
=
1.3 Một số khái niệm cơ bản
ảnh phẳng, ảnh một thị kính một vật kính (monocular) được tạo bởi hệ thống
như camera lỗ (pinhole camera) Trong đó ảnh được tạo bởi phép chiếu các điểm
trên vật thể tới mặt phẳng ảnh qua 1 lỗ ảnh phẳng không cho các thông tin về độ sâu của các điểm trên vật thể trong không gian 3 chiều
ảnh nổi, ảnh hai thị kính hai vật kính (binocular) được tạo bởi hệ thống có
hai điểm nhìn Hệ thống này có các ống kính không đồng quy mà được sắp đặt song
song nhìn ra điểm vô cực theo hướng z nào đó Thông tin độ sâu của một điểm được
giải mã bởi các vị trí khác nhau của điểm đó trong hai mặt phẳng ảnh
Tín hiệu điện của một ảnh trong thực tế thường là liên tục về không gian và cường độ sáng Khi được số hoá, các tín hiệu này được rời rạc hoá thông qua quá trình lấy mẫu và lượng tử hoá thành phần độ sáng Mặc dù các mẫu không gian có
Trang 27thể được đại diện cho các điểm nhưng sẽ thực tế hơn khi coi các mẫu này như các
mẫu ảnh có kích thước hữu hạn và có mức xám không đổi trong toàn mẫu Những
mẫu ảnh này gọi là các pixel (picture element) và ảnh trở thành ảnh số gồm một tập
hợp các pixel Trong thị giác máy tính, thường coi một pixel cần khảo sát ở trung
tâm có hình chữ nhật thì có 4 pixel hoặc 8 pixel lân cận như mô tả trên hình 1.15
Thường biểu diễn trực tiếp các số đo mức xám của các pixel như hình 1.15c
ảnh số được biểu diễn toán học bằng một hàm ảnh (image function) Nói
chung nó là một hàm vectơ với m hướng Hầu hết các ảnh được biểu diễn bằng hàm
của 2 biến không gian f(x) = f(x,y), trong đó f(x,y) là độ sáng của mức xám ảnh tại
toạ độ (x,y) của các pixel Mức xám (gray level) là kết quả của sự mã hoá tương ứng
một cường độ sáng của mỗi điểm ảnh với một giá trị số Thông thường ảnh đơn sắc
thường được mã hoá bằng 8 bit tương ứng sẽ có 256 mức xám (từ 0 đến 255)
(a) (b) (c)
Hình 1.15 Pixel trung tâm và 4 pixel lân cận (a) và 8 pixel lân cận (b)
Một ảnh đa phổ f là một hàm vectơ với các thành phần (f1, f2, , fn) Một ảnh
đa phổ đặc biệt là ảnh màu trong đó các thành phần đo các giá trị độ sáng của mỗi
một trong 3 bước sóng, đó là:
Với trường hợp ảnh ba chiều 3-D, x = (x,y,z) Thường giá trị của f được lưu
trữ trên 1 bit (với ảnh đen trắng), 8 bit (ảnh đa mức xám) hay 16, 24 hay 32 bit (ảnh
giả màu, màu thật, )
Như thảo luận ở trên, các ảnh thu nhận từ cảm biến ảnh thường bị hư do
nhiều nguyên nhân có thể kể ra như: điều kiện chiếu sáng, nhiễu loạn khí quyển, các
lỗi trong quá trình tạo ảnh, ống kính không hội tụ, chuyển động của các đối tượng,
ồn điện tử của cảm biến, ồn mã hoá và truyền thông Ngày nay, các cảm biến ảnh
15 7 3
9 16 18
2 20 98
Trang 28- 23 -
trong hệ thống camera đều đã được tích hợp các phần cứng cải thiện chất lượng ảnh ngay trong quá trình thu nhận Tuy nhiên, để có thể nâng chất lượng hình ảnh lên thêm một bước cũng như trích chọn ra những thông tin có ích cần phải tiến hành những nghiên cứu sâu rộng hơn Trong phần tiếp theo tôi sẽ đề cập một cách vắn tắt các phương pháp cải xử lý cải thiện ảnh Phần cuối của chương trình bày một số đặc tính của ảnh có thể dùng trong các hệ thống bám ảnh
1.4 Phép xử lý điểm ảnh dựa trên bảng tìm kiếm LUT
Phép xử lý điểm ảnh chỉ xử lý từng pixel đơn lẻ để thay đổi độ đen trắng (mức xám) và độ tương phản của ảnh Phép xử lý điểm ảnh dựa vào hai công cụ
chính là lược đồ mức xám (histogram) và bảng tìm kiếm LUT (Look-Up-Table)
Lược đồ mức xám cho ta biết sơ lược tình trạng của ảnh như độ tương phản, sự phân
bố năng lượng của ảnh Bảng tìm kiếm là công cụ chính thực hiện các thuật toán xử
lý điểm ảnh, vì nó rút ngắn được khối lượng tính toán, một ảnh có cỡ bất kỳ được biểu diễn trong 256 giá trị và do đó chỉ phải xử lý 256 giá trị
Hình 1.16 minh hoạ phương pháp xử lý ảnh dựa vào bảng tìm kiếm Giả thiết
ảnh đầu vào là ảnh 8 mức xám (từ 0 đến 7), khi đó bảng tìm kiếm được thiết lập là một mảng một chiều 8 phần tử các phần tử ban đầu được gán bằng chỉ số tương ứng Sau đó các thao tác xử lý điểm ảnh như cộng, trừ, nhân… được thực hiện trên bảng tìm kiếm Phép xử lý trong hình 1.16 là phép trừ mức xám với giá trị trừ là 2
ảnh thu được từ camera thường không lấp đầy dải động giá trị mức xám và
có thể năng lượng tập trung tại một vùng hẹp của giá trị xám do điền kiện chiếu sáng của môi trường phức tạp Để lấp đầy thang mức xám của ảnh nhằm tăng độ
tương phản ta sử dụng thuật toán kéo căng độ tương phản (contrast stretching) Khi
phát hiện năng lượng ảnh tập trung trong một vùng giá trị xám ta sử dụng thuật toán
làm bằng lượng đồ mức xám (histogram equalization) Dưới đây sẽ mô tả chi tiết hai
thuật toán trên
Trang 29Hình 1.16 Hoạt động của bảng tìm kiếm 3 bit
1.4.1 Kéo căng độ tương phản
Sự tương phản của một ảnh là sự khác biệt giữa những pixel sáng và tối cạnh
nhau Thang mức xám của ảnh có độ tương phản thấp thì trong lược đồ của nó các
pixel tập trung vào bên phải, trái hoặc giữa Trên đồ thị lược đồ ảnh bị bó chặt chẽ
xít nhau và có rất ít các mẫu nhỏ ở tất cả những vị trí khác Một ảnh có độ tương
phản cao có những vùng cả sáng và tối Những ảnh có độ tương phản cao thì lấp đầy
dải giá trị có thể có và có những vùng lớn tối và sáng Lược đồ mức xám của một
ảnh có độ tương phản cao thường có hai đỉnh Một đỉnh là trung tâm của vùng thấp
và một đỉnh là trung tâm của vùng cao Phương trình (1.9) mô tả quan hệ của ảnh lối
vào I [ j i, ] và lối ra I [' j i, ] qua phép xử lý kéo căng độ tương phản Trong đó: high
và low là giá trị xám tương ứng lớn nhất và nhỏ nhất của ảnh lối vào
255
*]
,[],[
'
low high
low j i I j i I
ư
ư
Tăng độ tương phản nhằm làm cho ảnh có lược đồ lấp đầy dải động của ảnh
Phép toán này là một kỹ thuật rất hiệu quả trong nâng cao chất lượng ảnh Đặc biệt
với những ảnh có phân bố gauss và gần gauss
1.4.2 Làm bằng lược đồ mức xám
Một ảnh có phân bố cường độ không đồng đều thường được cải thiện nhờ
một phép xử lý được gọi là làm bằng lược đồ mức xám Mục đích cuối cùng của
Trang 30- 25 -
phép làm bằng là để có một biểu đồ phân bố đều Phép toán này thực hiện việc phân
bố lại sự phân bố cường độ ảnh Nếu như một biểu đồ ảnh có nhiều đỉnh và lõm nó
sẽ vẫn có nhiều đỉnh và lõm sau khi làm bằng Nhưng đỉnh và lõm đã được dịch đi
Cũng như các phép toán xử lý điểm khác, giá trị điểm ảnh đang tồn tại sẽ ánh xạ tới
giá trị mới
Thuật toán làm bằng có thể được thực hiện trong 3 bước là: Tính biểu đồ ảnh,
tính tổng chuẩn hoá của biểu đồ ảnh, biến đổi ảnh lối vào thành ảnh lối ra Thuật
toán này làm việc tốt nhất trên ảnh có những có tiết nhỏ trong vùng tối
1.5 Phép xử lý vùng ảnh
Phép xử lý vùng sử dụng những pixel lân cận nhau của ảnh đầu vào I ( j i, )để
tạo ra một pixel của ảnh đầu ra I'(i,j) Phép xử lý vùng chủ yếu dựa trên phép toán
nhân chập (convolution) Phương trình (1.10) dưới đây là biển diễn toán học của
l j k i I l k w j
i
trong đó: w ( l k, )là mặt nạ nhân chập và là ma trận vuông (2r+1)ì(2r+1) Với mỗi
pixel I ( j i, ) được xử lý thì các pixel lân cận của nó được xem xét để tính toán giá trị
ảnh lối ra I'(i,j) Chẳng hạn ta xét mặt nạ 3ì3 tức là r = 1 thì 8 lân cận của I ( j i, )là
từ I1 tới I8 và trọng số của mặt nạ sẽ là từ W0 tới W8 Hình 1.17 mô tả phép tính cho
pixel I ( j i, )
Trang 31Hình 1.17 Nhân chập ảnh với mặt nạ
Trong ảnh video thường có hai nguồn nhiễu chính là: nhiễu muối tiêu và
nhiễu cuộn Nhiễu muối tiêu (salt-and-pepper) xuất hiện khi một hình ảnh được mã
hoá và truyền qua một kênh có nhiễu hoặc ồn điện tử của bộ cảm biến trong camera
video Nhiễu cuộn (convolutional) do thấu kính không hội tụ, sự chuyển động, hoặc
sự nhiễu loạn khí quyển trong những điều kiện thời tiết bất lợi Cả hai nguồn nhiễu này phân bố ở các thành phần tần số cao Nhằm mục đích loại bỏ hai nhiễu trên ta thường dùng bộ lọc gauss hoặc lọc trung vị
Lọc gauss cho phép loại bỏ nhiễu tần số cao nhưng nó lại làm mờ biên ảnh Lọc gauss được thực hiện qua phép toán nhân chập với mặt nạ gauss
Lọc trung vị (median) được sử dụng để giảm bớt tiếng ồn tần số cao và nó giữ
được thông tin biên của đối tượng Nhưng phép lọc này mất khá nhiều thời gian
Đây là kỹ thuật lọc không gian phi tuyến, không dùng phương pháp nhân chập Có
thể mô tả vắn tắt thuật toán lọc như sau Xét pixel I 0 và các lân cận (lân cận 8 chẳng
hạn) của nó, xắp xếp các giá trị I 0 và các giá trị của các pixel lân cận theo thứ tự
tăng dần Giá trị nằm chính giữa sẽ được gán cho pixel I 0
Trang 32- 27 -
1.6 Xử lý hình thái học ảnh nhị phân
1.5.1 Phép biết đổi “trúng hoặc trượt”
Những toán tử hình thái học nhị phân như dãn lân cận 8, co lân cận 8 và làm
đầy đường chéo có thể được phân vào loại biến đổi “trúng hoặc trượt” Biến đổi
trúng hoặc trượt sử dụng khái niệm nhân chập một mặt nạ nhỏ (gọi là phần tử cấu trúc) với một ảnh nhị phân để tạo ảnh lối ra Nếu mẫu trong ảnh phù hợp với mẫu
của mặt nạ thì được gọi là “trúng” và đặt pixel ở vị trí đó có giá trị nhị phân mong muốn (1 chẳng hạn) Nếu ngược lại được gọi là “trượt” và pixel được đặt giá trị
ngược lại (0)
Những phép biến đổi trúng hoặc trượt thảo luận trong phần này làm việc với một mặt nạ cỡ 3x3 Điều này có nghĩa rằng giá trị của mỗi pixel chỉ phụ thuộc vào 8 pixel lân cận của nó Phép nhân chập có thể được thực hiện bằng cách sử dụng một bảng tìm kiếm chỉ có 29 = 512 mẫu trong ảnh nhị phân Điều này nhằm tăng tốc độ
xử lý
1.5.2 Phương pháp lập bảng tìm kiếm
Mỗi pixel và 8 lân cận của nó trong ảnh nhị phân có thể được biểu diễn một cách đầy đủ bởi một số nguyên dương 9 bit Điều này được hoàn thành bởi việc gán mỗi điểm trong khu lân cận cho một vị trí bit riêng biệt trong một số nguyên 9 bit, hình 1.18 mô tả cách biểu diễn này
Hình 1.18 Phương pháp lập bảng tìm kiếm
Bây giờ, thật dễ để định nghĩa và sử dụng một bảng tìm kiếm cho thao tác hình thái học mong muốn Trước khi nhân chập với ảnh, ta hãy định nghĩa một bảng tìm kiếm với 512 mục bảng Lấy mỗi mẫu có thể có định nghĩa chỉ số vào trong bảng tìm kiếm Sau đó giá trị ở mỗi vị trí đó sẽ được đánh dấu là “trúng” hoặc
Trang 33“trượt” dựa vào chỉ số Để thực hiện nhân chập mặt nạ 3x3 với ảnh, thực hiện quét
qua ảnh, tính số nguyên tương ứng tại mỗi điểm và sử dụng số đó như một chỉ số
trong bảng tìm kiếm, sau đó đặt giá trị của pixel hiện hành bằng giá trị trong bảng
tìm kiếm Ta định nghĩa pixel thuộc đối tượng (mặt) có giá trị là 1 và pixel nền là 0
1.5.3 Phép d∙n lân cận 8
Phép dãn lân cận 8 tạo ra một pixel mặt nếu ít nhất một pixel lân cận 8 là
pixel mặt Phép này có hiệu ứng làm phình ra phía ngoài đường biên của một đối
tượng nhị phân với độ rộng một pixel Nếu ứng dụng lặp đi lặp lại, những đối tượng
nhị phân có thể lớn lên và chồng lên nhau cho đến khi toàn bộ ảnh là những pixel
đối tượng Mỗi điểm, Y, trong ảnh đầu ra là tập hợp theo mối quan hệ với ảnh lối vào
theo phương trình
7 6 5 4 3 2 1
X X
1.5.4 Phép co lân cận 8
Phép co lân cận 8 xoá bỏ một pixel mặt nếu ít nhất một lân cận 8 của nó là
một điểm nền Phép này có hiệu ứng làm co đối tượng trong ảnh Nếu lặp đi lặp lại,
những đối tượng sẽ dần dần co lại cho đến khi chúng hoàn toàn biến mất Mỗi điểm,
Y, trong ảnh đầu ra là tập hợp theo mối quan hệ như phương trình dưới đây
7 6 5 4 3 2 1
X X
1.5.5 Phép lấp đầy đường chéo
Phép lấp đầy đường chéo tạo ra một pixel mặt bất cứ khi nào sự tạo thành nó
sẽ loại trừ kết nối 8 pixel nền Toán tử này loại bỏ bất kỳ sự không rõ ràng nào từ
ảnh cần thiết để áp dụng những thao tác hình thái học khác Mỗi điểm, Y, trong ảnh
đầu ra là tập hợp theo mối quan hệ trong phương trình dưới đây
)(P1 P2 P3 P4X
ở đó P1= X∩X0∩X1∩X2 P2 = X ∩X2 ∩X3∩X4
6 5 4
P = ∩ ∩ ∩ P4 = X ∩X6 ∩X7 ∩X0
Trang 341.5.7 Phép đóng
Phép đóng ảnh được tạo từ phép dãn ảnh sau đó là một phép làm co ảnh Số lượng các bước làm co ảnh lớn đúng bằng số các bước làm dãn ảnh Qua phép đóng các đối tượng nằm sát nhau cùng lớn lên, có lỗ trống trong các đối tượng được khép kín lại và các cấu trúc lõm ở mép đối tượng được làm đầy
1.6 Đặc tính đường biên
Biên trong ảnh là một đường biên giới hay một đường bao mà ở đó xuất hiện
sự thay đổi đáng kể một vài tính chất vật lý của ảnh, như độ phản xạ bề mặt, độ chiếu sáng hoặc khoảng cách từ những bề mặt nhìn thấy đưa đến vị trí quan sát Thay đổi tính chất vật lý biểu hiện bằng nhiều cách bao gồm: thay đổi cường độ, thay đổi màu, kết cấu bề mặt… Trong phát hiện biên chỉ quan tâm đến sự thay đổi của cường độ ảnh
Với I(i,j) là hàm cường độ ảnh, và f(i,j) là hàm hai chiều biểu diễn đường biên trong ảnh I(i,j) Như định nghĩa ở trên, biên ảnh là điểm có sự thay đổi đột ngột
về cường độ ảnh Vậy nếu I(i,j) là một vị trí biên thì tại đó gradient cường độ sẽ đạt cực đại và đồng thời đạo hàm bậc hai (laplacian) sẽ qua điểm không như minh hoạ
trong hình 1.19 Hình 1.19a là hàm bậc nhất biểu diễn một kiểu đường biên, hình 1.19b và 1.19c tương ứng là đạo hàm bậc nhất và bậc hai
Trang 35Hình 1.19 Hàm f(x) và đạo hàm bậc nhất và bậc 2 của nó
1.6.1 Phát hiện biên dựa vào đạo hàm bậc nhất
Đạo hàm bậc nhất một hàm hai chiều tương tự f(x,y) được tính như sau:
y
y
y x f i x
y x f y x f
∂
∂+
∂
∂
= ( , ) ( , ))
,(
trong đó, i x và i y tương ứng là vector đơn vị theo hướng x và y Việc dựa vào f’(x,y)
để phát hiện đường biên được minh hoạ trong hình 1.5 Đầu tiên tính biên độ của
f’(x,y) sau đó đem so sánh với một ngưỡng để xác định điểm biên Phân ngưỡng như
trên sẽ tạo ra một dải biên chứ không phải một đường biên, do đó thuật toán làm
mảnh biên có thể được áp dụng đối với một số ứng dụng
Tớnh đạo hàm Tớnh biờn độ Phõn ngưỡng Làm mảnh biờn
Cỏc điểm biờn
Hình 1.20 Tuần tự các bước xử lý tìm biên
Trang 36- 31 -
Đối với ảnh số hàm f(x,y) là một hàm rời rác và được ký hiệu là I(i,j) thì đạo
hàm theo phương trình (1.14) được tính xấp xỉ Với các phương pháp xấp xỉ khác
nhau ta thu được các kết quả khác nhau tuỳ theo từng ứng dụng Để thực hiện tính
đạo hàm bậc nhất ta có thể sử dụng phép nhân chập ảnh I(i,j) với mặt nạ G, mặt nạ
này phụ thuộc vào phương pháp lấy xấp xỉ
Chẳng hạn Roberts thực hiện phép xấp xỉ như sau để tính biên độ gradient:
01
10
y
G
Sobel sử dụng cách tính nội suy điểm giữa dùng lân cận 3ì3 (hình 1.21) Sau
đó biên độ gradient được tính theo công thức (1.14)
2 2
)(
)(
)(
4 5 6 2 1 0
6 7 0 4 3 2
a ca a a ca a G
a ca a a ca a G
y
x
++
ư++
=
++
ư++
2 0 2
1 0 1
0 0 0
1 2 1
y
G
Với mặt nạ Prewitt sử dụng hằng số c=1 ta thu được các ma trận G như sau:
Trang 371 0 1
1 0 1
0 0 0
1 1 1
y
G
1.6.2 Phát hiện biên dựa vào đạo hàm bậc hai
Toán tử Laplacian của hàm hai chiều liên tục được tính như sau:
2
2 2
2 ( , ) ( , ))
,(
"
y
y x f x
y x f y
x f
∂
∂+
∂
∂
Với phương pháp lấy xấp xỉ tương tự như trên ta thu được các mặt nạ nhân
chập cho hàm ảnh rời rạc hai chiều Đây là đạo hàm bậc hai không có hướng, ta phải
xác định các điểm qua 0 để xác định điểm biên
1 4 1
0 1 0
1 8 1
1 1 1
2
L
Do đạo hàm bậc hai rất nhạy với nhiễu nên ta thường sử dụng một bộ lọc
gauss để loại bỏ nhiễu trước, đây là bộ tìm biên LoG (Laplacian of Gaussian) Ma
trận nhân chập được xác định như phương trình (1.20) sau:
[ ( , )* ( , )] [ ( , )]* ( , ))
,
y x f y x g y
x f y x g y
x
ở đó
2 2 2
2 ) (
4
2 2 2
),
σ
y x y x g
1.6.3 Phương pháp Canny để phát hiện biên
Năm 1986, John Canny đã đưa ra một tập các tiêu chuẩn mà một phương
pháp tìm biên phải đạt được và qua đó trình bày một phương pháp tối ưu để thực
hiện chúng Canny đã chỉ rõ ba tiêu chuẩn cần phải thực hiện là : (1) Mức lỗi: Một
phương pháp tìm biên chỉ phải tìm tất cả các cạnh, không cạnh nào tìm được lại bị
lỗi; (2) Định vị: Độ lệch mức xám trên cùng một đường biên càng nhỏ càng tốt; và
(3) Hiệu quả: Tách biên không được nhận ra nhiều biên trong khi đó chỉ có một biên
thực sự tồn tại Phương pháp canny là một thủ tục tìm biên nhiều bước
Trang 38- 33 -
Bước 1: Làm trơn ảnh với bộ lọc gauss để giảm ồn và các chi tiết, các kết cấu không
mong muốn
),(
*),(),(i j G i j I i j
1
σπσ
σ
j i G
Bước 2: Tính gradient của g(i,j) sử dụng một trong các toán tử gradient (Roberts,
Sobel, Prewitt, …) và lấy:
),(),()
,
j i g j i g j i
j i g j i g j
),(if)
,()
,(i j M i j M i j T
ở đó T được chọn sao cho tất cả các thành phần biên được giữ trong khi hầu
hết ồn bị khử
Bước 4: Loại bỏ những pixel không cực đại của biên thu được trong M T để làm
mỏng biên Để làm việc này, kiểm tra xem liệu mỗi điểm khác 0 trong
M T (i,j) có lớn hơn hai lân cận theo hướng gradient θ( j i, ) Nếu lớn hơn thì
giữ lại MT(i,j) còn trường khác thì đặt bằng 0
Bước 5: Mặc dù làm trơn ảnh được áp dụng trong bước 1 nhưng kết quả tính
gradient vẫn chứa nhưng pixel không cực đại Để khắc phục, hai ngưỡng
khác nhau τ và 1 τ (thường chọn 2 τ2 ≈ 2τ1) được áp dụng trong bước 3 để
thu được hai ảnh nhị phân T 1 và T 2 ảnh T 2 có các khoảng trống trong
đường biên chứa một vài biên sai Với thuật toán phân ngưỡng kép các biên
trong T 2 được kết nối thành đương biên Khi đạt đến cuối đường biên, thuật
toán sẽ xem trong T1 ở các vị trí lân cận 8 để có thể kết nối với đường biên
Thuật toán tiếp tục cho đến khi khoảng trống được kết nối tới biên T2
Trang 39Thuật toán thực hiện kết nối biên như một kết quả phụ của phân ngưỡng và
một số giả thuyết về chọn ngưỡng
1.7 Đặc tính góc
Cũng như đặc tính biên, góc thường được sử dụng cho sự đoán nhận và bám
đối tượng Những đặc tính như vậy tỏ ra ổn định qua chuỗi các ảnh, và do đó cũng
được quan tâm trong các ứng dụng theo dõi những đối tượng qua chuỗi ảnh
Vậy, phương pháp phát hiện ra những góc như thế nào? Ta xét hai ảnh
gradient, G x và G y của điểm ảnh p, một khu lân cận W của p, và một ma trận C được
y x W
y x W
x
G G
G
G G G
C
2
2
(1.25)
Ma trận C mô tả đặc điểm cấu trúc của các mức xám thông qua các giá trị riêng của
C và sự thể hiện tính chất hình học của chúng Chú ý rằng C là đối xứng, và bởi vậy
có thể được chéo hoá bằng cách quay trục toạ độ; như vậy, không mất tính tổng
quát, chúng ta có thể cho C như một ma trận đường chéo:
Cả hai giá trị riêng λ1 và λ2 là không âm Chúng ta có ba trường hợp : (1) W
là đồng dạng hoàn hảo, λ1 = λ2 vì gradien ảnh triết tiêu ở mọi nơi; (2) W chứa một
biên nhẩy bậc đen và trắng lý tưởng, ta có λ2 = 0 và λ1 > 0, và vectơ riêng liên quan
đến λ1 là song song với gradien ảnh; và (3) W chứa góc của một hình vuông đen trên
nền trắng; khi có hai phương chính trong W, chúng ta chờ đợi λ1 ≥ λ2 > 0, và những
giá trị riêng lớn hơn, mạnh hơn (tương phản cao hơn) tương ứng với những đường
ảnh của chúng Một góc như vậy được xác định bởi hai biên mạnh, bởi vậy, khi λ1 ≥
λ2 , một góc là một vị trí ở đó giá trị riêng λ2 nhỏ hơn là đủ lớn Thủ tục để định vị
kiểu đặc tính ảnh mới này có thể được tổng kết như sau: Đầu vào được hình thành
Trang 40- 35 -
bởi một ảnh I(x,y), hai ngưỡng λ2 và t và cỡ của khu lân cận, cho một cửa sổ vuông, (2N+1) pixel
1 Tính gradien qua toàn bộ ảnh I(x,y)
2 Cho mỗi điểm chỉ p:
(a) Hình thành ma trận C qua một lân cận (2N+1)ì(2N+1) W của p
(b) Tính λ2 , giá trị riêng nhỏ hơn của C
(c) Nếu λ2 > t, lưu trữ những toạ độ của p vào trong một danh sách, L
3 Xắp xếp L theo sự giảm của λ2
4 Quét danh sách được xắp xếp từ trên xuống; cho mỗi điểm, p, xoá tất cả các điểm xuất hiện thêm trong danh sách mà thuộc vào khu lân cận của p
Các đặc tính được thảo luận trên đâu đều có khả năng bám để phát hiện chuyển động của các đối tượng di động Việc chọn các đặc tính tốt để tạo ra bộ bám bền vững sẽ được thảo luận trong phần 3.4.3
1.7.Hệ thống phát hiện mục tiêu tự động
Khi công nghệ bám bắt đầu xuất hiện, nó đã được phát triển từ các thiết kế với phần cứng rất hạn chế tới các giải pháp dựa trên các mô hình toán học của môi trường bám và dữ liệu cảm biến Ngày này, các hệ thống bám hiện đại đã được cải tiến được phát triển sử dụng các công cụ là lý thuyết phát hiện và ước lượng Phương pháp thiết kế dựa trên mô hình này là nền tảng cho các thế hệ của những hệ thống bám hình ảnh hiện tại và tương lai
Các hệ thống bám video tự động được dùng rộng rãi và đa dạng trong các môi trường bám khác nhau với các nhiệm vụ rất khác nhau Chúng được sử dụng trong nhiều ứng dụng bao gồm: dẫn đường và điều khiển hoả lực, giám sát, phân luồng điều khiển giao thông, phân biệt mục tiêu một cách tự động và robot hoạt