1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng xử lý ảnh trong phân loại chất lượng gạo

73 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 73
Dung lượng 3,11 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Việc ứng dụng xử lý ảnh trong việc phân loại chất lượng gạo cũng đã được nhiều nhiều nhóm thực hiện: Phân loại gạo theo màu sắc của Viện Máy và dụng cụ công nghiệp IMI; ứng dụng neural v

Trang 1

TÓM TẮT ĐỀ TÀI

Đề tài này được xây dựng dựa trên mô hình máy phân loại chất lượng gạo trong thực tế nhằm làm hạ giá thành sản phẩm để có thể được sử dụng rộng rãi trên thị trường Nhóm thiết kế ra mô hình có khả năng phát hiện ra hạt gạo không đạt chất lượng nhờ vào hệ thống xử lý ảnh Hệ thống gồm camera, máy tính và đèn LED Camera sẽ chụp ảnh gạo cần kiểm tra rồi sau đó đưa vào máy tính dùng phần mềm Matlab để xử lý Việc xác định hạt gạo không đạt tiêu chuẩn sẽ dựa vào các tiêu chuẩn về hình dạng và màu sắc Kết quả thực nghiệm cho thấy hệ thống nhận dạng được sản phẩm lỗi khá cao Độ chính xác của giải thuật đạt 90%

Trang 2

MỤC LỤC

NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP i

PHIẾU NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN ii

PHIẾU NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN iii

LỜI CÁM ƠN iv

TÓM TẮT ĐỀ TÀI v

MỤC LỤC vi

DANH MỤC CÁC TỪ VIẾT TẮT viii

DANH MỤC CÁC BẢNG BIỂU ix

DANH MỤC CÁC HÌNH x

Chương 1: TỔNG QUAN 1

1.1 Đặt vấn đề 1

1.1.1 Tính cấp thiết của đề tài 1

1.1.2 Tình hình nghiên cứu trong nước 2

1.1.3 Tình hình nghiên cứu ngoài nước 2

1.1.4 Giải pháp 4

1.2 Mục tiêu đề tài 4

1.3 Giới hạn đề tài 5

1.4 Nội dung đề tài 5

Chương 2: CƠ SỞ LÝ THUYẾT 6

2.1 Giới thiệu chung về xử lý ảnh 6

2.2 Các vấn đề trong quá trình xử lý ảnh 10

2.2.1 Các thiết bị thu nhận ảnh 10

2.2.2 Những khái niệm cơ sở về xử lý ảnh 13

2.2.3 Quá trình xử lý ảnh 14

2.2.4 Các phép toán hình thái Morphology 23

2.2.5 Không gian màu 28

2.2.6 Những định dạng của ảnh 37

Trang 3

Chương 3: NHẬN DẠNG GẠO DỰA TRÊN HÌNH DẠNG VÀ MÀU SẮC 39

3.1 Quy trình xử lý ảnh 39

3.2 Phần mềm sử dụng 40

3.3 Phân loại theo diện tích và tỷ lệ 41

3.3.1 Chuyển đổi ảnh RGB sang ảnh mức xám 41

3.3.2 Lọc nhiễu 42

3.3.3 Tách biên 42

3.3.4 Loại nhỏ pixel nhỏ 43

3.3.5 Phân đoạn ảnh 44

3.4 Phân loại theo màu sắc 47

3.4.1 Chuyển ảnh từ hệ màu RGB sang hệ màu Lab 47

3.4.2 So sánh với ảnh mẫu 48

3.5 Kết quả 49

Chương 4: KẾT QUẢ THỰC NGHIỆM 50

4.1 Hình ảnh phần cứng mô hình 50

4.1.1 Khung mô hình 50

4.1.2 Thiết bị Camera 51

4.1.3 Thiết bị chiếu sáng 52

4.2 Kết quả thực nghiệm 52

Chương 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 59

5.1 Kết luận 59

5.1.1 Kết quả đạt được 59

5.1.2 Những mặt hạn chế 59

5.2 Hướng phát triển 60

TÀI LIỆU THAM KHẢO 61

PHỤ LỤC 62

Trang 4

DSP: Digital Signal Processing/Processor

GIF: Graphics Interchange Format

HSI: Hue-Saturation-Intensity

HSV: Hue-Saturation-Value

IMI: Industial Machinery and Instruments

IMG: Image

JPEG: Joint Photographic Experts Group

NTSC: National Television System Committee

PAL: Phase Alternate Line

RGB: Red-Green-Blue

SECAM: Sequential Color with Memory

TV: Television

Trang 5

DANH MỤC CÁC BẢNG BIỂU

Bảng 1.1: Thông số kỹ thuật máy phân loại gạo 3

Bảng 2.1: Bảng tiêu chuẩn quan sát 36

Bảng 4.1: Độ chính xác trong việc phát hiện gạo không đạt 58

Trang 6

DANH MỤC CÁC HÌNH

Hình 1.1: Kim ngạch xuất khẩu gạo của Việt Nam trong giai đoạn 2010-2014 1

Hình 1.2: Máy phân loại gạo dòng sản phẩm S.PRECISION trong thực tế 3

Hình 2.1: Các bước cơ bản trong xử lý ảnh 7

Hình 2.2: Thiết bị CCD 12

Hình 2.3: Pixel trung tâm và 4 pixel lân cận (a) và 8 pixel lân cận (b) 13

Hình 2.4: Đường biên của ảnh 19

Hình 2.5: Đối tượng cần phình A và nhân tạo ảnh B 24

Hình 2.6: Minh họa quét các bi khắp A 24

Hình 2.7: Kết quả đạt được 24

Hình 2.8: Kết quả đạt được 25

Hình 2.9: Sử dụng phép mở 26

Hình 2.10: Phép đóng 27

Hình 2.11: Các loại sóng điện từ (trên) và dải ánh sáng được phóng to (dưới) 28

Hình 2.12: Ba màu cơ bản red, green, blue 30

Hình 2.13: Mô hình không gian màu RGB 30

Hình 2.14:Màu cơ bản trong hệ CMYK 31

Hình 2.15: Mô hình không gian màu HSV biểu diễn dưới dạng hình nón 32

Hình 2.16: Mô hình không gian màu HSV biểu diễn dưới dạng hình trụ 33

Hình 2.17: Mô hình không gian màu HSI 34

Hình 2.18: Mô hình không gian màu CIE- L*a*b* 35

Hình 2.19: Cấu trúc chung của định dạng ảnh 38

Hình 3.1: Sơ đồ khối thể hiện quy trình xử lý ảnh gạo 39

Hình 3.2: Phần mềm Matlab 40

Hình 3.3: Ảnh gạo RGB 41

Hình 3.4: Ảnh gạo chuyển mức xám 41

Hình 3.5: Ảnh đã được lọc nhiễu 42

Hình 3.6: Ảnh đã được tách biên 43

Hình 3.7: Ảnh loại bỏ những vùng nhỏ hơn 10 pixel 43

Trang 7

Hình 3.8: Lắp đầy những vùng biên kín 44

Hình 3.9: Biên được làm dầy lên 44

Hình 3.10: Lắp đầy những vùng biên kín lần 2 45

Hình 3.11: Biên được làm mảnh trở lại 45

Hình 3.12: Các vùng ảnh gạo được đánh dấu 46

Hình 3.13: Những hạt gạo được đánh dấu không đạt yêu cầu theo diện tích và tỷ lệ 46

Hình 3.14: Ảnh màu RGB 47

Hình 3.15: Ảnh sau khi chuyển sang hệ màu Lab 47

Hình 3.16: Ảnh gạo mẫu RGB 48

Hình 3.17: Ảnh gạo mẫu chuyểnsang hệ màu Lab 48

Hình 3.18: Những hạt gạo được đánh dấu không đạt theo màu sắc 49

Hình 3.19: Những hạt gạo được đánh dấu không đạt về diện tích, tỷ lệ và màu 49

Hình 4.1: Khung mô hình phần cứng 50

Hình 4.2: Vị trí lắp đặt camera 51

Hình 4.3: Logitech B525 HD Webcam 51

Hình 4.4: Đèn LED dùng cho chiếu sáng 52

Hình 4.5: Ảnh 1 53

Hình 4.6: Ảnh 2 53

Hình 4.7: Ảnh 3 54

Hình 4.8: Ảnh 4 54

Hình 4.9: Ảnh 5 55

Hình 4.10: Ảnh 6 55

Hình 4.11: Ảnh 7 56

Hình 4.12: Ảnh 8 56

Hình 4.13: Ảnh 9 57

Hình 4.14: Ảnh 10 57

Trang 8

Chương 1: TỔNG QUAN

1.1 Đặt vấn đề

1.1.1 Tính cấp thiết của đề tài

Lúa gạo là một trong những cây lương thực chính trên thế giới Đặc biệt tại Việt Nam đây là cây lương thực chính để tạo ra các sản phẩm thiết yếu để phục vụ đời sống con người.Ngành sản xuất lúa gạo có khả năng tạo nhiều việc làm cho người lao động, tăng danh thu, làm cơ sở phát triển cho các ngành khác, góp phần nâng cao mức sống

và ổn định an ninh lương thực từ đó góp phần ổn định tình hình chính trị của đất nước Với một nước nông nghiệp như Việt Nam hiện nay thì ngành sản xuất lúa gạo vẫn còn là ngành chủ lực trong phần trăm cơ cấu cây trồng và phân công lao động xã hội Việt Nam có thế mạnh trong việc sản xuất lúa gạo và là nước nhiều năm liền xuất khẩu gạo đứng thứ ba trên thế giới thu về nguồn ngoại tệ lớn Kim ngạch xuất khẩu gạo của Việt Nam trong giai đoạn 2010-2014 được thể hiện trong Hình 1.1 [1]

Hình 1.1: Kim ngạch xuất khẩu gạo của Việt Nam trong giai đoạn 2010-2014

Tuy nhiên, xuất khẩu gạo của Việt Nam vẫn còn gặp không ít khó khăn Hệ thống sản xuất gạo vẫn còn lạc hậu, sản xuất nhỏ lẻ dẫn đến chất lượng của hạt gạo Việt Nam còn thấp hơn so với các nước xuất khẩu lớn trong khu vực như: Thái Lan, Ấn Độ, Vì thế khả năng cạnh tranh của hạt gạo Việt Nam trên thế giới còn thấp Việt

Trang 9

Nam chủ yếu xuất khẩu gạo qua các nước đang phát triển ở châu Á như: Trung Quốc, Philipines, Indonesia, một số nước ở châu Phi Đối với những thị trường khó tính như: Mỹ, EU, Nhật, thì việc xuất khẩu qua các nước này vẫn còn hạn chế do hạt gạo chưa đáp ứng được chất lượng mà các thị trường này đặt ra

1.1.2 Tình hình nghiên cứu trong nước

Kỹ thuật phân loại sử dụng các sensor quang đã bước đầu được thực hiện ở Việt Nam

từ đầu những năm 90 tại các trung tâm nghiên cứu lớn như Viện Máy và dụng cụ công nghiệp, Trường Đại học Bách khoa Hà Nội …Tuy nhiên, kỹ thuật và thiết bị phân loại chỉ có thể ứng dụng cho các đối tượng có màu sắc rõ ràng, di chuyển chậm theo tốc độ và mật độ hoàn toàn xác định trước Việc nghiên cứu kỹ thuật và thiết bị phân loại đối tượng có màu không rõ ràng di chuyển nhanh với mật độ lớn như các loại vật liệu rời và nông sản thực phẩm dạng hạt thì vẫn chưa được quan tâm đúng

mức [2]

Việc ứng dụng xử lý ảnh trong việc phân loại chất lượng gạo cũng đã được nhiều nhiều nhóm thực hiện: Phân loại gạo theo màu sắc của Viện Máy và dụng cụ công nghiệp (IMI); ứng dụng neural và xử lý ảnh trong nhận dạng và phân loại gạo trắng của nhóm tác giả Ths Nguyễn Xuân Vinh, Ths Lê Đình Lượng; nghiên cứu xử lý ảnh trong phân loại sản phẩm theo màu sắc của sinh viên Bùi Nhân Tiến, K6 Khoa Điện

tử, Trường ĐH Tôn Đức Thắng (TPHCM)

1.1.3 Tình hình nghiên cứu ngoài nước

Kỹ thuật phân loại vật liệu rời và thực phẩm dạng hạt được nghiên cứu ứng dụng trên thế giới từ những năm 70 Các thế hệ phân loại đầu tiên sử dụng sensor quang rời rạc (photodiodes) để nhận thông tin màu sắc, đồng thời xử lý các thông tin này bằng các thiết bị tương tự Nguyên tắc phân loại kiểu này tuy bước đầu đáp ứng yêu cầu thị trường phân loại sản phẩm nhưng bộc lộ nhiều nhược điểm: hệ thông phân loại cồng kềnh, năng suất phân loại thấp, sai số lớn, độ linh hoạt không cao, rất khó khăn khi thay đổi đối tượng phân loại

Trang 10

Hình 1.2: Máy phân loại gạo dòng sản phẩm S.PRECISION trong thực tế

Bảng 1.1: Thông số kỹ thuật máy phân loại gạo

Lượng khí tiêu thụ (lít/phút)

2000-3500

CCD Camera Japan 2048 Pixel

Màn hình hiển thị Japan Điện áp (V/Hz) 220/50 Trọng lượng (kg) 1043 Kích thước (DxRxC) mm 2279x1640x2015 Cùng với sự phát triển của kỹ thuật quang, các thế hệ đo – thu nhận tín hiệu màu sắc ngày càng đạt độ chính xác cao, tích hợp ngày càng chặt chẽ, gọn nhẹ, trong đó đặc biệt đáng kể là thiết bị quét quang học dựa trên CCD ( Charge Coupled Devides) Các camera quang số kết hợp với kỹ thuật thu nhận – xử lý hình ảnh bằng máy tính đã mở

Trang 11

ra bước ngoặt mới cho cho thiết bị phân loại sản phẩm: kết cấu máy hết sức gọn nhẹ,

độ chính xác cao, linh hoạt khi thay đổi đối tượng phân loại Nguyên tắc phân loại nhờ camera quang số đã được hầu hết các hãng lớn trên thế giới như Allen, Delta(Mỹ), Sortex (Anh), Satake (Nhật bản) … ứng dụng và phát triển cho đến ngày nay

Với thành tựu to lớn trong tất cả các thiết bị điều khiển liên quan đến thiết bị phân loại như kỹ thuật ánh sáng, kỹ thuật –thiết bị camera, kỹ thuật xử lý phân tích màu, thiết bị số, vi xử lý và máy tính, các thiết bị phân loại vật liệu rời dạng hạt ngày nay

đã đạt được tốc độ cao, đến hàng chục triệu sản phẩm mỗi giờ, đạt độ chính xác 0.2% và cho phép phân loại sản phẩm có kích thước nhỏ đến 1mm Với các tính năng trên, thiết bị phân loại đã được ứng dụng rộng rãi trong hầu hết lĩnh vực phân loại vật liệu rời như quặng, đá các loại, thủy tinh, nhựa tái chế … cũng như sản phẩm dạng hạt trong lĩnh vực chế biến nông sản thực phẩm như rau, đậu, các loại hoa quả, gạo,

0-cacao, cà phê …[2] Hình 1.2 là hình ảnh của một máy phân loại gạo trong thực tế

1.1.4 Giải pháp

Nghiên cứu một hệ thống phân loại chất lượng của gạo dùng xử lý ảnh Hệ thống gồm

có một camera thu nhận hình ảnh rồi đưa vào máy tính xử lý để phát hiện ra sản phẩm xấu sau đó dùng súng hơi loại bỏ sản phẩm xấu vừa mới phát hiện Hệ thống nhỏ gọn giá thành thấp nếu so với máy phân loại gạo trong thực tế của các hãng nước ngoài, khi đưa vào thực tế thì sẽ tiết kiệm được chi phí do giá thành của các máy phân loại gạo rất cao

Trang 12

1.3 Giới hạn đề tài

Đề tài chỉ mới dừng lại ở việc đánh giá chất lượng của hạt gạo theo chỉ tiêu về diện tích, kích thước và màu sắc chưa loại bỏ được hạt không đạt chất lượng Thời gian và tốc độ xử lý vẫn còn chậm nên chưa thể chạy đúng với thời gian thực

1.4 Nội dung đề tài

Phần còn lại của đề tài như sau:

Chương 2: Cơ sở lý thuyết

Chương này sẽ trình bày cơ bản lý thuyết về xử lý ảnh, các chỉ tiêu đánh giá trong việc phân loại chất lượng của hạt gạo

Chương 3: Nhận dạng gạo dựa trên hình dạng và màu sắc

Chương này sẽ trình bày các bước phân tích để có thể phân loại chất lượng của hạt gạo

Chương 4: Kết quả thực nghiệm

Nội dung chương này tổng hợp các kết quả sau khi thi công mô hình và kết quả đạt được trong việc phân loại gạo

Chương 5: Kết luận và hướng phát triển

Kết quả nhận được khi hoàn thành đề tài, đưa ra các phương án phát triển hoàn thiện

mô hình nhằm tiến tới tối ưu hệ thống trong tương lai

Trang 13

Chương 2: CƠ SỞ LÝ THUYẾT

Trong chương này sẽ trình bày sơ lược các khái niệm cơ bản về xử lý ảnh, các quy trình đánh giá chất lượng của hạt gạo dùng xử lý ảnh Đồng thời cũng trình bày các chỉ tiêu đánh giá chất lượng của hạt gạo

2.1 Giới thiệu chung về xử lý ảnh

Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ Nó là một ngành khoa học mới so với nhiều ngành khoa học khác Song tốc độ của nó phát triển rất nhanh, kích thích được nhiều các trung tâm nghiên cứu về nó với nhiều ứng dụng khác nhau

Xử lý ảnh có thể được áp dụng cho nhiều lĩnh vực khác nhau từ những lĩnh vực về dân sự đến những lĩnh vực an ninh quốc phòng Xử lý ảnh đang được ứng dụng rất nhiều như trong dự báo cháy rừng, dự báo lũ lụt, dự báo thời tiết, trong lĩnh vực an ninh như nhân dạng vân tay, nhận dạng khuôn mặt, nhận dạng tội phạm

Ngoài ra còn một ứng dụng của xử lý ảnh mà mấy năm trở lại đây được cho là rất quan trọng đó chính là ứng dụng xử lý ảnh trong việc phân biệt màu sắc, nó được áp dụng trong nhiều lĩnh vực khác nhau Đặc biệt bây giờ đang được áp dụng rất mạnh trong nông nghiệp, như ứng dụng xử lý ảnh cho việc phát hiện vật phẩm xấu Do vậy

xử lý ảnh đang được phát triện hết sức toàn diện trên mọi lĩnh vực

Các bước cần thiết trong xử lý ảnh, đầu tiên ảnh tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu (như Camera, máy chụp ảnh) Trước đây, ảnh thu qua Camera là các ảnh tương tự (loại Camera ống kiểu CCIR) Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng được lấy ra từ Camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh, có thể quét từ ảnh chụp bằng máy quét ảnh Hình 2.1 mô tả các bước cơ bản trong xử lý ảnh [3]

Trang 14

Hình 2.1: Các bước cơ bản trong xử lý ảnh

Sơ đồ như Hình 2.1 bao gồm các thành phần sau:

Phần thu nhận ảnh (Image Acquisition)

Ảnh có thể nhận qua camera màu hoặc đen trắng Thường ảnh nhận qua camera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25 dòng), cũng

có loại camera đã số hoá (như loại CCD – Charge Coupled Device) là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh

Camera thường dùng là loại quét dòng ; ảnh tạo ra có dạng hai chiều Chất lượng một

ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh)

Tiền xử lý (Image Processing)

Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộ tiền xử lý

để nâng cao chất lượng Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn

Phân đoạn (Segmentation) hay phân vùng ảnh

Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng Đây là phần phức tạp

Trang 15

khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này

Biểu diễn ảnh (Image Representation)

Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lận cận Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác

Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)

Nhận dạng ảnh là quá trình xác định ảnh Quá trình thường thu được bằng cách so sánh với mẫu chuẩn đã được học hoặc lưu từ trước Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng Ví dụ: một loạt chữ số và nét ngang trên phong bì thư có thể được nội suy thành mã điện thoại Có nhiều cách phân loại ảnh khác nhau về ảnh Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phân loại nhận dạng

Cơ sở tri thức (Knowledge Base)

Như đã nói ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu Trong nhiều khâu

xử lý và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán học đảm bảo

Trang 16

tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận và xử lý ảnh theo cách của con người Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con người Vì vậy, ở đây các cơ sở tri thức được phát huy

Mô tả (biểu diễn ảnh)

Từ Hình 2.1, ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp theo để phân tích Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng

bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ Thông thường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản là mã hoá) theo các đặc điểm của ảnh được gọi là các đặc trưng ảnh (Image Features) như: biên ảnh

(Boundary), vùng ảnh (Region) Một số phương pháp biểu diễn thường dùng:

 Biểu diễn bằng mã chạy (Run-LengthCode)

 Biểu diễn bằng mã xích (Chaine-Code)

 Biểu diễn bằng mã tứ phân (Quad-Tree Code)

Biểu diễn bằng mã chạy

Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị phân Một vùng ảnh R có thể mã hóa đơn giản nhờ một ma trận nhị phân:

U(m, n) = 1 nếu (m, n) thuộc R

U(m, n) = 0 nếu (m, n) không thuộc R

Trong đó: U(m, n) là hàm mô tả mức xám ảnh tại tọa độ (m, n) Với cách biểu diễn trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1 Giả sử chúng ta

mô tả ảnh nhị phân của một vùng ảnh được thể hiện theo toạ độ (x, y) theo các chiều

và đặc tả chỉ đối với giá trị “1” khi đó dạng mô tả có thể là: (x, y)r; trong đó (x, y) là toạ độ, r là số lượng các bit có giá trị“1” liên tục theo chiều ngang hoặc dọc

Biểu diễn bằng mã xích

Phương pháp này thường dùng để biểu diễn đường biên ảnh Một đường bất kỳ được chia thành các đoạn nhỏ Nối các điểm chia, ta có các đoạn thẳng kế tiếp được gán hướng cho đoạn thẳng đó tạo thành một dây xích gồm các đoạn Các hướng có thể chọn 4, 8, 12, 24,…mỗi hướng được mã hoá theo số thập phân hoặc số nhị phân thành

mã của hướng

Trang 17

Biểu diễn bằng mã tứ phân

Phương pháp mã tứ phân được dùng để mã hoá cho vùng ảnh Vùng ảnh đầu tiên được chia làm bốn phần thường là bằng nhau Nếu mỗi vùng đã đồng nhất (chứa toàn điểm đen (1) hay trắng (0)), thì gán cho vùng đó một mã và không chia tiếp Các vùng không đồng nhất được chia tiếp làm bốn phần theo thủ tục trên cho đến khi tất cả các vùng đều đồng nhất Các mã phân chia thành các vùng con tạo thành một cây phân chia các vùng đồng nhất

Camera

Đối với một hệ thống xử lý ảnh thu nhận qua camera-camera như là con mắt của hệ thống Có 2 loại camera: camera ống loại CCIR và camera CCD Loại camera ứng với chuẩn CCIR với tần số 1/25 và mỗi ảnh gồm 25 dòng Loại CCD gồm các photo điốt và làm tương ứng một cường độ sáng tại một điểm ảnh ứng với một phần tử ảnh (pixel) Như vậy, ảnh là tập hợp các điểm ảnh Số pixel tạo nên một ảnh gọi là độ phân giải (resolution)

Có nhiều kiểu thiết bị tạo ảnh, từ mắt động vật đến những ống kính camera ghi hình

và radio Chúng có thể có hoặc không trang bị thấu kính Mô hình buồng tối camera đầu tiên được phát minh vào thế kỷ 16 không có các thấu kính, nhưng thay vào đó là một lỗ (pinhole) để hội tụ các tia sáng lên trên tường hoặc tấm mờ Các lỗ dần dần được thay thế bởi các thấu kính càng ngày càng phức tạp

Nói chung camera thường có hai bộ phận cơ bản một là hệ thống tạo ảnh và hai là bề mặt tạo ảnh có chứa chất nhạy cảm quang Bề mặt tạo ảnh của một camera thông

Trang 18

thường là hình chữ nhật, nhưng các camera toàn cảnh có thể trang bị mặt tạo ảnh hình trụ để tăng trường nhìn Những phần tử nhạy tạo ảnh có những đặc trưng khác nhau Chúng có thể ghi nhận một ảnh rời rạc hoặc một ảnh liên tục về mặt không gian Hệ thống tạo ảnh có thể là lỗ hoặc là hệ thấu kính trong các camera hiện đại [2]

Cảm biến ảnh CCD (Charge Couple Device)

Như chúng ta biết Niepce phát minh ra kỹ thuật chụp ảnh từ đầu thế kỷ 19, nhưng Daguerre mới là người giới thiệu nó với công chúng Sau hai lần cùng cộng tác trong năm 1826, Daguerre tiếp tục phát triển phương pháp chụp ảnh của riêng mình sử dụng hơi thuỷ ngân để khuếch đại và để lộ ra ảnh được tạo trên miếng đồng mạ bạc được bôi iốt Phép chụp ảnh Daguerre ngay lập tức thành công khi Arago biểu diễn phương pháp Daguerre ở viện hàn lâm khoa học Pháp năm 1839 Những cột mốc khác trong lịch sử lâu dài của phương pháp chụp ảnh bao gồm phương pháp tấm ướt âm/dương của Legray và Archer năm 1850, phương pháp gelatin (chất lỏng trong suốt không có

vị để chế tạo phim ảnh) của Maddox năm 1870, Eastman giới thiệu phim chụp ảnh năm 1889, và phát minh kỹ thuật điện ảnh (cinema) của Lumiere năm 1895 và chụp ảnh màu năm 1908

Các camera CCD (Charge Couple Device) được đề xuất năm 1970 và đã thay thế các camera vidicon trong hầu hết các ứng dụng hiện đại Cảm biến CCD sử dụng một lưới hình chữ nhật của các điểm (site) thu thập điện tử phủ trên một đế silic mỏng để ghi lại năng lượng ánh sáng đến mỗi điểm trong chúng (hình 2.2) Mỗi một điểm được tạo thành bằng cách cấy một lớp SiO2 trên đế và sau đó lắng đọng một cấu trúc cổng dẫn lên trên Khi photon đập vào silic, thì cặp điện tử lỗ trống được tạo ra (chuyển đổi quang) và điện tử bị bắt giữ bằng giếng điện thế được tạo thành bởi tác động của một điện thế dương ở cổng tương ứng Các điện tử được tạo ra ở mỗi điểm được tập hợp qua một chu kỳ thời gian T cố định

Trang 19

Hình 2.2: Thiết bị CCD

Các điện tích được lưu trữ ở những điểm riêng biệt sẽ được di chuyển sử dụng cách mắc tích nạp điện (charge coupling): Các gói điện tích được truyền từ điểm này đến điểm kia bằng cách vận chuyển các điện thế cổng và bảo tồn các gói riêng biệt ảnh được đọc ra khỏi CCD một hàng một lần, mỗi hàng được truyền song song tới một thanh ghi lối ra nối tiếp Giữa hai lần đọc hàng, thanh ghi truyền một ô điện tích của

nó một lần (hình 2.1) tới một bộ khuếch đại lối ra tạo ra một tín hiệu tỷ lệ với điện tích nó nhận được Quá trình này tiếp tục cho tới khi toàn bộ ảnh đã được đọc ra Nó

có thể được lặp lại 30 lần trong một giây (tốc độ TV) cho các ứng dụng ghi hình hoặc

ở tốc độ thấp hơn nhiều, bỏ đi nhiều thời gian (giây, phút, thậm chí hàng giờ) để thu thập điện tử trong các ứng dụng mức sáng thấp như thiên văn học Lưu ý rằng lối ra

số của hầu hết các CCD camera được chuyển đổi bên trong thành một tín hiệu ghi hình tương tự trước khi được chuyển tới một bộ bắt hình (frame grabber) ở đó tạo dựng ảnh số cuối cùng

Các CCD camera màu cấp độ dân dụng thực chất sử dụng các chip giống như các camera đen trắng, chỉ khác là các hàng hoặc các cột liên tiếp của cảm biến được tạo

ra nhạy cảm với ánh sáng đỏ, lục hoặc lam thường sử dụng một bộ lọc phủ để bù ánh sáng Các mẫu lọc khác có thể thực hiện được bao gồm các khối khảm (mosaic) 22 được tạo bởi các bộ cảm nhận hai lục, một đỏ và một lam (mẫu Bayer) Độ phân giải không gian của camera một CCD tất nhiên là có giới hạn, các camera chất lượng cao hơn sử dụng một bộ chia chùm tia để chuyển ảnh tới 3 CCD khác nhau thông qua các

Trang 20

bộ lọc màu Các kênh màu riêng biệt sau đó được số hoá hoặc là riêng biệt (lối ra RGB) hoặc kết hợp thành tín hiệu ghi hình màu hỗn hợp (NTSC, SECAM hoặc PAL) hoặc thành định dạng ghi hình thành phần tách rời thông tin màu và độ chiếu sáng [2]

2.2.2 Những khái niệm cơ sở về xử lý ảnh [2].

Điểm ảnh (Picture Element)

Hình 2.3: Pixel trung tâm và 4 pixel lân cận (a) và 8 pixel lân cận (b)

Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng Để xử lý bằng máy tính (số), ảnh cần phải được số hoá Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám) Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel.Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y) Trong thị giác máy tính, thường coi một pixel cần khảo sát

ở trung tâm có hình chữ nhật thì có 4 pixel hoặc 8 pixel lân cận như mô tả trên hình 2.3 Thường biểu diễn trực tiếp các số đo mức xám của các pixel như hình 2.3c

Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu

nhất định Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh

số gần như ảnh thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh

Độ phân giải của ảnh

Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị

Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách thích hợp tạo nên một

Trang 21

mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y trong không

gian hai chiều

Mức xám của ảnh

Một điểm ảnh (pixel) có hai đặc trưng cơ bản là vị trí (x, y) của điểm ảnh và độ xám

của nó Dưới đây chúng ta xem xét một số khái niệm và thuật ngữ thường dùng trong

 Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác) với mức xám ở các điểm ảnh có thể khác nhau

 Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô tả 21 mức khác nhau Nói cách khác: mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1

 Ảnh màu: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu: 28*3=224≈16,7 triệu màu

2.2.3 Quá trình xử lý ảnh

Trong phạm vi đề tài này ảnh sau khi thu nhận được sẽ được xử lý thay đổi mức xám ảnh, chuyển từ ảnh màu gạo gốc sang ảnh gạo theo mức xám, tiếp theo ảnh được dò tách biên, lấp lỗ trống, làm dày biên để tách đối tượng ra khỏi ảnh Sau đó ảnh được lọc bỏ các nhiễu và các điểm ảnh lỗi Sau cùng ảnh được phân đoạn thành các vùng

có cùng tính chất nào đó dựa theo biên hay các vùng liên thông Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng độ nhám [4]

Trang 22

Chuyển đổi mức xám ảnh

Theo tiêu chuẩn của hệ thống màu NTSC, một ảnh bậc độ xám của một ảnh màu có được bằng cách tính mỗi pixel tương ứng của ảnh bậc độ xám theo công thức [4]:

𝑌 = 𝑌𝑅+ 𝑌𝐺+ 𝑌𝐵 = 𝛼 𝑅𝑑+ 𝛽 𝐺𝑑+ 𝛿 𝐵𝑑 (2.1) Trong đó:

Y là giá trị bậc độ xám của pixel ảnh các bậc độ xám (nhiều khi còn gọi là ảnh đen trắng)

Rd, Gd, Bd là giá trị của các pixels màu cơ bản R, G, B

𝛼 = 0.29890 𝛽 = 0.58662 𝛿 = 0.11448

Lọc nhiễu

Ảnh thu nhận được thường sẽ bị nhiễu nên cần phải loại bỏ nhiễu Các toán tử không gian dùng trong kỹ thuật tăng cường ảnh được phân nhóm theo công dụng: làm trơn nhiễu, nổi biên Để làm trơn nhiễu hay tách nhiễu, người ta sử dụng các bộ lọc tuyến tính (lọc trung bình, thông thấp) hoặc lọc phi tuyến (trung vị, giả trung vị, lọc đồng hình) Từ bản chất của nhiễu (thường tương ứng với tần số cao) và từ cơ sở lý thuyết lọc là: bộ lọc chỉ cho tín hiệu có tần số nào đó thông qua , để lọc nhiễu người ta thường dùng lọc thông thấp (theo quan điểm tần số không gian) hay lấy tổ hợp tuyến tính để san bằng (lọc trung bình) Để làm nổi cạnh (ứng với tần số cao), người ta dùng các bộ lọc thông cao, lọc Laplace Người ta thường xem xét 3 loại nhiễu chính: nhiễu cộng, nhiễu nhân và nhiễu xung [3]

+ Nhiễu cộng:Nhiễu cộng thường phân bố khắp ảnh Nếu gọi ảnh quan sát (ảnh thu được) là Xqs, ảnh gốc là Xgốc, nhiễu là η, ảnh thu được có thể biểu diễn bởi:

Trang 23

Làm trơn nhiễu bằng lọc tuyến tính: lọc trung bình và lọc dải thông thấp

[3]

Do có nhiều loại nhiễu can thiệp vào quá trình xử lý ảnh nên cần có nhiều bộ lọc thích hợp Với nhiễu cộng và nhiễu nhân ta dùng các bộ lọc thông thấp, trung bình và lọc đồng hình (Homomorphie); với nhiễu xung ta dùng lọc trung vị, giả trung vị, lọc ngoài (Outlier)

Lọc trung bình không gian Với lọc trung bình, mỗi điểm ảnh được thay thế bằng trung bình trọng số của các điểm lân cận và được định nghĩa như sau:

𝑁𝑤 với 𝑁𝑤 là số điểm ảnh trong cửa sổ lọc W

Lọc trung bình có trọng số chính là thực hiện chập ảnh đầu vào với nhân chập H Nhân chập H trong trường hợp này có dạng:

Trang 24

𝐻𝑏 = 1(𝑏 + 2)2[1𝑏 𝑏𝑏2 1𝑏

]

Ta dễ dàng nhận thấy khi b =1, Hb chính là nhân chập Ht1 (lọc trung bình) Để hiểu

rõ hơn bản chất khử nhiễu cộng của các bộ lọc này, ta viết lại phương trình thu nhận ảnh dưới dạng:

𝑌(𝑚, 𝑛) =𝑁1

𝑤∑ ∑ 𝑋𝑞𝑠(𝑚 − 𝑘, 𝑛 − 𝑙) + 𝜎𝑛2

𝑁𝑤(𝑘,𝑙)𝜖𝑊 (2.8)

Như vậy, nhiễu cộng trong ảnh đã giảm đi Nw lần

Lọc đồng hình (Homomorphie Filter)

Kỹ thuật lọc này hiệu quả với ảnh có nhiễu nhân Thực tế, ảnh quan sát được gồm

ảnh gốc nhân với một hệ số nhiễu Gọi X(m, n) là ảnh thu được, X(m, n) là ảnh gốc

và η(m, n) là nhiễu, như vậy:

𝑋(𝑚, 𝑛) = 𝑋̅(𝑚, 𝑛) ∗ 𝜂(𝑚, 𝑛) (2.9) Lọc đồng hình thực hiện lấy logarit của ảnh quan sát Do vậy ta có kết quả sau: log (𝑋(𝑚, 𝑛)) = log (𝑋̅(𝑚, 𝑛)) ∗ log (𝜂(𝑚, 𝑛)) (2.10)

Rõ ràng, nhiễu nhân có trong ảnh sẽ bị giảm Sau quá trình lọc tuyến tính, ta chuyển

về ảnh cũ bằng phép biến đổi hàm e mũ

Làm trơn nhiễu bằng lọc phi tuyến [3]

Các bộ lọc phi tuyến cũng hay được dùng trong kỹ thuật tăng cường ảnh Trong kỹ thuật này, người ta dùng bộ lọc trung vị, giả trung vị, lọc ngoài Với lọc trung vị, điểm ảnh đầu vào sẽ được thay thế bởi trung vị các điểm ảnh còn lọc giả trung vị sẽ dùng trung bình cộng của hai giá trị “trung vị” (trung bình cộng của max và min)

Trang 25

+ Lọc trung vị là loại lọc phi tuyến Điều này dẽ nhận thấy từ:

Trungvi(x(m)+y(m)) ≠ Trungvi(x(m)) + Trungvi(y(m))

+ Có lợi cho việc loại bỏ các điểm ảnh hay các hàng mà vẫn bảo toàn độ phân giải

+ Hiệu quả giảm khi số điểm trong cửa sổ lớn hay bằng một nửa số điểm trong cửa sổ Điều này dễ giải thích vì trung vị là (Nw+1)/2 giá trị lớn nhất nếu Nw lẻ Lọc

trung vị cho trường hợp 2 chiều coi như lọc trung vị tách được theo từng chiều

Lọc ngoài (Outlier Filter)

Giả thiết có ngưỡng nào đó cho các mức nhiễu (có thể dựa vào lược đồ xám) Tiến hành so sánh giá trị độ xám của một điểm ảnh với trung bình số học 8 lân cận của nó Nếu sai lệch lớn hơn ngưỡng, điểm ảnh này được coi như nhiễu Trong trường hợp đó,thay thế giá trị của điểm ảnh bằng giá trị trung bình 8 lân cận vừa tính được Bộ lọc ngoài có thể diễn tả bằng công thức sau:

𝑌(𝑚, 𝑛) = {𝑢(𝑚, 𝑛)𝛼(𝑤) ( 2.12)

với : α(w) là trung bình cộng các điểm trong lân cận w

Các cửa sổ tính toán thường chọn là 3x3 Tuy nhiên, cửa sổ có thể mở rộng đến 5x5 hay 7x7 để đảm bảo tính tương quan giữa các điểm ảnh Vấn đề quan trọng là xác định ngưỡng để loại nhiễu mà vẫn không làm mất thông tin của ảnh

Trang 26

Phương pháp phát hiện biên [3] [4]

Hình 2.4: Đường biên của ảnh

Biên là một vấn đề chủ yếu trong phân tích ảnh vì các kỹ thuật phân đoạn ảnh chủ yếu dựa vào biên

Điểm Biên: Một điểm ảnh được coi là điểm biên nếu có sự thay đổi nhanh hoặc đột

ngột về mức xám (hoặc màu) Ví dụ trong ảnh nhị phân, điểm đen gọi là điểm biên nếu lân cận nó có ít nhất một điểm trắng

Đường biên (đường bao: boundary): tập hợp các điểm biên liên tiếp tạo thành một

đường biên hay đường bao

Ý nghĩa của đường biên trong xử lý: ý nghĩa đầu tiên của đường biên là một loại đặc

trưng cục bộ tiêu biểu trong phân tích, nhận dạng ảnh Thứ hai, người ta sử dụng biên làm phân cách các vùng xám (màu) cách biệt Ngược lại, người ta cũng sử dụng các vùng ảnh để tìm đường phân cách

Tầm quan trọng của biên: để thấy rõ tầm quan trọng của biên, xét ví dụ sau: khi người

họa sỹ muốn vẽ một danh nhân, họa sỹ chỉ cần vẽ vài đường nứt tốc họa mà không cần vẽ một cách đầy đủ

Mô hình biểu diễn đường biên: theo toán học điểm ảnh có sự biến đổi mức xám u(x)

một cách đột ngột theo Hình 2.4

Như vậy, phát hiện biên một cách lý tưởng là phát hiện được tất cả các đường biên trong các đối tượng Định nghĩa toán học của biên ở trên là cơ sở cho các kỹ thuật phát hiện biên Điều quan trọng là sự biến thiên giữa các điểm ảnh thường nhỏ, trong khi đó biến thiên độ sáng của điểm biên thường là khá lớn khi qua biên Xuất phát cơ

sở này người ta thường sử dụng hai phương pháp phát hiện biên như sau:

Trang 27

+ Phương pháp phát hiện biên trực tiếp: phương pháp này chủ yếu dựa vào

sự biến thiên về giá trị độ sáng của điểm ảnh để làm nổi biên bằng kỹ thuật đạo hàm

Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp gradient; nếu lấy đạo hàm bậc

hai ta có kỹ thuật Laplace Hai phương pháp này được gọi chung là phương pháp dò

biên cục bộ Ngoài ra, người ta còn sử dụng phương pháp “đi theo đường bao” dựa

vào công cụ toán học là nguyên lý quy hoạch động và được gọi là phương pháp dò

biên tổng thể Phương pháp dò biên trực tiếp có hiệu quả và ít bị tác động của nhiễu

+ Phương pháp phát hiện biên gián tiếp: Nếu bằng cách nào đấy, chúng ta thu

được các vùng ảnh khác nhau thì đường phân cách giữa các vùng đó chính là biên

Nói cách khác, việc xác định đường bao của ảnh được thực hiện từ ảnh đã được phân

vùng Phương pháp dò biên gián tiếp khó cài đặt nhưng áp dụng tốt khi sự biến thiên

độ sáng nhỏ

Phương pháp gradient:

Gradient là một vec tơ f(x, y) có các thành phần biểu thị tốc độ thay đổi mức

xám của điểm ảnh (theo hai hướng x, y trong bối cảnh xử lý ảnh hai chiều) tức:

𝜕𝑓(𝑥,𝑦)

𝜕𝑥 = 𝑓𝑥, ≈ 𝑓(𝑥+𝑑𝑥,𝑦)−𝑓(𝑥,𝑦)𝑑𝑥 (2.13) 𝜕𝑓(𝑥,𝑦)

𝜕𝑦 = 𝑓𝑦, ≈ 𝑓(𝑥,𝑦+𝑑𝑦)−𝑓(𝑥,𝑦)𝑑𝑦 (2.14)

Trong đó dx, dy là khoảng cách giữa 2 điểm kế cận theo hướng x, y tương ứng (thực

tế chọn dx= dy=1) Đây là phương pháp dựa theo đạo hàm riêng bậc nhất theo hướng

Trang 28

độ g(m,n) tại điểm (m,n) được tính:

𝐴0 = 𝑔(𝑚, 𝑛) = √𝑔12(𝑚, 𝑛) + 𝑔22(𝑚, 𝑛) (2.17)

𝜃𝑟(𝑚, 𝑛) = 𝑎𝑟𝑡𝑔(𝑔2(𝑚, 𝑛)/𝑔1(𝑚, 𝑛)) (2.18)

Để giảm độ phức tạp tính toán, A0 được tính gần đúng như sau:

𝐴0 = |𝑔1(𝑚, 𝑛)| + |𝑔2(𝑚, 𝑛)| (2.19) Các toán tử đạo hàm được áp dụng khá nhiều Ở đây ta chỉ nêu lên một số toán tử tiêu biểu: Robert, Sobel, Prewit

Toán tử Robert

Trước tiên chúng ta xét toán tử Robert Toán tử này do Robert đề xuất năm 1965 Nó

áp dụng trực tiếp của công thức đạo hàm tại điểm (x,y) Với mỗi điểm ảnh I[x,y] của ảnh I, đạo hàm theo x, theo y được ký hiệu tương ứng g1, g2 được tính:

{𝑔𝑥 = 𝐼[𝑥 + 1, 𝑦] − 𝐼[𝑥, 𝑦]

𝑔𝑦 = 𝐼[𝑥, 𝑦 + 1] − 𝐼[𝑥, 𝑦] ( 2.20) Điều này tương ứng với việc nhân chập ảnh với hai mặt nạ H1, H2 các mặt nạ này gọi

Trang 29

Hướng ngang (x) Hướng dọc (y)

Thực tế cho thấy rằng, các toán tử Sobel và Prewitt tốt hơn toán tử Robert, bởi chúng

ít nhạy cảm với nhiễu Ta cũng thấy rằng việc lấy đạo hàm một tính hiệu có xu hướng làm tăng nhiễu trong tín hiệu đó Độ nhạy cảm này có thể làm giảm xuống nhờ các thao tác lấy trung bình cục bộ trong miền phủ bởi mặt nạ Lưu ý rằng, toán tử Sobel

và Prewitt dễ dàng chuyển đổi cho nhau bằng cách thay đổi hệ số

Phân đoạn ảnh [4]

Phân đoạn ảnh là bước then chốt trong xử lý ảnh Giai đoạn này nhằm phân tích ảnh thành các vùng có cùng tính chất nào đó dựa theo biên hay các vùng liên thông Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng

độ nhám

Quá trình phân đoạn ảnh nhằm tách đối tượng cần khảo sát ra khỏi phần nội dung còn lại của ảnh, hay phân chia các đối tượng trong ảnh thành những đối tượng riêng biệt Như vậy quá trình phân đoạn ảnh là quá trình giảm bớt số lượng thông tin trong ảnh

và chỉ giữ lại những thông tin cần thiết cho ứng dụng Do đó phân đoạn ảnh là quá trình loại bỏ các đối tượng không quan tâm trong ảnh

Có nhiều phương pháp phân đoạn ảnh khác nhau Trong đó quá trình phân đoạn ảnh

sử dụng một ngưỡng giá trị xám để phân đoạn ảnh ra thành các đối tượng và nền là phương pháp đơn giản nhất Lúc này các điểm ở bên dưới ngưỡng giá trị xám thuộc

về nền còn những điểm ảnh ở bên trên ngưỡng giá trị xám thuộc về đối tượng Phương pháp phân đoạn ảnh này hiệu quả lớn đối với ảnh nhị phân, văn bản in hay đồ họa

Trang 30

Dựa vào đặc tính vật lý của vùng ảnh, các kỹ thuật phân đoạn vùng có thể được chia làm 3 loại:

Các kỹ thuật cục bộ: dựa trên các đặc tính cục bộ của các điểm ảnh và các lân

cận của nó

Các kỹ thuật tổng thể: phân đoạn một ảnh dựa trên cơ sở của thông tin lấy từ

tổng thể như sử dụng biểu đồ mức xám histogram

Các kỹ thuật chia, nối và phát triển: dựa trên các khái niệm tương đồng về

hình dạng và tính đồng nhất Hai vùng có thể được nối lại với nhau và liền kề bên nhau Các vùng không đồng nhất có thể được chia thành các vùng nhỏ Một vùng có thể được phát triển bằng các nối các điểm ảnh sao cho nó đồng nhất với nhau

2.2.4 Các phép toán hình thái Morphology [5] [6]

Khái niệm Morphology trong xử lý ảnh số khởi nguồn từ một ngành của sinh học, nghiên cứu về hình thể và cấu trúc của động thực vật Đây là một công cụ giúp rút trích các thành phần trong ảnh nhị phân, biễu diễn và mô tả chúng dưới dạng các vùng hoặc dạng như các đường biên, xương và bao lồi Kỹ thuật morphology cũng được

áp dụng trên ảnh xám cho các công đoạn tiền/hậu xử lý ảnh (pre or post processing) Các phép toán đầu tiên trong Morphology được phát triển vào những năm 1964 bởi Georges Matheron (1930 - 2000) và Jean Serra (1940) tại trường đại học École des Mines de Paris, Pháp Matheron là tiến sĩ hướng dẫn của Jean, họ cố gắng xác định

số lượng đặc tính của khoáng sản thông qua “thin cross section” và công việc cho ra kết quả là một phương pháp tiếp cận mới, cũng như sự tiến bộ trong hình học tích phân và tô pô Từ đó đến hết năm 1970, Morphology xử lý cơ bản với các ảnh nhị phân, tạo ra các phép toán và kĩ thuật như: Dilation, Erosion, Opening, Closing…

Phép dãn (Dilation)

Phép toán Dilation là thao tác dãn nở/phình to các đối tượng ảnh đơn sắc Gọi A là ảnh góc , B là phần tử cấu trúc là hai tập hợp con trong ℤ2, thực hiện phép toán

Trang 31

đi khắp A và tìm những điểm nào mà B∩ A ≠ ∅ thì ta có thể hiểu như A⊕B=⋃𝑏𝑖∈𝐵𝐴𝑏𝑖 với 𝐴𝑏𝑖 là những khu vực mà A ∪ Bi thỏa A ∩ Bi ≠ ∅ Có thể xem hình minh họa: Hình 2.5, Hình 2.6, Hình 2.7

Trang 32

Hình 2.8: Kết quả đạt được

hơn (ở đây ta vẫn quan niệm rằng đối tượng ảnh là những điểm ảnh đen ) Trong trường hợp đơn giản nhất, một phép co nhị phân sẽ tách lớp điểm ảnh bao quanh đối tượng ảnh Dễ hiểu hơn, ta tưởng tượng rằng một ảnh nhị phân có những điểm ảnh đen (đối tượng ảnh ) và điểm ảnh trắng (nền) Từ ảnh ban đầu, ta thay các điểm đen

mà lân cận của nó có ít nhất một điểm trắng thành trắng Khi đó ảnh nhận được là ảnh được co bằng phép co đơn giản Trong phép co này, mẫu được dùng chính là mảng 3 x 3 của các điểm ảnh đen, đã được nói đến trong phép dãn nhị phân trước đây Goi A là ảnh gốc, B là phần tử cấu trúc là hai tập hợp con trong ℤ2, thực hiện phéo toán Erosion trong A theo B ký hiệu A⊖B và được định nghĩa như sau: A⊝B={p | 𝐵𝑝 ⊆ 𝐴}.

Nói cách khác đó là tập hợp các điểm p thuộc A, mà nếu cấu trúc B dịch chuyển theo các tọa độ của p, thì B vẫn nằm trong đối tượng ảnh A tức B là một tập con của đối tượng cần co ảnh A Tuy nhiên điều đó sẽ chưa chắc chắn đã đúng nếu như phần tử cấu trúc B không chứa gốc (tức điểm ảnh gốc màu trắng)

Để minh họa cách thức phép toán hoạt động có thể xem Hình 2.8 với A và B tương

tự như ví dụ ở phép toán Dilation

Trang 33

Hình 2.9 cũng minh họa một đối tượng khác, hoàn toàn tương tự, sử dụng phép mở ảnh và nhiễu ở giữa số 3 đã biến mất Bước co trong phép mở ảnh sẽ xóa những điểm ảnh cô lập được coi như những biên, phép dãn ảnh tiếp sau sẽ khôi phục lại các điểm biên và loại nhiễu

Phép đóng (Closing)

Tương tự phép mở nhưng trong phép đóng ảnh, thao tác dãn ảnh được thực hiện trước, sau đó mới tới thao tác co ảnh và cùng làm việc trên cùng một phần tử cấu trúc, nếu gọi I là ảnh, D là Dilation (dãn) và E là Erosion(co)

Close(I)=E(D(I))

Trang 34

Hình 2.10: Phép đóng

a Kết quả đóng của hình 2.d sử dụng cấu trúc đơn giản

b Ảnh của một bảng mạch được phân ngưỡng và có các vết nứt

c Ảnh tương tự sau khi đóng những nét dứt đã được nối liền

Nếu như phép mở ảnh tạo ra những khoảng trống nhỏ trong điểm ảnh thì trái lại, phép đóng ảnh sẽ lấp đầy những chỗ hổng đó Hình 2.10a trình bày một thao tác đóng ảnh

áp dụng cho Hình 2.9d, mà nhớ rằng đó là kết quả của việc xóa nhiễu Phép đóng ảnh

có tác dụng trong việc xóa những nhiễu trắng trong đối tượng ảnh mà phép mở ảnh chưa làm được

Hình 2.10b và 2.10c trình bày một ứng dụng của phép co ảnh nhằm nối lại những nét gãy Ảnh ban đầu Hình 2.10b là một bản mạch, sau khi sử dụng phép co các điểm gãy đã được liên kết nhau ở một số điểm ảnh Phép đóng ảnh này đã gắn được nhiều điểm ảnh gãy, nhưng không phải là tất cả Điều quan trọng nhận thấy rằng khi sử dụng những ảnh thực, thật hiếm khi xử lý ảnh một cách hoàn chỉnh mà chỉ cần một

kĩ thuật phải sử dụng nhiều phẩn tử cấu trúc mà có khi những kĩ thuật nằm ngoài hình thái học

Đóng ảnh cũng có thể được sử dụng để làm trơn những đường viền của những đối tượng trong ảnh Thỉnh thoảng việc phân ngưỡng có thể đưa ra một sự xuất hiện những điểm nhám trên viền

Trang 35

2.2.5 Không gian màu

Hình 2.11: Các loại sóng điện từ (trên) và dải ánh sáng được phóng to (dưới)

Mọi vật mà chúng ta quan sát được là nhờ ánh sáng Bề mặt của các vật đó là sáng hay tối có hai nguyên nhân chính: năng xuất phản xạ của nó và số lượng ánh sáng mà chúng ta nhận được từ nguồn Có hai loại nguồn sáng Loại thứ nhất tự nó phát ra ánh sáng gọi là nguồn sơ cấp (mặt trời, đèn điện ) Loại thứ hai là chỉ phản xạ hay khuyếch tán ánh sáng mà nó nhận được từ các nguồn sáng khác nhau gọi là nguồn sáng thứ cấp (như mặt trăng, đồ vật )

Ánh sáng khác với sóng điện từ khác là mắt người nhận biết được nó Mắt người nhậy cảm với sóng điện từ trong dải của bước sóng  trong khoảng từ 350nm đến 750nm Hình 2.11 trên biểu diễn các loại sóng điện từ theo bước sóng và dải nhìn thấy được Cảm nhận màu có được do 3 loại tế bào hình chóp trong võng mạc mắt người Mỗi

tế bào nhậy cảm với một dải phổ nhất định tương ứng với các màu đỏ,xanh lục và

xanh dương Nguồn sáng có thành phần phổ f() được biến đổi bởi bề mặt phản xạ

của vật thể Giả sử r() là hàm phản xạ này Khi đó số đo R được tạo bởi tế bào màu

Trang 36

Vậy mọi màu sắc tự nhiên đều được tổ hợp từ 3 màu cơ bản: đỏ R(red), xanh G(green)

và xanh dương B(blue) Người ta cũng đã quy định 3 màu cơ bản ứng với các bước sóng 700 nm(R), bước sóng 546,8 nm(G), và 435,8 nm (B)

Có 3 thuộc tính chủ yếu trong cảm nhận màu:

 Brightness còn gọi là độ chói

 Hue còn gọi là sắc thái

 Saturation là độ bão hòa màu

Mô hình không gian màu là phương pháp diễn giải các đặc tính và tác động của màu trong ngữ cảnh nhất định Song không có mô hình màu nào là đầy đủ cho mọi việc được ví dụ như không gian màu RGB ứng dụng cho màn hình, TV và không gian màu HSV dùng cho nhận nhức của con người ngoài ra còn có không gian màu CMYK dùng cho máy in [4]

Mô hình không gian màu RGB

Tổ chức quốc tế về chuẩn hoá màu CIE(Commision Internationale d'Eclairage) đưa

ra một số các chuẩn để biểu diễn màu Các hệ này có các chuẩn riêng, với chuẩn màu CIE-RGB (hệ toạ độ dùng 3 màu cơ bản)được sự kết hợp của 3 màu sắc cơ bản : màu

đỏ (R, Red), xanh lục (G, Green) và xanh lơ (B, Blue) để mô tả tất cả các màu sắc khác RGB là không gian màu rất phổ biến được dùng trong đồ họa máy tính và nhiều thiết bị kĩ thuật số khác Như đã nêu trên, một màu là tổ hợp của các màu cơ bản theo một tỉ lệ nào đấy Như vậy, một pixel ảnh màu kí hiệu Px được viết [2]:

Px =

red green blue

Ngày đăng: 31/10/2022, 17:17

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w