Việc ứng dụng xử lý ảnh trong việc phân loại chất lượng gạo cũng đã được nhiều nhiều nhóm thực hiện: Phân loại gạo theo màu sắc của Viện Máy và dụng cụ công nghiệp IMI; ứng dụng neural v
Trang 1TÓM TẮT ĐỀ TÀI
Đề tài này được xây dựng dựa trên mô hình máy phân loại chất lượng gạo trong thực tế nhằm làm hạ giá thành sản phẩm để có thể được sử dụng rộng rãi trên thị trường Nhóm thiết kế ra mô hình có khả năng phát hiện ra hạt gạo không đạt chất lượng nhờ vào hệ thống xử lý ảnh Hệ thống gồm camera, máy tính và đèn LED Camera sẽ chụp ảnh gạo cần kiểm tra rồi sau đó đưa vào máy tính dùng phần mềm Matlab để xử lý Việc xác định hạt gạo không đạt tiêu chuẩn sẽ dựa vào các tiêu chuẩn về hình dạng và màu sắc Kết quả thực nghiệm cho thấy hệ thống nhận dạng được sản phẩm lỗi khá cao Độ chính xác của giải thuật đạt 90%
Trang 2MỤC LỤC
NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP i
PHIẾU NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN ii
PHIẾU NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN iii
LỜI CÁM ƠN iv
TÓM TẮT ĐỀ TÀI v
MỤC LỤC vi
DANH MỤC CÁC TỪ VIẾT TẮT viii
DANH MỤC CÁC BẢNG BIỂU ix
DANH MỤC CÁC HÌNH x
Chương 1: TỔNG QUAN 1
1.1 Đặt vấn đề 1
1.1.1 Tính cấp thiết của đề tài 1
1.1.2 Tình hình nghiên cứu trong nước 2
1.1.3 Tình hình nghiên cứu ngoài nước 2
1.1.4 Giải pháp 4
1.2 Mục tiêu đề tài 4
1.3 Giới hạn đề tài 5
1.4 Nội dung đề tài 5
Chương 2: CƠ SỞ LÝ THUYẾT 6
2.1 Giới thiệu chung về xử lý ảnh 6
2.2 Các vấn đề trong quá trình xử lý ảnh 10
2.2.1 Các thiết bị thu nhận ảnh 10
2.2.2 Những khái niệm cơ sở về xử lý ảnh 13
2.2.3 Quá trình xử lý ảnh 14
2.2.4 Các phép toán hình thái Morphology 23
2.2.5 Không gian màu 28
2.2.6 Những định dạng của ảnh 37
Trang 3Chương 3: NHẬN DẠNG GẠO DỰA TRÊN HÌNH DẠNG VÀ MÀU SẮC 39
3.1 Quy trình xử lý ảnh 39
3.2 Phần mềm sử dụng 40
3.3 Phân loại theo diện tích và tỷ lệ 41
3.3.1 Chuyển đổi ảnh RGB sang ảnh mức xám 41
3.3.2 Lọc nhiễu 42
3.3.3 Tách biên 42
3.3.4 Loại nhỏ pixel nhỏ 43
3.3.5 Phân đoạn ảnh 44
3.4 Phân loại theo màu sắc 47
3.4.1 Chuyển ảnh từ hệ màu RGB sang hệ màu Lab 47
3.4.2 So sánh với ảnh mẫu 48
3.5 Kết quả 49
Chương 4: KẾT QUẢ THỰC NGHIỆM 50
4.1 Hình ảnh phần cứng mô hình 50
4.1.1 Khung mô hình 50
4.1.2 Thiết bị Camera 51
4.1.3 Thiết bị chiếu sáng 52
4.2 Kết quả thực nghiệm 52
Chương 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 59
5.1 Kết luận 59
5.1.1 Kết quả đạt được 59
5.1.2 Những mặt hạn chế 59
5.2 Hướng phát triển 60
TÀI LIỆU THAM KHẢO 61
PHỤ LỤC 62
Trang 4DSP: Digital Signal Processing/Processor
GIF: Graphics Interchange Format
HSI: Hue-Saturation-Intensity
HSV: Hue-Saturation-Value
IMI: Industial Machinery and Instruments
IMG: Image
JPEG: Joint Photographic Experts Group
NTSC: National Television System Committee
PAL: Phase Alternate Line
RGB: Red-Green-Blue
SECAM: Sequential Color with Memory
TV: Television
Trang 5DANH MỤC CÁC BẢNG BIỂU
Bảng 1.1: Thông số kỹ thuật máy phân loại gạo 3
Bảng 2.1: Bảng tiêu chuẩn quan sát 36
Bảng 4.1: Độ chính xác trong việc phát hiện gạo không đạt 58
Trang 6DANH MỤC CÁC HÌNH
Hình 1.1: Kim ngạch xuất khẩu gạo của Việt Nam trong giai đoạn 2010-2014 1
Hình 1.2: Máy phân loại gạo dòng sản phẩm S.PRECISION trong thực tế 3
Hình 2.1: Các bước cơ bản trong xử lý ảnh 7
Hình 2.2: Thiết bị CCD 12
Hình 2.3: Pixel trung tâm và 4 pixel lân cận (a) và 8 pixel lân cận (b) 13
Hình 2.4: Đường biên của ảnh 19
Hình 2.5: Đối tượng cần phình A và nhân tạo ảnh B 24
Hình 2.6: Minh họa quét các bi khắp A 24
Hình 2.7: Kết quả đạt được 24
Hình 2.8: Kết quả đạt được 25
Hình 2.9: Sử dụng phép mở 26
Hình 2.10: Phép đóng 27
Hình 2.11: Các loại sóng điện từ (trên) và dải ánh sáng được phóng to (dưới) 28
Hình 2.12: Ba màu cơ bản red, green, blue 30
Hình 2.13: Mô hình không gian màu RGB 30
Hình 2.14:Màu cơ bản trong hệ CMYK 31
Hình 2.15: Mô hình không gian màu HSV biểu diễn dưới dạng hình nón 32
Hình 2.16: Mô hình không gian màu HSV biểu diễn dưới dạng hình trụ 33
Hình 2.17: Mô hình không gian màu HSI 34
Hình 2.18: Mô hình không gian màu CIE- L*a*b* 35
Hình 2.19: Cấu trúc chung của định dạng ảnh 38
Hình 3.1: Sơ đồ khối thể hiện quy trình xử lý ảnh gạo 39
Hình 3.2: Phần mềm Matlab 40
Hình 3.3: Ảnh gạo RGB 41
Hình 3.4: Ảnh gạo chuyển mức xám 41
Hình 3.5: Ảnh đã được lọc nhiễu 42
Hình 3.6: Ảnh đã được tách biên 43
Hình 3.7: Ảnh loại bỏ những vùng nhỏ hơn 10 pixel 43
Trang 7Hình 3.8: Lắp đầy những vùng biên kín 44
Hình 3.9: Biên được làm dầy lên 44
Hình 3.10: Lắp đầy những vùng biên kín lần 2 45
Hình 3.11: Biên được làm mảnh trở lại 45
Hình 3.12: Các vùng ảnh gạo được đánh dấu 46
Hình 3.13: Những hạt gạo được đánh dấu không đạt yêu cầu theo diện tích và tỷ lệ 46
Hình 3.14: Ảnh màu RGB 47
Hình 3.15: Ảnh sau khi chuyển sang hệ màu Lab 47
Hình 3.16: Ảnh gạo mẫu RGB 48
Hình 3.17: Ảnh gạo mẫu chuyểnsang hệ màu Lab 48
Hình 3.18: Những hạt gạo được đánh dấu không đạt theo màu sắc 49
Hình 3.19: Những hạt gạo được đánh dấu không đạt về diện tích, tỷ lệ và màu 49
Hình 4.1: Khung mô hình phần cứng 50
Hình 4.2: Vị trí lắp đặt camera 51
Hình 4.3: Logitech B525 HD Webcam 51
Hình 4.4: Đèn LED dùng cho chiếu sáng 52
Hình 4.5: Ảnh 1 53
Hình 4.6: Ảnh 2 53
Hình 4.7: Ảnh 3 54
Hình 4.8: Ảnh 4 54
Hình 4.9: Ảnh 5 55
Hình 4.10: Ảnh 6 55
Hình 4.11: Ảnh 7 56
Hình 4.12: Ảnh 8 56
Hình 4.13: Ảnh 9 57
Hình 4.14: Ảnh 10 57
Trang 8Chương 1: TỔNG QUAN
1.1 Đặt vấn đề
1.1.1 Tính cấp thiết của đề tài
Lúa gạo là một trong những cây lương thực chính trên thế giới Đặc biệt tại Việt Nam đây là cây lương thực chính để tạo ra các sản phẩm thiết yếu để phục vụ đời sống con người.Ngành sản xuất lúa gạo có khả năng tạo nhiều việc làm cho người lao động, tăng danh thu, làm cơ sở phát triển cho các ngành khác, góp phần nâng cao mức sống
và ổn định an ninh lương thực từ đó góp phần ổn định tình hình chính trị của đất nước Với một nước nông nghiệp như Việt Nam hiện nay thì ngành sản xuất lúa gạo vẫn còn là ngành chủ lực trong phần trăm cơ cấu cây trồng và phân công lao động xã hội Việt Nam có thế mạnh trong việc sản xuất lúa gạo và là nước nhiều năm liền xuất khẩu gạo đứng thứ ba trên thế giới thu về nguồn ngoại tệ lớn Kim ngạch xuất khẩu gạo của Việt Nam trong giai đoạn 2010-2014 được thể hiện trong Hình 1.1 [1]
Hình 1.1: Kim ngạch xuất khẩu gạo của Việt Nam trong giai đoạn 2010-2014
Tuy nhiên, xuất khẩu gạo của Việt Nam vẫn còn gặp không ít khó khăn Hệ thống sản xuất gạo vẫn còn lạc hậu, sản xuất nhỏ lẻ dẫn đến chất lượng của hạt gạo Việt Nam còn thấp hơn so với các nước xuất khẩu lớn trong khu vực như: Thái Lan, Ấn Độ, Vì thế khả năng cạnh tranh của hạt gạo Việt Nam trên thế giới còn thấp Việt
Trang 9Nam chủ yếu xuất khẩu gạo qua các nước đang phát triển ở châu Á như: Trung Quốc, Philipines, Indonesia, một số nước ở châu Phi Đối với những thị trường khó tính như: Mỹ, EU, Nhật, thì việc xuất khẩu qua các nước này vẫn còn hạn chế do hạt gạo chưa đáp ứng được chất lượng mà các thị trường này đặt ra
1.1.2 Tình hình nghiên cứu trong nước
Kỹ thuật phân loại sử dụng các sensor quang đã bước đầu được thực hiện ở Việt Nam
từ đầu những năm 90 tại các trung tâm nghiên cứu lớn như Viện Máy và dụng cụ công nghiệp, Trường Đại học Bách khoa Hà Nội …Tuy nhiên, kỹ thuật và thiết bị phân loại chỉ có thể ứng dụng cho các đối tượng có màu sắc rõ ràng, di chuyển chậm theo tốc độ và mật độ hoàn toàn xác định trước Việc nghiên cứu kỹ thuật và thiết bị phân loại đối tượng có màu không rõ ràng di chuyển nhanh với mật độ lớn như các loại vật liệu rời và nông sản thực phẩm dạng hạt thì vẫn chưa được quan tâm đúng
mức [2]
Việc ứng dụng xử lý ảnh trong việc phân loại chất lượng gạo cũng đã được nhiều nhiều nhóm thực hiện: Phân loại gạo theo màu sắc của Viện Máy và dụng cụ công nghiệp (IMI); ứng dụng neural và xử lý ảnh trong nhận dạng và phân loại gạo trắng của nhóm tác giả Ths Nguyễn Xuân Vinh, Ths Lê Đình Lượng; nghiên cứu xử lý ảnh trong phân loại sản phẩm theo màu sắc của sinh viên Bùi Nhân Tiến, K6 Khoa Điện
tử, Trường ĐH Tôn Đức Thắng (TPHCM)
1.1.3 Tình hình nghiên cứu ngoài nước
Kỹ thuật phân loại vật liệu rời và thực phẩm dạng hạt được nghiên cứu ứng dụng trên thế giới từ những năm 70 Các thế hệ phân loại đầu tiên sử dụng sensor quang rời rạc (photodiodes) để nhận thông tin màu sắc, đồng thời xử lý các thông tin này bằng các thiết bị tương tự Nguyên tắc phân loại kiểu này tuy bước đầu đáp ứng yêu cầu thị trường phân loại sản phẩm nhưng bộc lộ nhiều nhược điểm: hệ thông phân loại cồng kềnh, năng suất phân loại thấp, sai số lớn, độ linh hoạt không cao, rất khó khăn khi thay đổi đối tượng phân loại
Trang 10Hình 1.2: Máy phân loại gạo dòng sản phẩm S.PRECISION trong thực tế
Bảng 1.1: Thông số kỹ thuật máy phân loại gạo
Lượng khí tiêu thụ (lít/phút)
2000-3500
CCD Camera Japan 2048 Pixel
Màn hình hiển thị Japan Điện áp (V/Hz) 220/50 Trọng lượng (kg) 1043 Kích thước (DxRxC) mm 2279x1640x2015 Cùng với sự phát triển của kỹ thuật quang, các thế hệ đo – thu nhận tín hiệu màu sắc ngày càng đạt độ chính xác cao, tích hợp ngày càng chặt chẽ, gọn nhẹ, trong đó đặc biệt đáng kể là thiết bị quét quang học dựa trên CCD ( Charge Coupled Devides) Các camera quang số kết hợp với kỹ thuật thu nhận – xử lý hình ảnh bằng máy tính đã mở
Trang 11ra bước ngoặt mới cho cho thiết bị phân loại sản phẩm: kết cấu máy hết sức gọn nhẹ,
độ chính xác cao, linh hoạt khi thay đổi đối tượng phân loại Nguyên tắc phân loại nhờ camera quang số đã được hầu hết các hãng lớn trên thế giới như Allen, Delta(Mỹ), Sortex (Anh), Satake (Nhật bản) … ứng dụng và phát triển cho đến ngày nay
Với thành tựu to lớn trong tất cả các thiết bị điều khiển liên quan đến thiết bị phân loại như kỹ thuật ánh sáng, kỹ thuật –thiết bị camera, kỹ thuật xử lý phân tích màu, thiết bị số, vi xử lý và máy tính, các thiết bị phân loại vật liệu rời dạng hạt ngày nay
đã đạt được tốc độ cao, đến hàng chục triệu sản phẩm mỗi giờ, đạt độ chính xác 0.2% và cho phép phân loại sản phẩm có kích thước nhỏ đến 1mm Với các tính năng trên, thiết bị phân loại đã được ứng dụng rộng rãi trong hầu hết lĩnh vực phân loại vật liệu rời như quặng, đá các loại, thủy tinh, nhựa tái chế … cũng như sản phẩm dạng hạt trong lĩnh vực chế biến nông sản thực phẩm như rau, đậu, các loại hoa quả, gạo,
0-cacao, cà phê …[2] Hình 1.2 là hình ảnh của một máy phân loại gạo trong thực tế
1.1.4 Giải pháp
Nghiên cứu một hệ thống phân loại chất lượng của gạo dùng xử lý ảnh Hệ thống gồm
có một camera thu nhận hình ảnh rồi đưa vào máy tính xử lý để phát hiện ra sản phẩm xấu sau đó dùng súng hơi loại bỏ sản phẩm xấu vừa mới phát hiện Hệ thống nhỏ gọn giá thành thấp nếu so với máy phân loại gạo trong thực tế của các hãng nước ngoài, khi đưa vào thực tế thì sẽ tiết kiệm được chi phí do giá thành của các máy phân loại gạo rất cao
Trang 121.3 Giới hạn đề tài
Đề tài chỉ mới dừng lại ở việc đánh giá chất lượng của hạt gạo theo chỉ tiêu về diện tích, kích thước và màu sắc chưa loại bỏ được hạt không đạt chất lượng Thời gian và tốc độ xử lý vẫn còn chậm nên chưa thể chạy đúng với thời gian thực
1.4 Nội dung đề tài
Phần còn lại của đề tài như sau:
Chương 2: Cơ sở lý thuyết
Chương này sẽ trình bày cơ bản lý thuyết về xử lý ảnh, các chỉ tiêu đánh giá trong việc phân loại chất lượng của hạt gạo
Chương 3: Nhận dạng gạo dựa trên hình dạng và màu sắc
Chương này sẽ trình bày các bước phân tích để có thể phân loại chất lượng của hạt gạo
Chương 4: Kết quả thực nghiệm
Nội dung chương này tổng hợp các kết quả sau khi thi công mô hình và kết quả đạt được trong việc phân loại gạo
Chương 5: Kết luận và hướng phát triển
Kết quả nhận được khi hoàn thành đề tài, đưa ra các phương án phát triển hoàn thiện
mô hình nhằm tiến tới tối ưu hệ thống trong tương lai
Trang 13Chương 2: CƠ SỞ LÝ THUYẾT
Trong chương này sẽ trình bày sơ lược các khái niệm cơ bản về xử lý ảnh, các quy trình đánh giá chất lượng của hạt gạo dùng xử lý ảnh Đồng thời cũng trình bày các chỉ tiêu đánh giá chất lượng của hạt gạo
2.1 Giới thiệu chung về xử lý ảnh
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ Nó là một ngành khoa học mới so với nhiều ngành khoa học khác Song tốc độ của nó phát triển rất nhanh, kích thích được nhiều các trung tâm nghiên cứu về nó với nhiều ứng dụng khác nhau
Xử lý ảnh có thể được áp dụng cho nhiều lĩnh vực khác nhau từ những lĩnh vực về dân sự đến những lĩnh vực an ninh quốc phòng Xử lý ảnh đang được ứng dụng rất nhiều như trong dự báo cháy rừng, dự báo lũ lụt, dự báo thời tiết, trong lĩnh vực an ninh như nhân dạng vân tay, nhận dạng khuôn mặt, nhận dạng tội phạm
Ngoài ra còn một ứng dụng của xử lý ảnh mà mấy năm trở lại đây được cho là rất quan trọng đó chính là ứng dụng xử lý ảnh trong việc phân biệt màu sắc, nó được áp dụng trong nhiều lĩnh vực khác nhau Đặc biệt bây giờ đang được áp dụng rất mạnh trong nông nghiệp, như ứng dụng xử lý ảnh cho việc phát hiện vật phẩm xấu Do vậy
xử lý ảnh đang được phát triện hết sức toàn diện trên mọi lĩnh vực
Các bước cần thiết trong xử lý ảnh, đầu tiên ảnh tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu (như Camera, máy chụp ảnh) Trước đây, ảnh thu qua Camera là các ảnh tương tự (loại Camera ống kiểu CCIR) Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng được lấy ra từ Camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh, có thể quét từ ảnh chụp bằng máy quét ảnh Hình 2.1 mô tả các bước cơ bản trong xử lý ảnh [3]
Trang 14Hình 2.1: Các bước cơ bản trong xử lý ảnh
Sơ đồ như Hình 2.1 bao gồm các thành phần sau:
Phần thu nhận ảnh (Image Acquisition)
Ảnh có thể nhận qua camera màu hoặc đen trắng Thường ảnh nhận qua camera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25 dòng), cũng
có loại camera đã số hoá (như loại CCD – Charge Coupled Device) là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh
Camera thường dùng là loại quét dòng ; ảnh tạo ra có dạng hai chiều Chất lượng một
ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh)
Tiền xử lý (Image Processing)
Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộ tiền xử lý
để nâng cao chất lượng Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn
Phân đoạn (Segmentation) hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng Đây là phần phức tạp
Trang 15khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này
Biểu diễn ảnh (Image Representation)
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lận cận Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác
Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)
Nhận dạng ảnh là quá trình xác định ảnh Quá trình thường thu được bằng cách so sánh với mẫu chuẩn đã được học hoặc lưu từ trước Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng Ví dụ: một loạt chữ số và nét ngang trên phong bì thư có thể được nội suy thành mã điện thoại Có nhiều cách phân loại ảnh khác nhau về ảnh Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phân loại nhận dạng
Cơ sở tri thức (Knowledge Base)
Như đã nói ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu Trong nhiều khâu
xử lý và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán học đảm bảo
Trang 16tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận và xử lý ảnh theo cách của con người Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con người Vì vậy, ở đây các cơ sở tri thức được phát huy
Mô tả (biểu diễn ảnh)
Từ Hình 2.1, ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp theo để phân tích Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng
bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ Thông thường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản là mã hoá) theo các đặc điểm của ảnh được gọi là các đặc trưng ảnh (Image Features) như: biên ảnh
(Boundary), vùng ảnh (Region) Một số phương pháp biểu diễn thường dùng:
Biểu diễn bằng mã chạy (Run-LengthCode)
Biểu diễn bằng mã xích (Chaine-Code)
Biểu diễn bằng mã tứ phân (Quad-Tree Code)
Biểu diễn bằng mã chạy
Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị phân Một vùng ảnh R có thể mã hóa đơn giản nhờ một ma trận nhị phân:
U(m, n) = 1 nếu (m, n) thuộc R
U(m, n) = 0 nếu (m, n) không thuộc R
Trong đó: U(m, n) là hàm mô tả mức xám ảnh tại tọa độ (m, n) Với cách biểu diễn trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1 Giả sử chúng ta
mô tả ảnh nhị phân của một vùng ảnh được thể hiện theo toạ độ (x, y) theo các chiều
và đặc tả chỉ đối với giá trị “1” khi đó dạng mô tả có thể là: (x, y)r; trong đó (x, y) là toạ độ, r là số lượng các bit có giá trị“1” liên tục theo chiều ngang hoặc dọc
Biểu diễn bằng mã xích
Phương pháp này thường dùng để biểu diễn đường biên ảnh Một đường bất kỳ được chia thành các đoạn nhỏ Nối các điểm chia, ta có các đoạn thẳng kế tiếp được gán hướng cho đoạn thẳng đó tạo thành một dây xích gồm các đoạn Các hướng có thể chọn 4, 8, 12, 24,…mỗi hướng được mã hoá theo số thập phân hoặc số nhị phân thành
mã của hướng
Trang 17Biểu diễn bằng mã tứ phân
Phương pháp mã tứ phân được dùng để mã hoá cho vùng ảnh Vùng ảnh đầu tiên được chia làm bốn phần thường là bằng nhau Nếu mỗi vùng đã đồng nhất (chứa toàn điểm đen (1) hay trắng (0)), thì gán cho vùng đó một mã và không chia tiếp Các vùng không đồng nhất được chia tiếp làm bốn phần theo thủ tục trên cho đến khi tất cả các vùng đều đồng nhất Các mã phân chia thành các vùng con tạo thành một cây phân chia các vùng đồng nhất
Camera
Đối với một hệ thống xử lý ảnh thu nhận qua camera-camera như là con mắt của hệ thống Có 2 loại camera: camera ống loại CCIR và camera CCD Loại camera ứng với chuẩn CCIR với tần số 1/25 và mỗi ảnh gồm 25 dòng Loại CCD gồm các photo điốt và làm tương ứng một cường độ sáng tại một điểm ảnh ứng với một phần tử ảnh (pixel) Như vậy, ảnh là tập hợp các điểm ảnh Số pixel tạo nên một ảnh gọi là độ phân giải (resolution)
Có nhiều kiểu thiết bị tạo ảnh, từ mắt động vật đến những ống kính camera ghi hình
và radio Chúng có thể có hoặc không trang bị thấu kính Mô hình buồng tối camera đầu tiên được phát minh vào thế kỷ 16 không có các thấu kính, nhưng thay vào đó là một lỗ (pinhole) để hội tụ các tia sáng lên trên tường hoặc tấm mờ Các lỗ dần dần được thay thế bởi các thấu kính càng ngày càng phức tạp
Nói chung camera thường có hai bộ phận cơ bản một là hệ thống tạo ảnh và hai là bề mặt tạo ảnh có chứa chất nhạy cảm quang Bề mặt tạo ảnh của một camera thông
Trang 18thường là hình chữ nhật, nhưng các camera toàn cảnh có thể trang bị mặt tạo ảnh hình trụ để tăng trường nhìn Những phần tử nhạy tạo ảnh có những đặc trưng khác nhau Chúng có thể ghi nhận một ảnh rời rạc hoặc một ảnh liên tục về mặt không gian Hệ thống tạo ảnh có thể là lỗ hoặc là hệ thấu kính trong các camera hiện đại [2]
Cảm biến ảnh CCD (Charge Couple Device)
Như chúng ta biết Niepce phát minh ra kỹ thuật chụp ảnh từ đầu thế kỷ 19, nhưng Daguerre mới là người giới thiệu nó với công chúng Sau hai lần cùng cộng tác trong năm 1826, Daguerre tiếp tục phát triển phương pháp chụp ảnh của riêng mình sử dụng hơi thuỷ ngân để khuếch đại và để lộ ra ảnh được tạo trên miếng đồng mạ bạc được bôi iốt Phép chụp ảnh Daguerre ngay lập tức thành công khi Arago biểu diễn phương pháp Daguerre ở viện hàn lâm khoa học Pháp năm 1839 Những cột mốc khác trong lịch sử lâu dài của phương pháp chụp ảnh bao gồm phương pháp tấm ướt âm/dương của Legray và Archer năm 1850, phương pháp gelatin (chất lỏng trong suốt không có
vị để chế tạo phim ảnh) của Maddox năm 1870, Eastman giới thiệu phim chụp ảnh năm 1889, và phát minh kỹ thuật điện ảnh (cinema) của Lumiere năm 1895 và chụp ảnh màu năm 1908
Các camera CCD (Charge Couple Device) được đề xuất năm 1970 và đã thay thế các camera vidicon trong hầu hết các ứng dụng hiện đại Cảm biến CCD sử dụng một lưới hình chữ nhật của các điểm (site) thu thập điện tử phủ trên một đế silic mỏng để ghi lại năng lượng ánh sáng đến mỗi điểm trong chúng (hình 2.2) Mỗi một điểm được tạo thành bằng cách cấy một lớp SiO2 trên đế và sau đó lắng đọng một cấu trúc cổng dẫn lên trên Khi photon đập vào silic, thì cặp điện tử lỗ trống được tạo ra (chuyển đổi quang) và điện tử bị bắt giữ bằng giếng điện thế được tạo thành bởi tác động của một điện thế dương ở cổng tương ứng Các điện tử được tạo ra ở mỗi điểm được tập hợp qua một chu kỳ thời gian T cố định
Trang 19Hình 2.2: Thiết bị CCD
Các điện tích được lưu trữ ở những điểm riêng biệt sẽ được di chuyển sử dụng cách mắc tích nạp điện (charge coupling): Các gói điện tích được truyền từ điểm này đến điểm kia bằng cách vận chuyển các điện thế cổng và bảo tồn các gói riêng biệt ảnh được đọc ra khỏi CCD một hàng một lần, mỗi hàng được truyền song song tới một thanh ghi lối ra nối tiếp Giữa hai lần đọc hàng, thanh ghi truyền một ô điện tích của
nó một lần (hình 2.1) tới một bộ khuếch đại lối ra tạo ra một tín hiệu tỷ lệ với điện tích nó nhận được Quá trình này tiếp tục cho tới khi toàn bộ ảnh đã được đọc ra Nó
có thể được lặp lại 30 lần trong một giây (tốc độ TV) cho các ứng dụng ghi hình hoặc
ở tốc độ thấp hơn nhiều, bỏ đi nhiều thời gian (giây, phút, thậm chí hàng giờ) để thu thập điện tử trong các ứng dụng mức sáng thấp như thiên văn học Lưu ý rằng lối ra
số của hầu hết các CCD camera được chuyển đổi bên trong thành một tín hiệu ghi hình tương tự trước khi được chuyển tới một bộ bắt hình (frame grabber) ở đó tạo dựng ảnh số cuối cùng
Các CCD camera màu cấp độ dân dụng thực chất sử dụng các chip giống như các camera đen trắng, chỉ khác là các hàng hoặc các cột liên tiếp của cảm biến được tạo
ra nhạy cảm với ánh sáng đỏ, lục hoặc lam thường sử dụng một bộ lọc phủ để bù ánh sáng Các mẫu lọc khác có thể thực hiện được bao gồm các khối khảm (mosaic) 22 được tạo bởi các bộ cảm nhận hai lục, một đỏ và một lam (mẫu Bayer) Độ phân giải không gian của camera một CCD tất nhiên là có giới hạn, các camera chất lượng cao hơn sử dụng một bộ chia chùm tia để chuyển ảnh tới 3 CCD khác nhau thông qua các
Trang 20bộ lọc màu Các kênh màu riêng biệt sau đó được số hoá hoặc là riêng biệt (lối ra RGB) hoặc kết hợp thành tín hiệu ghi hình màu hỗn hợp (NTSC, SECAM hoặc PAL) hoặc thành định dạng ghi hình thành phần tách rời thông tin màu và độ chiếu sáng [2]
2.2.2 Những khái niệm cơ sở về xử lý ảnh [2].
Điểm ảnh (Picture Element)
Hình 2.3: Pixel trung tâm và 4 pixel lân cận (a) và 8 pixel lân cận (b)
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng Để xử lý bằng máy tính (số), ảnh cần phải được số hoá Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám) Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel.Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y) Trong thị giác máy tính, thường coi một pixel cần khảo sát
ở trung tâm có hình chữ nhật thì có 4 pixel hoặc 8 pixel lân cận như mô tả trên hình 2.3 Thường biểu diễn trực tiếp các số đo mức xám của các pixel như hình 2.3c
Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu
nhất định Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh
số gần như ảnh thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh
Độ phân giải của ảnh
Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị
Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách thích hợp tạo nên một
Trang 21mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y trong không
gian hai chiều
Mức xám của ảnh
Một điểm ảnh (pixel) có hai đặc trưng cơ bản là vị trí (x, y) của điểm ảnh và độ xám
của nó Dưới đây chúng ta xem xét một số khái niệm và thuật ngữ thường dùng trong
Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác) với mức xám ở các điểm ảnh có thể khác nhau
Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô tả 21 mức khác nhau Nói cách khác: mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1
Ảnh màu: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu: 28*3=224≈16,7 triệu màu
2.2.3 Quá trình xử lý ảnh
Trong phạm vi đề tài này ảnh sau khi thu nhận được sẽ được xử lý thay đổi mức xám ảnh, chuyển từ ảnh màu gạo gốc sang ảnh gạo theo mức xám, tiếp theo ảnh được dò tách biên, lấp lỗ trống, làm dày biên để tách đối tượng ra khỏi ảnh Sau đó ảnh được lọc bỏ các nhiễu và các điểm ảnh lỗi Sau cùng ảnh được phân đoạn thành các vùng
có cùng tính chất nào đó dựa theo biên hay các vùng liên thông Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng độ nhám [4]
Trang 22Chuyển đổi mức xám ảnh
Theo tiêu chuẩn của hệ thống màu NTSC, một ảnh bậc độ xám của một ảnh màu có được bằng cách tính mỗi pixel tương ứng của ảnh bậc độ xám theo công thức [4]:
𝑌 = 𝑌𝑅+ 𝑌𝐺+ 𝑌𝐵 = 𝛼 𝑅𝑑+ 𝛽 𝐺𝑑+ 𝛿 𝐵𝑑 (2.1) Trong đó:
Y là giá trị bậc độ xám của pixel ảnh các bậc độ xám (nhiều khi còn gọi là ảnh đen trắng)
Rd, Gd, Bd là giá trị của các pixels màu cơ bản R, G, B
𝛼 = 0.29890 𝛽 = 0.58662 𝛿 = 0.11448
Lọc nhiễu
Ảnh thu nhận được thường sẽ bị nhiễu nên cần phải loại bỏ nhiễu Các toán tử không gian dùng trong kỹ thuật tăng cường ảnh được phân nhóm theo công dụng: làm trơn nhiễu, nổi biên Để làm trơn nhiễu hay tách nhiễu, người ta sử dụng các bộ lọc tuyến tính (lọc trung bình, thông thấp) hoặc lọc phi tuyến (trung vị, giả trung vị, lọc đồng hình) Từ bản chất của nhiễu (thường tương ứng với tần số cao) và từ cơ sở lý thuyết lọc là: bộ lọc chỉ cho tín hiệu có tần số nào đó thông qua , để lọc nhiễu người ta thường dùng lọc thông thấp (theo quan điểm tần số không gian) hay lấy tổ hợp tuyến tính để san bằng (lọc trung bình) Để làm nổi cạnh (ứng với tần số cao), người ta dùng các bộ lọc thông cao, lọc Laplace Người ta thường xem xét 3 loại nhiễu chính: nhiễu cộng, nhiễu nhân và nhiễu xung [3]
+ Nhiễu cộng:Nhiễu cộng thường phân bố khắp ảnh Nếu gọi ảnh quan sát (ảnh thu được) là Xqs, ảnh gốc là Xgốc, nhiễu là η, ảnh thu được có thể biểu diễn bởi:
Trang 23Làm trơn nhiễu bằng lọc tuyến tính: lọc trung bình và lọc dải thông thấp
[3]
Do có nhiều loại nhiễu can thiệp vào quá trình xử lý ảnh nên cần có nhiều bộ lọc thích hợp Với nhiễu cộng và nhiễu nhân ta dùng các bộ lọc thông thấp, trung bình và lọc đồng hình (Homomorphie); với nhiễu xung ta dùng lọc trung vị, giả trung vị, lọc ngoài (Outlier)
Lọc trung bình không gian Với lọc trung bình, mỗi điểm ảnh được thay thế bằng trung bình trọng số của các điểm lân cận và được định nghĩa như sau:
𝑁𝑤 với 𝑁𝑤 là số điểm ảnh trong cửa sổ lọc W
Lọc trung bình có trọng số chính là thực hiện chập ảnh đầu vào với nhân chập H Nhân chập H trong trường hợp này có dạng:
Trang 24𝐻𝑏 = 1(𝑏 + 2)2[1𝑏 𝑏𝑏2 1𝑏
]
Ta dễ dàng nhận thấy khi b =1, Hb chính là nhân chập Ht1 (lọc trung bình) Để hiểu
rõ hơn bản chất khử nhiễu cộng của các bộ lọc này, ta viết lại phương trình thu nhận ảnh dưới dạng:
𝑌(𝑚, 𝑛) =𝑁1
𝑤∑ ∑ 𝑋𝑞𝑠(𝑚 − 𝑘, 𝑛 − 𝑙) + 𝜎𝑛2
𝑁𝑤(𝑘,𝑙)𝜖𝑊 (2.8)
Như vậy, nhiễu cộng trong ảnh đã giảm đi Nw lần
Lọc đồng hình (Homomorphie Filter)
Kỹ thuật lọc này hiệu quả với ảnh có nhiễu nhân Thực tế, ảnh quan sát được gồm
ảnh gốc nhân với một hệ số nhiễu Gọi X(m, n) là ảnh thu được, X(m, n) là ảnh gốc
và η(m, n) là nhiễu, như vậy:
𝑋(𝑚, 𝑛) = 𝑋̅(𝑚, 𝑛) ∗ 𝜂(𝑚, 𝑛) (2.9) Lọc đồng hình thực hiện lấy logarit của ảnh quan sát Do vậy ta có kết quả sau: log (𝑋(𝑚, 𝑛)) = log (𝑋̅(𝑚, 𝑛)) ∗ log (𝜂(𝑚, 𝑛)) (2.10)
Rõ ràng, nhiễu nhân có trong ảnh sẽ bị giảm Sau quá trình lọc tuyến tính, ta chuyển
về ảnh cũ bằng phép biến đổi hàm e mũ
Làm trơn nhiễu bằng lọc phi tuyến [3]
Các bộ lọc phi tuyến cũng hay được dùng trong kỹ thuật tăng cường ảnh Trong kỹ thuật này, người ta dùng bộ lọc trung vị, giả trung vị, lọc ngoài Với lọc trung vị, điểm ảnh đầu vào sẽ được thay thế bởi trung vị các điểm ảnh còn lọc giả trung vị sẽ dùng trung bình cộng của hai giá trị “trung vị” (trung bình cộng của max và min)
Trang 25+ Lọc trung vị là loại lọc phi tuyến Điều này dẽ nhận thấy từ:
Trungvi(x(m)+y(m)) ≠ Trungvi(x(m)) + Trungvi(y(m))
+ Có lợi cho việc loại bỏ các điểm ảnh hay các hàng mà vẫn bảo toàn độ phân giải
+ Hiệu quả giảm khi số điểm trong cửa sổ lớn hay bằng một nửa số điểm trong cửa sổ Điều này dễ giải thích vì trung vị là (Nw+1)/2 giá trị lớn nhất nếu Nw lẻ Lọc
trung vị cho trường hợp 2 chiều coi như lọc trung vị tách được theo từng chiều
Lọc ngoài (Outlier Filter)
Giả thiết có ngưỡng nào đó cho các mức nhiễu (có thể dựa vào lược đồ xám) Tiến hành so sánh giá trị độ xám của một điểm ảnh với trung bình số học 8 lân cận của nó Nếu sai lệch lớn hơn ngưỡng, điểm ảnh này được coi như nhiễu Trong trường hợp đó,thay thế giá trị của điểm ảnh bằng giá trị trung bình 8 lân cận vừa tính được Bộ lọc ngoài có thể diễn tả bằng công thức sau:
𝑌(𝑚, 𝑛) = {𝑢(𝑚, 𝑛)𝛼(𝑤) ( 2.12)
với : α(w) là trung bình cộng các điểm trong lân cận w
Các cửa sổ tính toán thường chọn là 3x3 Tuy nhiên, cửa sổ có thể mở rộng đến 5x5 hay 7x7 để đảm bảo tính tương quan giữa các điểm ảnh Vấn đề quan trọng là xác định ngưỡng để loại nhiễu mà vẫn không làm mất thông tin của ảnh
Trang 26Phương pháp phát hiện biên [3] [4]
Hình 2.4: Đường biên của ảnh
Biên là một vấn đề chủ yếu trong phân tích ảnh vì các kỹ thuật phân đoạn ảnh chủ yếu dựa vào biên
Điểm Biên: Một điểm ảnh được coi là điểm biên nếu có sự thay đổi nhanh hoặc đột
ngột về mức xám (hoặc màu) Ví dụ trong ảnh nhị phân, điểm đen gọi là điểm biên nếu lân cận nó có ít nhất một điểm trắng
Đường biên (đường bao: boundary): tập hợp các điểm biên liên tiếp tạo thành một
đường biên hay đường bao
Ý nghĩa của đường biên trong xử lý: ý nghĩa đầu tiên của đường biên là một loại đặc
trưng cục bộ tiêu biểu trong phân tích, nhận dạng ảnh Thứ hai, người ta sử dụng biên làm phân cách các vùng xám (màu) cách biệt Ngược lại, người ta cũng sử dụng các vùng ảnh để tìm đường phân cách
Tầm quan trọng của biên: để thấy rõ tầm quan trọng của biên, xét ví dụ sau: khi người
họa sỹ muốn vẽ một danh nhân, họa sỹ chỉ cần vẽ vài đường nứt tốc họa mà không cần vẽ một cách đầy đủ
Mô hình biểu diễn đường biên: theo toán học điểm ảnh có sự biến đổi mức xám u(x)
một cách đột ngột theo Hình 2.4
Như vậy, phát hiện biên một cách lý tưởng là phát hiện được tất cả các đường biên trong các đối tượng Định nghĩa toán học của biên ở trên là cơ sở cho các kỹ thuật phát hiện biên Điều quan trọng là sự biến thiên giữa các điểm ảnh thường nhỏ, trong khi đó biến thiên độ sáng của điểm biên thường là khá lớn khi qua biên Xuất phát cơ
sở này người ta thường sử dụng hai phương pháp phát hiện biên như sau:
Trang 27+ Phương pháp phát hiện biên trực tiếp: phương pháp này chủ yếu dựa vào
sự biến thiên về giá trị độ sáng của điểm ảnh để làm nổi biên bằng kỹ thuật đạo hàm
Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp gradient; nếu lấy đạo hàm bậc
hai ta có kỹ thuật Laplace Hai phương pháp này được gọi chung là phương pháp dò
biên cục bộ Ngoài ra, người ta còn sử dụng phương pháp “đi theo đường bao” dựa
vào công cụ toán học là nguyên lý quy hoạch động và được gọi là phương pháp dò
biên tổng thể Phương pháp dò biên trực tiếp có hiệu quả và ít bị tác động của nhiễu
+ Phương pháp phát hiện biên gián tiếp: Nếu bằng cách nào đấy, chúng ta thu
được các vùng ảnh khác nhau thì đường phân cách giữa các vùng đó chính là biên
Nói cách khác, việc xác định đường bao của ảnh được thực hiện từ ảnh đã được phân
vùng Phương pháp dò biên gián tiếp khó cài đặt nhưng áp dụng tốt khi sự biến thiên
độ sáng nhỏ
Phương pháp gradient:
Gradient là một vec tơ f(x, y) có các thành phần biểu thị tốc độ thay đổi mức
xám của điểm ảnh (theo hai hướng x, y trong bối cảnh xử lý ảnh hai chiều) tức:
𝜕𝑓(𝑥,𝑦)
𝜕𝑥 = 𝑓𝑥, ≈ 𝑓(𝑥+𝑑𝑥,𝑦)−𝑓(𝑥,𝑦)𝑑𝑥 (2.13) 𝜕𝑓(𝑥,𝑦)
𝜕𝑦 = 𝑓𝑦, ≈ 𝑓(𝑥,𝑦+𝑑𝑦)−𝑓(𝑥,𝑦)𝑑𝑦 (2.14)
Trong đó dx, dy là khoảng cách giữa 2 điểm kế cận theo hướng x, y tương ứng (thực
tế chọn dx= dy=1) Đây là phương pháp dựa theo đạo hàm riêng bậc nhất theo hướng
Trang 28độ g(m,n) tại điểm (m,n) được tính:
𝐴0 = 𝑔(𝑚, 𝑛) = √𝑔12(𝑚, 𝑛) + 𝑔22(𝑚, 𝑛) (2.17)
𝜃𝑟(𝑚, 𝑛) = 𝑎𝑟𝑡𝑔(𝑔2(𝑚, 𝑛)/𝑔1(𝑚, 𝑛)) (2.18)
Để giảm độ phức tạp tính toán, A0 được tính gần đúng như sau:
𝐴0 = |𝑔1(𝑚, 𝑛)| + |𝑔2(𝑚, 𝑛)| (2.19) Các toán tử đạo hàm được áp dụng khá nhiều Ở đây ta chỉ nêu lên một số toán tử tiêu biểu: Robert, Sobel, Prewit
Toán tử Robert
Trước tiên chúng ta xét toán tử Robert Toán tử này do Robert đề xuất năm 1965 Nó
áp dụng trực tiếp của công thức đạo hàm tại điểm (x,y) Với mỗi điểm ảnh I[x,y] của ảnh I, đạo hàm theo x, theo y được ký hiệu tương ứng g1, g2 được tính:
{𝑔𝑥 = 𝐼[𝑥 + 1, 𝑦] − 𝐼[𝑥, 𝑦]
𝑔𝑦 = 𝐼[𝑥, 𝑦 + 1] − 𝐼[𝑥, 𝑦] ( 2.20) Điều này tương ứng với việc nhân chập ảnh với hai mặt nạ H1, H2 các mặt nạ này gọi
Trang 29Hướng ngang (x) Hướng dọc (y)
Thực tế cho thấy rằng, các toán tử Sobel và Prewitt tốt hơn toán tử Robert, bởi chúng
ít nhạy cảm với nhiễu Ta cũng thấy rằng việc lấy đạo hàm một tính hiệu có xu hướng làm tăng nhiễu trong tín hiệu đó Độ nhạy cảm này có thể làm giảm xuống nhờ các thao tác lấy trung bình cục bộ trong miền phủ bởi mặt nạ Lưu ý rằng, toán tử Sobel
và Prewitt dễ dàng chuyển đổi cho nhau bằng cách thay đổi hệ số
Phân đoạn ảnh [4]
Phân đoạn ảnh là bước then chốt trong xử lý ảnh Giai đoạn này nhằm phân tích ảnh thành các vùng có cùng tính chất nào đó dựa theo biên hay các vùng liên thông Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng
độ nhám
Quá trình phân đoạn ảnh nhằm tách đối tượng cần khảo sát ra khỏi phần nội dung còn lại của ảnh, hay phân chia các đối tượng trong ảnh thành những đối tượng riêng biệt Như vậy quá trình phân đoạn ảnh là quá trình giảm bớt số lượng thông tin trong ảnh
và chỉ giữ lại những thông tin cần thiết cho ứng dụng Do đó phân đoạn ảnh là quá trình loại bỏ các đối tượng không quan tâm trong ảnh
Có nhiều phương pháp phân đoạn ảnh khác nhau Trong đó quá trình phân đoạn ảnh
sử dụng một ngưỡng giá trị xám để phân đoạn ảnh ra thành các đối tượng và nền là phương pháp đơn giản nhất Lúc này các điểm ở bên dưới ngưỡng giá trị xám thuộc
về nền còn những điểm ảnh ở bên trên ngưỡng giá trị xám thuộc về đối tượng Phương pháp phân đoạn ảnh này hiệu quả lớn đối với ảnh nhị phân, văn bản in hay đồ họa
Trang 30Dựa vào đặc tính vật lý của vùng ảnh, các kỹ thuật phân đoạn vùng có thể được chia làm 3 loại:
Các kỹ thuật cục bộ: dựa trên các đặc tính cục bộ của các điểm ảnh và các lân
cận của nó
Các kỹ thuật tổng thể: phân đoạn một ảnh dựa trên cơ sở của thông tin lấy từ
tổng thể như sử dụng biểu đồ mức xám histogram
Các kỹ thuật chia, nối và phát triển: dựa trên các khái niệm tương đồng về
hình dạng và tính đồng nhất Hai vùng có thể được nối lại với nhau và liền kề bên nhau Các vùng không đồng nhất có thể được chia thành các vùng nhỏ Một vùng có thể được phát triển bằng các nối các điểm ảnh sao cho nó đồng nhất với nhau
2.2.4 Các phép toán hình thái Morphology [5] [6]
Khái niệm Morphology trong xử lý ảnh số khởi nguồn từ một ngành của sinh học, nghiên cứu về hình thể và cấu trúc của động thực vật Đây là một công cụ giúp rút trích các thành phần trong ảnh nhị phân, biễu diễn và mô tả chúng dưới dạng các vùng hoặc dạng như các đường biên, xương và bao lồi Kỹ thuật morphology cũng được
áp dụng trên ảnh xám cho các công đoạn tiền/hậu xử lý ảnh (pre or post processing) Các phép toán đầu tiên trong Morphology được phát triển vào những năm 1964 bởi Georges Matheron (1930 - 2000) và Jean Serra (1940) tại trường đại học École des Mines de Paris, Pháp Matheron là tiến sĩ hướng dẫn của Jean, họ cố gắng xác định
số lượng đặc tính của khoáng sản thông qua “thin cross section” và công việc cho ra kết quả là một phương pháp tiếp cận mới, cũng như sự tiến bộ trong hình học tích phân và tô pô Từ đó đến hết năm 1970, Morphology xử lý cơ bản với các ảnh nhị phân, tạo ra các phép toán và kĩ thuật như: Dilation, Erosion, Opening, Closing…
Phép dãn (Dilation)
Phép toán Dilation là thao tác dãn nở/phình to các đối tượng ảnh đơn sắc Gọi A là ảnh góc , B là phần tử cấu trúc là hai tập hợp con trong ℤ2, thực hiện phép toán
Trang 31đi khắp A và tìm những điểm nào mà B∩ A ≠ ∅ thì ta có thể hiểu như A⊕B=⋃𝑏𝑖∈𝐵𝐴𝑏𝑖 với 𝐴𝑏𝑖 là những khu vực mà A ∪ Bi thỏa A ∩ Bi ≠ ∅ Có thể xem hình minh họa: Hình 2.5, Hình 2.6, Hình 2.7
Trang 32Hình 2.8: Kết quả đạt được
hơn (ở đây ta vẫn quan niệm rằng đối tượng ảnh là những điểm ảnh đen ) Trong trường hợp đơn giản nhất, một phép co nhị phân sẽ tách lớp điểm ảnh bao quanh đối tượng ảnh Dễ hiểu hơn, ta tưởng tượng rằng một ảnh nhị phân có những điểm ảnh đen (đối tượng ảnh ) và điểm ảnh trắng (nền) Từ ảnh ban đầu, ta thay các điểm đen
mà lân cận của nó có ít nhất một điểm trắng thành trắng Khi đó ảnh nhận được là ảnh được co bằng phép co đơn giản Trong phép co này, mẫu được dùng chính là mảng 3 x 3 của các điểm ảnh đen, đã được nói đến trong phép dãn nhị phân trước đây Goi A là ảnh gốc, B là phần tử cấu trúc là hai tập hợp con trong ℤ2, thực hiện phéo toán Erosion trong A theo B ký hiệu A⊖B và được định nghĩa như sau: A⊝B={p | 𝐵𝑝 ⊆ 𝐴}.
Nói cách khác đó là tập hợp các điểm p thuộc A, mà nếu cấu trúc B dịch chuyển theo các tọa độ của p, thì B vẫn nằm trong đối tượng ảnh A tức B là một tập con của đối tượng cần co ảnh A Tuy nhiên điều đó sẽ chưa chắc chắn đã đúng nếu như phần tử cấu trúc B không chứa gốc (tức điểm ảnh gốc màu trắng)
Để minh họa cách thức phép toán hoạt động có thể xem Hình 2.8 với A và B tương
tự như ví dụ ở phép toán Dilation
Trang 33Hình 2.9 cũng minh họa một đối tượng khác, hoàn toàn tương tự, sử dụng phép mở ảnh và nhiễu ở giữa số 3 đã biến mất Bước co trong phép mở ảnh sẽ xóa những điểm ảnh cô lập được coi như những biên, phép dãn ảnh tiếp sau sẽ khôi phục lại các điểm biên và loại nhiễu
Phép đóng (Closing)
Tương tự phép mở nhưng trong phép đóng ảnh, thao tác dãn ảnh được thực hiện trước, sau đó mới tới thao tác co ảnh và cùng làm việc trên cùng một phần tử cấu trúc, nếu gọi I là ảnh, D là Dilation (dãn) và E là Erosion(co)
Close(I)=E(D(I))
Trang 34Hình 2.10: Phép đóng
a Kết quả đóng của hình 2.d sử dụng cấu trúc đơn giản
b Ảnh của một bảng mạch được phân ngưỡng và có các vết nứt
c Ảnh tương tự sau khi đóng những nét dứt đã được nối liền
Nếu như phép mở ảnh tạo ra những khoảng trống nhỏ trong điểm ảnh thì trái lại, phép đóng ảnh sẽ lấp đầy những chỗ hổng đó Hình 2.10a trình bày một thao tác đóng ảnh
áp dụng cho Hình 2.9d, mà nhớ rằng đó là kết quả của việc xóa nhiễu Phép đóng ảnh
có tác dụng trong việc xóa những nhiễu trắng trong đối tượng ảnh mà phép mở ảnh chưa làm được
Hình 2.10b và 2.10c trình bày một ứng dụng của phép co ảnh nhằm nối lại những nét gãy Ảnh ban đầu Hình 2.10b là một bản mạch, sau khi sử dụng phép co các điểm gãy đã được liên kết nhau ở một số điểm ảnh Phép đóng ảnh này đã gắn được nhiều điểm ảnh gãy, nhưng không phải là tất cả Điều quan trọng nhận thấy rằng khi sử dụng những ảnh thực, thật hiếm khi xử lý ảnh một cách hoàn chỉnh mà chỉ cần một
kĩ thuật phải sử dụng nhiều phẩn tử cấu trúc mà có khi những kĩ thuật nằm ngoài hình thái học
Đóng ảnh cũng có thể được sử dụng để làm trơn những đường viền của những đối tượng trong ảnh Thỉnh thoảng việc phân ngưỡng có thể đưa ra một sự xuất hiện những điểm nhám trên viền
Trang 352.2.5 Không gian màu
Hình 2.11: Các loại sóng điện từ (trên) và dải ánh sáng được phóng to (dưới)
Mọi vật mà chúng ta quan sát được là nhờ ánh sáng Bề mặt của các vật đó là sáng hay tối có hai nguyên nhân chính: năng xuất phản xạ của nó và số lượng ánh sáng mà chúng ta nhận được từ nguồn Có hai loại nguồn sáng Loại thứ nhất tự nó phát ra ánh sáng gọi là nguồn sơ cấp (mặt trời, đèn điện ) Loại thứ hai là chỉ phản xạ hay khuyếch tán ánh sáng mà nó nhận được từ các nguồn sáng khác nhau gọi là nguồn sáng thứ cấp (như mặt trăng, đồ vật )
Ánh sáng khác với sóng điện từ khác là mắt người nhận biết được nó Mắt người nhậy cảm với sóng điện từ trong dải của bước sóng trong khoảng từ 350nm đến 750nm Hình 2.11 trên biểu diễn các loại sóng điện từ theo bước sóng và dải nhìn thấy được Cảm nhận màu có được do 3 loại tế bào hình chóp trong võng mạc mắt người Mỗi
tế bào nhậy cảm với một dải phổ nhất định tương ứng với các màu đỏ,xanh lục và
xanh dương Nguồn sáng có thành phần phổ f() được biến đổi bởi bề mặt phản xạ
của vật thể Giả sử r() là hàm phản xạ này Khi đó số đo R được tạo bởi tế bào màu
Trang 36Vậy mọi màu sắc tự nhiên đều được tổ hợp từ 3 màu cơ bản: đỏ R(red), xanh G(green)
và xanh dương B(blue) Người ta cũng đã quy định 3 màu cơ bản ứng với các bước sóng 700 nm(R), bước sóng 546,8 nm(G), và 435,8 nm (B)
Có 3 thuộc tính chủ yếu trong cảm nhận màu:
Brightness còn gọi là độ chói
Hue còn gọi là sắc thái
Saturation là độ bão hòa màu
Mô hình không gian màu là phương pháp diễn giải các đặc tính và tác động của màu trong ngữ cảnh nhất định Song không có mô hình màu nào là đầy đủ cho mọi việc được ví dụ như không gian màu RGB ứng dụng cho màn hình, TV và không gian màu HSV dùng cho nhận nhức của con người ngoài ra còn có không gian màu CMYK dùng cho máy in [4]
Mô hình không gian màu RGB
Tổ chức quốc tế về chuẩn hoá màu CIE(Commision Internationale d'Eclairage) đưa
ra một số các chuẩn để biểu diễn màu Các hệ này có các chuẩn riêng, với chuẩn màu CIE-RGB (hệ toạ độ dùng 3 màu cơ bản)được sự kết hợp của 3 màu sắc cơ bản : màu
đỏ (R, Red), xanh lục (G, Green) và xanh lơ (B, Blue) để mô tả tất cả các màu sắc khác RGB là không gian màu rất phổ biến được dùng trong đồ họa máy tính và nhiều thiết bị kĩ thuật số khác Như đã nêu trên, một màu là tổ hợp của các màu cơ bản theo một tỉ lệ nào đấy Như vậy, một pixel ảnh màu kí hiệu Px được viết [2]:
Px =
red green blue