Trong một số lượng lớn các ứng dụng về xử lý ảnh và hiển thị trên máy tính, phân vùng ảnh đóng vai trò chính yếu như là bước đầu tiên trước khi áp dụng các thao tác xử lý ảnh mức cao hơn
Trang 1TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2 KHOA CÔNG NGHỆ THÔNG TIN
TRẦN QUỐC HÀ
XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG PHÂN VÙNG ẢNH DỰA TRÊN SỰ PHÂN CHIA
VÀ KẾT HỢP CÁC MIỀN KỀ
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Khoa học máy tính
HÀ NỘI – 2015
Trang 2TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2 KHOA CÔNG NGHỆ THÔNG TIN
TRẦN QUỐC HÀ
XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG PHÂN VÙNG ẢNH DỰA TRÊN SỰ PHÂN CHIA
VÀ KẾT HỢP CÁC MIỀN KỀ
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Khoa học máy tính
Người hướng dẫn khoa học
TS LƯU THỊ BÍCH HƯƠNG
HÀ NỘI – 2015
Trang 3LỜI CẢM ƠN
Em xin chân thành cảm ơn cô giáo TS Lưu Thị Bích Hương, người đã
hướng dẫn tận tình chỉ bảo em rất nhiều trong suốt quá trình tìm hiểu nghiên
cứu và hoàn thành khóa luận tốt nghiệp
Em cũng rất cảm ơn các thầy, cô giáo trong khoa Công nghệ Thông tin
trường Đại học sư phạm Hà Nội 2 đã tận tình giảng dạy, truyền đạt những
kiến thức quý báu và tạo điều kiện cho em hoàn thành khóa luận
Xin chân thành cảm ơn sự giúp đỡ, động viên của tất cả các bạn trong
quá trình thực hiện khóa luận
Em cũng muốn cảm ơn những người thân trong gia đình đã động viên,
giúp đỡ và tạo điều kiện để em hoàn thành khóa luận
Là sinh viên lần đầu nghiên cứu khoa học chắc chắn khóa luận của em
không tránh khỏi những thiếu sót, vì vậy em rất mong sự đóng góp ý kiến của
các thầy, cô giáo và các bạn để đề tài của em được hoàn thiện Một lần nữa
em xin chân thành cảm ơn công lao dạy dỗ chỉ bảo của thầy, cô giáo Kính
chúc quý thầy, cô giáo mạnh khỏe và tiếp tục đạt được nhiều thắng lợi trong
nghiên cứu khoa học và sự nghiệp trồng người
Em xin chân thành cảm ơn!
Hà Nội, tháng 05 năm 2015 Sinh viên thực hiện
Trần Quốc Hà
Trang 4LỜI CAM ĐOAN
Tên em là: TRẦN QUỐC HÀ
Sinh viên lớp : K37 – CNTT, khoa Công nghệ Thông tin , trường Đại học sư
phạm Hà Nội 2
Em xin cam đoan:
1 Đề tài: “Xây dựng chương trình mô phỏng phân vùng ảnh dựa trên sự
phân chia và kết hợp các miền kề” là nghiên cứu của riêng em , dưới sự
hướng dẫn của cô giáo TS Lưu Thị Bích Hương
2 Khóa luận hoàn toàn không sao chép của tác giả nào khác
Nếu sai em xin hoàn toàn chịu trách nhiệm
Hà Nội, tháng 05 năm 2015 Sinh viên
Trần Quốc Hà
Trang 5DANH MỤC HÌNH
Hình 1.1: Quá trình xử lý ảnh 7
Hình 1.2: Các bước cơ bản trong quá trình xử lý ảnh 7
Hình 1.3: Ví dụ về nắn chỉnh hình biến dạng 12
Hình 2.1: Chọn ngưỡng các đường ngang dọc 19
Hình 2.2: Phân vùng ảnh tượng đài Washington 20
Hình 2.3: Lược đồ hình rắn lượn và cách chọn ngưỡng 21
Hình 2.4: Xác định ngưỡng dựa trên thuật toán tam giác 21
Hình 2.5: Quá trình tính toán Pred(R) 27
Hình 2.6: Cây tứ phân của ảnh R 28
Hình 2.7: 4 liên thông và 8 liên thông 29
Hình 2.8: Làm mảnh ảnh 31
Hình 2.9: Loại bỏ đường bao hở 33
Hình 2.10: Khép kín nhờ ngoại suy 33
Hình 2.11: Loại bỏ các chân rết làm rõ biên 33
Hình 3.1: Form giao diện chính của chương trình 36
Hình 3.2: Form kết quả nhận được từ chức năng thay đổi mức xám 36
Hình 3.3: Form kết quả nhận được từ chức năng phân vùng ảnh 37
Hình 3.4: Form kết quả nhận được từ chức năng xem ảnh gốc 37
Trang 6MỤC LỤC
MỞ ĐẦU…… 1
CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH 5
1.1 Xử lý ảnh và các vấn đề cơ bản trong xử lý ảnh 5
1.1.1 Xử lý ảnh là gì 5
1.1.2 Các vấn đề cơ bản trong xử lý ảnh 7
1.1.2.1 Một số khái niệm cơ bản 7
1.1.2.2 Độ phân giải của ảnh 8
1.1.2.3 Mức xám của ảnh 9
1.1.2.4 Nắn chỉnh biến dạng 11
1.1.2.5 Khử nhiễu 12
1.1.2.6 Chỉnh mức xám 12
1.1.2.7 Trích chọn đặc điểm 12
2.1.2.8 Nén ảnh…… 13
1.1.2.9 Một số thuộc tính cần quan tâm của ảnh số 14
1.2 Khái quát về phân vùng ảnh 14
1.2.1 Một số khái niệm 14
1.2.2 Các hướng tiếp cận phân vùng ảnh 16
1.2.3 Các công đoạn chính của phân vùng ảnh 16
1.3 Một số thuộc tính của điểm ảnh và phân vùng ảnh 17
1.3.1 Một số thuộc tính của điểm ảnh 17
1.3.2 Một số thuộc tính của vùng ảnh 17
CHƯƠNG 2: MỘT SỐ PHƯƠNG PHÁP PHÂN VÙNG ẢNH 18
2.1 Phân vùng ảnh dựa trên phương pháp phân lớp 18
2.1.1 Khái quát về phương pháp phân lớp 18
2.1.2 Phân lớp các điểm ảnh trong không gian thuộc tính một chiều 18
2.2 Phân vùng ảnh dựa trên sự phân chia miền kề 23
2.2.1 Phương pháp tách cây tứ phân 23
2.2.2 Phương pháp cục bộ 28
2.2.3 Phương pháp tổng hợp 29
2.3 Phân vùng ảnh dựa theo đường biên 30
Trang 72.3.1 Làm mảnh biên 30
2.3.2 Nhị phân hoá đường biên 32
2.3.3 Miêu tả đường biên 32
CHƯƠNG 3: XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG 35
3.1 Phát biểu bài toán 35
3.2 Thiết kế chương trình 36
3.2.1 Giao diện của chương trình 36
3.2.2 Một số kết quả của chương trình 36
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 38
TÀI LIỆU THAM KHẢO 40
Trang 8MỞ ĐẦU
1 Mục đích, lý do chọn đề tài
Trong những năm gần đây, cùng với sự phát triển vượt bậc của khoa học máy tính, thì xử lý ảnh là một lĩnh vực đang được quan tâm Nó là một ngành khoa học còn tương đối mới mẻ so với nhiều ngành khoa học khác, nhưng hiện nay nó đang là một trong những lĩnh vực phát triển rất nhanh và thu hút
sự quan tâm đặc biệt từ các nhà khoa học, thúc đẩy các trung tâm nghiên cứu, ứng dụng về lĩnh vực hấp dẫn này Xử lý ảnh là ngành khoa học nghiên cứu các quá trình xử lý thông tin dạng hình ảnh, mà hình ảnh là một dạng thông tin vô cùng phong phú, đa dạng và là phương tiện giao tiếp, trao đổi chủ yếu của con người Thông tin hình ảnh ngày nay có thể được xử lý dễ dàng bằng máy tính Mục tiêu của xử lý ảnh là:
- Xử lý ảnh ban đầu để có được ảnh mới theo một yêu cầu xác định (ví dụ như ảnh mờ cần xử lý để được ảnh rõ hơn)
- Phân tích ảnh để thu được các thông tin đặc trưng giúp cho việc phân loại, nhận biết ảnh (ví dụ phân tích ảnh vân tay để trích chọn các đặc trưng vân tay)
- Hiểu ảnh đầu vào để có những mô tả về ảnh ở mức cao hơn, sâu hơn (ví dụ
từ ảnh một tai nạn giao thông phác họa hiện trường tai nạn)
Qua đó, có thể thấy xử lý ảnh đóng vai trò quan trọng như thế nào trong các ứng dụng thực tế về khoa học kĩ thuật cũng như trong cuộc sống thường ngày Những ứng dụng này dường như là vô hạn cùng với sự khám phá của con người và sự phát triển như vũ bão của công nghệ số hóa, chẳng hạn, trong các lĩnh vực như: Sản xuất và kiểm tra chất lượng, sự di chuyển của Robot, các phương tiện đi lại, công cụ hướng dẫn cho người mù, an ninh và giám sát, nhận dạng đối tượng, nhận dạng mặt, các ứng dụng trong y học, sản xuất, hiệu chỉnh Video, chinh phục vũ trụ…
Để xử lý được một bức ảnh thì phải trải qua nhiều khâu khác nhau tùy theo
Trang 9mục đích của việc xử lý, nhưng khâu quan trọng và khó khăn nhất đó là phân vùng ảnh Trong một số lượng lớn các ứng dụng về xử lý ảnh và hiển thị trên máy tính, phân vùng ảnh đóng vai trò chính yếu như là bước đầu tiên trước khi áp dụng các thao tác xử lý ảnh mức cao hơn như: Nhận dạng, giải thích ngữ nghĩa, và biểu diễn ảnh Nếu bước phân vùng ảnh không tốt thì dẫn đến việc nhận diện sai lầm về các đối tượng có trong ảnh
Phân vùng ảnh đã và đang là một trong những vấn đề nhận được nhiều
sự quan tâm trong lĩnh vực xử lý ảnh Trong khoảng 30 năm trở lại đây đã có rất nhiều các thuật toán được đề xuất để giải bài toán này Trong thời gian gần đây, việc tìm ra các thuật toán nắm bắt được các thuộc tính toàn cục của bức ảnh đã trở thành một xu hướng phổ biến
Xuất phát trong hoàn cảnh đó em đã lựa chọn đề tài: “Xây dựng
chương trình mô phỏng phân vùng ảnh dựa trên sự phân chia và kết hợp các miền kề ” để làm khóa luận tốt nghiệp
2 Nhiệm vụ
- Tìm hiểu cơ bản về xử lý ảnh
- Tìm hiểu phương pháp phân vùng ảnh dựa trên phương pháp phân lớp
- Tìm hiểu phương pháp phân vùng ảnh dựa trên sự phân chia và kết hợp
các miền kề
- Tìm hiểu phương pháp phân vùng ảnh dựa theo đường biên
- Xây dựng ứng dụng phân vùng ảnh dựa trên sự phân chia và kết hợp các
miền kề trên ngôn ngữ Visual C#
3 Đối tượng và phạm vi nghiên cứu
a Đối tượng nghiên cứu
Trang 104 Phương pháp nghiên cứu
a Phương pháp nghiên cứu lý luận
Nghiên cứu qua việc đọc sách, báo và các tài liệu liên quan nhằm xây dựng cơ sở lý thuyết của đề tài và các biện pháp cần thiết để giải quyết các vấn đề của đề tài
b Phương pháp nghiên cứu chuyên gia
Tham khảo ý kiến của các chuyên gia để có thể thiết kế chương trình phù hợp với yêu cầu thực tiễn, nội dung xử lý nhanh đáp ứng được yêu cầu ngày càng cao của người sử dụng
c Phương pháp nghiên cứu thực nghiệm
Thông qua quan sát thực tế, yêu cầu của cơ sở, những lý luận được nghiên cứu và kết quả đạt được qua những phương pháp trên
5 Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài
Ý nghĩa khoa học:
Phân vùng ảnh là một trong những tính tất yếu quyết định đến chất lượng của hình ảnh Mục tiêu của phân vùng ảnh là để đơn giản hóa hoặc thay đổi biểu diễn của một tấm ảnh để dễ dàng phân tích Phân vùng ảnh thường được sử dụng để xác định vị trí các đối tượng, đường biên (đường thẳng, cong.vv) Phương pháp phân vùng ảnh dựa trên sự phân chia và kết hợp miền
kề đã giúp cho việc phân vùng ảnh trở lên nhanh chóng, rút ngắn thời gian thực hiện và cho kết quả chính xác
Ý nghĩa thực tiễn:
Việc xây dựng chương trình mô phỏng phân vùng ảnh dựa trên sự phân chia và kết hợp miền kề có ý nghĩa thực tiễn trong nhiều lĩnh vực khác nhau như lĩnh vực hình ảnh y tế(medical imaging), phát hiện và nhận dạng đối tượng, hệ thống camera giám sát, hệ thống điều khiển giao thông… Kỹ thuật này là bước tiền xử lý quan trọng trong hầu hết các hệ thống xử lý ảnh, kết hợp phân vùng tốt sẽ giúp cho quá trình xử lý về sau đạt hiệu quả cao hơn
Trang 11nhằm tiết kiệm về chi phí tính toán, thời gian cũng như tăng độ chính xác của các ứng dụng trên.
6 Cấu trúc của khóa luận
Ngoài phần mở đầu, kết luận và tài liệu tham khảo, nội dung chính của khoá luận gồm 3 chương cụ thể như sau:
Chương 1: Tổng quan về xử lý ảnh
Chương 2: Một số phương pháp phân vùng ảnh
Chương 3: Xây dựng chương trình mô phỏng
Trang 12Trong các dạng truyền thông cơ bản: Lời nói, văn bản, hình ảnh, âm thanh thì hình ảnh là dạng truyền thông truyền tải thông tin mạnh mẽ nhất Bằng thị giác, con người có thể nhận biết và hiểu về thế giới xung quanh chúng ta
Ví dụ: Những hình ảnh về trái đất, những hình ảnh trong dự báo thời tiết
Có tới 99% lượng thông tin đã biết về thế giới xung quanh được nhận biết thông qua thị giác (Nguồn: Chương 1 - Nhập môn xử lý ảnh - Lương Mạnh Bá, Nguyễn Thanh Thuỷ (1999), NXB Khoa học kỹ thuật)
Việc trang bị cho máy tính có khả năng thị giác như con người không phải là việc dễ dàng Chúng ta đang sống trong một không gian 3D, khi máy tính cố gắng phân tích đối tượng trong không gian 3D thì những bộ cảm biến
có sẵn như camera, lại thường cho ảnh 2D Như vậy, việc mất mát thông tin của hình ảnh sẽ xảy ra Với những cảnh động thì sự di chuyển của đối tượng hay sự di chuyển của camera, tất cả những việc đó làm cho việc mất mát và sai lệch thông tin rất lớn
Trang 13Ngày nay cùng với sự phát triển của ngành CNTT, chúng ta mong muốn đưa được những hình ảnh mà con người có thể nhìn thấy được vào máy tính để thực hiện các mục đích khác nhau của con người như: Phân tích ảnh, phục hồi ảnh, phân vùng ảnh, nâng cao chất lượng ảnh Với mục đích làm cho ảnh sắc nét hơn hoặc làm cho ảnh gần giống nhất với trạng thái gốc, trạng thái trước khi ảnh bị biến dạng Để máy tính có thể hiểu và phân tích ảnh thì ảnh cần được mã hoá và biểu diễn dưới dạng số gọi là ảnh số Ngày nay một số máy ảnh số sử dụng tăng cường khả năng zoom (phóng to, thu nhỏ) kỹ thuật
Việc hiểu ảnh, phân tích ảnh và thị giác máy nhằm mục đích nhân bản hiệu quả của thị lực con người, giúp nhận biết tốt hơn về thế giới xung quanh
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai trò quan trọng nhất trong việc thu nhận thông tin Những năm trở lại đây với sự phát triển nhanh của phần cứng máy tính, xử lý ảnh và đồ hoạ đang phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tương tác người máy Quá
Trang 14trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận
Hình 1.1: Quá trình xử lý ảnh Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong không gian và nó có thể xem như một hàm n biến P(c1, c2, , cn) Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều
Sơ đồ tổng quát của một hệ thống xử lý ảnh:
1.1.2 Các vấn đề cơ bản trong xử lý ảnh
1.1.2.1 Một số khái niệm cơ bản
Ảnh trong thực tế (ảnh tự nhiên) là một ảnh liên tục về không gian và
về giá trị độ sáng Để có thể xử lý ảnh bằng máy tính, cần thiết phải tiến hành
số hoá ảnh nhằm biến đổi gần đúng một ảnh liên tục thành một tập điểm, phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám) Trong quá trình
số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hoá về không gian), và lượng hoá thành phần giá trị mà
Kết luận Ảnh “Tốt hơn”
Hình 1.2: Các bước cơ bản trong một hệ thống xử lý ảnh
Đối sách rút ra kết luận
Hậu xử
lý
Hệ quyết định
Lưu trữ
Trang 15về nguyên tắc bằng mắt thường không phân biệt được hai điểm kề nhau Trong quá trình này người ta sử dụng khái niệm điểm ảnh (pixel) Như vậy một ảnh là một tập hợp các điểm ảnh Khi sử dụng đến phân vùng ảnh thì việc phân biệt hai điểm ảnh kề nhau là việc cần thiết
Điểm ảnh (pixel) được xem như là dấu hiệu hay cường độ sáng tại một toạ độ trong không gian của đối tượng Mỗi pixel gồm một cặp toạ độ x, y và màu
Như vậy, một ảnh là một tập hợp các điểm ảnh Khi được số hoá, nó thường được biểu diễn bởi mảng hai chiều hay ma trận hai chiều I(n,p): mỗi phần tử có một giá trị nguyên hoặc là một véc tơ cấu trúc màu, n dòng và p cột Ta nói ảnh gồm n x p pixels Người ta thường kí hiệu I(x,y) để chỉ một pixel Thường giá trị của n chọn bằng p và bằng 256 Một pixel có thể lưu trữ trên 1, 4, 8 hay 24 bit Mỗi điểm ảnh khi mã hoá sẽ được biểu diễn dưới dạng
8 bít Cách mã hoá kinh điển thường dùng 16, 32 hay 64 mức Mã hoá 256 mức là phổ dụng nhất do lý do kỹ thuật Vì 28
= 256 (0, 1, , 255), nên với
256 mức, mỗi pixel sẽ được mã hoá bởi 8 bit và từ đó có thể biểu diễn ảnh dưới nhiều dạng khác nhau Số pixel tạo nên một ảnh gọi là độ phân giải (resolution)
1.1.2.2 Độ phân giải của ảnh
Độ phân giải là mật độ điểm ảnh được ấn định trên một ảnh số Khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bố chính là độ phân giải, và được phân bố theo trục x, y trong không gian hai chiều
Ví dụ: Với màn CGA (320 x 200) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc x 200 điểm ảnh So sánh màn hình CGA 12 (Color Graphic Adaptor) thì thấy ảnh mịn hơn màn hình CGA 17 Như vậy diện tích càng rộng thì độ mịn của ảnh càng kém đi, cũng như khi phóng to một ảnh cũng vậy, ảnh càng to thì càng bị vỡ hạt, độ mịn càng kém
Trang 161.1.2.3 Mức xám của ảnh
Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị
số tại điểm đó Trong biểu diễn số của các ảnh đa mức xám, một ảnh được biểu diễn dưới dạng một ma trận hai chiều Mỗi phần tử của ma trận biểu diễn cho mức xám hay cường độ của ảnh tại vị trí đó Mỗi phần tử trong ma trận được gọi là một phần tử ảnh hoặc điểm ảnh (pixel) Một điểm ảnh có hai đặc trưng cơ bản là vị trí (x,y) của điểm ảnh và độ xám
a Các thang giá trị mức xám thông thường
Thông thường có các thang mức xám như: 16, 32, 64, 128, 256 (với lý
do kỹ thuật máy tính dùng 1 byte (8 bít) để biểu diễn mức xám thì có thể biểu diễn: 28
= 256 mức (0, 1, …, 255) thì mức 256 là mức phổ dụng
- Mức xám ở ảnh đen trắng: Ảnh đen trắng là ảnh chỉ có hai màu đen trắng, mức xám ở các điểm ảnh có thể khác nhau Nếu dùng 8 bit (1 byte) để biểu diễn mức xám, thì số các mức xám có thể biểu diễn được là 28
hay 256 Mỗi mức xám được biểu diễn dưới dạng là một số nguyên nằm trong khoảng từ 0 đến 255, với mức 0 biểu diễn cho mức cường độ đen nhất và 255 biểu diễn cho mức cường độ sáng nhất
- Mức xám ở ảnh nhị phân: Ảnh chỉ có hai mức đen, trắng phân biệt, tức dùng
1 bit mô tả 21 mức khác nhau Nói cách khác mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1
- Mức xám ở ảnh màu: Ảnh màu được tạo nên từ ba màu cơ bản (Red, Blue, Green), người ta dùng 3 byte để mô tả mức màu, khi đó giá trị màu: 28*3 = 224
= 16,7 triệu màu
Với ảnh màu: Cách biểu diễn cũng tương tự như với ảnh đen trắng, chỉ khác là các số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm:
đỏ (red), lục (green) và lam (blue) Để biểu diễn cho một điểm ảnh màu cần
24 bit, 24 bit này được chia thành ba khoảng 8 bit Mỗi khoảng này biểu diễn cho cường độ sáng của một trong các màu chính
Trang 17b Các kiểu ảnh
b1 Ảnh chỉ số (Index Images)
Một ảnh chỉ số bao gồm một ma trận dữ liệu X và ma trận bản đồ màu (map) Ma trận dữ liệu có thể có kiểu thuộc lớp uint8, uint16 hoặc kiểu double Ma trận bản đồ màu là một mảng m x 3 kiểu double bao gồm các giá trị dấu phẩy động nằm giữa 0 và 1 Mỗi hàng của bản đồ chỉ ra các giá trị mà: red, green và blue của một màu đơn Một ảnh chỉ số sử dụng ánh xạ trực tiếp giữa giá trị của pixel ảnh tới giá trị trong bản đồ màu Màu sắc của mỗi pixel ảnh được tính toán bằng cách sử dụng giá trị tương ứng của X ánh xạ tới một giá trị chỉ số của bản đồ màu Giá trị 1 chỉ ra hàng đầu tiên, giá trị 2 chỉ ra hàng thứ hai trong bản đồ màu
Một bản đồ màu thường được chứa cùng với ảnh chỉ số và được tự động nạp cùng với ảnh Tuy nhiên, không bị giới hạn khi sử dụng bản đồ màu mặc định, ta có thể sử dụng bất kì bản đồ màu nào Các pixel trong ảnh được đại diện bởi một số nguyên ánh xạ tới một giá trị tương ứng trong bản đồ màu
b2 Ảnh cường độ (Intensity Images)
Một ảnh cường độ là một ma trận dữ liệu ảnh I mà giá trị của nó đại diện cho cường độ trong một số vùng nào đó của ảnh Ma trận có thể thuộc lớp double, uint8 hay uint16 Trong khi ảnh cường độ hiếm khi được lưu với bản đồ màu Những phần tử trong ma trận cường độ đại diện cho các cường
độ khác nhau hoặc độ xám
b3.Ảnh nhị phân (Binary Images)
Trong một ảnh nhị phân, mỗi pixel chỉ có thể chứa một trong hai giá trị nhị phân 0 hoặc 1 Hai giá trị này tương ứng với bật hoặc tắt (on hoặc off) Một ảnh nhị phân được lưu trữ như một mảng logic của 0 và 1
b4 Ảnh RGB (RGB Images)
Một ảnh RGB được lưu trữ dưới dạng một mảng dữ liệu có kích thước
3 chiều m x n x 3, định nghĩa các giá trị màu red, green và blue cho mỗi pixel
Trang 18riêng biệt Ảnh RGB không sử dụng bảng màu Màu của mỗi pixel được quyết định bởi sự kết hợp giữa các giá trị R, G, B (Red, Green, Blue) được lưu trữ trong một mặt phẳng màu tại vị trí của pixel Định dạng file đồ hoạ lưu trữ ảnh RGB giống như một ảnh 24 bít trong đó R, G, B chiếm tương ứng
8 bít 1 Điều này cho phép nhận được 16,7 triệu màu khác nhau
Một mảng RGB có thể thuộc lớp double, uint8 hoặc uint16 Trong một mảng RGB thuộc lớp double, mỗi thành phần màu có giá trị giữa 0 và 1 Một pixel mà thành phần màu của nó là (0,0,0) được hiển thị với màu đen và một pixel mà thành phần màu là (1,1,1) được hiển thị với màu trắng
Trong một ảnh RGB khoảng trắng tương ứng với giá trị cao nhất của mỗi màu riêng rẽ Chẳng hạn trong ảnh mặt phẳng R, vùng trắng đại diện cho
sự tập trung cao nhất của màu đỏ thuần khiết Nếu R được trộn với G hoặc B
ta sẽ có màu xám Vùng màu đen trong ảnh chỉ ra giá trị của pixel mà không chứa màu đỏ R = 0 Tương tự cho các mặt phẳng màu G và B
1.1.2.4 Nắn chỉnh biến dạng
Nắn chỉnh biến dạng là việc biến đổi hình học giữa hai ảnh: Ảnh nguồn và ảnh đích Sự biến đổi hình học được định nghĩa về mối quan hệ giữa các điểm ảnh nguồn và điểm ảnh đích
Thuật toán nắn chỉnh ảnh có hai khuynh hướng: Tác động toàn cục hoặc tác động cục bộ Tác động toàn cục là ta áp dụng thuật toán, tiêu chí như nhau đối với mọi điểm ảnh trên toàn bộ ảnh Còn tác động cục bộ thì ta chỉ tác động trên các điểm ảnh ở một số vùng của ảnh, còn các vùng khác của ảnh
ta giữ nguyên.Các thuật toán nắn chỉnh toàn cục có tốc độ xử lý tương đối nhanh nhưng chỉ áp dụng được với các yêu cầu đơn giản như co, giãn ảnh, bóp méo cả ảnh thành tứ giác hay một số hiệu ứng khác như mắt cá, kính núp,
Thuật toán nắn chỉnh cục bộ cho kết quả ấn tượng hơn Tuy nhiên để nắn chỉnh từng vùng, ta phải xác định thêm tập đặc trưng Trong trường hợp này việc xây dựng thuật toán tương đối phức tạp
Trang 19
Hình 1.3: Ví dụ về nắn chỉnh hình biến dạng Nắn chỉnh biến dạng là một khâu trong xử lý ảnh Với mỗi ảnh tùy theo mức độ, hiện trạng, và chủng loại ảnh mà người ta sử dụng ứng dụng nào cho phù hợp nhất trong xử lý ảnh 1.1.2.5 Khử nhiễu Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh: - Nhiễu hệ thống: Là nhiễu có quy luật có thể khử bằng các phép biến đổi - Nhiễu ngẫu nhiên: Vết bẩn không rõ nguyên nhân và có thể khắc phục bằng các phép lọc 1.1.2.6 Chỉnh mức xám Nhằm khắc phục tính không đồng đều của hệ thống gây ra Thông thường có 2 hướng tiếp cận: - Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau thành một bó Trường hợp chỉ có 2 mức xám thì chính là chuyển về ảnh đen trắng Ứng dụng: In ảnh màu ra máy in đen trắng - Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ thuật nội suy Kỹ thuật này nhằm tăng cường độ mịn cho ảnh 1.1.2.7 Trích chọn đặc điểm
𝑃𝑖′
b) Ảnh qua xử lý
𝑃𝑖
a) Ảnh gốc
Trang 20Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá trình xử lý ảnh Có thể nêu ra một số đặc điểm của ảnh sau
đây:
- Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm uốn
- Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực
hiện lọc vùng (zonal filtering) Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật,
tam giác, cung tròn)
- Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và
do vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng Các đặc điểm này có thể được trích chọn nhờ toán tử gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo không”
(zero crossing)
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống
1.1.2.8 Nén ảnh
Nhằm giảm thiểu không gian lưu trữ Thường được tiến hành theo cả hai cách khuynh hướng là nén có bảo toàn và không bảo toàn thông tin Nén không bảo toàn thì thường có khả năng nén cao hơn nhưng khả năng phục hồi thì kém hơn Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén ảnh:
- Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần suất xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF
- Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh để tiến hành mã hóa Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong các vùng gần nhau Ví dụ cho kỹ thuật này là mã nén *.PCX
Trang 21- Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không bảo toàn và do vậy, kỹ thuật thường nén hiệu quả hơn *.JPG chính
là tiếp cận theo kỹ thuật nén này
- Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện
sự lặp lại của các chi tiết Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal
1.1.2.9 Một số thuộc tính cần quan tâm của ảnh số
- Đường viền (Border): Đường viền của một vùng ảnh R là tập hợp các điểm ảnh trong vùng đó mà có một hay nhiều lân cận bên ngoài vùng R
- Biên ảnh (Edge): Một điểm ảnh có thể coi là biên nếu ở đó có sự thay đổi đột ngột về mức xám Tập hợp các điểm biên tạo thành đường bao của ảnh.Thuộc tính biên gắn liền một điểm ảnh và lân cận của nó, đôi khi nó giúp cho việc xác định đặc tính giữa một cặp điểm lân cận
Ví dụ: Trong một ảnh nhị phân, một điểm có thể gọi là biên nếu đó là điểm đen và có ít nhất một điểm trắng lân cận
- Độ sắc nét của ảnh: Độ sắc nét là khả năng phát hiện những chi tiết trong ảnh Mắt người ít nhạy cảm với sự thay đổi nhanh hay chậm của độ sáng trong mặt phẳng ảnh nhưng nhạy cảm với sự thay đổi trung gian
Độ phân giải trong ảnh được giới hạn bởi khả năng phân giải ở mắt người Khi độ phân giải của ảnh cao hơn độ phân giải của mắt người thì con người không thể cảm nhận về ảnh được nữa
Độ phân giải trong quang học được định nghĩa là khoảng cách giữa hai điểm ảnh gần nhất mà con người không thể phân biệt được
Mỗi một ảnh đều có độ sắc nét, độ phân giải riêng, việc xử lý ảnh nhằm mục đích làm cho ảnh sắc nét hơn, đẹp hơn hay gần với ảnh gốc hơn, và khi biến đổi bằng một trong các phương pháp phân vùng ảnh làm cho ảnh có khả năng hiển thị tốt, và để xác định vị trí các đối tượng, đường biên (đường thẳng, cong.vv)
1.2 Khái quát về phân vùng ảnh
Trang 221.2.1 Một số khái niệm
Phân vùng ảnh là bước then chốt trong xử lý ảnh Giai đoạn này nhằm phân tích ảnh thành những thành phần có cùng tính chất nào đó dựa theo biên hay các vùng liên thông Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng độ nhám…
Trước hết cần làm rõ khái niệm "vùng ảnh" (Segment) và đặc điểm vật
lý của vùng Vùng ảnh là một chi tiết, một thực thể trông toàn cảnh Nó là một tập hợp các điểm có cùng hoặc gần cùng một tính chất nào đó: mức xám, mức màu, độ nhám… Vùng ảnh là một trong hai thuộc tính của ảnh Nói đến vùng ảnh là nói đến tính chất bề mặt Đường bao quanh một vùng ảnh (Boundary) là biên ảnh Các điểm trong một vùng ảnh có độ biến thiên giá trị mức xám tương đối đồng đều hay tính kết cấu tương đồng Dựa vào đặc tính vật lý của ảnh, người ta có nhiều kỹ thuật phân vùng: Phân vùng dựa theo miền liên thông gọi là phân vùng dựa theo miền đồng nhất hay miền kề, phân vùng dựa vào biên gọi là phân vùng biên Ngoài ra còn có các kỹ thuật phân vùng khác dựa vào biên độ, phân vùng dựa theo kết cấu…
Phân vùng ảnh (Image Segmentation): Là quá trình phân hoạch tập các điểm ảnh của R thành các tập con Ri (hay một vùng ảnh) thỏa mãn các điều kiện sau:
(a)
1
n i i
Trang 23- Điều kiện (b) R là một vùng liên thông
- Điều kiện (c) để đảm bảo các vùng phải rời nhau
- Điều kiện (d) để đảm bảo các điểm ảnh trong vùng phải thoả mãn một tính chất P nào đó
- Điều kiện (e) để đảm bảo hai vùng khác nhau về tính chất P được định nghĩa trước
Dựa vào đặc tính của vùng ảnh, có nhiều kỹ thuật phân vùng khác nhau Tuy nhiên, kỹ thuật phân vùng ảnh có thể được chia thành ba phương pháp cơ bản sau đây:
- Phân vùng ảnh dựa trên phương pháp phân lớp
- Phân vùng ảnh dựa trên sự phân chia miền kề
- Phân vùng ảnh dựa theo đường biên
1.2.2 Các hướng tiếp cận phân vùng ảnh
Phân vùng ảnh là chia ảnh thành các vùng không trùng lặp Mỗi vùng gồm một nhóm pixel liên thông và đồng nhất theo một tiêu chí nào đó Tiêu chí này phụ thuộc vào mục tiêu của quá trình phân đoạn
Ví dụ như đồng nhất về màu sắc, mức xám, kết cấu, độ sâu của các layer Sau khi phân đoạn mỗi pixel chỉ thuộc về một vùng duy nhất Để đánh giá chất lượng của quá trình phân đoạn là rất khó Vì vậy trước khi phân đoạn ảnh cần xác định rõ mục tiêu của quá trình phân đoạn là gì Xét một cách tổng quát, ta có thể chia các hướng tiếp cận phân đoạn ảnh thành các nhóm chính như sau:
- Dựa trên tính đồng đều (độ tương tự của mức xám và các thuộc tính chung của các điểm ảnh trong mỗi vùng)
- Phân vùng ảnh dựa trên sự biến thiên của hàm độ xám hoặc mức xám (phân vùng dựa trên tách biên)
1.2.3 Các công đoạn chính của phân vùng ảnh
Gồm 3 công đoạn sau:
- Tiền xử lý ảnh (nếu có)
Trang 24- Quá trình phân vùng ảnh (thực hiện dựa trên các thuật toán)
- Đánh nhãn cho các vùng ảnh được phân tách và điều chỉnh nếu cần
1.3 Một số thuộc tính của điểm ảnh và phân vùng ảnh
1.3.1 Một số thuộc tính của điểm ảnh
Giả sử có một điểm ảnh X = {Pi}, trong đó Pi là pixel thứ i (i = 1, …, M*N)
Có 2 loại ảnh sau:
+ Ảnh đơn màu: Pi được biểu diễn bằng giá trị mức xám (độ xám) Kí hiệu A(Pi) hoặc X(Pi)
+ Ảnh đa màu (đa phổ): Mỗi pixel được biểu diễn bởi một vecto màu gọi
là vecto thuộc tính Độ tương phản giữa hai điểm ảnh:
X P
Trong đó:
- X(Pi) là giá trị của điểm ảnh Pi
- Nk là tổng số điểm ảnh thuộc miền Rk
- M(Rk) là giá trị trung bình của miền Rk được tính bằng công thức sau:
1
1 (R ) ( )
k
N
i k
Nếu Pred(Rk) = 1 thì vùng Rk là vùng đồng đều
Nếu Pred(Rk) = 0 thì vùng Rk là không đồng đều
- Thuộc tính tần số, thuộc tính thống kê, thuộc tính cấu trúc