1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng chương trình mô phỏng phân vùng ảnh dựa trên sự phân chia và kết hợp các miền kề

48 639 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 48
Dung lượng 0,96 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Trong một số lượng lớn các ứng dụng về xử lý ảnh và hiển thị trên máy tính, phân vùng ảnh đóng vai trò chính yếu như là bước đầu tiên trước khi áp dụng các thao tác xử lý ảnh mức cao hơn

Trang 1

TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2 KHOA CÔNG NGHỆ THÔNG TIN

TRẦN QUỐC HÀ

XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG PHÂN VÙNG ẢNH DỰA TRÊN SỰ PHÂN CHIA

VÀ KẾT HỢP CÁC MIỀN KỀ

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC

Chuyên ngành: Khoa học máy tính

HÀ NỘI – 2015

Trang 2

TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2 KHOA CÔNG NGHỆ THÔNG TIN

TRẦN QUỐC HÀ

XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG PHÂN VÙNG ẢNH DỰA TRÊN SỰ PHÂN CHIA

VÀ KẾT HỢP CÁC MIỀN KỀ

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC

Chuyên ngành: Khoa học máy tính

Người hướng dẫn khoa học

TS LƯU THỊ BÍCH HƯƠNG

HÀ NỘI – 2015

Trang 3

LỜI CẢM ƠN

Em xin chân thành cảm ơn cô giáo TS Lưu Thị Bích Hương, người đã

hướng dẫn tận tình chỉ bảo em rất nhiều trong suốt quá trình tìm hiểu nghiên

cứu và hoàn thành khóa luận tốt nghiệp

Em cũng rất cảm ơn các thầy, cô giáo trong khoa Công nghệ Thông tin

trường Đại học sư phạm Hà Nội 2 đã tận tình giảng dạy, truyền đạt những

kiến thức quý báu và tạo điều kiện cho em hoàn thành khóa luận

Xin chân thành cảm ơn sự giúp đỡ, động viên của tất cả các bạn trong

quá trình thực hiện khóa luận

Em cũng muốn cảm ơn những người thân trong gia đình đã động viên,

giúp đỡ và tạo điều kiện để em hoàn thành khóa luận

Là sinh viên lần đầu nghiên cứu khoa học chắc chắn khóa luận của em

không tránh khỏi những thiếu sót, vì vậy em rất mong sự đóng góp ý kiến của

các thầy, cô giáo và các bạn để đề tài của em được hoàn thiện Một lần nữa

em xin chân thành cảm ơn công lao dạy dỗ chỉ bảo của thầy, cô giáo Kính

chúc quý thầy, cô giáo mạnh khỏe và tiếp tục đạt được nhiều thắng lợi trong

nghiên cứu khoa học và sự nghiệp trồng người

Em xin chân thành cảm ơn!

Hà Nội, tháng 05 năm 2015 Sinh viên thực hiện

Trần Quốc Hà

Trang 4

LỜI CAM ĐOAN

Tên em là: TRẦN QUỐC HÀ

Sinh viên lớp : K37 – CNTT, khoa Công nghệ Thông tin , trường Đại học sư

phạm Hà Nội 2

Em xin cam đoan:

1 Đề tài: “Xây dựng chương trình mô phỏng phân vùng ảnh dựa trên sự

phân chia và kết hợp các miền kề” là nghiên cứu của riêng em , dưới sự

hướng dẫn của cô giáo TS Lưu Thị Bích Hương

2 Khóa luận hoàn toàn không sao chép của tác giả nào khác

Nếu sai em xin hoàn toàn chịu trách nhiệm

Hà Nội, tháng 05 năm 2015 Sinh viên

Trần Quốc Hà

Trang 5

DANH MỤC HÌNH

Hình 1.1: Quá trình xử lý ảnh 7

Hình 1.2: Các bước cơ bản trong quá trình xử lý ảnh 7

Hình 1.3: Ví dụ về nắn chỉnh hình biến dạng 12

Hình 2.1: Chọn ngưỡng các đường ngang dọc 19

Hình 2.2: Phân vùng ảnh tượng đài Washington 20

Hình 2.3: Lược đồ hình rắn lượn và cách chọn ngưỡng 21

Hình 2.4: Xác định ngưỡng dựa trên thuật toán tam giác 21

Hình 2.5: Quá trình tính toán Pred(R) 27

Hình 2.6: Cây tứ phân của ảnh R 28

Hình 2.7: 4 liên thông và 8 liên thông 29

Hình 2.8: Làm mảnh ảnh 31

Hình 2.9: Loại bỏ đường bao hở 33

Hình 2.10: Khép kín nhờ ngoại suy 33

Hình 2.11: Loại bỏ các chân rết làm rõ biên 33

Hình 3.1: Form giao diện chính của chương trình 36

Hình 3.2: Form kết quả nhận được từ chức năng thay đổi mức xám 36

Hình 3.3: Form kết quả nhận được từ chức năng phân vùng ảnh 37

Hình 3.4: Form kết quả nhận được từ chức năng xem ảnh gốc 37

Trang 6

MỤC LỤC

MỞ ĐẦU…… 1

CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH 5

1.1 Xử lý ảnh và các vấn đề cơ bản trong xử lý ảnh 5

1.1.1 Xử lý ảnh là gì 5

1.1.2 Các vấn đề cơ bản trong xử lý ảnh 7

1.1.2.1 Một số khái niệm cơ bản 7

1.1.2.2 Độ phân giải của ảnh 8

1.1.2.3 Mức xám của ảnh 9

1.1.2.4 Nắn chỉnh biến dạng 11

1.1.2.5 Khử nhiễu 12

1.1.2.6 Chỉnh mức xám 12

1.1.2.7 Trích chọn đặc điểm 12

2.1.2.8 Nén ảnh…… 13

1.1.2.9 Một số thuộc tính cần quan tâm của ảnh số 14

1.2 Khái quát về phân vùng ảnh 14

1.2.1 Một số khái niệm 14

1.2.2 Các hướng tiếp cận phân vùng ảnh 16

1.2.3 Các công đoạn chính của phân vùng ảnh 16

1.3 Một số thuộc tính của điểm ảnh và phân vùng ảnh 17

1.3.1 Một số thuộc tính của điểm ảnh 17

1.3.2 Một số thuộc tính của vùng ảnh 17

CHƯƠNG 2: MỘT SỐ PHƯƠNG PHÁP PHÂN VÙNG ẢNH 18

2.1 Phân vùng ảnh dựa trên phương pháp phân lớp 18

2.1.1 Khái quát về phương pháp phân lớp 18

2.1.2 Phân lớp các điểm ảnh trong không gian thuộc tính một chiều 18

2.2 Phân vùng ảnh dựa trên sự phân chia miền kề 23

2.2.1 Phương pháp tách cây tứ phân 23

2.2.2 Phương pháp cục bộ 28

2.2.3 Phương pháp tổng hợp 29

2.3 Phân vùng ảnh dựa theo đường biên 30

Trang 7

2.3.1 Làm mảnh biên 30

2.3.2 Nhị phân hoá đường biên 32

2.3.3 Miêu tả đường biên 32

CHƯƠNG 3: XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG 35

3.1 Phát biểu bài toán 35

3.2 Thiết kế chương trình 36

3.2.1 Giao diện của chương trình 36

3.2.2 Một số kết quả của chương trình 36

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 38

TÀI LIỆU THAM KHẢO 40

Trang 8

MỞ ĐẦU

1 Mục đích, lý do chọn đề tài

Trong những năm gần đây, cùng với sự phát triển vượt bậc của khoa học máy tính, thì xử lý ảnh là một lĩnh vực đang được quan tâm Nó là một ngành khoa học còn tương đối mới mẻ so với nhiều ngành khoa học khác, nhưng hiện nay nó đang là một trong những lĩnh vực phát triển rất nhanh và thu hút

sự quan tâm đặc biệt từ các nhà khoa học, thúc đẩy các trung tâm nghiên cứu, ứng dụng về lĩnh vực hấp dẫn này Xử lý ảnh là ngành khoa học nghiên cứu các quá trình xử lý thông tin dạng hình ảnh, mà hình ảnh là một dạng thông tin vô cùng phong phú, đa dạng và là phương tiện giao tiếp, trao đổi chủ yếu của con người Thông tin hình ảnh ngày nay có thể được xử lý dễ dàng bằng máy tính Mục tiêu của xử lý ảnh là:

- Xử lý ảnh ban đầu để có được ảnh mới theo một yêu cầu xác định (ví dụ như ảnh mờ cần xử lý để được ảnh rõ hơn)

- Phân tích ảnh để thu được các thông tin đặc trưng giúp cho việc phân loại, nhận biết ảnh (ví dụ phân tích ảnh vân tay để trích chọn các đặc trưng vân tay)

- Hiểu ảnh đầu vào để có những mô tả về ảnh ở mức cao hơn, sâu hơn (ví dụ

từ ảnh một tai nạn giao thông phác họa hiện trường tai nạn)

Qua đó, có thể thấy xử lý ảnh đóng vai trò quan trọng như thế nào trong các ứng dụng thực tế về khoa học kĩ thuật cũng như trong cuộc sống thường ngày Những ứng dụng này dường như là vô hạn cùng với sự khám phá của con người và sự phát triển như vũ bão của công nghệ số hóa, chẳng hạn, trong các lĩnh vực như: Sản xuất và kiểm tra chất lượng, sự di chuyển của Robot, các phương tiện đi lại, công cụ hướng dẫn cho người mù, an ninh và giám sát, nhận dạng đối tượng, nhận dạng mặt, các ứng dụng trong y học, sản xuất, hiệu chỉnh Video, chinh phục vũ trụ…

Để xử lý được một bức ảnh thì phải trải qua nhiều khâu khác nhau tùy theo

Trang 9

mục đích của việc xử lý, nhưng khâu quan trọng và khó khăn nhất đó là phân vùng ảnh Trong một số lượng lớn các ứng dụng về xử lý ảnh và hiển thị trên máy tính, phân vùng ảnh đóng vai trò chính yếu như là bước đầu tiên trước khi áp dụng các thao tác xử lý ảnh mức cao hơn như: Nhận dạng, giải thích ngữ nghĩa, và biểu diễn ảnh Nếu bước phân vùng ảnh không tốt thì dẫn đến việc nhận diện sai lầm về các đối tượng có trong ảnh

Phân vùng ảnh đã và đang là một trong những vấn đề nhận được nhiều

sự quan tâm trong lĩnh vực xử lý ảnh Trong khoảng 30 năm trở lại đây đã có rất nhiều các thuật toán được đề xuất để giải bài toán này Trong thời gian gần đây, việc tìm ra các thuật toán nắm bắt được các thuộc tính toàn cục của bức ảnh đã trở thành một xu hướng phổ biến

Xuất phát trong hoàn cảnh đó em đã lựa chọn đề tài: “Xây dựng

chương trình mô phỏng phân vùng ảnh dựa trên sự phân chia và kết hợp các miền kề ” để làm khóa luận tốt nghiệp

2 Nhiệm vụ

- Tìm hiểu cơ bản về xử lý ảnh

- Tìm hiểu phương pháp phân vùng ảnh dựa trên phương pháp phân lớp

- Tìm hiểu phương pháp phân vùng ảnh dựa trên sự phân chia và kết hợp

các miền kề

- Tìm hiểu phương pháp phân vùng ảnh dựa theo đường biên

- Xây dựng ứng dụng phân vùng ảnh dựa trên sự phân chia và kết hợp các

miền kề trên ngôn ngữ Visual C#

3 Đối tượng và phạm vi nghiên cứu

a Đối tượng nghiên cứu

Trang 10

4 Phương pháp nghiên cứu

a Phương pháp nghiên cứu lý luận

Nghiên cứu qua việc đọc sách, báo và các tài liệu liên quan nhằm xây dựng cơ sở lý thuyết của đề tài và các biện pháp cần thiết để giải quyết các vấn đề của đề tài

b Phương pháp nghiên cứu chuyên gia

Tham khảo ý kiến của các chuyên gia để có thể thiết kế chương trình phù hợp với yêu cầu thực tiễn, nội dung xử lý nhanh đáp ứng được yêu cầu ngày càng cao của người sử dụng

c Phương pháp nghiên cứu thực nghiệm

Thông qua quan sát thực tế, yêu cầu của cơ sở, những lý luận được nghiên cứu và kết quả đạt được qua những phương pháp trên

5 Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài

 Ý nghĩa khoa học:

Phân vùng ảnh là một trong những tính tất yếu quyết định đến chất lượng của hình ảnh Mục tiêu của phân vùng ảnh là để đơn giản hóa hoặc thay đổi biểu diễn của một tấm ảnh để dễ dàng phân tích Phân vùng ảnh thường được sử dụng để xác định vị trí các đối tượng, đường biên (đường thẳng, cong.vv) Phương pháp phân vùng ảnh dựa trên sự phân chia và kết hợp miền

kề đã giúp cho việc phân vùng ảnh trở lên nhanh chóng, rút ngắn thời gian thực hiện và cho kết quả chính xác

 Ý nghĩa thực tiễn:

Việc xây dựng chương trình mô phỏng phân vùng ảnh dựa trên sự phân chia và kết hợp miền kề có ý nghĩa thực tiễn trong nhiều lĩnh vực khác nhau như lĩnh vực hình ảnh y tế(medical imaging), phát hiện và nhận dạng đối tượng, hệ thống camera giám sát, hệ thống điều khiển giao thông… Kỹ thuật này là bước tiền xử lý quan trọng trong hầu hết các hệ thống xử lý ảnh, kết hợp phân vùng tốt sẽ giúp cho quá trình xử lý về sau đạt hiệu quả cao hơn

Trang 11

nhằm tiết kiệm về chi phí tính toán, thời gian cũng như tăng độ chính xác của các ứng dụng trên.

6 Cấu trúc của khóa luận

Ngoài phần mở đầu, kết luận và tài liệu tham khảo, nội dung chính của khoá luận gồm 3 chương cụ thể như sau:

Chương 1: Tổng quan về xử lý ảnh

Chương 2: Một số phương pháp phân vùng ảnh

Chương 3: Xây dựng chương trình mô phỏng

Trang 12

Trong các dạng truyền thông cơ bản: Lời nói, văn bản, hình ảnh, âm thanh thì hình ảnh là dạng truyền thông truyền tải thông tin mạnh mẽ nhất Bằng thị giác, con người có thể nhận biết và hiểu về thế giới xung quanh chúng ta

Ví dụ: Những hình ảnh về trái đất, những hình ảnh trong dự báo thời tiết

Có tới 99% lượng thông tin đã biết về thế giới xung quanh được nhận biết thông qua thị giác (Nguồn: Chương 1 - Nhập môn xử lý ảnh - Lương Mạnh Bá, Nguyễn Thanh Thuỷ (1999), NXB Khoa học kỹ thuật)

Việc trang bị cho máy tính có khả năng thị giác như con người không phải là việc dễ dàng Chúng ta đang sống trong một không gian 3D, khi máy tính cố gắng phân tích đối tượng trong không gian 3D thì những bộ cảm biến

có sẵn như camera, lại thường cho ảnh 2D Như vậy, việc mất mát thông tin của hình ảnh sẽ xảy ra Với những cảnh động thì sự di chuyển của đối tượng hay sự di chuyển của camera, tất cả những việc đó làm cho việc mất mát và sai lệch thông tin rất lớn

Trang 13

Ngày nay cùng với sự phát triển của ngành CNTT, chúng ta mong muốn đưa được những hình ảnh mà con người có thể nhìn thấy được vào máy tính để thực hiện các mục đích khác nhau của con người như: Phân tích ảnh, phục hồi ảnh, phân vùng ảnh, nâng cao chất lượng ảnh Với mục đích làm cho ảnh sắc nét hơn hoặc làm cho ảnh gần giống nhất với trạng thái gốc, trạng thái trước khi ảnh bị biến dạng Để máy tính có thể hiểu và phân tích ảnh thì ảnh cần được mã hoá và biểu diễn dưới dạng số gọi là ảnh số Ngày nay một số máy ảnh số sử dụng tăng cường khả năng zoom (phóng to, thu nhỏ) kỹ thuật

Việc hiểu ảnh, phân tích ảnh và thị giác máy nhằm mục đích nhân bản hiệu quả của thị lực con người, giúp nhận biết tốt hơn về thế giới xung quanh

Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai trò quan trọng nhất trong việc thu nhận thông tin Những năm trở lại đây với sự phát triển nhanh của phần cứng máy tính, xử lý ảnh và đồ hoạ đang phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tương tác người máy Quá

Trang 14

trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận

Hình 1.1: Quá trình xử lý ảnh Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong không gian và nó có thể xem như một hàm n biến P(c1, c2, , cn) Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều

Sơ đồ tổng quát của một hệ thống xử lý ảnh:

1.1.2 Các vấn đề cơ bản trong xử lý ảnh

1.1.2.1 Một số khái niệm cơ bản

Ảnh trong thực tế (ảnh tự nhiên) là một ảnh liên tục về không gian và

về giá trị độ sáng Để có thể xử lý ảnh bằng máy tính, cần thiết phải tiến hành

số hoá ảnh nhằm biến đổi gần đúng một ảnh liên tục thành một tập điểm, phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám) Trong quá trình

số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hoá về không gian), và lượng hoá thành phần giá trị mà

Kết luận Ảnh “Tốt hơn”

Hình 1.2: Các bước cơ bản trong một hệ thống xử lý ảnh

Đối sách rút ra kết luận

Hậu xử

Hệ quyết định

Lưu trữ

Trang 15

về nguyên tắc bằng mắt thường không phân biệt được hai điểm kề nhau Trong quá trình này người ta sử dụng khái niệm điểm ảnh (pixel) Như vậy một ảnh là một tập hợp các điểm ảnh Khi sử dụng đến phân vùng ảnh thì việc phân biệt hai điểm ảnh kề nhau là việc cần thiết

Điểm ảnh (pixel) được xem như là dấu hiệu hay cường độ sáng tại một toạ độ trong không gian của đối tượng Mỗi pixel gồm một cặp toạ độ x, y và màu

Như vậy, một ảnh là một tập hợp các điểm ảnh Khi được số hoá, nó thường được biểu diễn bởi mảng hai chiều hay ma trận hai chiều I(n,p): mỗi phần tử có một giá trị nguyên hoặc là một véc tơ cấu trúc màu, n dòng và p cột Ta nói ảnh gồm n x p pixels Người ta thường kí hiệu I(x,y) để chỉ một pixel Thường giá trị của n chọn bằng p và bằng 256 Một pixel có thể lưu trữ trên 1, 4, 8 hay 24 bit Mỗi điểm ảnh khi mã hoá sẽ được biểu diễn dưới dạng

8 bít Cách mã hoá kinh điển thường dùng 16, 32 hay 64 mức Mã hoá 256 mức là phổ dụng nhất do lý do kỹ thuật Vì 28

= 256 (0, 1, , 255), nên với

256 mức, mỗi pixel sẽ được mã hoá bởi 8 bit và từ đó có thể biểu diễn ảnh dưới nhiều dạng khác nhau Số pixel tạo nên một ảnh gọi là độ phân giải (resolution)

1.1.2.2 Độ phân giải của ảnh

Độ phân giải là mật độ điểm ảnh được ấn định trên một ảnh số Khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bố chính là độ phân giải, và được phân bố theo trục x, y trong không gian hai chiều

Ví dụ: Với màn CGA (320 x 200) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc x 200 điểm ảnh So sánh màn hình CGA 12 (Color Graphic Adaptor) thì thấy ảnh mịn hơn màn hình CGA 17 Như vậy diện tích càng rộng thì độ mịn của ảnh càng kém đi, cũng như khi phóng to một ảnh cũng vậy, ảnh càng to thì càng bị vỡ hạt, độ mịn càng kém

Trang 16

1.1.2.3 Mức xám của ảnh

Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị

số tại điểm đó Trong biểu diễn số của các ảnh đa mức xám, một ảnh được biểu diễn dưới dạng một ma trận hai chiều Mỗi phần tử của ma trận biểu diễn cho mức xám hay cường độ của ảnh tại vị trí đó Mỗi phần tử trong ma trận được gọi là một phần tử ảnh hoặc điểm ảnh (pixel) Một điểm ảnh có hai đặc trưng cơ bản là vị trí (x,y) của điểm ảnh và độ xám

a Các thang giá trị mức xám thông thường

Thông thường có các thang mức xám như: 16, 32, 64, 128, 256 (với lý

do kỹ thuật máy tính dùng 1 byte (8 bít) để biểu diễn mức xám thì có thể biểu diễn: 28

= 256 mức (0, 1, …, 255) thì mức 256 là mức phổ dụng

- Mức xám ở ảnh đen trắng: Ảnh đen trắng là ảnh chỉ có hai màu đen trắng, mức xám ở các điểm ảnh có thể khác nhau Nếu dùng 8 bit (1 byte) để biểu diễn mức xám, thì số các mức xám có thể biểu diễn được là 28

hay 256 Mỗi mức xám được biểu diễn dưới dạng là một số nguyên nằm trong khoảng từ 0 đến 255, với mức 0 biểu diễn cho mức cường độ đen nhất và 255 biểu diễn cho mức cường độ sáng nhất

- Mức xám ở ảnh nhị phân: Ảnh chỉ có hai mức đen, trắng phân biệt, tức dùng

1 bit mô tả 21 mức khác nhau Nói cách khác mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1

- Mức xám ở ảnh màu: Ảnh màu được tạo nên từ ba màu cơ bản (Red, Blue, Green), người ta dùng 3 byte để mô tả mức màu, khi đó giá trị màu: 28*3 = 224

= 16,7 triệu màu

Với ảnh màu: Cách biểu diễn cũng tương tự như với ảnh đen trắng, chỉ khác là các số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm:

đỏ (red), lục (green) và lam (blue) Để biểu diễn cho một điểm ảnh màu cần

24 bit, 24 bit này được chia thành ba khoảng 8 bit Mỗi khoảng này biểu diễn cho cường độ sáng của một trong các màu chính

Trang 17

b Các kiểu ảnh

b1 Ảnh chỉ số (Index Images)

Một ảnh chỉ số bao gồm một ma trận dữ liệu X và ma trận bản đồ màu (map) Ma trận dữ liệu có thể có kiểu thuộc lớp uint8, uint16 hoặc kiểu double Ma trận bản đồ màu là một mảng m x 3 kiểu double bao gồm các giá trị dấu phẩy động nằm giữa 0 và 1 Mỗi hàng của bản đồ chỉ ra các giá trị mà: red, green và blue của một màu đơn Một ảnh chỉ số sử dụng ánh xạ trực tiếp giữa giá trị của pixel ảnh tới giá trị trong bản đồ màu Màu sắc của mỗi pixel ảnh được tính toán bằng cách sử dụng giá trị tương ứng của X ánh xạ tới một giá trị chỉ số của bản đồ màu Giá trị 1 chỉ ra hàng đầu tiên, giá trị 2 chỉ ra hàng thứ hai trong bản đồ màu

Một bản đồ màu thường được chứa cùng với ảnh chỉ số và được tự động nạp cùng với ảnh Tuy nhiên, không bị giới hạn khi sử dụng bản đồ màu mặc định, ta có thể sử dụng bất kì bản đồ màu nào Các pixel trong ảnh được đại diện bởi một số nguyên ánh xạ tới một giá trị tương ứng trong bản đồ màu

b2 Ảnh cường độ (Intensity Images)

Một ảnh cường độ là một ma trận dữ liệu ảnh I mà giá trị của nó đại diện cho cường độ trong một số vùng nào đó của ảnh Ma trận có thể thuộc lớp double, uint8 hay uint16 Trong khi ảnh cường độ hiếm khi được lưu với bản đồ màu Những phần tử trong ma trận cường độ đại diện cho các cường

độ khác nhau hoặc độ xám

b3.Ảnh nhị phân (Binary Images)

Trong một ảnh nhị phân, mỗi pixel chỉ có thể chứa một trong hai giá trị nhị phân 0 hoặc 1 Hai giá trị này tương ứng với bật hoặc tắt (on hoặc off) Một ảnh nhị phân được lưu trữ như một mảng logic của 0 và 1

b4 Ảnh RGB (RGB Images)

Một ảnh RGB được lưu trữ dưới dạng một mảng dữ liệu có kích thước

3 chiều m x n x 3, định nghĩa các giá trị màu red, green và blue cho mỗi pixel

Trang 18

riêng biệt Ảnh RGB không sử dụng bảng màu Màu của mỗi pixel được quyết định bởi sự kết hợp giữa các giá trị R, G, B (Red, Green, Blue) được lưu trữ trong một mặt phẳng màu tại vị trí của pixel Định dạng file đồ hoạ lưu trữ ảnh RGB giống như một ảnh 24 bít trong đó R, G, B chiếm tương ứng

8 bít 1 Điều này cho phép nhận được 16,7 triệu màu khác nhau

Một mảng RGB có thể thuộc lớp double, uint8 hoặc uint16 Trong một mảng RGB thuộc lớp double, mỗi thành phần màu có giá trị giữa 0 và 1 Một pixel mà thành phần màu của nó là (0,0,0) được hiển thị với màu đen và một pixel mà thành phần màu là (1,1,1) được hiển thị với màu trắng

Trong một ảnh RGB khoảng trắng tương ứng với giá trị cao nhất của mỗi màu riêng rẽ Chẳng hạn trong ảnh mặt phẳng R, vùng trắng đại diện cho

sự tập trung cao nhất của màu đỏ thuần khiết Nếu R được trộn với G hoặc B

ta sẽ có màu xám Vùng màu đen trong ảnh chỉ ra giá trị của pixel mà không chứa màu đỏ R = 0 Tương tự cho các mặt phẳng màu G và B

1.1.2.4 Nắn chỉnh biến dạng

Nắn chỉnh biến dạng là việc biến đổi hình học giữa hai ảnh: Ảnh nguồn và ảnh đích Sự biến đổi hình học được định nghĩa về mối quan hệ giữa các điểm ảnh nguồn và điểm ảnh đích

Thuật toán nắn chỉnh ảnh có hai khuynh hướng: Tác động toàn cục hoặc tác động cục bộ Tác động toàn cục là ta áp dụng thuật toán, tiêu chí như nhau đối với mọi điểm ảnh trên toàn bộ ảnh Còn tác động cục bộ thì ta chỉ tác động trên các điểm ảnh ở một số vùng của ảnh, còn các vùng khác của ảnh

ta giữ nguyên.Các thuật toán nắn chỉnh toàn cục có tốc độ xử lý tương đối nhanh nhưng chỉ áp dụng được với các yêu cầu đơn giản như co, giãn ảnh, bóp méo cả ảnh thành tứ giác hay một số hiệu ứng khác như mắt cá, kính núp,

Thuật toán nắn chỉnh cục bộ cho kết quả ấn tượng hơn Tuy nhiên để nắn chỉnh từng vùng, ta phải xác định thêm tập đặc trưng Trong trường hợp này việc xây dựng thuật toán tương đối phức tạp

Trang 19

Hình 1.3: Ví dụ về nắn chỉnh hình biến dạng Nắn chỉnh biến dạng là một khâu trong xử lý ảnh Với mỗi ảnh tùy theo mức độ, hiện trạng, và chủng loại ảnh mà người ta sử dụng ứng dụng nào cho phù hợp nhất trong xử lý ảnh 1.1.2.5 Khử nhiễu Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh: - Nhiễu hệ thống: Là nhiễu có quy luật có thể khử bằng các phép biến đổi - Nhiễu ngẫu nhiên: Vết bẩn không rõ nguyên nhân và có thể khắc phục bằng các phép lọc 1.1.2.6 Chỉnh mức xám Nhằm khắc phục tính không đồng đều của hệ thống gây ra Thông thường có 2 hướng tiếp cận: - Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau thành một bó Trường hợp chỉ có 2 mức xám thì chính là chuyển về ảnh đen trắng Ứng dụng: In ảnh màu ra máy in đen trắng - Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ thuật nội suy Kỹ thuật này nhằm tăng cường độ mịn cho ảnh 1.1.2.7 Trích chọn đặc điểm

𝑃𝑖

b) Ảnh qua xử lý

𝑃𝑖

a) Ảnh gốc

Trang 20

Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá trình xử lý ảnh Có thể nêu ra một số đặc điểm của ảnh sau

đây:

- Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm uốn

- Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực

hiện lọc vùng (zonal filtering) Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật,

tam giác, cung tròn)

- Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và

do vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng Các đặc điểm này có thể được trích chọn nhờ toán tử gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo không”

(zero crossing)

Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống

1.1.2.8 Nén ảnh

Nhằm giảm thiểu không gian lưu trữ Thường được tiến hành theo cả hai cách khuynh hướng là nén có bảo toàn và không bảo toàn thông tin Nén không bảo toàn thì thường có khả năng nén cao hơn nhưng khả năng phục hồi thì kém hơn Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén ảnh:

- Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần suất xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF

- Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh để tiến hành mã hóa Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong các vùng gần nhau Ví dụ cho kỹ thuật này là mã nén *.PCX

Trang 21

- Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không bảo toàn và do vậy, kỹ thuật thường nén hiệu quả hơn *.JPG chính

là tiếp cận theo kỹ thuật nén này

- Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện

sự lặp lại của các chi tiết Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal

1.1.2.9 Một số thuộc tính cần quan tâm của ảnh số

- Đường viền (Border): Đường viền của một vùng ảnh R là tập hợp các điểm ảnh trong vùng đó mà có một hay nhiều lân cận bên ngoài vùng R

- Biên ảnh (Edge): Một điểm ảnh có thể coi là biên nếu ở đó có sự thay đổi đột ngột về mức xám Tập hợp các điểm biên tạo thành đường bao của ảnh.Thuộc tính biên gắn liền một điểm ảnh và lân cận của nó, đôi khi nó giúp cho việc xác định đặc tính giữa một cặp điểm lân cận

Ví dụ: Trong một ảnh nhị phân, một điểm có thể gọi là biên nếu đó là điểm đen và có ít nhất một điểm trắng lân cận

- Độ sắc nét của ảnh: Độ sắc nét là khả năng phát hiện những chi tiết trong ảnh Mắt người ít nhạy cảm với sự thay đổi nhanh hay chậm của độ sáng trong mặt phẳng ảnh nhưng nhạy cảm với sự thay đổi trung gian

Độ phân giải trong ảnh được giới hạn bởi khả năng phân giải ở mắt người Khi độ phân giải của ảnh cao hơn độ phân giải của mắt người thì con người không thể cảm nhận về ảnh được nữa

Độ phân giải trong quang học được định nghĩa là khoảng cách giữa hai điểm ảnh gần nhất mà con người không thể phân biệt được

Mỗi một ảnh đều có độ sắc nét, độ phân giải riêng, việc xử lý ảnh nhằm mục đích làm cho ảnh sắc nét hơn, đẹp hơn hay gần với ảnh gốc hơn, và khi biến đổi bằng một trong các phương pháp phân vùng ảnh làm cho ảnh có khả năng hiển thị tốt, và để xác định vị trí các đối tượng, đường biên (đường thẳng, cong.vv)

1.2 Khái quát về phân vùng ảnh

Trang 22

1.2.1 Một số khái niệm

Phân vùng ảnh là bước then chốt trong xử lý ảnh Giai đoạn này nhằm phân tích ảnh thành những thành phần có cùng tính chất nào đó dựa theo biên hay các vùng liên thông Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng độ nhám…

Trước hết cần làm rõ khái niệm "vùng ảnh" (Segment) và đặc điểm vật

lý của vùng Vùng ảnh là một chi tiết, một thực thể trông toàn cảnh Nó là một tập hợp các điểm có cùng hoặc gần cùng một tính chất nào đó: mức xám, mức màu, độ nhám… Vùng ảnh là một trong hai thuộc tính của ảnh Nói đến vùng ảnh là nói đến tính chất bề mặt Đường bao quanh một vùng ảnh (Boundary) là biên ảnh Các điểm trong một vùng ảnh có độ biến thiên giá trị mức xám tương đối đồng đều hay tính kết cấu tương đồng Dựa vào đặc tính vật lý của ảnh, người ta có nhiều kỹ thuật phân vùng: Phân vùng dựa theo miền liên thông gọi là phân vùng dựa theo miền đồng nhất hay miền kề, phân vùng dựa vào biên gọi là phân vùng biên Ngoài ra còn có các kỹ thuật phân vùng khác dựa vào biên độ, phân vùng dựa theo kết cấu…

Phân vùng ảnh (Image Segmentation): Là quá trình phân hoạch tập các điểm ảnh của R thành các tập con Ri (hay một vùng ảnh) thỏa mãn các điều kiện sau:

(a)

1

n i i

Trang 23

- Điều kiện (b) R là một vùng liên thông

- Điều kiện (c) để đảm bảo các vùng phải rời nhau

- Điều kiện (d) để đảm bảo các điểm ảnh trong vùng phải thoả mãn một tính chất P nào đó

- Điều kiện (e) để đảm bảo hai vùng khác nhau về tính chất P được định nghĩa trước

Dựa vào đặc tính của vùng ảnh, có nhiều kỹ thuật phân vùng khác nhau Tuy nhiên, kỹ thuật phân vùng ảnh có thể được chia thành ba phương pháp cơ bản sau đây:

- Phân vùng ảnh dựa trên phương pháp phân lớp

- Phân vùng ảnh dựa trên sự phân chia miền kề

- Phân vùng ảnh dựa theo đường biên

1.2.2 Các hướng tiếp cận phân vùng ảnh

Phân vùng ảnh là chia ảnh thành các vùng không trùng lặp Mỗi vùng gồm một nhóm pixel liên thông và đồng nhất theo một tiêu chí nào đó Tiêu chí này phụ thuộc vào mục tiêu của quá trình phân đoạn

Ví dụ như đồng nhất về màu sắc, mức xám, kết cấu, độ sâu của các layer Sau khi phân đoạn mỗi pixel chỉ thuộc về một vùng duy nhất Để đánh giá chất lượng của quá trình phân đoạn là rất khó Vì vậy trước khi phân đoạn ảnh cần xác định rõ mục tiêu của quá trình phân đoạn là gì Xét một cách tổng quát, ta có thể chia các hướng tiếp cận phân đoạn ảnh thành các nhóm chính như sau:

- Dựa trên tính đồng đều (độ tương tự của mức xám và các thuộc tính chung của các điểm ảnh trong mỗi vùng)

- Phân vùng ảnh dựa trên sự biến thiên của hàm độ xám hoặc mức xám (phân vùng dựa trên tách biên)

1.2.3 Các công đoạn chính của phân vùng ảnh

Gồm 3 công đoạn sau:

- Tiền xử lý ảnh (nếu có)

Trang 24

- Quá trình phân vùng ảnh (thực hiện dựa trên các thuật toán)

- Đánh nhãn cho các vùng ảnh được phân tách và điều chỉnh nếu cần

1.3 Một số thuộc tính của điểm ảnh và phân vùng ảnh

1.3.1 Một số thuộc tính của điểm ảnh

Giả sử có một điểm ảnh X = {Pi}, trong đó Pi là pixel thứ i (i = 1, …, M*N)

Có 2 loại ảnh sau:

+ Ảnh đơn màu: Pi được biểu diễn bằng giá trị mức xám (độ xám) Kí hiệu A(Pi) hoặc X(Pi)

+ Ảnh đa màu (đa phổ): Mỗi pixel được biểu diễn bởi một vecto màu gọi

là vecto thuộc tính Độ tương phản giữa hai điểm ảnh:

X P

Trong đó:

- X(Pi) là giá trị của điểm ảnh Pi

- Nk là tổng số điểm ảnh thuộc miền Rk

- M(Rk) là giá trị trung bình của miền Rk được tính bằng công thức sau:

1

1 (R ) ( )

k

N

i k

Nếu Pred(Rk) = 1 thì vùng Rk là vùng đồng đều

Nếu Pred(Rk) = 0 thì vùng Rk là không đồng đều

- Thuộc tính tần số, thuộc tính thống kê, thuộc tính cấu trúc

Ngày đăng: 24/09/2015, 16:24

HÌNH ẢNH LIÊN QUAN

Sơ đồ tổng quát của một hệ thống xử lý ảnh: - Xây dựng chương trình mô phỏng phân vùng ảnh dựa trên sự phân chia và kết hợp các miền kề
Sơ đồ t ổng quát của một hệ thống xử lý ảnh: (Trang 14)
Hình 1.3: Ví dụ về nắn chỉnh hình biến dạng  Nắn chỉnh biến dạng là một khâu trong xử lý ảnh - Xây dựng chương trình mô phỏng phân vùng ảnh dựa trên sự phân chia và kết hợp các miền kề
Hình 1.3 Ví dụ về nắn chỉnh hình biến dạng Nắn chỉnh biến dạng là một khâu trong xử lý ảnh (Trang 19)
Hình 2.1: Chọn ngưỡng các đường ngang dọc  Đường viền sau bao quanh đối tượng nằm trong hình chữ nhật cho ta các  đối tƣợng đã đƣợc phân vùng - Xây dựng chương trình mô phỏng phân vùng ảnh dựa trên sự phân chia và kết hợp các miền kề
Hình 2.1 Chọn ngưỡng các đường ngang dọc Đường viền sau bao quanh đối tượng nằm trong hình chữ nhật cho ta các đối tƣợng đã đƣợc phân vùng (Trang 27)
Hình 2.3: Lƣợc đồ hình rắn lƣợn và cách chọn ngƣỡng  Giả sử ảnh có lƣợc đồ xám nhƣ hình trên ta chọn các ngƣỡng nhƣ hình vẽ: - Xây dựng chương trình mô phỏng phân vùng ảnh dựa trên sự phân chia và kết hợp các miền kề
Hình 2.3 Lƣợc đồ hình rắn lƣợn và cách chọn ngƣỡng Giả sử ảnh có lƣợc đồ xám nhƣ hình trên ta chọn các ngƣỡng nhƣ hình vẽ: (Trang 28)
Hình 2.4: Xác định ngƣỡng dựa trên thuật toán tam giác  Thuật toán này do Zack đƣa ra và đƣợc minh họa ở hình 2.4 - Xây dựng chương trình mô phỏng phân vùng ảnh dựa trên sự phân chia và kết hợp các miền kề
Hình 2.4 Xác định ngƣỡng dựa trên thuật toán tam giác Thuật toán này do Zack đƣa ra và đƣợc minh họa ở hình 2.4 (Trang 29)
Hình 2.5: Quá trình tính toán Pred(R)  Khi tất cả các Pred(R) = 1 thì dừng và có cây tứ phân sau: - Xây dựng chương trình mô phỏng phân vùng ảnh dựa trên sự phân chia và kết hợp các miền kề
Hình 2.5 Quá trình tính toán Pred(R) Khi tất cả các Pred(R) = 1 thì dừng và có cây tứ phân sau: (Trang 35)
Hình 2.9: Loại bỏ đường bao hở - Xây dựng chương trình mô phỏng phân vùng ảnh dựa trên sự phân chia và kết hợp các miền kề
Hình 2.9 Loại bỏ đường bao hở (Trang 40)
Hình 3.1: Form giao diện chính - Xây dựng chương trình mô phỏng phân vùng ảnh dựa trên sự phân chia và kết hợp các miền kề
Hình 3.1 Form giao diện chính (Trang 43)
Hình 3.2: Form kết quả nhận đƣợc từ chức năng thay đổi mức xám - Xây dựng chương trình mô phỏng phân vùng ảnh dựa trên sự phân chia và kết hợp các miền kề
Hình 3.2 Form kết quả nhận đƣợc từ chức năng thay đổi mức xám (Trang 44)
Hình 3.3: Form kết quả nhận đƣợc từ chức năng phân vùng ảnh - Xây dựng chương trình mô phỏng phân vùng ảnh dựa trên sự phân chia và kết hợp các miền kề
Hình 3.3 Form kết quả nhận đƣợc từ chức năng phân vùng ảnh (Trang 44)
Hình 3.4: Form kết quả nhận đƣợc từ chức năng xem ảnh gốc - Xây dựng chương trình mô phỏng phân vùng ảnh dựa trên sự phân chia và kết hợp các miền kề
Hình 3.4 Form kết quả nhận đƣợc từ chức năng xem ảnh gốc (Trang 45)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w