1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu

87 541 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 87
Dung lượng 1,68 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Như vậy, mục tiêu của xử lý ảnh có thể phân làm ba hướng như sau:  Xử lý ảnh ban đầu để có được một ảnh mới theo yêu cầu xác định ví dụ như ảnh mờ cần xử lý để được ảnh rõ hơn, lọc nhiễ

Trang 1

LỜI CẢM ƠN

Trong thời gian thực hiện luận văn thạc sỹ em đã nhận được rất nhiều

sự khích lệ, động viên, giúp đỡ từ phía thầy cô, cha mẹ và bạn bè xung quanh

Em xin bày tỏ lòng biết ơn chân thành nhất tới thầy giáo, PGS.TS Ngô Quốc Tạo, người đã trực tiếp hướng dẫn em hoàn thành luận văn thạc sỹ này

Cảm ơn đề tài: “ Hệ thống đeo tay hỗ trợ đọc sách tiếng Việt dành cho người khiếm thị” Mã số VAST01.07/15-16 hỗ trợ trong thực hiện luận văn

Em xin gửi lời cảm ơn chân thành tới các thầy cô trong trường Đại học

Sư phạm Hà Nội 2

Em đã cố gắng học tập và hoàn thành luận văn thạc sỹ nhưng có thể luận văn thạc sỹ vẫn còn thiếu sót Em rất mong nhận được sự góp ý, chỉ bảo của các thầy cô và các bạn để luận văn thạc sỹ hoàn thiện hơn

Hà nội, ngày 01 tháng 07 năm 2015

Tác giả luận văn

Nguyễn Đức Toàn

Trang 2

LỜI CAM ĐOAN

Tôi xin cam đoan r ng số liệu và kết quả nghiên cứu trong luận văn này

là trung thực và không tr ng l p với các đề tài khác Tôi c ng xin cam đoan

r ng mọi sự giúp đỡ cho việc thực hiện luận văn này đã được cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ nguồn gốc

Hà nội, ngày 01 tháng 07 năm 2015

Tác giả luận văn

Nguyễn Đức Toàn

Trang 3

MỤC LỤC

MỞ ĐẦU 8

1 Lý do chọn đề tài 8

2 Mục đích nghiên cứu 8

3 Nhiệm vụ nghiên cứu 8

4 Đối tượng và phạm vi nghiên cứu 9

5 Phương pháp nghiên cứu 9

CHƯƠNG 1: KHÁI NIỆM VỀ PHÂN ĐOẠN ẢNH 11

1.1 Xử lý ảnh, các vấn đề cơ bản trong xử lý ảnh 11

1.2 Quá trình xử lý ảnh 11

1.2.1 Thu nhận ảnh (Image Acquisition) 13

1.2.2 Tiền xử lý (Image Processing) 14

1.2.3 Phân đoạn (Segmentation) hay phân vùng ảnh 14

1.2.4 Biểu diễn ảnh (Image Representation) 15

1.2.5 Nhận dạng và nội suy ảnh (Image Recognition and Interpretation) 15

1.2.6 Cơ sở tri thức (Knowledge Base) 16

1.2.7 Mô tả ảnh 16

1.3 Phân đoạn ảnh 19

1.3.1 Điểm ảnh (Picture Element) 19

1.3.2 Độ phân giải của ảnh 20

1.3.3 Mức xám của ảnh 20

1.3.4 Quan hệ giữa các điểm ảnh 21

1.3.4.1 Các lân cận của điểm ảnh (Image Neighbors) 21

1.3.4.2 Khoảng cách giữa các điểm ảnh 22

1.3.4.3 Các thành phần cơ bản của hệ thống xử lý ảnh 24

1.3.5 Những vấn đề khác trong xử lý ảnh 25

Trang 4

1.3.5.1 Biến đổi ảnh (Image Transform) 25

1.3.5.2 Nén ảnh 25

1.3.5.3 Các định dạng cơ bản trong xử lý ảnh 26

CHƯƠNG 2: PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH 27

Trộn các vùng 38

2.1 Phương pháp phân đoạn ảnh dựa trên miền đồng nhất 47

2.1.1 Phương pháp tách cây tứ phân 48

2.1.2 Phương pháp cục bộ 50

2.2 Phương pháp phân đoạn ảnh dựa trên LPB (Local Binary Pattern– Mẫu nhị phân cục bộ) 52

2.2.1 LBP trong miền không gian 53

2.2.2 LBP spatiotemporal 55

2.2.3 Mô tả mặt bằng LBP 57

2.2.4 Mở rộng và các ứng dụng 59

2.3 Phương pháp phân đoạn ảnh dựa trên Histogram (Ngưỡng) 60

2.3.1 Thao tác với ảnh nhị phân 70

2.3.1.1 Điểm ảnh và các điểm láng riềng 70

2.3.1.2 Connected components labeling 71

2.3.1.3 Xác định số từ trong ảnh tài liệu 78

CHƯƠNG 3: ỨNG DỤNG PHÂN ĐOẠN CHO ẢNH TÀI LIỆU 80

3.1 Yêu cầu bài toán: Giải quyết bài viết của học sinh 80

3.2 Cách giải quyết yêu cầu của bài toán 80

3.3 Xây dựng DEMO 80

3.3.1 Giao diện chính: 80

3.3.2 Nhập hình ảnh 81

3.3.3 Sử dụng thuật toán Gray 81

3.3.4 Sử dụng thuật toán Segmentation 82

Trang 5

3.3.5 Sử dụng thuật toán Sobel 82

3.4 So sánh với ảnh phong cảnh 83

3.4.1 Giao diện chính 83

3.4.2 Nhập hình ảnh 83

3.4.3 Sử dụng thuật toán Gray 84

3.4.4 Sử dụng thuật toán Segmentation 84

3.4.5 Sử dụng thuật toán Sobel 85

KẾT LUẬN VÀ KIẾN NGHỊ 86

TÀI LIỆU THAM KHẢO 87

Trang 6

DANH MỤC BẢNG

Hình 2.1 Các phương pháp phân đoạn ảnh 28

Bảng 2.2.Ưu nhược điểm của các phương pháp phân v ng 28

Bảng 2.3 Bảng tra màu 33

Bảng 2.3 Biểu đồ tần xuất histogram của ảnh I 61

Bảng 2.4 : Định nghĩa thành phần liên thông 72

Bảng 2.5 Ảnh nhị phân và nhãn của các thành phần 72

Bảng 2.6 Cấu trúc Union - Find với hai tập nhãn 73

Bảng 2.7 Giả mã cho thủ tục Find 74

Bảng 2.8 : Giả mã cho thủ tục Union 74

Bảng 2.9 Giả mã thuật toán và gán nhãn cho các thành phần liên thông 76

Bảng 2.10 Ứng dụng thuật toán gán nhãn cho các thành phần liên thông 78

Trang 7

DANH MỤC HÌNH

Hình 2.1 Các phương pháp phân đoạn ảnh 28

Bảng 2.2.Ưu nhược điểm của các phương pháp phân v ng 28

Bảng 2.3 Bảng tra màu 33

Bảng 2.3 Biểu đồ tần xuất histogram của ảnh I 61

Bảng 2.4 : Định nghĩa thành phần liên thông 72

Bảng 2.5 Ảnh nhị phân và nhãn của các thành phần 72

Bảng 2.6 Cấu trúc Union - Find với hai tập nhãn 73

Bảng 2.7 Giả mã cho thủ tục Find 74

Bảng 2.8 : Giả mã cho thủ tục Union 74

Bảng 2.9 Giả mã thuật toán và gán nhãn cho các thành phần liên thông 76

Bảng 2.10 Ứng dụng thuật toán gán nhãn cho các thành phần liên thông 78

Trang 8

MỞ ĐẦU

1 Lý do chọn đề tài

Trong những năm gần đây công nghệ thông tin phát triển với tốc độ nhanh chóng Sự phát triển của công nghệ thông tin đã thúc đẩy sự phát triển của nhiều lĩnh vực xã hội khác như: y học, giáo dục, giải trí, kinh tế…

Lĩnh vực xử lý ảnh c ng như công nghệ thực tại ảo đã ra đời và thâm nhập mạnh mẽ vào đời sống của con người

Ảnh thu được sau qua trình thu nhận ảnh ho c các phép biến đổi không tránh khỏi nhiễu ho c khuyết thiếu Sự sai sót này một phần bởi các thiết bị quang học và điện tử, phần khác bởi bản thân các phép biến đổi không phải là toàn ánh, nên có sự ánh xạ thiếu hụt đến những điểm trên ảnh kết quả

Việc khắc phục các nhược điểm này luôn là vấn đề đ t ra cho các hệ thống xử lý ảnh vì vậy các nhà khoa học đã phân đoạn ảnh ra để làm rõ nét hơn cho bức ảnh cần xử lý và tăng cường nâng cao chất lượng ảnh

Xuất phát trong hoàn cảnh đó “Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu” được em chọn làm đề tài

2 Mục đích nghiên cứu

Tìm hiểu tổng quan về phân đoạn ảnh, các phương pháp phân đoạn ảnh

và chọn ra phương pháp phân đoạn ảnh cụ thể

Trên cơ sở các kiến thức đã thu thập và nghiên cứu, tổng hợp các kỹ thuật để hướng đến các ứng dụng thực tế phân đoạn cho ảnh tài liệu

3 Nhiệm vụ nghiên cứu

Tìm hiểu khái niệm phân đoạn ảnh

Các phương pháp phân đoạn ảnh

Ứng dụng phương pháp phân đoạn cho ảnh tài liệu

Trang 9

4 Đối tượng và phạm vi nghiên cứu

Đối tượng, phạm vi nghiên cứu về tổng quan về phân đoạn ảnh, các phương pháp phân đoạn ảnh và chọn ra phương pháp phân đoạn cho ảnh cụ

thể và các ứng dụng thực tế phân đoạn cho ảnh tài liệu

5 Phương pháp nghiên cứu

Thu thập tài liệu, phân tích, suy luận, tổng hợp, đánh giá Từ đó đề xuất

nghiên cứu và tìm hiểu: “Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu”

Trang 10

Chương 2: Phương pháp phân đoạn ảnh

2.1 Phương pháp phân đoạn ảnh dựa trên miền đồng nhất

2.2 Phương pháp phân đoạn ảnh dựa trên LBP (Local Binary Pattern) ( Mẫu nhị phân cục bộ)

2.3 Phương pháp phân đoạn ảnh dựa trên Histogram (Ngưỡng)

Chương 3: Ứng dụng phương pháp phân đoạn cho ảnh tài liệu

- Yêu cầu bài toán: Giải quyết bài viết của học sinh

- Đ c th của ảnh sau khi phân đoạn: là ảnh đen trắng (ảnh đơn màu)

- Thử nghiệm với các dữ liệu

Trang 11

CHƯƠNG 1: KHÁI NIỆM VỀ PHÂN ĐOẠN ẢNH

1.1 Xử lý ảnh, các vấn đề cơ bản trong xử lý ảnh

Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng

vai trò quan trọng nhất Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ Những năm trở lại đây với sự phát triển của phần cứng máy tính,

xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tương tác người và máy

Quá trình xử lý ảnh là một quá trình thao tác nh m phân tích, biến đổi một ảnh đầu vào để đưa ra một kết quả mong muốn Kết quả của quá trình xử

lý ảnh có thể là một ảnh tốt hơn ho c một kết luận Điều này t y thuộc vào mục đích yêu cầu của quá trình Như vậy, mục tiêu của xử lý ảnh có thể phân làm ba hướng như sau:

 Xử lý ảnh ban đầu để có được một ảnh mới theo yêu cầu xác định (ví

dụ như ảnh mờ cần xử lý để được ảnh rõ hơn, lọc nhiễu, phân đoạn ảnh để lấy được những yêu cầu cần thiết )

 Phân tích ảnh để thu được các thông tin đ c trưng giúp cho việc phân loại, nhận dạng ảnh (Ví dụ như phân tích nhận dạng vân tay, nhận dạng chữ viết, nhận dạng ảnh tài liệu )

 Đưa ra một kết luận ở mức cao hơn, sâu hơn (ví dụ như từ ảnh một tai nạn giao thông phác họa hiện trường tai nạn…

1.2 Quá trình xử lý ảnh

Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ, là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đ c biệt là máy tính chuyên dụng riêng

Trang 12

Xử lý ảnh liên quan đến nhiều lĩnh vực và cần nhiều kiến thức cơ sở khác Đầu tiên phải kể đến Xử lý tín hiệu số là một môn học hết sức cơ bản cho xử lý tín hiệu chung, các khái niệm về tích chập, các biến đổi Fourier, biến đổi Laplace, các bộ lọc hữu hạn… Thứ hai, các công cụ toán như Đại số tuyến tính, Xác xuất, thống kê Một số kiến thứ cần thiết như Trí tuệ nhân tao, Mạng nơron nhân tạo c ng được đề cập trong quá trình phân tích và nhận dạng ảnh Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng

cao chất lượng ảnh và phân tích ảnh

Ứng dụng đầu tiên được biết đến là nâng cao chất lượng ảnh báo được truyền qua cáp từ Luân Đôn đến New York từ những năm 1920 Vấn đề nâng cao chất lượng ảnh có liên quan tới phân bố mức sáng và độ phân giải của ảnh Việc nâng cao chất lượng ảnh được phát triển vào khoảng những năm

1955 Điều này có thể giải thích được vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện cho quá trình xử lý ảnh sô thuận lợi Năm 1964, máy tính đã có khả năng xử lý và nâng cao chất lượng ảnh từ m t trăng và vệ tinh Ranger 7 của Mỹ bao gồm: làm nổi đường biên, lưu ảnh Từ năm 1964 đến nay, các phương tiện xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng

Các phương pháp tri thức nhân tạo như mạng nơron nhân tạo, các thuật toán xử lý hiện đại và cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều kết quả khả quan

Để dễ tưởng tượng, xét các bước cần thiết trong xử lý ảnh Đầu tiên, ảnh tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu (như Camera, máy chụp ảnh) Trước đây, ảnh thu qua Camera là các ảnh tương tự (loại Camera ống kiểu CCIR) Gần đây, với sự phát triển của công nghệ, ảnh màu ho c đen trắng được lấy ra từ Camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo (Máy ảnh số hiện nay là một thí

Trang 13

dụ gần g i) M t khác, ảnh c ng có thể tiếp nhận từ vệ tinh; có thể quét từ ảnh chụp b ng máy quét ảnh

Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính như nâng cao chất lượng ảnh và phân tích ảnh

Do vậy, quá trình xử lý ảnh bao giờ c ng bắt đầu b ng công việc thu nhận ảnh và kết thúc là việc nhận dạng ảnh ho c một phán đoán theo ý nghĩa trên cơ sở nhận dạng ảnh Cụ thể, các bước cơ bản trong quá trình xử lý ảnh được thể hiện thông qua hình dưới đây:

Hình 1.1 Các bước cơ bản trong xử lý ảnh

1.2.1 Thu nhận ảnh (Image Acquisition)

Đây là bước đầu tiên trong quá trình xử lý ảnh Đầu ra của giai đoạn này là ảnh đã được số hoá Vì vậy, công việc cụ thể ở giai đoạn này là thu ảnh qua một bộ thu ảnh và số hoá những tín hiệu liên tục được sinh ra bởi bộ thu ảnh đó

Bộ thu ảnh có thể là máy chụp ảnh đơn sắc hay màu, máy quét ảnh, máy quay… Nếu bộ thu ảnh cung cấp chưa phải dạng số hoá thì phải chuyển đổi hay số hoá ảnh

Ảnh có thể nhận qua camera màu ho c đen trắng Thường ảnh nhận qua camera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh

25 dòng), c ng có loại camera đã số hoá (như loại CCD - Change Coupled Device) là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh Camera thường

Trang 14

d ng là loại quét dòng ; ảnh tạo ra có dạng hai chiều Chất lượng một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh)

1.2.2 Tiền xử lý (Image Processing)

Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào

bộ tiền xử lý để nâng cao chất lượng Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn

Mục đích của các công việc này là làm cho chất lượng ảnh trở lên tốt hơn chuẩn bị cho các bước xử lý tiếp theo

Khử nhiễu: Nhiễu được chia thành hai loại là nhiễu hệ thống và nhiễu

ngẫu nhiên Đ c trưng của nhiễu hệ thống là tính tuần hoàn Do vậy, có thể khử nhiễu hệ thống b ng việc sử dụng phép biến đổi Fourie và loại bỏ các đỉnh điểm Đối với nhiễu ngẫu nhiên, trường hợp đơn giản là các vết bẩn tương ứng với các điểm sáng hay tối thì có thể khử b ng phương pháp nội suy, lọc trung vị và lọc trung bình

Chỉnh độ tương phản: Công việc cụ thể là chỉnh sửa tính không đồng

đều của thiết bị thu nhận ho c độ tương phản giữa các v ng ảnh

1.2.3 Phân đoạn (Segmentation) hay phân vùng ảnh

Phân v ng ảnh là tách một ảnh đầu vào thành các v ng thành phần để biểu diễn phân tích, nhận dạng ảnh Ví dụ: để nhận dạng chữ (ho c mã vạch) trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ ho c tên người thành các từ, các chữ, các số (ho c các vạch) riêng biệt

để nhận dạng Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và c ng dễ gây lỗi, làm mất độ chính xác của ảnh Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này

Kết quả của bước phân đoạn ảnh thường được cho dưới dạng dữ liệu điểm ảnh thô, trong đó hàm chứa biên của v ng ảnh ho c tập hợp tất cả các điểm ảnh thuộc về chính v ng ảnh đó Trong cả hai trường hợp, sự chuyển đổi

Trang 15

dữ liệu thô này thành một dạng thích hợp hơn cho việc xử lý trong máy tính là hết sức cần thiết, nghĩa là nên biểu diễn một v ng ảnh dưới dạng biên hay dưới dạng một v ng hoàn chỉnh gồm tất cả những điểm ảnh thuộc về nó

1.2.4 Biểu diễn ảnh (Image Representation)

Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của v ng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các v ng lận cận Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo b ng máy tính Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đ c trưng (Feature Selection) gắn với việc tách các đ c tính của ảnh dưới dạng các thông tin định lượng ho c làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được

Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các

đ c trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác

Ảnh sau khi số hoá sẽ được lưu vào bộ nhớ ho c chuyển sang các khâu tiếp theo để phân tích Nếu lưu trữ ảnh trực tiếp từ các ảnh thô đòi hỏi dung lượng bộ nhớ rất lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ Thông thường, các ảnh thô đó được biểu diễn lại theo các đ c điểm của ảnh được gọi là các đ c trưng ảnh như: biên ảnh, v ng ảnh - Biểu diễn dạng biên cho một v ng ph hợp với những ứng dụng chỉ quan tâm đến các đ c trưng hình dạng bên ngoài của đối tượng

Ví dụ như các góc cạnh và điểm uốn trên biên

Biểu diễn dạng v ng thích hợp cho những ứng dụng khai thác các tính chất bên trong của đối tượng Ví dụ như vân ảnh ho c cấu trúc xương của nó

Trong một số ứng dụng thì cả hai cách biểu diễn trên đều cần thiết

1.2.5 Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)

Nhận dạng ảnh là quá trình xác định ảnh b ng cách so sánh ảnh với mẫu chuẩn đã được lưu từ trước

Trang 16

Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng ảnh

Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thư có thể nội suy thành mã điện thoại Có nhiều cách phân loại khác nhau về ảnh Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phân theo hai loại nhận dạng sau:

- Nhận dạng theo tham số

- Nhận dạng theo cấu trúc

Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa học và công nghệ là: Nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn bản, nhận dạng vân tay, nhận dạng mã vạch, nhận dạng m t người

1.2.6 Cơ sở tri thức (Knowledge Base)

Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng điểm ảnh, nhiễu do môi trường thu ảnh phong phú Trong nhiều khâu

xử lý và phân tích ảnh, ngoài việc đơn giản hoá các phương pháp toán học đảm bảo tiện lợi cho xử lý thì chúng ta luôn hướng đến việc xây dựng hệ thống tự động tiếp nhận và xử lý theo cách của con người Vì vậy, nhiều khâu hiện nay đã được xử lý theo các phương pháp trí tuệ nhân tạo, sử dụng cơ sở tri thức của con người

1.2.7 Mô tả ảnh

Từ Hình 1.1, ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, ho c chuyển sang các khâu tiếp theo để phân tích Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ Thông thường, các ảnh thô đó được đ c tả (biểu diễn) lại (hay đơn giản là mã hoá) theo các đ c điểm của ảnh được gọi là các đ c trưng ảnh (Image Features) như: biên ảnh (Boundary), v ng ảnh (Region) Một số phương pháp biểu diễn thường d ng:

Trang 17

• Biểu diễn b ng mã chạy (Run-Length Code)

• Biểu diễn b ng mã xích (Chaine -Code)

• Biểu diễn b ng mã tứ phân (Quad-Tree Code)

- Biểu diễn bằng mã chạy

Phương pháp này thường biểu diễn cho v ng ảnh và áp dụng cho ảnh nhị phân Một v ng ảnh R có thể mã hoá đơn giản nhờ một ma trận nhị phân:

U(m, n) = 1 nếu (m, n) thuộc R U( m, n) = 0 nếu (m, n) không thuộc R Trong đó: U(m n), là hàm mô tả mức xám ảnh tại tọa độ (m, n) Với cách biểu diễn trên, một v ng ảnh được mô tả b ng một tập các chuỗi số 0 ho c 1

Giả sử chúng ta mô tả ảnh nhị phân của một v ng ảnh được thể hiện theo toạ

độ (x, y) theo các chiều và đ c tả chỉ đối với giá trị “1” khi đó dạng mô tả có thể là: (x, y)r; trong đó (x, y) là toạ độ, r là số lượng các bit có giá trị “1” liên

tục theo chiều ngang ho c dọc

- Biểu diễn bằng mã tứ phân

Phương pháp mã tứ phân được d ng để mã hoá cho v ng ảnh V ng ảnh đầu tiên được chia làm bốn phần thường là b ng nhau Nếu mỗi v ng đã đồng

nhất (chứa toàn điểm đen (1) hay trắng (0)) thì gán cho v ng đó một mã và

không chia tiếp Các v ng không đồng nhất được chia tiếp làm bốn phần theo thủ tục trên cho đến khi tất cả các v ng đều đồng nhất Các mã phân chia thành các v ng con tạo thành một cây phân chia các v ng đồng nhất

Trang 18

Trên đây là các thành phần cơ bản trong các khâu xử lý ảnh Trong thực

tế, các quá trình sử dụng ảnh số không nhất thiết phải qua hết các khâu đó t y theo đ c điểm ứng dụng Hình 1.2 cho sơ đồ phân tích và xử lý ảnh và lưu đồ thông tin giữa các khối một cách khá đầy đủ Ảnh sau khi được số hóa được nén, lưu lại để truyền cho các hệ thống khác sử dụng ho c để xử lý tiếp theo

M t khác, ảnh sau khi số hóa có thể bỏ qua công đoạn nâng cao chất lượng (khi ảnh đủ chất lượng theo một yêu cầu nào đó) để chuyển tới khâu phân đoạn ho c bỏ tiếp khâu phân đoạn chuyển trực tiếp tới khâu trích chọn đ c trưng Hình 1.2 c ng chia các nhánh song song như: nâng cao chất lượng ảnh

có hai nhánh phân biệt: nâng cao chất lượng ảnh (tăng độ sáng, độ tương phản, lọc nhiễu) ho c khôi phục ảnh (hồi phục lại ảnh thật khi ảnh nhận được

Lưu ảnh

Nâng chất lượng ảnh

Phân đoạn

Phân Tích Thống Kê/

cấu trúc Ảnh tương tự

Số hóa

Thu

ảnh

Khôi phục

quan

hệ

Ảnh được cải tiến Trích chọn

đ c

tả

và Nội suy

Trang 19

1.3 Phân đoạn ảnh

Phân đoạn ảnh là một thao tác ở mức thấp và là bước then chốt trong quá trình xử lý ảnh Giai đoạn này nh m phân tích ảnh thành những v ng rời rạc có c ng tính chất nào đó dựa vào việc xác định biên và các v ng liên thông cho từng v ng Tiêu chuẩn để xác định các v ng liên thông có thể là

c ng mức xám, c ng màu hay c ng độ nhám… Các v ng ảnh này thông thường sẽ tương ứng với toàn bộ hay từng phần của đối tượng thật bên trong ảnh

Mỗi v ng ảnh là một tập hợp các điểm có c ng ho c gần c ng một tính chất nào đó như mức xám, mức màu, độ nhám… Đường bao quanh một v ng ảnh là biên ảnh Các điểm ảnh trong một v ng ảnh có độ biến thiên giá trị mức xám tương đối đồng đều hay tinh kết cấu tương đồng

Dựa vào đ c tính vật lý của ảnh người ta có nhiều kỹ thuật phân v ng như phân v ng dựa theo miền liên thông gọi là phân v ng dựa theo miền đồng nhất hay miền kề; phân v ng dựa và biên gọi là phân v ng biên Ngoài ra còn

có các kỹ thuật phân v ng khác dựa vào biên độ, dựa vào kết cấu…

1.3.1 Điểm ảnh (Picture Element)

Gốc của ảnh là ảnh liên tục về không gian và độ sáng Để xử lý ảnh

b ng máy tính thì ảnh cần phải được số hóa Số hóa ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm ph hợp với ảnh thật về vị trí và độ sáng Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng Mỗi điểm như vậy gọi là điểm ảnh – Picture Element (PEL) hay gọi tắt là Pixel Trong khuôn khổ ảnh hai

chiều, mỗi pixel ứng với c p tọa độ (x,y)

Như vậy, điểm ảnh (Pixel) là một phần tử của ảnh số tại tọa độ (x,y) với

độ xám ho c màu nhất định Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian

Trang 20

và mức xám (ho c màu) của ảnh số gần như ảnh thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh

1.3.2 Độ phân giải của ảnh

Định nghĩa

Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định

trên một ảnh số được hiển thị

Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân

bố theo trục x, y trong không gian hai chiều

Ví dụ: Độ phân giải của màn hình CGA (Color Graphic Adaptor) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh (320*200) C ng loại màn hình CGA và ở c ng độ phân giải 320*200, ta

sẽ thấy màn hình CGA 12‟‟ mịn hơn màn hình CGA 17‟‟ Lý do chính là ở

c ng một độ phân giải nhưng diện tích màn hình rộng hơn thì độ mịn hay tính

liên tục của các điểm ảnh sẽ thấp hơn

Ảnh đen trắng: là ảnh có hai màu đen trắng với mức xám ở các điểm

ảnh có thể khác nhau

Ảnh nhị phân: là ảnh chỉ có 2 mức đen trắng phân biệt d ng 1 bit mô

tả 2 mức khác nhau Như vậy, mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0

ho c 1

Trang 21

Ảnh màu: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo

nên thế giới màu người ta thường d ng 3 byte để mô tả mức màu Khi đó mỗi điểm ảnh có thể nhận số giá trị màu là 28*3

=224 ≈ 16,7 triệu màu

1.3.4 Quan hệ giữa các điểm ảnh

Một ảnh số giả sử được biểu diễn b ng hàm f(x,y) Tập con các điểm ảnh là S; c p điểm ảnh có quan hệ với nhau là p,q Để thể hiện quan hệ giữa

các điểm ảnh chúng ta có một số khái niệm sau:

1.3.4.1 Các lân cận của điểm ảnh (Image Neighbors)

Giả sử có điểm ảnh p tại tọa độ (x,y) p có 4 điểm lân cận gần nhất theo

chiều đứng và ngang (có thể coi như lân cận 4 hướng chính: Đông, Tây, Nam, Bắc)

N 4 (p) = {(x-1,y); (x,y-1); (x,y+1); (x+1,y)}

Trong đó: số 1 là giá trị logic; N 4 (p) là tập 4 điểm lân cận của p

Hình 1.3 Lân cận các điểm ảnh của tọa độ (x,y) Các điểm lân cận chéo N p (p) (Có thể coi lân cận chéo là 4 hướng:

Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc)

N p (p) = {(x+1,y+1); (x+1,y-1); (x-1,y+1); (x-1;y-1)}

Tập kết hợp: N 8 (p) = N 4 (p) + N p (p) là tập hợp 8 lân cận của điểm ảnh p

Trang 22

Chú ý: Nếu (x,y) n m ở biên ảnh thì một số điểm lân cận sẽ n m ngoài

ảnh

1.3.4.2 Khoảng cách giữa các điểm ảnh

Định nghĩa: Khoảng cách D(p,q) giữa hai điểm ảnh p tọa độ (x,y), q

tọa độ (s,t) là hàm khoảng cách (Distance) nếu:

1 D(p,q) ≥ 0 (Với D(p,q)=0 nếu và chỉ nếu p≡q)

2 D(p,q) = D(q,p)

3 D(p,z) ≤ D(p,q) + D(q,z); z là một điểm ảnh khác

Khoảng cách Euclide: Khoảng cách Euclide giữa hai điểm ảnh p(x,y)

và q(s,t) được định nghĩa như sau:

D e (p,q) = (x - s)2  (y - t)2

Khoảng cách Euclide giữa hai điểm p và q là chiều dài đoạn thẳng Trong hệ tọa độ Descartes, nếu p = (p1, p2, , pn) và q = (q1, q2, , qn) là hai điểm trong không gian Euclidn chiều, thì khoảng cách từ p đến q b ng:

Dạng chuẩn Euclid là khoảng cách của một điểm đến điểm gốc trong không gian Euclid:

trong đó phương trình sau c ng là tích vô hướng Đây là chiều dài của p, khi

ta xem nó là một Véc-tơ Euclid có gốc n m ở gốc tọa độ Khoảng cách khi đó

b ng

Trang 23

Khoảng cách khối: Khoảng cách D 4 (p,q) được gọi là khoảng cách

khối đồ thị (City – Block Distance) và được xác định như sau:

≈ 1mm

Khoảng cách hay khoảng cách nhỏ nhất của một mã khối là số kí tự khác nhau nhỏ nhất giữa hai mã tự bất kì, và khoảng cách tương đối là tỉ lệ Một cách cụ thể hơn, với hai mã tự , đ t là khoảng cách Hamming giữa và , nghĩa là số vị trí khác nhau giữa và Định nghĩa khoảng cách nhỏ nhất của mã là

Trang 24

quá lỗi, người nhận có thể sửa lỗi và tìm ra mã tự gửi đi Đó là

vì trong khoảng cách từ khối tự nhận được chỉ có đúng một mã

tự Nếu có nhiều hơn lỗi thì người nhận không thể tìm ra chính xác mã tự gửi đi Một phương thức đối phó với trường hợp này là sử dụng giải mã danh sách, trong đó người nhận liệt kê tất cả các mã tự n m trong một bán kính nhất định

Khoảng cách bàn cờ: Khoảng cách D 8 (p,q) còn gọi là khoảng cách bàn cờ (Chess-Board Distance) giữa điểm ảnh p,q được xác định như sau:

Bộ hiển thị

Bộ nhớ

Trang 25

Ảnh mức xám được áp dụng trong nhiều lĩnh vực như sinh vật học ho c trong công nghiệp Thực tế chỉ ra r ng bất kỳ ứng dụng nào trên ảnh, mức xám c ng ứng dụng được trên ảnh màu Với lý do đó, hệ thống ban đầu nên chỉ bao gồm các thiết bị thu nhận và hiển thị ảnh đen trắng Với ảnh màu, nên

sử dụng một hệ thống mới như Hình 1.4, trừ trường hợp cần một camera TV màu và một màn hình đa tần số (ví dụ như NEC MultiSync, Sony Multiscan,

ho c Mitsubishi Diamond Scan) để hiển thị ảnh màu Nếu khả năng hạn chế,

có thể d ng PC kèm theo vỉ mạch VGA và màn hình VGA, để dựng ảnh được

1.3.5 Những vấn đề khác trong xử lý ảnh

1.3.5.1 Biến đổi ảnh (Image Transform)

Trong xử lý ảnh, do số điểm ảnh lớn, các tính toán nhiều (độ phức tạp tính toán cao) đòi hỏi dung lượng bộ nhớ lớn, thời gian tính toán lâu Các phương pháp khoa học kinh điển áp dụng cho xử lý ảnh hầu hết khó khả thi

Vì vậy, chúng ta sử dụng các phép toán tương đương ho c biến đổi ảnh sang miền xử lý khác để dễ tính toán

Sau khi xử lý xong, chúng ta d ng biến đổi ngược để đưa ảnh về miền xác định ban đầu Các phép biến đổi thường g p trong xử lý ảnh gồm:

- Biến đổi Fourier, Cosin, Sin,

- Biến đổi (mô tả) ảnh b ng tích chập, tích Kronecker,

- Các biến đổi khác như KL (Karhumen Loeve), Hadamard… Một số các công cụ sác xuất thông kê c ng được sử dụng trong xử lý ảnh

1.3.5.2 Nén ảnh

Ảnh d ở dạng nào vẫn chiếm không gian nhớ rất lớn Vì vậy, khi mô

tả ảnh có thể sử dụng kỹ thuật nén ảnh để thu thu gọn dung lượng nhớ dành cho ảnh Các giai đoạn nén ảnh có thể chia ra thành 2 thế hệ là thế hệ 1và thế

Trang 26

hệ 2 Hiện nay, các chuẩn nén ảnh MPEG được d ng với ảnh đang khá phổ biến Một số phương pháp, thuật toán nén được sử dụng rộng rãi là: Mã hóa loại dài RLC, mã hóa Huffman, mã hóa LZW, mã hóa khối, phương pháp Kim tự tháp Laplace,…

1.3.5.3 Các định dạng cơ bản trong xử lý ảnh

Hình ảnh khi lưu trữ dưới dạng tệp tin sẽ được số hóa Một số dạng ảnh

đã được chuẩn hóa như: ảnh GIF, BMP, PCX, IMG,…

 Ảnh IMG: Là ảnh đen trắng, được nén theo từng dòng Mỗi dòng gồm các gói, các dòng giống nhau c ng nén thành một gói

 Ảnh PCX: Là một trong những định dạng ảnh cổ điển nhất Nó sử dụng phương pháp mã loạt dài RLE (Run Length Encoded) để nén dữ liệu ảnh Quá trình nén và giải nén được thực hiện trên từng dòng ảnh

 Ảnh TIFF: Là ảnh mà dữ liệu chứa trong tệp thường được tổ chức thành các nhóm dòng (cột) quét của dữ liệu ảnh

 Ảnh GIF: Dạng ảnh GIF cho chất lượng cao, độ phân giải đồ họa cao

và cho phép hiển thị trên hầu hết các phần cứng

Tuy các định dạng này khác nhau, song chúng đều tuân theo một cấu trúc chung nhất là gồm 3 phần:

 Mào đầu tệp (Header): Là phần chứa các thông tin về kiểu ảnh, kích thước, độ phân giải, số bit d ng cho 1 pixel, cách mã hóa, vị trí bảng màu…

 Dữ liệu nén (Data Compression): Số liệu ảnh được mã hóa bởi kiểu

mã hóa chỉ ra trong phần Header

 Bảng màu (Palette Color): Bảng màu cho biết số màu d ng trong ảnh

và sử dụng trong việc hiển thị màu của ảnh Ảnh đen trắng không nhất thiết phải có bảng màu

Trang 27

CHƯƠNG 2: PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH

Phân đoạn ảnh là bước then chốt trong xử lý ảnh Giai đoạn này nh m phân tích ảnh thành những thành phần có c ng tính chất nào đó dựa theo biên hay các v ng liên thông Tiêu chuẩn đểxác định các v ng liên thông có thể là

c ng mức xám, c ng màu hay c ng độ nhám Trước hết cần làm rõ khái niệm "v ng ảnh" (Segment) và đ c điểm vật lý của v ng V ng ảnh là một chi tiết, một thực thể trông toàn cảnh Nó là một tập hợp các điểm có c ng ho c gần c ng một tính chất nào đó : mức xám, mức màu, độ nhám… V ng ảnh là một trong hai thuộc tính của ảnh Nói đến v ng ảnh là nói đến tính chất bề

m t Đường bao quanh một v ng ảnh (Boundary) là biên ảnh Các điểm trong một v ng ảnh có độ biến thiên giá trị mức xám tương đối đồng đều hay tính kết cấu tương đồng

Dựa vào đ c tính vật lý của ảnh, người ta có nhiều kỹ thuật phân v ng : phân v ng dựa theo miền liên thông gọi là phân v ng dựa theo miền đồng nhất hay miền kề ; phân v ng dựa vào biên gọi là phân v ng biên Ngoài ra còn có các kỹ thuật phân v ng khác dựa vào biên độ, phân v ng dựa theo kết cấu

Trang 28

Tóm lại, một cái nhìn tổng quan về các phưong pháp phân đoạn ảnh như sau:

Hình 2.1 Các phương pháp phân đoạn ảnh Bảng 2.2.Ưu nhược điểm của các phương pháp phân vùng

Featured-based techniques Clustering  Phân loại không cần

giám sát

 Tồn tại các phương pháp heuristic và hữu hạn

 Không quan tâm đến các thông tin trong không gian ảnh

 Có vấn đề trong việc xác định số lượng các cụm ban đầu

 Khó khăn trong việc điều chỉnh các cụm sao cho ph hợp với

Color Image Segmentation

Trang 29

các v ng trong ảnh Adaptive Clustering  Sở hữu tính liên tục

trong không gian ảnh

và tính thích nghi cục

bộ đối với các v ng ảnh

 Sử dụng các ràng buộc

về không gian ảnh

 Cực đại hoá một xác suất hậu điều kiện có thể bị sai do các cực trị địa phương

 Hội tụ chậm

Histogram thresholding  Không cần biết trước

bất kỳ thông tin nào từ ảnh

 Các giải thuật nhanh

 Ảnh hưởng dễ dàng bởi nhiễu xuất hiện trong ảnh

Spatial-based techniques Spit and Merge  Sử dụng các thông tin

về không gian ảnh là chính

 Cho kết quả tốt với các ảnh chứa nhiều

v ng màu đồng nhất

 Định nghĩa mức độ đồng nhất về màu sắc

có thể phức tạp và khó khăn

 Quadtree có thể gây ra các kết quả không như mong muốn

Trang 30

Region growing  Các v ng ảnh đồng

nhất và liên thông

 Có một số thuật giải

có tốc độ thực thi khá nhanh

 Tốn kém chi phí sử dụng bộ nhớ và tính toán

 G p khó khăn trong việc thu thập tập các điểm mầm và xác định các điều kiện đồng nhất đầy đủ

 Chịu ảnh hưởng bởi các đ c tính tự nhiên của kỹ thuật này Graph theories  Thể hiện tốt không

gian ảnh b ng đồ thị

 Một số thuật toán có tốc độ thực hiện nhanh

 Một vài thuật giải mất khá nhiều thời gian thực hiện

 Các đ c trưng cục bộ đôi khi được sử dụng nhiều hơn các đ c trưng toàn cục

Neural networks  Mức độ song song hoá

cao và có tốc độ thực thi nhanh

 Khả năng chống chịu tốt trước các thay đổi xấu

 Một công cụ hữu hiệu

 Màu sắc có thể làm tăng độ phức tạp của mạng

 Quá trình học cần phải biết trước số lượng các phân lớp/cụm

Trang 31

cho các ứng dụng nhận dạng và xử lý ảnh y khoa

Edge-based  Là phương pháp được

hỗ trợ mạnh bởi các toán tử dò biên

 Có hiệu năng tốt với các ứng dụng dò biên đối tượng theo đường cong

 Khó khăn trong việc định nghĩa một hàm gradient cho các ảnh màu

 Nhiễu ho c các ảnh có

độ tương phản kém ảnh hưởng xấu đến kết quả phân v ng

Physics-based techniques

 Khẳng định tính chắc chắn đối với các v ng bóng sáng/tối, và v ng bóng chuyển tiếp (diffuse ho c shade)

 Phân v ng các đối tượng dựa vào thành phần vật liệu cấu tạo

 Bị giới hạn vào một số lượng nhất định các loại vật chất hình thành nên đối tượng

 Khó khăn trong việc xác định v ng bóng sáng và bóng chuyển tiếp trong các ảnh thực

 Một vài giải thuật đòi hỏi các thông tin về hình dạng đối tượng (không luôn luôn đáp

Trang 32

ứng được)

 Chi phí tính toán khá cao

Đối với bài toán truy vấn ảnh theo nội dung, bước tiền xử lý phân đoạn phải chú ý đến các thông tin tòan cục và cả cục bộ Đồng thời đảm bảo tính liên tục trong không gian ảnh Vì vậy, ở đây ta sẽ đi sâu vào các thuật toán phân đoạn: phương pháp phân đoạn yếu của B.G Prasad áp dụng trong hệ thống truy vấn ảnh của ông; phương pháp phân đoạn trung bình-k thích nghi; phương pháp phân đoạn theo ngưỡng cục bộ thích nghi

Việc chọn số lượng màu phân biệt trong không gian màu giảm là một

sự trao đổi giữa sự thể hiện và tốc độ đối với một ứng dụng riêng biệt Với chỉ mục màu hiệu quả, số lượng màu ít thì thích hợp và nó c ng làm giảm sự tính toán Dưới đây là bảng gồm 25 màu (theo giác quan) được chọn từ bảng màu RGB chuẩn

Hình 2.2 Phân đoạn ảnh

Trang 34

Phương pháp này phụ thuộc vào việc xác định các biên Màu của một pixel (màu phân biệt được b ng giác quan) có thể được mô tả b ng loại màu trong v ng màu giảm tương ứng Tiến trình phân đoạn và xử lý chọn v ng trội được trình bày b ng sơ đồ sau:

Trang 35

Hình 2.3 Sơ đồ xử lý chọn vùng và phân đoạn

L p lại cho mỗi

giá trị màu trong

Gọi hàm Fix_Boundary(img_array, col, region)

Tính diện tích (v ng hình chữ nhật) Diện tích = ((reg x1 - reg x2) * (reg y1 - reg y2)) /Image_size

Nếu Dtích > T

No_RGN ++

No_RGN<3

&^EOT

Lưu region trong mảng Region

No

Trang 36

Thủ tục này phân đoạn ảnh thành những v ng, b ng cách ánh xạ toàn

bộ pixel của ảnh lên v ng màu tương ứng trong không gian màu đã được giảm, và sau đó nhóm các pixel c ng loại với nhau Có nghĩa là: với mỗi pixel màu trên ảnh gốc, ta sẽ tìm được một màu trong 25 màu mà ta đã định nghĩa trước gần với nó nhất, nó sẽ được lưu lại và đó làm màu trong ảnh mới Ở đây, ta sẽ sử dụng khoảng cách Euclidean để tìm màu kết quả

Gọi pr, pg, pb là những giá trị cường độ màu của pixel tương ứng với

ba thành phần red, green, blue, và CiR, CiG, CiB là những giá trị màu tương ứng với nó trong bảng màu Để tính khoảng cách màu Cd, ta sử dụng khoảng cách Euclidean như sau:

để xây dựng cây chỉ mục ảnh dành cho máy tìm kiếm (seach engine)

Giải thích sơ đồ (các bước) phân đoạn và dò đường biên:

(1) Đọc ảnh và tạo một mảng ảnh chứa các thành phần màu RGB của mỗi pixel trong ảnh

(2) Với mỗi pixel trong ảnh, thực hiện:

(a) Tìm màu gần với màu của pixel trong ảnh gốc b ng cách sử dụng công thức tính Cd (với i=1,2,…,25)

Trang 37

CiR, CiG, CiB : 3 thành phần màu tại vị trí i trong bảng 25 màu

Tính được Cd min ta sẽ có giá trị i, đây chính là vị trí của màu gần nhất cần tìm

(b) Gán màu tìm được này cho pixel đang xét (ứng với Cd min)

(3) Tạo bảng tần xuất cho mỗi màu được gán (tạo histogram cho ảnh) (4) Sắp xếp bảng tần xuất theo thứ tự giảm (để xác định những v ng màu trội)

(5) L p lại từ bước 6 đến 10 cho đến khi tìm được 3 v ng màu trội ho c đến cuối bảng tần xuất

(6) Tiếp tục quét điểm ảnh theo thứ tự, dừng lại ở pixel đầu tiên có

c ng giá trị màu trong bảng tần xuất được sắp xếp

(7) Gán vị trí pixel tìm được đó vào hai biến iseed, jseed tương ứng theo chiều ngang và chiều dọc của ảnh

(8) Đánh dấu toàn bộ v ng (region) b ng cách sử dụng v ng lân cận 8 connected của pixel đó

(9) Lấy tọa độ đường biên (x,y) của v ng được đánh dấu R và vẽ hình chữ nhật biên

(10) Xác định kích thước chuẩn hóa s(R) của hình chữ nhật biên b ng công thức:

s(R) = (|x1 - x2|*|y1 - y2|)/N

Với (x1, y1) và (x2, y2) là tọa độ của tương ứng của 2 đỉnh đối nhau trong hình chữ nhật biên, N là kích thước của ảnh

Trang 38

Theo thuật toán này, để tránh việc lấy l p lại các v ng trội thì ở bước 6, sau khi chọn được pixel đầu tiên thỏa, chúng ta sẽ kiểm tra xem pixel này đã có

n m trong v ng đã xét nào hay chưa, nếu chưa thì sẽ chọn nó

Giải thuật này cho kết quả tương đối tin cậy trên nhiều loại ảnh khác nhau

Hình 2.4 Phân đoạn ảnh theo các thuật toán Trộn các vùng

Đánh giá sự khác biệt giữa các v ng

Để xác định trình tự trộn các v ng, ta xác định hàm thể hiện sự khác biệt giữa hai v ng lân cận R i m i

j

m j

R , kí hiệu là f(R i m i,

j

m j

R ) Hàm thể hiện sự khác biệt dựa vào hai thành phần: màu sắc và cạnh

 Đối với thành phần màu, giải thuật sử dụng giá trị trong không gian màu HSV vì trị này ít bị ảnh hưởng bởi sự thay đổi nguồn chiếu sáng, ví dụ như hình dạng và bóng Cụ thể, chúng tôi lấy trị trung

Trang 39

bình của thành phần trong v ng R i m i, kí hiệu h(R i m i)

 Thành phần thể hiện sự khác biệt còn lại là cạnh được biểu diễn bởi cường độ gradient Cường độ gradient chính là trị của các pixel trong IG Chúng tôi qui định ( i, m j j)

m i

R , được xác định dựa trên trị gradient của những pixel chung của hai v ng

Gọi Bij là tập pixel thuộc về ranh giới giữa hai v ng R i m i

j

m j R

, )

, ( i m j

j m i

( )

,

ij

B y

m j

m i G

B

y x

I R

(1) Với | Bij | là số pixel của tập Bij

Ta có hàm thể hiện sự khác biệt dựa vào trị Hue và độ gradient được tính như sau:

) , (

* ))

( ), ( (

* )

,

j i

j

j

m i

m j h

m i h

m j

m i

R m j j

:

|}

)()(

|360(

|,)()(min{|

))(),

(

j h m i h m

j h m i h m

j h m

i

(3) Với w1 và w2 là các hệ số h ng đã định trước Nếu hàm thể hiện sự khác biệt ( i, m j j)

m

i R R f

phụ thuộc chủ yếu vào trị Hue của màu sắc hơn là cường

độ gradient thì w1 >> w2 Dựa vào kinh nghiệm thực tiễn trên các loại ảnh khác nhau, trị của w1 và w2 tương ứng là 0.8 và 0.2

Cấu trúc đồ thị lân cận RAG

Trang 40

Giải thuật sử dụng cấu trúc đồ thị các v ng lân cận RAG để thể hiện quá trình phân v ng ảnh Đồ thị RAG thể hiện tập các v ng R i0, i = 1,…, n dưới dạng

đồ thị không hướng G = (V, E) Trong đó, V = {1, 2, …, n} với mỗi node thuộc V tương ứng với một v ng Ngoài ra, mỗi cạnh e(i,j) E nếu i, j ,V, đồng thời R i m i

j

m j R

là hai v ng liền kề Vì quá trình trộn dựa vào đồ thị G nên mỗi cạnh cần có một trọng số riêng Cụ thể, trong giải thuật, trọng số của cạnh e(i,j) chính là trị của hàm ( i, m j j)

m

i R R f

nhận được từ biểu thức tính toán (2)

Giải thuật Kruskal tìm cây khung nhỏ nhất T của đồ thị G như sau:

 Trước tiên, ta sắp các cạnh trong G theo thứ tự không giảm

 Kế đến, xét từng cạnh một trong danh sách cạnh đã sắp xếp và kiểm tra cạnh đang xét có tạo chu trình với các cạnh đã được thêm vào T không Nếu cạnh này không tạo chu trình thì đưa nó vào T, ngược lại bỏ qua và xét cạnh kế tiếp

 Giải thuật tìm cây khung T sẽ dừng khi T chứa n-1 cạnh Khi đó, T

là cây khung nhỏ nhất của đồ thị G

Trong giải thuật phân đoạn chúng ta đang khảo sát, quá trình tạo cây khung nhỏ nhất MST của đồ thị các v ng liền kề RAG chính là trình tự trộn các

Ngày đăng: 09/05/2016, 14:41

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1]. Đỗ Năng Toàn, Phạm việt Bình, Giáo trình xử lý ảnh, Đại học Thái Nguyên, 2007 Sách, tạp chí
Tiêu đề: Giáo trình xử lý ảnh
[2]. Nguyễn Ngọc Cương, Giáo trình Ngôn ngữ lập trình, Nhà xuất bản Thông tin và Truyền thông, 2011 Sách, tạp chí
Tiêu đề: Giáo trình Ngôn ngữ lập trình
Nhà XB: Nhà xuất bản Thông tin và Truyền thông
[3]. Nguyễn Quang Hoan, Giáo trình xử lý ảnh, Học viện công nghệ bưu chính viễn thông, 2006 Sách, tạp chí
Tiêu đề: Giáo trình xử lý ảnh
[4]. Ngô Quốc Tạo, Khai thác một số phương pháp tiêu biểu về trích chọn đặc trưng và khả năng ứng dụng trong nhận dạng chữ, tiếng nói, văn bản và hình ảnh. Đề tài cấp Viện, 2006-2008 Sách, tạp chí
Tiêu đề: Khai thác một số phương pháp tiêu biểu về trích chọn đặc trưng và khả năng ứng dụng trong nhận dạng chữ, tiếng nói, văn bản và hình ảnh
[5]. Đoàn Thị Phương, Nghiên cứu một số phương pháp phân đoạn ảnh màu, Luận văn thạc sĩ khoa học máy tính, Học viện Bưu chính viễn thông, 2012.Tiếng Anh Sách, tạp chí
Tiêu đề: Nghiên cứu một số phương pháp phân đoạn ảnh màu

HÌNH ẢNH LIÊN QUAN

Hình 1.1  Các bước cơ bản trong xử lý ảnh - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 1.1 Các bước cơ bản trong xử lý ảnh (Trang 13)
Hình 1.2 Sơ đồ phân tích và xử lý ảnh và lưu đồ thông tin giữa các khối - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 1.2 Sơ đồ phân tích và xử lý ảnh và lưu đồ thông tin giữa các khối (Trang 18)
Hình 2.1 Các phương pháp phân đoạn ảnh  Bảng 2.2.Ưu nhược điểm của các phương pháp phân vùng - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.1 Các phương pháp phân đoạn ảnh Bảng 2.2.Ưu nhược điểm của các phương pháp phân vùng (Trang 28)
Hình 2.3 Sơ đồ xử lý chọn vùng và phân đoạn - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.3 Sơ đồ xử lý chọn vùng và phân đoạn (Trang 35)
Hình 2.4. Phân đoạn ảnh theo các thuật toán - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.4. Phân đoạn ảnh theo các thuật toán (Trang 38)
Hình 2.9 : Một ví dụ về LBP tính toán. - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.9 Một ví dụ về LBP tính toán (Trang 54)
Hình 2.10: LBP từ ba mặt phẳng trực giao. - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.10 LBP từ ba mặt phẳng trực giao (Trang 57)
Hình 2.11: Mô tả mặt với mô hình nhị phân của địa phương. - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.11 Mô tả mặt với mô hình nhị phân của địa phương (Trang 58)
Hình 2.12 :  Ảnh trang tài liệu(bên trái) và histogram của ảnh (bên phải) - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.12 Ảnh trang tài liệu(bên trái) và histogram của ảnh (bên phải) (Trang 61)
Hình 2.16 : Tính toán giá trị phương sai bên trong một lớp ứng với tứng - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.16 Tính toán giá trị phương sai bên trong một lớp ứng với tứng (Trang 65)
Hình 2.17 : Ảnh xám của từ chứa nhiều nhiễu - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.17 Ảnh xám của từ chứa nhiều nhiễu (Trang 66)
Hình 2.18.Biểu đồ Histogram của ảnh nhiều nhiễu - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.18. Biểu đồ Histogram của ảnh nhiều nhiễu (Trang 67)
Bảng 2.4 : Định nghĩa thành phần liên thông - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Bảng 2.4 Định nghĩa thành phần liên thông (Trang 72)
Bảng 2.7 Giả mã cho thủ tục Find - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Bảng 2.7 Giả mã cho thủ tục Find (Trang 74)
Bảng 2.9. Giả mã thuật toán và gán nhãn cho các thành phần liên thông - Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Bảng 2.9. Giả mã thuật toán và gán nhãn cho các thành phần liên thông (Trang 76)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w