1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu

87 599 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 87
Dung lượng 1,32 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Xuất phát trong hoàn cảnh đó “Nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu” được em chọn làm đề tài.. Đổi tượng và phạm vi nghiên cứuĐối tượng, phạm vi nghiên cứu v

Trang 1

NGUYỄN ĐỨC TOÀN

NGHIÊN CỨU PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH

VÀ ỨNG DỤNG CHO ẢNH TÀI LIỆU

Chuyên ngành: Khoa học máy tính

Mã số: 60 48 01 01

LUẬN VĂN THẠC SĨ MÁY TÍNH

Người hướng dẫn khoa học: PGS TS NGÔ QUỐC TẠO

HÀ NỘI, 2015

Trang 2

LỜI CẢM ƠN

Trong thời gian thực hiện luận văn thạc sỹ em đã nhận được rất nhiều

sự khích lệ, động viên, giúp đỡ từ phía thày cô, cha mẹ và bạn bè xung quanh

Em xin bày tỏ lòng biết ơn chân thành nhất tới thầy giáo, PGS.TS Ngô

Quốc Tạo, người đã trực tiếp hướng dẫn em hoàn thành luận văn thạc sỹ này.

Cảm ơn đề tài: “ Hệ thống đeo tay hỗ trợ đọc sách tiếng Việt dành cho

người khiếm thị ” Mã số VAST01.07/15-16 hỗ trợ trong thực hiện luận văn.

Em xin gửi lời cảm ơn chân thành tới các thầy cô trong trường Đại học

Sư phạm Hà Nội 2

Em đã cố gắng học tập và hoàn thành luận văn thạc sỹ nhưng có thể luận văn thạc sỹ vẫn còn thiếu sót Em rất mong nhận được sự góp ý, chỉ bảo của các thầy cô và các bạn để luận văn thạc sỹ hoàn thiện hơn

Hà nội, ngày 01 tháng 07 năm 2015

Tác giả luận văn

Nguyễn Đức Toàn

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan rằng số liệu và kết quả nghiên cứu trong luận văn này

là trung thực và không trùng lặp với các đề tài khác Tôi cũng xin cam đoan rằng mọi sự giúp đõ cho việc thực hiện luận văn này đã được cảm ơn và các thông tin trích dẫn ừong luận văn đã được chỉ rõ nguồn gốc

Hà nội, ngày 01 tháng 07 năm 2015

Tác giả luận văn

Nguyễn Đức Toàn

Trang 4

MỤC LỤC

MỞ ĐẦU 8

1 Lý do chọn đề tà i 8

2 Mục đích nghiên cứu 8

3 Nhiệm vụ nghiên cứu 8

4 Đổi tượng và phạm vi nghiên cứu 9

5 Phương pháp nghiên cứu 9

CHƯƠNG 1: KHẮT NIỆM VỀ PHÂN ĐOẠN ẢNH 11

1.1 Xử lý ảnh, các vấn đề cơ bản trong xử ỉý ảnh 11

1.2 Quá trình xử lý ảnh 11

1.2.1 Thu nhận ảnh (Image Acquisition) _13 1.22 Tiền xửỉý (Image Processing) 14

1.23 Phân đoạn (Segmentation) hay phân vùng ảnh _ 14 1.2A Biểu diễn ảnh (Image Representation) 15

1.2.5 Nhận dạng và nội suy ảnh (Image Recognition and Interpretation) 15

1.2.6 Cơ sở tri thúc (Knowledge Base) 16

1.2.7 Mô tả ảnh 16

1.3 Phân đoan ảnh 19

1.3.1 Điểm ảnh (Picture Element) 19 1 3 2 Độ phân giải của ảnh _ 20 1.33 Múc xám của 1.3.4 Quan hệ giữa các điểm ảnh 21

1.3.4.1 Các lân cận của điểm ảnh (Image Neighbors) 21

1.3.4.2 Khoảng cách giữa các điểm ảnh 22

1.3.4.3 Các thành phần cơ bản của hệ thống xử lý ảnh 24

1.3.5 Những vấn đề khác trong xử lý ảnh 25

Trang 5

1.3.5.L Biến đỗi ảnh Ợmage Transform) 25

1.3.5.2 Nén ảnh 25

1.3.5.3 Các định dạng cơ bản trong xử lý ảnh 26

CHƯƠNG 2: PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH 27

Trộn các vùng 38

2.1 Phương pháp phân đoạn ảnh dựa trên miền đồng nhất 47

2.1.1 Phương pháp tách cây tứ phân 48

2.1.2 Phương pháp cục b ộ 50

2.2 Phương pháp phân đoạn ảnh dựa trên LPB (Local Binary Pattern-Mẩu nhị phân cục bộ) 52

2.2.1 LBP trong miền không gian 53

2.2.2 LBP spatiotemporal 55

2.2.3 Mô tả mặt bằng LBP 57

2.2.4 Mở rộng và các ứng dụng 59

2.3 Phương pháp phân đoạn ảnh dựa trên Histogram (Ngưỡng) 60

2.3.1 Thao tác với ảnh nhị phân 70

2.3.1.L Điểm ảnh và các điểm láng riềng 70

2.3.1.2 Connected components labeling 71

2.3.1.3 Xác định số từ trong ảnh tài liệu 78

CHƯƠNG 3: ỨNG DỤNG PHÂN ĐOẠN CHO ẢNH TÀI LIỆU 80• • •

3.1 Yêu cầu bài toán: Giải quyết bài viết của học sinh 80

3.2 Cách giải quyết yêu cầu của bài toán 80

3.3 Xây dựng DEMO 80

3.3.1 Giao diên chính; 80

3.3.2 Nhập hình ảnh 81

3.3.3 Sử dụng thuật toán Gray 81

3.3.4 Sử dụng thuật toán Segmentation 82

Trang 6

3.3.5 Sử dụng thuật toán Sobel 82

3.4 So sánh vói ảnh phong cảnh 83

3.4.1 Giao diện chính 83

3.4.2 Nhập hình ảnh 83

3.4.3 Sử dụng thuật toán Gray 84

3.4.4 Sử dụng thuật toán Segmentation 84

3.4.5 Sử dụng thuật toán Sobel 85

KẾT LUẬN VÀ KIÉN NGHỊ 86

TÀI LIỆU THAM KHẢO 87

Trang 7

DANH MỤC BẢNG*

Hình 2.1 Các phương pháp phân đoạn ảnh 28

Bảng 2.2.Ưu nhược điểm của các phương pháp phân vùng 28

Bảng 2.3 Bảng ừa màu 33

Bảng 2.3 Biểu đồ tần xuất histogram của ảnh 1 61

Bảng 2.4 : Định nghĩa thành phần liên thông 72

Bảng 2.5 Anh nhị phân và nhãn của các thảnh phần 72

Bảng 2.6 Cấu trúc Union - Find với hai tập nhãn 73

Bảng 2.7 Giả mã cho thủ tục F ind 74

Bảng 2.8 : Giả mã cho thủ tục Union 74

Bảng 2.9 Giả mã thuật toán và gán nhãn cho các thành phần liên thông 76

Bảng 2.10 ứ ng dụng thuật toán gán nhãn cho các thành phần liên thông 78

Trang 8

DANH MỤC HÌNH*

Hình 2.1 Các phương pháp phân đoạn ảnh 28

Bảng 2.2.Ưu nhược điểm của các phương pháp phân vùng 28

Bảng 2.3 Bảng ừa màu 33

Bảng 2.3 Biểu đồ tần xuất histogram của ảnh 1 61

Bảng 2.4 : Định nghĩa thành phần liên thông 72

Bảng 2.5 Anh nhị phân và nhãn của các thảnh phần 72

Bảng 2.6 Cấu trúc Union - Find với hai tập nhãn 73

Bảng 2.7 Giả mã cho thủ tục F ind 74

Bảng 2.8 : Giả mã cho thủ tục Union 74

Bảng 2.9 Giả mã thuật toán và gán nhãn cho các thành phàn liên thông 76

Bảng 2.10 ứ ng dụng thuật toán gán nhãn cho các thành phần liên thông 78

Trang 9

M Ở ĐẦU

1 Lý do chọn đề tài

Trong những năm gần đây công nghệ thông tin phát triển với tốc độ nhanh chóng Sự phát triển của công nghệ thông tin đã thúc đẩy sự phát triển của nhiều lĩnh vực xã hội khác như: y học, giáo dục, giải trí, kinh tế

Lĩnh vực xử lý ảnh cũng như công nghệ thực tại ảo đã ra đời và thâm nhập mạnh mẽ vào đời sống của con người

Anh thu được sau qua trình thu nhận ảnh hoặc các phép biến đổi không tránh khỏi nhiễu hoặc khuyết thiếu Sự sai sót này một phần bởi các thiết bị quang học và điện tử, phần khác bởi bản thân các phép biến đổi không phải là toàn ánh, nên có sự ánh xạ thiếu hụt đến những điểm trên ảnh kết quả

Việc khắc phục các nhược điểm này luôn là vấn đề đặt ra cho các hệ thống xử lý ảnh vì vậy các nhà khoa học đã phân đoạn ảnh ra để làm rõ nét hơn cho bức ảnh cần xử lý và tăng cường nâng cao chất lượng ảnh

Xuất phát trong hoàn cảnh đó “Nghiên cứu phương pháp phân đoạn

ảnh và ứng dụng cho ảnh tài liệu” được em chọn làm đề tài.

2 Mục đích nghiên cứu

Tìm hiểu tổng quan về phân đoạn ảnh, các phương pháp phân đoạn ảnh

và chọn ra phương pháp phân đoạn ảnh cụ thể

Trên cơ sở các kiến thức đã thu thập và nghiên cứu, tổng họp các kỹ thuật để hướng đến các ứng dụng thực tế phân đoạn cho ảnh tài liệu

3 Nhiệm vụ nghiên cứu

Tìm hiểu khái niệm phân đoạn ảnh

Các phương pháp phân đoạn ảnh

ứ ng dụng phương pháp phân đoạn cho ảnh tài liệu

Trang 10

4 Đổi tượng và phạm vi nghiên cứu

Đối tượng, phạm vi nghiên cứu về tổng quan về phân đoạn ảnh, các phương pháp phân đoạn ảnh và chọn ra phương pháp phân đoạn cho ảnh cụ thể và các ứng dụng thực tế phân đoạn cho ảnh tài liệu

5 Phương pháp nghiên cứu

Thu thập tài liệu, phân tích, suy luận, tổng hợp, đánh giá Từ đó đề xuất

nghiên cứu và tìm hiểu: “Nghiên cứu phương pháp phân đoạn ảnh và ủng

dụng cho ảnh tài liệu”.

Trang 11

Chương 2: Phương pháp phân đoạn ảnh

2.1 Phương pháp phân đoạn ảnh dựa ừên miền đồng nhất

2.2 Phương pháp phân đoạn ảnh dựa trên LBP (Local Binary Pattern)( MỄu nhị phân cục bộ)

2.3 Phương pháp phân đoạn ảnh dựa trên Histogram (Ngưỡng)

Chưong 3: ứng dụng phưong pháp phân đoạn cho ảnh tài liệu.

- Yêu càu bài toán: Giải quyết bài viết của học sinh

- Đặc thù của ảnh sau khi phân đoạn: là ảnh đen trắng (ảnh đơn màu)

- Thử nghiệm với các dữ liệu

Trang 12

CHƯƠNG 1: KHÁI NIỆM VÈ PHÂN ĐOẠN ẢNH

1.1 Xử lý ảnh, các vấn đề cơ bản trong xử lý ảnh.

Con người thu nhận thông tin qua các giác quan, ừong đó thị giác đóng

vai trò quan trọng nhất Xử lý ảnh là một lĩnh vực mang tính khoa học và

công nghệ Những năm ừở lại đây với sự phát triển của phần cứng máy tính,

xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tương tác người và máy

Quá trình xử lý ảnh là một quá trình thao tác nhằm phân tích, biến đổi một ảnh đầu vào để đưa ra một kết quả mong muốn Kết quả của quá trình xử

lý ảnh có thể là một ảnh tốt hơn hoặc một kết luận Điều này tùy thuộc vào mục đích yêu càu của quá trình Như vậy, mục tiêu của xử lý ảnh có thể phân làm ba hướng như sau:

■ Xử lý ảnh ban đầu để có được một ảnh mới theo yêu cầu xác định (ví

dụ như ảnh mờ cần xử lý để được ảnh rõ hơn, lọc nhiễu, phân đoạn ảnh để lấy được những yêu cầu cần thiết )

■ Phân tích ảnh để thu được các thông tin đặc trưng giúp cho việc phân loại, nhận dạng ảnh (Ví dụ như phân tích nhận dạng vân tay, nhận dạng chữ viết, nhận dạng ảnh tài liệu )

■ Đưa ra một kết luận ở mức cao hơn, sâu hơn (ví dụ như tò ảnh một tai nạn giao thông phác họa hiện trường tai nạn

1.2 Quá trình xử lý ảnh

Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ, là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuyên dụng riêng

Trang 13

Xử lý ảnh liên quan đến nhiều lĩnh vực và cần nhiều kiến thức cơ sở khác Đầu tiên phải kể đến Xử lý tín hiệu số là một môn học hết sức cơ bản cho xử lý tín hiệu chung, các khái niệm về tích chập, các biến đổi Fourier, biến đổi Laplace, các bộ lọc hữu hạn Thứ hai, các công cụ toán như Đại số tuyến tính, Xác xuất, thống kê Một số kiến thứ cần thiết như Trí tuệ nhân tao, Mạng nơron nhân tạo cũng được đề cập trong quá trình phân tích và nhận dạng ảnh Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng cao chất lượng ảnh và phân tích ảnh.

ứ ng dụng đầu tiên được biết đến là nâng cao chất lượng ảnh báo được truyền qua cáp từ Luân Đôn đến New York từ những năm 1920 vấn đề nâng cao chất lượng ảnh có liên quan tới phân bố mức sáng và độ phân giải của ảnh Việc nâng cao chất lượng ảnh được phát triển vào khoảng những năm

1955 Điều này có thể giải thích được vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện cho quá trình xử lý ảnh sô thuận lợi Năm 1964, máy tính đã có khả năng xử lý và nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao gồm: làm nổi đường biên, lưu ảnh Từ năm 1964 đến nay, các phương tiện xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng

Các phương pháp tri thức nhân tạo như mạng nơron nhân tạo, các thuật toán xử lý hiện đại và cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều kết quả khả quan

Để dễ tưởng tượng, xét các bước càn thiết ừong xử lý ảnh Đầu tiên, ảnh tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu (như Camera, máy chụp ảnh) Trước đây, ảnh thu qua Camera là các ảnh tương tự (loại Camera ống kiểu CCIR) Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen ừắng được lấy ra tò Camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo (Máy ảnh số hiện nay là một thí

Trang 14

dụ gần gũi) Mặt khác, ảnh cũng có thể tiếp nhận tò vệ tinh; có thể quét từ ảnh chụp bằng máy quét ảnh.

Các phương pháp xử lý ảnh bắt đàu từ các ứng dụng chính như nâng cao chất lượng ảnh và phân tích ảnh

Do vậy, quá trình xử lý ảnh bao giờ cũng bắt đàu bằng công việc thu nhận ảnh và kết thúc là việc nhận dạng ảnh hoặc một phán đoán theo ý nghĩa trên cơ sở nhận dạng ảnh Cụ thể, các bước cơ bản trong quá trình xử lý ảnh được thể hiện thông qua hình dưới đây:

Hình 1.1 Các bước cơ bản trong xử lỷ ảnh

1.2.1 Thu nhận ảnh (Image Acquisition)

Đây là bước đầu tiên trong quá ừình xử lý ảnh Đầu ra của giai đoạn này là ảnh đã được số hoá Vì vậy, công việc cụ thể ở giai đoạn này là thu ảnh qua một bộ thu ảnh và số hoá những tín hiệu liên tục được sinh ra bởi bộ thu ảnh đó

Bộ thu ảnh có thể là máy chụp ảnh đơn sắc hay màu, máy quét ảnh, máy quay Nếu bộ thu ảnh cung cấp chưa phải dạng số hoá thì phải chuyển đổi hay số hoá ảnh

Anh có thể nhận qua camera màu hoặc đen ừắng Thường ảnh nhận qua camera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh

25 dòng), cũng có loại camera đã số hoá (như loại CCD - Change Coupled Device) là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh Camera thường

Trang 15

dùng là loại quét dòng ; ảnh tạo ra có dạng hai chiều Chất lượng một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh).

1.2.2 Tiền xử lý (Image Processing)

Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào

bộ tiền xử lý để nâng cao chất lượng Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn

Mục đích của các công việc này là làm cho chất lượng ảnh trở lên tốt hơn chuẩn bị cho các bước xử lý tiếp theo

Khử nhiễu: Nhiễu được chia thành hai loại là nhiễu hệ thống và nhiễu

ngẫu nhiên Đặc trưng của nhiễu hệ thống là tính tuần hoàn Do vậy, có thể khử nhiễu hệ thống bằng việc sử dụng phép biến đổi Fourie và loại bỏ các đỉnh điểm Đối với nhiễu ngẫu nhiên, trường hợp đơn giản là các vết bẩn tương ứng với các điểm sáng hay tối thì có thể khử bằng phương pháp nội suy, lọc trung vị và lọc trung bình

Chỉnh độ tương phản: Công việc cụ thể là chỉnh sửa tính không đồng

đều của thiết bị thu nhận hoặc độ tương phản giữa các vùng ảnh

1.2.3 Phân đoạn (Segmentation) hay phân vùng ảnh

Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt

để nhận dạng Đây là phàn phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này

Kết quả của bước phân đoạn ảnh thường được cho dưới dạng dữ liệu điểm ảnh thô, ừong đó hàm chứa biên của vùng ảnh hoặc tập họp tất cả các điểm ảnh thuộc về chính vùng ảnh đó Trong cả hai trường hợp, sự chuyển đổi

Trang 16

dữ liệu thô này thành một dạng thích họp hơn cho việc xử lý trong máy tính là hết sức cần thiết, nghĩa là nên biểu diễn một vùng ảnh dưới dạng biên hay dưới dạng một vùng hoàn chính gồm tất cả những điểm ảnh thuộc về nó.

1.2.4 Biểu diễn ảnh (Image Representation)

Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lận cận Việc biến đổi các số liệu này thành dạng thích họp là cần thiết cho xử lý tiếp theo bằng máy tính Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được

Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác

Anh sau khi số hoá sẽ được lưu vào bộ nhớ hoặc chuyển sang các khâu tiếp theo để phân tích Nếu lưu trữ ảnh trực tiếp tò các ảnh thô đòi hỏi dung lượng bộ nhớ rất lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ Thông thường, các ảnh thô đó được biểu diễn lại theo các đặc điểm của ảnh được gọi là các đặc trưng ảnh như: biên ảnh, vùng ảnh - Biểu diễn dạng biên cho một vùng phù họp với những ứng dụng chỉ quan tâm đến các đặc trưng hình dạng bên ngoài của đối tượng

Ví dụ như các góc cạnh và điểm uốn trên biên

Biểu diễn dạng vùng thích hợp cho những ứng dụng khai thác các tính chất bên trong của đối tượng Ví dụ như vân ảnh hoặc cấu trúc xương của nó Trong một số ứng dụng thì cả hai cách biểu diễn trên đều cần thiết

1.2.5 Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)

Nhận dạng ảnh là quá trình xác định ảnh bằng cách so sánh ảnh vớimẫu chuẩn đã được lưu từ trước

Trang 17

Nội suy là phán đoán theo ý nghĩa ừên cơ sở nhận dạng ảnh.

Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thư có thể nội suy thành mã điện thoại Có nhiều cách phân loại khác nhau về ảnh Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phân theo hai loại nhận dạng sau:

- Nhận dạng theo tham số

- Nhận dạng theo cấu trúc

Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng ừong khoa học và công nghệ là: Nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn bản, nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người

1.2.6 Cơ sở tri thức (Knowledge Base)

Anh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng điểm ảnh, nhiễu do môi trường thu ảnh phong phú Trong nhiều khâu

xử lý và phân tích ảnh, ngoài việc đơn giản hoá các phương pháp toán học đảm bảo tiện lợi cho xử lý thì chúng ta luôn hướng đến việc xây dựng hệ thống tự động tiếp nhận và xử lý theo cách của con người Vì vậy, nhiều khâu hiện nay đã được xử lý theo các phương pháp trí tuệ nhân tạo, sử dụng cơ sở tri thức của con người

1.2.7 Mô tả ảnh

Từ Hình 1.1, ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp theo để phân tích Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ Thông thường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản là mã hoá) theo các đặc điểm của ảnh được gọi là các đặc trưng ảnh (Image Features) như: biên ảnh (Boundary), vùng ảnh (Region) Một số phương pháp biểu diễn thường dùng:

Trang 18

• Biểu diễn bằng mã chạy (Run-Length Code)

• Biểu diễn bằng mã xích (Chaîne -Code)

• Biểu diễn bằng mã tá phân (Quad-Tree Code)

- Biểu diễn bằng mã chạy

Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị phân Một vùng ảnh R có thể mã hoá đơn giản nhờ một ma trận nhị phân:

U(m, n) = 1 nầi (m, n) thuộc R U( m,n) = 0 nếu (m, n) không thuộc R

Trong đó: Uịm n), là hàm mô tả mức xám ảnh tại tọa độ (m, n) Với cách biểu diễn trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1

Giả sử chứng ta mô tả ảnh nhị phân của một vùng ảnh được thể hiện theo toạ

độ (x, y) theo các chiều và đặc tả chỉ đối với giá trị “1 ” khi đó dạng mô tả có thể là: (x, y)r; trong đó (x, y) là toạ độ, r là số lượng các bit có giá ừị “1 ” liên

tục theo chiều ngang hoặc dọc

- Biểu diễn bằng mã tứ phân

Phương pháp mã tứ phân được dùng để mã hoá cho vùng ảnh Vùng ảnh đầu tiên được chia làm bốn phần thường là bằng nhau Nếu mỗi vùng đã đồng

nhất (chứa toàn điểm đen (1) hay trắng (0)) thì gán cho vùng đó một mã và

không chia tiếp Các vùng không đồng nhất được chia tiếp làm bốn phần theo thủ tục trên cho đến khi tất cả các vùng đều đồng nhất Các mã phân chia thành các vùng con tạo thành một cây phân chia các vùng đồng nhất

Trang 19

Trên đây là các thành phần cơ bản trong các khâu xử lý ảnh Trong thực

tế, các quá trình sử dụng ảnh số không nhất thiết phải qua hết các khâu đó tùy theo đặc điểm ứng dụng Hình 1.2 cho sơ đồ phân tích và xử lý ảnh và lưu đồ thông tin giữa các khối một cách khá đầy đủ Ảnh sau khi được số hóa được nén, lưu lại để truyền cho các hệ thống khác sử dụng hoặc để xử lý tiếp theo Mặt khác, ảnh sau khi số hóa có thể bỏ qua công đoạn nâng cao chất lượng (khi ảnh đủ chất lượng theo một yêu cầu nào đó) để chuyển tới khâu phân đoạn hoặc bỏ tiếp khâu phân đoạn chuyển trực tiếp tới khâu trích chọn đặc trưng Hình 1.2 cũng chia các nhánh song song như: nâng cao chất lượng ảnh

có hai nhánh phân biệt: nâng cao chất lượng ảnh (tăng độ sáng, độ tương phản, lọc nhiễu) hoặc khôi phục ảnh (hồi phục lại ảnh thật khi ảnh nhận được

Trang 20

1.3 Phân đoan ảnh

Phân đoạn ảnh là một thao tác ở mức thấp và là bước then chốt ừong quá trình xử lý ảnh Giai đoạn này nhằm phân tích ảnh thành những vùng rời rạc có cùng tính chất nào đó dựa vào việc xác định biên và các vùng liên thông cho từng vùng Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng độ nhám Các vùng ảnh này thông thường sẽ tương ứng với toàn bộ hay từng phần của đối tượng thật bên trong ảnh

Mỗi vùng ảnh là một tập họp các điểm có cùng hoặc gần cùng một tính chất nào đó như mức xám, mức màu, độ nhám Đường bao quanh một vùng ảnh là biên ảnh Các điểm ảnh trong một vùng ảnh có độ biến thiên giá trị mức xám tương đối đồng đều hay tinh kết cấu tương đồng

Dựa vào đặc tính vật lý của ảnh người ta có nhiều kỹ thuật phân vùng như phân vùng dựa theo miền liên thông gọi là phân vùng dựa theo miền đồng nhất hay miền kề; phân vùng dựa và biên gọi là phân vùng biên Ngoài ra còn

có các kỹ thuật phân vùng khác dựa vào biên độ, dựa vào kết cấu

1.3.1 Điểm ảnh (Picture Element)

Gốc của ảnh là ảnh liên tục về không gian và độ sáng Để xử lý ảnh bằng máy tính thì ảnh cần phải được số hóa số hóa ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí và độ sáng Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng Mỗi điểm như vậy gọi là điểm ảnh - Picture Element (PEL) hay gọi tắt là Pixel Trong khuôn khổ ảnh hai

chiều, mỗi pixel ứng với cặp tọa độ (x,y).

Như vậy, điểm ảnh (Pixel) là một phần tử của ảnh số tại tọa độ (x,y) với

độ xám hoặc màu nhất định Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích họp sao cho mắt người cảm nhận sự liên tục về không gian

Trang 21

và mức xám (hoặc màu) của ảnh số gần như ảnh thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh.

1.3.2 Độ phân giải của ảnh

bố theo trục X , y trong không gian hai chiều

Ví dụ: Độ phân giải của màn hình CGA (Color Graphic Adaptor) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh (320*200) Cùng loại màn hình CGA và ở cùng độ phân giải 320*200, ta

sẽ thấy màn hình CGA 12” mịn hơn màn hình CGA 17” Lý do chính là ở cùng một độ phân giải nhưng diện tích màn hình rộng hơn thì độ mịn hay tính liên tục của các điểm ảnh sẽ thấp hơn

Ảnh đen trắng: là ảnh có hai màu đen trắng với mức xám ở các điểm

ảnh có thể khác nhau

Ảnh nhị phân: là ảnh chỉ có 2 mức đen trắng phân biệt dùng 1 bit mô

tả 2 mức khác nhau Như vậy, mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1

Trang 22

Ảnh màu: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế giới màu người ta thường dùng 3 byte để mô tả mức màu Khi đó mẫỉ điểm ảnh có thể nhận số giá trị màu là 28*3=224 ~ 16,7 triệu màu.

1.3.4 Quan hệ giữa các đỉểm ảnh

Một ảnh số giả sử được biểu diễn bằng hầmý(x,ỵ) Tập con các điểm ảnh là S; cặp điểm ảnh có quan hệ với nhau là p,q Để thể hiện quan hệ giữa

các điểm ảnh chúng ta có một số khái niệm sau:

1,3A,1 Các lân cận của điểm ảnh (Image Neighbors)

Giả sử có điểm ảnh p tại tọa độ (x,y) p có 4 điểm lân cận gần nhất theo

chiều đứng và ngang (có thể coi như lân cận 4 hướng chính: Đông, Tây, Nam, Bắc).

NẶp) = Ịịx-hy); (x,y-l); (x,y+l); (x+ỉty)}

Trong đó: số 1 là giá trị logic; NẶp) là tập 4 điểm lân cận của p.

Hình L3 Lân cùn các đi êm ảnh cua to tí đô (x,y)

Hình 1.3 Lân cận các điểm ảnh của tọa độ (x,ỵ)

Các điểm lân cận chéo Np(p) (Có thể coi lân cận chéo là 4 hướng:

Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc)

NP(p) = {(x + ly + l); (x + ly -l); (x-l,y+l); (x-l.y-l)ỉ

Tập kết hợp: Ns(p) - NẶp) + Np(p) là tập hợp 8 lân cận của điểm ảnh p.

Trang 23

Chú ý: Nếu (x,y) nằm ở biên ảnh thì một số điểm lân cận sẽ nằm ngoài

ảnh

I.3.4.2 Khoảng cách giữa các điểm ảnh

Định nghĩa: Khoảng cách D(p,q) giữa hai điểm ảnh p tọa độ (x,y), q

tọa độ (s,t) là hàm khoảng cách (Distance) nếu:

1 D(p,q) > 0 (Với D(p,q)=0 nểu vả chỉ nếu p —q)

2 D(p,q) = D(q,p)

3 D(p,z) <D(p,q) + D(q,z); z là một điểm ảnh khác.

Khoảng cách Euclỉde: Khoảng cách Euclide giữa hai điểm ảnh p(x,y)

và q(s,t) được định nghĩa như sau:

Đ e(p,q) = V(x-s)2+(y-t)2

Khoảng cách Euclide giữa hai điểm p và q là chiều dài đoạn thẳng p ^ Trong hệ tọa độ Descartes, nếu p = (pl, p2, , pn) và q = (ql, q2, , qn) là hai điểm ừong không gian Euclidn chiều, thì khoảng cách từ p đến q bằng:

ừong đó phương trình sau cùng là tích vô hướng Đây là chiều dài của p, khi

ta xem nó là một Véc-tơ Euclid có gốc nằm ở gốc tọa độ Khoảng cách khi đó

Trang 24

q-Khoảng cách khối: q-Khoảng cách D4(p,q) được gọi là khoảng cách

khối đồ thị (City - Block Distance) và được xác định như sau:

khối gửi đi và khối nhận được Một mã với khoảng cách d cho phép phát hiện đ — 1 lỗi vì sau khi thay đổi không quá đ — 1 vị trí của một mã tự, ta

không thể thu được một mã tự mới Ngoài ra, nếu chỉ có không

Trang 25

quá (rá — l ) / 2 lỗi, người nhận có tìiể sửa lỗi và tìm ra mã tự gửi đi Đó là

vì trong khoảng cách (rá — 1) / 2 khối tự nhận được chỉ có đúng một mã

tự Nếu có nhiều hơn (rá - 1 )/2 lỗi thì người nhận không thể tìm ra chính xác mã tự gửi đi Một phương thức đối phó với trường họp này là sử dụng giải mã danh sách, trong đó người nhận liệt kê tất cả các mã tự nằm trong một bán kính nhất định

Khoảng cách bàn cờ: Khoảng cách D8(p,q) còn gọi là khoảng cách

bàn cờ (Chess-Board Distance) giữa điểm ảnh p,q được xác định như sau:

Trang 26

Anh mức xám được áp dụng trong nhiều lĩnh vực như sinh vật học hoặc trong công nghiệp Thực tế chỉ ra rằng bất kỳ ứng dụng nào trên ảnh, mức xám cũng ứng dụng được trên ảnh màu Với lý do đó, hệ thống ban đàu nên chỉ bao gồm các thiết bị thu nhận và hiển thị ảnh đen trắng Với ảnh màu, nên

sử dụng một hệ thống mới như Hình 1.4, trừ trường hợp cần một camera TV màu và một màn hình đa tần số (ví dụ như NEC Multisync, Sony Multiscan, hoặc Mitsubishi Diamond Scan) để hiển thị ảnh màu Nếu khả năng hạn chế,

có thể dùng PC kèm theo vỉ mạch VGA và màn hình VGA, để dựng ảnh được

1.3.5 Những vấn đề khác trong xử lý ảnh

1.3.5.1 Biến đổi ảnh (Image Transform)

Trong xử lý ảnh, do số điểm ảnh lớn, các tính toán nhiều (độ phức tạp tính toán cao) đòi hỏi dung lượng bộ nhớ lớn, thời gian tính toán lâu Các phương pháp khoa học kinh điển áp dụng cho xử lý ảnh hầu hết khó khả thi

Vì vậy, chúng ta sử dụng các phép toán tương đương hoặc biến đổi ảnh sang miền xử lý khác để dễ tính toán

Sau khi xử lý xong, chúng ta dùng biến đổi ngược để đưa ảnh về miền xác định ban đầu Các phép biến đổi thường gặp trong xử lý ảnh gồm:

- Biến đổi Fourier, Cosin, Sin,

- Biến đổi (mô tả) ảnh bằng tích chập, tích Kronecker,

- Các biến đổi khác như KL (Karhumen Loeve), Hadamard Một số các công cụ sác xuất thông kê cũng được sử dụng ừong xử lýảnh

1.3.5.2 Nén ảnh

Anh dù ở dạng nào vẫn chiếm không gian nhớ rất lớn Vì vậy, khi mô

tả ảnh có thể sử dụng kỹ thuật nén ảnh để thu thu gọn dung lượng nhớ dành cho ảnh Các giai đoạn nén ảnh có thể chia ra thành 2 thế hệ là thế hệ lvà thế

Trang 27

hệ 2 Hiện nay, các chuẩn nén ảnh MPEG được dùng với ảnh đang khá phổ biến Một số phương pháp, thuật toán nén được sử dụng rộng rãi là: Mã hóa loại dài RLC, mã hóa Huffman, mã hóa LZW, mã hóa khối, phương pháp Kim tự tháp Laplace,

I.3.5.3 Các định dạng cơ bản trong xử lý ảnh

Hình ảnh khi lưu trữ dưới dạng tệp tin sẽ được số hóa Một số dạng ảnh

đã được chuẩn hóa như: ảnh GIF, BMP, PCX, IMG,

■ Ảnh IMG: Là ảnh đen trắng, được nén theo từng dòng Mỗi dòng gồm các gói, các dòng giống nhau cũng nén thành một gói

■ Ảnh PCX: Là một trong những định dạng ảnh cổ điển nhất Nó sử dụng phương pháp mã loạt dài RLE (Run Length Encoded) để nén dữ liệu ảnh Quá trình nén và giải nén được thực hiện trên từng dòng ảnh

■ Ảnh TIFF: Là ảnh mà dữ liệu chứa trong tệp thường được tổ chức thành các nhóm dòng (cột) quét của dữ liệu ảnh

■ Ảnh GIF: Dạng ảnh GIF cho chất lượng cao, độ phân giải đồ họa cao

và cho phép hiển thị trên hầu hết các phàn cứng

Tuy các định dạng này khác nhau, song chúng đều tuân theo một cấu trúc chung nhất là gồm 3 phàn:

■ Mào đầu tệp (Header): Là phần chứa các thông tin về kiểu ảnh, kích thước, độ phân giải, số bit dừng cho 1 pixel, cách mã hóa, vị trí bảng màu

■ Dữ liệu nén (Data Compression): số liệu ảnh được mã hóa bởi kiểu

mã hóa chỉ ra trong phần Header

■ Bảng màu (Palette Color): Bảng màu cho biết số màu dùng trong ảnh

và sử dụng trong việc hiển thị màu của ảnh Anh đen trắng không nhất thiết phải có bảng màu

Trang 28

CHƯƠNG 2: PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH

Phân đoạn ảnh là bước then chốt trong xử lý ảnh Giai đoạn này nhằm phân tích ảnh thành những thành phàn có cùng tính chất nào đó dựa theo biên hay các vùng liên thông Tiêu chuẩn đểxác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng độ nhám Trước hết cần làm rõ khái niệm "vùng ảnh" (Segment) và đặc điểm vật lý của vùng Vùng ảnh là một chi tiết, một thực thể trông toàn cảnh Nó là một tập hợp các điểm có cùng hoặc gần cùng một tính chất nào đó : mức xám, mức màu, độ nhám Vùng ảnh là một trong hai thuộc tính của ảnh Nói đến vùng ảnh là nói đến tính chất bề mặt Đường bao quanh một vùng ảnh (Boundary) là biên ảnh Các điểm ừong một vùng ảnh có độ biến thiên giá trị mức xám tương đối đồng đều hay tính kết cấu tương đồng

Dựa vào đặc tính vật lý của ảnh, người ta có nhiều kỹ thuật phân vùng : phân vùng dựa theo miền liên thông gọi là phân vùng dựa theo miền đồng nhất hay miền kề ; phân vùng dựa vào biên gọi là phân vùng biên Ngoài ra còn có các kỹ thuật phân vùng khác dựa vào biên độ, phân vùng dựa theo kết cấu

Trang 29

Tóm lại, một cái nhìn tổng quan về các phưong pháp phân đoạn ảnh như sau:

giám sát

■ Tồn tại các phương pháp heuristic và hữu hạn

■ Không quan tâm đến các thông tin trong không gian ảnh

■ Có vấn đề trong việc xác định số lượng các cụm ban đầu

■ Khó khăn trong việc điều chỉnh các cụm sao cho phù hợp với

Trang 30

các vùng trong ảnh.Adaptive Clustering ■ Sở hữu tính liên tục

trong không gian ảnh

và tính thích nghi cục

bộ đối với các vùng ảnh

■ Sử dụng các ràng buộc

về không gian ảnh

■ Cực đại hoá một xác suất hậu điều kiện có thể bị sai do các cực trị địa phương

■ Hội tụ chậm

Histogram thresholding ■ Không càn biết trước

bất kỳ thông tin nào từ ảnh

■ Các giải thuật nhanh

■ Ảnh hưởng dễ dàng bởi nhiễu xuất hiện ừong ảnh

Spatial-based techniquesSpit and Merge ■ Sử dụng các thông tin

về không gian ảnh là chính

■ Cho kết quả tốt với các ảnh chứa nhiều vùng màu đồng nhất

■ Định nghĩa mức độ

đồng nhất về màu sắc

có thể phức tạp và khó khăn

■ Quadtree có thể gây ra các kết quả không như mong muốn

Trang 31

Region growing ■ Cac vung anh d6ng

nhit va lien thong

■ Co mot so thuat giai

co toe do thuc thi kha nhanh

■ Ton kem chi phi su dung bo nha va tinh toan

■ Gap kho khan trong viec thu thap tap cac diem mam va xac dinh cac dieu kien dong nhat day du

■ Chiu anh hucrng boi cac dac tinh tu nhien cua ky thuat nay

Graph theories ■ Thi hien t6t khong

gian anh bang do thi

■ Mot so thuat toan co toe do thuc hien nhanh

■ Mot vai thuat giai m it kha nhieu thoi gian thuc hien

■ Cac dac trung cuc bo doi khi dugc sii dung nhieu hon cac dac trung toan cuc

Neural networks ■ Miic do song song hoa

cao va co toe do thuc thi nhanh

■ Kha nang ch6ng chiu tot truac cac thay doi xau

■ Mot cong cu huu hieu

■ Mau sac co the lam tang do phiic tap cua mang

■ Qua trinh hoc c§n phai biet truac so luang cac phan lop/cum

Trang 32

cho các ứng dụng nhận dạng và xử lý ảnh y khoa.

Edge-based ■ Là phương pháp được

hỗ trợ mạnh bởi các toán tử dò biên

■ Có hiệu năng tốt với các ứng dụng dò biên đối tượng theo đường cong

■ Khó khăn trong việc định nghĩa một hàm gradient cho các ảnh màu

■ Nhiễu hoặc các ảnh có

độ tương phản kém ảnh hưởng xấu đến kết quả phân vùng

Physics-based techniques

■ Khẳng định tính chắc chắn đối với các vùng bóng sáng/tối, và vùng bóng chuyển tiếp (diffuse hoặc shade)

■ Phân vùng các đối tượng dựa vào thành phàn vật liệu cấu tạo

■ Bị giới hạn vào một số lượng nhất định các loại vật chất hình thành nên đối tượng

■ Khó khăn trong việc xác định vùng bóng sáng và bóng chuyển tiếp ừong các ảnh thực

■ Một vài giải thuật đòi hỏi các thông tin về hình dạng đối tượng (không luôn luôn đáp

Trang 33

ứng được).

■ Chi phí tính toán khá cao

Đôi với bài toán truy vân ảnh theo nội dung, bước tiên xử lý phân đoạn phải chú ý đến các thông tin tòan cục và cả cục bộ Đồng thời đảm bảo tính liên tục trong không gian ảnh Vì vậy, ở đây ta sẽ đi sâu vào các thuật toán phân đoạn: phương pháp phân đoạn yếu của B.G Prasad áp dụng trong hệ thống truy vấn ảnh của ông; phương pháp phân đoạn trung bình-k thích nghi; phương pháp phân đoạn theo ngưỡng cục bộ thích nghi

Việc chọn số lượng màu phân biệt trong không gian màu giảm là một

sự trao đổi giữa sự thể hiện và tốc độ đối với một ứng dụng riêng biệt Với chỉ mục màu hiệu quả, số lượng màu ít thì thích họp và nó cũng làm giảm sự tính toán Dưới đây là bảng gồm 25 màu (theo giác quan) được chọn tò bảng màu RGB chuẩn

Hình 2.2 Phân đoạn ảnh

Trang 35

Phương pháp này phụ thuộc vào việc xác định các biên Màu của một pixel (màu phân biệt được bằng giác quan) có thể được mô tả bằng loại màu trong vùng màu giảm tương ứng Tiến trình phân đoạn và xử lý chọn vùng trội được trinh bày bằng sơ đồ sau:

Trang 36

G ọi hàm

F ix_B oundary(im g_array, col, region)

T ính diện tích (vùng hìn h chữ nhật) Diện tích = ((reg x l - reg x2) * (reg y l - reg y2)) /Image_size

Hình 2.3 Sơ đồ xử lỷ chọn vùng và phân đoạn

Trang 37

Thủ tục này phân đoạn ảnh thành những vùng, bằng cách ánh xạ toàn

bộ pixel của ảnh lên vùng màu tương ứng trong không gian màu đã được giảm, và sau đó nhóm các pixel cùng loại với nhau Có nghĩa là: với mỗi pixel màu trên ảnh gốc, ta sẽ tìm được một màu trong 25 màu mà ta đã định nghĩa trước gàn với nó nhất, nó sẽ được lưu lại và đó làm màu trong ảnh mới Ở đây, ta sẽ sử dụng khoảng cách Euclidean để tìm màu kết quả

Gọi pr, pg, pb là những giá trị cường độ màu của pixel tương ứng với

ba thành phần red, green, blue, và CiR, CiG, CiB là những giá trị màu tương ứng với nó trong bảng màu Để tính khoảng cách màu Cd, ta sử dụng khoảng cách Euclidean như sau:

để xây dựng cây chỉ mục ảnh dành cho máy tìm kiếm (seach engine)

Giải thích sơ đồ (các bước) phân đoạn và dò đường biên:

(1) Đọc ảnh và tạo một mảng ảnh chứa các thành phần màu RGB của mỗi pixel trong ảnh

(2) Với mỗi pixel trong ảnh, thực hiện:

(a) Tìm màu gần với màu của pixel trong ảnh gốc bằng cách sử dụng công thức tính Cd (với i= l,2, ,25)

c d = minỊ j ( p r - C mf + (pg - C iGf + (pb - c j y = 1, ,25

với pr, pg, pb : 3 thành phần màu RGB của ảnh gốc

Trang 38

CiR, CiG, CiB : 3 thành phần màu tại vị trí i ừong bảng 25màu.

Tính được Cd min ta sẽ có giá trị i, đây chính là vị trí của màu gần nhất cần tìm

(b) Gán màu tìm được này cho pixel đang xét (ứng với Cd min)

(3) Tạo bảng tần xuất cho mỗi màu được gán (tạo histogram cho ảnh).(4) Sắp xếp bảng tần xuất theo thứ tự giảm (để xác định những vùng màu trội)

(5) Lặp lại từ bước 6 đến 10 cho đến khi tìm được 3 vùng màu trội hoặc đến cuối bảng tàn xuất

(6) Tiếp tục quét điểm ảnh theo thứ tự, dừng lại ở pixel đầu tiên có cùng giá trị màu trong bảng tần xuất được sắp xếp

(7) Gán vị trí pixel tìm được đó vào hai biến iseed, jseed tương ứng theo chiều ngang và chiều dọc của ảnh

(8) Đánh dấu toàn bộ vùng (region) bằng cách sử dụng vùng lân cận 8 connected của pixel đó

(9) Lấy tọa độ đường biên (x,y) của vùng được đánh dấu R và vẽ hình chữ nhật biên

(10) Xác định kích thước chuẩn hóa s(R) của hình chữ nhật biên bằng công thức:

s(R) = (Ixl - x2l*lyl - y2l)/N

Với (xl, y l) và (x2, y2) là tọa độ của tương ứng của 2 đỉnh đối nhau ừong hình chữ nhật biên, N là kích thước của ảnh

Trang 39

Theo thuật toán này, để ừánh việc lấy lặp lại các vùng ừội thì ở bước 6, sau khi chọn được pixel đàu tiên thỏa, chúng ta sẽ kiểm tra xem pixel này đã có nằm trong vùng đã xét nào hay chưa, nếu chưa thì sẽ chọn nó.

Giải thuật này cho kết quả tương đối tin cậy trên nhiều loại ảnh khác nhau

Trang 40

bình của thành phàn trong vùng Rị , kí hiệu VhíK").

• Thành phàn thể hiện sự khác biệt còn lại là cạnh được biểu diễn bởi cường độ gradient Cường độ gradient chính là trị của các pixelừong IG Chúng tôi qui định hà ừị gradient trung bình

Ị?mi

giữa hai vùng >' và i , được xác định dựa trên trị gradient của

những pixel chung của hai vùng

Gọi Bij là tập pixel thuộc vê ranh giới giữa hai vùng ' và J ,

M g ( rì ’’Rj ) được định nghĩa như sau:

Với I Bij I là số pixel của tập Bij

Ta có hàm thể hiện sự khác biệt dựa vào ừị Hue và độ gradient được tính như sau:

Trong đó, d^ ^ Ri )) là sự chênh lệch giữa trị trung bình của Ri

rà > :

= min{ I M O - ) 1,(360-1 M O - ) I} (3)Với w l và w2 là các hệ số hằng đã định trước Nếu hàm thể hiện sự

f(R mi Rmi)

khác biệt J ‘ ’ j phụ ứiuộc chủ yêu vào ừị Hue của màu săc hơn là cường

độ gradient thì w l » w2 Dựa vào kinh nghiệm ứiực tiễn ừên các loại ảnh khác nhau, trị của wl và w2 tương ứng là 0.8 và 0.2

Cấu trúc đồ thị lân cận RAG

7

Ngày đăng: 19/08/2016, 21:01

HÌNH ẢNH LIÊN QUAN

Hình 1.1  Các bước cơ bản trong xử lỷ ảnh - Luận văn thạc sĩ nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 1.1 Các bước cơ bản trong xử lỷ ảnh (Trang 14)
Hình 1.2 Sơ đô phân tích và xử lý ảnh và lưu đô thông tin giữa các khôi - Luận văn thạc sĩ nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 1.2 Sơ đô phân tích và xử lý ảnh và lưu đô thông tin giữa các khôi (Trang 19)
Hình 2.1  Các phương pháp phân đoạn ảnh  Bảng 2.2. Ưu nhược điểm của các phương pháp phân vùng - Luận văn thạc sĩ nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.1 Các phương pháp phân đoạn ảnh Bảng 2.2. Ưu nhược điểm của các phương pháp phân vùng (Trang 29)
Hình 2.3 Sơ đồ xử lỷ chọn vùng và phân đoạn - Luận văn thạc sĩ nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.3 Sơ đồ xử lỷ chọn vùng và phân đoạn (Trang 36)
Hình 2.4. Phân đoạn ảnh theo các thuật toán - Luận văn thạc sĩ nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.4. Phân đoạn ảnh theo các thuật toán (Trang 39)
Hình 2.10: LBP từ ba mặt phẳng trực giao. - Luận văn thạc sĩ nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.10 LBP từ ba mặt phẳng trực giao (Trang 58)
Hình 2.11: Mô tả mặt với mô hình nhị phân của địa phương. - Luận văn thạc sĩ nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.11 Mô tả mặt với mô hình nhị phân của địa phương (Trang 59)
Hình 2.12 :  Ảnh trang tài lỉệu(bên trái) và histogram của ảnh (bên phải) - Luận văn thạc sĩ nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.12 Ảnh trang tài lỉệu(bên trái) và histogram của ảnh (bên phải) (Trang 62)
Hình 2.16 :  Tính toán giá trị phương sai bên trong một lớp ứng với tứng - Luận văn thạc sĩ nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.16 Tính toán giá trị phương sai bên trong một lớp ứng với tứng (Trang 66)
Hình 2.15: Biểu đồ histogram cho những giá trị màu lớn hơn ngưỡng t=3 - Luận văn thạc sĩ nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.15 Biểu đồ histogram cho những giá trị màu lớn hơn ngưỡng t=3 (Trang 66)
Hình 2.17: Ảnh xám của từ chứa nhiều nhiễu - Luận văn thạc sĩ nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.17 Ảnh xám của từ chứa nhiều nhiễu (Trang 67)
Hình 2.18.Biêu đô Histogram của ảnh nhiêu nhiêu - Luận văn thạc sĩ nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Hình 2.18. Biêu đô Histogram của ảnh nhiêu nhiêu (Trang 68)
Bảng 2.4: Định nghĩa thành phần Hên thông - Luận văn thạc sĩ nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Bảng 2.4 Định nghĩa thành phần Hên thông (Trang 73)
Bảng 2.7 Giả mã cho thủ tục Find - Luận văn thạc sĩ nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Bảng 2.7 Giả mã cho thủ tục Find (Trang 75)
Bảng 2.9.  Giả mã thuật toán và gán nhãn cho các thành phần liên thông - Luận văn thạc sĩ nghiên cứu phương pháp phân đoạn ảnh và ứng dụng cho ảnh tài liệu
Bảng 2.9. Giả mã thuật toán và gán nhãn cho các thành phần liên thông (Trang 77)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w