Nhiệm vụ nghiên cứu Nhiệm vụ cơ bản của khóa luận là tìm hiểu tổng quan về xử lý ảnh, các k thuật nâng cao chất lượng hình ảnh như các phép lọc, phép biến đổi ảnh và các phép toán số họ
Trang 1TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2 KHOA CÔNG NGHỆ THÔNG TIN
Trang 2TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2 KHOA CÔNG NGHỆ THÔNG TIN
Trang 3LỜI CẢM N
Lời đầu tiên, em xin chân thành cảm ơn PGS TS Lê Huy Thập đã trực tiếp hướng dẫn em hoàn thành khóa luận Với những lời chỉ dẫn, sự tận tình hướng dẫn của thầy đã giúp em vượt qua nhiều khó khăn trong quá trình hoàn thành khóa luận này
Em cũng xin cảm ơn Th.S Lưu Thị Bích Hương về những góp ý và hướng dẫn rất hữu ích trong quá trình thực hiện khóa luận
Em cũng xin gửi lời cảm ơn tới các thầy, cô giáo trong khoa Công nghệ Thông tin trường Đại học Sư phạm Hà Nội 2 những người đã giúp đỡ cho em trong suốt quá trình học tập và nghiên cứu
Cuối cùng, em xin bày tỏ lòng biết ơn tới gia đình và các bạn bè đã giúp đỡ, động viên em rất nhiều trong suốt quá trình học tập để em có thể thực hiện tốt khóa luận này
Hà Nội, tháng 5 năm 2014 Sinh viên thực hiện
Nguyễn Ngọc Lễ
Trang 4LỜI CAM ĐOAN
là sự nghiên cứu của riêng em, dưới sự hướng dẫn của PGS TS Lê Huy Thập
2 Khóa luận hoàn toàn không sao chép của tác giả nào khác
Nếu sai em xin hoàn toàn chịu trách nhiệm
Hà Nội, tháng 5 năm 2014 Sinh viên thực hiện
Nguyễn Ngọc Lễ
Trang 5M C L C
MỞ ĐẦU 1
CHƯ NG 1 TỔNG QUAN VỀ XỬ LÝ ẢNH 4
1.1 Xử lý ảnh là gì 4
1.2 Một số khái niệm liên quan 5
1.2.1 Điểm ảnh 5
1.2.2 Độ phân giải của ảnh 5
1.2.3 Mức xám của ảnh (Gray level) 6
1.2.4 Ảnh số 6
1.2.5 Các mối quan hệ cơ bản giữa các điểm ảnh 7
1.2.6 Lược đồ mức xám (Histogram) 9
1.2.7 Phân vùng ảnh 10
1.2.8 Trích chọn đặc tính 10
1.3 Các ứng dụng của xử lý ảnh 11
1.4 Các bước cơ bản trong xử lý ảnh 12
1.5 Các thành phần của một hệ thống xử lý ảnh 18
1.6 Các định dạng ảnh cơ bản 19
CHƯ NG 2 CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG HÌNH ẢNH 23
2.1 Các phương pháp 23
2.2 Phép tăng giảm độ sáng 24
2.3 Phép toán tăng độ tương phản (Stretching Contrast) 25
2.4 Biến đổi ảnh âm bản 28
2.5 Biến đổi ảnh màu về ảnh xám 29
2.6 Biến đổi ảnh nhị phân 30
2.7 Nâng cao chất lượng ảnh sử dụng các toán tử số học/logic 31
2.8 Các phép toán trên lược đồ xám (Histogram) 37
Trang 62.9 Các phép lọc 41
2.9.1 Lọc trung bình 41
2.9.2 Lọc trung vị 43
CHƯ NG 3 XÂY DỰNG VÀ CÀI ĐẶT CHƯ NG TRÌNH 46
3.1 Phát biểu bài toán 46
3.2 Một số hàm thủ tục 46
3.2.1 Hàm quay ảnh về ban đầu 46
3.2.2 Hàm thực hiện zoom ảnh 47
3.2.3 Xử lý trực tiếp trên ảnh 47
3.2.4 Xử lý bằng con trỏ và bộ đệm 48
3.3 Thiết kế chương trình 49
K T LUẬN VÀ HƯ NG PHÁT TRIỂN 53
TÀI LIỆU THAM KHẢO 54
Trang 7BẢNG KÝ HIỆU VI T TẮT
Ký
ADC Analog to Digital Converter Chuyển đổi tín hiệu tương tự -
số
CCIR Consultative Committee for
International Radio Tiêu chuẩn CCIR
CGA Color Graphic Adaptor Card màn hình CGA
GIF Graphics Interchange Format Ảnh định dạng GIF
JPEG Joint Photographic Experts Group Ảnh nén định dạng JPEG
LZW Lempel - Zip - Welch Phương pháp nén LZW
MPEG Moving Picture Experts Group Chuẩn MPEG
PNG Portable Network Graphics Ảnh định dạng PNG
SVGA Super Video Graphics Array Card màn hình SVGA
TIFF Tagged Image File Format Ảnh định dạng TIFF
VGA Video Graphics Adapter Card màn hình VGA
Trang 8DANH M C HÌNH ẢNH
Hình 1.1 Quá trình xử lý ảnh 4
Hình 1.2 Lân cận các điểm ảnh của tọa độ (x,y) 7
Hình 1.3 Lân cận của một điểm ảnh 8
Hình 1.4 Lược đồ mức xám 10
Hình 1.5 Các bước cơ bản trong một hệ thống xử lý ảnh 12
Hình 1.6 Sơ đồ phân tích xử lý ảnh và lưu đồ thông tin giữa các khối 17
Hình 1.7 Sơ đồ các thành phần chính của hệ thống xử lý ảnh 18
Hình 1.8 Một hệ thống xử lý ảnh 19
Hình 2.1 Các k thuật cải thiện ảnh sử dụng toán tử điểm 23
Hình 2.2 Các k thuật cải thiện ảnh sử dụng toán tử không gian 24
Hình 2.3 Ảnh gốc và ảnh kết quả sau tăng độ sáng 25
Hình 2.4 Dãn độ tương phản 26
Hình 2.5 Ảnh gốc và ảnh kết quả sau khi tăng độ tương phản 28
Hình 2.6 Biển đổi âm bản 28
Hình 2.7 a Ảnh gốc và b Ảnh kết quả sau khi biến đổi âm bản 29
Hình 2.8 Ảnh gốc và ảnh kết quả sau khi biến đổi ảnh xám 30
Hình 2.9 Ảnh gốc và ảnh kết quả sau phép biến đổi ảnh nhị phân 31
Hình 2.10 Ảnh gốc và ảnh kết quả sau khi thực hiện phép cộng 32
Hình 2.11 Ảnh gốc và ảnh kết quả sau khi thực hiện phép tr 32
Hình 2.12 Phép ND tổ hợp thông tin hai ảnh 33
Hình 2.13 Phép OR tổ hợp thông tin hai ảnh 34
Hình 2.14 Toán tử NOT tạo ảnh bù 34
Hình 2.15 Các phép toán thực hiện trên t ng điểm ảnh 35
Hình 2.16 Đưa các giá trị mức xám về đơn vị bit 36
Hình 2.17 Một số ví dụ biến đổi ảnh phép toán số học và logic 37
Hình 2.18 Đồ thị mối quan hệ mức xám và số điểm ảnh 37
Trang 9Hình 2.19 Trượt giá trị mức xám 38
Hình 2.20 Căng tổ chức đồ 39
Hình 2.21 San lấp tổ chức đồ 39
Hình 2.22 Lấy trung bình 41
Hình 2.23 Phần tử trung vị trước và sau khi s p xếp 45
Hình 3.1 Form giao diện chính 50
Hình 3.2 Form chức năng thao tác với file ảnh 50
Hình 3.3 Form chức năng chuyển ảnh 50
Hình 3.4 Form chức năng zoom ảnh 51
Hình 3.5 Form chức năng các bộ lọc – xử lý 51
Hình 3.6 Form chức năng các phép toán số học, logic 51
Hình 3.7 Thực hiện chức năng SUM (cộng) hai ảnh 52
Hình 3.8 Thực hiện chức năng chuyển ảnh sang ảnh âm bản 52
Trang 10Hơn một thập k qua có rất nhiều công trình nghiên cứu về bài toán xử
lý ảnh t ảnh đen tr ng đến ảnh màu như ngày hôm nay
Ứng dụng đầu tiên được biết đến là nâng cao chất lượng ảnh báo được truyền qua cáp t Luân Đôn đến New York t những năm 1920 Vấn đề nâng cao chất lượng ảnh có liên quan tới phân bố mức sáng và độ phân giải của ảnh Việc nâng cao chất lượng ảnh được phát triển vào khoảng những năm 1955 Điều này có thể giải thích được vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện cho quá trình xử lý ảnh số thuận lợi Năm 1964, máy tính
đã có khả năng xử lý và nâng cao chất lượng ảnh t mặt trăng và vệ tinh Ranger
7 của M bao gồm: làm nổi đường biên, lưu ảnh T năm 1964 đến nay, các phương tiện xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển không
ng ng Các phương pháp tri thức nhân tạo như mạng nơ-ron nhân tạo, các thuật toán xử lý hiện đại và cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều kết quả khả quan
Với mong muốn tiếp cận các công nghệ mới, đồng thời bổ sung kiến thức về khoa học k thuật hiện đại, cũng như tổng kết những k năng, kiến
thức trong suốt quá trình học tập tại trường, em xin chọn đề tài “N ng cao chất ư ng hình ảnh ằng c c ph p to n số học”
Trang 112
2 Mục tiêu nghiên cứu
Mục tiêu của khóa luận “N ng cao chất ư ng h nh ảnh ằng c c
ph p to n số học” là tìm hiểu, nghiên cứu về các k thuật nâng cao chất
lượng hình ảnh Đồng thời xây dựng chương trình thử nghiệm ứng dụng các phép toán vào việc nâng cao chất lượng, xử lý một bức ảnh bằng ngôn ngữ Visual C#
3 Nhiệm vụ nghiên cứu
Nhiệm vụ cơ bản của khóa luận là tìm hiểu tổng quan về xử lý ảnh, các
k thuật nâng cao chất lượng hình ảnh như các phép lọc, phép biến đổi ảnh và các phép toán số học, logic Đọc và tìm hiểu về ngôn ngữ Visual C# T đó, xây dựng một chương trình thử nghiệm để xử lý một file ảnh Thông qua chương trình các hình ảnh phải được biến đổi, xử lý một cách nhanh chóng
4 Đối tư ng nghiên cứu
Đối tượng nghiên cứu ở đây là các k thuật nâng cao chất lượng ảnh
5 Phạm vi nghiên cứu
Vấn đề nâng cao chất lượng ảnh là một vấn đề rộng lớn Vì vậy trong phạm vi khóa luận này em chỉ đi tìm hiểu những phép toán, phép biến đổi, phép lọc điển hình để nâng cao chất lượng hình ảnh, sau đó đưa vào xây dựng chương trình thử nghiệm
6 Phương ph p nghiên cứu
a Phương ph p nghiên cứu ý uận
Nghiên cứu qua việc đọc sách, báo và các tài liệu liên quan nhằm xây dựng cơ sở lý thuyết của khóa luận và các biện pháp cần thiết để giải quyết các vấn đề của khóa luận
Phương ph p chuyên gia
Tham khảo ý kiến của các chuyên gia để có thể thiết kế chương trình phù hợp với yêu cầu thực tiễn Nội dung xử lý nhanh đáp ứng được yêu cầu ngày càng cao của người sử dụng
Trang 123
c Phương ph p thực nghiệm
Thông qua quan sát thực tế, yêu cầu của cơ sở, những lý luận được nghiên cứu và kết quả đạt được qua những phương pháp trên
7 Ý nghĩa khoa học và thực tiễn
Ý ĩ k : Các k thuật nâng cao chất lượng ảnh ra đời, phát
triển và có cơ sở khoa học vững ch c, nội dung nghiên cứu của khóa luận sẽ góp phần làm rõ hơn lý thuyết nâng cao chất lượng hình ảnh và tính ứng dụng của nó Hiện nay nâng cao chất lượng ảnh là một lĩnh vực đang được các chuyên gia nghiên cứu và phát triển
Ý ĩ ự iễ : Chương trình thử nghiệm nếu thành công sẽ góp một
phần nhỏ trong việc xử lý nâng cao chất lượng hình ảnh
8 Bố cục của khóa uận
Với mục tiêu chính là tìm hiểu các k thuật nâng cao chất lượng ảnh khóa luận được trình bày trong ba chương với bố cục như sau:
Chương 1: Tổng quan về xử lý ảnh
Chương 2: Các k thuật nâng cao chất lượng hình ảnh
Chương 3: Xây dựng và cài đặt chương trình
Trang 13Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ Nó là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt
là máy tính chuyên dụng riêng cho nó
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn Kết quả đầu ra của một quá trình xử lý ảnh
có thể là một ảnh “tốt hơn” hoặc một kết luận
nh Qu tr nh l ảnh
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong không gian và nó có thể xem như một hàm n biến P (c1,c2,…, cn) Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều
Ảnh tốt hơn
Kết luận
Trang 145
1.2 M t số kh i niệm iên quan
1.2.1 Điểm ảnh
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng
Để xử lý bằng máy tính (số), ảnh cần phải được số hóa Số hóa ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám) Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho m t người không phân biệt được ranh giới giữa chúng Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi t t là Pixel Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x,y)
Kh i niệm về to n tử điểm:
Xử lý điểm ảnh thực chất là biến đổi giá trị một điểm ảnh dựa vào giá trị của chính nó mà không hề dựa vào các điểm ảnh khác Có hai cách tiệm cận với phương pháp này Cách thứ nhất dùng một hàm biến đổi thích hợp với mục đích hoặc yêu cầu đặt ra để biến đổi giá trị mức xám của điểm ảnh sang một giá trị mức xám khác Cách thứ hai là dùng lược đồ mức xám (Gray Histogram) Về mặt toán học, toán tử điểm là một ánh xạ t giá trị cường độ
ánh sáng u(m, n) tại toạ độ (m, n) sang giá trị cường độ ánh sáng khác v(m, n) thông qua hàm f(.), tức là:
v(m,n) = f(u(m,n))
Nói một cách khác, toán tử điểm là toán tử không bộ nhớ, ở đó một
mức xám u [0, N] được ánh xạ sang một mức xám v [0, N] với v = f (u)
Ứng dụng chính của các toán tử điểm là biến đổi độ tương phản của ảnh Ánh
xạ f khác nhau tùy theo các ứng dụng
Trang 156
thích hợp tạo nên một mật độ phân bố, đó chính là độ phân giải và được phân
bố theo trục x và y trong không gian hai chiều
Ví dụ: Độ phân giải của ảnh trên màn hình CG (Color Graphic daptor) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc *
200 điểm ảnh (320*200) Rõ ràng, cùng màn hình CG 12’’ ta nhận thấy mịn hơn màn hình CG 17” độ phân giải 320*200 Lý do: cùng một mật độ (độ phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn
1.2.3 Mức x m của ảnh (Gray level)
Là kết quả của sự biến đổi tương ứng một giá trị độ sáng của một điểm ảnh với một giá trị nguyên dương Thông thường nó xác định trong khoảng (0, 255) Tùy thuộc vào giá trị xám mà mỗi điểm ảnh được biểu diễn trên 1, 4,
8, 24 hay 32 bit
1.2.4 Ảnh số
Là tập hợp hữu hạn các điểm ảnh, thường được biểu diễn bằng một mảng hai chiều I(m,n) với m là số hàng, n là số cột Ta ký hiệu P(x, y) là một điểm ảnh tại vị trí (x,y) Số lượng điểm ảnh trên mỗi hàng hoặc các hàng xác định độ phân giải của ảnh Ảnh số được chia là 3 loại:
Trang 167
khác là các số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm:
đỏ (red), lục (green), lam (blue) Để biểu diễn cho mỗi điểm ảnh màu 24 bit
24 bit này được chia thành 3 khoảng 8 bit Mỗi màu cũng phân thành L cấp màu khác nhau (thường L=256) Mỗi khoảng này biểu diễn cho cường độ sáng của một trong các màu chính
Mỗi pixel ảnh màu ký hiệu Px, được viết: Px=[red, green, blue]T
1.2.5 C c mối quan hệ cơ ản giữa c c điểm ảnh
Một ảnh số giả sử được biểu diễn bằng hàm f(x,y) Tập con các điểm
ảnh là S, cặp điểm ảnh có quan hệ với nhau ký hiệu là p, q
a L n cận của m t điểm ảnh (Image Neighbors)
Giả sử có điểm ảnh p tại tọa độ (x, y), p có 4 điểm lân cận gần nhất theo chiều đứng và ngang (có thể coi như lân cận 4 hướng chính: Đông, Tây, Nam, B c)
{(x-1, y); (x, y-1); (x, y+1); (x+1, y)}= N4(p) Trong đó: số 1 là giá trị logic; N4(p) tập 4 điểm lân cận của p
nh 2 Lân cận c c điểm ảnh của tọa độ ( ,y)
- Các lân cận chéo: Các điểm lân cận chéo ND(p) (có thể coi lân cận chéo
là 4 hướng: Đông – Nam, Đông – B c, Tây – Nam, Tây – B c)
ND(p)={(x+1, y+1); (x+1, y-1); (x-1, y+1); (x-1, y-1)}
- Tập kết hợp: N8(p) = N4(p) + ND(p) là tập hợp 8 lân cận của điểm ảnh p
- Nếu (x,y) nằm ở biên (mép) ảnh, một số điểm ảnh sẽ nằm ra ngoài
Trang 178
nh 3 Lân cận của một điểm ảnh
b Liên kết giữa c c điểm ảnh
Các mối liên kết được sử dụng để xác định giới hạn (Boundaries) của đối tượng vật thể hoặc xác định vùng trong một ảnh Một liên kết được đặc trưng bởi tính liền kề giữa các điểm và mức xám của chúng
Giả sử V là tập các giá trị mức xám Một ảnh có các giá trị cường độ sáng với thang mức xám t 32 đến 64 được mô tả như sau:
V={32, 33,…, 63, 64}
Có 3 loại liên kết:
+ Liên kết 4: Hai điểm ảnh p và q được nói là liên kết 4 với các giá trị
cường độ sáng V nếu q nằm trong một các lân cận của p, tức q thuộc
N4(p)
+ Liên kết 8: Hai điểm ảnh p và q nằm trong một các lân cận 8 của p,
tức q thuộc N8(p)
+ Liên kết m (liên kết hỗn hợp): Hai điểm ảnh p và q với các giá trị
cường độ sáng V được nói là liên kết m nếu: q thuộc N4(p) hoặc q thuộc ND(p)
c Đo khoảng c ch giữa c c điểm ảnh
Định nghĩa: Khoảng cách D(p,q) giữa hai điểm ảnh p tọa độ (x,y), q
tọa độ (s,t) là hàm khoảng cách (Distance) hoặc Metric nếu:
+ D(p,q) ≥ 0 (Với D(p,q) = 0 nếu và chỉ nếu p = q) + D(p,q) = D(q,p)
+ D(p,z) ≤ D(p,q) + D(q,z); z là một điểm ảnh khác
Trang 189
Khoảng c ch Euc ide: Khoảng cách Euclide giữa hai điểm ảnh p(x,y)
và q(s,t) được định nghĩa như sau:
Lược đồ mức xám cung cấp rất nhiều thông tin về sự phân bố mức xám của ảnh Theo thuật ngữ của xử lý ảnh gọi là tính động của ảnh, tính động của ảnh cho phép phân tích một khoảng nào đó phân bố phần lớn các mức xám của ảnh: ảnh rất sáng hay rất đậm Nếu ảnh nhạt, lược đồ xám nằm bên phải (mức xám cao), còn ảnh đậm thì lược đồ xám nằm bên trái (mức xám thấp)
Trang 19Vùng ảnh là một chi tiết, một thực thể trong toàn cảnh Nói đến vùng ảnh là nói đến tính chất bề mặt của ảnh Nó là một tập hợp các điểm có cùng hoặc gần cùng một tính chất nào đó: mức xám, màu s c… Đường bao quanh một vùng ảnh (Boundary) là biên ảnh Các điểm trong một vùng ảnh có độ biến thiên giá trị mức xám tương đối đồng đều hay tính kết cấu tương đồng
Một phương pháp phân vùng ảnh là sử dụng một ngưỡng giá trị xám để phân tách ảnh thành đối tượng và nền (những điểm dưới ngưỡng xám thuộc
về nền, ngược lại thuộc về đối tượng)
1.2.8 Trích chọn đặc tính
Dựa trên các thông tin thu nhận được qua quá trình phân vùng, kết hợp với các k thuật xử lý để đưa ra các đặc trưng, đối tượng ảnh cũng như các thông tin cần thiết trong quá trình xử lý
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống
Trang 2011
1.3 C c ứng dụng của xử ý ảnh
Biến đổi ảnh (Image Transform):
Trong xử lý ảnh do số điểm ảnh lớn các tính toán nhiều (độ phức tạp tính toán cao) đòi hỏi dung lượng bộ nhớ lớn, thời gian tính toán lâu Các phương pháp khoa học kinh điển áp dụng cho xử lý ảnh hầu hết khó khả thi Người ta
sử dụng các phép toán tương đương hoặc biến đổi sang miền xử lý khác để dễ tính toán Sau khi xử lý dễ dàng hơn được thực hiện, dùng biến đổi ngược để đưa về miền xác định ban đầu, các biến đổi thường gặp trong xử lý ảnh gồm:
- Biến đổi Fourier, Cosin, Sin
- Biến đổi (mô tả) ảnh bằng tích chập, tích Kronecker (theo xử lý số tín hiệu)
- Các biến đổi khác như KL (Karhumen Loeve), Hadamard
Một số các công cụ xác suất thống kê cũng được sử dụng trong xử lý ảnh
Nén không bảo toàn thì thường có khả năng nén cao hơn nhưng khả năng phục hồi thì kém hơn Trên cơ sở hai khuynh hướng có 4 cách tiếp cận
cơ bản trong nén ảnh:
Nén ảnh thống kê: K thuật nén này dựa vào việc thống kê tần suất xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp Một ví dụ điển hình cho k thuật mã hóa này là *.TIF
Trang 2112
Nén ảnh không gian: K thuật này dựa vào vị trí không gian của các điểm ảnh để tiến hành mã hóa K thuật lợi dụng sự giống nhau của các điểm ảnh trong các vùng gần nhau Ví dụ cho k thuật này là mã nén
*.PCX
Nén ảnh sử dụng phép biến đổi: Đây là k thuật tiếp cận theo hướng nén không bảo toàn và do vậy, k thuật thường nén hiệu quả hơn *.JPG chính là tiếp cận theo k thuật nén này
Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sự lặp lại của các chi tiết K thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal
1.4 C c ước cơ ản trong xử ý ảnh
Các phương pháp xử lý ảnh b t đầu t các ứng dụng chính: nâng cao chất lượng ảnh và phân tích ảnh
Để dễ tưởng tượng, xét các bước cần thiết trong xử lý ảnh Đầu tiên, ảnh tự nhiên t thế giới ngoài được thu nhận qua các thiết bị thu (như Camera, máy chụp ảnh) Trước đây, ảnh thu qua Camera là các ảnh tương tự (loại Camera ống kiểu CCIR) Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen tr ng được lấy ra t Camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo (máy ảnh số hiện nay là một thí
dụ gần gũi) Mặt khác, ảnh cũng có thể tiếp nhận t vệ tinh, có thể quét t ảnh chụp bằng máy quét ảnh
Phân đoạn ảnh
Biểu diễn
và mô
tả
Nhận dạng
và nội suy
Cơ sở tri thức
Trang 2213
Sơ đồ này ao gồm c c thành phần sau:
a) Phần thu nhận ảnh (Image Acquisition)
Đây là bước đầu tiên trong quá trình xử lý ảnh Để thực hiện điều này,
ta cần có bộ thu ảnh và khả năng số hóa những tín hiệu liên tục được sinh ra bởi bộ thu ảnh đó Bộ thu ảnh ở đây có thể là máy chụp ảnh đơn s c hay màu, máy quét ảnh, máy quay… Trong trường hợp bộ thu ảnh cung cấp chưa phải
là dạng số hóa ta còn phải chuyển đổi hay số hóa ảnh Qúa trình chuyển đổi
DC ( nalog to Digital Converter) để thu nhận dạng số hóa của ảnh Mặc dù đây chỉ là công đoạn đầu tiên song kết quả của nó có ảnh hưởng rất nhiều đến công đoạn kế tiếp
) Tiền xử ý (Image Processing)
Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộ tiền xử lý để nâng cao chất lượng Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn
Ở bước này, ảnh sẽ được cải thiện về độ tương phản, khử nhiễu, khôi phục cảnh, n n chỉnh hình học… Với mục đích làm cho chất lượng ảnh trở
nên tốt hơn nữa, chuẩn bị cho các bước xử lý phức tạp kế tiếp sau đó
+ K ử iễu: Nhiễu được chia thành hai loại: nhiễu hệ thống và nhiễu
ngẫu nhiên Đặc trưng của nhiễu hệ thống là tính tuần hoàn Do vậy, có thể khử nhiễu này bằng việc sử dụng phép biến đổi Fourier và loại bỏ các đỉnh điểm Đối với nhiễu ngẫu nhiên, trường hợp đơn giản là các vết bẩn tương ứng với các điểm sáng hay tối, có thể khử bằng phương pháp nội suy, lọc trung vị và lọc trung bình
+ C ỉ mứ x m: Đây là k thuật nhằm chỉnh sửa tính không đồng
đều của thiết bị thu nhận hoặc độ tương phản giữa các vùng ảnh
+ C ỉ xạ: Ảnh thu nhận được t các thiết bị quang học hay điện
tử có thể bị mờ, nhòe Phương pháp biến đổi Fourier dựa trên tính chập của ảnh với hàm tán xạ cho phép giải quyết việc hiệu chỉnh này
Trang 2314
+ ắ ỉ ì : Những biến dạng hình học thường do các thiết
bị điện tử và quang học gây ra Do đó, phương pháp hiệu chỉnh ảnh dựa trên mô hình được mô tả dưới dạng phương trình biến đổi ảnh biến dạng
f(x,y) thành ảnh lý tưởng f( ’,y’) như sau:
f(x, y) f( ’, y’)
' ( , )' ( , )
x y
Trong đó hx, hy là các phương trình tuyến tính (biến dạng do phối cảnh) hay bậc hai (biến dạng do ống kính camera)
c) Ph n đoạn (Segmentation) hay ph n vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các t , các chữ, các số (hoặc các vạch) riêng biệt
để nhận dạng Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng
dễ gây lỗi, làm mất độ chính xác của ảnh Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này
d) Biểu diễn ảnh (Image Representation)
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lận cận Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính Việc chọn
các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection)
g n với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm
vi ảnh nhận được Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của t ng ký tự giúp phân biệt ký tự này với ký tự khác
e) Nhận dạng và n i suy ảnh (Image Recognition and Interpretation)
Nhận dạng ảnh là quá trình xác định ảnh Quá trình này thường thu
Trang 2415
được bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu) t trước Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thư có thể được nội suy thành mã điện thoại Có nhiều cách phân loại ảnh khác nhau về ảnh Theo lý thuyết về nhận dạng, các
mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản:
f) Cơ sở tri thức (Know edge Base)
Như đã nói ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán học đảm bảo tiện lợi cho xử lý, người ta mong muốn b t chước quy trình tiếp nhận và xử lý ảnh theo cách của con người Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con người Vì vậy, ở đây các cơ sở tri thức được phát huy
g) Mô tả ( iểu diễn ảnh)
T hình 1.5 ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp theo để phân tích Nếu lưu trữ ảnh trực tiếp t các ảnh thô, đòi hỏi dung lượng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ Thông thường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản là mã hoá) theo các đặc điểm của ảnh được gọi là các đặc trưng
ảnh (Image Features) như: biên ảnh (Boundary), vùng ảnh (Region)
Trang 2516
Một số phương pháp biểu diễn thường dùng:
• Biểu diễn bằng mã chạy (Run - Length Code)
• Biểu diễn bằng mã xích (Chaine - Code)
• Biểu diễn bằng mã tứ phân (Quad - Tree Code)
Biểu diễ mã ạy:
Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị phân Một vùng ảnh R có thể mã hoá đơn giản nhờ một ma trận nhị phân:
- U(m, n) = 1 nếu (m, n) thuộc R
- U(m,n) = 0 nếu (m, n) không thuộc R
Trong đó: U(m, n) là hàm mô tả mức xám ảnh tại tọa độ (m, n) Với
cách biểu diễn trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1 Giả sử chúng ta mô tả ảnh nhị phân của một vùng ảnh được thể hiện
theo toạ độ (x, y) theo các chiều và đặc tả chỉ đối với giá trị "1" khi đó dạng mô tả
có thể là: (x, y)r; trong đó (x, y) là toạ độ, r là số lượng các bit có giá trị "1" liên
tục theo chiều ngang hoặc dọc
Biểu diễ mã ứ :
Phương pháp mã tứ phân được dùng để mã hoá cho vùng ảnh Vùng ảnh đầu tiên được chia làm bốn phần thường là bằng nhau Nếu mỗi vùng đã đồng nhất (chứa toàn điểm đen (1) hay tr ng (0)), thì gán cho vùng đó một mã và không chia tiếp Các vùng không đồng nhất được chia tiếp làm bốn phần theo thủ tục trên cho đến khi tất cả các vùng đều đồng nhất Các mã phân chia thành các vùng con tạo thành một cây phân chia các vùng đồng nhất
Trang 2617
Trên đây là các thành phần cơ bản trong các khâu xử lý ảnh Trong thực tế, các quá trình sử dụng ảnh số không nhất thiết phải qua hết các khâu đó tùy theo đặc điểm ứng dụng Hình 1.6 cho sơ đồ phân tích và xử lý ảnh và lưu
đồ thông tin giữa các khối một cách khá đầy đủ Ảnh sau khi được số hóa được nén, lưu lại để truyền cho các hệ thống khác sử dụng hoặc để xử lý tiếp theo Mặt khác, ảnh sau khi số hóa có thể bỏ qua công đoạn nâng cao chất lượng
(khi ảnh đủ chất lượng theo một yêu cầu nào đó) để chuyển tới khâu phân đoạn hoặc bỏ tiếp khâu phân đoạn chuyển trực tiếp tới khâu trích chọn đặc
tr ng Hình 1.6 cũng chia các nhánh song song như: nâng cao chất lượng ảnh
có hai nhánh phân biệt: nâng cao chất lượng ảnh (tăng độ sáng, độ tương phản, lọc nhiễu) hoặc khôi phục ảnh (hồi phục lại ảnh thật khi ảnh nhận được bị méo)…
Hình 1.6 Sơ đ phân tích l ảnh và l u đ thông tin giữa c c kh i
Ảnh đ c cải tiến
Mô tả
và nội suy Ảnh
s Ảnh t ơng tự
Thu
ảnh
Số hóa
Nâng chất lượng ảnh
Khôi phục ảnh
Phân đoạn
Trích chọn quan
hệ
Nén
ảnh
Lưu ảnh
Phân tích thống
kê cấu trúc
Trích chọn đặc trưng
Trang 2718
1.5 Các thành phần của m t hệ thống xử ý ảnh
Hình 1.7 Sơ đ c c thành phần chính của h th ng l ảnh
Theo quan điểm của quy trình xử lý, chúng ta đã thể hiện các khối cơ
bản trên hình 1.5, các khối chi tiết và luồng thông tin trên hình 1.6 Theo quan
điểm của h th ng xử lý trên máy tính số, hệ thống gồm: các đầu đo (thu nhận
ảnh), bộ số hóa, máy tính số, bộ hiển thị, bộ nhớ
Một hệ thống xử lý ảnh cơ bản có thể gồm: máy tính cá nhân kèm theo vỉ mạch chuyển đổi đồ hoạ VG hoặc SVG , đĩa chứa các ảnh dùng để kiểm tra các thuật toán và một màn hình có hỗ trợ VG hoặc SVG Nếu điều kiện cho phép, nên có một hệ thống như hình 1.8 bao gồm một máy tính PC kèm theo thiết bị xử lý ảnh Nối với cổng vào của thiết bị thu nhận ảnh là một video camera và cổng ra nối với một màn hình Thực tế, phần lớn các nghiên cứu của chúng ta được đưa ra trên ảnh mức xám (ảnh đen tr ng) Bởi vậy, hệ thống sẽ bao gồm một thiết bị xử lý ảnh đen tr ng và một màn hình đen tr ng
Ảnh mức xám được áp dụng trong nhiều lĩnh vực như sinh vật học hoặc trong công nghiệp Thực tế chỉ ra rằng bất kỳ ứng dụng nào trên ảnh, mức xám cũng ứng dụng được trên ảnh màu Với lý do đó, hệ thống ban đầu nên chỉ bao gồm các thiết bị thu nhận và hiển thị ảnh đen tr ng Với ảnh màu, nên
sử dụng một hệ thống mới như hình 1.7, tr trường hợp bạn cần một camera
TV màu và một màn hình đa tần số (ví dụ như NEC MultiSync, Sony
Đầu đo Bộ số hóa
Bộ hiển thị Máy tính số
Bộ nhớ
Trang 2819
Multiscan, hoặc Mitsubishi Diamond Scan) để hiển thị ảnh màu Nếu khả năng hạn chế, có thể dùng PC kèm theo vỉ mạch VG và màn hình VG , để dựng ảnh được
+ Phần đầu tệp (Header): Là phần chứa thông tin về kiểu ảnh, kích thước, độ phân giải, số bit dùng cho 1 pixel, cách mã hóa, vị trí bảng màu
+ Dữ liệu nén (Data Compression): Số liệu ảnh được mã hóa bởi kiểu
mã hóa chỉ ra trong phần Header
Trang 2920
+ Bảng màu (Palette Color): Bảng màu không nhất thiết phải có, ví dụ ảnh là đen tr ng Nếu có bảng màu cho biết số màu dùng trong ảnh và bảng màu được sử dụng để hiển thị màu của ảnh
- Ảnh BMP (Bitmap): Số bit trên mỗi điểm ảnh (bit per pixel), thường
được kí hiệu bởi n Một ảnh BMP có n bit có 2nmàu Giá trị n càng lớn thì ảnh càng có nhiều màu và càng rõ nét hơn Giá trị tiêu biểu của n là 1 (ảnh đen tr ng), 4 (ảnh 16 màu), 8 (ảnh 256 màu), 16 (ảnh 65536 màu) và 24 (ảnh
16 triệu màu) Ảnh 24 bit có chất lượng hình ảnh trung thực nhất Cấu trúc gồm 3 phần: header: 54 bytes, palette: 4*n bytes (n là số màu) và data
Đặc điểm nổi bật nhất của định dạng BMP là tập tin hình ảnh thường không được nén bằng bất kì thuật toán nào Khi lưu ảnh, các điểm ảnh được ghi trực tiếp vào tập tin – một điểm ảnh sẽ được mô tả bởi một hay nhiều byte tùy thuộc vào giá trị n của ảnh Do đó, một hình ảnh lưu dưới dạng BMP thường có kích thước rất lớn, gấp nhiều lần so với các ảnh được nén (chẳng hạn GIF, JPEG hay PNG)
- Ảnh GIF (Graphics Interchange Format): Là 1 định dạng tập tin hình
ảnh bitmap cho các hình ảnh dùng ít hơn 256 màu s c khác nhau và các hoạt hình dùng ít hơn 256 màu cho mỗi khung hình GIF là định dạng nén dữ liệu đặc biệt hữu ích cho việc truyền hình ảnh qua đường truyền lưu lượng nhỏ Định dạng GIF dựa vào các bảng màu: một bảng chứa tối đa 256 màu khác nhau cho biết các màu được dùng trong hình Một trong số các màu trong bảng màu có thể được đặt trong suốt
- Ảnh JPEG (Joint Photographic Experts Group): Đây là một định dạng
ảnh được hỗ trợ bởi nhiều trình duyệt web Ảnh JPEG được phát triển để nén dung lượng và lưu trữ ảnh chụp và được sử dụng tốt nhất cho đồ họa có nhiều màu s c, ví dụ như là ảnh chụp được scan File ảnh JPEG là ảnh Bitmap được nén lại Là định dạng ảnh nén hiệu quả, có thể nén ảnh đến vài chục lần, tuy nhiên chất lượng ảnh sẽ suy giảm tỉ lệ thuận với hệ số nén (Compression) dựa
Trang 3021
trên nguyên t c loại bỏ những thông số màu để giảm thông tin cho file dựa trên xu hướng nhận thức về màu s c của m t người Do vậy JPEG còn được gọi là định dạng ảnh nén chịu thiệt Thường được dùng để lưu ảnh chụp, tất nhiên tùy theo nhu cầu mà chọn độ nén thích hợp để bảo toàn chất lượng
Có hai sự khác nhau cơ bản giữa ảnh GIF và ảnh JPEG:
+ Ảnh GIF nén lại theo cách giữ nguyên toàn bộ dữ liệu ảnh trong khi ảnh JPEG nén lại nhưng làm mất một số dữ liệu trong ảnh
+ Ảnh GIF bị giới hạn bởi số màu nhiều nhất là 256 trong khi ảnh JPEG không giới hạn số màu mà chúng sử dụng
- Ảnh WMF (Windows Metafiles): Là một tập hợp các lệnh GDI dùng
để mô tả ảnh và nội dung ảnh Có hai ưu điểm khi sử dụng ảnh WMF: kích thước file WMF nhỏ và ít phụ thuộc vào thiết bị hiển thị hơn so với ảnh Bitmap
- Ảnh PNG (Portable Network Graphics): là một dạng hình ảnh sử dụng
phương pháp nén dữ liệu mới – không làm mất đi dữ liệu gốc PNG được tạo
ra nhằm cải thiện và thay thế định dạng ảnh GIF với một định dạng hình ảnh không đòi hỏi phải có giấy phép sáng chế khi sử dụng PNG được hỗ trợ bởi thư viện tham chiếu libpng, một thư viện nền tảng độc lập bao gồm các hàm của C để quản lý các hình ảnh PNG
- Ảnh TIFF (Tagged Image File Format): là định dạng chủ yếu để lưu trữ
ảnh, bao gồm cả đồ thị lẫn hình ảnh Đầu tiên được xây dựng bởi hãng ldus kết hợp với Microsoft để dùng cho k thuật in PostScript TIFF là định dạng thông dụng cho các ảnh có dải tần số màu rộng và sâu, phát triển song song với các máy quét ảnh do đó ngày cảng trở thành một định dạng hữu dụng được dùng trong in ấn nhờ v a bảo toàn được thông tin, v a có thế chấp nhận các k thuật nén LZW, ZIP… có thể làm giảm đáng kể dung lượng T Photoshop 7.0 trở đi, ta có thể lưu được file TIFF mà vẫn bảo toàn được các
Trang 3122
lớp (nếu click option Layers khi Save as), do đó giúp cho việc lưu trữ trở nên thuận tiện
- Ảnh RAW: Là định dạng ảnh thô chưa qua xử lý hoặc chỉ chịu rất ít
ảnh hưởng bởi bộ cảm biến hình ảnh của các thiết bị nhập như máy ảnh k thuật số hay scanner, do đó nó bảo toàn được hình ảnh gần như nguyên thủy
và s n sàng cho việc biên tập cũng như in ấn tùy theo cảm nhận của người xử
lý