TÌM HIỂU VÀ VIẾT CHƯƠNG TRÌNHNHẬN DIỆN ẢNH KHIÊU DÂMLỜI MỞ ĐẦUVới sự phát triển nhanh chóng của Internet hiện nay, đó là dấu hiệu đáng mừng trước sự phát triển của công nghệ thông tin trong một xã hội hiện đại. Nhưng đằng sau nó là những hệ lụy từ Internet mang lại cho con người, trong đó đặc biệt là giới trẻ.Theo điều tra mới đây, từ Bộ thông tin Truyền thông cho thấy, thời gian truy cập Internet được nhiều em học sinh dành để chơi game trực tuyến và lướt web những trang có nội dung không lành mạnh chiếm gần 70% trong tổng số các máy truy cập net ở Việt Nam. Có thể nói, việc truy cập các trang web đồi trụy là hiện tượng khá phổ biến trong giới học sinh trung học hiện nay. Cũng theo thống kê của Google, Việt Nam đứng đầu trong số những quốc gia có nhiều người đặt lệnh tìm kiếm về tình dục nhất thế giới. Thống kê này cho thấy, một bộ phận người Việt đang sử dụng Internet một cách thiếu lành mạnh.Nói đi phải nói lại, có cầu ắt sẽ có cung. Các trang mạng xã hội như Facebook, Twister… lẽ ra là nơi giao lưu, kết bạn nhưng vô tình lại trở thành nơi để thanh thiếu niên tung các nội dung đồi trụy và cứ như thế ngày càng có nhiều clip sex được tung lên mạng; những nội dung khiêu dâm ảnh sex “tự sướng” liên tục được tung lên mạng và truyền bá đến các “cư dân” mạng đang ở tuổi “teen” bởi các thanh thiếu niên mới lớn. Điều đáng chú ý là chúng ta không thể nào có một lực lượng nhân viên đủ lớn để có thể kiểm duyệt các nội dung mà người dùng đưa lên mạng được, chính vì vậy, một giải pháp phần mềm có khả năng nhận diện được một bức ảnh có nội dung không lành mạnh hay không là điều rất cần thiết.Những gì đã dẫn chứng và phân tích ở trên chính là lí do mà chúng em quyết định chọn đề tài “Tìm hiểu và viết chương trình Nhận Diện Ảnh Khiêu Dâm”.
Trang 1TỔNG LIÊN ĐOÀN LAO ĐỘNG VIỆT NAM TRƯỜNG ĐẠI HỌC TÔN ĐỨC THẮNG KHOA CÔNG NGHỆ THÔNG TIN
ĐỒ ÁN 2
TÊN ĐỀ TÀI
TÌM HIỂU VÀ VIẾT CHƯƠNG TRÌNH
NHẬN DIỆN ẢNH KHIÊU DÂM
Giảng viên hướng dẫn : TS ABC
Sinh viên thực hiện:
Trang 2MỤC LỤC
MỤC LỤC 4
DANH MỤC CÁC TỪ VIẾT TẮT 7
DANH MỤC CÁC BẢNG BIỂU 8
DANH MỤC CÁC HÌNH ẢNH 9
LỜI MỞ ĐẦU 10
CHƯƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI 11
1.1 Phát biểu bài toán 11
1.2 Mục tiêu đề tài 11
1.3 Các khó khăn trong vấn dề nhận diện ảnh khiêu dâm 11
1.4 Cấu trúc của báo cáo đề tài 11
CHƯƠNG 2: CÁC CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN ĐẾN BÀI TOÁN NHẬN DIỆN ẢNH KHIÊU DÂM 13
2.1 Ngưỡng 13
2.2 Không gian màu (space color) 14
2.2.1 Không gian màu RGB 14
2.2.2 Không gian màu HSV 15
2.2.3 Không gian màu CYMK 16
2.3 Nhận diện ảnh khiêu dâm dựa trên không gian màu HSV 17
2.3.1 Cơ sở 17
2.3.2 Kết quả 18
CHƯƠNG 3: CƠ SỞ LÝ THUYẾT 21
3.1 Khái niệm ảnh số 21
3.1.1 Nhị phân hóa 21
3.1.2 Lược đồ Histogram 22
3.2.1 Đặc trưng ảnh Image features 24
3.2.2 Trích chọn đặc trưng Feature Extraction 24
3.2.3 Vai trò của trích chọn đặc trưng 24
3.3 Thuật toán Adaboost và đặc trưng Haarlike 25
3.3.1 Tổng quan về đặc trưng Haarlike 25
3.3.2 Thuật toán AdaBoost 27
3.3.3 Giai đoạn huấn luyện của bộ phân loại (stage) 30
3.3.4 Tầng phân loại (cascade) 31
CHƯƠNG 4: MÔ HÌNH ĐỀ XUẤT 33
Trang 34.2 Nhận diện khuôn mặt 34
4.3 Xây dựng ảnh chứa các điểm màu da 35
CHƯƠNG 5: MÔI TRƯỜNG LẬP TRÌNH VÀ GIAO DIỆN 37
5.1 Giới thiệu OpenCV 37
5.2 Giao diện chương trình minh họa 38
5.2.1 Giao diện chính 38
5.2.2 Giao diện hiển thị kết quả: 38
5.3 Thực nghiệm và kết quả 39
CHƯƠNG 6: TỔNG KẾT VÀ ĐÁNH GIÁ 40
6.1 Kết quả đạt được 40
6.2 Hạn chế 40
6.3 Hướng phát triên tiếp theo 40
Tài liệu tham khảo: 41
Trang 4Ngưỡng là giá trị ranh giới giữa các lớp, giá trị của ngưỡng
có thể điều chỉnh được thường được chọn từ thực nghiệm (Người ta thử bộ nhận dạng với các giá trị ngưỡng khác nhau
để chọn ra ngưỡng cho tỉ lệ nhận dạng đúng tốt nhất)
Weak classifier
(bộ phân loại yếu) Bộ phân loại đơn giản có độ chính xác khoảng 50%
RGB, HSV Không gian màu
Support vector
machine Học máy vector hỗ trợ
False alarm Là tỉ lệ nhận dạng sai của các bộ phân loại
Hit rate Là tỉ lệ nhận dạng đúng của bộ phân loại
Trang 5DANH MỤC CÁC BẢNG BIỂU
Bảng 2 1 Nhận dạng màu da và hiệu suất đánh giá 18
Bảng 5 1 Kết quả thực nghiệm chương trình 39
Trang 6DANH MỤC CÁC HÌNH ẢNH
Hình 2 1 Ảnh đa mức xám ban đầu 14
Hình 2 2 Ảnh đa mức xám sau 14
Hình 2 3 Không gian màu RGB 15
Hình 2 4 Không gian màu HSV 15
Hình 2 5 Hình tròn biểu diễn màu sắc 16
Hình 2 6 Không gian màu CYMK 17
Hình 3 1 Ví dụ về điểm ảnh 21
Hình 3 2 Ví dụ chuyển ảnh đa mức xám sang ảnh nhị phân 22
Hình 3 3 Ví dụ về chuyển ảnh nhị phân 22
Hình 3 4 Lược đồ Histogram 23
Hình 3 5 Histogram của ảnh tối 23
Hình 3 6 Histogram của ảnh sáng 23
Hình 3 7 Lược đồ cơ bản của AdaBoost 27
Hình 3 8 Thuật toán học AdaBoost 28
Hình 3 9 Mô hình minh họa tác vụ phát hiện vật thể dùng cascade 29
Hình 3 10 Chuỗi cascade đã được huấn luyện để phát hiện cửa sổ con phù hợp 30
Hình 3 11 Cấu trúc các chuỗi cascade song song 30
Hình 3 12 Cấu trúc các chuỗi cascade nối tiếp, với N giai đoạn học huấn luyện 31
Hình 4 1 Mô hình hệ thống nhận diện ảnh khiêu dâm 34
Hình 4 2 Sơ đồ mô tả quá trình phân loại hình ảnh 35
Hình 5 1 Cấu trúc cơ bản của OpenCV 37
Hình 5 2 Giao diện chính của chương trình 38
Hình 5 3 Giao diện kết quả chi tiết 39
Trang 7LỜI MỞ ĐẦU
Với sự phát triển nhanh chóng của Internet hiện nay, đó là dấu hiệu đáng mừng trước sự phát triển của công nghệ thông tin trong một xã hội hiện đại Nhưng đằng sau nó là những hệ lụy từ Internet mang lại cho con người, trong đó đặc biệt là giới trẻ
Theo điều tra mới đây, từ Bộ thông tin & Truyền thông cho thấy, thời gian truy cập Internet được nhiều em học sinh dành để chơi game trực tuyến và lướt web những trang có nội dung không lành mạnh chiếm gần 70% trong tổng số các máy truy cập net ở Việt Nam Có thể nói, việc truy cập các trang web đồi trụy là hiện tượng khá phổ biến trong giới học sinh trung học hiện nay Cũng theo thống kê của Google, Việt Nam đứng đầu trong số những quốc gia có nhiều người đặt lệnh tìm kiếm về tình dục nhất thế giới Thống kê này cho thấy, một bộ phận người Việt đang sử dụng Internet một cách thiếu lành mạnh
Nói đi phải nói lại, có cầu ắt sẽ có cung Các trang mạng xã hội như Facebook, Twister… lẽ ra là nơi giao lưu, kết bạn nhưng vô tình lại trở thành nơi để thanh thiếu niên tung các nội dung đồi trụy và cứ như thế ngày càng có nhiều clip sex được tung lên mạng; những nội dung khiêu dâm ảnh sex “tự sướng” liên tục được tung lên mạng và truyền bá đến các “cư dân” mạng đang ở tuổi “teen” bởi các thanh thiếu niên mới lớn Điều đáng chú ý là chúng ta không thể nào có một lực lượng nhân viên đủ lớn để có thể kiểm duyệt các nội dung mà người dùng đưa lên mạng được, chính vì vậy, một giải pháp phần mềm có khả năng nhận diện được một bức ảnh có nội dung không lành mạnh hay không là điều rất cần thiết
Những gì đã dẫn chứng và phân tích ở trên chính là lí do mà chúng em quyết
định chọn đề tài “Tìm hiểu và viết chương trình Nhận Diện Ảnh Khiêu Dâm”
Trang 8CHƯƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI
1.1 Phát biểu bài toán
Bài toán nhận diện ảnh khiêu dâm được phát biểu như sau: Đầu vào sẽ là một ảnh màu, sau đó bằng cách phát hiện khuôn mặt cũng như nhận diện và tính toán phần trăm điểm ảnh màu da trong ảnh đầu vào kết hợp với một số công thức đã được sử dụng trong các công trình nghiên cứu liên quan đã công bố trước đó để kết luận ảnh đầu vào có phải là ảnh khiêu dâm (porn) hay không khiêu dâm (non-porn)
Nghiên cứu các phương pháp giải quyết bài toán từ những công trình liên quan đã được công bố trước đây
Xây dựng một chương trình minh họa cho đề tài
1.3 Các khó khăn trong vấn dề nhận diện ảnh khiêu dâm
Bài toán nhận diện khuôn mặt nói chung cũng như dận diện ảnh khiêu dâm nói riêng cho tới nay vẫn là một thách thức khó trong lĩnh vực thị giác máy tính (Vision Computer), có thể kể tới các nguyên nhân sau:
Sự xuất hiện của các chi tiết không phải là đặc trưng của con người như cây cỏ, nhà cửa…
Chất lượng ảnh đầu vào: về độ sáng-tối, độ mờ, độ nhiễu…
…
1.4 Cấu trúc của báo cáo đề tài
Trang 9Phần mở đầu này trình bàu những nội dung tổng quát nhất về đề tài, các phần còn lại bao gồm như sau:
Chương 2: trình bày các kiến thức liên quan đến đề tài, là những gì cơ bản nhất mà người đọc có thể nắm bắt được nội dung các phần tiếp theo một cách
dễ dàng nhất
Chương 3: cơ sở lý thuyết cũng như các phương pháp hõ trợ khác được sử dụng trong đề tài
Chương 4: mô hình đề xuất để giải quyết bài toán
Chương 5: môi trường lập trình cũng như giao diện minh họa sẽ đượctrình bày trong chương này
Chương 6 trình bày các vấn đề đã giải quyết và chưa giải quyết được của đề tài này
Trang 10CHƯƠNG 2: CÁC CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN ĐẾN BÀI
TOÁN NHẬN DIỆN ẢNH KHIÊU DÂM
2.1 Ngưỡng
Nguỡng (Threshold) là một khái niệm khá quen thuộc trong xử lý ảnh cũng như rất nhiều giải thuật khác Nó dùng để chỉ một giá trị mà người ta dựa vào để phân hoạch một tập hợp thành các miền phân biệt
Ví dụ thang điểm đánh giá học sinh là từ 1 đến 10 Trong một tập hợp gồm 40 học sinh của 1 lớp, người ta muốn phân lọai ra hai miền, miền thứ nhất bao gồm các học sinh đạt yêu cầu và miền thứ hai gồm các học sinh không đạt Trong tình huống đó người ta dùng giá trị 5 (điểm) như là một ngưỡng (threshold) để phân loại học sinh Các học sinh có điểm dưới 5 sẽ xem như không đạt, những học sinh có điểm
từ 5 trở lên là đạt yêu cầu
Giá trị ngưỡng thường được xác định dựa vào những điểm đặc biệt (ví dụ ở trung bình), dựa vào kinh nghiệm khảo sát Nếu dựa vào số lượng Ngưỡng áp dụng cho cùng một tập dữ liệu người ta sẽ phân ra các phương pháp ứng dụng ngưỡng đơn, ngưỡng kép, hay đa ngưỡng Nếu dựa vào sự biến thiên của giá trị Ngưỡng, trong cùng phạm vi ứng dụng người ta sẽ phân ra các phương pháp dùng ngưỡng cố định (Constant/Fixed Threshold) và không cố định (Adaptive Threshold) Ngưỡng không
cố định nghĩa là giá trị của nó sẽ thay đổi tùy theo sự biến thiên của tập dử liệu theo không gian và thời gian Thông thường giá trị này được xác định thông qua khảo sát tập dử liệu bằng phương pháp thống kê
Để dễ hình dung hơn về ứng dụng khái niệm Threshold, sau đây chúng ta sẻ xét một
ví dụ bộ lọc ngưỡng (Threshold Filter) đơn giản trong xử lý ảnh
Trang 11Hình 2 1 Ảnh đa mức xám ban đầu Hình 2 2 Ảnh đa mức xám sau
khi thay đổi ngưỡng
Với mỗi pixel trong hình đa mức xám (grayscale) (Hình 2.1) ở trên giá trị sẽ trong khoảng 0 - 255 vậy pixel nào lớn hơn ngưỡng là 120 ta gán giá trị cho nó thành đen (0), ngược lại gán giá trị trắng (255) Kết quả thu được như Hình 2.2
2.2 Không gian màu (space color)
Không gian màu là một mô hình toán học dùng để mô tả các màu sắc trong thực tế được biểu diễn dưới dạng số học Trên thực tế có rất nhiều không gian màu khác nhau được mô hình để sử dụng vào những mục đích khác nhau Ba không gian màu cơ bản hay được nhắc tới và ứng dụng nhiều, đó là hệ không gian màu RGB, HSV và CMYK
2.2.1 Không gian màu RGB
RGB là không gian màu rất phổ biến được dùng trong đồ họa máy tính và nhiều thiết bị kĩ thuật số khác Ý tưởng chính của không gian màu này là sự kết hợp của 3 màu sắc cơ bản : màu đỏ (R, Red), xanh lục (G, Green) và xanh lơ (B, Blue)
để mô tả tất cả các màu sắc khác
Nếu như một ảnh số được mã hóa bằng 24bit, nghĩa là 8bit cho kênh R, 8bit cho kênh G, 8bit cho kênh B, thì mỗi kênh màu này sẽ nhận giá trị từ 0-255 Với mỗi giá trị khác nhau của các kênh màu kết hợp với nhau ta sẽ được một màu khác nhau, như vậy ta sẽ có tổng cộng 255x255x255 = 1.66 triệu màu sắc Ví dụ: màu đen là sự kết hợp của các kênh màu (R, G, B) với giá trị tương ứng (0, 0, 0) màu trắng có giá trị (255, 255, 255), màu vàng có giá trị (255, 255, 0), màu tím đậm có
Trang 12giá trị (64, 0, 128) Nếu ta dùng 16bit để mã hóa một kênh màu (48bit cho toàn bộ
3 kênh màu) thì dãi màu sẽ trãi rộng lên tới 3*216 = một con số rất lớn
Hình 2 3 Không gian màu RGB
2.2.2 Không gian màu HSV
HSV và cũng gần tương tự như HSL là không gian màu được dùng nhiều trong việc chỉnh sữa ảnh, phân tích ảnh và một phần của lĩnh vực thị giác máy tính (Computer Vision) Hệ không gian này dựa vào 3 thông số sau để mô tả màu sắc
H = Hue: màu sắc, S = Saturation: độ đậm đặc, sự bảo hòa, V = value: giá trị cường
độ sáng Không gian màu này thường được biểu diễn dưới dạng hình trụ hoặc hình nón
Hình 2 4 Không gian màu HSV
Trang 13Theo đó, đi theo vòng tròn từ 0 -360 độ là trường biểu diễn màu sắc (Hue) Trường này bắt đầu từ màu đỏ đầu tiên (red primary) tới màu xanh lục đầu tiên (green primary) nằm trong khoảng 0-120 độ, từ 120 - 240 độ là màu xanh lục tới xanh lơ
(green primary - blue primary) Từ 240 - 360 là từ màu đen tới lại màu đỏ
Hình 2 5 Hình tròn biểu diễn màu sắc
Theo như cách biểu diễn không gian màu theo hình trụ như trên, đi từ giá trị độ sáng (V) được biểu diễn bằng cách đi từ dưới đáy hình trụ lên và nằm trong khoảng
từ 0 -1 Ở đáy hình trụ V có giá trị là 0, là tối nhất và trên đỉnh hình trụ là độ sáng lớn nhất (V = 1) Đi từ tâm hình trụ ra mặt trụ là giá trị bão hòa của màu sắc (S) S
có giá trị từ 0 - 1 0 ứng với tâm hình trụ là chỗ mà màu sắc là nhạt nhất S = 1 ở ngoài mặt trụ, là nơi mà giá trị màu sắc là đậm đặc nhất
Như vậy với mỗi giá trị (H, S, V) sẽ cho ta một màu sắc mà ở đó mô tả đầy đủ thông tin về màu sắc, độ đậm đặc và độ sáng của màu đó
2.2.3 Không gian màu CYMK
CMYK là không gian màu được sử dụng phổ biến trong ngành công nghiệp
in ấn.Ý tưởng cơ bản của hệ không gian này là dùng 4 màu sắc cơ bản để phục vụ cho việc pha trộn mực in Trên thực tế, người ta dùng 3 màu là C=Cyan: xanh lơ, M=Magenta: hồng xẫm, và Y=Yellow: vàng để biểu diễn các màu sắc khác nhau Nếu lấy màu hồng xẫm cộng với vàng sẽ ra màu đỏ, màu xẫm kết hợp với xanh lơ
Trang 14sẽ cho xanh lam Sự kết hợp của 3 màu trên sẽ cho ra màu đen, tuy nhiên màu đen
ở đây khôn phải là đen tuyệt đối và thường có độ tương phản lớn, nên trong ngành
in, để tiết kiệm mực in người ta thêm vào màu đen để in những chi tiết có màu đen thay vì phải kết hợp 3 màu sắc trên Và như vậy ta có hệ màu CMYK chữ K ở đây
là để kí hiệu màu đen (Black), có nhẽ chữ B đã được dùng để biểu diễn màu Blue nên người ta lấy chữ cái cuối K để biểu diễn màu đen? Nguyên lý làm việc của hệ màu này như sau : Trên một nền giấy trắng, khi mỗi màu này được in lên sẽ loại bỏ dần đi thành phần màu trắng 3 màu C, M, Y khác nhau
in theo những tỉ lệ khác nhau sẽ loại bỏ đi thành phần đó một cách khác nhau và cuối cùng cho ta màu sắc cần in Khi cần in màu đen, thay vì phải in cả 3 màu người
ta dùng màu đen để in lên Nguyên lý này khác với nguyên lý làm việc của hệ RGB
ở chỗ hệ RGB là sự kết hợp của các thành phần màu, còn hệ CMYK là sự loại bỏ lẫn nhau của các thành phần màu
Hình 2 6 Không gian màu CYMK 2.3 Nhận diện ảnh khiêu dâm dựa trên không gian màu HSV
2.3.1 Cơ sở
Đối với một hình ảnh, mỗi điểm ảnh được phân loại là màu da hay không phải màu da dựa vào thông tin màu sắc Nếu giá trị H-S của điểm ảnh vượt quá một ngưỡng nào đó được gọi là skinthreshold (thu được bằng thực nghiệm) thì điểm ảnh
đó được coi là một điểm ảnh màu da, ngược lại nó được coi là điểm ảnh không phải màu da
Trang 15Để phát hiện hình ảnh con người, da là một trong những tính năng quan trọng nhất
mà chúng ta phải lọc ra Đối với ảnh khiêu dâm, tính năng này càng quan trọng hơn khi mà nhiều vùng da được lộ ra Vì vậy, một chương trình đơn giản và chính xác
để lọc da từ hình ảnh nguyên vẹn là cần thiết trong việc xây dựng hệ thống nhận diện ảnh khiêu dâm Phát hiện điểm ảnh da có thể dựa trên không gian màu RGB (Red, Green, Blue) khi màu da nằm trong khoảng R>G hoặc là cả 2 RGB và HSV (Hue, Saturation, Value) là 2 không gian màu phổ biến cho nhận diện vùng da 2.3.2 Kết quả
Một chương trình viết bằng Java chophương pháp này chấp nhận các định dạng hình ảnh JPEG và GIF – định dạng phổ biến trên mạng Internet Nó thực hiện phân khúc HSV bằng cách sử dụng các thuật toán phân đoạn và gom cụm màu da
Nó tính tỉ lệ phần trăm màu da của con người trong ảnh và tạo ra một đánh giá cho biết nếu nó chủ yếu là da thì là ảnh khiêu dâm hoặc có một mức độ chấp nhận được thì là ảnh thường Xem xét các bức ảnh thể hiện trong Bảng 2.1, nếu tỉ lệ phần trăm màu da từ 5% đến 20% thì hệ thống sẽ xác định đó là một bộ phận của cơ thể con người và sẽ đánh giá đó là ảnh thường Nếu tỉ lệ phần trăm màu da hơn 20% thì nhiều khả năng đó là ảnh khiêu dâm và hệ thống sẽ giữ lại để giám sát
Bảng 2 1 Nhận dạng màu da và hiệu suất đánh giá
Ảnh đầu vào Ảnh đã phân loại Điểm
ảnh
% (điểm ảnh da) Nhận định
6225 6.76 Ảnh bình
thường
Trang 1658729 25.94
Gần giống ảnh khiêu dâm
Trang 18CHƯƠNG 3: CƠ SỞ LÝ THUYẾT
3.1 Khái niệm ảnh số
Ảnh số được tạo nên từ hàng trăm ngàn cho đến hàng triệu ô vuông rất nhỏ- được coi là những thành tố của bức ảnh và thường được biết dưới tên gọi là pixels Máy tính hay máy in sử dụng những ô vuông nhỏ này để hiển thị hay in ra bức ảnh
Để làm được điều đó máy tính hay máy in chia màn hình, trang giấy thành một mạng lưới chứa các ô vuông, sau đó sử dụng các giá trị chứa trong file ảnh để định
ra mầu sắc, độ sáng tối của từng pixel trong mạng lưới đó - ảnh số được hình thành
Việc kiểm soát, định ra địa chỉ theo mạng lưới như trên được gọi là bit mapping và ảnh số còn được gọi là ảnh bit-maps
Tấm hình 2 chiều liên tục a(x, y) được chia thành N hàng và M cột Giao điểm của một hàng và một cột được gọi là điểm ảnh Giá trị được gán cho các tọa độ số nguyên [m, n], với {m = 0, 1, 2, …, M–1} và {n = 0, 1, 2, …, N–1} là a[m, n]
3.1.1 Nhị phân hóa
Ảnh nhị phân là ảnh số mà trong đó giá trị mỗi điểm ảnh có thể nhận một trong hai giá trị 0 hoặc 1 Quá trình phân đoạn ảnh yêu cầu ảnh đầu vào phải là ảnh nhị phân, trong khi đó ảnh đầu vào của hệ thống là một ảnh đa mức xám, chính vì
Hình 3 1 Ví dụ về điểm ảnh
Trang 19vậy mà cần phải thực chuyển ảnh đa mức xám sang ảnh nhị phân để thực hiện phân
đoạn (hình 3.2)
Hình 3 2 Ví dụ chuyển ảnh đa mức xám sang ảnh nhị phân
Quá trình này được thực hiện nhờ vào hàm phân ngưỡng:
Trong đó, Source(x, y) là giá trị điểm ảnh ở vị trí (x, y) của ảnh nguồn, Dest(x, y) là giá trị điểm ảnh tương ứng ở vị trí (x, y) của ảnh đích T là giá trị đầu vào đang xét, không thể lấy cố định Ví dụ như trên hình 3.3, thể hiện ảnh đã được nhị phân hóa với ngưỡng thấp, ngưỡng cao
Hình 3 3 Ví dụ về chuyển ảnh nhị phân 3.1.2 Lược đồ Histogram
Histogram là một lược đồ biểu diễn độ sáng của một bức ảnh Lược đồ này bao gồm trục hoành biểu diễn mức sáng và trục tung biểu diễn số lượng điểm sáng
(3.1)