Đầu báo cháy thường: chỉ có khả năng phát hiện cháy, không có khả năng xác định các thông số như: độ bẩn của cảm biến, vị trí… Vì thế các đầu báo thường được sử Hệ thống cảnh báo cháy bằ
Trang 1HỆ THỐNG CẢNH BÁO CHÁY BẰNG
VIDEO
Trang 5BG Background
CCTV Closed Circuit Television
FPS Frame per second
GUI Graphic User Interface
HSV Hue Saturation Value
JPEG Joint Photographic Experts Group
MPEG Moving Picture Experts Group
Trang 6CHƯƠNG 1 TỔNG QUAN VỀ HỆ THỐNG
1.1 Giới thiệu về đề tài
Cháy là thảm họa có thể xảy ra bất kỳ thời gian nào, bất cứ nơi đâu và để lại nhữnghậu quả vô cùng nghiêm trọng nếu không được phát hiện kịp thời Trong thực tếcuộc sống và sản xuất, có rất nhiều nguồn nhiệt có thể gây cháy Ví dụ như: ngọnlửa trực tiếp, ngọn lửa do các máy móc, ngọn lửa do các chất hóa học…
Hiện này, tình hình cháy nổ ở nước ta diễn ra rất phức tạp Các vụ cháy nổ ở cácnhà máy xí nghiệp, các chung cư… diễn ra ngày càng nhiều gây rất nhiều thiệt hại
về tài sản và tính mạng con người Vì vậy, vấn đề phát hiện lửa và hệ thống cảnhbáo cháy sớm đang là một nhu cầu thiết yếu nhằm tăng cường khả năng phòngchống cháy nổ cho doanh nghiệp, công ty và các hộ gia đình
Do đó, trên thế giới có rất nhiều nhà khoa học đã và đang nghiên cứu để giải quyếtvấn đề này Hiện nay, có rất nhiều công nghệ, kỹ thuật được dùng để phòng chống
và chữa cháy như: dùng các đầu báo cháy, thị giác máy tính…
1.2 Tình hình nghiên cứu
Trong nền khoa học ngày càng phát triển, có rất nhiều công nghệ, kỹ thuật cảnh báocháy và chữa cháy được nghiên cứu và phát triển Hiện nay, có 2 phương pháp chủyếu được dùng là: dùng các loại cảm biến và xử lý ảnh Trong những thập kỷ qua,các cảm biến khác nhau được phát triển, chẳng hạn như cảm biến nhiệt độ và cảmbiến khói đã được sử dụng để cảnh báo lửa và dự báo cháy
1.1.1 Cảm biến nhiệt độ và khói
Cảm biến nhiệt độ: là loại đơn giản nhất, cấu tạo gồm cảm biến nhiệt độ đo nhiệt độkhông khí xung quanh môi trường Ngưỡng nhiệt độ hoạt động sẽ tùy thuộc yêu cầu
mà nhà sản xuất đưa ra
Trang 7Hình 1-1: Cảm biến nhiệt độ thường dùng
Cảm biến khói: Đầu báo khói quang học được chế tạo theo nguyên lý khuếch tán vàhấp thụ ánh sáng bởi các phân tử khói khi ánh sáng truyền trong không khí Khóiđược tạo ra bởi đám cháy sẽ ảnh hưởng tới dòng ánh sáng truyền qua trong khôngkhí Khói có thể ngăn hoặc che khuất các ánh sáng, là nguyên nhân khiến các tiasáng bị lệch hoặc khuất xạ Đầu báo khói quang học được thiết kế dựa trên nguyên
lý của ánh sáng và ảnh hưởng khói đến chúng
Hình 1-2: Nguyên lý hoạt động của đầu báo cháy quang học
Dựa vào các tính năng có thể chia hệ thống cảnh báo cháy dùng cảm biến chia thành
2 loại cụ thể Các hệ thống cảnh báo cháy sẽ được lắp đặt tùy thuộc vào nhu cầu củađối tượng sử dụng Với môi trường nhỏ như các hộ gia đình, việc cảnh báo cháy vàchữa cháy dễ quản lý hơn Nhưng với các công ty, nhà máy xí nghiệp hay chung cưthì việc cần biết được chính xác vị trí cháy sẽ quan trọng hơn trong khâu chữa cháy
và khắc phục hậu quả
Đầu báo cháy thường: chỉ có khả năng phát hiện cháy, không có khả năng xác định
các thông số như: độ bẩn của cảm biến, vị trí… Vì thế các đầu báo thường được sử
Hệ thống cảnh báo cháy bằng video
Trang 8dụng lắp theo dạng kênh, khi có một đầu báo cháy sẽ cho biết kênh nào đó cháy chứkhông xác định được chính xác vị trí có cháy.
Hình 1-3: Đầu báo cháy thường hãng Hochiki Đầu báo cháy địa chỉ: ngoài khả năng báo cháy còn có khả năng tự động đo được
một số thông số như độ bẩn cảm biến, tình trạng thiết bị, định vị trí, rồi gửi về tủtrung tâm nhờ có bộ nhớ EPROM thông minh tích hợp trong đầu báo
Hình 1-4: Đầu báo cháy địa chỉ
Ưu nhược điểm của hệ thống báo cháy dùng cảm biến:
• Ưu điểm: đơn giản, dễ lắp đặt, cảm biến khói có thể phát hiện sớm.
• Nhược điểm: chỉ phát hiện được khi đám cháy xảy ra gần vị trí đặt cảm biến,
độ chính xác không cao, không có hình ảnh hiện trường cháy, vùng giám sát
Trang 9nhỏ và công tác điều tra nguyên nhân gặp nhiều khó khăn Thêm vào đó, việcứng cứu chưa kịp thời cũng là nguyên nhân gia tăng thiệt hại do các đámcháy gây ra Do phương thức báo cháy chủ yếu bằng điện thoại làm mấtnhiều thời gian để xác minh và lấy thông tin nên khâu chữa cháy hiệu quảkhông cao.
Nhận xét: Với phương thức sử dụng các cảm biến khói và lửa thì các hình ảnh tại
hiện trường sẽ không được ghi lại nên sẽ gây ra các khó khăn về việc điều tra, tìm
ra nguyên nhân Cùng với đó, hệ thống chỉ cảnh báo cháy báo khi có ngọn lửa gầnnơi đặt cảm biến sẽ gây ra vấn đề về việc cảnh báo và phòng ngừa nên các hậu quả
sẽ không được giảm thiểu tối đa
1.1.2 Thị giác máy tính
Ngày nay với sự phát triển mạnh mẽ của công nghệ xử lý ảnh, con người ngày càngphát triển hơn trong lĩnh vực thị giác máy tính nhằm giải quyết các vấn đề của conngười, xã hội Phát hiện lửa trong cảnh báo cháy cũng không nằm trong vấn đề này,nếu có thể dùng công nghệ xử lý ảnh để phân tích và phát hiện cháy thì chúng tahoàn toàn có thể ngăn chặn, giảm thiểu thiệt hại gây ra về vật chất và người khi xảy
ra các vụ cháy
Phương pháp cảnh báo cháy bằng thị giác máy tính sẽ sử dụng các camera giám sátđược lắp đặt sẵn để theo dõi sự xuất hiện của lửa và khói ở bất kỳ nơi nào trongphạm vi giám sát của camera Với phương pháp này, thông tin được cung cấp sớm
sẽ giúp các cơ quan chức năng có biện pháp xử lý một cách kịp thời Cùng với đó,công tác điều tra nguyên nhân sẽ thuận lợi hơn khi có hình ảnh hiện trường và vùnggiám sát phương pháp này rộng hơn phương pháp dùng đầu báo Ngọn lửa có cáctính chất đặc biệt như màu sắc, chuyển động, hình dạng tăng trưởng và hành độngkhói
1.3 Mục tiêu và nhiệm vụ đề tài
Trong đồ án tốt nghiệp này, em tập trung nghiên cứu những giải thuật để phát hiệncháy một cách chính xác nhất có thể dựa vào tính chất màu sắc của ngọn lửa Bêncạnh việc nhận dạng được ngọn lửa dựa vào tính chất thì cũng đưa ra các cơ chế
Hệ thống cảnh báo cháy bằng video
Trang 10cảnh báo cháy phù hợp tùy theo mức độ cháy cho người dùng và đưa ra được hướngkhắc phục một cách hiệu quả để tránh những thiệt hại nặng nề về người và tài sản.Trong đề tài này, em sẽ dùng hình ảnh từ các video được thu từ các camera an ninh.Các camera này sẽ được gắn sẵn ở các khu vực đông dân như khu dân cư, các khucông nghiệp… Sau khi thu được các đoạn video, các chuỗi hình ảnh sẽ được tách ra
từ các đoạn video trên Từ các chuỗi hình ảnh này, em sẽ xử lý và khoanh vùng cáckhu vực bị nghi là có cháy dựa trên các đặc tính màu sắc của ngọn lửa Sau khikhoanh vùng được các khu vực bị nghi là có lửa, em sẽ đề ra các biện pháp cảnhbáo cháy
Nội dung nghiên cứu của đồ án tốt nghiệp gồm các phần như sau:
• Tìm hiểu về các công nghệ, kỹ thuật phát hiện cháy được sử dụng hiện nay
• Tìm hiểu giải thuật về việc phát hiện lửa dựa vào các mô hình không gianmàu để nhận dạng ngọn lửa
• Xây dựng và thu thập tập cơ sở dữ liệu bao gồm các hình ảnh tĩnh chuẩnRGB để nhận dạng
• Sử dụng mô hình không gian màu RGB và YCbCr để chọn ngưỡng và táchngưỡng cho dữ liệu thu thập được
• Thực hiện việc phát hiện lửa bằng các thuật toán được xây dựng trong 2 môhình màu
• Xây dựng hệ thống với giao diện, tính năng và cảnh báo cháy khi phát hiệncháy (phát loa, gửi tin nhắn, gọi điện thoại…)
• Dùng giải thuật luồng quang kết hợp không gian màu để phân biệt những vậtthể không chuyển động có cùng màu với lửa
Do đề tài này chỉ thực hiện ở mức độ đánh giá các giải thuật phát hiện cháy quavideo để cảnh báo cháy nên cơ sở dữ liệu được sử dụng với hình ảnh rõ nét, trongcùng môi trường, ít ánh sáng, không bóng mờ…
Trang 11CHƯƠNG 2 GIỚI THIỆU VỀ XỬ LÝ ẢNH
1.4 Tổng quan về xử lý ảnh
Từ những năm 1970, năng lực tính toán của máy tính ngày càng trở nên mạnh mẽhơn Các máy tính lúc này có thể xử lý được những tập dữ liệu lớn như các hìnhảnh, các đoạn phim thì khái nhiệm về kỹ thuật xử lý ảnh ngày càng được nhắc đến
và nghiên cứu nhiều hơn cho tới ngày nay
Hiện nay, xử lý ảnh (image processing) là một lĩnh vực khá mới mẽ bao gồm cácphương pháp thu nhận ảnh, xử lý ảnh kỹ thuật số, phân tích và nhận dạng đối tượng
Xử lý ảnh bao gồm lý thuyết và các kỹ thuật liên quan nhằm mục đích tạo ra hệthống nhân tạo có thể tiếp nhận thông tin từ các hình ảnh thu được hoặc các tập dữliệu đa chiều Đối với con người, quá trình nhận thức thế giới bên ngoài là một điều
dễ dàng Thông qua quá trình sống, quá trình nhận thức của mỗi người sẽ được
“học” dễ dàng Tuy nhiên với các vật vô tri như máy tính, robot… thì điều đó là mộtbước tiến khó khăn Các thiết bị ngày nay không chỉ nhận thông tin ở dạng tín hiệuđơn lẻ mà nay còn có thể có cái “nhìn” thật với thế giới bên ngoài Cái “nhìn” nàyqua quá trình phân tích, kết hợp với các mô hình như máy học, mạng nơ-ron… sẽgiúp cho thiết bị tiến dần tới một hệ thống nhân tạo có khả năng ra quyết định linhhoạt và đúng đắn hơn rất nhiều Lĩnh vực nghiên cứu của thị giác máy tính rất rộng,
và đặc điểm chung là các bài toán về xử lý ảnh đều không có một đề tài chung vàcách giải duy nhất Mỗi giải pháp giải quyết vấn đề được một kết quả nhất định chonhững trường hợp cụ thể Xử lý ảnh là một môn khoa học, kỹ thuật có liên quan đếncác lý thuyết đằng sau các hệ thống nhân tạo được trích xuất từ các thông tin từ cáchình ảnh Các chuỗi video, các cảnh từ camera, hay dữ liệu đa chiều từ máy quét ýhọc là các dạng thường gặp của dữ liệu hình ảnh Xử lý ảnh tìm kiếm việc áp dụngcác mô hình và các lý thuyết để xây dựng các hệ thống xử lý ảnh
1.1.3 Khái niệm ảnh số
Ảnh số: là hình ảnh được ghi nhận bởi bộ cảm biến điện tử và lưu lại dưới dạng dữ
liệu trong bộ nhớ của máy (có thể là thẻ nhớ, đĩa,…) Ảnh số chỉ là ma trận 2 chiều,
Hệ thống cảnh báo cháy bằng video
Trang 12và việc xử lý chúng chỉ là những thao tác trên ma trận này sao cho ra kết quả hợp lý.
Ví dụ một bức ảnh có độ phân giải 480x360 có nghĩa là chiều ngang có 480 điểmảnh (pixel), chiều dài có 360 điểm ảnh (pixel), và mỗi điểm ảnh được biểu diễnbằng một con số
Tùy theo giá trị dùng để biểu diễn, ảnh số được chia thành 3 loại chính:
• Ảnh nhị phân (binary image): là một ảnh đen hoặc trắng Giá trị tại mỗi điểm
ảnh (pixel) là 0 hoặc 1
• Ảnh xám (gray image): giá trị mỗi điểm ảnh nằm trong dãi có giá trị từ 0 đến
255, nghĩa là cần 8 bits hay 1 byte
• Ảnh màu (color image): mỗi điểm ảnh có giá trị bao gồm màu đỏ (red), xanhlục (green), xanh dương (blue) Mỗi màu có giá trị từ 0 đến 255, nghĩa là mỗiđiểm ảnh cần 24 bits hay 3 bytes để biểu diễn
Hình 2-1: Ảnh LENA ở ảnh màu được biến đổi sang ảnh xám và ảnh nhị phân
Điểm ảnh (Picture Element): là phần tử của ảnh số Tại tọa độ của mỗi điểm (x,y)
có giá trị với mức độ xám hoặc một màu nhất định Mỗi phần tử trong ma trận đượcgọi là một phần tử ảnh
Độ phân giải: là chỉ số các điểm ảnh hiển thị được chứa trong một tập tin ảnh kỹthuật số được hiển thị hoặc được in ra trên các thiết bị Sao cho mắt người có thể
Trang 13nhìn thấy ảnh một cách liên tục, độ phân giải của ảnh sẽ được phân bố theo x và ytrong không gian.
1.1.4 Các thang màu trong ảnh số
Trong thí nghiệm của bác học Newton thì sau khi chùm tia sáng trắng đi qua lăngkính thì nó trở thành một quang phổ, gồm nhiều màu đơn sắc sắp xếp cạnh nhau,gọi là hiện tượng tán sắc ánh sáng Bác học Newton cho rằng, ánh sáng mặt trờiđược cấu tạo bằng vô số những tia bức xạ lan rộng từ màu Đỏ đến màu Tím Mỗiloại tia sáng tạo ra màu có bước sóng dài ngắn khác nhau, tia sáng có bước sóngngắn thì sẽ bị khúc xạ nhiều hơn loại có tia sáng có bước sóng dài Từ bảy màu trênquang phổ cầu vòng: Đỏ, Cam, Vàng, Lục, Lam, Chàm, Tím người ta có thể phânbiệt rất nhiều màu chuyển tiếp, trung gian, nối liền bảy màu này Do đó về mặtquang học, có thể khẳng định, màu sắc là ánh sáng, hay có thể gọi màu sắc là con đẻcủa ánh sáng, là hiệu quả hiển thị của các loại ánh sáng có bước sóng dài ngắn khácnhau Ngoài ra, màu sắc còn là do sự phản chiếu của ánh sáng trên những vật thể.Như vậy, thì bản thân màu sắc là ánh sáng và bản thân vật thể ấy cũng có màu sắc
• Hệ thống RGB: là từ viết tắt tiếng anh của cơ chế hệ màu cộng gồm: Đỏ
(Red), Xanh lục (Green), Xanh dương (Blue), thường được sử dụng để hiểnthị màu trên các màn hình kỹ thuật số) Nguyên lý làm việc của hệ RGB làphát xạ ánh sáng, hay còn gọi là mô hình ánh sáng bổ sung (các màu đượcsinh ra từ 3 màu RGB sẽ sáng hơn các màu gốc) Nếu CYMK là nơi bắt đầu
từ một tờ giấy trắng và sau đó thêm các màu khác thì RGB hoạt động ngượclại Ví dụ, khi màn hình TV tắt thì nó tối đen, khi bật nó lên sẽ thêm các màu
đỏ, xanh lá cây, xanh dương cộng thêm hiệu ứng tích lũy và màu trắng đểphát ra ánh sáng và hình ảnh Chế độ màu RGB có một gam màu lớn hơnnhiều so với CYMK, đặc biệt trong vùng các màu huỳnh quang sáng Khibiểu diễn dưới dạng số, các giá trị RGB trong mô hình bpp thông thường ghibằng ba số nguyên có giá trị từ 0 đến 255, mỗi giá trị đại diện cho cường độcủa màu đỏ, xanh lá cây, xanh dương Số lượng màu tối đa là 256 x 256 x
256 = 16 777 216 màu
Hệ thống cảnh báo cháy bằng video
Trang 14Ví dụ: (255,0,0) là màu đỏ.
(0,255,0) là màu xanh lá cây
(0,0,255) là màu xanh dương
• Không gian màu HSV: Hệ không gian màu HSV và HSL là hai hình dạngphổ biến nhất của các điểm trong một mô hình màu RGB Được phát triểnvào những năm 1930 cho các ứng dụng truyển hình màu, không gian màuHSL cho phép thêm thông tin màu vài các tín hiệu đen trắng hiện tại, cónghĩa là không giống như các hệ thống màu trước đó, máy thu đơn sắc có thểnhận tín hiệu màu phát bằng HSL HSV và HSL được sử dụng ngày naytrong tất cả các hệ thống mã hóa truyền hình kỹ thuật số, bộ chọn màu, phầnmềm chỉnh sửa hình ảnh, và ít phổ biến hơn trong phân tích hình ảnh và tầmnhìn máy tính Hệ không gian màu này dựa vào 3 thông số sau để mô tả màusắc: H = Hue (màu sắc), S = Saturation (độ đậm đặc, sự bão hòa), V = Value(giá trị cường độ sáng) Không gian màu này thường được biểu diễn dướidạng hình trụ hoặc hình nón
Hình 2-2: Không gian màu HSV
Theo đó, đi theo vòng tròn 0-360 độ là trường biểu diễn màu sắc (Hue).Trường này bắt đầu từ màu đỏ đầu tiên (Red primary) tới màu xanh lục đầutiên (Green primary) nằm trong khoảng từ 0-120 độ, từ 120-240 độ là màuxanh lục tới xanh lơ (Green primary – Blue primary) Từ 240-360 độ là từmàu đen tới màu đỏ
Trang 15Hình 2-3: Hình tròn biểu diễn màu sắc (Hue)
Theo như cách biểu diễn không gian màu theo hình trụ như trên, đi từ giá trị
độ sáng (V) được biểu diễn bằng cách đi từ dưới đáy hình trụ đi lên và nằmtrong khoảng từ 0 – 1 Ở đáy hình trụ V có giá trị là 0, là tối nhất và trên đỉnhhình trụ là độ sáng lớn nhất (V=1) Đi từ tâm hình trụ ra mặt trụ là giá trị bãohòa của màu sắc (S) S có giá trị từ 0 -1, S = 0 ứng với tâm hình trụ là chỗ
mà màu sắc nhạt nhất, S = 1 ở ngoài mặt trụ là nơi mà giá trị màu sắc là đậmđặc nhất Như vậy với mỗi giá trị (H,S,V) sẽ cho ta một màu sắc mà ở đó mô
tả đầy đủ thông tin về màu sắc, độ đậm đặc và độ sáng của màu đỏ
• Không gian màu CMYK: là không gian màu được sử dụng phổ biến trongngành công nghiệp in ấn Ý tưởng cơ bản của hệ không gian màu này là dung
4 màu sắc cơ bản để phục vụ cho việc pha trộn mực in Trên thực tế, người tadùng 3 màu là C = Cyan (xanh lơ), M = Magenta (hồng sẫm) và Y = Yellow(vàng) để biểu diễn các màu sắc khác nhau Nếu lấy màu hồng sẫm cộng vớimàu vàng sẽ ra màu đỏ, màu sẫm kết hợp với màu xanh lơ sẽ cho màu xanhlam… Sự kết hợp của 3 màu trên sẽ cho màu đen ở đây không phải là đentuyệt đối và thường có độ tương phản lớn, nên trong ngành in, để tiết kiệmmực in người ta thêm vào màu đen để in những chi tiết có màu đen thay vìphải kết hợp 3 màu sắc trên, và như vậy ta có hệ màu CYMK, chứ K ở đây là
để kí hiệu màu đen (black)
Nguyên lý làm việc của hệ màu như sau: trên một nền giấy trắng, khi mỗimàu này được ịn lên sẽ loại bỏ dần đi thành phần màu trắng, 3 màu C, M, Y
Hệ thống cảnh báo cháy bằng video
Trang 16khác nhau được in theo những tỉ lệ khác nhau sẽ loại bỏ đi thành phần đómột cách khác nhau và cuối cùng cho ta màu sắc cần in Khi cần in màu đen,thay vì phải in cả 3 màu thì người ta dùng màu đen để in lên Nguyên lý nàykhác với nguyên lý làm việc của hệ RGB ở chỗ hệ RGB là sự kết hợp củacác thành phần màu, còn hệ CMYK là sự loại bỏ lẫn nhau của các thànhphần màu.
Hình 2-4: Không gian màu CMYK
• Hệ màu YUV: mô hình YUV quy định một không gian màu được tạo bởi một
độ sáng và hai thành phần màu (chrominance) Mô hình YUV giúp tạo ramàu đúng với nhận thức của con người chuẩn hơn thang màu RGB, là loạiđược dùng trong các thiết bị đồ họa máy tính, nhưng không chuẩn bằngthang màu HSV Y đại diện cho thành phần độ sáng, U và V là đại diện chocác thành phần màu Không gian màu YCbCr hay YPbPr được sử dụng nhiềutrong các thiết bị phát hình, đều xuất phát từ YUV (Cb/Pb và Cr/Pr là nhữngbiến thể của U và V), và đôi khi bị gọi một cách không chính xác là “YUV”.Các tín hiệu YUV đều xuất phát từ các nguồn RGB Các giá trị trọng số của
R, G và B được cộng lại với nhau để tạo ra một tín hiệu Y đơn, biểu diễn cho
độ sáng chung tại một điểm đó Tín hiệu U sau đó được tạo ra bằng cách trừ
Trang 17Y khói tín hiệu xanh lam (B của RGB), và được nhân với một tỉ lệ có sẵn;còn V được tính bằng cách trừ Y khỏi màu đỏ (R của RGB), và nhân tỉ lệ vớimột hệ số khác.
Không gian màu YCbCr được sử dụng nhiều trong các hệ thống ảnh số,video hay các chuẩn nén JPEG và MPEG Vì không gian màu RGB chỉ thuậntiện cho hiển thị màn hình nhưng lại không thuận tiện cho việc lưu trữ vàchuyển đổi nên người ta đề xuất ra không gian này để thuận lợi cho việc nén
Trang 18Hình 2-6: Các bước cơ bản trong xử lý ảnh
Các bước cơ bản trong xử lý ảnh được diễn ta như sau: ảnh đầu vào sẽ được thubằng thiết bị thu ảnh, sau đó chuyển dữ liệu của ảnh thành rời rạc, nén để có hiệuquả trong lưu trữ hoặc truyền Sau khi đã rời rạc, số hóa, ảnh sẽ được cải thiện chấtlượng như tăng độ tương phản, khử mờ hoặc nhiễu Tiếp theo là bước phân đoạnảnh Bước này sẽ chia ảnh thành các đối tượng hoặc các phần tử, rồi từ đó dựa vàocác đặc trưng thích hợp hoặc bộ mô ra để phân chia các lớp đối tượng Sau khi đãchọn đặc trưng các đối tượng, các đối tượng này sẽ được gán nhãn dựa trên thôngtin của bộ mô tả Rồi từ đó sẽ gán ý nghĩa cho các đối tượng được nhận dạng
1.6 Kỹ thuật phân vùng theo ngưỡng [1]
Biên độ của các thuộc tính vật lý của ảnh (như độ phản xạ, độ truyền sáng, màusắc…) là một đặc tính đơn giản và hữu ích Kỹ thuật phân ngưỡng theo biên độ rất
Trang 19hữu ích với những ảnh nhị phân như văn bản in, đồ họa, ảnh màu hay ảnh X-quangnếu biên độ đủ lớn đặc trưng cho phân đoạn ảnh Ví dụ biên độ của bộ cảm biếnhồng ngoại có thể phản ánh được nhiệt độ thấp hay nhiệt độ cao Bước quan trọngcủa giải thuật này là việc chọn ngưỡng để phân đoạn Thông thường sẽ tiến hànhtheo các bước chung như sau:
• Xác định đỉnh và khe dựa trên xem xét lược đồ xám của ảnh, nếu như ảnh cónhiều đỉnh và khe có thể sử dụng để chọn ngưỡng
• Chọn ngưỡng Th sao cho một phần xác định trước của toàn bộ số mẫu sẽthấp hơn Th
• Xét lược đồ của các điểm lân cận để điều chỉnh ngưỡng
• Xem xét lược đồ xám của những điểm tiêu chuẩn đã chọn để chọn ngưỡng.Giải thuật phân vùng theo ngưỡng có thể hiểu một cách đơn giản là các đối tượng
mà ta quan tâm trên nền tối (background), một tham số ngưỡng Th sẽ chọn đượcmột ảnh F(x,y) nếu:
(2)
Có rất nhiều thuật toán chọn ngưỡng: ngưỡng cố định, dựa trên lược đồ, sử dụngEntropy, sử dụng tập mờ, chọn ngưỡng thông qua sự không ổn định của lớp và tínhthuần nhất của vùng
Chọn ngưỡng cố định: đây là một phương pháp chọn ngưỡng độc lập với dữ liệuảnh Nếu biết trước được là chương trình ứng dụng sẽ làm việc với các ảnh có độtương phản khá cao, trong đó các đối tượng quan tâm rất tối còn nền gần như đồngnhất và rất sáng thì việc chọn ngưỡng Th = 128 (dựa theo thang độ sáng từ 0 đến255) là một giá trị chọn khá chính xác Chính xác ở đây hiểu theo nghĩa là số cácđiểm ảnh bị phân lớp sai là cực tiểu
Chọn ngưỡng dựa trên lược đồ: kỹ thuật này chọn ngưỡng tự động xuất phát từ lược
đồ xám Kỹ thuật này tận dụng được những lợi thế do sự làm trơn dữ liệu lược đồban đầu nhằm loại bỏ những giao động nhỏ về độ sáng Một số thuật toán thườnggặp là: thuật toán đẳng hiệu, thuật toán đối xứng nền, thuật toán tam giác, chọnngưỡng theo biểu đồ Histogram…
Hệ thống cảnh báo cháy bằng video
Trang 20• Thuật toán đẳng hiệu: là kỹ thuật chọn ngưỡng theo kiểu lặp do Ridler và
Calvard đưa ra
Thuật toán này được mô tả như sau:
- Bước 1: Chọn giá trị ngưỡng khởi động
- Bước 2: Tính các trung bình mẫu ( của những điểm ảnh thuộc đối tượng
và của những điểm ảnh nền
- Bước 3: Tính ngưỡng trung gian theo công thức:
(3)
- Bước 4: Nếu kết thúc và dừng thuật toán Ngược lại: thực hiện từ bước 2
• Thuật toán đối xứng nền: kỹ thuật này dựa trên sự giả định là tồn tại hai đỉnh
phân biệt trong lược đồ đối xứng qua đỉnh có giá trị lớn nhất trong phần lược
đồ thuộc về các điểm ảnh nền Kỹ thuật này có thể tận dụng ưu điểm củaviệc làm trơn được mô tả trong chương trình Đỉnh cực đại max tìm đượcnhờ tiến hành tìm giá trị cực đại trong lược đồ Sau đó thuật toán sẽ áp dụng
ở phía không phải là điểm ảnh thuộc đối tượng ứng với giá trị cực đại đónhằm tìm ra giá trị độ sáng a ứng với giá trị phần trăm p% mà: P(a)=p%,trong đó P(a) là hàm phân phối xác suất về độ sáng
Hình 2-6: Hình minh họa thuật toán đối xứng nền
Giả thiết là ảnh có các đối tượng tối trên nền sáng Giả sử mức là 5% thì cónghĩa là ta phải ở bên phải đỉnh max một giá trị a sao cho P(a)=95% Do tínhđối xứng đã giả định, ta sử dụng độ dịch chuyển về phía trái của điểm cựcđại tìm giá trị ngưỡng T: T=max – (a – max) Kỹ thuật này dễ dàng điềuchỉnh được cho phù hợp với tình huống ảnh có các đối tượng sáng trên mộtnền tối
Trang 21• Thuật toán tam giác: Khi một ảnh có các điểm ảnh thuộc đối tượng tạo nên
một đỉnh yếu trong lược đồ ảnh thì thuật toán tam giác hoạt động rất hiệuquả Thuật toán này do Zack đề xuất và được mô tả như sau:
- Bước 1: Xây dựng đường thẳng là đường nối 2 điểm ( và ( Trong đó làđiểm Histogram ứng với độ sáng nhỏ nhất
- Bước 2: Tính khoảng cách d từ của lược đồ (ứng với điểm sáng b) đến Trong đó,
- Bước 3: Chọn ngưỡng T = Max
Hình 2-7: Hình minh họa thuật toán tam giác Chọn ngưỡng đối với Bimodal Histogram: Ngưỡng T được chọn tại vị trí cực tiểu
của Histogram nằm giữa hai đỉnh của Histogram Điểm cực đại của Histogram cóthể dễ dàng được phát hiện bằng cách sử dụng biến đổi chóp mũ (top hat) do Meyerđưa ra: phụ thuộc vào tình huống phải làm việc là đối với đối tượng sáng trên nềntối hay đối tượng tối trên nền sáng mà phép biến đổi top hat sẽ có một trong haidạng sau:
• Các đối tượng sáng:
• Các đối tượng tối:
Hệ thống cảnh báo cháy bằng video
Trang 22- Áp dụng giải thuật Watershed chia ảnh thành nhiều vùng con.
- Trộn các vùng và đồng thời phát hiện ngưỡng cục bộ Ngưỡng được tính
từ thông tin cục bộ của vùng và các vùng lân cận
1.7 Kỹ thuật phát hiện chuyển động
Hệ thống giám sát chuyển động được ra đời từ những năm 1960, là một trongnhững hệ thống trợ giúp đắc lực nhất cho con người thực hiện theo dõi và giám sát
Từ các hình ảnh thu được từ những nơi được quan sát, con người có thể phát hiệnđược chuyển động của các đối tượng trong các khung hình, có thể xác định đượcđối tượng đó là người, phương tiện hay vật thể Minh họa rõ hơn, với một bài toángiám sát giao thông một hệ thống giám sát thông minh có thể cho ta biết được sốlượng phương tiện lưu thông qua đoạn đường được theo dõi, đưa ra thông tin về tốc
độ chuyển động, đường đi của đối tượng được theo dõi Với một bài toán phát hiện,
dự đoán, hệ thống giám sát thông minh có thể phát hiện một đám cháy, tự độngcảnh báo cháy ở nơi được quan sát và theo dõi
Hiện nay, trên thế giới các hệ thống giám sát thông minh bằng video đã được pháttriển và chứng minh được hiệu quả nhất định trên một số lĩnh vực như giám sát hoạtđộng của con người, giám sát giao thông,… Song các hệ thống vẫn gặp phải một sốtồn tại như hiệu quả của việc quan sát luôn phụ thuộc vào điều kiện môi trườngquan sát, kiểu chuyển động của đối tượng hay các lý do khách quan khác Chính vìthế mà việc nghiên cứu và phát triển các giải phát, công nghệ mới vẫn đang đượctiến hành nhằm đáp ứng được yêu cầu về một hệ thống giám sát thông minh hoànthiện nhất Bên cạnh sự phát triển của các thiết bị phần cứng, hệ thống giám sát đòihỏi con người thường trực 24/24 để giảm sát các màn hình theo dõi Một phút lơ làcủa con người có thể để đối tượng đột nhập vào mục tiêu Kỹ thuật xử lý ảnh số thu
Trang 23được từ các thiết bị quan sát sẽ tự động phân tích và đưa ra cảnh báo khi có một đốitượng đột nhập vào mục tiêu, đông thời hệ thống sẽ lưu lại hình ảnh đối tượng vàtheo dõi dấu đối tượng trong vùng quan sát Căn cứ vào cảnh báo tự động đó, conngười sẽ biết để có biện pháp xử lý đảm bảo mục tiêu an toàn.
1.1.5 Phương pháp trừ nền
Phương pháp chung để nhận dạng đối tượng chuyển động là trừ nền, ở đây mỗikhung video được so sánh với mô hình tham chiếu hoặc mô hình nền Các pixeltrong frame ảnh hiện thời mà lệch đáng kể so với nền sẽ được xem như là đối tượngchuyển động Một giải thuật trừ nền tốt phải xử lý được sự thay đổi độ sáng, sương
mù, tuyết, đổi bóng… Ngoài ra, nó phải tính toán nhanh và có yêu cầu bộ nhớ ít,trong khi vẫn có khả năng xác định những đối tượng chính xác trong video Bốnbước chính trong giải thuật trừ nền là: tiền xử lý, mô hình hóa nền, phát hiện đốitượng và hợp lệ hóa dữ liệu
Tiền xử lý: bao gồm những tác vụ xử lý ảnh đơn giản cho video đầu vào tạo điều
kiện cho xử lý trong những bước tiếp theo
Mô hình hóa nền: sử dụng những frame video mới để tính toán và cập nhật một môhình nền Mô hình nền này cung cấp phần mô tả thống kê của toàn bộ cảnh nền
Dò tìm đối tượng: xác định những pixel trong frame video không tương ứng với mô
Thuật toán trừ nền được thực hiện như sau: gọi là biểu diễn của giá trị cường độmức xám ở điểm ảnh có vị trí (x) và ở trường hợp thứ n của dãy Video I thuộc trongđoạn [0,255] Gọi là giá trị cường độ nền tương ứng cho điểm ảnh ở vị trí (x) ướclượng theo thời gian từ ảnh Video đến
Hệ thống cảnh báo cháy bằng video
Trang 24Một điểm ảnh ở vị trí (x) trong ảnh hiện thời thuộc thành phần nổi trội nếu nó thỏamãn: Trong đó là giá trị ngưỡng có khả năng thích hợp được khởi tạo cùng vớiảnh Video đầu tiên ,, và ngưỡng được khởi tạo bởi giá trị đã được xác định trước Nền cơ sở và các ảnh ngưỡng phải được cập nhật liên tục từ các ảnh đầu vào Sựphối hợp cập nhật này là khác nhau đối với các vị trí điểm, chẳng hạn như một điểmthì sẽ khác với :
(4) (5)Trong đó là các hằng số chỉ ra rằng có bao nhiêu thông tin từ các ảnh vào được đẩyvào nền và các ảnh ngưỡng
Nói cách khác, nếu mỗi điểm ảnh nền được coi như là chuỗi các lần, các ảnh nền làmột giá trị trung bình của trọng số vùng theo thời gian của chuỗi các ảnh đầu vào vàảnh ngưỡng là giá trị trung bình trong số vùng của lần khác nhau của các ảnh đầuvào và nền đó
Hình 2-9: Hình minh họa phương pháp trừ nền [1][2][3]
1.1.6 Phương pháp Optical Flow
Hiện nay, có rất nhiều kỹ thuật được sử dụng để phát hiện đối tượng chuyển động,một trong những kỹ thuật đang được sử dụng rộng rãi hiện nay là kỹ thuật OpticalFlow
Trang 25Optical Flow (giải thuật luồng quang) là khái niệm chỉ sự chuyển động tương đốicủa các điểm trên bề mặt của một đối tượng, vật thể nào đó gây ra dưới góc quan sátcủa một điểm mốc (ví dụ: mắt, camera,…) Sự chuyển động của các vật thể (màthực tế có thể coi là sự chuyển động của các điểm trên bề mặt vật thể ấy) trongkhông gian 3 chiều, khi được chiếu lên một mặt phẳng quan sát 2D được gọi làmotion field Nhìn chung, mục đích của Optical Flow là xác định (xấp xỉ) motionfield từ một tập các frame ảnh thay đổi theo thời gian, chúng được sử dụng rộng rãitrong các bài toán phát hiện, nhận dạng đối tượng, tracking…
Hình 2-9: Hình minh họa Optical Flow [4][5]
Phương pháp Lucas – Kanade là một phương pháp khác biệt được sử dụng rộng rãicho đánh giá Optical Flow được phát triển bởi Bruce D Lucas và Takeo Kanade.Thuật toán Lucas – Kanade dựa vào thông tin tại chỗ mà được từ vài window nhỏquanh mỗi điểm quan tâm Tuy nhiên, với trường hợp các chuyển động là lớn dẫnđén có thể di chuyển các điểm ra ngoài local window và do đó thuật toán sẽ khôngthể tìm thấy Vấn đề này dẫn đến sự phát triển thuật toán Pyramidal Lucas Kanade:theo vết bắt đầu từ mức cao nhất của một image pyramid (chi tiết thấp nhất) và làmviệc xuống đến mức thấp nhất (chi tiết tốt hơn) Theo trên các Image pyramid chophép các chuyển động lớn có thể được bắt bởi các local window Ý tưởng cơ bảncủa thuật toán Lucas Kanade dựa vào giả thiết:
- Mức sáng của các điểm ảnh không có thay đổi từ frame thứ n sang framethứ n+1: (6)
- Chuyển động ảnh của một khối bề mặt thay đổi chậm theo thời gian
Hệ thống cảnh báo cháy bằng video