1. do chọn đề tài Với sự phát triển nhanh chóng của các loại máy móc hiện đại như máy ảnh số, máy quay phim kỹ thuật số, máy vi tính, điện thoại di động, . . .v.v thì lượng thông tin con người thu được dưới dạng hình ảnh là khá lớn. Để lượng thông tin này trở nên có ích hơn con người cần phải tiến hành xử lý nó và từ đó tạo điều kiện cho sự phát triển không ngừng của các kỹ thuật xử lý hình ảnh. Xử lý ảnh là một trong những công nghệ được ứng dụng rộng rãi hiện nay trong nhiều lĩnh vực của đời sống xã hội. Không chỉ dừng lại ở việc xử lý những vết nhèo, tái chế và phục hồi các ảnh cũ, ngày nay công nghệ xử lý ảnh đã mang lại những tiến bộ vượt bậc như nhận dạng vân tay, nhận dạng khuôn mặt, nhận dạng đối tượng chuyển động khi nó kết hợp với lĩnh vực trí tuệ nhân tạo. Bên cạnh đó hệ thống camera giám sát ngày càng được sử dụng một cách rộng rãi với mục đích hỗ trợ an ninh cho các cửa hàng, công ty, ngân hàng, . . v.v. Nhưng các camera này chỉ có khả năng để lưu giữ các dữ liệu video và chúng ta cần tốn thêm chi phí để thuê các nhân viên bảo vệ để quan sát và phát hiện khi có người nào đó xâm nhập.
Trang 1ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
NGUYỄN THỊ THANH THƯƠNG
ĐỀ TÀI:
TÌM HIỂU KỸ THUẬT TRỪ NỀN TRONG PHÁT HIỆN ĐỐI TƯỢNG CHUYỂN ĐỘNG DƯỚI SỰ TRỢ GIÚP CỦA CAMERA GIÁM SÁT
ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC
XHUYEE
Trang 2ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
Giáo viên hướng dẫn: ThS TRỊNH HIỀN ANH
Sinh viên : NGUYỄN THỊ THANH THƯƠNG
Lớp : HỆ THỐNG THÔNG TIN K7A
Thái Nguyên, tháng 5 năm 2013
ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
TÌM HIỂU KỸ THUẬT TRỪ NỀN TRONG PHÁT HIỆN
VÀ BÁM SÁT ĐỐI TƯỢNG CHUYỂN ĐỘNG DƯỚI
SỰ TRỢ GIÚP CỦA CAMERA GIÁM SÁT
Sinh viên thực hiện: NGUYỄN THỊ THANH THƯƠNG
Lớp: HTTT - K7A, Hệ Chính qui
Giáo viên hướng dẫn: Th.S TRỊNH HIỀN ANH
Thái Nguyên, tháng 5 năm 2013
Trang 3LỜI CẢM ƠN
Sau một thời gian học tập và nghiên cứu em đã hoàn thành Đồ án tốt nghiệp
với đề tài: “Tìm hiểu kỹ thuật trừ nền trong phát hiện và bám sát đối tượng chuyển động dưới sự trợ giúp của camera giám sát” Đầu tiên em xin bày bỏ
lòng kính trọng và biết ơn chân thành đến cô giáo ThS.Trịnh Hiền Anh là ngườitrực tiếp hướng dẫn và thầy giáo PGS.TS.Đỗ Năng Toàn tạo điều kiện cho emđược tìm hiểu tại Viện Công nghệ thông tin – Viện Hàn lâm Khoa học và Côngnghệ Việt Nam để hoàn thành Đồ án tốt nghiệp Qua thời gian được các thầy côhướng dẫn, em đã học hỏi được nhiều kiến thức bổ ích và kinh nghiệm quý báulàm nền tảng cho quá trình học tập, làm việc và nghiên cứu sau này
Em cũng xin chân thành cảm ơn các thầy cô giáo đang giảng dạy tại Khoacông nghệ thông tin – Trường ĐH Công nghệ thông tin và truyền thông – ĐHThái Nguyên trong suốt thời gian qua đã trang bị cho em những kiến thức cơ bảncần thiết và bổ ích giúp em hoàn thành đồ án tốt nghiệp
Em cũng xin chân thành cảm ơn các anh tại phòng Công nghệ thực tại
ảo – Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã nhiệt tình giúp đỡ emtrong quá trình làm đồ án và tìm kiếm tài liệu
Cuối cùng em xin chân thành cảm ơn gia đình và bạn bè đã cổ vũ động
viên em trong suốt thời gian vừa qua Mặc dù đã rất cố gắng nỗ lực hết mình,
song chắc chắn đồ án không khỏi còn nhiều thiếu sót Em rất mong nhận được sựthông cảm và chỉ bảo tận tình của quý Thầy cô và các bạn
Thái nguyên, ngày tháng 05 năm 2013
Sinh viên
Nguyễn Thị Thanh Thương
Trang 4LỜI CAM ĐOAN
Để hoàn thành đồ án tốt nghiệp đúng thời gian quy định và đáp ứng đượcnhu cầu đề ra, bản thân em đã cố gắng nghiên cứu, học tập và làm việc trong thờigian dài cùng với sự hướng dẫn nhiệt tình của cô giáo Thạc Sỹ Trịnh Hiền Anh
và các bạn sinh viên cùng bộ môn Em đã tham khảo một số tài liệu nêu trong
phần “Tài liệu tham khảo” và không sao chép nội dung từ bất kỳ đồ án nào khác.
Toàn bộ đồ án là do em xây dựng nên
Em xin cam đoan những lời nói trên là hoàn toàn đúng sự thật Mọi thôngtin sai lệch em xin hoàn toàn chịu trách nhiện trước hội đồng
Thái Nguyên, tháng 05 năm 2013
Sinh viên
Nguyễn Thị Thanh Thương
Trang 5MỤC LỤC
LỜI CẢM ƠN 1
LỜI CAM ĐOAN 2
MỤC LỤC 3
DANH MỤC HÌNH VẼ 6
DANH MỤC TỪ VIẾT TẮT 8
LỜI MỞ ĐẦU 9
CHƯƠNG I: TỔNG QUAN VỀ MỘT HỆ THỐNG XỬ LÝ ẢNH VÀ VIDEO 12
1.1 Tổng quan về xử lý ảnh 12
1.1.1 Xử lý ảnh là gì? 12
1.1.2 Các vấn đề cơ bản trong xử lý ảnh 13
a Một số khái niệm 13
b Thu nhận ảnh 13
c Biểu diễn ảnh 13
d Các kỹ thuật cơ bản trong xử lý ảnh 14
1.2 Tổng quan về xử lý video 19
1.2.1 Một số khái niệm 19
1.2.2 Một số thuộc tính đặc trưng của video 21
a.Màu (Color) 21
b Kết cấu (Texture) 22
c Hình dáng (Shape) 23
d Chuyển động (Motion) 23
1.2.3 Video tương tự 23
a Tín hiệu video tương tự 23
b.Các chuẩn video tương tự 25
c Các thiết bị video tương tự 25
1.2.4 Video số 25
a.Tín hiệu video số 25
Trang 6b Các chuẩn video số 26
d Ưu điểm của video số 27
1.2.5 Chuẩn video số AVI 28
CHƯƠNG II KỸ THUẬT TRỪ NỀN TRONG PHÁT HIỆN VÀ BÁM SÁT ĐỐI TƯỢNG CHUYỂN ĐỘNG DƯỚI SỰ TRỢ GIÚP CỦA CAMERA GIÁM SÁT 29
2.1 KỸ THUẬT TRỪ NỀN 29
2.1.1 Giới thiệu 29
2.1.2 Các phương pháp trừ nền 30
2.12.1 Các phương pháp cơ bản 31
a Sự khác biệt khung (Frame Differencing) 31
b Lọc trung bình (Running Average) 32
c Lọc trung vị (Running Median) 33
2.1.2.2 Các phương pháp cao cấp 33
a Lọc trung bình Gaussian (Running Gaussian Average) 33
b Codebook 34
2.2 KỸ THUẬT TRỪ NỀN TRONG PHÁT HIỆN VÀ BÁM SÁT ĐỐI TƯỢNG CHUYỂN ĐỘNG DƯỚI SỰ TRỢ GIÚP CỦA CAMERA GIÁM SÁT 35
2.2.1 Bài toán phát hiện đối tượng chuyển động 35
2.2.2 Bái toán phát hiện đối tượng chuyển động dựa vào phần cứng 35
2.2.3 Bài toán phát hiện đối tượng chuyển động dựa vào các kỹ thuật xử lý ảnh 36
2.2.3.1 Các kỹ thuật trừ ảnh 36
a Trừ ảnh dựa vào điểm ảnh 37
b Trừ ảnh phân khối 38
c Phương pháp biểu đồ 41
d Phương pháp thống kê 44
e Trừ ảnh dựa vào đặc trưng 44
Trang 7a Không gian màu (Color space) 46
b Mô hình nền (Background modeling) 47
c Lựa chọn ngưỡng (Thresholh selection) 48
d Thao tác trừ (Subtraction operation) 49
CHƯƠNG III CHƯƠNG TRÌNH CÀI ĐẶT THỬ NGHIỆM 52
3.1 Phát biểu bài toán 52
3.2 Thuật toán phát hiện sự chuyển động của đối tượng 52
3.3 Một số hình ảnh chạy thử nghiệm chương trình 55
3.3 Đánh giá 57
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 58
Kết luận 58
Hướng phát triển 59
TÀI LIỆU THAM KHẢO 60
Trang 8DANH MỤC HÌNH VẼ
Hình 1.1: Quá trình xử lý ảnh 12
Hình 1.2: Các giai đoạn chính trong xử lý ảnh 12
Hình 1.3: Hệ tọa độ màu RGB 13
Hình 1.4: Điểm 4 - láng giềng và 8 - láng giềng 14
Hình 1.5 : Ảnh sau khi nắn chỉnh biến dạng 15
Hình1.6: Cấu trúc phân cấp của video 20
Hình 1.7: Minh họa việc chuyển đổi giữa các lia 21
Hình 1.8: Các hình ảnh khác nhau nhưng có cùng biểu đồ 22
Hình1 9: Các hình ảnh khác nhau nhưng có cùng biểu đồ 22
Hình 1.10: Quét liên tục: Các dòng quét bắt đầu từ A đến B, tiếp tục đến C và cứ thế cho đến D rồi quay trở lại A 23
Hình 1.11: Quét xen kẽ: Dòng quét bắt đầu từ A đến B, chuyển qua C và tiếp tục cho đến khi tới D sẽ trở về E và tiếp tục quét đến F 24
Hình 1.12 : Chuỗi ảnh 26
Hình 1.13: Các chuẩn về studio số 26
Hình 1.14: Các chuẩn về ảnh và video số nén 27
Hình 2.1: Biểu đồ luồng chung của các giải thuật trừ nền 30
Hình 2.2: Các cửa sổ cơ sở trong thuật toán so sánh thực 40
Hình 2.3: So sánh biểu đồ giữa 2 ảnh 42
Trang 9Hình 2.5: Các không gian màu và phân lớp điểm ảnh của nó 47
Hình 2.6: Sơ đồ thuật giải kỹ thuật trừ nền 50
Hình 3.1: Phát hiện chuyển động đối với video 1 55
Hình 3.2: Phát hiện chuyển động đối với video 2 56
Hình 3.3: Phát hiện chuyển động đối với video 3 57
Trang 10DANH MỤC TỪ VIẾT TẮT
- AVI: Audio Video Interleave.
- OpenCV: Open Computer Vision.
- AD: Analog to Digital.
- RGB: Mô hình màu Red, Green, Blue.
- YCrCb: Tạo bởi độ sáng và không gian màu
- NTSC: National Television Standards Committee.
- PAL: Phase Alternating Line.
- SECAM: Sequential Color And Memory.
- Bpp: bits per pixel
Trang 11LỜI MỞ ĐẦU
1 Lý do chọn đề tài
Với sự phát triển nhanh chóng của các loại máy móc hiện đại như máyảnh số, máy quay phim kỹ thuật số, máy vi tính, điện thoại di động, v.v thìlượng thông tin con người thu được dưới dạng hình ảnh là khá lớn Để lượngthông tin này trở nên có ích hơn con người cần phải tiến hành xử lý nó và từ đótạo điều kiện cho sự phát triển không ngừng của các kỹ thuật xử lý hình ảnh Xử
lý ảnh là một trong những công nghệ được ứng dụng rộng rãi hiện nay trongnhiều lĩnh vực của đời sống xã hội Không chỉ dừng lại ở việc xử lý những vếtnhèo, tái chế và phục hồi các ảnh cũ, ngày nay công nghệ xử lý ảnh đã mang lạinhững tiến bộ vượt bậc như nhận dạng vân tay, nhận dạng khuôn mặt, nhận dạngđối tượng chuyển động khi nó kết hợp với lĩnh vực trí tuệ nhân tạo
Bên cạnh đó hệ thống camera giám sát ngày càng được sử dụng một cáchrộng rãi với mục đích hỗ trợ an ninh cho các cửa hàng, công ty, ngân hàng, v.v Nhưng các camera này chỉ có khả năng để lưu giữ các dữ liệu video vàchúng ta cần tốn thêm chi phí để thuê các nhân viên bảo vệ để quan sát và pháthiện khi có người nào đó xâm nhập
Hiện nay trên thế giới cũng đã có một số ứng dụng cũng như nghiên cứu
về việc giám sát hỗ trợ an ninh, phát hiện, bám sát đối tượng chuyển động Tuynhiên những nghiên cứu này phát triển riêng lẻ, chưa tính hợp được với nhau đểtạo thành một hệ thống giám sát hoàn chỉnh và giá thành cho các ứng dụng thìcón khá cao
Từ yêu cầu thực tế được đặt ra, việc xây dựng một hệ thống phát hiện vàbám sát đối tượng chuyển động từ dữ liệu thu được thông qua hệ thống cameraquan sát trong lĩnh vực thị giác máy tính là một điều cần thiết
Trang 122 Mục tiêu và nhiệm vụ nghiên cứu
Mục đích của đề tài nhằm nghiên cứu các thuật toán phát hiện và bám sátđối tượng chuyển động từ dữ liệu video, từ đó xây dựng chương trình hỗ trợ vớicác chức năng sau:
- Phát hiện đối tượng chuyển động khi có đối tượng đi vào vị trí quan sát của camera
- Bám sát đối tượng cho tới khi đối tượng chuyển động thoát khỏi vị trí của camera
Bên cạnh đó đề tài còn mong muốn giúp cho mọi người có một cái nhìntoàn diện hơn về vai trò và khả năng ứng dụng của công nghệ xử lý ảnh vàotrong thực tế của đời sống xã hội
3 Đối tượng và phạm vi nghiên cứu
* Đối tượng nghiên cứu
Trong bài toán này, dữ liệu được xử lý là đoạn video được quay từ một
camera tĩnh ghi lại với chuẩn AVI (Audio Video Interleave).
* Phạm vi nghiên cứu
Phạm vi nghiên cứu của đề tài liên quan đến lĩnh vực xử lý ảnh số thông
qua việc sử dụng bộ thư viện mở OpenCV (Open Computer Vision).
4 Bố cục đồ án
Nội dung của đồ án gồm các phần như sau:
Mở đầu
Trang 13 Chương 2: Kỹ thuật trừ nền trong phát hiện và bám sát đối tượng chuyển động
dưới sự trợ giúp của camera giám sát
Chương 3: Chương trình cài đặt thử nghiệm.
Kết luận và hướng phát triển
Trang 151.1.2 Các vấn đề cơ bản trong xử lý ảnh
a Một số khái niệm
Pixel (Picture Element): phần tử ảnh (điểm ảnh) được xem như là dấu
hiệu hay cường độ sáng tại một toạ độ trong không gian của đối tượng
Ảnh: Được xem như là một tập hợp các điểm ảnh.
Mức xám (Grey Level): Là số các giá trị có thể có của các điểm ảnh của
ảnh
Lược đồ mức xám (Histogram): Lược đồ mức xám của một ảnh là một
hàm cung cấp tần suất xuất hiện của mỗi mức xám
b Thu nhận ảnh
Để đưa ảnh vào trong máy tính chúng ta có thể dùng các thiết bị thu nhận
như: camera cộng với bộ chuyển đổi tương tự số AD (Analog to Digital) hoặc
máy quét chuyên dụng
c Biểu diễn ảnh
Sau quá trình số hoá ta sẽ thu được một ma trận tương ứng với ảnh cầnxét, mỗi phần tử của ma trận tương ứng với một điểm ảnh Các điểm này thườngđược đặc trưng bởi toạ độ màu RGB tương ứng với nó trong hệ toạ độ màu cơbản sau:
Trang 16Ảnh có thể được biểu diễn theo một trong hai mô hình sau:
- Mô hình RASTER: là mô hình biểu diễn ảnh phổ biến nhất hiện nay, ảnh được
biểu diễn dưới dạng ma trận các điểm ảnh Tùy theo nhu cầu thực tế mà mỗiđiểm ảnh có thể được biểu diễn bởi một hay nhiều bit Mô hình Raster phù hợpcho việc thu nhận và hiển thị ảnh
- Mô hình VECTOR: bên cạnh mục đích tiết kiệm không gian lưu trữ, dễ dàng
hiển thị và in ấn các ảnh biểu diễn theo mô hình vector còn ưu điểm cho phép dễdàng lựa chọn, sao chép, di chuyển, tìm kiếm Trong mô hình này người ta sửdụng hướng vector của các điểm ảnh lân cận để mã hóa và tái tạo ảnh ban đầu.Các ảnh vector được thu nhận trực tiếp từ các thiết bị số hóa như Digitalize hoặcchuyển đổi từ các ảnh raster thông qua các chương trình vector hóa
Khi xử lý các ảnh raster chúng ta có thể quan tâm đến mối quan hệ trongvùng lân cận của các điểm ảnh Các điểm ảnh có thể xếp hàng trên một lưới hìnhvuông, hoặc lưới lục giác hoặc theo một cách hoàn toàn ngẫu nhiên với nhau.Cách sắp xếp theo lưới hình vuông được quan tâm nhiều nhất với hai khái niệmsau: điểm 4 láng giềng và điểm 8 láng giềng
Hình 1.4: Điểm 4 - láng giềng và 8 - láng giềng
d Các kỹ thuật cơ bản trong xử lý ảnh
Nắn chỉnh biến dạng
Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử
Trang 17Hình 1.5 : Ảnh sau khi nắn chỉnh biến dạng
Để khắc phục người ta sử dụng các phép chiếu, các phép chiếu thườngđược xây dựng trên tập các điểm điều khiển
Giả sử (Pi, Pi’) i = 1 ,n có n các tập điều khiển
Tìm hàm f: Pi f (Pi) sao cho
min)
i
P P
i i
i i
i i n
i
y c y b x a x c y b x a Pi
Pi f
1
2 ' 2 2 2 2 ' 1 1 1 2
' 1
))((
n i i i i
n i n i
n
i i n
i i i i
n i n i
n i i n
i i i i
x nc y b x a
x y y b y a
x x y b x a
c b a
1 1 1
' 1 1 1
1 1 1
' 1
2 1
1 1 1
' 1
1 2
1 1 1
0 0 0
Trang 18Từ đó xác định được hàm f.
Khử nhiễu
Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh:
Nhiễu hệ thống: là nhiễu có quy luật có thể khử bằng các phép biến đổi
Nhiễu ngẫu nhiên: vết bẩn không rõ nguyên nhân khắc phục bằng các phéplọc
- Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ thuậtnội suy Kỹ thuật này nhằm tăng cường độ mịn cho ảnh
Phân tích ảnh
Là khâu quan trọng trong quá trình xử lý ảnh để tiến tới hiểu ảnh Trongphân tích ảnh việc trích chọn đặc điểm là một bước quan trọng Các đặc điểm củađối tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá trình xử lý ảnh
Có thể nêu ra một số đặc điểm của ảnh sau đây:
- Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ,
điểm uốn v.v
Trang 19- Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực hiện
lọc vùng (zonal filtering) Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung
tròn v.v)
- Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và do
vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được dùng khi nhậndạng đối tượng Các đặc điểm này có thể được trích chọn nhờ toán tử gradient,
toán tử la bàn, toán tử Laplace, toán tử “chéo không” (zero crossing) v.v
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đốitượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống
Nhận dạng
Nhận dạng tự động (automatic recognition): mô tả đối tượng, phân loại và
phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứngdụng trong nhiều ngành khoa học khác nhau Tuy nhiên, một câu hỏi đặt ra là:
mẫu (pattern) là gì? Watanabe, một trong những người đi đầu trong lĩnh vực này
đã định nghĩa: “Ngược lại với hỗn loạn (chaos), mẫu là một thực thể (entity), được xác định một cách ang áng (vaguely defined) và có thể gán cho nó một tên
gọi nào đó” Ví dụ mẫu có thể là ảnh của vân tay, ảnh của một vật nào đó đượcchụp, một chữ viết, khuôn mặt người hoặc một ký đồ tín hiệu tiếng nói Khi biếtmột mẫu nào đó, để nhận dạng hoặc phân loại mẫu đó có thể
Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích
phân biệt (discriminant analyis), trong đó mẫu đầu vào được định danh như một
thành phần của một lớp đã xác định
Hoặc phân loại không có mẫu (unsupervised classification hay
clustering), trong đó các mẫu được gán vào các lớp khác nhau dựa trên một tiêu
Trang 20chuẩn đồng dạng nào đó Các lớp này cho đến thời điểm phân loại vẫn chưa biếthay chưa được định danh
Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạnchủ yếu sau đây:
1o Thu nhận dữ liệu và tiền xử lý
2o Biểu diễn dữ liệu
3o Nhận dạng, ra quyết định
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
1o Đối sánh mẫu dựa trên các đặc trưng được trích chọn
2o Phân loại thống kê
3o Đối sánh cấu trúc
4o Phân loại dựa trên mạng nơ-ron nhân tạo
Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cậnđơn lẻ để phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương pháp
và cách tiếp cận khác nhau Do vậy, các phương thức phân loại tổ hợp hay được
sử dụng khi nhận dạng và nay đã có những kết quả có triển vọng dựa trên thiết kế
các hệ thống lai (hybrid system) bao gồm nhiều mô hình kết hợp.
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy sinhtrong cuộc sống không chỉ tạo ra những thách thức về thuật giải, mà còn đặt ranhững yêu cầu về tốc độ tính toán Đặc điểm chung của tất cả những ứng dụng
đó là những đặc điểm đặc trưng cần thiết thường là nhiều, không thể do chuyêngia đề xuất, mà phải được trích chọn dựa trên các thủ tục phân tích dữ liệu
Nén ảnh
Trang 21Nhằm giảm thiểu không gian lưu trữ Thường được tiến hành theo cả haicách khuynh hướng là nén có bảo toàn và không bảo toàn thông tin Nén khôngbảo toàn thì thường có khả năng nén cao hơn nhưng khả năng phục hồi thì kémhơn Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén ảnh:
- Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần suất xuất hiện
của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp Một
ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF
- Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh
để tiến hành mã hóa Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong cácvùng gần nhau Ví dụ cho kỹ thuật này là mã nén *.PCX
- Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không
bảo toàn và do vậy, kỹ thuật thướng nến hiệu quả hơn *.JPG chính là tiếp cậntheo kỹ thuật nén này
- Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sự
lặp lại của các chi tiết Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc ảnh
và quy luật sinh ra ảnh theo nguyên lý Fractal
1.2 Tổng quan về xử lý video
1.2.1 Một số khái niệm
Video hay còn gọi là chuỗi ảnh(image sequence) tượng trưng cho thông
tin hình ảnh Đó là một chuỗi các hình ảnh truyền liên tục theo thời gian
S = f(x, y, t)
Trong đó:
x, y R: là tọa độ của điểm ảnh (thông tin về không gian)
t R: thông tin về thời gian
Trang 22Dựa trên công thức trên ta thấy ảnh tĩnh là một trường hợp đặc biệt củavideo Khi đó nó là một chuỗi các ảnh không thay đổi theo thời gian.
f (x,y,t1) = f (x,y,t2); x,y R
Shot (lia) là một đơn vị cơ sở của video Một lia là một đơn vị vật lý của
dòng video, gồm chuỗi các khung hình liên tiếp, không thể chia nhỏ hơn
Scene (cảnh) là các đơn vị logic của dòng video Cấu trúc phân cấp của
video được mô tả trong hình vẽ:
Hình1.6: Cấu trúc phân cấp của video
Khi phim được chiếu các khung hình lần lượt được hiển thị ở một tốc độnhất định Tốc độ thưởng thấy ở các định dạng video là 25 hình/s hoặc 30 hình/s.Như vậy trong một giờ video số khung hình tương ứng là 108000 hoặc 9000.Phân đoạn video là quá trình phân tích và chia nội dung hình ảnh video thành cácđơn vị cơ sở gọi là các lia (shot) Việc lấy mẫu chính là chọn gần đúng mộtkhung hình video đại diện cho mỗi lia (hoặc nhiểu hơn tùy theo độ phức tạp củanội dung hình ảnh của lia), và được gọi là các khung khóa Khung khóa là khunghình đại diện mô tả nội dung chính của lia Quá trình phân đoạn dữ liệu videotiến hành phân tích, phát hiện sự chuyển đổi từ lia này sang lia khác hay chính là
sự phát hiện ranh giới giữa các lia (đó chính là sự khác nhau giữa các khung liềnkề)
Trang 23Hình 1.7: Minh họa việc chuyển đổi giữa các lia
1.2.2 Một số thuộc tính đặc trưng của video
Video có 4 đặc tính chung là: màu (color), kết cấu (texture), hình dáng (shape), chuyển động (motion).
a.Màu (Color)
Màu là một thuộc tính đặc trưng của ảnh Biểu đồ màu, biểu diễn sự phân
bố màu, là một đặc trưng màu phổ biến nhất hiện nay Biểu đồ màu không phụthuộc vào sự quay, dịch chuyển ảnh cũng như chiều nhìn ảnh Tuy nhiên với biểu
đồ màu không biểu diễn thông tin về không gian phân bố các điểm ảnh, do đó haiđiểm ảnh có cùng biểu đồ màu có thể lại có nội dung khác nhau
Trang 24Hình 1.8: Các hình ảnh khác nhau nhưng có cùng biểu đồ
Hình1 9: Các hình ảnh khác nhau nhưng có cùng biểu đồ
b Kết cấu (Texture)
Đây là một đặc trưng quan trọng của bề mặt, nơi xảy ra việc lặp lại mẫu
cơ bản Có hai dạng biểu diễn texture phổ biến đó là: biểu diễn dạng ma trậnđồng thời và biểu diễn Tamura
Trang 25c Hình dáng (Shape)
Các đặc trưng hình dáng có thể được biểu diễn sử dụng phân tích truyềnthống như bất biến mômen, mô tả Fourier, mô hình học tự động quay lui, và cácthuộc tính hình học Các đặc trưng này có thể được phân chia thành đặc trưngtoàn cục và đặc trưng cục bộ
d Chuyển động (Motion)
Motion là một thuộc tính quan trọng của video Thông tin về chuyểnđộng có thể được sinh ra bằng các kỹ thuật ghép khối hoặc luồng ánh sáng Cácđặc trưng chuyển động: mômen của trường chuyển động, biểu đồ chuyển động,các tham số chuyển động toàn cục có thể được trích chọn từ vector chuyển động
Các đặc trưng mức cao phản ánh di chuyển camera như quét (pan), nghiêng (tilt), phóng to (zoom in), thu nhỏ (zoom out) cũng có thể được trích chọn.
1.2.3 Video tương tự
a Tín hiệu video tương tự
Tín hiệu video tuần tự được xem như là tín hiệu điện một chiều theo thờigian f(t) và được lấy mẫu theo chiều dọc Việc lấy mẫu theo chu kỳ này được gọi
là quét (scanning) Các phương pháp quét thường được sử dụng nhất là quét liên tục (progressive scanning) và quét xen kẽ (interlace scanning).
Quét liên tục (progressive scanning)
Hình 1.10: Quét liên tục: Các dòng quét bắt đầu từ A đến B, tiếp tục đến C
Trang 26- Mỗi ảnh hay còn được gọi là frame là dữ liệu được lấy mẫu theo thời gian.
- Mỗi ảnh này được quét liên tục từng dòng ngang và từ trên xuống dưới với tốc
độ là ∆t giây
- Phương pháp quét này thường được dùng trong công nghiệp máy tính với tốc độ
∆t = 1/72 giây
Quét xen kẽ (interlace scanning)
Hình 1.11: Quét xen kẽ: Dòng quét bắt đầu từ A đến B, chuyển qua C
và tiếp tục cho đến khi tới D sẽ trở về E và tiếp tục quét đến F.
Vì mắt người phát hiện ra hình ảnh chớp khi tần số quét dưới 50Hz nêntần số quét của máy bao giờ cũng phải lớn hơn 50Hz Tuy nhiên khi áp dụngtrong các nghành công nghiệp khác như là nghành truyền thông thì gặp khó khăn
về vấn đề băng thông do kích thước quá lớn Từ đó xuất hiện phương pháp xen
kẽ Phương pháp này chia dòng quét thành dòng chẵn và dòng lẻ (gọi là field) và
quét các dòng chẵn trong khoảng ∆t rồi chuyển qua quét các dòng lẻ Vì thế tần
số quét sẽ giảm đi một nửa
Một vài thông số quan trọng của tín hiệu video là:
- Độ phân giải theo chiều dọc (vertical resolution): thông số này có liên quan đến
số dòng quét trên một frame
Trang 27b.Các chuẩn video tương tự
- Component Analog Video: chuẩn video này sử dụng các thành phần màu RGB
hoặc là YCrCb (YIQ hoặc là YUV)
- Composite Video: NTSC (National Television Standards Committee): xuất hiện
vào năm 1952, hiện tại được sử dụng ở Bắc Mỹ và Nhật Có 262.5 dòng trên 1field hay là 525 dòng trên 1 frame, 60 field trên 1 giây và có tỉ lệ co là 4:3
- PAL (Phase Alternating Line) và SECAM (Sequential Color And Memory):
được phát triển vào những năm 1960 và ngày nay thường được sử dụng ở Châu
Âu Ở Việt Nam cũng dùng chuẩn này Các thông số kỹ thuật: 625 line trên 1frame, 50 field trên 1 giây
c Các thiết bị video tương tự
Các thiết bị video tương tự có thể được chia làm 3 loại Loại dành cho truyềnthông Loại có chất lượng chuyên nghiệp Loại dành cho người tiêu dùng
Video được quay bởi máy quay thông thường và được lưu trong bănghoặc được quay bởi các máy quay dùng trong phim trường và tạo thành phim (24 frame/giây)
Hầu hết tín hiệu video tương tự được lưu dựa trên kỹ thuật từ ngoại, trừđĩa laser là dùng kỹ thuật quang
1.2.4 Video số
a.Tín hiệu video số
Tín hiệu video số được lưu trữ dưới dạng số Do đó chúng được lấy mẫu
và lượng tử hóa Tín hiệu video số là một thông tin 3 chiều gồm 2 chiều khônggian và 1 chiều thời gian hay còn được gọi là chuỗi ảnh số với mỗi ảnh số là mộtảnh được lấy mẫu và lượng tử hóa
Trang 28Hình 1.12: Chuỗi ảnh.
b Các chuẩn video số
Việc trao đổi giữa các ứng dụng và các sản phẩm video số đã đưa ra cácchuẩn video số: Các chuẩn này bao gồm:
- Chuẩn nén: dùng để trao đổi thông tin dạng nén của video
- Các độ phân giải hiển thị: được dùng trong công nghiệp máy tính
- Chuẩn studio số: được dùng trong ngành công nghiệp tivi
- Chuẩn về giao tiếp mạng được dùng trong công nghiệp truyền thông
Trang 29Hình 1.14: Các chuẩn về ảnh và video số nén
c Nhược điểm của video số
Nhược điểm của video số là nó đòi hỏi khối lượng lưu trữ lớn và băngthông rộng để truyền tải Với tín hiệu TV chất lượng tốt ta cần 1440 điểm ảnhtrên một dòng, 1050 dòng cho một frame độ sáng, 720 điểm trên một dòng và
525 dòng trên một frame sắc màu Bởi vì mỗi giây có 30 frame và 8 bit/pixel nênkết quả cuối cùng là xấp xỉ 545 Mps Đây là một yêu cầu quá lớn Do đó hiệnnay người ta đang nghiên cứu các phương pháp nén video để giảm kích thước khitruyền tải
d Ưu điểm của video số
Tuy có nhược điểm về yêu cầu bộ nhớ lớn nhưng video số lại có nhiều ưuđiểm quan trọng Video tuần tự cung cấp cho chúng ta một số rất giới hạn cáchoạt động tương tác như là: chọn kênh, chỉnh tới lui hay là quay chậm trên băngvideo Ngoài ra ta còn có thể chỉnh sửa, tạo các hiệu ứng đẹp trên tín hiệu video
số Video số không chỉ có vai trò giải trí mà nó còn cung cấp cho chúng ta nhiềuthông tin quan trọng trong nhiều lĩnh vực như là các ảnh giám sát quân sự, điềukhiển giao thông, và rút trích thông tin từ các dữ liệu ảnh và video
Trang 301.2.5 Chuẩn video số AVI
Theo Wikipedia, Audio Video Interleave được biết đến với tên viết tắt của
nó AVI, là một đa phương tiện định dạng container được giới thiệu bởi Microsofttrong tháng 11 năm 1992 như một phần của Video cho Windows công nghệ AVIfile có thể chứa cả âm thanh và dữ liệu video trong một thùng chứa tập tin chophép đồng bộ phát lại âm thanh với video Cũng giống như các định dạng videoDVD, các tập tin AVI hỗ trợ nhiều âm thanh và video, mặc dù các tính năng này
ít được sử dụng
Trang 31Chương 2 KỸ THUẬT TRỪ NỀN TRONG PHÁT HIỆN VÀ BÁM SÁT ĐỐI TƯỢNG CHUYỂN ĐỘNG DƯỚI SỰ TRỢ GIÚP CỦA CAMERA GIÁM SÁT
2.1 KỸ THUẬT TRỪ NỀN
2.1.1 Giới thiệu
Ý tưởng chung của phương pháp trừ nền là: để phát hiện ra được các đốitượng chuyển động trong video chúng ta phải có được mô hình nền
(background) Mô hình nền này có thể được lọc qua nhiều frame ảnh nếu nền bị
thay đổi, ngược lại ta có thể chọn một nền có sẵn nếu nền không bị thay đổi Sau
đó, ta sẽ dùng mô hình nền này để so sánh với frame ảnh hiện tại và kết quả là ta
sẽ nhận biết được đâu là vùng phần nền, đâu là các đối tượng chuyển động
Có 4 chức năng khác nhau của giải thuật trừ nền: tiền xử lý, mô hình hóa,phát hiện đối tượng và hợp lệ hóa dữ liệu
- Tiền xử lý: bao gồm những tác vụ xử lý ảnh đơn giản cho video đầu vào tạo
điều kiện cho xử lý trong những bước tiếp theo
- Mô hình hóa nền: sử dụng những frame video mới để tính toán và cập nhật một
mô hình nền.Mô hình nền này cung cấp phần mô tả thống kê của toàn bộ cảnh nền
- Phát hiện đối tượng: là xác định những pixel trong frame video không tương
ứng với mô hình nền, và đưa ra mặt nạ nhị phân tương ứng với các đối tượng
- Hợp lệ hóa dữ liệu: khảo sát mặt nạ thích hợp này, loại bỏ những pixel không
tương ứng với những đối tượng chuyển động thật và đưa ra hình ảnh cuối cùng
Trang 32Hình 2.1: Biểu đồ luồng chung của các giải thuật trừ nền
2.1.2 Các phương pháp trừ nền
Trong những ứng dụng về thị giác máy tính, vấn đề cơ bản nhất được đặt ra là
làm thế nào để phát hiện được các hình ảnh thay đổi trong video (foreground), làm thế nào để biết được đâu là những cảnh vật không thay đổi (background)…
Để giải quyết được những vấn đề đã nêu ở trên thì ta dùng phương pháp trừ nền.Đây là một trong những phương pháp nền tảng nhất trong lĩnh vực thị giác máytính Có nhiều giải thuật khác nhau về trừ nền Các giải thuật này được chiathành hai nhóm là: phương pháp cơ bản và phương pháp cao cấp Trong giới hạncủa đề tài này, sẽ trình bày chi tiết về những giải thuật trừ nền sau đây: