1. Trang chủ
  2. » Luận Văn - Báo Cáo

TÌM HIỂU KỸ THUẬT TRỪ NỀN TRONG PHÁT HIỆN VÀ BÁM SÁT ĐỐI TƯỢNG CHUYỂN ĐỘNG DƯỚI SỰ TRỢ GIÚP CỦA CAMERA GIÁM SÁT

64 96 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 64
Dung lượng 2,19 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

1. do chọn đề tài Với sự phát triển nhanh chóng của các loại máy móc hiện đại như máy ảnh số, máy quay phim kỹ thuật số, máy vi tính, điện thoại di động, . . .v.v thì lượng thông tin con người thu được dưới dạng hình ảnh là khá lớn. Để lượng thông tin này trở nên có ích hơn con người cần phải tiến hành xử lý nó và từ đó tạo điều kiện cho sự phát triển không ngừng của các kỹ thuật xử lý hình ảnh. Xử lý ảnh là một trong những công nghệ được ứng dụng rộng rãi hiện nay trong nhiều lĩnh vực của đời sống xã hội. Không chỉ dừng lại ở việc xử lý những vết nhèo, tái chế và phục hồi các ảnh cũ, ngày nay công nghệ xử lý ảnh đã mang lại những tiến bộ vượt bậc như nhận dạng vân tay, nhận dạng khuôn mặt, nhận dạng đối tượng chuyển động khi nó kết hợp với lĩnh vực trí tuệ nhân tạo. Bên cạnh đó hệ thống camera giám sát ngày càng được sử dụng một cách rộng rãi với mục đích hỗ trợ an ninh cho các cửa hàng, công ty, ngân hàng, . . v.v. Nhưng các camera này chỉ có khả năng để lưu giữ các dữ liệu video và chúng ta cần tốn thêm chi phí để thuê các nhân viên bảo vệ để quan sát và phát hiện khi có người nào đó xâm nhập.

Trang 1

ĐẠI HỌC THÁI NGUYÊN

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

NGUYỄN THỊ THANH THƯƠNG

ĐỀ TÀI:

TÌM HIỂU KỸ THUẬT TRỪ NỀN TRONG PHÁT HIỆN ĐỐI TƯỢNG CHUYỂN ĐỘNG DƯỚI SỰ TRỢ GIÚP CỦA CAMERA GIÁM SÁT

ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC

XHUYEE

Trang 2

ĐẠI HỌC THÁI NGUYÊN

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

Giáo viên hướng dẫn: ThS TRỊNH HIỀN ANH

Sinh viên : NGUYỄN THỊ THANH THƯƠNG

Lớp : HỆ THỐNG THÔNG TIN K7A

Thái Nguyên, tháng 5 năm 2013

ĐẠI HỌC THÁI NGUYÊN

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

TÌM HIỂU KỸ THUẬT TRỪ NỀN TRONG PHÁT HIỆN

VÀ BÁM SÁT ĐỐI TƯỢNG CHUYỂN ĐỘNG DƯỚI

SỰ TRỢ GIÚP CỦA CAMERA GIÁM SÁT

Sinh viên thực hiện: NGUYỄN THỊ THANH THƯƠNG

Lớp: HTTT - K7A, Hệ Chính qui

Giáo viên hướng dẫn: Th.S TRỊNH HIỀN ANH

Thái Nguyên, tháng 5 năm 2013

Trang 3

LỜI CẢM ƠN

Sau một thời gian học tập và nghiên cứu em đã hoàn thành Đồ án tốt nghiệp

với đề tài: “Tìm hiểu kỹ thuật trừ nền trong phát hiện và bám sát đối tượng chuyển động dưới sự trợ giúp của camera giám sát” Đầu tiên em xin bày bỏ

lòng kính trọng và biết ơn chân thành đến cô giáo ThS.Trịnh Hiền Anh là ngườitrực tiếp hướng dẫn và thầy giáo PGS.TS.Đỗ Năng Toàn tạo điều kiện cho emđược tìm hiểu tại Viện Công nghệ thông tin – Viện Hàn lâm Khoa học và Côngnghệ Việt Nam để hoàn thành Đồ án tốt nghiệp Qua thời gian được các thầy côhướng dẫn, em đã học hỏi được nhiều kiến thức bổ ích và kinh nghiệm quý báulàm nền tảng cho quá trình học tập, làm việc và nghiên cứu sau này

Em cũng xin chân thành cảm ơn các thầy cô giáo đang giảng dạy tại Khoacông nghệ thông tin – Trường ĐH Công nghệ thông tin và truyền thông – ĐHThái Nguyên trong suốt thời gian qua đã trang bị cho em những kiến thức cơ bảncần thiết và bổ ích giúp em hoàn thành đồ án tốt nghiệp

Em cũng xin chân thành cảm ơn các anh tại phòng Công nghệ thực tại

ảo – Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã nhiệt tình giúp đỡ emtrong quá trình làm đồ án và tìm kiếm tài liệu

Cuối cùng em xin chân thành cảm ơn gia đình và bạn bè đã cổ vũ động

viên em trong suốt thời gian vừa qua Mặc dù đã rất cố gắng nỗ lực hết mình,

song chắc chắn đồ án không khỏi còn nhiều thiếu sót Em rất mong nhận được sựthông cảm và chỉ bảo tận tình của quý Thầy cô và các bạn

Thái nguyên, ngày tháng 05 năm 2013

Sinh viên

Nguyễn Thị Thanh Thương

Trang 4

LỜI CAM ĐOAN

Để hoàn thành đồ án tốt nghiệp đúng thời gian quy định và đáp ứng đượcnhu cầu đề ra, bản thân em đã cố gắng nghiên cứu, học tập và làm việc trong thờigian dài cùng với sự hướng dẫn nhiệt tình của cô giáo Thạc Sỹ Trịnh Hiền Anh

và các bạn sinh viên cùng bộ môn Em đã tham khảo một số tài liệu nêu trong

phần “Tài liệu tham khảo” và không sao chép nội dung từ bất kỳ đồ án nào khác.

Toàn bộ đồ án là do em xây dựng nên

Em xin cam đoan những lời nói trên là hoàn toàn đúng sự thật Mọi thôngtin sai lệch em xin hoàn toàn chịu trách nhiện trước hội đồng

Thái Nguyên, tháng 05 năm 2013

Sinh viên

Nguyễn Thị Thanh Thương

Trang 5

MỤC LỤC

LỜI CẢM ƠN 1

LỜI CAM ĐOAN 2

MỤC LỤC 3

DANH MỤC HÌNH VẼ 6

DANH MỤC TỪ VIẾT TẮT 8

LỜI MỞ ĐẦU 9

CHƯƠNG I: TỔNG QUAN VỀ MỘT HỆ THỐNG XỬ LÝ ẢNH VÀ VIDEO 12

1.1 Tổng quan về xử lý ảnh 12

1.1.1 Xử lý ảnh là gì? 12

1.1.2 Các vấn đề cơ bản trong xử lý ảnh 13

a Một số khái niệm 13

b Thu nhận ảnh 13

c Biểu diễn ảnh 13

d Các kỹ thuật cơ bản trong xử lý ảnh 14

1.2 Tổng quan về xử lý video 19

1.2.1 Một số khái niệm 19

1.2.2 Một số thuộc tính đặc trưng của video 21

a.Màu (Color) 21

b Kết cấu (Texture) 22

c Hình dáng (Shape) 23

d Chuyển động (Motion) 23

1.2.3 Video tương tự 23

a Tín hiệu video tương tự 23

b.Các chuẩn video tương tự 25

c Các thiết bị video tương tự 25

1.2.4 Video số 25

a.Tín hiệu video số 25

Trang 6

b Các chuẩn video số 26

d Ưu điểm của video số 27

1.2.5 Chuẩn video số AVI 28

CHƯƠNG II KỸ THUẬT TRỪ NỀN TRONG PHÁT HIỆN VÀ BÁM SÁT ĐỐI TƯỢNG CHUYỂN ĐỘNG DƯỚI SỰ TRỢ GIÚP CỦA CAMERA GIÁM SÁT 29

2.1 KỸ THUẬT TRỪ NỀN 29

2.1.1 Giới thiệu 29

2.1.2 Các phương pháp trừ nền 30

2.12.1 Các phương pháp cơ bản 31

a Sự khác biệt khung (Frame Differencing) 31

b Lọc trung bình (Running Average) 32

c Lọc trung vị (Running Median) 33

2.1.2.2 Các phương pháp cao cấp 33

a Lọc trung bình Gaussian (Running Gaussian Average) 33

b Codebook 34

2.2 KỸ THUẬT TRỪ NỀN TRONG PHÁT HIỆN VÀ BÁM SÁT ĐỐI TƯỢNG CHUYỂN ĐỘNG DƯỚI SỰ TRỢ GIÚP CỦA CAMERA GIÁM SÁT 35

2.2.1 Bài toán phát hiện đối tượng chuyển động 35

2.2.2 Bái toán phát hiện đối tượng chuyển động dựa vào phần cứng 35

2.2.3 Bài toán phát hiện đối tượng chuyển động dựa vào các kỹ thuật xử lý ảnh 36

2.2.3.1 Các kỹ thuật trừ ảnh 36

a Trừ ảnh dựa vào điểm ảnh 37

b Trừ ảnh phân khối 38

c Phương pháp biểu đồ 41

d Phương pháp thống kê 44

e Trừ ảnh dựa vào đặc trưng 44

Trang 7

a Không gian màu (Color space) 46

b Mô hình nền (Background modeling) 47

c Lựa chọn ngưỡng (Thresholh selection) 48

d Thao tác trừ (Subtraction operation) 49

CHƯƠNG III CHƯƠNG TRÌNH CÀI ĐẶT THỬ NGHIỆM 52

3.1 Phát biểu bài toán 52

3.2 Thuật toán phát hiện sự chuyển động của đối tượng 52

3.3 Một số hình ảnh chạy thử nghiệm chương trình 55

3.3 Đánh giá 57

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 58

Kết luận 58

Hướng phát triển 59

TÀI LIỆU THAM KHẢO 60

Trang 8

DANH MỤC HÌNH VẼ

Hình 1.1: Quá trình xử lý ảnh 12

Hình 1.2: Các giai đoạn chính trong xử lý ảnh 12

Hình 1.3: Hệ tọa độ màu RGB 13

Hình 1.4: Điểm 4 - láng giềng và 8 - láng giềng 14

Hình 1.5 : Ảnh sau khi nắn chỉnh biến dạng 15

Hình1.6: Cấu trúc phân cấp của video 20

Hình 1.7: Minh họa việc chuyển đổi giữa các lia 21

Hình 1.8: Các hình ảnh khác nhau nhưng có cùng biểu đồ 22

Hình1 9: Các hình ảnh khác nhau nhưng có cùng biểu đồ 22

Hình 1.10: Quét liên tục: Các dòng quét bắt đầu từ A đến B, tiếp tục đến C và cứ thế cho đến D rồi quay trở lại A 23

Hình 1.11: Quét xen kẽ: Dòng quét bắt đầu từ A đến B, chuyển qua C và tiếp tục cho đến khi tới D sẽ trở về E và tiếp tục quét đến F 24

Hình 1.12 : Chuỗi ảnh 26

Hình 1.13: Các chuẩn về studio số 26

Hình 1.14: Các chuẩn về ảnh và video số nén 27

Hình 2.1: Biểu đồ luồng chung của các giải thuật trừ nền 30

Hình 2.2: Các cửa sổ cơ sở trong thuật toán so sánh thực 40

Hình 2.3: So sánh biểu đồ giữa 2 ảnh 42

Trang 9

Hình 2.5: Các không gian màu và phân lớp điểm ảnh của nó 47

Hình 2.6: Sơ đồ thuật giải kỹ thuật trừ nền 50

Hình 3.1: Phát hiện chuyển động đối với video 1 55

Hình 3.2: Phát hiện chuyển động đối với video 2 56

Hình 3.3: Phát hiện chuyển động đối với video 3 57

Trang 10

DANH MỤC TỪ VIẾT TẮT

- AVI: Audio Video Interleave.

- OpenCV: Open Computer Vision.

- AD: Analog to Digital.

- RGB: Mô hình màu Red, Green, Blue.

- YCrCb: Tạo bởi độ sáng và không gian màu

- NTSC: National Television Standards Committee.

- PAL: Phase Alternating Line.

- SECAM: Sequential Color And Memory.

- Bpp: bits per pixel

Trang 11

LỜI MỞ ĐẦU

1 Lý do chọn đề tài

Với sự phát triển nhanh chóng của các loại máy móc hiện đại như máyảnh số, máy quay phim kỹ thuật số, máy vi tính, điện thoại di động, v.v thìlượng thông tin con người thu được dưới dạng hình ảnh là khá lớn Để lượngthông tin này trở nên có ích hơn con người cần phải tiến hành xử lý nó và từ đótạo điều kiện cho sự phát triển không ngừng của các kỹ thuật xử lý hình ảnh Xử

lý ảnh là một trong những công nghệ được ứng dụng rộng rãi hiện nay trongnhiều lĩnh vực của đời sống xã hội Không chỉ dừng lại ở việc xử lý những vếtnhèo, tái chế và phục hồi các ảnh cũ, ngày nay công nghệ xử lý ảnh đã mang lạinhững tiến bộ vượt bậc như nhận dạng vân tay, nhận dạng khuôn mặt, nhận dạngđối tượng chuyển động khi nó kết hợp với lĩnh vực trí tuệ nhân tạo

Bên cạnh đó hệ thống camera giám sát ngày càng được sử dụng một cáchrộng rãi với mục đích hỗ trợ an ninh cho các cửa hàng, công ty, ngân hàng, v.v Nhưng các camera này chỉ có khả năng để lưu giữ các dữ liệu video vàchúng ta cần tốn thêm chi phí để thuê các nhân viên bảo vệ để quan sát và pháthiện khi có người nào đó xâm nhập

Hiện nay trên thế giới cũng đã có một số ứng dụng cũng như nghiên cứu

về việc giám sát hỗ trợ an ninh, phát hiện, bám sát đối tượng chuyển động Tuynhiên những nghiên cứu này phát triển riêng lẻ, chưa tính hợp được với nhau đểtạo thành một hệ thống giám sát hoàn chỉnh và giá thành cho các ứng dụng thìcón khá cao

Từ yêu cầu thực tế được đặt ra, việc xây dựng một hệ thống phát hiện vàbám sát đối tượng chuyển động từ dữ liệu thu được thông qua hệ thống cameraquan sát trong lĩnh vực thị giác máy tính là một điều cần thiết

Trang 12

2 Mục tiêu và nhiệm vụ nghiên cứu

Mục đích của đề tài nhằm nghiên cứu các thuật toán phát hiện và bám sátđối tượng chuyển động từ dữ liệu video, từ đó xây dựng chương trình hỗ trợ vớicác chức năng sau:

- Phát hiện đối tượng chuyển động khi có đối tượng đi vào vị trí quan sát của camera

- Bám sát đối tượng cho tới khi đối tượng chuyển động thoát khỏi vị trí của camera

Bên cạnh đó đề tài còn mong muốn giúp cho mọi người có một cái nhìntoàn diện hơn về vai trò và khả năng ứng dụng của công nghệ xử lý ảnh vàotrong thực tế của đời sống xã hội

3 Đối tượng và phạm vi nghiên cứu

* Đối tượng nghiên cứu

Trong bài toán này, dữ liệu được xử lý là đoạn video được quay từ một

camera tĩnh ghi lại với chuẩn AVI (Audio Video Interleave).

* Phạm vi nghiên cứu

Phạm vi nghiên cứu của đề tài liên quan đến lĩnh vực xử lý ảnh số thông

qua việc sử dụng bộ thư viện mở OpenCV (Open Computer Vision).

4 Bố cục đồ án

Nội dung của đồ án gồm các phần như sau:

Mở đầu

Trang 13

Chương 2: Kỹ thuật trừ nền trong phát hiện và bám sát đối tượng chuyển động

dưới sự trợ giúp của camera giám sát

Chương 3: Chương trình cài đặt thử nghiệm.

Kết luận và hướng phát triển

Trang 15

1.1.2 Các vấn đề cơ bản trong xử lý ảnh

a Một số khái niệm

Pixel (Picture Element): phần tử ảnh (điểm ảnh) được xem như là dấu

hiệu hay cường độ sáng tại một toạ độ trong không gian của đối tượng

Ảnh: Được xem như là một tập hợp các điểm ảnh.

Mức xám (Grey Level): Là số các giá trị có thể có của các điểm ảnh của

ảnh

Lược đồ mức xám (Histogram): Lược đồ mức xám của một ảnh là một

hàm cung cấp tần suất xuất hiện của mỗi mức xám

b Thu nhận ảnh

Để đưa ảnh vào trong máy tính chúng ta có thể dùng các thiết bị thu nhận

như: camera cộng với bộ chuyển đổi tương tự số AD (Analog to Digital) hoặc

máy quét chuyên dụng

c Biểu diễn ảnh

Sau quá trình số hoá ta sẽ thu được một ma trận tương ứng với ảnh cầnxét, mỗi phần tử của ma trận tương ứng với một điểm ảnh Các điểm này thườngđược đặc trưng bởi toạ độ màu RGB tương ứng với nó trong hệ toạ độ màu cơbản sau:

Trang 16

Ảnh có thể được biểu diễn theo một trong hai mô hình sau:

- Mô hình RASTER: là mô hình biểu diễn ảnh phổ biến nhất hiện nay, ảnh được

biểu diễn dưới dạng ma trận các điểm ảnh Tùy theo nhu cầu thực tế mà mỗiđiểm ảnh có thể được biểu diễn bởi một hay nhiều bit Mô hình Raster phù hợpcho việc thu nhận và hiển thị ảnh

- Mô hình VECTOR: bên cạnh mục đích tiết kiệm không gian lưu trữ, dễ dàng

hiển thị và in ấn các ảnh biểu diễn theo mô hình vector còn ưu điểm cho phép dễdàng lựa chọn, sao chép, di chuyển, tìm kiếm Trong mô hình này người ta sửdụng hướng vector của các điểm ảnh lân cận để mã hóa và tái tạo ảnh ban đầu.Các ảnh vector được thu nhận trực tiếp từ các thiết bị số hóa như Digitalize hoặcchuyển đổi từ các ảnh raster thông qua các chương trình vector hóa

Khi xử lý các ảnh raster chúng ta có thể quan tâm đến mối quan hệ trongvùng lân cận của các điểm ảnh Các điểm ảnh có thể xếp hàng trên một lưới hìnhvuông, hoặc lưới lục giác hoặc theo một cách hoàn toàn ngẫu nhiên với nhau.Cách sắp xếp theo lưới hình vuông được quan tâm nhiều nhất với hai khái niệmsau: điểm 4 láng giềng và điểm 8 láng giềng

Hình 1.4: Điểm 4 - láng giềng và 8 - láng giềng

d Các kỹ thuật cơ bản trong xử lý ảnh

Nắn chỉnh biến dạng

Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử

Trang 17

Hình 1.5 : Ảnh sau khi nắn chỉnh biến dạng

Để khắc phục người ta sử dụng các phép chiếu, các phép chiếu thườngđược xây dựng trên tập các điểm điều khiển

Giả sử (Pi, Pi’) i = 1 ,n có n các tập điều khiển

Tìm hàm f: Pi  f (Pi) sao cho

min)

i

P P

i i

i i

i i n

i

y c y b x a x c y b x a Pi

Pi f

1

2 ' 2 2 2 2 ' 1 1 1 2

' 1

))((

n i i i i

n i n i

n

i i n

i i i i

n i n i

n i i n

i i i i

x nc y b x a

x y y b y a

x x y b x a

c b a

1 1 1

' 1 1 1

1 1 1

' 1

2 1

1 1 1

' 1

1 2

1 1 1

0 0 0

Trang 18

Từ đó xác định được hàm f.

Khử nhiễu

Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh:

 Nhiễu hệ thống: là nhiễu có quy luật có thể khử bằng các phép biến đổi

 Nhiễu ngẫu nhiên: vết bẩn không rõ nguyên nhân  khắc phục bằng các phéplọc

- Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ thuậtnội suy Kỹ thuật này nhằm tăng cường độ mịn cho ảnh

Phân tích ảnh

Là khâu quan trọng trong quá trình xử lý ảnh để tiến tới hiểu ảnh Trongphân tích ảnh việc trích chọn đặc điểm là một bước quan trọng Các đặc điểm củađối tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá trình xử lý ảnh

Có thể nêu ra một số đặc điểm của ảnh sau đây:

- Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ,

điểm uốn v.v

Trang 19

- Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực hiện

lọc vùng (zonal filtering) Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung

tròn v.v)

- Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và do

vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được dùng khi nhậndạng đối tượng Các đặc điểm này có thể được trích chọn nhờ toán tử gradient,

toán tử la bàn, toán tử Laplace, toán tử “chéo không” (zero crossing) v.v

Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đốitượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống

Nhận dạng

Nhận dạng tự động (automatic recognition): mô tả đối tượng, phân loại và

phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứngdụng trong nhiều ngành khoa học khác nhau Tuy nhiên, một câu hỏi đặt ra là:

mẫu (pattern) là gì? Watanabe, một trong những người đi đầu trong lĩnh vực này

đã định nghĩa: “Ngược lại với hỗn loạn (chaos), mẫu là một thực thể (entity), được xác định một cách ang áng (vaguely defined) và có thể gán cho nó một tên

gọi nào đó” Ví dụ mẫu có thể là ảnh của vân tay, ảnh của một vật nào đó đượcchụp, một chữ viết, khuôn mặt người hoặc một ký đồ tín hiệu tiếng nói Khi biếtmột mẫu nào đó, để nhận dạng hoặc phân loại mẫu đó có thể

Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích

phân biệt (discriminant analyis), trong đó mẫu đầu vào được định danh như một

thành phần của một lớp đã xác định

Hoặc phân loại không có mẫu (unsupervised classification hay

clustering), trong đó các mẫu được gán vào các lớp khác nhau dựa trên một tiêu

Trang 20

chuẩn đồng dạng nào đó Các lớp này cho đến thời điểm phân loại vẫn chưa biếthay chưa được định danh

Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạnchủ yếu sau đây:

1o Thu nhận dữ liệu và tiền xử lý

2o Biểu diễn dữ liệu

3o Nhận dạng, ra quyết định

Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:

1o Đối sánh mẫu dựa trên các đặc trưng được trích chọn

2o Phân loại thống kê

3o Đối sánh cấu trúc

4o Phân loại dựa trên mạng nơ-ron nhân tạo

Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cậnđơn lẻ để phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương pháp

và cách tiếp cận khác nhau Do vậy, các phương thức phân loại tổ hợp hay được

sử dụng khi nhận dạng và nay đã có những kết quả có triển vọng dựa trên thiết kế

các hệ thống lai (hybrid system) bao gồm nhiều mô hình kết hợp.

Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy sinhtrong cuộc sống không chỉ tạo ra những thách thức về thuật giải, mà còn đặt ranhững yêu cầu về tốc độ tính toán Đặc điểm chung của tất cả những ứng dụng

đó là những đặc điểm đặc trưng cần thiết thường là nhiều, không thể do chuyêngia đề xuất, mà phải được trích chọn dựa trên các thủ tục phân tích dữ liệu

Nén ảnh

Trang 21

Nhằm giảm thiểu không gian lưu trữ Thường được tiến hành theo cả haicách khuynh hướng là nén có bảo toàn và không bảo toàn thông tin Nén khôngbảo toàn thì thường có khả năng nén cao hơn nhưng khả năng phục hồi thì kémhơn Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén ảnh:

- Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần suất xuất hiện

của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp Một

ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF

- Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh

để tiến hành mã hóa Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong cácvùng gần nhau Ví dụ cho kỹ thuật này là mã nén *.PCX

- Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không

bảo toàn và do vậy, kỹ thuật thướng nến hiệu quả hơn *.JPG chính là tiếp cậntheo kỹ thuật nén này

- Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sự

lặp lại của các chi tiết Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc ảnh

và quy luật sinh ra ảnh theo nguyên lý Fractal

1.2 Tổng quan về xử lý video

1.2.1 Một số khái niệm

Video hay còn gọi là chuỗi ảnh(image sequence) tượng trưng cho thông

tin hình ảnh Đó là một chuỗi các hình ảnh truyền liên tục theo thời gian

S = f(x, y, t)

Trong đó:

x, y  R: là tọa độ của điểm ảnh (thông tin về không gian)

t  R: thông tin về thời gian

Trang 22

Dựa trên công thức trên ta thấy ảnh tĩnh là một trường hợp đặc biệt củavideo Khi đó nó là một chuỗi các ảnh không thay đổi theo thời gian.

f (x,y,t1) = f (x,y,t2); x,y  R

Shot (lia) là một đơn vị cơ sở của video Một lia là một đơn vị vật lý của

dòng video, gồm chuỗi các khung hình liên tiếp, không thể chia nhỏ hơn

Scene (cảnh) là các đơn vị logic của dòng video Cấu trúc phân cấp của

video được mô tả trong hình vẽ:

Hình1.6: Cấu trúc phân cấp của video

Khi phim được chiếu các khung hình lần lượt được hiển thị ở một tốc độnhất định Tốc độ thưởng thấy ở các định dạng video là 25 hình/s hoặc 30 hình/s.Như vậy trong một giờ video số khung hình tương ứng là 108000 hoặc 9000.Phân đoạn video là quá trình phân tích và chia nội dung hình ảnh video thành cácđơn vị cơ sở gọi là các lia (shot) Việc lấy mẫu chính là chọn gần đúng mộtkhung hình video đại diện cho mỗi lia (hoặc nhiểu hơn tùy theo độ phức tạp củanội dung hình ảnh của lia), và được gọi là các khung khóa Khung khóa là khunghình đại diện mô tả nội dung chính của lia Quá trình phân đoạn dữ liệu videotiến hành phân tích, phát hiện sự chuyển đổi từ lia này sang lia khác hay chính là

sự phát hiện ranh giới giữa các lia (đó chính là sự khác nhau giữa các khung liềnkề)

Trang 23

Hình 1.7: Minh họa việc chuyển đổi giữa các lia

1.2.2 Một số thuộc tính đặc trưng của video

Video có 4 đặc tính chung là: màu (color), kết cấu (texture), hình dáng (shape), chuyển động (motion).

a.Màu (Color)

Màu là một thuộc tính đặc trưng của ảnh Biểu đồ màu, biểu diễn sự phân

bố màu, là một đặc trưng màu phổ biến nhất hiện nay Biểu đồ màu không phụthuộc vào sự quay, dịch chuyển ảnh cũng như chiều nhìn ảnh Tuy nhiên với biểu

đồ màu không biểu diễn thông tin về không gian phân bố các điểm ảnh, do đó haiđiểm ảnh có cùng biểu đồ màu có thể lại có nội dung khác nhau

Trang 24

Hình 1.8: Các hình ảnh khác nhau nhưng có cùng biểu đồ

Hình1 9: Các hình ảnh khác nhau nhưng có cùng biểu đồ

b Kết cấu (Texture)

Đây là một đặc trưng quan trọng của bề mặt, nơi xảy ra việc lặp lại mẫu

cơ bản Có hai dạng biểu diễn texture phổ biến đó là: biểu diễn dạng ma trậnđồng thời và biểu diễn Tamura

Trang 25

c Hình dáng (Shape)

Các đặc trưng hình dáng có thể được biểu diễn sử dụng phân tích truyềnthống như bất biến mômen, mô tả Fourier, mô hình học tự động quay lui, và cácthuộc tính hình học Các đặc trưng này có thể được phân chia thành đặc trưngtoàn cục và đặc trưng cục bộ

d Chuyển động (Motion)

Motion là một thuộc tính quan trọng của video Thông tin về chuyểnđộng có thể được sinh ra bằng các kỹ thuật ghép khối hoặc luồng ánh sáng Cácđặc trưng chuyển động: mômen của trường chuyển động, biểu đồ chuyển động,các tham số chuyển động toàn cục có thể được trích chọn từ vector chuyển động

Các đặc trưng mức cao phản ánh di chuyển camera như quét (pan), nghiêng (tilt), phóng to (zoom in), thu nhỏ (zoom out) cũng có thể được trích chọn.

1.2.3 Video tương tự

a Tín hiệu video tương tự

Tín hiệu video tuần tự được xem như là tín hiệu điện một chiều theo thờigian f(t) và được lấy mẫu theo chiều dọc Việc lấy mẫu theo chu kỳ này được gọi

là quét (scanning) Các phương pháp quét thường được sử dụng nhất là quét liên tục (progressive scanning) và quét xen kẽ (interlace scanning).

Quét liên tục (progressive scanning)

Hình 1.10: Quét liên tục: Các dòng quét bắt đầu từ A đến B, tiếp tục đến C

Trang 26

- Mỗi ảnh hay còn được gọi là frame là dữ liệu được lấy mẫu theo thời gian.

- Mỗi ảnh này được quét liên tục từng dòng ngang và từ trên xuống dưới với tốc

độ là ∆t giây

- Phương pháp quét này thường được dùng trong công nghiệp máy tính với tốc độ

∆t = 1/72 giây

Quét xen kẽ (interlace scanning)

Hình 1.11: Quét xen kẽ: Dòng quét bắt đầu từ A đến B, chuyển qua C

và tiếp tục cho đến khi tới D sẽ trở về E và tiếp tục quét đến F.

Vì mắt người phát hiện ra hình ảnh chớp khi tần số quét dưới 50Hz nêntần số quét của máy bao giờ cũng phải lớn hơn 50Hz Tuy nhiên khi áp dụngtrong các nghành công nghiệp khác như là nghành truyền thông thì gặp khó khăn

về vấn đề băng thông do kích thước quá lớn Từ đó xuất hiện phương pháp xen

kẽ Phương pháp này chia dòng quét thành dòng chẵn và dòng lẻ (gọi là field) và

quét các dòng chẵn trong khoảng ∆t rồi chuyển qua quét các dòng lẻ Vì thế tần

số quét sẽ giảm đi một nửa

Một vài thông số quan trọng của tín hiệu video là:

- Độ phân giải theo chiều dọc (vertical resolution): thông số này có liên quan đến

số dòng quét trên một frame

Trang 27

b.Các chuẩn video tương tự

- Component Analog Video: chuẩn video này sử dụng các thành phần màu RGB

hoặc là YCrCb (YIQ hoặc là YUV)

- Composite Video: NTSC (National Television Standards Committee): xuất hiện

vào năm 1952, hiện tại được sử dụng ở Bắc Mỹ và Nhật Có 262.5 dòng trên 1field hay là 525 dòng trên 1 frame, 60 field trên 1 giây và có tỉ lệ co là 4:3

- PAL (Phase Alternating Line) và SECAM (Sequential Color And Memory):

được phát triển vào những năm 1960 và ngày nay thường được sử dụng ở Châu

Âu Ở Việt Nam cũng dùng chuẩn này Các thông số kỹ thuật: 625 line trên 1frame, 50 field trên 1 giây

c Các thiết bị video tương tự

Các thiết bị video tương tự có thể được chia làm 3 loại Loại dành cho truyềnthông Loại có chất lượng chuyên nghiệp Loại dành cho người tiêu dùng

Video được quay bởi máy quay thông thường và được lưu trong bănghoặc được quay bởi các máy quay dùng trong phim trường và tạo thành phim (24 frame/giây)

Hầu hết tín hiệu video tương tự được lưu dựa trên kỹ thuật từ ngoại, trừđĩa laser là dùng kỹ thuật quang

1.2.4 Video số

a.Tín hiệu video số

Tín hiệu video số được lưu trữ dưới dạng số Do đó chúng được lấy mẫu

và lượng tử hóa Tín hiệu video số là một thông tin 3 chiều gồm 2 chiều khônggian và 1 chiều thời gian hay còn được gọi là chuỗi ảnh số với mỗi ảnh số là mộtảnh được lấy mẫu và lượng tử hóa

Trang 28

Hình 1.12: Chuỗi ảnh.

b Các chuẩn video số

Việc trao đổi giữa các ứng dụng và các sản phẩm video số đã đưa ra cácchuẩn video số: Các chuẩn này bao gồm:

- Chuẩn nén: dùng để trao đổi thông tin dạng nén của video

- Các độ phân giải hiển thị: được dùng trong công nghiệp máy tính

- Chuẩn studio số: được dùng trong ngành công nghiệp tivi

- Chuẩn về giao tiếp mạng được dùng trong công nghiệp truyền thông

Trang 29

Hình 1.14: Các chuẩn về ảnh và video số nén

c Nhược điểm của video số

Nhược điểm của video số là nó đòi hỏi khối lượng lưu trữ lớn và băngthông rộng để truyền tải Với tín hiệu TV chất lượng tốt ta cần 1440 điểm ảnhtrên một dòng, 1050 dòng cho một frame độ sáng, 720 điểm trên một dòng và

525 dòng trên một frame sắc màu Bởi vì mỗi giây có 30 frame và 8 bit/pixel nênkết quả cuối cùng là xấp xỉ 545 Mps Đây là một yêu cầu quá lớn Do đó hiệnnay người ta đang nghiên cứu các phương pháp nén video để giảm kích thước khitruyền tải

d Ưu điểm của video số

Tuy có nhược điểm về yêu cầu bộ nhớ lớn nhưng video số lại có nhiều ưuđiểm quan trọng Video tuần tự cung cấp cho chúng ta một số rất giới hạn cáchoạt động tương tác như là: chọn kênh, chỉnh tới lui hay là quay chậm trên băngvideo Ngoài ra ta còn có thể chỉnh sửa, tạo các hiệu ứng đẹp trên tín hiệu video

số Video số không chỉ có vai trò giải trí mà nó còn cung cấp cho chúng ta nhiềuthông tin quan trọng trong nhiều lĩnh vực như là các ảnh giám sát quân sự, điềukhiển giao thông, và rút trích thông tin từ các dữ liệu ảnh và video

Trang 30

1.2.5 Chuẩn video số AVI

Theo Wikipedia, Audio Video Interleave được biết đến với tên viết tắt của

nó AVI, là một đa phương tiện định dạng container được giới thiệu bởi Microsofttrong tháng 11 năm 1992 như một phần của Video cho Windows công nghệ AVIfile có thể chứa cả âm thanh và dữ liệu video trong một thùng chứa tập tin chophép đồng bộ phát lại âm thanh với video Cũng giống như các định dạng videoDVD, các tập tin AVI hỗ trợ nhiều âm thanh và video, mặc dù các tính năng này

ít được sử dụng

Trang 31

Chương 2 KỸ THUẬT TRỪ NỀN TRONG PHÁT HIỆN VÀ BÁM SÁT ĐỐI TƯỢNG CHUYỂN ĐỘNG DƯỚI SỰ TRỢ GIÚP CỦA CAMERA GIÁM SÁT

2.1 KỸ THUẬT TRỪ NỀN

2.1.1 Giới thiệu

Ý tưởng chung của phương pháp trừ nền là: để phát hiện ra được các đốitượng chuyển động trong video chúng ta phải có được mô hình nền

(background) Mô hình nền này có thể được lọc qua nhiều frame ảnh nếu nền bị

thay đổi, ngược lại ta có thể chọn một nền có sẵn nếu nền không bị thay đổi Sau

đó, ta sẽ dùng mô hình nền này để so sánh với frame ảnh hiện tại và kết quả là ta

sẽ nhận biết được đâu là vùng phần nền, đâu là các đối tượng chuyển động

Có 4 chức năng khác nhau của giải thuật trừ nền: tiền xử lý, mô hình hóa,phát hiện đối tượng và hợp lệ hóa dữ liệu

- Tiền xử lý: bao gồm những tác vụ xử lý ảnh đơn giản cho video đầu vào tạo

điều kiện cho xử lý trong những bước tiếp theo

- Mô hình hóa nền: sử dụng những frame video mới để tính toán và cập nhật một

mô hình nền.Mô hình nền này cung cấp phần mô tả thống kê của toàn bộ cảnh nền

- Phát hiện đối tượng: là xác định những pixel trong frame video không tương

ứng với mô hình nền, và đưa ra mặt nạ nhị phân tương ứng với các đối tượng

- Hợp lệ hóa dữ liệu: khảo sát mặt nạ thích hợp này, loại bỏ những pixel không

tương ứng với những đối tượng chuyển động thật và đưa ra hình ảnh cuối cùng

Trang 32

Hình 2.1: Biểu đồ luồng chung của các giải thuật trừ nền

2.1.2 Các phương pháp trừ nền

Trong những ứng dụng về thị giác máy tính, vấn đề cơ bản nhất được đặt ra là

làm thế nào để phát hiện được các hình ảnh thay đổi trong video (foreground), làm thế nào để biết được đâu là những cảnh vật không thay đổi (background)…

Để giải quyết được những vấn đề đã nêu ở trên thì ta dùng phương pháp trừ nền.Đây là một trong những phương pháp nền tảng nhất trong lĩnh vực thị giác máytính Có nhiều giải thuật khác nhau về trừ nền Các giải thuật này được chiathành hai nhóm là: phương pháp cơ bản và phương pháp cao cấp Trong giới hạncủa đề tài này, sẽ trình bày chi tiết về những giải thuật trừ nền sau đây:

Ngày đăng: 29/05/2020, 16:39

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] TS. Đỗ Năng Toàn - TS. Phạm Việt Bình, “Giáo trình Xử lý ảnh”, Khoa công nghệ thông tin – Đại học Thái Nguyên, 2007 Sách, tạp chí
Tiêu đề: Giáo trình Xử lý ảnh
[2] Lương Mạnh Bá – Nguyễn Thanh Thủy, “Nhập môn Xử lý ảnh”, Trường đại học Bách khoa Hà Nội, 2008 Sách, tạp chí
Tiêu đề: Nhập môn Xử lý ảnh
[3] A. Hampapur – T. Weymouth – R. Jain , “Digital Video Segmentation”, Proc.AMC Multimedia 94, San Francisco CA, 1994, PP. 357 – 364 Sách, tạp chí
Tiêu đề: Digital Video Segmentation
[4] B. Shahraray, “Scene Change Detection and Contene – Based Sampling of Video Sequences”, Digital Video Compression: Algorithms and Technologies, 1995, pp. 2 – 13 Sách, tạp chí
Tiêu đề: Scene Change Detection and Contene – Based Sampling ofVideo Sequences
[5] Jirpi Korki – Anttila, “Automatic color enhancement and sence change detection of digital video”, Dept of Automation and System, Lab of Media Technology, Hensiki University of Technology, 2002 Sách, tạp chí
Tiêu đề: Automatic color enhancement and sence changedetection of digital video
[6] W. Xiong, J. C-M Lee, M-C Ip, “Net Comparison: AVersatile and Efficient Method for Scene Change Detection”, 1995, pp. 318 – 328 Sách, tạp chí
Tiêu đề: “Net Comparison: AVersatile and EfficientMethod for Scene Change Detection”

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w