1. Trang chủ
  2. » Luận Văn - Báo Cáo

tái tạo video dựa vào kỹ thuật nội suy bù chuyển động

64 533 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 64
Dung lượng 1,11 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Phần này trình bày các nghiên cứu về kỹ thuật trừ ảnh và lọc ảnh, các -u và nh-ợc điểm của từng kỹ thuật trong việc xác định cảnh của video và trích rút khung hình đặc tr-ng trong mỗi cả

Trang 1

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

ĐẠI HỌC THÁI NGUYÊN ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

-oOo -

Phạm Tuấn Anh

TÁI TẠO VIDEO DỰA VÀO KỸ THUẬT

NỘI SUY BÙ CHUYỂN ĐỘNG

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

Thái Nguyên, tháng 06 năm 2014

Trang 2

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

LỜI CẢM ƠN

Để hoàn tất một luận văn thạc sĩ yêu cầu sự tập trung, sự cố gắng và độc lập nghiên cứu Bản thân tôi sau những năm tháng học tập vất vả và nghiên cứu cũng đã cố gắng để hoàn thành được luận văn này Tôi luôn ghi nhận những sự đóng góp giúp đỡ nhiệt tình của những người bên cạnh mình, sự ủng hộ, sự hỗ trợ của gia đình bạn bè giúp tôi có thêm động lực để hoàn thành luận tốt nghiệp, nhân đây tôi muốn gửi lời cảm ơn nhất tới họ

Lời cảm ơn trân trọng đầu tiên tôi muốn dành tới TS Nguyễn Thị Hồng Minh, đã hướng dẫn tôi trong suốt quá trình làm luận văn, nhờ sự định hướng của cô giúp tôi tự tin nghiên cứu những vấn đề mới và giải quyết bài toán một cách khoa học

Tôi xin trân trọng cảm ơn Ban giám hiệu trường Đại học công nghệ thông tin, Đại học Thái nguyên, khoa CNTT đã tạo các điều kiện cho chúng tôi được học tập và làm khóa luận một cách thuận lợi

Lời cảm ơn sâu sắc muốn được gửi tới các thầy cô giáo đã dạy dỗ và mở ra cho chúng tôi thấy chân trời tri thức mới, hướng dẫn chúng tôi cách khám phá

và làm chủ công nghệ mới

Tôi muốn gửi lời cảm ơn chân thành đến tập thể lớp CHK11D-KHMT đã cùng tôi đi qua những tháng ngày miệt mài học tập, cùng chia sẻ những niềm vui nỗi buồn, động viên tôi đi qua những khó khăn, để tôi vững bước vượt qua những vất vả, quyết tâm hoàn thành luận văn này

Tuy nhiên do thời gian có hạn, mặc dù đã nỗ lực cố gắng hết mình nhưng chắc rằng luận văn khó tránh khỏi những thiếu sót Rất mong được sự chỉ bảo, góp ý tận tình của Quý thầy cô và các bạn

Trang 3

Số húa bởi Trung tõm Học liệu http://www.lrc-tnu.edu.vn/

Mục lục

Lời cảm ơn 1

Phần mở đầu 6

Ch-ơng 1: Khái quát về video và bài toán tái tạo video 8

1.1 Khái quát về video 8

1.1.1 Một số khái niệm cơ bản 8

1.1.1.1 Các dạng video 9

1.1.1.2 Một số định chuẩn video 10

1.1.2 Video và các thao tác video 26

1.1.2.1 Các hiệu ứng biên tập video 276

1.1.2.2 Một số thuộc tính đặc tr-ng của video 287

1.1.2.2.1 Màu(Color) 287

1.1.2.2.2 Kết cấu (Texture) 298

1.1.2.2.3 Hình dáng (Shape) 298

1.1.2.2.4 Chuyển động (Motion) 309

1.2 Bài toán tái tạo video 30

Ch-ơng 2: Một số vấn đề trong tái tạo video 33

2.1 Trích rút video 33

2.1.1 Kỹ thuật trừ ảnh xác định trong video 33

2.1.2 Trừ ảnh dựa vào điểm ảnh 34

2.1.3 Trừ ảnh phân khối 36

2.1.4 Trừ ảnh dựa vào biểu đồ 38

2.2 Một số kỹ thuật tái tạo video 44

2.2.1 Kỹ thuật nội suy không gian 50

2.2.3 Kỹ thuật nội suy bù chuyển động 52

Ch-ơng 3: Ch-ơng trình thử nghiệm 57

3.1 Đặt vấn đề 57

3.2 Phân tích, lựa chọn công cụ 57

3.3 Một số giao diện của ch-ơng trình 58

Trang 4

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

PhÇn kÕt luËn 60 Danh môc tµi liÖu tham kh¶o 621

Trang 5

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

Danh môc h×nh vÏ

Hình 1.1 : Cấu trúc phân cấp video 8

Hình 1.2 : Minh họa chuyển đổi giữa các lia 9

Hình 1.3 :Sơ đồ giải nén MPEG-1(ISO/IEC 11172) 18

Hình 1.4 : Sơ đồ nén dữ liệu âm thanh 18

Hình 1.5 : Mô hình hệ thống giải mã MPEG-2 20

Hình 1.6 : Mô hình nén và giải nén theo từng lớp của MPEG-4 23

Hình 1.7 : Một số wipe cơ bản 27

Hình 1.8 : Các ảnh rất khác nhau nhưng có cùng biểu đồ màu 28

Hình 1.9 : Biểu đồ thể hiện 4 loại ảnh cơ bản 28

Hình 1.10 : Các thao tác camera 29

Hình 1.11 : Mô hình chung của phép cộng ảnh 30

Hình 1.12 : Ánh xạ các đặc trưng 31

Hình 2.1 : Quá trình phân đoạn video 34

Hình 2.2 : Các cửa sổ cơ sở trong thuật toán so sánh thực 37

Hình 2.3 : Chênh lệch biêt đồ, * cắt cảnh, chồng mờ 38

Hình 2.4 : So sánh biểu đồ màu giữa hai ảnh 39

Hình 2.5 : So sánh các cặp a, Chênh lệch biểu đồ liên tiếp b, Chênh lệch biêt đồ tích lũy 42

Hình 2.6 : Phát hiện chuyển cảnh dần dần bằng kỹ thuật so sánh cặp 43

Hình 2.7 : Biểu diễn giá trị f c (x,y)bằng nội suy song tuyến 49

Hình 2.8 : Ảnh tịn tiến di chuyển d x , d y 51

Hình 2.9 : Nội suy sinh khung trung gian f(n 1 , n 2 , t) 53

Trang 6

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

Hình 2.10 : Mô tả nội suy theo thời gian 54 Hình 2.11 : tái tạo cảnh theo ba bước (1) hình ảnh gốc I 0 và I 1 được kéo giãn để tạo ra những hình ảnh song song I^ 0 và I^ 1 (2)I^ S được tạo ra bằng cách phối hợp hai hình ảnh kéo giãn( trung gian).(3) I^ S được co lại để tạo thành

I S 55

Hình 3.1 : Giao diện module trích rút video 58 Hình 3.2 : Giao diện module tái tạo video 59

Trang 7

Số húa bởi Trung tõm Học liệu http://www.lrc-tnu.edu.vn/

Phần Mở đầu

Video ra đời vào những năm đầu của thế kỷ XX và phỏt triển khỏ mạnh

mẽ, nhưng phải đến cuối thập kỷ XX video số mới phỏt triển Với sự ra đời và phỏt triển mạnh của mỏy tớnh và hệ thống viễn thụng, dữ liệu video đó được số hoỏ và đưa vào xử lý trờn hệ thống mỏy tớnh Việc xử lý dữ liệu video được số hoỏ trờn mỏy tớnh tỏ ra khỏ hiệu quả Kết quả là dữ liệu video số đó được đưa vào rất nhiều ứng dụng trong thực tế như truyền hỡnh, đào tạo điện tử dựa vào mỏy tớnh, hỗ trợ đào tạo trờn mạng, hệ thống mụ phỏng, video theo yờu cầu

Video là phương tiện thụng tin đại chỳng cú độ phõn giải cao và nội dung thụng tin rất phong phỳ Tuy nhiờn vỡ nhiều nguyờn nhõn như: chất lượng thiết

bị thu nhận video, do chuyển động của đối tượng… làm thiếu khuyết cỏc khung hỡnh trong video, ảnh hưởng đến nội dung, chất lượng của video Do đú cần tỏi tạo cỏc khung hỡnh bị thiếu khuyết trong video Hiện nay cú rất nhiều cụng trỡnh nghiờn cứu để tỏi tạo cỏc khung hỡnh bị thiếu khuyết trong video và đó đạt được những kết quả nhất định Tuy nhiờn việc sử dụng kỹ thuật nội suy bự chuyển động để tỏi tạo khung hỡnh bị thiếu khuyết trong video vẫn chưa cú nhiều sự đầu

tư, nghiờn cứu chuyờn sõu Xuất phỏt trong hoàn cảnh đú luận văn lựa chọn đề

tài: Tỏi tạo video dựa vào kỹ thuật nội suy bự chuyển động

Để đạt đ-ợc mục tiêu đề ra, luận văn tập trung nghiên cứu một số vấn đề cơ bản sau đây:

"Nghiên cứu tổng quan về video" Phần này trình bày một số khái niệm và các vấn đề cơ bản trong xử lý và tái tạo video

"Nghiên cứu một số kỹ thuật trích rút và tái tạo video" Phần này trình bày các nghiên cứu về kỹ thuật trừ ảnh và lọc ảnh, các -u và nh-ợc điểm của từng kỹ thuật trong việc xác định cảnh của video và trích rút khung hình đặc tr-ng trong mỗi cảnh của video để l-u trữ Phần này cũng trình bày các nghiên cứu về các

kỹ thuật tạo lập khung hình trung gian trong việc tái tạo đoạn video từ các khung hình đại diện dựa vào kỹ thuật nội suy bù chuyển động

Trang 8

Số húa bởi Trung tõm Học liệu http://www.lrc-tnu.edu.vn/

"Nghiên cứu và ứng dụng kỹ thuật tái tạo video" Đ-a ra một số ứng dụng

kỹ thuật tái tạo video Cài đặt và thử nghiệm và đánh giá kỹ thuật tái tạo video dựa vào kỹ thuật nội suy bù chuyển động để khôi phục lại các khung hình bị thiếu khuyết từ những khung hình đã trích rút

Trên cơ sở các mục tiêu đặt ra, cấu trúc của luận văn bao gồm 3 ch-ơng:

Ch-ơng 1: Khái quát về video và bài toán tái tạo video

Ch-ơng 2: Một số vấn đề trong tái tạo video

Ch-ơng 3: Ch-ơng trình thử nghiệm

Trang 9

Số húa bởi Trung tõm Học liệu http://www.lrc-tnu.edu.vn/

Ch-ơng 1 kháI quát về video và bài toán táI tạo video

1.1 Khái quát về video

1.1.1 Một số khái niệm cơ bản

Video là tập hợp các khung hình (frames), mỗi khung hình là một ảnh Shot (hay lia) là đơn vị cơ sở của video Một lia là một đơn vị vật lý của dòng video, gồm các chuỗi các khung hình liên tiếp, không thể chia nhỏ hơn, ứng với một thao tác camera đơn

Scene (cảnh) là các đơn vị logic của dòng video, một cảnh gồm các lia liên quan về không gian và liền kề về thời gian, cùng mô tả một nội dung ngữ nghĩa hoặc một tình tiết Khi phim đ-ợc chiếu, các khung hình lần l-ợt đ-ợc hiển thị ở tốc độ nhất định Tốc độ th-ờng thấy ở các định dạng video khác nhau

là 25 hoặc 30 hình/s Nh- vậy, một giờ video sẽ có số l-ợng khung hình t-ơng ứng là 90000 hoặc là 1080000

Cấu trúc phân cấp của video đ-ợc thể hiện trên hình d-ới đây

Hình 1.1: Cấu trúc phân cấp video

Phân đoạn video là quá trình phân tích và chia nội dung hình ảnh video thành các đơn vị cơ sở gọi là các lia (shot) Việc lấy mẫu chính là chọn gần đúng một khung video đại diện cho mỗi lia (hoặc nhiều hơn tuỳ theo mức độ phức tạp của nội dung hình ảnh của lia) và đ-ợc gọi là các khung khoá Khung khoá là khung hình đại diện mô tả nội dung chính của shot Quá trình phân đoạn dữ liệu video tiến hành, phát hiện sự chuyển đổi từ lia này sang lia khác hay chính là sự phát hiện ranh giới giữa các lia (đó chính là đo sự khác nhau giữa các khung hình liền kề) Trong hình d-ới đây minh họa về sự chuyển đổi giữa các lia:

Trang 10

Số húa bởi Trung tõm Học liệu http://www.lrc-tnu.edu.vn/

Hình 1.2: Minh hoạ về sự chuyển đổi giữa các lia

1.1.1.1.Cỏc dạng video

1.1.1.1.1.Video tương tự

NTSC Video: Đõy là dạng Video tương tự với 525 dũng trờn một khung hỡnh,

30 khung hỡnh trong một giõy, quột cỏch dũng, chia làm hai trường (mỗi trường 262.5 dũng), cú 20 dũng dự trữ cho thụng tin điều khiển tại thời điểm bắt đầu mỗi trường

PAL Video: Dạng Video này cú 625 dũng trờn một khung hỡnh, 25 khung hỡnh trong một giõy, quột cỏch dũng Khung gồm hai trường chẵn lẽ, mỗi trường bao gồm 312.5 dũng

1.1.1.1.2.Video số

Một số tiờu chuẩn của Video số lấy theo tiờu chuẩn CCI

CCIR 601525/60 NTSC

CCIR 601625/50 PAL/SECAM

Cỏch quột Cỏch dũng Cỏch dũng Liờn tục Liờn tục

Bảng 1 1: Cỏc tiờu chuẩn của Video số

Trang 11

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

1.1.1.2.Một số định chuẩn video

Sự chuẩn hóa của video tương tự trong những năm đầu của thập niên 1950 (NTSC) và những năm cuối của 1960 (SECAM và PAL) làm cho ảnh chuyển động xuất hiện hầu như khắp nơi, với các thiết bị vô tuyến được dùng rộng rãi cho mục đích giải trí, các hệ thống ứng dụng công nghệ như phát hiện chuyển động tiếp tục được phát triển

Vào năm 1990, các tổ chức về chuẩn hóa như tổ chức ISO-IEC (International Organization for Standard – International Electrotechnical Commission) đã đưa

ra chuẩn MJPEG cho video kĩ thuật số, tổ chức chuẩn ITU-T đã đưa ra chuẩn H.261 và một số các chuẩn liên quan khác Đi kèm với nó là các thiết bị tin học

giá rẻ đã tạo nên sự phát triển bùng nổ cho các ứng dụng đa phương tiện

Trong quá trình soạn thảo, xử lý và kết xuất video cần hiểu rõ về các định chuẩn video Ví dụ: để tạo ra một video sử dụng trên Intermet chúng ta cần phải thiết lập các tham số nén đảm bảo tệp video theo đúng định dạng và mục đích sử dụng Ngoài các yếu tố kỹ thuật, việc xác định định dạng của video còn phụ thuộc vào các yếu tố kinh nghiệm của người xử lý MPEG, AVI cho Windows, MOV cho QuickTime là các định dạng được sử dụng rộng rãi Trong phần này chúng ta làm rõ các định chuẩn với mục đích sử dụng, các kỹ thuật nén, kích cỡ, thời gian xử lý nén và giải nén

1.1.1.2.1.Định dạng AVI

Đây là định dạng phổ biến được thiết kế để dùng trong môi trường Windows Định dạng này rất linh hoạt, có thể sử dụng rất nhiều thuật toán nén video được phát triển từ trước đến nay để tạo ra các sản phẩm video theo mục đích sử dụng a) Mã nén âm thanh cho chuẩn AVI

+ Intel Indeo 5.10 (Intel indeo 5.03): được sử dụng cho các định dạng Video

phân tán trên mạng Internet, cho các máy tính có bộ xử lý MMX hoặc

bộ xử lý từ Pentium II trở lên Mã nén có đặc trưng: có lựa chọn nén nhanh, điều khiển các khung hình chính mềm dẻo, điều chỉnh độ sắc,

Trang 12

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

các hiệu ứng hiển thị lại, và cuối cùng tạo ra các tệp video có dữ liệu giảm đáng kể

Kiểu nén này cho phép người xử lý video có thể điều chỉnh để tạo ra các video dùng cho các băng thông khác nhau

Ví dụ: có thể điều chỉnh để tạo ra video dùng cho modem 56Kb, 28,8Kb hay đường cáp mạng Mã nén này được thiết kế để làm việc cùng với mã nén âm thanh Intel Audio

+ Intel Indeo Video Raw R1.1: được sử dụng tốt nhất cho việc thu các tín hiệu

video làm dữ liệu video nguồn sử dụng cho soạn thảo video, với thiết bị thu Intel Video Mã nén này cung cấp các hình ảnh chất lượng cao Các tệp video dùng lựa chọn Intel Indeo Video Raw R1.1, có kích cỡ nhỏ hơn các tệp video chưa được nén Ở định dạng này màu sắc của hình ảnh video đã được chuyển từ không gian mầu RGB thành không gian mầu YUV

+ Intel Indeo Video Interactive: là kiểu nén tương tự như định dạng 5.10

nhưng có một số hỗ trợ mở rộng như đặc tính trong suốt, nhiều đối tượng chuyển động và các hiệu ứng hiển thị lại trong video

+ Microsoft RLE: dùng để nén các khuôn hình mà nội dung là các vùng mầu

đồng nhất có kích cỡ lớn và số lượng mầu không nhiều, màu phẳng (các ảnh không có chiều sâu) Ví dụ: khi xử lý các video phim hoạt hình, sử dụng kiểu nén này tỏ ra khá hữu hiệu Kiểu nén này có mã nén

độ dài 8 bit dùng thuật toán nén RLE và chất lượng video cao

+ Microsoft Video 1: sử dụng kỹ thuật nén mất thông tin theo phương pháp

nén không gian màu Mã nén này có nhiều tham số có thể thay đổi như:

số mầu trên khuôn hình của video (8 bit hay 24 bit mầu), chất lượng video, số khung hình chính Chuẩn nén này có thể tạo ra các tệp video

sử dụng cho các chương trình đào tạo từ xa hay các tệp video sử dụng cho mạng tốc độ thấp

Trang 13

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

+ Indeo (R) Video R3:2: sử dụng để nén video 24 bit dùng cho đĩa CD Tỷ lệ

nén tốt, chất lượng hình ảnh cao và tốc độ hiển thị nhanh hơn so với kiểu nén Microsoft Video 1 Cho kết quả tốt nhất nếu sử dụng mã nén Indeo Video trên dữ liệu video nguồn mà trước đó dữ liệu này không bị nén với tỷ lệ cao bằng các kỹ thuật nén mất thông tin Các tệp video được nén bằng kỹ thuật nén Indeo (R) video R3:2 có chất lượng tương đương với các tệp video sử dụng kỹ thuật nén Cinepak

+ Cinepak Code By Radius: sử dụng để nén video 24 bit dùng cho CD-ROM

hoặc cho mục đích tải về từ Web Đây là kiểu nén đạt được tỷ lệ nén cao hơn và tốc độ giải nén nhanh hơn so với mã nén Microsoft Video 1 Chúng ta có thể đặt tham số chất lượng hình ảnh Các tệp video sau khi

xử lý có thể hiển thị lại trên đường truyền có tốc độ 30 Kb/giây Kỹ thuật mã bằng Cinepak tạo ra sản phẩm video có tốc độ giải nén rất nhanh nhưng khi nén mất rất nhiều thời gian Kỹ thuật nén này phù hợp cho việc chuyển một đoạn video thành kết quả cuối cho người sử dụng b) Mã nén âm thanh cho Windows

+ Intel Audio Software codec: sử dụng cho nhạc và lời nói trên Internet Tỷ lệ

nén tối đa là 8:1 Mã nén này được thiết kế để làm việc với chương trình Intel Video Software

+ TrueSpeech: sử dụng cho nói chuyện trên mạng Internet với tốc độ thấp + Microsoft GSM 6.10: sử dụng cho điện thoại trên Internet ở châu Âu

+ MS-ADPCM: sử dụng để tạo các tệp âm thanh có chất lượng cao ghi trên

đĩa CD-ROM Kiểu nén này được sử dụng rộng rãi

+ Microsoft IMA ADPCM: sử dụng tạo các tệp âm thanh cho các sản phẩm đa

phương tiện Mã nén này được dựa trên mã nén ADPCM được phát triển bởi IMA

+ Lucent Technologies SX8300P: sử dụng cho giao tiếp trên Internet với tốc

độ thấp

Trang 14

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

+ Elemedia TM AX2400P: sử dụng tạo ra các tệp âm nhạc có chất lượng cao

trên Internet

+ Voxware Audio Codecs: sử dụng cho các tệp âm thanh dạng tiếng nói trên

Internet tốc độ thấp

1.1.1.2.2.Định dạng MOV

Các phần mềm soạn thảo video thường cung cấp các mã nén theo chuẩn

QuickTime sử dụng trên môi trường hệ điều hành Windows và Mac Error! Reference source not found Định dạng QuickTime được xây dựng từ nhiều

thuật toán nén ảnh và âm thanh trong môi trường Mac QuickTime cũng là định dạng được rất nhiều phần mềm ứng dụng hỗ trợ Không những thế, nó còn được cài đặt trong nhiều chíp xử lý của hệ thống máy Mac

a) Mã nén video cho chuẩn QuickTime

+ Cinepak: được sử dụng để nén video 24 bit Các tệp sử dụng mã nén này để

dùng cho CD-ROM và Web video Mã nén có tỷ lệ nén cao và tốc độ giải nén nhanh Cinepak dùng thuật toán nén không đối xứng các tệp video có kích cỡ nhỏ nhưng thời gian nén rất lâu Cho kết quả tốt nhất nếu dùng Cinepak để tạo tệp video

+ Sorenson Video: được sử dụng để nén video 24 bit Các tệp sử dụng mã nén

này để dùng cho CD-ROM và Web video Nó cũng giống như mã nén Cinepak nhưng là mã nén mới thiết kế để nén với chất lượng cao Mã nén này cho hình ảnh tốt hơn, kích cỡ tệp video nhỏ hơn so với mã Cinepak vì vậy nó phù hợp cho việc tạo các tệp video cuối cùng chứ không phù hợp cho soạn thảo

+ Planar RGB: sử dụng hiệu quả cho các khuôn hình có vùng màu đặc như các

tệp hình động (hoạt hoạ) Nó sử dụng thuật toán nén RLE kết hợp với

kỹ thuật tạo mã hình động

+ Motion JPEGA and Motion JPEG: được dùng cho mục đích chuyển mã

video giữa các thiết bị Ví dụ: chuyển các tệp video trong hệ thống máy

Trang 15

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

tính, các đoạn video trên băng ra các thiết bị khác của mày tính như đĩa CD thông qua thiết bị thu video Mã nén Motion JPEGA and Motion JPEG được hỗ trợ nhiều trong các chíp có trên các thiết bị thu video do

đó tốc độ xử lý rất nhanh

+ Photo - JPEG: dùng để nén một chuỗi các ảnh tĩnh có màu sắc biến đổi dần

(các đường biên không rõ nét) Đây là kiểu nén mất thông tin nhưng có thể đặt được tham số nén để ảnh có chất lượng rất cao Mã nén Photo-JPEG là kiểu nén đối xứng - thời gian nén gần bằng thời gian giải nén, nhưng thời gian nén là khá nhiều so với thời gian thực của video Các ảnh đã được nén theo kiểu này thì không nên dùng làm nguồn để soạn thảo vì nó đã bị mất thông tin Tuy nhiên với tỷ lệ nén không cao nhưng cho chất lượng ảnh tốt nên có thể dùng để lưu trữ hoặc để di chuyển giữa các hệ thống máy tính Rất nhiều phần mềm cho phép nén dữ liệu video đã được cứng hoá sử dụng định dạng JPEG

+ H.261, H.263: sử dụng tạo các video cho hội thảo, có tỷ lệ nén cao Không

nên sử dụng chuẩn này cho soạn thảo video thông thường

+ Component video: được sử dụng để thu các video chất lượng cao để tạo và

lưu trữ video nguồn hay tạo các đoạn video trung gian cho xử lý Mã nén này có tỷ lệ nén rất thấp do đó các tệp video chiếm rất nhiều không gian đĩa

+ Graphics: được sử dụng cho việc nén và tạo video với chất lượng cao, có độ

sâu màu 8 bit Mục tiêu của mã nén là để nén các ảnh động (một chuỗi các ảnh) nhưng đôi khi cũng có thể sử dụng cho nén video Mã nén này không đạt được tỷ lệ nén cao Nó chỉ thích hợp cho các tệp video lưu trữ và được xem lại trên đĩa cứng, không phù hợp với các tệp video trên CD-ROM

+ Video: được sử dụng cho việc thu và nén các tín hiệu video có nguồn ở dạng

tín hiệu tương tự Mã nén này tạo ra các tệp video có chất lượng cao và

Trang 16

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

sử dụng tốt cho lưu trữ trên ổ đĩa cứng hoặc trên đĩa CD-ROM Nó hỗ trợ cả hai loại nén theo không gian và thời gian cho video 16 bit mầu + Animation: được sử dụng cho việc nén các khuôn hình có vùng màu có kích

cỡ lớn, như các khuôn hình cho phim hoạt hình Mã nén này có các tham số cho phép thay đổi tỷ lệ nén Với tỷ lệ nén là 100%, video không bị nén Nếu tỷ lệ dưới 100% tệp video bị nén ở dạng mất thông tin Mã nén hình động dựa trên lý thuyết nén của hãng Apple và thuật toán nén RLE

+ DV–PAL và DV–NTSC: dùng để tạo các tệp video với định dạng PAL,

NTSC phục vụ in ra băng theo các hệ trên hoặc ngược lại lấy từ băng vào máy tính thông qua card thu video số Chuẩn nén này rất hữu dụng cho việc chuyển dữ liệu video từ hệ thống máy tính này sang hệ thống máy tính khác hoặc từ thiết bị này sang thiết bị khác

Đối với các thiết bị phần cứng hỗ trợ soạn thảo Video thường có các mã nén riêng được viết bởi nhà sản xuất thiết bị phần cứng

b) Mã nén âm thanh cho chuẩn QuickTime

Đối với hệ thống Mac người ta thường sử dụng các mã nén âm thanh sau:

+ mLaw 2:1: sử dụng cho việc chuyển các tệp âm thanh với các ứng dụng trên

các máy trạm Tại đó mLaw là định dạng âm thanh chuẩn, mLaw được

sử dụng cho điện thoại số ở Bắc Mỹ và Nhật Bản

+ 16-bit Big Endian và 16-bit Little Endian: sử dụng cho các phần cứng và

phần mềm chuyên dụng để nén âm thanh Âm thanh đã được nén bằng

mã nén này thường không tốt cho soạn thảo

+ 24–bit Integer và 32–bit Integer: sử dụng cho âm thanh 24 bit hoặc 32 bit

Mã nén này được sử dụng tốt cho các phần cứng và phần mềm chuyên dụng Nó là sản phẩm cuối do đó các tệp video chứa mã nén này không nên dùng để soạn thảo

Trang 17

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

+ IMA 4:1: sử dụng cho các tệp âm thanh tại các trạm IMA 4:1 được phát

triển bởi IMA sử dụng mã ADPCM

+ 32–bit Floating và 64–bit Floating: sử dụng trong các thiết bị phần cứng và

phần mềm chuyên dụng nhưng thường không sử dụng cho Video

+ ALaw 2:1: giống mLaw nhưng được sử dụng cho điện thoại số ở châu Âu + QDesign Music Codec: sử dụng để nén các tệp âm thanh chất lượng cao

dùng trên Internet Chất lượng của nó tương đương các tệp âm thanh trên CD-ROM có định dạng 16 bit, 44.1 kHz Các tệp âm thanh được nén theo mã này có thể nghe trực tiếp bằng đường Internet có tốc độ 28.8 Kb/giây

+ Qualcomm PureVoice: được thiết kế để tạo các tệp âm thanh tốt nhất ở tần

số 8 kHz Cơ sở của mã nén này dựa trên thuật toán nén chuẩn của Telephone CDMA

+ MACE 3:1 and MACE 6:1: để tạo các tệp âm thanh thông thường cho hệ

điều hành Mac Nó dựa trên thuật toán nén âm thanh MACE Mã nén MACE 3:1 có tỷ lệ nén thấp hơn mã nén MACE 6:1 nhưng có chất lượng cao hơn

1.1.1.2.3.Các định chuẩn MPEG

Chuẩn nén video MPEG được phát triển bởi MPEG, hiện đang được sử dụng rộng rãi trong các sản phẩm video MPEG đứng đầu trong việc ứng dụng trong truyền hình số, mã và giải mã HDTV, CD, DVD, video hội nghị, video cho Internet và các ứng dụng khác MPEG được sử dụng rộng rãi như vậy chính là nhờ khả năng nén hiệu quả, làm giảm đáng kể kích cỡ tệp video Thông qua xử lý nén bằng MPEG, các video có thể truyền hiệu quả trên mạng Cơ sở của chuẩn nén MPEG là sử dụng thuật toán biến đổi cosin rời rạc DCT với việc phân chia khuôn hình ảnh thành các khối và đánh giá chuyển động Các đặc điểm chi tiết về kỹ thuật của chuẩn MPEG được tổ

Trang 18

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

chức ISO và IEC công nhận Có ba định dạng Video theo chuẩn MPEG là MPEG 1, MPEG 2, MPEG 4 chính thức trở thành định dạng chuẩn quốc tế a) Chuẩn Video MPEG-1

MPEG 1 đã được hoàn thiện vào năm 1991, với nhiều ưu điểm như: tối ưu hoá khi làm việc với độ phân giải 352x240 điểm ảnh, 30 hình/giây cho hệ NTSC và

độ phân giải 352x288 điểm ảnh, 25 hình/giây Chuẩn này cố định độ phân giải nên thường gây ra một số lỗi nếu độ phân giải đặt không đúng Tuy nhiên, trường hợp đặc biệt MPEG 1 có chế độ làm việc với độ phân giải rất cao 4095x4095, phát 60 hình/giây MPEG 1 thông thường làm việc tối ưu với tốc

độ 1,5 Mb/giây cho các ứng dụng MPEG 1 sử dụng cho các ứng dụng có chế

độ quét hình tuần tự Nó không trực tiếp làm việc với các ứng dụng video sử dụng chế độ quét xen dòng như ứng dụng truyền hình MPEG 1 có chất lượng tương đương với chất lượng truyền hình Video MPEG-1 sử dụng làm định dạng chuẩn cho các sản phẩm video CD MP3 là chuẩn nén âm thanh được sử dụng trong MPEG-1

Mã nén cho cho các tín hiệu âm thanh theo chuẩn 3 lớp:

Lớp 1 MP1 (MPEG 1 Audio Layer 1)

Lớp 2 MP2 (MPEG 1 Audio Layer 2)

Lớp 3 MP3 (MPEG 1 Audio Layer 3)

MPEG 1 được thiết kế theo chuẩn ISO/IEC 11172, phân định địa chỉ của các kênh dữ liệu âm thanh và hình ảnh, kết hợp với thời gian Đây là chức năng quan trọng vì từ dạng dữ liệu này sẽ được chuyển đổi thành các kênh dữ liệu phù hợp

Trang 19

Số húa bởi Trung tõm Học liệu http://www.lrc-tnu.edu.vn/

Bộ điều khiển

Video đã giải mã

Bộ giải mã

đặc tr-ng media L-u trữ

Media số

Âm thanh

Video Luồng

Hỡnh 1.3 Sơ đồ giải nộn MPEG–1 (ISO/IEC 11172)

Theo sơ đồ này chỳng ta thấy rằng, thụng qua cỏc địa chỉ được lưu trữ trong chuẩn MPEG1, khi giải nộn sẽ xỏc định chớnh xỏc cỏc kờnh õm thanh và video Thuật toỏn nộn cho chuẩn MPEG1 cú khả năng nộn cao Đầu tiờn chuyển video

từ khụng gian mầu RGB về khụng gian mầu YUV, sử dụng thuật toỏn nộn khụng gian mầu để giảm dữ liệu video Sau đú dựng thuật nộn theo thời gian chuyển động bằng cỏch phõn chia video thành cỏc dóy, lựa chọn cỏc khung hỡnh Phõn chia khuụn hỡnh thành cỏc macro block và block Dựng giải thuật DCT nộn khụng gian ảnh Nộn khụng gian dữ liệu một lần nữa bằng giải thuật nộn khụng mất thụng tin

Hỡnh 1.4 Sơ đồ nộn dữ liệu õm thanh

Đầu vào là cỏc tớn hiệu õm thanh, dựa theo bản đồ, lọc và lấy ra cỏc mẫu đặc trưng Mụ hỡnh tõm lý - õm học là quỏ trỡnh tập hợp dữ liệu và điều khiển việc

Trang 20

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

lượng tử hoá và mã hoá để tạo ra khối các khuôn hình Khối các khuôn hình là các gói chuẩn (cơ sở) được mã hoá

Ứng dụng của MPEG 1:

Phân phối video: Một ứng dụng rộng khắp của MPEG 1 hiện nay đó

là việc phân phối video thường là phim Các video theo chuẩn MPEG 1 có chất lượng tốt, kích cỡ nhỏ Phim được chuyển thành dạng MPEG 1, ghi trên đĩa CD-ROM và đang được các hãng phân phối trên toàn thế giới

Video công cộng: các trạm video công cộng hướng dẫn người sử dụng các thông tin cần thiết của một hệ thống nào đó Nó thường được đặt tại các nhà ga, ngân hàng, siêu thị Các video này được đặt trên đĩa cứng hoặc CD-ROM với định chuẩn MPEG 1 MPEG 1 đảm bảo chất lượng, kích cỡ nhỏ do đó có thể dễ dàng sử dụng trong các ứng dụng này

Dịch vụ video thông qua đường truyền điện thoại: Hệ thống này đang được thử nghiệm ở nhiều nước tiên tiến như Nhật Bản, Mỹ Thông qua đường truyền điện thoại, máy điện thoại để bàn có màn hình hoặc hệ thống điện thoại di động, người sử dụng có thể đặt các chương trình video xem trực tiếp trên máy điện thoại hay có thể đàm thoại và thấy được hình ảnh của nhau Dịch vụ này bị giới hạn về băng thông do đó người ta sử dụng định chuẩn video MPEG 1

Thư viện video: Các thư viện dữ liệu video hiện nay đang được thay thế dần các băng video bằng dữ liệu video số theo chuẩn MPEG 1 Ưu điểm của các đĩa CD theo chuẩn MPEG 1 là dễ hiển thị, dễ truy cập, không gian lưu trữ nhỏ, chất lượng hình ảnh tốt Hiện nay rất nhiều thư viện của các trường đại học, viện nghiên cứu, trung tâm đang chuyển dần sang sử dụng dữ liệu video số

Trang 21

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

Sau đây là một số ràng buộc đối với MPEG-1:

Kích thước bộ đệm giải nén tối đa 376.832 bits

Bảng 1 2: Một số ràng buộc của MPEG-1

b) Chuẩn Video MPEG-2

MPEG 2 đã hoàn thành vào tháng 11/1994 MPEG 2 ban đầu được phát triển trên cơ sở các kỹ thuật nén tốt nhất của MPEG 1 nhưng phần mã hoá được mở rộng hơn Các mã này được áp dụng cho các ảnh có không gian mầu YUV với thành phần Y:U:V là 4:2:2 Tuy nhiên MPEG 2 vẫn không được triển khai trong các ứng dụng video Đến tháng 4/1997, MPEG-2 đưa thêm các mã phân định nhiều kênh âm thanh Một số thuật toán nén âm thanh được

áp dụng trong phần này không còn bị lệ thuộc vào các thuật toán được áp dụng trong MPEG 1 Chuẩn này đã được tổ chức ISO công nhận và được sử dụng làm chuẩn video cho truyền hình số Mã nén MPEG 2 có thể đáp ứng

kỹ thuật quét xen dòng của video Mục tiêu của định chuẩn này là nâng chất lượng của video lên cao hơn chuẩn MPEG 1 do đó yêu cầu về đường truyền cũng cao hơn, từ 5-20 Mb/giây MPEG 2 bao gồm Profiles và Levels Profiles định rõ dòng bit và độ phân giải của không gian mầu, Levels xác định độ phân giải ảnh và tốc độ bit lớn nhất của mỗi Profiles Các Profiles và Levels được sử dụng phổ biến hiện này gọi là Main Profiles, Main Levels ký hiệu (MP@ML) Chúng có độ phân giải video 720x480 với tốc độ 30 hình/giây, tốc độ bít là 15 Mb/giây cho video hệ NTSC HDTV sử dụng độ

Trang 22

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

phân giải 1920x1080, 30 hình/giây, tốc độ bít là 80 Mb/giây gọi là Main Profiles, High Levels (MP@HL) MPEG 2

Bé m· ho¸

Video D÷ liÖu

Video

Bé m· ho¸

©m thanh D÷ liÖu

Bé trén luång vËn chuyÓn

luång ch-¬ng tr×nh

luång vËn chuyÓn

Hình 1.5 Mô hình hệ thống giải mã MPEG 2

Theo mô hình, này MPEG 2 đánh địa chỉ phối hợp một hoặc nhiều luồng

dữ liệu của video và âm thanh thành một luồng đơn thống nhất Các dữ liệu trên luồng dữ liệu này được tổ chức phù hợp nhất cho việc lưu trữ và phát video Việc tổ chức này dựa vào hai lớp chính: luồng chương trình và luồng vận chuyển

Luồng chương trình là việc phối hợp một hoặc nhiều gói tin cơ bản PES

có nhịp độ cơ sở thông thường (hai hoặc bốn nhịp một) trong các luồng dữ

liệu đơn thành một luồng dữ liệu thống nhất Các gói tin luồng chương trình

có độ lớn khác nhau và như vậy thời gian truyền gói tin là khác nhau Trong quá trình truyền các gói tin, nến phát hiện có một gói tin bị mất thì hệ thống

sẽ yêu cầu truyền lại toàn bộ các gói tin (vì luồng chương trình không xác định gói tin nào phải được truyền lại) Luồng chương trình được thiết kế cho

việc sử dụng trong hệ thống đường truyền rất ít lỗi Nó phù hợp với các ứng dụng có dùng phần mềm để xử lý

Luồng vận chuyển là việc phối hợp một hoặc nhiều gói tin cơ bản PES cùng với một hoặc nhiều nhịp độ cơ sở độc lập thành một luồng dữ liệu đơn thống nhất Các gói tin luồng vận chuyển có độ lớn bằng nhau là 188byte và như vậy thời gian truyền gói tin là như nhau Trong quá trình truyền các gói

Trang 23

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

tin, nếu phát hiện có một gói tin bị mất thì hệ thống không yêu cầu truyền lại

toàn bộ các gói tin mà chỉ yêu cầu truyền lại gói tin bị mất (vì luồng vận chuyển đánh chỉ số cho các gói tin) Luồng vận chuyển được thiết kế cho việc

sử dụng trong hệ thống đường truyền có nhiều lỗi

Ứng dụng của MPEG 2:

Video theo yêu cầu: VOD là một ứng dụng cơ bản về video Tuy nhiên, hầu hết các ứng dụng của VOD là phim Ban đầu trong các khách sạn, bệnh viện và cuối cùng là ở trong gia đình Tất cả chúng đều được tương tác qua ti vi Dịch vụ này cho phép người sử dụng đặt các chương trình phim theo ý thích, và có thể xem bất kể thời gian nào Các ứng dụng VOD sử dụng định chuẩn video MPEG 2

Truyền hình cáp CATV: sử dụng chuẩn video MPEG 2 để nén, giải

nén và phân phối video Đây là chuẩn video có chất lượng rất cao, yêu

cầu băng thông rộng

Hệ thống phát hình trực tiếp qua vệ tinh DBS: sử dụng chuẩn

MPEG 2 cho việc phát hình trực tiếp Lợi thế của hệ thống này là bất

kể tại đâu và bất kể thời gian nào chúng ta cũng có thể bắt đuợc tín hiệu truyền hình

Truyền hình chất lượng cao HDTV: Mỹ và một số nước khác sử dụng

MPEG 2 làm chuẩn video cho truyền hình chất lượng cao

Một số ứng dụng khác: MPEG 2 sử dụng trong các phầm mềm của

các thiết bị video như: băng Video chất lượng cao, đĩa video số chất lượng cao DVD, video hội nghị và trong các máy quay video số

c) Chuẩn Video MPEG-4

MPEG 4 là chuẩn ISO/IEC được phát triển bởi MPEG Nhóm này cũng

đã phát triển chuẩn MPEG 1 và MPEG 2 Các chuẩn này cho phép phát hành video trên CD-ROM và truyền hình số MPEG 4 là kết quả tổng hợp của hàng

Trang 24

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

trăm nhà nghiên cứu và kỹ sư trên toàn thế giới MPEG 4 được hoàn thành vào tháng 10/1998 và trở thành chuẩn quốc tế từ tháng 1/1999 Cuối năm

1999, phiên bản 2 của MPEG 4 ra đời Định dạng này mềm dẻo, yêu cầu tốc

độ đường truyền thấp và không có độ phân giải video chuẩn

Nén hình ảnh trong MPEG 4 sử dụng kỹ thuật nén đối tượng cơ bản với việc phân lớp và lưu các thông tin đối tượng Mỗi lớp lưu mã nén về nội dung

của một chuỗi các ảnh (bao gồm: đường viền, quỹ đạo chuyển động, kết cấu bề mặt) Khi giải nén, thông qua nội dung được lưu trong các lớp để xây dựng lại

từng phần của đoạn video

Hình 1.6 Mô hình nén và giải nén theo từng lớp của MPEG 4

Theo mô hình nén và giải nén theo từng lớp của MPEG 4, video được nén trên 3 lớp với tỷ lệ giảm kích cỡ (không gian) là 2 lần trên từng lớp Trên các lớp ngoài, những thông tin về nội dung của một chuỗi hình ảnh còn lưu tỷ

lệ giảm không gian của lớp so với lớp trên đó Khi giải nén dựa vào tỷ lệ này cùng với các thông tin về đường viền, quỹ đạo chuyển động, kết cấu bề mặt của đối tượng trong video để phục hồi lại đoạn video gốc

Như vậy, dựa vào tỷ lệ giảm kích cỡ không gian video, chúng ta có thể điều chỉnh tốc độ phát hình cũng như kích cỡ của tệp video cho phù hợp với băng thông

Trang 25

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

Ứng dụng của MPEG 4: do có tính mềm dẻo MPEG 4 đã được triển

khai trong ba lĩnh vực chính:

Truyền hình số

Các ứng dụng đồ hoạ tương tác

Ứng dụng đa phương tiện tương tác

Chuẩn kỹ thuật của MPEG 4 được thống nhất cho sản xuất, phân phối các sản phẩm video cho cả ba lĩnh vực trên

d) Chuẩn Video MPEG-7

Được thừa nhận thành tiêu chuẩn quốc tế tháng 7/2001.MPEG-7 đề xuất cho việc tìm kiếm, chọn lựa, quản lý và phân tích thông tin đa phương tiện, không tập trung vào một ứng dụng cụ thể, không phải là một tiêu chuẩn mã hóa thực sự cho Audio, Video hay multimedia.MPEG-7 cũng là một dạng phát triển lên từ phiên bản của MPEG-1 và nó đang được phát triển

MPEG-7 cung cấp một tập hợp đầy đủ các công cụ chuẩn hóa để mô tả nội dung của đa phương tiện Cả người dùng và hệ thống tự động xử lý hệ âm thanh thực đều thuộc phạm vi của MPEG-7

Trang 26

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

hơn ¼ là QCIF (Quadrature) Với tốc độ 30 khung hình/s thì tốc độ dữ liệu của CIF là 37.3 Mbps, QCIF là 9.35 Mbps Tốc độ càng thấp thì càng giảm số khung hình/s

Tín hiệu video được phân thành các lớp, mỗi lớp đều có các header để định nghĩa các tham số được sử dụng bởi bộ mã hóa khi tạo dòng bit Lớp ảnh được phân thành các nhóm khối GOB (Group of Block), các GOB bao gồm các MB (MacroBlock) MB là đơn vị nhỏ nhất bao gồm 4 khối 8x8 của tín hiệu Y và hai khối 8x8 của tín hiệu sắc

Lớp GOB luôn được kết hợp của 33 MB hợp thành ma trận 3x11 Mỗi MB

có một header chứa địa chỉ MB và kiểu nén, tiếp theo là dữ liệu của khối

Bảng 1 3: Mô tả kiểu CIF và QCIF

Cuối cùng, lớp ảnh bao gồm header ảnh theo sau bởi dữ liệu cho các GOB Mỗi header chữa dữ liệu là dạng ảnh và dạng số khung Cấu trúc của một MB như sau:

Data MBA: Địa chỉ, MTYPE: Dạng Intra, Inter

MQUANT: Hệ số lượng tử, MVD: Vector chuyển động

CBP: Mẫu khối đã mã hóa, Block Data: Dữ liệu

IntraFrame: Trong khung, Khung I cho khả năng truy cập ngẫu nhiên, kiểu nén intra tương tự như JPEG dựa trên mã hóa DCT từng MB

InterFrame: Liên khung, liên hệ với các khung I và P trước, MB đầu có thể bù chuyển động (MC – Motion Compensation) hoặc không bù chuyển động Cung cấp các tùy chọn cho từng MB như lượng tử với các hệ số lượng tử và sử dụng

bộ lọc bù chuyển động

Trang 27

Số húa bởi Trung tõm Học liệu http://www.lrc-tnu.edu.vn/

c) Chuẩn Video H.263

H.263 là chuẩn cải tiến của H.261 cho Video tốc độ thấp, cú thể truyền trờn mạng điện thoại cụng cộng PSTN, được cụng nhận năm 1996 Giống như H.261, mó húa DCT cho cỏc MB trong I Frame và DCT sai biệt dự đoỏn trong P Frame, tốc độ tối thiểu H.263 là một yờu cầu bắt buộc của video codec trong cụng nghệ ETSI 3GPP cho hệ thống đa phương tiện nhỏ sử dụng giao thức IP (IMS), cỏc dịch vụ gửi nhận thụng điệp đa phương tiện (MMS),…

Ưu điểm:

Chớnh xỏc sai biệt dự đoỏn với ẵ điểm ảnh

Khụng hạn chế vector chuyển động

Mó húa số học theo cỳ phỏp

Dự đoỏn thuận lợi với cỏc khung P,…

d) Chuẩn Video H.264:

H.264 là một chuẩn để nộn video, được hoàn thành vào thỏng 5 năm 2003 Nú

tương tự như chuẩn ISO/IEC 14496 dành cho video

1.1.2 Các thao tác cơ bản trong video

1.1.2.1.Các hiệu ứng biên tập video

Số các hiệu ứng video có thể là rất lớn Các ch-ơng trình biên tập video nổi tiếng nh- Adobe Premiere hay Ulead MediaStudio có tới hàng trăm loại biên tập đ-ợc tham số hoá Nh-ng trên thực tế, hơn 99% các biên tập đó đều nằm trong ba loại: cắt cứng, fade và chồng mờ, ngoài ra còn có wipe

+ Cắt cứng: là sự biến đổi đột ngột từ cảnh này sang cảnh khác, nó xảy ra giữa hai khung hình

+ Fade: là sự biến đổi dần dần giữa một cảnh và một ảnh (fade out) hoặc

là sự biến đổi dần giữa một ảnh và một cảnh phim (fade in)

+ Chồng mờ: là sự biến đổi dần dần từ cảnh cũ sang cảnh mới trong đó cảnh cũ đ-ợc fade out và cảnh mới đ-ợc fade in

Trang 28

Số húa bởi Trung tõm Học liệu http://www.lrc-tnu.edu.vn/

+ Wipe: là hiện t-ợng cảnh chạy theo một đ-ờng trên màn hình, trong khi

đó cảnh mới lại xuất hiện phía sau đ-ờng đó

Hình 1.7: Một số wipe cơ bản

Các hiệu ứng đó tạo nên sự biến đổi cho các khung hình, tạo nên các chuyển cảnh Cắt cứng tạo nên chuyển cảnh đột ngột, fade, chồng mờ và wipe tạo nên chuyển cảnh dần dần

1.1.2.2.Một số thuộc tính đặc tr-ng của video

Màu là một thuộc tính quan trọng của ảnh Biểu đồ màu biểu diễn sự phân

bố màu, là một đặc tr-ng phổ biến nhất hiện nay Biểu đồ màu không phụ thuộc vào sự quay, dịch chuyển ảnh cũng nh- chiều nhìn ảnh Tính hiệu quả của nó lại phụ thuộc vào hệ màu và ph-ơng pháp định l-ợng đ-ợc dùng Có một vấn đề với biểu đồ màu là nó không biểu diễn thông tin về không gian phân bố các điểm

ảnh, do đó hai ảnh có cùng biểu đồ màu có thể có nội dung rất khác nhau Hình d-ới đây minh hoạ điều này

Hình 1.8: Các ảnh rất khác nhau nh-ng có cùng biểu đồ màu

Trang 29

Số húa bởi Trung tõm Học liệu http://www.lrc-tnu.edu.vn/

Hình 1.9: Biểu đồ thể hiện 4 loại ảnh cơ bản

1.1.2.4 Kết cấu (Texture)

Đây là một đặc tr-ng quan trọng của bề mặt, nơi xảy ra việc lặp lại mẫu cơ bản Có hai dạng biểu diễn texture phổ biến: biểu diễn dạng ma trận đồng thời và biểu diễn Tamura Ma trận đồng thời mô tả h-ớng và khoảng cách giữa các điểm ảnh, nhờ đó các thống kê có nghĩa có thể đ-ợc trích chọn Ng-ợc lại, ng-ời ta thấy rằng entrophi và mômen chênh lệch nghịch đảo lại có khả năng phân biệt tốt nhất Biểu diễn Tamura đ-ợc thúc đẩy nhờ các nghiên cứu về tâm

lý trong việc thu nhận trực giác của con ng-ời và nó bao gồm các đại l-ợng đo tính thô, độ t-ơng phản, h-ớng, tính trơn, tính cân đối và độ ráp Các đặc tr-ng Tamura rất hấp dẫn trong việc hiểu nội dung ảnh vì nó biểu đạt trực quan Ngoài

ra còn có một số các dạng biểu diễn khác nh- tr-ờng ngẫu nhiên Markov, biến

đổi Gabor, biến đổi gợn sóng

1.1.2.5 Hình dáng (Shape)

Các đặc tr-ng hình dáng có thể đ-ợc biểu diễn sử dụng phân tích hình dáng truyền thống nh- bất biến momen, mô tả Fourier, mô hình học tự động quay lui và các thuộc tính hình học Các đặc tr-ng này có thể đ-ợc phân chia

Trang 30

Số húa bởi Trung tõm Học liệu http://www.lrc-tnu.edu.vn/

thành đặc tr-ng toàn cục và đặc tr-ng cục bộ Đặc tr-ng toàn cục là đặc tr-ng thuộc tính thu đ-ợc từ toàn bộ hình dáng ảnh, chẳng hạn nh- chu vi, tính tròn, mô men trung tâm, h-ớng trục chính

Đặc tr-ng cục bộ là đặc tr-ng thu đ-ợc từ việc thao tác với một phần của

ảnh, không phụ thuộc vào toàn bộ ảnh

1.1.2.6 Chuyển động (Motion)

Motion là thuộc tính quan trọng của video Thông tin về chuyển động có thể đ-ợc sinh ra bằng các kỹ thuật ghép khối hoặc luồng ánh sáng Các đặc tr-ng chuyển động nh- mô men của tr-ờng chuyển động, biểu đồ chuyển động hoặc là các tham số chuyển động toàn cục có thể đ-ợc trích chọn từ vectơ chuyển động Các đặc tr-ng mức cao phản ánh di chuyển camera nh- quét

(pan), nghiêng (tilt), phóng to (zoom in), thu nhỏ (zoom out) cũng có thể đ-ợc

trích chọn

Hình 1.10: Các thao tác camera

1.2 Bài toán tái tạo video

Yêu cầu đặt ra là cần phải tái tạo lại đoạn video từ các khung hình đặc tr-ng này thông qua việc sinh ra các khung hình trung gian

Trang 31

Số húa bởi Trung tõm Học liệu http://www.lrc-tnu.edu.vn/

Trong việc tạo lập khung hình trung gian, một khung hình sẽ đ-ợc xác

A: tập các thuộc tính, th-ờng các thuộc tính về màu sắc và mức xám

Có nhiều kỹ thuật khác nhau để tạo lập các khung hình trung gian nh-: kỹ thuật cộng ảnh đơn giản, cộng ảnh nâng cao, kỹ thuật nắn chỉnh ảnh và kỹ thuật làm biến dạng ảnh với những thuật toán từ đơn giản đến phức tạp

1.2.1 Các cách tiếp cận và ứng dụng cơ bản

Mặc dù có nhiều thuật toán tạo lập khung hình trung gian khác nhau nh-ng tất cả các thuật toán tạo lập khung hình trung gian đều phải tuân thủ một

số nguyên tắc sau đây để đạt đ-ợc hình ảnh tái tạo tốt

1.2.1.1 Chuyển đổi thuộc tính

Một đối t-ợng hình học bao gồm hình dáng cùng với thuộc tính của nó Vì vậy khi tạo ra các khung hình trung gian, thì các thuộc tính từ khung hình này cần đ-ợc biến đổi sang các thuộc tính t-ơng đ-ơng của khung hình kia và ng-ợc lại

Trang 32

Số húa bởi Trung tõm Học liệu http://www.lrc-tnu.edu.vn/

1.2.1.2 Duy trì miền lồi

Nếu các miền biến đổi của các khung hình đầu vào là miền lồi (th-ờng

các miền biến đổi đ-ợc chia thành các miền lồi) thì các miền trung gian của các khung hình trung gian cũng cần là các miền lồi

1.2.1.3 Duy trì hình trạng hình học

Nếu các đối t-ợng có cùng hình trạng hình học thì hình trạng này cần

đ-ợc duy trì trong suốt quá trình biến đổi

1.2.1.4 ánh xạ đúng đặc tr-ng

Khi thực hiện ánh xạ các đặc tr-ng chúng ta phải ánh xạ làm sao cho từng

đặc tr-ng riêng biệt của đối t-ợng này phải đ-ợc tham chiếu đúng đến đặc tr-ng

1.2.2.5 Duy trì tính nhẵn của đối t-ợng

Khi thực hiện tạo ra các khung hình trung gian thì các đối t-ợng của nó cũng phải có tính nhẵn nh- các đối t-ợng gốc và đích

1.2.2.6 Đảm bảo nền của ảnh

Thông th-ờng khi nội suy đối t-ợng ảnh thì nền của chúng cũng bị nội suy theo Đối với hai khung hình có nền nh- nhau và nền tuân thủ theo quy luật

Ngày đăng: 22/11/2014, 23:34

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1. Đỗ Năng Toàn, Phạm Việt Bình (2007). Giáo trình xử lý ảnh, Nhà xuất bản Đại học Hà Nội Sách, tạp chí
Tiêu đề: Giáo trình xử lý ảnh
Tác giả: Đỗ Năng Toàn, Phạm Việt Bình
Nhà XB: Nhà xuất bản Đại học Hà Nội
Năm: 2007
2. Lương Xuân Cương, Đỗ Xuân Tiến, Đỗ Trung Tuấn (2004), “Kỹ thuật nâng cao khả năng phán đoán dữ liệu video ứng dụng trong e-learning”, Báo cáo khoa học tại Hội thảo quốc gia “ Một số vấn đề chọn lọc của Công nghệ thông tin”, Đà Nẵng, tháng 8/2004 Sách, tạp chí
Tiêu đề: Kỹ thuật nâng cao khả năng phán đoán dữ liệu video ứng dụng trong e-learning”, "Báo cáo khoa học tại Hội thảo quốc gia “ Một số vấn đề chọn lọc của Công nghệ thông tin
Tác giả: Lương Xuân Cương, Đỗ Xuân Tiến, Đỗ Trung Tuấn
Năm: 2004
3. Lương Mạnh Bá, Nguyễn Thanh Thủy. Nhập môn xử lý ảnh số, Nhà xuất bản Khoa học kỹ thuật, Hà Nội.Tiếng Anh Sách, tạp chí
Tiêu đề: Nhập môn xử lý ảnh số
Nhà XB: Nhà xuất bản Khoa học kỹ thuật
1. A. Amir, J. Argillander, M. Berg, S-F. Chang, et al.”IBM Research TRECVID- 2004 Video Retrieval System.” Proc. TRECVID 2004 Sách, tạp chí
Tiêu đề: IBM Research TRECVID-2004 Video Retrieval System
2. LarsLau Raket, Lars Roholm,Andrés Bruhn and Joachim Weickert ”Motion Compensated Frame Interpolation with a Symmetric Optical Flow Constraint”.Advances in Visual Computing, volume 7431 of Lecture Notes in Computer Science, Springer Berlin Heidellberg, (2012) Sách, tạp chí
Tiêu đề: Motion Compensated Frame Interpolation with a Symmetric Optical Flow Constraint
4. e Dane ” Temporal frame interpolation by motion analysis and processing” University of California, San Diego, 2005 Sách, tạp chí
Tiêu đề: Temporal frame interpolation by motion analysis and processing
5. Saranta Ponla “Frame rate up conversion by block base affin transform” Mahidol University, 2009 Sách, tạp chí
Tiêu đề: Frame rate up conversion by block base affin transform
6. Ya-Ting Yang, Yi-Shin Tung, Ja-Ling Wu, Chung-Yi Wen “Low-Bitrate Video Quality Enhancenment by Frame Rate Up-Conversion and Adaptive Fram Encoding”. Advances in Multimedia Information Processing –PCM 2005, pp.841-853 Sách, tạp chí
Tiêu đề: Low-Bitrate Video Quality Enhancenment by Frame Rate Up-Conversion and Adaptive Fram Encoding
7. Jianning Zhang, Lifeng Sun, Yuzhuo Zhong “A Novel Spatial-Temporal Position Prediction Motion-Compensated Interpolation for Frame Rate Up- Conversion” Advances in Multimedia Information Processing - PCM 2006, pp.870-879 Sách, tạp chí
Tiêu đề: “A Novel Spatial-Temporal Position Prediction Motion-Compensated Interpolation for Frame Rate Up-Conversion”
8. Gargi, U., Kasturi, R., & Strayer, S. H, 2000. Performance characterization of video-shot-change detection methods. IEEE Transactions on Circuits and Systems for Video Technology, 10(1), 1-13 Sách, tạp chí
Tiêu đề: IEEE Transactions on Circuits and Systems for Video Technology, 10(1)
9. Sarah Porter, Majid Mirmehdi, Barry Thomas, 2003. Temporal video segmentation and classication of edit effects. Image and Vision Computing 21 (2003) 1097–1106 Sách, tạp chí
Tiêu đề: Image and Vision Computing 21 (2003)
10. Sawhney, H.S., Hafner, J.L., Efficient color histogram indexing, Proceedings of the IEEE International Conference on Image Processing, Volume: 2 , 994,pp. 66 Sách, tạp chí
Tiêu đề: Efficient color histogram indexing, Proceedings of the IEEE International Conference on Image Processing
11. Efthymia Tsamoura, Vasileios M ezaris, Ioannis Kompatsiaris, 2008. Video Shot Meta-Segmentation Based On Multiple Criteria For Gradual Transition Detection. Content-Based Multimedia Indexing, 2008. CBMI 2008.International Workshop on 18-20 June 2008, pp51 – 57 Sách, tạp chí
Tiêu đề: Content-Based Multimedia Indexing, 2008. CBMI 2008. "International Workshop on 18-20 June 2008
12. Efthymia Tsamoura, Vasileios Mezaris, Ioannis Kompatsiaris, 2008. Gradual Transition Detection Using Color Coherence And Other Criteria In A Video Shot Meta-Segmentation Framework. Image Processing, 2008. ICIP 2008.15th IEEE International Conference on Oct. 2008, page(s): 45 – 48 Sách, tạp chí
Tiêu đề: Image Processing, 2008. ICIP 2008. "15th IEEE International Conference on Oct. 2008
13. Yong Rui, Thomas S. Huang, Sahrad Merohtra, Constructing Table-of-Content for Video, Beckman Institude for Advanced Science and Technology, University of Illinois at Urbana Champaign, 2003 Sách, tạp chí
Tiêu đề: Constructing Table-of-Content for Video
3. Xu, C., Corso, J.J.: Evaluation of super-voxel methods for early video processing. In: CVPR.(2012) Khác

HÌNH ẢNH LIÊN QUAN

Hình 1.1: Cấu trúc phân cấp video - tái tạo video dựa vào kỹ thuật nội suy bù chuyển động
Hình 1.1 Cấu trúc phân cấp video (Trang 9)
Bảng 1. 1:  Các tiêu chuẩn của Video số - tái tạo video dựa vào kỹ thuật nội suy bù chuyển động
Bảng 1. 1: Các tiêu chuẩn của Video số (Trang 10)
Hình 1.2: Minh hoạ về sự chuyển đổi giữa các lia - tái tạo video dựa vào kỹ thuật nội suy bù chuyển động
Hình 1.2 Minh hoạ về sự chuyển đổi giữa các lia (Trang 10)
Bảng 1. 2:  Một số ràng buộc của MPEG-1 - tái tạo video dựa vào kỹ thuật nội suy bù chuyển động
Bảng 1. 2: Một số ràng buộc của MPEG-1 (Trang 21)
Phân  giải  1920x1080,  30  hình/giây,  tốc  độ  bít  là  80  Mb/giây  gọi  là  Main  Profiles, High Levels (MP@HL) MPEG 2 - tái tạo video dựa vào kỹ thuật nội suy bù chuyển động
h ân giải 1920x1080, 30 hình/giây, tốc độ bít là 80 Mb/giây gọi là Main Profiles, High Levels (MP@HL) MPEG 2 (Trang 22)
Hình 1.6 Mô hình nén và giải nén theo từng lớp của MPEG 4 - tái tạo video dựa vào kỹ thuật nội suy bù chuyển động
Hình 1.6 Mô hình nén và giải nén theo từng lớp của MPEG 4 (Trang 24)
Hình 1.8: Các ảnh rất khác nhau nh-ng có cùng biểu đồ màu - tái tạo video dựa vào kỹ thuật nội suy bù chuyển động
Hình 1.8 Các ảnh rất khác nhau nh-ng có cùng biểu đồ màu (Trang 28)
Hình 1.7: Một số wipe cơ bản - tái tạo video dựa vào kỹ thuật nội suy bù chuyển động
Hình 1.7 Một số wipe cơ bản (Trang 28)
1.1.2.5. Hình dáng (Shape) - tái tạo video dựa vào kỹ thuật nội suy bù chuyển động
1.1.2.5. Hình dáng (Shape) (Trang 29)
Hình 1.10: Các thao tác camera - tái tạo video dựa vào kỹ thuật nội suy bù chuyển động
Hình 1.10 Các thao tác camera (Trang 30)
Hình 1.11: Mô hình chung của phép cộng ảnh - tái tạo video dựa vào kỹ thuật nội suy bù chuyển động
Hình 1.11 Mô hình chung của phép cộng ảnh (Trang 31)
Hình 1.12: ánh xạ các đặc tr-ng - tái tạo video dựa vào kỹ thuật nội suy bù chuyển động
Hình 1.12 ánh xạ các đặc tr-ng (Trang 32)
Hình 2.1: Quá trình phân đoạn video - tái tạo video dựa vào kỹ thuật nội suy bù chuyển động
Hình 2.1 Quá trình phân đoạn video (Trang 35)
Hình 2.2: Các cửa sổ cơ sở trong thuật toán so sánh thực - tái tạo video dựa vào kỹ thuật nội suy bù chuyển động
Hình 2.2 Các cửa sổ cơ sở trong thuật toán so sánh thực (Trang 38)
Hình 2.3: Chênh lệch biểu đồ, * cắt cảnh, ---- chồng mờ - tái tạo video dựa vào kỹ thuật nội suy bù chuyển động
Hình 2.3 Chênh lệch biểu đồ, * cắt cảnh, ---- chồng mờ (Trang 39)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w