1. Trang chủ
  2. » Luận Văn - Báo Cáo

bài tập lớn xử lý âm thanh và hình ảnh

31 1,4K 7
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 31
Dung lượng 6,02 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Trình bày hiệu ứng che trong mã hóa âm thanh.. Chuỗi video được trình chiếu trong 90 phút... Tín hiệu video được số hóa với độ phân giải theo chiều ngang và chiều dọcgiô

Trang 2

Câu 2.8:

a Trình bày hiệu ứng che trong mã hóa âm thanh

b Giải thích sự khác nhau giữa che miền thời gian và che miền tần số?

c Xác định số bit cần thiết để mã hóa cho các băng 7 và 9 ? Biết băng 8 che 12

dB ở băng 7, 15 dB ở băng 9 và tín hiệu gốc được mã hóa 8 bit/mẫu/băng. -

- Khi tăng hoặc giảm 1 bit -> SNR tăng hoặc giảm 6dB

- Mà băng 7 bị che 12dB -> bị che mất 2 bit

=> số bít cần để mã hóa là: 8-2=6 (bit)

Câu 2.13:

Xét chuỗi video được mã hóa sử dụng H.263 ở chế độ PB, có kích cỡ ảnh 4CIF, tốc độ 30 fps Chuỗi video được trình chiếu trong 90 phút Các tham số nén được cho như sau: trung bình có 2 ảnh I được mã hóa trong 1 giây Chuỗi video ở chất lượng yêucầu có tỉ lệ nén trung bình ảnh I, P, B tương ứng là 10:1, 20:1, 40:1 Tính dung lượng của chuỗi video trên sau khi mã hóa? Tính thời gian để tải đoạn video đó trong trường hợp sử dụng ADSL2+?

Bài làm:

Trang 3

Câu 2.14:

Cho hệ thống LPC tổng quát như hình vẽ dưới đây:

Trang 4

- u(m)=1 tại m=1 và u(m)=0 tại các giá trị m khác.

Các điều kiện đầu =0 tại thời điểm bắt đầu của chu kỳ pitch

Bài làm:

Câu 2.15:

Sử dụng thuật toán Levinson-Durbin để tìm các hệ số dự đoán của bộ dự đoán bậc 3 (ai, i=1,2,3)? Biết khối dữ liệu thoại có các giá trị tự tương quan như sau: R(0)=1;R(1)=0,866; R(2)=0,554 và R(3)=0,225

Bài làm:

Trang 5

Câu 2.16:

Sử dụng phương pháp tối thiểu hóa bình phương sai số để tìm các hệ số dự đoáncủa bộ dự đoán bậc 2 (ai, i=1,2)? Biết khối dữ liệu thoại có các giá trị tự tương quan như sau: R(0)=1; R(1)=0,6 và R(2)=-0,2 Cho x[4]=0,5 và x[3]=-0,1 và giả thiết bộ dự đoán lỗi bình phương trung bình có độ dài là 2 Tính giá trị dự đoán cho mẫu tín hiệu x[5]=?

Bài làm:

Trang 6

Câu 2.17:

a Trình bày về các mô hình màu trong ảnh?

b Cho ảnh màu RGB với R=200, G=150, B=40 Xác định các thành phần Y, Cb,

Cr cho ảnh theo mô hình Y, Cb, Cr? Giả sử với ảnh màu RGB đã cho có các thành phần mầu được mã hóa 8 bit/pixel Nếu chúng ta muốn biểu diễn thành ảnh màu 8 bít sử dụng bộ lượng tử hóa đều với tỷ lệ R, G, B tương ứng dùng 3, 3, 2 bit mã hóa Xác định các giá trị màu sau khi lượng tử hóa?

x p và bộ lượng tử 3 mứcdưới đây:

Trang 7

1 0

1 2

) (

d d

d d

a Xác định mã Huffman cho các ký hiệu nói trên?

Tính độ dài từ mã trung bình và hiệu suất mã?

Bài làm:

Trang 9

Câu 2.23:

Nêu ý nghĩa của tăng cường ảnh? Cho ảnh đa mức xám I với các mức xám nằmtrong đoạn [0, 255] Dùng biến đổi s=log(1+r) để tìm ảnh đầu ra?

Trang 10

Bài làm:

Câu 2.24:

Trang 11

Nêu ý nghĩa phương pháp cân bằng lược đồ xám? Cho ảnh đầu vào I có 10 mứcxám Thực hiện cân bằng lược đồ xám ảnh I đã cho?

Bài làm:

Câu 2.25:

Cho khối ảnh 8x8 sau khi biến đổi DCT và lượng tử được bảng dưới đây Hãy mã hóa khối ảnh này bằng mã RLC và VLC biết rằng giá trị DC có trong khối DCT trước là 20?

75 -6 -3 3 0 0 0 0

Trang 13

Xác định các hệ số DC và AC(0,1), AC(1,0) của phép biến đổi DCT cho khối blockảnh 8x8 dưới đây ?

Trang 14

a Hãy tìm các ảnh cơ sở của biến đổi DCT-2D đối với ảnh S trên?

b Biểu diễn ảnh S qua các ảnh cơ sở tìm đươc ở trên?

Bài làm:

Trang 16

  và DC của khối trước đó là 3.

b Tính tỷ số nén CR, RMS, PSNR, BPP?

Bài làm:

Trang 19

a Sử dụng mã hóa từ điển LZW để mã hóa ảnh trên Tính tỷ số nén?

Với dữ liệu ảnh nén có được ở câu a, sử dụng giải mã LZW để tìm ảnh ban đầu? (Giả thiết ảnh được đọc và hiển thị theo thứ tự từ trái qua phải, từ trên xuống dưới)

Bài làm:

Trang 20

Câu 3.11:

Trang 21

a Mã hóa chuỗi ký tự sau sử dụng mã hóa số học: MEDIA; biết các ký tự xuất

hi n với các xác suất như sau: M = 0.1, E = 0.3, D = 0.3, I = 0.2 và A = 0.1

b Cho bảng sau:

Kí tự Tần suất Xác suất Dải

Trang 22

Câu 3.12:

Trình bày các khuôn dạng lấy mẫu YcbCr ? Cho một hệ thống truyền hình chấtlượng cao với số dòng z=1080, tỷ lệ khuôn hình 16:9, tần số quét là 60 mành/giây (quét

Trang 23

đan xen) Tín hiệu video được số hóa với độ phân giải theo chiều ngang và chiều dọcgiống nhau Mức lượng tử là 256 cho thành phần chói và 128 cho hai thành phần màu.Tính khối lượng thông tin số có được sau khi thực hiện số hóa một chương trình truyền

hình có thời gian là 2 giờ với khuôn dạng lấy mẫu : 4:2:0?

Bài làm:

+256 mức cho chói => có 8 bit biểu diễn chói

+128 mức cho màu => có 7 bit biểu diễn màu

+Kích thước ảnh 16:9

Số dòng z= 1080 => Số cột: (1080x16)/9=1920

Số điểm ảnh: (1920x1080) pixel

+ 1 điểm ảnh sử dụng 8 bit chói, 14 bit màu (2 màu) => 22 bit

+ Tần số quét: 60/2=30(Hz)

+ Lấy mẫu theo chuẩn 4:2:0 => Tần số quét cho màu =1/2 tần cố quét cho chói

 Dung lượng trong 2h: 1080x1920(8.30 + 7.30/2 + 7.30/2).2.3600=6718.464 Gb

a Ước tính chu kỳ pitch, P, của tín hiệu tiếng nói đó

b Tính hệ số dự đoán, a1 của bộ dự đoán tuyến tính (LPC) bậc 1 (p=1) đối với tínhiệu này

c Cho 4 giá trị đầu tiên của đoạn tiếng nói: x(n)=[1,2,3,5]:

- Hãy tính các hệ số MDCT sử dụng N=2 Biết ma trận biến đổi thuận A (2x4)

Trang 24

- Lượng tử hóa các hệ số MDCT sử dụng bộ lượng tử hóa đều mid-tread vớibước lượng tử = 1.

Khôi phục x(n) qua việc thực hiện biến đổi MDCT ngược các hệ số đã lượng tử hóa Biết ma trận biến đổi ngược là 8

Thực hiện phân tích đa phân giải tín hiệu trên, với các sóng con:

a Tìm biến đổi Haar 2 mức

b Khôi phục lại x(n) qua biến đổi Haar ngược Tính MSE giữa tín hiệu bạn đầu vàtín hiệu khôi phục?

Bài làm:

Trang 26

Câu 3.15:

Cho tín hiệu X có hàm mật độ xác suất như sau:

a Thiết kế bộ lượng tử hóa đều 1 bit Xác định các mức quyết định và mứckhôi phục

b Tính giá trị méo kỳ vọng (MSE) đối với tín hiệu đã lượng tử hóa

c Sử dụng thuật toán Max-Lloyd để thiết kế bộ lượng tử hóa không đều Sửdụng các thiết lập trước đó đối với bộ lượng tử hóa đều để khởi tạo thuậttoán Sử dụng ít nhất 2 vòng lặp để đưa ra các mức quyết định và khôiphục?

b Mã hóa 4 băng con với 2 bits/pixel sử dụng lượng tử hóa đều vô hướng

c Mã hóa 4 băng con sử dụng DPCM với lượng tử hóa đều vô hướng 2 bits/pixel

So sánh các ảnh khôi phục của ảnh I tương ứng với các cơ chế mã hóa trên

Bài làm:

Trang 27

Câu 3.17:

Cho tín hiệu x[n] gồm 12 mẫu như sau:

Phân đoạn tín hiệu trên thành các đoạn gồm có 4 mẫu:

a Thực hiện biến đổi DCT-4 mỗi đoạn đó

b Thực hiện biến đổi DWT 2 mức mỗi đoạn đó sử dụng các bộ lọc Haar

Tính toán phương sai các hệ số biến đổi trong mỗi trường hợp? Mô tả thủ tục gán 36 bit cho 12 giá trị sau biến đổi sao cho méo MSE là nhỏ nhất? Phép biến đổi nào cho hiệu năng tốt hơn?

Bài làm:

Câu 3.18:

a So sánh giữa chuẩn JPEG và JPEG2k

b Xác định số bít trung bình cho 1 điểm ảnh ( bao gồm cả chói và màu) Biết rằngảnh sử dụng chuẩn lấy mẫu 4:2:2 với 16 bít/mẫu và tỷ số nén của cả chói vàmàu 25

c Cần bao nhiêu bít để lưu trữ nếu ảnh sử dụng chuẩn lấy mẫu 4:2:0 độ phân giảichói 576x720, nếu tỷ số nén chói là 20 và tỷ số nén màu gấp 2 lần chói?

d Xác định phương pháp điều chế đơn giản dùng để truyền trong băng tần 2MHz,tần số 25hz ảnh được mã hóa theo định dang câu b ?

Bài làm:

Trang 28

Câu 3.19:

Dữ liệu đa phương tiện được truyền qua mạng với tốc độ 1.5 Mbps Dữ liệu bao gồm video và audio số Audio có tốc độ bít trung bình 300kbps Biết rằng Video số có định dạng chuẩn PAL và nén dùng MPEG1 Khung video có cấu trúc

IBBPBBPBBPBBI…Tỷ số nén 10:1 và 20:1 tương ứng cho khung I và khung P Tính tỷ số nén của khung B để đảm bảo truyền dữ liệu đa phương tiện với tốc độ 1.5 Mbps Giả sử chuẩn PAL tín hiệu chói có độ phân giải 352x288 và 2 tín hiệu màu được lấy mẫu bằng 1 nửa độ phân giải của chói Tần số quét hình 25Hz Mào đầu ghépkênh và đóng gói không được vượt quá 15% của luồng dữ liệu video MPEG- 1

Bài làm:

- Tốc độ trung bình của video là: 1,5 – 0,3 = 1,2 Mbps

- Khung video có 1I, 8B, và 3P

- Tốc độ của 1I được nén xuống 10 lần là 0,1

- Tốc độ của 3P được nén xuống 20 lần là 3/20= 0,15

- Tốc độ của 8B được nén xuống X lần là 8/X

 Tốc độ trung bình là (0,1+0,15+8/X)/(1+8+3)

Trang 29

 Số bit trên 1 khung là: 352x288x8+2(352/2)(288/2)x8= 1216512

 Tốc độ trung bình của video là:

(1216512x(0,1+0,15+8/X)/(1+8+3))x25=1,2.106/1,15 ( do màu đầu không được vượt quá 15%)

396 macroblock

Bài làm:

M=4: là khoảng cách giữa I và P, giữa P và P

N=16: chiều dài khung

 Thứ tự các khung I, P, B trong khung lớn là:IBBBPBBBPBBBPBBB

Vậy có 1 khung I, 12 khung B và 3 khung P

- Gọi x là số bit khung P

 Số bit khung I là 4x, số bit khung B là x/5

 Tốc độ mã hóa là: [(4x.1+x.3+12x/5)/(1+12+3)].25=1,15.106

 X=78298 bit

 Số bit trung bình của khung P trong mỗi macroblock=x/396=197,7

 Số bit trung bình của khung I trong mỗi macroblock=4x/396=790,8

 Số bit trung bình của khung B trong mỗi macroblock=x/5.396=39.5

Câu 3.21:

Phân tích ý nghĩa của dự đoán bù chuyển động trong mô hình mã hóa video?Dựa vào kỹ thuật ánh xạ khối xác định véc tơ chuyển động MB in đậm trong hình vẽ.Biết rằng cửa số tìm kiếm có kích thước 4x4

Trang 30

Bài làm:

Câu 3.23:

a Kể tên các loại ảnh của MPEG và cấu trúc của GOP

b Chuẩn mã hóa Video Mpeg 1 tần số quét 25hz với M=3 và N=12 Nếu khung I

có số bít gấp 3 lần khung P và khung P có số bít gấp 4 lần khung B Mỗimacroblock của khung B sử dụng 50 bít Xác định tốc độ bít của luồng video giảsử mỗi khung có 396 macroblock

Bài làm:

Ta có M=3 là khoảng cách giữa khung I và P, khung P và P

N=12: độ dài toàn khung

Trang 31

 Có 1 khung I, 8 khung B và 3 khung P

Gọi x là số bit của khung P  số bit khung I là 3x và số bit của khung B là x/4Tốc độ mã hóa là: [(3x.1+x.3+8x.4)/(1+3+8)].25

Vậy số bit trung bình của khung I trong 1 macroblock là 3x/396

Số bit trung bình của khung P trong 1 macroblock là x/396

Số bit trung bình của khung B trong 1 macroblock là x/(4.396)=50 (bit)

 X=7920 (bit) – tốc độ mã hóa của luồng video là 0,132Mbps

Ngày đăng: 01/07/2016, 12:51

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w