Quantization là một kỹ thuật lossy, vì quá trình lượng tử hoá bị nhiễu hoặc lỗi là do sự làm tròn giá trị làm tròn bằng mức lượng tử gần nhất, là sự sai khác giữa giá trị thực của tín hi
Trang 1TRƯỜNG ĐẠI HỌC ĐIỆN LỰC ĐỀ THI KẾT THÚC HỌC PHẦN
Khoa Điện tử - Viễn thông Môn: Kỹ thuật Multimedia
ĐỀ SỐ 1
Áp dụng cho trình độ: Đại học – Hệ đào tạo: chính quy
Thời gian làm bài: 90 phút.
Ngày ra đề: Người duyệt:
Ngày chọn đề: Đại diện Phòng KT&KĐCL:
Ghi chú:
1 Sinh viên không được dùng tài liệu, thi xong kẹp đề vào bài làm.
2 Trình bày rất ngắn gọn dễ hiểu.
3 Các bài giống nhâu sẽ bị trừ điểm nặng.
Câu 1: (1 điểm) Định nghĩa khái niệm Formant trong xử lý tiếng nói?
Nêu 2 ứng dụng thực tế của xử lý tiếng nói
Formant
Với phổ của tín hiệu tiếng nói, mỗi đỉnh có biên độ lớn nhất xét trong một khoảng nào đó (cực đại cục bộ) tương ứng với một
formant Ngoài tần số, các formant còn được xác định bởi biên độ và dải thông của chúng Về mặt vật lý các formant tương ứng với các tần số cộng hưởng của tuyến âm
Tần số formant biến đổi trong một khoảng rộng phụ thuộc vào giới tính của người nói và phụ thuộc vào các dạng âm vị tương ứng với formant đó
2 ứng dụng thực tế của xử lý tiếng nói:
Bảo mật: nhận dạng giọng nói, đặt mã bảo vệ bằng giọng nói
Truyền thông: việc số hoá tín hiệu tiếng nói nhằm mang lại hiệu quả cao nhất trong việc truyền dẫn và lưu trữ tín hiệu, hay phức tạp hơn là ra lệnh bằng giọng nói cho các thiết bị điện tử
Trang 2Câu 2: (1 điểm) Vì đâu chúng ta lại sử dụng Signal to Quantization
noise Ratio?
Như chúng ta đã biết quá trình lượng tử là chuyển tín hiệu liên tục (tương tự) sang tín hiệu rời rạc (số) Với tín hiệu vào là tín hiệu điện
có giá trị từ 0 đến 1, nhưng ta chỉ có 8 bít để mã hoá, tức là có 256 giá trị khác nhau Vì vậy quá trình lượng tử hoá bị nhiễu (hoặc lỗi) là
do sự làm tròn giá trị, là sự sai khác giữa giá trị thực của tín hiệu điện so với giá trị của các mức lượng tử ( bước lượng tử)
Và ta sử dụng Signal to Quantization noise Ratio để đánh giá chất lượng của quá trình Quantization mà thôi
Câu 3: (1 điểm) Quantization là một kỹ thuật lossless hay lossy? Tại
sao?
Quantization là một kỹ thuật lossy, vì quá trình lượng tử hoá bị nhiễu (hoặc lỗi) là do sự làm tròn giá trị (làm tròn bằng mức lượng tử gần nhất), là sự sai khác giữa giá trị thực của tín hiệu điện so với giá trị của các mức lượng tử ( bước lượng tử)
Do đó Quantization là một kỹ thuật làm mất dữ liệu
Câu 4: (1 điểm) Dải tần số của tín hiệu mà chúng ta có thể có được
khi tần số lấy mẫu tín hiệu là 16KHz sẽ là :
A: 8KHz 16KHz B: 0 32KHz
C: 0 8KHz D: 16KHz 32KHz
Câu 5: (1 điểm) Cho một chuỗi Text như sau:
S=”WWWWWWWWWWWWBWWWWWWWWWWWWBBBWWWWWW WWWWWWWWWWWWWWWWWWB”
Tính Compression ratio sau khi sử dụng kỹ thuật Run-Lengh Coding?
Text to be coded (length: 53)
Trang 3S=”WWWWWWWWWWWWBWWWWWWWWWWWWBBBWWWWWW WWWWWWWWWWWWWWWWWWB”
Text after coded (length: 15)
12W1B12W3B24W1B
compression ratio = B0/B1=15/53=3,533
Câu 6: (1 điểm) Cho một chuỗi ký tự như sau:
S=”BBBCAAEEEEDDDDCCCAAAACCBBBBBBBBEEABBBBD”
Mô tả giải thuật Huffman để nén chuỗi ký tự trên và cho biết mã đầu
ra tương ứng cho mỗi ký tự?
Câu 7: (1 điểm) Cho hàm f(i)=10 (i=0, ,7) Tính giá trị hàm F(u)?
(u=0, ,7) của phép biến đổi Cosin rời rạc? Vẽ biểu đồ tương ứng cho f(i) và F(u)?
Câu 8: (1 điểm) Việc nén tín hiệu video số nhằm mục đích gì?
A: Giảm dung lượng cho quá trình lưu trữ.
B: Giảm dung lượng cho quá trình truyền dẫn.
C: Cả A) và B).
Câu 9: (0.5 điểm) Trong kỹ thuật Watermarking, kỹ thuật Blind và
Non-Blind là gì?
Trong kỹ thuật Watermarking, kỹ thuật Blind là kỹ thuật thuỷ vân
ẩn Tính ẩn cao, bằng mắt thường không thể nhìn thấy được thủy vân Thủy vân ẩn mang tính bất ngờ hơn thủy vân hiện trong việc phát hiện sản phẩm bị lấy cắp
Trong kỹ thuật Watermarking, kỹ thuật Non-Blind là kỹ thuật thuỷ vân hiện Người dùng có thể nhìn thấy được giống như các biểu thượng truyền hình VTV1, VTV2, HDTV… Các thủy vân hiện trên ảnh thường dưới dạng chìm, mờ hoặc trong suốt để không gây ảnh hưởng đến chất lượng ảnh gốc
Câu 10: (0.5 điểm) Trong lĩnh vực computer vision, để một robot dò
tìm ra được biển số của một xe ô tô thì phải qua những bước xử lý nào?
Bước 1: Nhận diện mẫu (khung hình chữ nhật của biển số ô tô)
Trang 4Bước 2: Chụp hình mẫu và lưu vào hệ thống.
Bước 3: Quét mẫu, xử lý tín hiệu
Bước 4:Lưu lại giá trị đã xử lý
Câu 11: (0.5 điểm) Trong lĩnh vực dò tìm và chuẩn đoán lỗi, mô tả
các bước rất ngắn gọn phương pháp tìm lỗi vòng bi sử dụng kỹ thuật Envelope Analaysis
Bước 1: lấy tín hiệu đo (từ đầu đo được gắn trên vật)
Bước 2: xử lý tín hiệu đo qua bộ lọc số và phân tích (tín hiệu giải tích).để được đường bao tín hiệu lọc
Bước 3: Qua thuật toán FFT (biến đổi fourier nhanh )đưa ra phổ đường bao Sau đó qua sự so sánh với các thông số chuẩn thì có thể đánh giá chuẩn đoán lỗi
Câu 12: (0.5 điểm) Trong lĩnh vực data mining, kỹ thuật Clustering
để làm gì?
Kỹ thuật Clustering trong lĩnh vực data mining là kỹ thuật phân nhóm (phân cụm)
Đó là công việc sắp xếp các đối tượng cho trước thành từng cụm Ví
dụ với phân nhóm văn bản, các văn bản (được coi là mới) sẽ được phân vào các nhóm khác nhau (dựa vào thuộc tính của mỗi nhóm) Người ta sẽ dùng các thuật toán khác nhau để làm sao nhận định được văn bản này là thuộc phân nhóm nào Và
Các thuật toán Clusterring có thể chia làm 2 nhóm chính:
Trang 5• Hierachial Bayesian clustering (HBC) algorithm G – HC algorithm
• Partilional clustering: K – Means
TRƯỜNG ĐẠI HỌC ĐIỆN LỰC ĐỀ THI KẾT THÚC HỌC PHẦN
Khoa Điện tử - Viễn thông Môn: Kỹ thuật Multimedia
ĐỀ SỐ 2
Áp dụng cho trình độ: Đại học – Hệ đào tạo: chính quy – Thời gian làm bài: 90 phút.
Ngày ra đề: Người duyệt:
Ngày chọn đề: Đại diện Phòng KT&KĐCL:
Ghi chú:
1 Sinh viên không được dùng tài liệu, thi xong kẹp đề vào bài làm.
2 Trình bày rất ngắn gọn dễ hiểu.
3 Các bài giống nhâu sẽ bị trừ điểm nặng.
Trang 6Câu 1: (1 điểm) Phương pháp tổng hợp tiếng nói bằng LP là gì?
Linear Predictive là một trong các phương pháp tổng hợp tín hiệu tiếng nói phổ biến và được sử dụng nhiều trong việc dò tìm các tham số cơ bản: tần số
cơ bản, formant, phổ tín hiệu, các hàm truyền đạt của bộ máy phát âm
Các mẫu tín hiệu tiếng nói có thể được xấp xỉ hóa như là tổ hợp tuyến tính của một số mẫu quá khứ,bằng cách tối thiểu hóa tổng của các bình phương phương sai (trong một khoảng thời gian xác định) giữa các mẫu hiện tại của tín hiệu tiếng nói và mẫu tiên đoán tuyến tính ta có thể thu được một tập hợp các tham số dự đoán.
Trong mô hình tổng hợp tiếng nói nguyên lý cơ bản của phương pháp LP chỉ
ra rằng tín hiệu tiếng nói có thể coi như là kết quả đầu ra của hệ tuyến tính biến đổi theo thời gian được kích thích bởi các xung tuần hoàn hoặc nhiễu ngẫu nhiên.
Ưu điểm của phương pháp này là nó cung cấp công cụ dò tìm tham số một cách chính xác và cho tốc độ tính toán nhanh.
Câu 2: (1 điểm) Tại nơi nhận tín hiệu Audio, tại sao thông thường
chúng ta phải dùng lowpass filter?
Ta biết tín hiệu audio có tần số trong khoảng 20hz đến 20khz
Tại bên đầu phát: tín hiệu phát là kết quả của một loạt quá trình biến đổi(như lấy mẫu, lượng tử, nén) và tín hiệu về bản chất đã được làm trơn (với audio là trong khoảng 20hz đến 20khz.)
Trong quá trình chuyền phát, trên đường truyền tín hiệu có thể bị các nhiễu ảnh hưởng (có tấn số cao)
Tại bên thu: tần số cao có thể xuất hiện ở phía thu do các yếu tố không mong muốn Và để lấy được tín hiệu cần thiết thì người ta dùng một bộ lowpass filter
Trang 7Câu 3: (1 điểm) Trong mô hình mã hóa và giải mã tín hiệu thoại, giải
thuật and A law được dùng trong phần mã hóa để làm gì?
Thuật toán luật μ là một thuật toán nén-giản tín hiệu, chủ yếu được sử dụng trong các hệ
thống viễn thông kỹ thuật số của Bắc Mỹ và Nhật Bản Các thuật toán nén-giản tín hiệu làm giảm phạm vi dải động của một tín hiệu âm thanh Trong các hệ thống tương tự, điều này có thể làm tăng tỷ lệ tín hiệu -nhiễu (SNR) đạt được trong quá trình truyền, và trong lĩnh vực kỹ thuật số, nó có thể làm giảm lỗi lượng tử hóa
Thuật toán luật A là một thuật toán nén-giãn tín hiệu tiêu chuẩn được sử dụng trong các hệ thống viễn thông số của Châu Âu , tương tự thuật toán μ-law
Câu 4: (1 điểm) Dải tần số của tín hiệu mà chúng ta có thể có được
khi tần số lấy mẫu tín hiệu là 10KHz sẽ là :
A: 5KHz 10KHz B: 0 5KHz
C: 0 20KHz D: 10KHz 20KHz
Câu 5: (1 điểm) Cho một chuỗi Text như sau:
S=”BBWWWWWWWWWWWWBWWWWWWWWWWWWBBBWWWWW WWWWWWWWWWWWWWWWWWWBB”
Tính Compression ratio sau khi sử dụng kỹ thuật Run-Lengh Coding?
Câu 6: (1 điểm) Cho một chuỗi ký tự như sau:
S=”CCCBAAEEEEDDDDBBBAAAABBCCCCCCCCEEACCCCD”
Mô tả giải thuật Huffman để nén chuỗi ký tự trên và cho biết mã đầu
ra tương ứng cho mỗi ký tự?
Câu 7: (1 điểm) Cho hàm f(i)=100 (i=0, ,7) Tính giá trị hàm F(u)?
(u=0, ,7) của phép biến đổi Cosin rời rạc? Vẽ biểu đồ tương ứng cho f(i) và F(u)?
Trang 8Câu 8: (1 điểm) Việc nén tín hiệu video số là quá trình trong đó
lượng thông tin của một ảnh hoặc nhiều ảnh được giảm bớt bằng cách:
A: Loại bỏ những thông tin dư thừa trong tín hiệu video.
B: Cắt nhỏ hình ảnh.
C: Loại bỏ một số khung hình.
Câu 9: (0.5 điểm) Tính ‘bền vững’ trong kỹ thuật Watermarking
được hiểu như thế nào?
tính bền vững trong watermarking được xác định là khả năng chống lại các tấn công của một sản phẩm watermarking các tấn công mà sản phẩm watermarking có thể là
Lấy lại mẫu
Lọc
thông
Thêm nhiễu
Biến đ ổi D/A A/D
Nén mp3 ( converted into mp3 )
Co lại ( cropped )
Câu 10: (0.5 điểm) Trong lĩnh vực computer vision, để một robot dò
tìm ra được biển số của một xe ô tô thì phải qua những bước xử lý nào?
Để một robo dò được biển số xe của một ô tô cần ,
Bước 1: Khoang vùng và xác định mẫu biển số xe ô tô
Bước 2: chụp hình vùng mẫu (biển oto) và lưu trữ
Bước 3: quét, scan ảnh và xử lý tín hiệu thu được sang dạng số
Buwocs4: lưu vào hệ thồng
Câu 11: (0.5 điểm) Trong lĩnh vực dò tìm và chuẩn đoán lỗi, một
chiếc SMART tivi có chương trình được điều khiển bằng cách nhận biết bàn tay người thì phải có những công nghệ gì?
Trang 9Trong lĩnh vực dò tìm và chuẩn đoán lỗi, một chiếc SMART tivi cần cả về phần cứng
và phần mềm Phần cứng : cần có như cammera, các sensor cảm biến chuyển động, hệ thống thu nhận và xử lý tín hiệu Phần mềm dựa trên các kỹ thuật chuẩn đoán, dò tìm , sau khi nhận dạng được bàn tay điều khiển, dựa vào hướng chuyển động , phần mềm sẽ so sánh với các thông tin đã lưu từ trước trong hệ thống để ra quyết định điều khiển
(Gợi ý nêu cả phần cứng lẫn phần mềm).
Câu 12: (0.5 điểm) Liệt kê 3 ứng dụng của Non-distructive testing.
Non-distructive testing là kiểm tra không phá huỷ với nhiều phương pháp khác nhau :
1 Phát hiện các khuyết tật bề mặt và gần bề mặt
PP thị giác và quang học(Visual test- VT)
Thẩm thấu chất lỏng(Liquid Penetrant Testing- PT)
Kiểm tra bột từ(Magnetic Particle Testing- MT)
Kiểm tra dòng xoáy(Eddy Current Testing- ET)
2 Phát hiện các khuyết tật nằm sâu bên trong
Chụp ảnh phóng xạ
Siêu âm Mỗi phương pháp có những ưu và nhược điểm khác nhau nên tuỳ vào trường hợp mà ứng dụng cũng khác nhau Ví dụ trong hàng không, máy móc công nghiệp, cơ khí chính xác, …