Truyền thông: đơn giản như nghiên cứu việc số hoá tín hiệu tiếng nói theo một phương thức nào đó, nhằm mang lại hiệu quả quả cao nhất trong việc truyền dẫn và lưu trữ tín hiệu, hay phức
Trang 1Đề số 1 (Lần 2)
Câu 1: (1 điểm) Định nghĩa khái niệm Formant trong xử lý tiếng nói? Nêu 2 ứng dụng thực tế
của xử lý tiếng nói.
Với phổ của tín hiệu tiếng nói, mỗi đỉnh có biên độ lớn nhất xét trong một khoảng nào đó (cực đại cục bộ) tương ứng với một formant Ngoài tần số, các formant còn được xác định bởi biên độ và dải thông của chúng Về mặt vật lý các formant tương ứng với các tần số cộng hưởng của tuyến âm
Tần số formant biến đổi trong một khoảng rộng phụ thuộc vào giới tính của người nói và phụ thuộc vào các dạng âm vị tương ứng với formant đó
Bảo mật: nhận dạng giọng nói, đặt mã bảo vệ bằng giọng nói.
Truyền thông: đơn giản như nghiên cứu việc số hoá tín hiệu tiếng nói theo một phương thức nào đó, nhằm mang lại hiệu quả quả cao nhất trong việc truyền dẫn và lưu trữ tín hiệu, hay phức tạp hơn là ra lệnh bằng giọng nói cho các thiết bị di động để có thể gửi tin nhắn, thực hiệc cuộc gọi tương tác thời gian thực với người sử dụng (VD: Siri trên iOS,Cortana trên Window Phone )
Câu 2: (1 điểm) Vì đâu chúng ta lại sử dụng Signal to Quantization noise Ratio?
Signal to Quantization noise Ratio SQNR- tỉ số tín hiệu trên nhiễu lượng tử đạc trưng cho chất lượng của quá trình lượng tử hóa hay chất lượng tín hiệu đầu ra của bộ chuyển đổi
AD được biểu diễn bằng SQNR
SQNR được sử dụng rộng rãi kiểm tra chất lượng trong các giải thuật phân tích tín hiệu số
vd PCM (điều chế mã xung) nó thể hiên mối liên hệ giữa cường độ tín hiệu tối đa và nhiễu lượng tử hay quantization error-lỗi lượng tử- Nó được tính bằng độ sai lệch của tín hiệu thực so với mức tín hiệu lượng tử hoá.
Câu 3: (1 đi m) Quantization là m t kỹ thu t lossless hay lossy? T i sao? ể ộ ậ ạ
Quá trình lượng tử hóa (quantization) tín hiệu, về cơ bản là một quá trình xấp xỉ
Hóa Tín hiệu tương tự(Analog )sau khi được lấy mẫu sẽ được chuyển về một số mức nhất định
Nó có thể được thực hiện dễ dàng bằng cách làm tròn hay cắt gọt Ví dụ tín hiệu có giá
trị là 8.62 có thể được xấp xỉ hóa thành 8 (nếu lượng tử hóa bằng cách cắt gọt) hay là 9 (nếu lượng tử hóa bằng cách làm tròn) nên đây là một kĩ thuật lossy
Câu 4: (1 đi m) D i t n s c a tín hi u mà chúng ta có th có để ả ầ ố ủ ệ ể ượ c khi t n s l y ầ ố ấ
m u tín hi u là 16KHz sẽ là ẫ ệ :
A: 8KHz 16KHz B: 0 32KHz
C: 0 8KHz D: 16KHz 32KHz
Vì theo Định lý lấy mẫu Nyquist–Shannon : tần số lấy mẫu phải thoả mãn điều kiện f s ≥ 2f m
Trong đó fm là tần số lớn nhất của tín hiệu
Câu 5: (1 điểm) Cho một chuỗi Text như sau:
S=”WWWWWWWWWWWWBWWWWWWWWWWWWBBBWWWWWWWWWWWWW WWWWWWWWWWWB” Đ dài 53 ộ
Tính Compression ratio sau khi s d ng kỹ thu t Run-Lengh Coding? ử ụ ậ
Run-Lengh Coding là m t kĩ thu t nén d li u đ n gi n12W1B12W3B24W1B đ dài 15 ộ ậ ữ ệ ơ ả ộ
Compression ratio=Bo/B1= 53/15 =3.533333
Câu 6: (1 điểm) Cho một chuỗi ký tự như sau:
S=”BBBCAAEEEEDDDDCCCAAAACCBBBBBBBBEEABBBBD”
Trang 2Mô tả giải thuật Huffman để nén chuỗi ký tự trên và cho biết mã đầu ra tương ứng cho mỗi ký tự?
Bảng tần xuất xuất hiện
Huffman shanon
Câu 7: (1 điểm) Cho hàm f(i)=100 (i=0, ,7) Tính giá trị hàm F(u)? (u=0, ,7) của phép
biến đổi Cosin rời rạc? Vẽ biểu đồ tương ứng cho f(i) và F(u)?
Câu 8: (1 điểm) Việc nén tín hiệu video số nhằm mục đích gì?
A: Gi m dung lả ượ ng cho quá trình l u tr ư ữ
B: Gi m dung lả ượ ng cho quá trình truy n d n ề ẫ
C: C ả A) và B).
Câu 9: (0.5 điểm) Trong kỹ thuật Watermarking, kỹ thuật Blind và Non-Blind là gì?
Trong một vài ứng dụng như bảo vệ bản quyền và kiểm tra dữ liệu các giải thuật watermark có thể dung ảnh gốc để xác định watermark gọi là watermark non- blind -tường minh, (non – oblivious).Ngược lại các giải thuật trích watermark không thể truy cập vào ảnh gốc được gọi là watermark không tường minh blind oblivious
Phân loại các loại Watermarking:
1 Theo khà năng cảm nhận :
Sẽ có các loại : Hữu hình và Vô hình.
-Watermarking Hữu hình (Visible/ Perceptible Watermarking)
Người sử dụng có the nhận thấy sự hiện diện của thông tin mật Thường dùng nhúng Logo, tên tác giả, địa chỉ website
-Watermaking Vô hình (invisible)
Trang 3Loai này thì thông tin mật được xem như vô hình đối với các cảm quan thị giác, thính giác Loại này thường dùng để truyền những thông điệp mật trên các kênh đại chúng Vidu: Binladen khi cho phát các video của mình
bề ngoài chỉ là những lời phát ngôn khiêu khích, nhưng nhữ người thân cận của ông ta trên khắp thế giới down video đó từ Youtube về giải mã sẽ ra những mệnh lệnh mật chẳng hạn.
2 Theo khả năng bền vững :
Có 3 loại : Robust Watermaking; Fragile Watermaking; Semi-Fragile Watermarking.
-Robust Watermaking : Watermarking nhúng theo phương pháp này rất khó phá hủy Việc tấn công các
Watermark trong trường hợp này sẽ làm suy giảm nghiêm trọng chất lượng thông tin Nói một cách dễ hiểu, tháo Watermark đồng nghĩa với việc tiêu luôn thông điệp mang VD: Trong một cái clip có nhúng Robust Watermarking làm hiện lên thông tin về website gốc hay nhà cung cấp suốt chiều dài clip làm bạn khó chịu, nhưng khi bạn gỡ các Robust Watermark đó ra thì cái clip của bạn cũng tiêu luôn!
-Fragile Watermaking: Loại này nhằm bảo đảm tính toàn vẹn cho nội dung thông tin Bất kì sự thay đổi nào dù nhỏ cũng làm hư Watermark cái này dùng để kiểm tra chất lượng kênh truyền thông tin, coi có bị ai can thiệp, hiệu chỉnh thông tin hay ko.
-Semi-Fragile Watermarking:Loại này nói một cách bình dân dễ hiểu nhất là tự phá hủy trong trường hợp bị kẻ thù tấn công Vd : Kẻ thù phát hiện điệp viên nước X dấu thông điệp mật trong File ảnh hay Video clip, nhưng khi tiến hành tấn công để giải mã ko hợp lý thì Watermark chứa bên trong sẽ bị xóa vĩnh viễn và ko thể phục hồi.
3 Phân loại theo đặc tính rút trích :
Có : Nonblind Watermarking, Semiblind Watermarking, Blind Watermarking Cái này hơi sâu một tí, có thời gian mình sẽ nói thêm.
4 Phân loại theo khóa:
Khóa ở đây kiểu hơi giống như Liense code Có 2 loại Watermarking theo kiểu phân loại này:
-Ko xài khóa : cái này bảo mật bằng một loạt các quy trình mã hóa phức tạp Nếu biết được trình tự công việc
và làm ngược lại thì có thể giải mã được Watermark.
-Sử dụng khóa: Bạn nào học về kỹ thuật CDMA rồi thì nói ra là hiểu ngay Bên phát dùng một chuỗi giả ngẫu nhiên dài ơi là dài để 'xào nấu' Nó đòi hỏi bên thu phải được cho cái code đó để giải mã Như vậy trình tự giải
mã có thể giông nhau tuy nhiên mỗi lần giải mã cần phải được bên phát cấp cho code.
Câu 12: (0.5 điểm) Trong lĩnh vực data mining, kỹ thuật Clustering để làm gì?
Clustering là một kỹ thuật được sử dụng trong datamining- khai thác dữ liệu để đặt các yếu tố
dữ liệu thành các nhóm có liên quan mà không biết trước các thuộc tính nhóm(cụm) , nhóm là một tập hợp các đối tượng dữ liệu thuộc tính tương tự như nhau và do đó có thể để là một nhóm Kỹ thuật phân nhóm phổ biến bao gồm k-means và tối đa hóa kỳ vọng (EM).
Câu 1: (1 điểm) Phương pháp tổng hợp tiếng nói bằng LP là gì?
Tín hiệu tiếng nói là 1 tín hiệu biến đổi theo thới gian,nhưng xét trong một khoảng thời gian ngắn khoang 20ms thì tín hiệu tiếng nói gần như không thay đổi mô hình tổng hợp lpc được xây dựng trên điều này.Nó xuất phát từ sự dự đoán tuyến tính,tức là mẫu tín hiệu tiếng nói tại thời điểm n kí hiệu S(n) sẽ được coi là tổ hợp tuyến tính của p mẫu tín hiệu trong quá khứ Từ tín hiệu tiếng nói ban đầu qua khối phân tích để tìm ra các tham số theo mô hình lpc khối tổng hợp sẽ nhận các tham số này và tổng hợp lại tiếng nói ban đầu
Trong mô hình tổng hợp tiếng nói nguyên lý cơ bản của phương pháp LPC chỉ ra rằng tín hiệu tiếng nói có thể coi như là kết quả đầu ra của hệ tuyến tính biến đổi theo thời gian được kích thích bởi các xung tuần hoàn hoặc nhiễu ngẫu nhiên
Câu 2: (1 điểm) Tại nơi nhận tín hiệu Audio, tại sao thông thường chúng ta phải dùng
lowpass filter?
Trang 4Trước khi lấy mẫu và chuyển đổi AD, các tín hiệu âm thanh cũng thường được lọc để loại bỏ tần số không mong muốn Các tần số giữ phụ thuộc vào ứng dụng:
Cho thoại , điển hình là tần sô từ 50Hz đến 10kHz được giữ lại, và các tần số khác bị chặn bằng cách sử dụng một bộ lọc thông dải qua đó sàng lọc ra tần số thấp hơn và cao hơn
Một tín hiệu âm nhạc âm thanh thông thường sẽ có từ khoảng 20Hz đến 20kHz
Tại bộ chuyển đổi DA, các tần số cao có thể xuất hiện trở lại ở đầu ra - vì lấy mẫu và sau đó lượng tử hóa, tín hiệu đầu tương tự được thay thế bởi một loạt các mức năng lương có chứa tất
cả các tần số có thể và bản thân trong quá trình truyền dẫn có thể xuất hiện các nhiễu thương là nhiễu cao tần
Vì vậy, ở phía bộ giải mã, một bộ lọc thông thấp được sử dụng sau các mạch DA
Câu 3: (1 điểm) Trong mô hình mã hóa và giải mã tín hiệu thoại, giải thuật and A law được dùng
trong phần mã hóa để làm gì?
giải thuật and A law là một thuật toán nén-giãn tín hiệu tiêu chuẩn được sử dụng trong các hệ thống viễn thông số của Châu Âu nhằm nhằm tối ưu hóa hệ thống, ví dụ như giảm dải động của
Các thuật toán nén-giản tín hiệu làm giảm phạm vi dải động của một tín hiệu âm thanh Trong các hệ thống tương tự, điều này có thể làm tăng tỷ lệ tín hiệu - nhiễu (SNR) đạt được trong quá trình truyền, và trong lĩnh vực kỹ thuật số, nó có thể làm giảm lỗi lượng tử hóa
Câu 8: (1 điểm) Việc nén tín hiệu video số là quá trình trong đó lượng thông tin của một ảnh
hoặc nhiều ảnh được giảm bớt bằng cách:
A: Lo i b nh ng thông tin d th a trong tín hi u videoạ ỏ ữ ư ừ ệ
B: C t nh hình nh.ắ ỏ ả
C: Lo i b m t s khung hình.ạ ỏ ộ ố
Th c ch t c a kỹthu t “nén video s ” là lo i b đi các thông ự ấ ủ ậ ố ạ ỏ
tin d th a Các thông tin d th a trong nén video s th ư ừ ư ừ ố ườ ng là:
+ Đ d th a không gian gi a các pixel; ộ ư ừ ữ
+ Đ d th a th i gian do các nh liên ti p nhau; ộ ư ừ ờ ả ế
+ Đ d th a do các thành ph n màu bi u di n t ng pixel có đ t ộ ư ừ ầ ể ễ ừ ộ ươ ng quan
cao;
+ Đ d th a th ng kê do các kí hi u xu t hi n trong dòng bít v i xác su t xu t ộ ư ừ ố ệ ấ ệ ớ ấ ấ
hi n không đ u nhau; ệ ề
+ Đ d th a tâm lý th giác (các thông tin n mngoài kh năng c m nh n c a ộ ư ừ ị ằ ả ả ậ ủ
m t 24 frame/s ).vv… ắ
Câu 9: (0.5 điểm) Tính ‘bền vững’ trong kỹ thuật Watermarking được hiểu như thế nào? Câu 10: (0.5 điểm) Trong lĩnh vực computer vision, để một robot dò tìm ra được biển số
của một xe ô tô thì phải qua những bước xử lý nào?
Câu 11: (0.5 điểm) Trong lĩnh vực dò tìm và chuẩn đoán lỗi, một chiếc SMART tivi có
chương trình được điều khiển bằng cách nhận biết bàn tay người thì phải có những công nghệ gì?
(Gợi ý nêu cả phần cứng lẫn phần mềm).
Trang 5Câu 12: (0.5 điểm) Liệt kê 3 ứng dụng của Non-distructive testing.
Để phát hiện các khuyết tật xuất hiện trong các sản phẩm và bán sản phẩm trước khi đầu tư thời gian và tiền bạc vào các công đoạn sau
Để cải thiện các quy trình sản xuất, bằng cách kiểm tra các sản phẩm trước và sau mỗi lần cải tiến
Để giảm thiểu các chi phí, tăng cường sự an toàn cho công nhân, dân chúng, môi trường bằng cách kiểm tra định kì các thiết bị máy móc, tìm ra các khuyết tật, thay thế trước khi chúng gây nên sự cố nghiêm trọng
Để có được các thông tin về chất lượng, tình trạng của sản phẩm mà không làm tổn hại đến khả năng sử dụng của chúng
Để khẳng định sự toàn vẹn của các đối tượng kiểm tra trong quá trình đại tu nhằm đảm bảo sự hoạt động an toàn của máy móc, thiết bị
Đề số 1 (Lần 2)
Câu 1: (1 Điểm) Phân tích tiếng nói là gì? Nêu 2 ứng dụng thực tế của xử lý tiếng nói.
Câu 2: (1 Điểm) Tại sao cần phải lượng tử hóa? Bước lượng tử là gì?
Câu 3: (1 Điểm) Để thu được tín hiệu có giải tần số là 0-20Khz thì tần số lấy mẫu phải là:
Câu 4: (2 Điểm) Cho một chuỗi các kí tự như sau:
S = “CABBBAEEEEDDDDCCCAAAACCBBBBBBBBEEABBBBD”
Mô tả giải thuật Huffman để nén chuỗi kí tự trên và cho biết mã đầu ra tương ứng cho mỗi kí tự?
Câu 5: (1 điểm) Theo mã RLC, End Of Block (EOB) để đánh dấu vị trí bắt đầu:
A: Chuỗi số 0 liên tiếp
B: Chuỗi số 1 liên tiếp
C: Dãy số 101010
D: Kết thúc bảng mã
Câu 6: (2 Điểm) Cho hàm f(i) = 10 (i=0,2,3 ,7) Tính giá trị hàm F(u)? (u=0,1,…,7) của phép biến đổi Cosine rời rạc Vẽ biểu đồ tương ứng cho f(i) và F(u)?
Câu 7: (1 Điểm) Trong kỹ thuật Watermarking, người ta dùng khóa (key) để làm gì? Liệt
kê 3 ứng dụng của watermarking?
Câu 8: (1 Điểm) Trong lĩnh vực dò tìm và chuẩn đoán lỗi cho thiết bị máy, mô tả ngắn gọn
kĩ thuật dò tìm lỗi cho vòng bi và hộp số sử dụng tín hiệu rung và tín hiệu âm thanh.