1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tài liệu TIỂU LUẬN MÔN XỬ LÝ TÍN HIỆU NÂNG CAO..“NGHIÊN CỨU MÔ HÌNH MÃ HÓA TIẾNG NÓI MELP” potx

23 625 3
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 23
Dung lượng 681 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Có rất nhiều thuật toán để xử lý số tín hiệu tiêngs nói khác nhau để giải quyết vấn đề này như là LPC, CVSD, Melp Mixed-Excitation Linear Predictive.. Vì vậy thuật toán Me

Trang 1

-o0o -TIỂU LUẬN MÔN XỬ LÝ TÍN HIỆU NÂNG CAO

“NGHIÊN CỨU MÔ HÌNH MÃ HÓA TIẾNG NÓI MELP”

Giáo viên hướng dẫn: TS Nguyễn Ngọc Minh Nhóm thực hiện:

Hà Nội, tháng 5 năm 2013

Trang 2

MỤC LỤC

MỤC LỤC 1

LỜI NÓI ĐẦU 2

I Khái quát chung 3

II Thủ tục mã hóa Melp 5

1 Mô hình mã hóa Melp 5

2 Lọc bỏ tần số thấp 6

3 Bộ đệm đầu vào mẫu 6

4 Tính toán phần nguyên độ cao tiếng nói (pitch) 6

5 Phân tích dải tần tiếng nói 6

6 Tính phần thập phân của độ cao tiếng nói 7

7 Cờ ngẫu nhiên 7

8 Phân tích dự đoán tuyến tính 7

9 Tính toán tín hiệu sau lọc của dự đoán tuyến tính 7

10 Tính toán Peakiness 8

11 Hoàn tất tính toán cao độ của tiếng nói 8

12 Kiểm tra tính bội của cao độ 9

13 Tính hệ số khuyếch đại 9

14 Cập nhật cao độ trung bình 10

15 Lượng tử hóa các hệ số của bộ lọc dự đoán tuyến tính 10

16 Lượng tử hóa cao độ tiếng nói 11

17 Lượng tử hóa hệ số khuyếch đại 11

18 Lượng tử hóa băng tần tiếng nói 11

19 Tính toán biên độ Furie và lượng tử hóa 12

20 Sửa lỗi và đóng gói các bit thành khung 13

III Bộ giải mã 14

1 Sửa lỗi và lấy ra các bit từ khung 15

2 Giảm nhiễu 15

3 Nội suy các tham số 16

4 Tạo kích thích hỗn hợp 17

5 Bộ lọc thích nghi tăng cường phổ 18

6 Tổng hợp bộ lọc dự đoán tuyến tính 19

7 Điều chỉnh hệ số khuyếch đại 19

8 Trải phổ xung 19

9 Điều khiển vòng lặp tổng hợp 20

10 Lọc trước đầu ra (không bắt buộc) 20

IV Ứng dụng mã Melp trong máy VHF nhảy tần 22

1 Quá trình xử lý thoại để truyền đi 22

2 Quá trình xử lý thoại nhận về 22

V Mô hình ứng dụng mã Melp trong mạng truyền thông quân sự 23

PHẦN KẾT LUẬN 24

DANH MỤC TÀI LIỆU THAM KHẢO 25

Trang 3

LỜI NÓI ĐẦU

Trong thông tin vô tuyến điện băng hẹp HF, VHF nói chung và thông tin

vô tuyến điện quân sự nói riêng thì việc tiết kiệm băng thông, cải thiện chất lượng tín hiệu khi truyền là vấn đề rất quan trọng Có rất nhiều thuật toán để xử

lý số tín hiệu tiêngs nói khác nhau để giải quyết vấn đề này như là LPC, CVSD, Melp (Mixed-Excitation Linear Predictive)

Đối với thông tin vô tuyến điện quân sự ngoài việc tiết kiệm băng thông kênh truyền còn có nhiệm vụ quan trọng nữa đó là chống tác chiến điện tử của kẻ thù, nên việc yêu cầu phải tích hợp rất nhiều dịch vụ trên một kênh truyền HF và VHF Điều này chỉ được giải quyết khi ta nén dữ liệu số xuống một tốc độ rất thấp Vì vậy thuật toán Melp là đáp ứng được các yêu cầu trên.

Mã dự đoán tuyến tính kết hợp với bộ kích thích (MELP) là một mã hóa tiếng nói chuẩn của Bộ Quốc Phòng và Chính Phủ Mỹ, được ứng dụng chủ yếu trong các ứng dụng quân sự và thông tin vệ tinh, âm thanh bảo mật và các thiết bị vô tuyến bảo mật Được phát minh năm 1995 do Alan McCree (làm luận văn tốt nghiệp về xử lý tín hiệu và xử lý ảnh) Sau đó được hãng Texas Instruments đưa vào sản phẩm thương mại (chíp DSP kèm phần mềm MELP với tốc độ 2400bps) Năm 1997 đưa vào thành chuẩn quân sự Mỹ (MIL-STD-3005) và đến năm 2001 được đưa vào chuẩn NATO (STANAG 4591) Ngày nay chuẩn mã thoại MELP gồm 3 tốc độ (2400bps, 1200bps và 600bps).

2

Trang 4

I Khái quát chung

Theo chuẩn MIL-STD-3005, mã MELP dựa trên mô hình tham số mã dự đoántuyến tính (LPC - Linear Prediction Coding chủ yếu là LPC10) và có cải tiến, bổ xungthêm năm đặc trưng nữa để khắc phục các nhược điểm của mã LPC; đó là Bộ trộn kíchthích, chuỗi xung ngẫu nhiên, bộ lọc phổ thích nghi tăng cường, trải phổ xung và môhình năng lượng Fourier, Một khung dữ liệu MELP được tạo thành từ đoạn dữ liệu âmthanh trong khoảng thời gian 22.5ms, trong đó gồm 180 mẫu với tốc độ lấy mẫu là8,000 mẫu/giây Sau khi qua quá trình phân tích, tính toán ra các đặc trưng, đoạn dữliệu này sẽ được mã hóa bằng 54 bit rồi truyền đi, vậy tốc độ dữ liệu (54 bit/22,5mstương đương 2400 bit/ 1giây) Các yêu cầu về đặc tính tương tự và các tham số mã hóacụ thể như sau:

Yêu cầu về tín hiệu tương tự: Băng thông tín hiệu tương tự từ 100Hz đến3800Hz; Bộ biến đổi A/D lớn nhất là 16 bit (tức là có giá trị sau biến đổi nằm trongkhoảng -32768 đến 32767); Độ lợi xử lý mã phải đồng đều trên cả băng thông để đảmbảo mức của tín hiệu tiếng nói đầu ra phù hợp với mức của tín hiệu tiếng nói đầu vào Yêu cầu các tham số mã hóa và lượng tử: Các tham số của mã MELP sau khilượng tử hóa và được truyền đi bao gồm: chu kỳ pitch cuối cùng (P3); các giá trị âmthanh qua lọc băng thông (Vbpi, i = 1, 2, …, 5); giá trị 2 hệ số khuếch đại (G1, G2);các hệ số dự đoán tuyến tính (ai, i= 1, 2, …, 10); giá trị năng lượng Fourier và cờ ngẫunhiên Phạm vi, giá trị cụ thể của các tham số được cho trong bảng 1

B ng 1: B ng c p phát s bit dùng cho các tham s MELP ảng 1: Bảng cấp phát số bit dùng cho các tham số MELP ảng 1: Bảng cấp phát số bit dùng cho các tham số MELP ấp phát số bit dùng cho các tham số MELP ố bit dùng cho các tham số MELP ố bit dùng cho các tham số MELP

Tên tham số Âm hữu thanh (bit) Âm vô thanh (bit)

Trang 5

-Cờ ngẫu nhiên 1

4

Trang 6

II Thủ tục mã hóa Melp

1 Mô hình mã hóa Melp

I Thủ tục giải mã Melp

Hình trên là mô hình hệ thống mã hóa MELP Chức năng của từng bộ phậntrong hệ thống lần lượt được trình bày ở phần tiếp theo

2 Lọc bỏ tần số thấp

Bước đầu tiên thực hiện mã hóa là lọc bỏ các tần số thấp, năng lượng một chiềucủa dữ liệu tiếng nói đầu vào Bước này được thực hiện với một bộ lọc thông caoChebychev 4 bậc loại II, với tần số cắt tại 60Hz và hệ số nén ngoài dải thông là 30dB

Dữ liệu tiếng nói sau lọc được đưa vào bộ đệm

Trang 7

3 Bộ đệm đầu vào mẫu

Bộ đệm chứa các mẫu mới nhất của tín hiệu tiếng nói đầu vào Trong đó có mộtmẫu là mẫu mới nhất trong khung hiện tại Bộ đệm được bổ xung thêm các mẫu trướcvà sau mẫu này để có các mẫu cần thiết cho quá trình giải mã

4 Tính toán phần nguyên độ cao tiếng nói (pitch)

Để tính độ cao tiếng nói, đầu tiên tín hiệu giọng nói được lọc với bộ lọc thôngthấp Butterworth bậc 6 tần số cắt 1kHz Giá trị phần nguyên của độ cao âm thanh P1 làgiá trị của τ, τ = 40, 41, …, 160, để cho hàm tự tương quan chuẩn r(τ) cực đại Hàmnày được xác định bởi công thức sau:

Trong đó [τ/2 ] là giá trị nguyên lớn nhất không vượt quá τ/2.τ/2 ] là giá trị nguyên lớn nhất không vượt quá τ/2

5 Phân tích dải tần tiếng nói

Phần này của bộ mã hóa sẽ xác định tiếng nói thuộc băng tần nào trong 5 băngtần và tính cường độ tiếng nói Vbpi, i= 1, 2, 3, 4, 5, sau khi cho qua các bộ lọcButterworth bậc 6 với các dải băng thông là 0 ÷ 500, 500 ÷ 1000, 1000 ÷ 2000, 2000 ÷

3000, 3000 ÷ 4000 Hz

6 Tính phần thập phân của độ cao tiếng nói

Thủ tục này dùng phương pháp nội suy để tăng độ chính xác cho độ cao tiếngnói Đầu tiên độ cao tiếng nói được làm tròn đến giá trị nguyên gần nhất Giả sử rằnggiá trị này bằng T mẫu và hàm tự tương quan chuẩn hóa r( ) là một hàm liên tục vàcó cực đại trong khoảng T-1 và T+1 từ đó c(0,T-1) và c(0,T+1) được tính và so sánh

để xác định cực đại nằm trong khoảng T-1 và T hay T và T+1 Nếu c(0,T-1) >

(1)

(2)

(3)

6

Trang 8

c(0,T+1) thì cực đại nằm giữa T-1 và T thì độ cao tiếng nói T cần phải giảm đi 1 Phầnthập phân ɛ được tính bằng công thức sau:

Trong đó c(m,n) được xác định ở công thức (2) ở trên Giá trị độ cao âm thanhtính được ở phần này là: P2 = T + 

7 Cờ ngẫu nhiên

Cờ ngẫu nhiên được thiết lập bằng 1 khi Vpb1 < 0,5 và được thiết lập tới 0trong các trường hợp khác Giá trị của Vpb1 được xác định trong phân tích dải tầntiếng nói như ở phần 4

8 Phân tích dự đoán tuyến tính

Một bộ phân tích dự đoán tuyến tính bậc 10 được thực hiện trên đầu vào tínhiệu tiếng nói sử dụng cửa sổ Hamming 200 mẫu ( 25 ms) tập trung xung quanh mẫumới nhất trong khung hiện tại Quá trình tính được thực hiện bởi thuật toán đệ quiLevinson-Durbin

9 Tính toán tín hiệu sau lọc của dự đoán tuyến tính

Tín hiệu sau lọc của dự đoán tuyến tính được tính toán bằng cách lọc tín hiệutiếng nói đầu vào với bộ lọc dự đoán tuyến tính có hệ số được xác định ở phần 7 Cửa

sổ để tính tín hiệu sau lọc có tâm là mẫu mới nhất trong khung hiện tại và được làm đủrộng để sử dụng cho việc tính toán độ cao âm thanh sau cùng (ở phần 10)

10 Tính toán Peakiness

Đỉnh của tín hiệu sau lọc được tính toán trên một cửa sổ 160 mẫu có tâm là mẫumới nhất của khung hiện hành Giá trị đỉnh là được tính dựa trên tín hiệu sau lọc rn nhưcông thức dưới:

(4)

(3)

Trang 9

Nếu giá trị đỉnh vượt quá 1,34 thì cường độ âm thanh Vpb1 được gán 1,0 Nếugiá trị đỉnh vượt qua 1,6 thì cường độ âm thanh 3 băng, Vpbi , i=1, 2, 3 được gán bằng1,0 Peakiness chỉ được sử dụng cho mục đích trên.

11 Hoàn tất tính toán cao độ của tiếng nói

Quá trình tính toán giá trị cuối cùng của cao độ tiếng nói dựa trên tín hiệu saulọc sau khi đã lọc thông thấp với bộ lọc thông thấp Butterworth bậc 6, tần số cắt 1kHz.Phương trình (1) cũng được sử dụng để tìm phần nguyên của cao độ của tín hiệu saulọc dao động từ nhỏ hơn độ cao giọng nói 5 mẫu đến lớn hơn cao độ giọng nói 5 mẫu.Quá trình tính toán phần thập phân của cao độ tín hiệu sau lọc cũng được tiến hànhtương tự như phần 6 để tìm ra giá trị chính xác của cao độ P3 và giá trị tương quanchuẩn tương ứng r(P3)

Nếu r(P3)≥0,6 (nghĩa là giá trị tự tương quan tính ra đủ lớn, tức tín hiệu sau lọcgần như tuần hoàn với chu kỳ P3 mẫu) thì giá trị cao độ này sẽ được coi như cao độcủa tiếng nói, ta tiến hành kiểm tra xem cao độ tìm được có là bội của cao độ nào nhỏhơn không (mục 12) với ngưỡng để so sánh là Dth (nghĩa là nếu muốn khẳng định P3 cóphải là bội của cao độ nhỏ hơn P3/n nào đó, cần có r(P3/n)≥Dth.r(P3) để tìm ra giá trịcao độ cuối cùng Nếu P3≤100 thì chọn Dth=0,75, ngược lại thì chọn Dth=0,5

Ngược lại (tức độ tương quan không đủ lớn – tín hiệu sau lọc gần như là ngẫunhiên không có chu kỳ), thì giá trị cao độ của tiếng nói ban đầu sẽ được chọn để tínhcao độ cuối cùng Nếu giá trị tự tương quan đã chuẩn hóa tính được nhỏ hơn 0,55 thìtiếng nói ban đầu gần như là ngẫu nhiên không có chu kỳ, ta sử dụng cao độ trung bình

Pavg Ngược lại thì giá trị này được coi như độ cao của tiếng nói, ta tiến hành kiểm traxem cao độ này có phải là bội số của cao độ nhỏ hơn nào đó không với ngưỡng sosánh là Dth=0,9 nếu P3≤100, Dth=0,7 nếu ngược lại

Quá trình trên có thể tính ra giá trị P3 và giá trị tự tương quan tương ứng khácvới các giá trị ban đầu Nếu giá trị tương quan tính được nhỏ hơn 0,55 thì cao độ đượcgán bằng giá trị cao độ trung bình

12 Kiểm tra tính bội của cao độ

8

Trang 10

Một hàm tuần hoàn với chu kỳ T nào đó thì cũng tuần hoàn với chu kỳ 2T, 3T,

… nên cao độ tính được ở bước trên có thể gấp 2 lần, 3 lần… cao độ cơ bản nào đó.Quá trình kiểm tra tính bội của cao độ nhằm tính ra cao độ cơ bản từ giá trị cao độ tínhđược ở trên

13 Tính hệ số khuyếch đại

Hệ số khuyếch đại âm thanh đầu vào được tính hai lần trong mỗi frame sử dụngcửa sổ có độ rộng thay đổi theo giá trị cao độ Độ rộng cửa sổ ở cả hai lần tính đềugiống nhau và được xác định như sau: Nếu Vbp1>0,6, độ rộng cửa sổ bằng số lần P2

nhỏ nhất sao cho giá trị của nó lớn hơn 120 mẫu Nếu độ rộng này vượt quá 320 mẫuthì nó được chia cho 2 Nếu Vbp1≤0,6, độ rộng cửa sổ là 120 mẫu Cửa sổ thứ nhất cótâm cách 90 mẫu trước mẫu cuối cùng trong khung hiện hành Cửa sổ thứ hai có tâm làmẫu cuối cùng của khung hiện hành Hệ số khuyếch đại Gi ,i=1,2, là giá trị hiệu dụngcủa dãy tín hiệu sn tính theo thang dB theo công thức:

Trong đó L là độ rộng cửa sổ Giá trị 0,01 được đưa vào để không bị lỗi lấylogarit của 0 Nếu hệ số khuyếch đại tính ra nhỏ hơn 0,0… thì lấy giá trị bằng 0,0.Trong quá trình tính toán, ta giả thiết rằng giá trị các mẫu tín hiệu nằm trong khoảng từ-32768 đến 32767

14 Cập nhật cao độ trung bình

Cao độ trung bình trong một thời gian dài được cập nhật bằng thao tác làm mịnđơn giản: Nếu r(P3)>0,8 và G2>30dB thì P3 được đưa vào bộ đệm chứa 3 giá trị cao độ

rõ nhất cho đến hiện tại, pi, i=1,2,3 Ngược lại thì tất cả 3 giá trị cao độ rõ nhất trongbộ đệm được thay đổi để giá trị của nó dịch dần về giá trị cao độ mặc định Pdefault=50mẫu:

(6)

(7)

Trang 11

Giá trị cao độ trung bình Pavg được cập nhật bằng trung bình cộng của 3 giá trịcao độ lưu trong bộ đệm Giá trị này được sử dụng để tính giá trị cuối cùng của cao độtrong các phần trước.

15 Lượng tử hóa các hệ số của bộ lọc dự đoán tuyến tính.

Đầu tiên, từ các hệ số của bộ lọc dự đoán tuyến tính tính ra các tần số có phổvạch (Line Spectral Frequencies – LSFs) Tiếp đó, các tần số này được sắp xếp tăngdần bằng phương pháp nổi bọt, tức kiểm tra tất cả các cặp tần số liên tiếp, nếu có cặpnào không tăng dần thì đổi chỗ 2 tần số này Quá trình này lặp lại cho đến khi dãy tầnsố theo đúng thứ tự Sau đó, các tần số được điều chỉnh để khoảng cách nhỏ nhất giữa

2 tần số liên tiếp fi và fi+1 là di =fi+1 - fi không nhỏ hơn 50Hz như đoạn giả mã dưới đây

Ở đây giả sử các tần số có phổ vạch được tính trong thang Hz, trong các thang khác thìquá trình tính có thể hơi khác Vectơ các tần số phổ vạch f sau đó được lượng tử hóa

sử dụng phương pháp lượng tử hóa vectơ nhiều tầng Bảng tra lượng tử hóa vectơnhiều tầng chứa 4 tầng với số mức ở các tầng là 128,64,64,64 Vectơ sau khi lượng tửhóa f là tổng của 4vectơ ở 4 tầng Ta cần tìm một vectơ trong bảng tra sao cho bìnhphương khoảng cách Ơclit giữa nó và vectơ cần lượng tử hóa là nhỏ nhất

Trong đó, fi là tần số phổ vạch thứ i và P(fi) – nghịch đảo của năng lượng phổcủa bộ lọc dự đoán tuyến tính tại tần số fi Quá trình tính toán vectơ lượng tử là quátrình xấp xỉ dần, dùng phương pháp bình phương cực tiểu Từ vectơ tối ưu tìm được ởmỗi tầng, tính ra vectơ sai số và ở tầng tiếp theo ta lại xấp xỉ vectơ sai số này Vectơtính ra ở bước này sẽ được dùng để tính các biên độ Furie (mục 19)

16 Lượng tử hóa độ cao tiếng nói

Giá trị cuối cùng của độ cao P3 được lượng tử hóa theo thang logarit cơ số 10với bộ lượng tử hóa vô hướng 99 mức các giá trị trong phạm vi từ 20 đến 160 mẫu.Giá trị cao độ được ánh xạ đến bộ từ điển 7 bit Từ mã có tất cả các thành phần đều

(8)

10

Ngày đăng: 26/02/2014, 17:20

HÌNH ẢNH LIÊN QUAN

B ng 1: B ng c p phát s  bit dùng cho các tham s  MELP ảng 1: Bảng cấp phát số bit dùng cho các tham số MELP ảng 1: Bảng cấp phát số bit dùng cho các tham số MELP ấp phát số bit dùng cho các tham số MELP ố bit dùng cho các tham số MELP ố bit dùng cho các  - Tài liệu TIỂU LUẬN MÔN XỬ LÝ TÍN HIỆU NÂNG CAO..“NGHIÊN CỨU MÔ HÌNH MÃ HÓA TIẾNG NÓI MELP” potx
ng 1: B ng c p phát s bit dùng cho các tham s MELP ảng 1: Bảng cấp phát số bit dùng cho các tham số MELP ảng 1: Bảng cấp phát số bit dùng cho các tham số MELP ấp phát số bit dùng cho các tham số MELP ố bit dùng cho các tham số MELP ố bit dùng cho các (Trang 4)

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w