Tài liệu tham khảo Mã hóa âm thanh amr
Trang 1I C M N
L i u tiên c a b n khóa lu n này cho phép em c bày t l i c m n sâu s c
t i Th.S Tr n Ng c H ng, ng i ã t n tình h ng d n, ch b o em trong su t th igian em làm khóa lu n
Em xin chân thành c m n sâu s c t i các th y cô giáo trong Tr ng i h cCông Ngh - HQGHN ã ch b o, d y d và cung c p nh ng ki n th c c b n vàchuyên môn trong su t 4 n m qua và t o u ki n thu n l i em hoàn thành b nkhóa lu n này
Cu i cùng em xin g i l i c m n t i gia ình, b n bè ã nhi t tình giúp và
ng viên em hoàn thành khóa lu n này
Xin chúc th y cô giáo và các b n s c kh e, h nh phúc.
Hà n i, tháng 05 n m 2008
Trang 2TÓM T T N I DUNG
Khóa lu n t t nghi p này trình bày khái quát v ng d ng Adaptive Multi Rate(AMR) nâng cao ch t l ng cu c g i AMR c s d ng trong m ng n tho i tbào, nó cung c p ch t l ng ti ng nói t t nh t v i nh ng giá tr th p nh t v i vi c s
d ng các k thu t ACELP, DTX, VAD và CNG AMR là b mã hóa âm thanh a t c
có th ho t ng 8 t c bit ngu n khác nhau: 12.2, 10.2, 7.95, 7.4, 6.7, 5.9, 5.15 và4.75kbps Không gi ng nh các b mã hóa âm thanh tr c ây trong GSM mà ho t
ng t c c nh và m c b o v l i là h ng s , thì các b mã hóa âm thanhAMR có th thích ng v i m c b o v l i c a i u ki n kênh truy n radio và kênh
u l ng M t h th ng GSM s d ng mã hóa âm thanh AMR có th l a ch n kênhtruy n t i u (bán t c hay toàn t c) và ch mã hóa (t c bit ti ng nói và kênh)
ph i h p t t nh t gi a ch t l ng ti ng nói và dung l ng h th ng
Trang 3C L C
Trang
I C M N 1
TÓM T T N I DUNG 2
NG CÁC T VI T T T VÀ THU T NG 6
CH NG 1: GI I THI U V MÃ HÓA ÂM THANH AMR 8
1.1 Gi i thi u v mã hóa âm thanh trong thông tin di ng 8
1.2 Gi i thi u v mã hóa âm thanh AMR 8
1.3 Miêu t ch c n ng c a AMR trong h th ng GSM 9
1.4 Gi i thi u v b mã hóa âm thanh AMR 10
CH NG 2: THU T TOÁN VÀ CÁC KH I CH C N NG TRONG AMR 13
2.1 Thu t toán d oán tuy n tính kích thích theo mã i s ACELP 13
2.1.1 LPC t ng h p ti ng nói 13
2.1.2 Khuy n ngh G.729 và thu t toán ACELP 14
2.1.3 Phân tích LP và l ng t hóa LSP 16
2.1.4 Tìm b ng mã thích ng và di n t .17
2.1.5 Tìm b ng mã c nh .18
2.1.6 L ng t hóa vector c a các l i 19
2.2 Các ch c n ng chuy n i mã 20
2.2.1 Ch c n ng c a c a các thành ph n audio 20
2.2.2 Chu n b các m u ti ng nói 20
2.2.3 Các nguyên t c c a b mã hóa ti ng nói AMR 20
2.2.4 Nguyên t c c a b gi i mã âm thanh AMR .25
2.2.5 Ch c n ng c a b mã hóa 25
2.2.5.1 Quá trình ti n x lý ( i v i t t c các ch ) 25
2.2.5.2 Phép phân tích d oán và quá trình l ng t 26
2.2.5.3 Tính toán áp ng xung (cho t t c các ch ) 34
2.2.5.4 Tính toán tín hi u m c tiêu (cho t t c các ch ) 34
2.2.5.5 B ng mã thích nghi 35
2.2.5.6 B ng mã i s 37
2.2.5.7 L ng t hóa gia l ng b ng mã thích nghi và c nh 42
Trang 42.2.6 Miêu t ch c n ng c a b gi i mã 46
2.2.6.1 Gi i mã và t ng h p ti ng nói 46
2.2.6.2 Quá trình h u x lý 50
2.2.7 S phân b bit chi ti t c a mã hóa a m c thích nghi 51
2.3 C u trúc khung mã hóa AMR 52
2.3.1 Khuôn d ng khung AMR mã hóa (AMR IF1) 52
2.3.1.1 AMR Header và thông tin b tr AMR 53
2.3.1.2 Khung lõi AMR 55
2.3.2 Thành ph n khung AMR 57
2.4 Ho t ng c a kh i u khi n t c ngu n (SCR) 58
2.4.1 Miêu t các ch c n ng c a SCR 59
2.4.2 Ho t ng c a SCR AMR 59
2.4.2.1 T i bên truy n 59
2.4.2.2 T i bên nh n 63
2.4.3 B u khi n DTX cho h th ng GSM 64
2.4.3.1 Các kh i ch c n ng c a DTX 65
2.4.3.2 T i bên truy n TX 65
2.4.3.3 T i bên nh n RX 68
2.5 Khuôn d ng t p âm thích h p 70
2.5.1 Ch c n ng t i bên truy n TX 70
2.5.1.1 c l ng LSF 71
2.5.1.2 Tính toán n ng l ng khung 72
2.5.1.3 Thay i thu t toán mã hóa trong su t th i gian t o khung SID 72
2.5.2 Ch c n ng t i bên nh n RX 72
2.6 Kh i tách tích c c ti ng nói VAD 74
2.6.1 Ch c n ng c a kh i VAD 74
2.6.2 S kh i và ch c n ng c a t ng kh i c a thu t toán VAD 74
2.6.2.1 Kh i bàn l c và tính toán m c b ng con 75
2.6.2.2 Kh i tách pitch 77
2.6.2.3 Kh i tách âm 78
2.6.2.4 Phân tích tín hi u ph c t ng quan (và b tách) 78
2.6.2.5 Kh i quy t nh VAD 79
Trang 52.7 S che d u l i khi m t khung 80
CH NG 3: NG D NG AMR TRONG VI C NÂNG CAO CH T L NG CU C I C A M NG N THO I T BÀO 82
3.1 o ki m tra ch t l ng tho i khi ng d ng AMR 82
3.1.1 Gi i thi u v tiêu chu n MOS 82
3.1.2 So sánh ch t l ng tho i khi s d ng AMR so v i khi s d ng EFR 83
3.2 ng d ng AMR trong vi c nâng cao ch t l ng tho i m ng MobiFone 86
3.2.1 T ng quan 86
3.2.2 Tri n khai AMR trên m ng vô tuy n 86
3.2.2.1 o ch t l ng ng truy n 86
3.2.2.2 C u hình AMR 89
3.2.3 K t qu o ki m m ng l i sau khi tri n khai AMR 94
3.2.3.1 K t qu o ki m ch s SQI 94
3.2.3.2 T l thi t l p cu c g i thành công 95
3.2.3.3 T l r t cu c g i 96
3.2.3.4 L u l ng kênh i u khi n (lo i tr vi c gán ban u) (ERL) 97
3.2.3.5 T l chuy n giao thành công gi a các cell (%) 98
3.2.3.6 Nh n xét 99
T LU N 100
TÀI LI U THAM KH O 101
Trang 6NG CÁC T VI T T T VÀ THU T NG
sang s
phân thích nghi
nhi u
ng t
c u
Telecommunications Standardization Sector
T ch c vi n thông th
gi i – Tiêu chu n vi n
Trang 7tính
di ng
m ch công c ng
hi uTCH-
AFS
Traffic Channel Adaptive Full rate Speech Kênh l u l ng toàn t c
ti ng nói thích nghiTCH-
AHS
Traffic Channel Adaptive Half rate Speech Kênh l u l ng bán t c
ti ng nói thích nghi
ti ng nói
Trang 8CH NG 1: GI I THI U V MÃ HÓA ÂM THANH AMR
Trong thông tin di ng r ng d i t n có giá tr nh hàng hóa, do ó các b mãhóa ti ng nói óng vai trò quan tr ng không ch v i ch t l ng ti ng nói mà còn ph i
m b o chi m d ng ít b ng t n v i t c bit th p B mã hóa v i t c bit th p chokênh truy n b ng h p làm t ng dung l ng h th ng là yêu c u quan tr ng c a các nhàcung c p d ch v và c chú tr ng nghiên c u c bi t trong thông tin di ng Các
b mã hóa ti ng nói v c b n c chia làm 2 lo i chính là: Mã hóa d ng sóng và mãhóa ngu n (Vocoder)
- Mã hóa d ng sóng: là k thu t mã hóa và gi i mã liên t c bám theo d ng sóng
c a tín hi u am thanh (mà ti ng nói ch là m t ph n trong ó), v nguyên t c chúng
c thi t k c l p v i ngu n âm nên ch t l ng ti ng nói không ph thu c vào các
lo i ngu n tín hi u, ki u mã này có u i m ch ng nhi u t t, k thu t không ph c t p
và r , song h s nén tín hi u không th t s cao, thu c lo i này có PCM, ADPCM,
DM, APC…
- Mã hóa ngu n d a trên s mô ph ng ngu n âm c th ( i t ng chính ây là
ti ng nói c a con ng i c nghiên c u tr c các c tính khai thác các kh n ngnén mã), k thu t này ph c t p, có tr cao, giá thành t song bù l i có h s nén
l n và cho t c bit mã hóa th p
1.2 Gi i thi u v mã hóa âm thanh AMR.
AMR là s k t h p c bi t v i h th ng di ng toàn c u GSM GSM là h
th ng chuy n m ch c xu t phát t Châu Âu vào nh ng n m 1980 và c s d ng
r t nhi u n c Châu Âu Nhi u công ty di ng n c M và nhi u n c khôngthu c Châu Âu c ng s d ng công ngh GSM
AMR là ph ng pháp mã hóa ti ng c phát tri n trên c s CELP i
s (ACELP) và c ti p nh n cho p ng pháp mã hóa ti ng c a GSM vào
m 1998
AMR thích ng v i nhi u lo i kênh truy n khác nhau AMR có th t u
ch nh b ng cách thêm vào các bit giúp s a l i khi u ki n kênh truy n kém,
Trang 9trong khi v n cung c p t ng s bit nh nh t trong u ki n kênh truy n t t.
i u này có ngh a là AMR có nhi u bit có th mã hóa ti ng nói h n là các b mãhóa khác
AMR là b mã hóa âm thanh a t c và nó có th ho t ng 8 t c bit:12.2, 10.2, 7.95, 7.4, 6.7, 5.9, 5.15 hay 4.75 kbps Thêm vào ó, b mã hóa cthi t k cho phép chuy n m ch khung không liên t c b i khung c s gi a các ch khác nhau
dài khung c nh là 20ms trong t t c các ch Kh n ng a t c c b ngcách thay i s l ng bit l ng t cho các thông s trong các subframe
AMR quy nh các công ngh ngo i vi c n thi t cho thông tin di ng Hai tùy
ch n c cung c p tùy ch n là gi i thu t VAD và DTX Thông tin t p âm n n SID
c phát t i m t kho ng th i gian nh t nh cùng v i h s d oán ng n h n vàcông su t khung c l ng t hóa 35 bit Ngoài ra c ng nh ngh a các yêu c u choche d u l i khi x y ra l i
1.3 Miêu t ch c n ng c a AMR trong h th ng GSM
Mã hóa âm thanh AMR bao g m m t t p các ch mã hóa âm thanh t c
c nh cho ho t ng toàn t c và ho t ng bán t c, có kh n ng cung c pchuy n m ch gi a các ch khác nhau tùy thu c vào i u ki n l i truy n M i
ch s cung c p m t m c b o v l i khác nhau qua vi c dành phân ph i
t ng s bit có th (22,8 kbps trong toàn t c và 11,4 kbps trong bán t c) gi a mãhóa ngu n và mã hóa kênh
T c bit th c t c s d ng cho m i khung ti ng nói thì ph thu c vàocác i u ki n t n t i c a kênh truy n Thu t toán thích nghi mã hóa s l a ch n
t c ti ng nói t i u (hay ch mã hóa) nh ch t l ng c a kênh truy n Ch
mã hóa t t nh t s c l a ch n trong i u ki n truy n kém và trong i u
ki n truy n t t thì ch mã hóa s cung c p ch t l ng t t nh t Ch mã hóathích h p c l a ch n tùy thu c vào k t qu o ch t l ng c a kênh truy n
c th c hi n trong MS và trong m ng và thông tin v b ng t n g i qua giao
di n không khí cùng v i d li u
Trang 10Hình 1.1: S hi n th các thông tin chính truy n qua giao di n h th ng.
Theo c hai h ng, các khung d li u ti ng nói c k t h p v i ch s ch
mã hóa c s d ng bên nh n l a ch n úng gi i mã kênh và gi i mã ngu n.Trong m ng, ch s ch mã hóa ph i c g i t i TRAU vì th mà gi i mã ngu nphù h p c l a ch n
kênh truy n, nh n d ng mã hóa t t nh t i v i u ki n truy n ã t n t i và g ithông tin này t i MS qua giao di n không khí
Thích nghi mã hóa theo tuy n xu ng, MS ph i c l ng ch t l ng kênh truy n
và g i thông tin ch t l ng t i m ng, nó có th c ánh x trong m ng v i ch mã
M i link có th s d ng ch mã hóa khác nhau nh ng b t bu c c 2 link ph i
s d ng cùng ch kênh (là toàn t c ho c bán t c)
Ch kênh c l a ch n b i ch c n ng qu n lý tài nguyên vô tuy n c a m ng
1.4 Gi i thi u v b mã hóa âm thanh AMR
B mã hóa ti ng AMR bao g m b mã hóa ti ng a t c, m t b u khi n t c ngu n ph i h p v i b tách tích c c ti ng nói và h th ng t o t p âm thích h p và
ch che ch n l i ch ng l i nh h ng c a truy n l i và m t các gói d li u
Trang 11M t b mã hóa ti ng a t c là m t b n m ch tích h p mã hóa âm thanh v i 8 t c ngu n t 4.75kbps n 12.2kbps, và cho phép ch mã hóa t p âm n n t c th p B
mã hóa ti ng có th chuy n t c c a nó v i khung ti ng nói 20ms trên 1 l nh u khi n.Hình 1.2 mô t các kh i ch c n ng x lý ti ng nói Trong hình này, các c m
k thu t thích h p c ch ra cho m i kh i ch c n ng Trong hình 1.2, các ph n âmthanh bao g m chuy n i t tín hi u t ng t sang tín hi u s và chuy n t tín hi u
s sang tín hi u t ng t , ch ra các b c hoàn thành ti ng nói gi a tín hi u âm thanhvào/ra thi t b ng i s d ng (UE) và giao di n s c a m ng
Hình 1.2.T ng quan các kh i ch c n ng x lý âm thanh.
Trang 12mã hóa AMR.
5) Khung miêu t chèn im l ng SID
6) TX_TYPE, 2 bit, m t trong 2 bit ch s thông tin có ích n u chúng mangthông tin v ti ng nói hay thông tin v SID
7) Các bit thông tin c g i n m ng truy c p 3G
8) Các bit thông tin nh n c t m ng truy c p 3G
9) RX_TYPE, lo i khung nh n c ã c l ng t hóa thành 3 bit
Trong hình 1.2, b mã hóa ti ng lây tín hi u vào nó là 13 bit PCM ng u t b
ph n âm thanh c a UE hay c a m ng, t m ng PSTN 8 bit theo lu t A hay lu t µ cchuy n i thành 13 bit PCM ng u Ti ng c mã hóa t i l i ra b mã hóa là các gói
và c g i t i giao di n c a m ng T i n i nh n thì tín hi u c chuy n ng c l i.Ánh x chi ti t gi a các kh i tín hi u vào là 160 m u ti ng nói theo khuôn
d ng là 13 bit PCM ng u c các kh i mã hóa (trong ó s l ng các bit thì
m u ti ng nói s c khôi ph c l i B ng mã hóa theo d oán tuy n tính kíchthích theo mã i s a t c
M t mã hóa âm thanh AMR c a UE s h tr t t c t c ngu n c cho
b ng 1.1 d i ây
Chú ý:
1) Các khung SID gi nh liên t c c truy n i
2) GSM-EFR là Enhanced Full Rate Speech Mã hóa 3GPP TS 26.090
3) IS-641 là TIA/EIA IS-641 TDMA Enhanced Full Rate Speech Codec
4) PDC-EFR là ARIB 6.7kbps Enhanced Full Rate Speech Codec
Trang 13d ng sóng theo yêu c u Các tham s c a d ng sóng t ng h p c s hóa truy n ithay vì tín hi u th c s Xét hi u qu các k t qu n u quá trình t ng h p chính xáchoàn toàn v i ti n trình t ng t Vì ã có các thông s v ti ng nói, LPC c bi tthích h p v i t ng h p ti ng nói và t o ti ng nói.
Hình 2.1 T ng h p ti ng nói
Hình 2.1 mô t m t quá trình t ng h p ti ng nói bao g m 2 ngu n phát uvào, m t b khu ch i thay i l i, và m t b l c ngang trong vòng h i ti p
l i c a b khu ch i và b l c t ng nhánh c u ch nh nh d ng tính ch t âmthanh (di n t) trên gi i âm t n Nh ng ti ng không có âm c t o b ng n i v ingu n phát nhi u tr ng Nh ng ti ng có âm c n i vào ngu n phát dãy xung n
v i các t n s thích h p v i các cao
N u các b l c có kho ng 10 nhánh l i, và các tham s c thu th pkho ng 10 n 25ms, quá trình t ng h p ti ng nói r t d dàng m c dù có th nó
i gi
Trang 14Hình 2.2 H th ng LPC m ch phát
Hình 2.3 H th ng LPC m ch thu
Xét h th ng phát LPC nh hình 2.2 Các giá tr m u c a ti ng nói u vào
c phân tích tìm ra các tham s t ng h p, toàn b các giá tr ra so sánh v i uvào Các k t qu sai khác c mã hóa theo các giá tr tham s t tín hi u s ctruy n B thu trong hình 2.3 dùng các giá tr tham s và sai s l ng t tái t o l i
d ng sóng âm thanh
T mã LPC hoàn ch nh có kho ng 80 bit - 1 bit chuy n i tr ng h p
có âm ho c không có âm, 6 bit cho cao , 5 bit cho l i khu ch i, 6 bit cho
t ng l i c a 10 nhánh và m t vài bít phát hi n l i Ghi nh n các tham s m i
10 - 25ms t ng ng l y m u t n s 40 – 100Hz, vì th LPC òi h i t c bit kho ng 3000 – 8000bps Vi c gi m áng k t c bit làm cho LPC có kh
ng thay th trong l l c c i ti n ch t l ng c a t ng h p ti ng nói cho truy nthông tho i
2.1.2 Khuy n ngh G.729 và thu t toán ACELP.
ITU-T ã phát hành khuy n ngh G.729 vào n m 1996, c bi t n nh m t b
mã hóa ti ng nói ch t l ng cao, tr th p và t c 8kbps
Thu t toán c d a trên k thu t mã hóa d báo tuy n tính kích thích theo mã
i s ACELP
kh i c a thu t toán ACELP c ch ra hình i ây:
Trang 15Hình 2.4 S kh i G.729
B mã hóa này d a trên m t ki u mã hóa CELP và s d ng m t k thu t t ng
h p phân tích xác nh các vector t o kích thích t t nh t mà làm gi m thi u
c s méo tr ng s c m giác ti ng nói ban u và ti ng nói t o ra b ng ph ngpháp t ng h p
Phân tích d oán tuy n tính LP c th c hi n tr c tiên, và tín hi u ti ngnói c bi u di n b ng các h s d oán tuy n tính ã c tính toán Các h sLPC ã c l ng t hóa c s d ng trong b l c t ng h p c a coder này Skích thích c a b l c này bao g m hai ph n: m t là vector b ng mã thích ng nh mtái t o c u trúc di n t c a âm thanh gi ng nói, và hai là vector b ng mã c nh
nh m tái t o âm thanh câm Hai vector c a b ng mã ã chia t l b i nh ng l iriêng c a chúng xây d ng s kích thích c a b l c t ng h p Ti ng nói ã t ng
h p c t o và có méo t i thi u liên quan n ti ng nói g c và các vector b ng
mã ã tìm là nh ng cái t t nh t
Thông th ng, s ph c t p tính toán thu t toán cho CELP là khá l n, nh t là khitìm ki m kích thích t t nh t B i v y, thu t toán ACELP s d ng các k thu t mã hóa
và c u trúc b ng mã c bi t ó là h t nhân c a thu t toán nh sau: phân tích LP và
ng t hóa LSP s s ng l ng t hóa vector v i d báo trung bình d ch chuy n liênkhung; tìm ki m di n t v i các chi n l c hai t ng bao g m phân tích chu k óng
Trang 16Ti ng nói ã qua c a s s(n) c s d ng tính toán các h s LPC LPC thu
c sau ó c chuy n i sang các c p ph v ch LSP cho m c ích l ng t hóavector, các tham s LSP t ng ng liên quan n khuôn m u c a hình bao ph ti ngnói và mô t tr c ti p nh ph ng n k Nh th , các sai s c a tham s trên t n sônào ó ch nh h ng ph ti ng nói xung quanh m t n s này và có nh h ng m t
ít lên các t n s khác Trong khi các h s LPC không có s liên quan t ng ng nh
th , các tham s LSP có th làm t ng hi u qu vector c l ng t hóa và n i suy
m t cách t ng i Theo các thu c tính c m giác c bi t c a thính giác con ng i,các tham s LSP có quan h v i s phân ph i t n s nh y c m c c p phát nhi u bit
n, trong khi các tham s khác t ng ng v i s phân ph i t n s ít nh y c m c
Trang 17c p phát ít bit gi m t ng s bit mã hóa.
N u chính xác c a l ng t hóa LSP không v a , ch t l ng c a ti ng nói
gi i mã s gi m áng k Nh th m t c a b ng mã c l n c c n n và s ph c t ptìm ki m và các bit t ng lên ng th i Trong xem xét trên, l ng t hóa vector hai
t ng v i d báo MA th t chuy n m ch l n th 4 c s d ng gi m c c a b ng
mã và ph c t p v i vi c c p phát bit ít h n T ng th nh t s d ng l ng t hóavector 10 chi u v i 7 bit, và t ng th 2 là l ng t hóa vector tách 10 bit v i hai b ng
mã hóa 5 chi u H n n a, 1 bit c phân ph i cho s l a ch n các h s d báo MA
2.1.4 Tìm b ng mã thích ng và di n t.
B mã hóa mang n nhi u m c ph c t p trong tính toán, c bi t là khi tìm
ki m b ng mã thích ng và b ng mã c nh V i m c ích n gi n hóa, m t l i vàohai t ng c a ra trong tìm ki m b ng mã thích ng và các th t c c ch ratrong hình d i ây:
t ng th nh t, phân tích chu k m c c l ng m i l n cho t ng khung10ms M c dù s tìm ki m là n gi n và tr di n t c l ng t c là r t thô,
th t c là thi t y u thu h p ph m vi tìm ki m và n gi n h n nhi u s ph c t p khitìm di n t
Nh th ng biên c a chu k óng tìm ki m di n t gi i h n Xung quanh tr
di n t chu k m , phân tích chu k óng c th c hi n cho m i subframe 5ms v iphân gi i 1/3 trong kho ng 191 842
3 + 3 và s nguyên duy nh t trong kho ng 85 ÷ 143
Và tr t i u c xác nh b i t i thi u hóa trung bình bình ph ng sai s tr ng s
gi a ti ng nói g c và ti ng nói khôi ph c u này t c b i c c i hóa s h ngsau:
Trang 180 39
0
( ) ( ) ( )
( ) ( )
k n
tmax, nó c c p nh t s d ng quan h quy:
yk(n) = yk-1(n-1) + u(-k)h(n) v i n = 39,…,0
v i h(n) là áp ng xung c a b l c t ng h p tr ng s
Các tham s b ng mã thích ng là các ch s t ng ng v i tr và l i nào ó.Trong l i vào b ng mã thích ng th c thi b l c di n t kích thích c l p các
tr ít h n dài khung con Vi c s d ng các tr nh t o cho quá trình x lý này trgiá t trong quá trình tìm t ng Do ó kích thích v t quá th i gian di n t c kéodài b i ph n d LP trong quá trình tìm ki m Th t c này là n gi n h n và cho th y
nó t o ra các k t qu gi ng nhau sau khi so v i vi c s d ng b ng mã thích ng cho
Tìm ki m b ng mã c nh c ng c th c hi n trên m i subframe và d i công
th c o sai s tr ng s trung bình bình ph ng N u Ck là vector b ng mã c nh th
k, thì vector t t nh t c tìm ki m b i vi c tìm th y biên và v trí b n xung 0 cu
nó mà c c i hóa theo phân s sau:
Trang 192 2
0 1
( ( ) ( ))k
d n c n C
kc
n a b i thi t l p m t ch ng trình ng ng tính tr c và m t liên k t u khi n tr ckhi vòa tìm ki m chu k sau cùng
2.1.6 ng t hóa vector c a các l i
K ti p là các l i l ng t hóa vector cho óng góp b ng mã thích ng và c
nh 7 bit và d báo MA c áp d ng i v i l i b ng mã c nh L ng t hóanói chung này cung c p m t s ti t ki m kho ng 2 bit so v i l ng t hóa vô h ng
D a trên nh ng so sánh không chính th c, cho th y r ng l ng t hóa này không a ra
b t k gi m sút áng k c a ch t l ng ti ng nói so v i các l i không l ng t hóa
l i b ng mã thích ng và h s hi u ch nh c a l i b ng mã c nh c
ng t hóa vector B ng mã l ng hóa t vector s d ng m t c u trúc liên h p 2
t ng M i t ng g m b ng mã 2 chi u và t ng u tiêng s d ng b ng mã GA v i 3 bit,
và t ng hai bao g m m t b ng mã GB 4 bit Thành ph n u tiên c a t ng vector trong
m i b ng mã mô t l i b ng mã thích ng ã l ng t hóa và thành ph n th 2 mô
Trang 20t t nh t c a hai ch m c t i thi u hóa sai s trung bình bình ph ng.
- Tai nghe ho c loa
Trong thi t b u cu i, ch c n ng A/D có th thu c:
- Thông qua chuy n i tr c ti p PCM 13 bit u
- Ho c thông qua chuy n i hình th c lu t A ho c lu t 8 bit, d a trêncodec/b l c lu t A ho c lu t chu n d a trên gi i thi u c a ITU-T G.711 và G.714,tuân theo phép chuy n i 8 bit sang 13 bit
2.2.3 Các nguyên t c c a b mã hóa ti ng nói AMR
Mã hóa AMR bao g m 8 mã hóa ngu n v i các t c bit t 4,75 n 12,2 kbps
Mã hóa d a trên mô hình mã hóa d báo tuy n tính c kích thích mã CELP
S d báo tuy n tính b c 10 hay b l c t ng h p ng n h n c áp d ng nh sau:
Trang 21( ) ( ) 1
m i i i
, i=1,…,m là các thông s ã c l ng t hóa tuy n tính và m=10 là b c
c a b l c d báo B l c t ng h p pitch dài h n nh sau:
Trong mô hình này, tín hi u kích thích t i u vào c a b l c t ng h p ng n h n
LP c xây d ng thông qua vi c thêm vào 2 vector kích thích t các b ng mã c nh
ho c thích nghi Vi c t ng h p ti ng nói c th c hi n thông qua vi c cung c p 2vector ã c l a ch n h p lý t các b ng mã này thông qua b l c ng n h n Chu ikích thích t i u trong 1 b ng mã c l a ch n s d ng th t c tìm ki m “phân tíchthông qua t ng h p” ó l i gi a ti ng nói ban u và sau khi ã t ng h p c c c
ti u hóa d a trên o bi n d ng có c m giác
B l c giác quan c bi t c s d ng trong k thu t tìm ki m “phân tích thôngqua t ng h p”nh sau:
Trang 22v i A(z) là b l c ch a c l ng t hóa và 0 < γ 2<γ 1< 1 là các nhân t cótính tr c giác Các giá tr γ 1 =0,9 (cho ch 12,2 và 10,2 kbps) hay γ 1=0,94 cho t t
c các ch và γ 2=0,6 c s d ng Tr ng s c a b l c s d ng các thông s LPkhông c l ng t hóa
B mã hóa ho t ng trên các khung ti ng nói v i 20ms t ng ng v i 160 m u
t i t c l y m u là 8000 m u/giây V i m i 160 m u ti ng nói, tín hi u ti ng nói
c phân tích rút ra các tham s c a mô hình CELP (các h s c a b l c LP, các
ch s và t ng thêm c a b ng mã c nh và thích nghi) Nh ng tham s này c
mã hóa và truy n i T i b gi i mã, nh ng tham s này s c gi i mã và ti ng nói
c t ng h p thông qua vi c l c các tín hi u kích thích ã c xây d ng l i thôngqua b l c t ng h p LP
Dòng tín hi u t i b mã hóa nh trên hình d i ây:
Trang 23S phân tích LP c th c thi hành 2 l n trên 1 khung v i ch 12.2kbit/s và 1
l n cho các ch khác V i ch 12.2kbit/s, 2 t p h p tham s LP c chuy n isang các c p ph tuy n (LSP) và c l ng t hóa ng th i s d ng s l ng t hóa
ma tr n tách (SMQ) 38bits V i các ch khác, t p n các tham s LP c chuy n
i sang các c p và vector ph tuy n l ng t hóa thông qua s l ng t hóa vectortách Khung ti ng nói c chia thành 4 subframe v i m i frame là 5ms (t ng ng
v i 40 m u) Các tham s b ng mã c nh và thích nghi c truy n theo m isubframe Các tham s c l ng t hóa và ch a c l ng t hóa ho c các phiên
b n n i suy c s dùng tùy vào subframe M t tr pitch vòng l p m c c
ng trong m i subframe khác (ngo i tr các ch 5.15 và 4.75kbit/s c th c
hi n 1 l n trên m i frame) d a trên tín hi u ti ng nói c tr ng s giác quan
Các thao tác c l p l i cho m i subframe:
Tín hi u ích x(n) c tính toán thông qua quá trình l c th ng d LP qua b l c
d ng hàm m c tiêu x(n) và áp ng xung h(n), thông qua vi c tìm ki m xung quanh
tr pitch l p óng Pitch phân s kho ng 1/6 ho c 1/3 c a 1 phân gi i m u (ph
Tín hi u m c tiêu x(n) c c p nh t qua vi c b i quá trình gom b ng mã thíchnghi (vector mã thích nghi ã l c), và m c tiêu m i x2(n) c s d ng trong vi c tìm
ki m b ng mã i s c nh ( tìm ra s i m i t i u)
S t ng thêm c a b ng mã c nh và thích nghi là nh l ng vô h ng v i 4 và
5 bít t ng ng ho c vector nh l ng v i 6-7 bit (v i d báo trung bình ng (MA)
áp d ng cho s t ng b ng mã c nh)
Cu i cùng, các b nh c a b l c c c p nh t (thông qua tín hi u kích thích ã
nh tr c) cho vi c tìm ki m tín hi u ích trong subframe k ti p
S phân b bit c a các ch mã hóa AMR nh b ng sau:
Trang 24B ng 2.2: Phân b bit trong các ch AMR
1 st sub- 2 nd sub- 3 rd sub- 4 th sub- Total per
Trang 25Trong m i khung ti ng nói 20 ms, 95, 103, 118, 134, 148, 159, 204 ho c 244 bits
s c t o ra, t ng ng v i t c bit 4.75, 5.15, 5.90, 6.70, 7.40, 7.95, 10.2 hay12.2 kbps L u ý là các bít quan tr ng nh t (MSB) luôn luôn c g i i tr c tiên
2.2.4 Nguyên t c c a b gi i mã âm thanh AMR.
Bi u lu ng tín hi u t i b gi i mã nh trong hình d i ây:
T i b gi i mã, d a trên ch ã ch n, các ch s ã truy n s c trích ra t
lu ng bit nh n c Các ch s c gi i mã thu c các tham s c a b mã hóa
t i m i khung truy n i Nh ng tham s này là các vector LSP, các tr pitch m t
ph n, các codevector i m i, và t ng t c pitch và t ng t c i m i Các vectorLSP c chuy n i thành các h s c a b l c LP và n i suy ra thu c các b l c
Trang 26Gi m t l tín hi u bao g m quá trình chia tín hi u vào b i s m 2 gi m s có
th tràn trong thi hành i m c nh
B l c thông cao n n ng a các thành ph n t n s th p không mong i M t b
l c t n s c t 80 Hz c s d ng và c cho b i công th c sau:
S t t ng quan c a c a s ti ng nói c chuy n i thành các h s LP thôngqua thu t toán Levinson-Durbin Sau ó các h s LP s c ánh x vào mi n c p
ph tuy n cho các m c ích ng t hóa và phép n i suy Các h s l c ã n i suy
ng t hóa và ch a c l ng t hóa s c chuy n i ng c tr l i thành các h
s l c LP ( c u trúc lên các b l c t ng h p và ph thêm c bi t t i m i subframe)
D báo ng n h n, ho c d báo tuy n tính, phép phân tích c thi hành m t l n trên
m i khung ti ng nói s d ng phép ti p c n t ng quan t ng v i các c a s b t i
x ng 30ms M t d báo c a 40 m u s c áp d ng trong tính toán t ng quan t ng.Các t ng quan t ng c a c a s ti ng nói s c chuy n i thành các h s
LP thông qua thu t toán Levinson-durbin Sau ó các h s này s c ánh x t i
mi n c p ph tuy n cho các m c ích l ng t hóa và phép n i suy Các h s l c ã
n i suy l ng t hóa và ch a l ng t hóa s c chuy n i ng c thành các h s
l c LP ( c u trúc thành các b l c t ng h p và có tr ng s t i m i subframe)
2.2.5.2.1 Phân c a s và tính toán t ng quan t ng
Phép phân tích LP c thi hành 2 l n trên m i frame s d ng 2 c a s b t
i x ng khác nhau C a s u tiên có t tr ng t p chung vào 2 subframe và nó
Trang 27bao g m 2 n a c a c a s Hamming có các kích c khác nhau C a s c cho
ph n th 2 là ¼ c a 1 vòng tròn hàm cosine C a s c cho nh sau:
Trang 28T t ng quan c a c a s ti ng nói s’(n), n=0,…,239 và c tính toán b i:
2 1
v i f0=60 Hz là tri n khai b ng thông r ng và fs=8000Hz là t n s l y m u H n
th n a, rac(0) c nhân v i nhân t t ng quan nhi u tr ng 1.0001 t ng ng v inhi u sàn -40 dB
Phép phân tích LP c thi hành m i l n trên m i frame có s d ng c a s b t
i x ng C a s có tr ng s t p chung t i 4 subframe và bao g m 2 ph n: Ph n th
nh t là 1 n a c a c a s Hamming và ph n th 2 là ¼ c a chu trình hàm cosin C a
s c cho d i ây v i các giá tr L1=200 và L2=40 c s d ng:
2 1
Trang 292.2.5.2.2 Thu t toán Levinson-Durbin algorithm (cho t t c các ch )
S d ng t t ng quan s a i r’ac(0)= 1.0001 rac(0) và r’ac(k)=rac(k)wlag(k),k=1,…10 và c s d ng thu c các h s b l c LP d ng tr c ti p ak,k=1,…,10 qua vi c gi i quy t t p các ph ng trình sau:
l i sang mi n h s b l c LP s c di n t trong m c sau
2.2.5.2.3 Phép chuy n i LP sang LSP (cho t t c các ch )
Các h s b l c LP ak, k =1,…,10 c bi n i sang bi u di n c p ph tuy n(LSP) cho m c ích l ng t hóa và phép n i suy V i 1 b l c LP b c 10, các LSP
Trang 30F1(z) = '
1( )
F z /(1+z-1)và
Khi c 2 a th c F1 và F2 là i x ng thì ch có duy nh t 5 h s u tiên c a
m i a th c là c n thi t cho tính toán Các h s c a nh ng a th c này thu cthông qua các quan h qui (v i i = 0 n 4):
F2(z) Trong ph ng th c này các nghi m s thu c tr c ti p trong mi n cosin {qi}.Các a th c F1(z) và F2(z) c c ng t i z=e có th vi t nh sau:
F( ) = 2–j5 C(x)
Trang 31C(x) = x 1- λ 2 + f(5)/2;
v i các giá tr kh i t o là λ 5=1 và λ 6=0
2.2.5.2.4 Phép chuy n i LSP sang LP (cho t t c các ch )
Khi các LSP c l ng t hóa và n i suy, chúng s c bi n i ng c l i vào
mi n h s LP {ak} Phép bi n i vào mi n LP c th c hi n nh sau Các h s c a
F1(z) và F2(z) d a vào vi c khai tri n các ph ng trình (1) và (2) và bi t tr c các LSP
ng t hóa và n i suy qi, i=1, 10 H th c qui sau dùng tính toán hàm f1(i):for i=1 to 5
f1’(i) = f1(i) + f1(i-1), i=1,…,5
f2’(i) = f2(i) – f2(i-1), i=1,…,5
Cu i cùng các h s c tìm b i:
Trang 32V i fi là các t n s ph tuy n (LSF) trong kho ng [0,4000] Hz và fs = 8000 là t n
s l y m u Cho tr c vector LSF v i f t =[f f1 2 f10], v i t là kí hi u chuy n v
Áp d ng d báo MA b c 1, và 2 vector bù LSF c nh l ng ng th i s
d ng l ng t hóa ma tr n chia (SMQ) S d báo và s l ng t hóa c thi hành
nh sau V i z(1)(n) và z(2)(n) là kí hi u các vector LSF ã lo i b trung t i frame n.Các vector bù d báo r(1)(n) và r(2)(n) c cho nh sau:
Hai vector d LSF r(1) và r(2) c nh l ng ng th i s d ng phép l ng t hóa
ma tr n chia (SMQ).Ma tr n (r(1)r(2)) c chia nh thành 5 ma tr n nh kích th c 2 x
2 (m i vector có 2 ph n t ) Ch ng h n, ma tr n con u tiên bao g m các ph n t r1(1),
r2(1), r1(2) và r2(2) 5 Ma tr n con c l ng t hóa t ng ng v i 7, 8, 8+1, 8 và 6 bit
Ma tr n con th 3 s d ng b ng mã d u 256 u vào (8 bit ch s c ng v i 1 bít d u)
Trang 33o bi n d ng LSP có t tr ng c dùng trong quá trình l ng t hóa.Thông th ng, v i m t vector LSP u vào f và 1 vector l ng t hóa t i m k, k
f
∧,quá trình l ng t hóa c ti n hành thông qua vi c tìm ki m ch s k làm t i ti uhóa bi u th c:
2 10
Áp d ng m t d báo MA b c nh t, và vector ph n d LSF c l ng t hóa s
d ng phép l ng t hóa vector chia S d báo và l ng t hóa c thi hành nh sau
V i Z(n) là ký hi u c a các Vector LSF ã kh trung bình t i frame n Các vector ph n
Trang 34ng t hóa t ng ng v i 7 – 9 bits nh trong b ng d i ây:
o m c bi n d ng LSP có t tr ng c a ph ng trình (4) v i ph ng trình (5)
c áp d ng trong quá trình l ng t hóa
2.2.5.3 Tính toán áp ng xung (cho t t c các ch )
áp ng xung, h(n) c a b l c t ng h p c tính toán cho m i subframe áp
ng xung này c n thi t cho vi c tìm ki m các b ng mã thích nghi và c nh áp ngxung h(n) c tính toán b ng cách l c vector các h s c a b l c A(z/ )γ1 m r ng
2.2.5.4 Tính toán tín hi u m c tiêu (cho t t c các ch )
Tín hi u m c tiêu cho vi c tìm ki m b ng mã thích nghi th ng c tính toán
A (z)
∧ và b l c o t tr ng
2
A(z/ 1) A(z/ )
γ
γ Sau khi xác nh c s kích thích dành chosubframe, các tr ng thái g c c a các b l c này s c c p nh t b ng thông qua quátrình l c s khác nhau gi a s d và s kích thích LP
Tín hi u d resLP(n) là c n thi t cho vi c tìm ki m vector m c tiêu c ng cdùng trong vi c tìm ki m b ng mã thích nghi m r ng b m kích thích ã qua
Vi c này s n gi n hóa th t c tìm ki m b ng mã thích nghi l y ra các tr nh
Trang 35n kích th c subframe là 40 s c nói rõ trong m c ti p theo Ph n d LP ccho b i:
10 LP
Tìm ki m b ng mã thích nghi c th c hi n trên c s m i subframe Bao g m
vi c thi hành tìm ki m cao vòng l p óng, và sau ó tính toán các vector mã thíchnghi thông qua vi c n i suy kích thích quá kh t i tr cao c l a ch n 1 ph n.Các tham s b ng mã thích nghi (hay các tham s cao) là tr và m c t ng
c a b l c cao Trong ti p c n b ng mã thích nghi thi hành b l c cao, skích thích c l p l i có các tr nh h n dài c a subframe Trong b c tìm
ki m, s kích thích c m r ng thông qua ph n d LP n gi n vi c tìm ki mvòng l p óng
Trong subframe th nh t và th 3, m t tr cao m t ph n c dùng v i phân
gi i: 1/6 trong d i [173/6, 943/6] và các s nguyên ch có trong d i [95,143] V i cácsubframe th 2 và th 4, m t gi i cao 1/6 luôn c s d ng trong d i [T1– 53/6,
T1 + 43/6] v i T1 là s nguyên g n nh t v i tr cao m t ph n c a subframe tr c
nh ã nói trên tr cao c mã hóa 9 bit trong subframe th 1 và 3 và tr
ng i c a các subframe khác c mã hóa 6 bit
Tìm ki m cao l p m c th c hi n thông qua vi c c c ti u hóa l i t tr ngbình ph ng trung bình gi a ti ng nói g c và ti ng nói ã c t ng h p Thu c
k t qu này thông qua c c i hóa s h ng sau:
39 0 39 0
( ) ( ) ( )
( ) ( )
k n
Trang 36V i x(n) là tín hi u m c tiêu và yk(n)là kích thích ã l c quá kh t i tr k(kích thích quá kh i kèm theo h(n)) L u ý là d i tìm ki m c gi i h n xungquanh cao l p m nh trên ã gi i thích.
Hàm cu n yk(n) c tính toán cho tr u tiên tmin trong d i tìm ki m, và v icác tr khác trong d i tìm ki m k= tmin+1,…, tmaxs c c p nh t thông quan h th c qui sau:
m c ích t o cho h th c trong ph ng trình (7) có hi u l c v i t t c các tr Khi tr cao s nguyên t i u c xác nh, các phân sô -3/6 t i 3/6 v i b c
là 1/6 xung quanh s nguyên s c ki m tra Tìm ki m tr phân s c th c hi nthông vi c n i suy s t ng quan chu n hóa trong ph ng trình (7) và tìm ki m c c
i c a nó Quá trình n i suy c th c hi n s d ng b l c FIR b24 d a trên hàm ssin(x)/x có c a s Hamming b ch t t i ±23 và c m vào các s 0 t i ±24 … B
l c có t n s c t (-3 db) t i t n s 3600 Hz trong kh p mi n ã l y m u Thu c cácgiá tr n i suy c a R(k) cho các phân s -3/6 t i 3/6 thông qua công th c n i suy sau:
Trang 37M c t ng c a b ng mã thích nghi c o b ng:
39
0 39
0
( ) ( ) ( ) ( )
n
p
n
x n y n g
M c t ng b ng mã thích nghi ã c tính toán c l ng t hóa s d ng phép
ng t hóa vô h ng không ng d ng trong d i [0.0,1.2]
ng t cho các ch còn l i
2.2.5.5.2 i u ch nh m c t ng b ng mã thích nghi (t t c các ch )
M c t ng b ng mã thích nghi trung bình c tính toán n u LSP_flag c thi t
l p và m c t ng b ng mã thích nghi không l ng t hóa v t tr i kh i ng ng m c
Trang 38Trong b ng mã này, vector i m i ch a 10 xung khác 0 T t c các xung có th
có biên +1 ho c -1 40 V trí trong subframe c chia làm 5 ng, v i m i ng
ch a 2 xung, nh trong b ng d i ây:
C 2 xung t trong m t ng s c mã hóa 6 bit (t ng 30 bit, 3 bit cho v trí
c a m i xung), và d u c a xung u tiên c mã hóa 1 bit (t ng 5 bit)
V i 2 xung trong cùng 1 track, ch c n 1 bít d u Bit d u này là d u c a xung utiên D u c a xung th 2 ph thu c vào v trí t ng i c a nó v i xung th nh t N u
v trí c a xung th 2 nh h n, thì s có d u ng c v i d u c a xung th 1, ng c l i s
có cùng d u v i xung th 1
T t c v trí xung 3-bit c mã hóa Gray c i thi n kh n ng ch ng ch u các
l i b ng t n u này d n n c n t i 35 bit cho mã i s
Trang 39B ng 2.7: V trí các xung trong b ng mã i s cho ch 6,70 kbps
C n 1 bit mã hóa t p con c s d ng Hai v trí xung c mã hóa 3 bit cho
m i v trí (t ng 6 bit), và d u c a m i xung c mã hóa 1 bit (c n t i 2 bit t t c ).Ngh a là c n t i 9 bit cho mã i s
Trang 402.2.5.6.2 Tìm ki m b ng mã i s
B ng mã i s c tìm ki m thông qua vi c c c ti u hóa l i bình ph ng trungbình gi a ti ng nói u vào có t tr ng v i ti ng nói ã t ng h p có t tr ng Tín hi u
m c tiêu c dùng trong tìm ki m cao l p óng c c p nh t qua phép tr i
ph n góp thêm c a b ng mã thích nghi Nh sau:
mã thích nghi ã l ng t hóa N u ck là vector mã i s t i ch s k, thì mã i s
c tìm thông qua vi c c c i hóa s h ng sau:
( )2 ( )t 2
k k
d c C
A
vói d= Htx2 là s t ng quan gi a tín hi u m c tiêu và áp ng xung h(n), H là
ma tr n giao Toepliz tam giác b c th p v i ng chéo h(0) và các ng chéo b c
th p h(1), h(39) và = HtH là ma tr n các t ng quan c a h(n) Vector d ( ích ã
c l c ng c) và ma tr n c tính toán tr c tìm ki m b ng mã Các thành
ph n c a vector d c tính b i:
39 2