TịMăT TăLU NăVĔN σghiênăc uănh năd ngăti ngănóiăđưăđ căcácăn cătrênăth ăgi iăth căhi nă r tănhi uănĕmăquaăvƠăcǜngăđưăcóănh ngăthƠnhăcôngănh tăđ nh.ă ăVi tăσamăcǜngăcóănhi uăcôngătrìnhăng
C ăS ăX ăLụăTệσăHI UăS
Phépăbi năđ iăt năs ăliênăt c
Bi năđ iăFourierăc aăm tătínăhi uăx(n)ăđ căđ nhănghƿaănh ăsau:
Vìăe jω = cosω + jsinωăătu năhoƠnăv iăchuăkỳă2π,ădoăv yăkhiăth ăhi năX(e jω )ă taăchỉăc năth ăhi năv iăd iăt ă0ăđ nă2πăho căt ă-πăđ năπăr iăl yătu năhoƠn.
+ăBi uădi nătheoăph năth căph nă oăRe,ăIm
� = ∣∣ � ∣∣ arg[ � ] ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.12) +ăBi uădi nătheoăđ ăl năvƠăpha: Đ ăl năcóăth ăl yăgiáătr ăơmăvƠăd ng.
S ăt năt iăc aăbi năđ iăFourier:ăCĕnăc ăvƠoăcácătínhăch tăh iăt ăc aăchu iăvƠă s ăánhăx ăđ yăđ ăt ămi năth iăgianăr iăr cănăsangămi năt năs ăωă(t călƠăkhiăsangă mi năt năs ăω,ăchỉăt năt iăbi năωăch ăkhôngăt năt iăbi năn),ătaăcó:
Bi năđ iăFourierăc aăm tădưyăx(n)ăs ăt năt iăn uăvƠăchỉăn u:
Biến đổi Fourier ngược (IFT: Inverse Fourier Transform):
Bi năđ iăFourierăng căc aăph ătínăhi uăXăeăjωăđ căđ nhănghƿaănh ăsau:
= � ∫ −� � � � �ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.14) ăđơyăbi năđ iăFourierăng căgiúpătaăxácăđ nhăđ căx(n)ăt ăX(e jω )ă.
Bảng 2.1 Các tính chất của biến đổi Fourier
=−∞ ax 1 ( n ) + bx 2 ( n )ă;ă(a,ăb:ăhằngă s ) aX 1 ( e jω ) + bX 2 ( e jω ) x ( n − n 0 ) − � � x(n)ă lƠă th că (tínhă ch tă đ iă x ng)
2.1.2.2 Bi năđ iăZ: Đ nhănghƿa:ăBi năđ iăzăc aăm tădưyăx(n)ăđ căđ nhănghƿaănh ăsau:
= ∑ ∞ =−∞ − ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.15) Đ nhănghƿaătrênăcònăđ căg iălƠăbi năđ iăzăhaiăphía.
Taăs ăcóăbi năđ iăzăm tăphíaăn uăthayăđ iăc nănăch yăt ă0ăđ nă+∞:
= ∑ ∞ = − ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.16) ăđơyătaăph iăth yăđ căzălƠăm tăbi năs ăph căđ căbi uădi nătheoă2ăd ng: +ăBi uădi nătheoăph năth c,ăph nă oăRe[z],ăIm[z] ză=ăRe[z]ă+ăj.Im[z]ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.17)
Hình 2.6 Biểu diễn theo phần thực phần ảo
+ăBi uădi nătheoăt aăđ ăc c:
= � = cos� + sin� = cos� + sin� = ℜ[ ] + ℑ[ ]ăăăăăăăă(2.18)
Hình 2.7 Biểu diễn Z trên mặt phẳng phức
-ăTr ngăh păđ căbi t:ăză=ără=ă1ă,ătaăcóăvòngătrònăđ năv
Hình 2.8 Vòng tròn đơn vị
Mi năh iăt ăc aăbi năđ iăz:ăT păh păt tăc ăcácăgiáătr ăc aăzămƠăt iăđóăchu i
= ∑ ∞ =−∞ − ă ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.19) h iăt ăđ căg iălƠămi năh iăt ăc aăbi năđ iăz.ăKỦăhi uăRCă(Region of Convergence).
Biến đổi z ngược (IZT: Inverse Z Transform):
[ ] Bi năđ iăzăng căđ căđ nhănghƿaănh ăsau:
∮ -ăĐ ngăcongăkínăđiăquaăg căt aăđ ăTíchăphơnăđ ngătheoăchi uăd ng.
Bảng 2.2 Các tính chất của biến đổi Z
=−∞ ax 1 (n) + bx 2 (n)ă;ăa,ăbălƠăhằngăs aX 1 (z) + bX 2 (z) x(n-n 0 ) − a n x(n) X(a -1 z) nx(n)
2.1.2.3 Quanăhệăgi aăbi năđ iăFourierăvƠăbi năđ iăZ
Taăth y,ătheoăđ nhănghƿaăc aăbi năđ iăz:
M tăkhácăzălƠăm tăbi năs ăph căvƠăđ căbi uădi nătrongăm tăphẳngăph că theoăto ăđ ăc cănh ăsau:ăz=r.e jω σ uăchúngătaăđánhăgiáăbi năđ iăZătrênăvòngătrònăđ năv ă(r=1),ătaăcó:ă
Hình 2.9 Thực hiện biến đổi z trên vòng tròn đơn vị σh ăv y,ătaărútăraăm tăs ănh năxét:
-ăBi năđ iăFourierăchínhălƠăbi năđ iăzăđ căth căhi nătrênăvòngătrònăđ năv
-ăBi năđ iăFourierăchỉălƠătr ngăh păriêngăc aăbi năđ iăz.
-ăChúngătaăcóăth ătìmăbi năđ iăFourierăt ăbi năđ iăZăbằngăcáchăđánhăgiáăZTă trênăvòngătrònăđ năv ăv iăđi uăki năvòngătrònăđ năv ăph iănằmătrongămi năh iăt ăc aă bi năđ iăZ.
Phépăbi năđ iăt năs ăr iăr c
2.1.3.1 Bi nă đ iă Fourieră r iă r că (Discreteă Fourieră Transformă -ă DFT): σ uăm tătínăhi uăxσ(n)ătu năhoƠnăv iăchuăkỳăσăthì: xσ(n)ă=ăxσ(n+σ)ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.23)
Bi nă đ iă Fourieră r iă r că c aă m tă dưyă tu nă hoƠnă xσ(n)ă cóă chuă kỳă σă đ că đ nhănghƿaănh ăsau:
= ÷ − x(n)ălƠădưyătu năhoƠnăchuăkỳăσănênănóăth aămưn:ăx(n)ă=ăx(nă+ălσ) Đ tă = − � = − � ăăăăăăăăăăăăăăăăăă − = � = � ăăăăăăă = − � ; − = � ;ă Theoăcáchăđ tănh ătrênăthìăbi năđ iăFourierăr iăr căđ iăv iădưyătu năhoƠnă chuăkỳăσăđ căvi tăl iănh ăsau:
Bi năđ iăFourierăr iăr căng că(IDFT):
Bảng 2.3 Tính chất của DFT đối với dãy tuần hoàn có chu kỳ N
Bi năđ iăFourierănhanhă-ăFFTă(FastăFourierăTransform)ălƠăthu tătoánăr tăhi uă qu ăđ ătínhăDFTăc aăm tăchu iăs ă uăđi mălƠă ăch ănhi uătínhătoánăđ căl păl iădoă tínhătu năhoƠnăc aăs ăh ngăFourieră − � ăD ngăc aăDFTălƠ:
= ∑ = − ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.28) TaăcóăW(σ+qσ)(k+rσ)ă=ăW nk ăv iăm iăq,ărănguyênădoătínhătu năhoƠnăc aăs ăh ngă Fourier.ăTáchăDFTăthƠnhă2ăph n:
Chỉă s ă d iă σă c aă s ă h ngă Fourieră bi uă di nă kíchă th că c aă chu i.ă σ uă chúngătaăbi uădi năthƠnhăph năch năc aăchu iăs ăx(n)ăbằngăxevăvƠăthƠnhăph năl ălƠă xodăthìăph ngătrìnhăcóăth ăvi tăl i:
= ăăăăăăăăăăăăăăăăăăăăăăă(2.30) Taăcóăhaiăbi uăth căDFT,ădoăđóăcóăth ăvi tă:
Chỉăs ăkăch yăđ năσ-1ănh ngădoăs ăd ngătínhăchuăkỳăc aăhƠmăch năvƠăhƠmă l ănênăchỉăc nătínhăDFTăσ/2ăđi măđ ăcóăđ căgiáătr ăc aăX(k).
Ti păt căchiaăDFTăk tăqu ăthƠnhăhaiăn aăchẳnăvƠăl ăchoăđ năkhiăchỉăcònăph iă tínhăhaiăđi măDFT.
� − � ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.33) Đ iăv iă2ăđi măDFTănƠyăchỉăc năphépăc ngăvƠătr ămƠăkhôngăc năphépănhơn.ă Đ ătínhătoƠnăb ăDFT,ăchúngătaănhơnă2ăđi măDFTăv iăcácăth aăs ăWăthíchăh păt ăW 0 ă t iăW σ/2 ăHìnhăd i1Ơăđ ăth ă8ăđi măFFT.
Hình 2.10 FFT 8 điểm, cơ số 2, phân chia theo tần số
Chúngătaăcóăth ăsoăsánhătr căti păDFTăvƠăFFTănh ăsau:
Khiătínhătr căti păDFT,ăm iăgiáătr ăc aăkăc năσăphépănhơnăph căvƠăσ-1ăphépă c ngăph c.ăĐ iăv iăFFT,ăm iăhƠmăđ uăcóăd ngăλ(0)ă±ăW p ăλ(1)ă(g iălƠăs ăb mădoă đ ăth ăcóăhìnhăcánhăb m)ăyêuăc uăm tăphépănhơnăvƠăhaiăphépăc ng.ăT ăđ ăth ătrênă hìnhă2.5ăchúngătaăcóăth ăt ngăquátăhóaăs ăb mălƠ:
S ăb mă=ă log Đi uă nƠyă lƠă doă cóă σ/2ă hƠngă b mă (b iă vìă m iă b mă cóă haiă ngõă vƠo)ă vƠă log2σăc tăb m.
Bi nă đ iă Cosineă r iă r că DCTă(Discrete Cosine Transform)ă đ că s ă d ngă r ngărưiătrongăx ălỦăti ngănói.ăσóălƠăm tăphépăbi năđ iăchuy nătínăhi uăsangămi nă t năs
= , = , , , , − ăăăăăăăăăăă(2.34) Phépăbi năđ iăngh ch:
Cácăb ăl căs ăvƠăcácăc aăs
B ăl căs ălƠăm tăh ăth ngăs ădùngăđ ălƠmăbi năd ngăs ăphơnăb ăt năs ăc aă cácăthƠnhăph năc aăm tătínăhi uătheoăcácăchỉătiêuăđưăcho.
L căs ălƠăcácăthaoătácăc aăx ălỦădùngăđ ălƠmăbi năd ngăs ăphơnăb ăt năs ă c aăcácăthƠnhăph năc aăm tătínăhi uătheoăcácăchỉătiêuăđưăchoănh ăm tăh ăth ngăs ă
Ph nănƠyămôăt ăcácănguyênăt căc ăb năc aăthi tăk ăb ăl căs ,ănghiênăc uăb ă l căs ăcóăđápă ngăxungăchi uădƠiăh uăh năFIRă(Finite-ImpulseăResponse)ăvƠăb ăl că s ăcóăđápă ngăxungăchi uădƠiăvôăh năIIRă(Infinite-ImpulseăResponse),ălƠăcácălo iă đ căbi tăc aăcácăb ăl căs ăphaătuy nătính.
S ăd ngăđ nhănghƿaăc aăbi năđ iăFourier,ătaăđ c:
−� ăăăăăă(2.37) ăđơyăhƠmăsincăđ căđ nhănghƿaănh ăsau:
= i � � ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.38) cóăph năth călƠăhƠmăch năc aăxăđ cămôăt ătrongăhìnhăd i.ă
Cácăph ngăphápăc aăs ălƠăcácătínăhi uăđ căt pătrungătrongăm tă kho ngă th iăgianăgi iăh n.ăCóăcácăph ngăphápăc aăs ătamăgiácănh ăKaiser,ăBarlett, ăc aă s ăch ănh tăHanningăvƠăHamming,ătrongăđóăHanningăvƠăHammingăđ căs ăd ngă r ngărưiătrongăx ălỦăti ngănói.
Cửa sổ chữ nhật: ăTrongămi năn,ăc aăs ăch ănh tăđ căđ nhănghƿaănh ăsau:
Xétăc aăs ăch ănh tătrongămi năt năs ătaăcó:ă
-ăTỷăs ăgi aăbiênăđ ăđỉnhăth ăc păth ănh tătrênăbiênăđ ăđỉnhătrungătơm:
C aăs ăHanningăvƠăHamming:ăTrongămi năn,ăc aăs ăHanningăvƠăHammingă đ căđ nhănghƿaănh ăsau:
= { − − cos − � ≤ ≤ − ≠ ăăăăăăăăăăăăăăăăăăăă(2.41) Phơnălo iăkhácănhauătheoăh ăs ăαătaăđ c:
= { , − , cos − � ≤ ≤ − ≠ ăăăăăăăăăăăăăăăăăăăăăăăăă(2.42) +ăαă=ă0,54ă:ăc aăs ăHamming
= { , − , cos − � ≤ ≤ − ≠ ăăăăăăăăăăăăăăăăăăă(2.43) Taăcóăcácăthamăs ăc aăb ăl căHanning:
+ăλHanăảăứ32dB Cácăthamăs ăc aăb ăl căHamming:
+ăΔωHamă=ă8πă/σ +ăλHamăảăứ43dB σh ăv yătaăth y:ăΔωTă=ăΔωHană=ăΔωHamă=ă8πă/σ;ăăλTă>ăλHană>ăλHamăv yătrongă 3ăc aăs ăb ăr ngăđỉnhătrungătơmălƠănh ănhauănh ngăbiênăđ ăc aăđ ăg năsóngăd iă thôngăvƠăd iăch năs ănh ănh tăkhiăthi tăk ăbằngăc aăs ăHamming.
Cácăh ăth ngăcóăđ cătínhăxungăcóăchi uădƠiăh uăh năđ căg iălƠăFIR:
Gi ăs ăh ăth ngăFIR:
≠ ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.45) Khiăđóăđ cătínhăxungăc aăh ăth ng:
= ∑ = − ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.46) Cácăh ăth ngăcóăđ cătínhăxungăcóăchi uădƠiăvôăh năđ căg iălƠăIIR:
Ph ngătrìnhătrênălƠăm tăph ngătrìnhăđ ăqui:
= − ∑ = − + ∑ = − ăăăăăăăăăăăăăăăăăăăăăăăă(2.48) vìăv yăIIRăcònăg iălƠăl căđ ăquiăvƠăFIRălƠăl căkhôngăđ ăqui.
Khiăđóăh ăth ngăcóăhƠmătruy nătrongăm tăphẳngăZ:
Xácăsu tăvƠăquáătrìnhăng uănhiên
Tínăhi uăti ngănóiălƠăm tăquáătrìnhăth ngăkêă ăđóăs ăt ngăquanăc aăchu iă s ăđóngăvaiătròăquanătr ngăđ ăphơnătích,ăd ăbáoăđ cătínhăc aăti ngănói.ăσgoƠiăra,ă trongănh năd ngăti ngănói,ămôăhìnhăxácăsu tălƠăm tătrongănh ngămôăhìnhăđ tăk tăqu ă t tănh t.ăPh nănƠyătrìnhăbƠyăkháiăni măxácăsu tăvƠăquáătrìnhăng uănhiênălƠmăc ăs ă choătríchăhu năluy năvƠănh năd ngăti ngănóiă ăch ngăsau.
Xácăsu tăc aăs ăki năAăđ căkỦăhi uălƠăP(A).ăCóă3ătínhăch tăc aăP(A):
- P(t tăc ăkh ănĕngăcóăth ăx yăra)ă=ă1
- Choă{Ai},ăv iă(Aiă.ăAjă=ă0)ăthìăP(Ai.Aj)ă=ăP(Ai)ă+ăP(Aj)
Chúngătaăđ nhănghƿaăthêmăxácăsu tăđ ngăth iăvƠăxácăsu tăcóăđi uăki n.ăXácă su tăđ ngăăth iălƠăxácăsu tăđ ăhaiăhayănhi uăs ăki năđ ngăth iăx yăraătrongăm tăphépă th ăKíăhi uăxácăsu tă2ăs ăki năAăvƠăBăx yăraăđ ngăth i:ăP(AB)
Xácăsu tăcóăđi uăki nălƠăxácăsu tăđ ăx yăraăs ăki năAătrongăkhiăs ăki năBăđưă x yăra.ăKíăhi u:ăP(A/B).ăCôngăth cătính:
P(A | B) = P(AB) P(B) ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.50) Côngăth căBayes:ă2ăbi năc ăA,ăBăđ căl p:
Trongăx ălỦătínăhi u,ăđi uămongămu nălƠătínăhi uăcóăgiáătr ăhayănằmătrongă m tăph măviăc ăth ăTínăhi uătrongătr ngăh pănƠyăđ căcoiălƠăbi năng uănhiên.ă ĐơyălƠăt păs ăki năc aăbi năr iăr căcóăgiáătr ăc ăth ,ăngoƠiăraăcònăcóăt păs ă ki năc aăbi năliênăt căcóăgiáătr ănằmătrongăm tăph măviănƠoăđó.ăChúngătaăcóăth ăđ nhă nghƿaăhƠmăphơnăph iăxácăsu tăc aăm tăbi năng uănhiênănh ăsau:
HƠmăphơnăph iăxácăsu tălƠăhƠmătĕngăc aăbi năđ căl păxăvƠăchỉă đúngăchoă bi năng uănhiênăc ăth ăX. σ uăl yăviăphơnăF(x)ătheoăbi năx,ătaănh năđ căhƠmăm tăđ ăxácăsu tăPDFă
(Probablity Destiny Function)ăc aăX:
L yătíchăphơnăp(x),ătaăcóăđ căhƠmăphơnăph iăxácăsu tănh ăsau:
= ∫ −∞ � �ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.53) Taăcóăth ăxácăđ nhăđ căxácăsu tăc aăbi năng uănhiênăXănằmăgi aăaăvƠăb:
Hình 2.13 Hàm phân phối σghƿaălƠăn uăbi tăhƠmăphơnăph iăhayăhƠmăm tăđ ,ăchúngătaăcóăth ătínhăđ că xácăsu tăc aăbi năng uănhiênăXănằmătrongăph măviăchoătr c
Giáătr ăkỳăv ngăc aăxăkỦăhi uăE(x)ălƠăgiáătr ăcóăkh ănĕngăx yăraănhi uănh t.ă E(x)ăcònăđ căg iălƠăgiáătr ătrungăbình,ăvƠăđ cătínhăt ăhƠmăm tăđ ănh ăsau:
Ph ngăsaiăc aăbi năng uănhiênăxăđ căđ nhănghƿa: Ń 2 ă=ăVar(x)ă=ăE[(xă-ăE[x]) 2 ]ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.56) ŃălƠăcĕnăb căhaiăgiáătr ăbìnhăph ngătrungăbìnhăc aăđ ăl chăgi aăm tăbi năvƠă giáătr ătrungăbìnhăc aăbi năđó.
BI UăDI σăTệσăHI UăTI σGăσịI
Bi năđ iăFourierăth iăgianăng n
Phépăbi năđ iăFourierăkhôngăth ăápăd ngăđ iăv iătínăhi uăkhôngăd ng,ăvìă cácăthƠnhăph năt năs ăkhôngă năđ nh.ăTuyănhiênăn uăchúngătaăchiaătínăhi uăkhôngă d ngăthƠnhănh ngăđo năđ ănh ătheoăth iă gianăthìătínăhi uătrongă m iăđo năcóăth ă xemălƠătínăhi uăd ngăvƠădoăđóăcóăth ăl yăbi năđ iăFourierătrênăt ngăđo nătínăhi uă nƠy.ă σh ă v y,ă phépă bi nă đ iă Fourieră th iă giană ng nă STFTă(Short-Time Fourier Transform)ăv aăcóătínhăđ nhăv ătheoăt năs ădoătínhăch tăc aăbi năđ iăFourier,ăv aăcóă tínhăđ nhăv ătheoăth iăgianădoăđ cătínhătrongăt ngăkho ngăth iăgianăng n.ăĐơyălƠă nguyênălỦăc aăSTFTăhayăcònăg iălƠăbi năđ iăFourierăc aăs ăhóa.
TrongăSTFT,ătínăhi uăf(t)ăđ uătiênăđ cănhơnăv iăm tăhƠmăc aăs ăw(t-ń)ăđ ăă l yăđ cătínăhi uătrongăkho ngăth iăgianăng năxungăquanhăth iăđi măń.ăSauăđóăphépă bi nă đ iă Fourieră bìnhă th ngă đ că tínhă trênă đo nă tínă hi uă nƠy.ă K tă qu ă chúngă taă đ căm tăhƠmăhaiăbi năSTFTf(w,t)ăxácăđ nhăb i:
, = ∫ −∞ ∞ ∗ − � − ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.57) STFTăt iăth iăđi măńălƠăbi năđ iăFourierăc aătínăhi uăf(t)ănhơnăv iăphiênăb nă d chăm tăkho ngăńătheoăth iăgianăw(t-ń)ăăc aăc aăs ăc ăb năt pătrungăxungăquanhăń.ă STFTăcóătínhăđ nhăv ătheoăth iăgian.ăC aăs ăcƠngăh păthìătínhăđ nhăv ăcƠngăt t. Đ ăth yărõăh năv ătínhăđ nhăv ătheoăt năs ,ătaăápăd ngăđ nhălỦăParservalăđ ă vi tăăl iă(2.57)ănh ăsau:
= � ∫ [ ∗ −∞ ∞ ′ − ′− � ] [ ′] ′ ăăăăăăăăăăăăăăăăăăăăăăăăă= − �� � ∫ −∞ ∞ ∗ ′ − ′ ′ ′ăăăăăăăăăăăăă(2.58) v iăW*(w'-w)ăvƠăF(w')ăl năl tălƠăph ăc aăc aăs ăw(t-τ)ăvƠătínăhi uăf(t).
W*(w'-w)ăcóătácăd ngănh ăm tăb ăl căd iăthôngăt pătrungăquanhăt năs ăwăcóă bĕngăthôngăbằngăbĕngăthôngăw(t)ălƠmăgi iăh năph ăc aătínăhi uăF(w')ăxungăquanhă t năs ăđangăphơnătíchăw.ăσh ăv yăSTFTăcóătínhăđ nhăv ătheoăt năs ăTínhăđ nhăv ănƠyă cƠngăt tăkhiăbĕngăthôngăc aăc aăs ăphơnătíchăcƠngăh p.
Taăth yărằng,ăSTFTăchínhălƠăs ăđoăđ ăgi ngănhauăgi aătínăhi uăphiênăb nă d chăvƠăbi năđi uăc aăc aăs ăc ăb năvìă(2.57)ăcóăth ăvi tăl iănh ăsau:
, =∫ −∞ ∞ − � ∗ = ,� , ăăăăă(2.59) v iăg w, τ (t) = w(t - τ)e jwt ălƠăphiênăb năd chăvƠăbi năthiênăc aăw(t).
Doăvi căd chăth iăgianăm tăkho ngăńălƠmăchoăc aăs ăt nhăti năm tăkho ngăńă theoătr căth iăgianăvƠăbi năđi uăc aăs ăv iăe jwt ălƠăc aăs ăt nhăti năm tăkho ngăwătheoă tr căt năs ,ănênăkíchăăth căc aăc aăs ăkhôngăthayăđ iămƠăchỉăd iăđ năv ătríăm iă xungăquanhă(τ, w).ăσh ăv y,ăm iăhƠmăc aăs ăc ăs ăs ăd ngătrongăphépăbi năđ iănƠyă đ uăcóăm tăđ ăphơnăgi iăth iăgiană-ăt năs ,ăchỉăkhácăv ătríătrênăm tăphẳngăth iăgiană t năs ăDoăđó,ăcóăth ăr iăr căhóaăd ădƠngăSTFTătrênăm tăl iăch ănh tă(mw 0 , nτ 0 ). σ uăhƠmăc aăs ălƠăm tăb ăl căh ăthôngăcóăt năs ăc tăw b ,ăho căbĕngăthôngă
2w b ăthìăw 0 ăđ căch nănh ăh năw b ăvƠăτ 0 ănh ăh năπ/w 0 ăđ ăvi căl yăm uăkhôngăm tă thôngătin.ăCácăhƠmăc aăs ăt iăt tăc ăcácăđi măl yăm uăs ăph ăkínăm tăphẳngăth iă giană-ăt năs ăc aăphépăbi năđ i. Đ ăphơnăgi iăth iăgiană-ăt năs ăc aăSTFTăph ăthu căvƠoăhƠmăc aăs ăĐ ăcóă đ ăphơnăgi iăt tăthìăc aăs ăphơnătíchăph iăh pă(v ăm tăth iăgian).ăTrongăkhiăđó,ăđ ă đ tăđ căđ ăphơnăgi iăt năs ăt tăthìăbĕngăthôngăc aăc aăs ăph iăh p.ăTuyănhiên,ătheoă nguyênălỦăb tăđ nhăthìăkhôngăth ăt năt iăm tăc aăs ăv iăkho ngăth iăgianăvƠăbĕngă thôngăh pătùyăỦămƠăcóăm tăs ăhoánăđ iăgi aăhaiăthôngăs ănƠyă(doătíchăc aăchúngăb ă ch năd i).ăσ uătaăch năc aăs ăcóăbĕngăthôngăh păđ ăđ ăphơnăgi iăt tăthìăkho ngă th iăgianăl iăr ngălƠmăchoăđ ăphơnăgi iăth iăgianăl iăkémăđiăvƠăng căl i,ăđơyăchínhă lƠănh căđi măc aăSTFT.
PhơnătíchăFourierăth iăgianăng n
ụăt ngăđằngăsauă nhăph ălƠătínhătoánăm tăbi năđ iăFourierăm iă5msăm tă l n,ăhayăbi uădi nănĕngăl ngăt iăm iăđi măth iăgian/t năs ăDoăm tăvƠiămi nătínă hi uăti ngănóiăng năh năkho ngă100msăth ngăxu tăhi năđ nhăkỳ,ătaăcóăs ăd ngăcácă kỹăthu tăđưăđ ăc pă ăph năx ălỦătínăhi uăs ăTuyănhiên,ătínăhi uăkhôngăcònătu năhoƠnă khiăphơnătíchăcácăđo nădƠiăh n,ădoăđó,ăvi căxácăđ nhăchínhăxácăc aăbi năđ iăFourieră khôngăth ădùngăđ căn a.ăH năn a,ăvi căxácăđ nhănƠyăyêuăc uăki năth căc aătínă hi uăth iăgianăvôăh n.ăVìăhaiălỦădoănƠy,ăcácăkỹăthu tăm iăg iălƠăphơnătíchăth iăgiană ng nă(short-timeăanalysis)ăđ căđ ăxu t.ăCácăkỹăthu tănƠyăphơnătíchătínăhi uăti ngă nóiă thƠnhă m tă chu iă cácă đo nă ng n,ă g iă lƠă cácă khungă (frame)ă vƠă phơnă tíchă m iă khungănƠyăm tăcáchăđ căl p.
Choăx m (n)ălƠătínăhi uăth iăgianăng năc aăkhungăm. w m (n)ălƠăhƠmăc aăs ,ăbằngă0ăt iăm iăđi mătr ăm tăvùngănh
DoăhƠmăc aăs ăcóăth ăcóăcácăgiáătr ăkhácănhauăđ iăv iăm iăframeăm,ăđ ăgi ă giáătr ăkhôngăđ iăchoăt tăc ăframeăthì: w m (n) = w(m-n)
Bi uădi năFourierăth iăgianăng năđ iăv iăframeămăđ căđ nhănghƿa:
Hình 2.14 Phổ thời gian ngắn của tiếng nói giọng nam
Doă nhăph ăchỉăhi năth ănĕngăl ngăvƠăkhôngăph iăđo năgi iăh năc aăbi nă đ iăFourierănênăm cănĕngăl ngăđ cătínhănh ăsau: log∣∣ ∣∣ = log + ăăă(2.61)
Giáătr ănƠyăđ căchuy năsangăthangăxámănh ăhìnhă(2.16).ăCácăpixelămƠăgiáă tr ăkhôngăđ cătínhătoánăđ căthêmăvƠo.ăĐo nănghiêngăđi uăchỉnhăđ ăt ngăph nă c aă nhăph ,ătrongăkhiăcácăđi măbưoăhòaămƠătr ngăvƠămƠuăđenăđi uăchỉnhădưyăđ ngă h c.
Hình 2.15 Chuyển đổi giữa giá trị năng lượng log (trên trục x) sang thang xám (trục y)
Quáătrìnhănh năd ngăm uă(c ă ăphaăhu năluy năhayăphaănh năd ng)ăđ uătr iă quaăgiaiăđo nătríchăch năđ cătr ngă(featureăextraction).ăB cănƠyăth căhi năcácăphơnă tíchăph ă(spectralăanalysis)ănhằmăxácăđ nhăcácăthôngătinăquanătr ng,ăđ cătr ng,ă nă đ nhăc aătínăhi uăti ngănói,ăt iăthi uăhóaă nhăh ngăc aănhi u;ăxúcăc m,ătr ngăthái,ă cáchăphátăơmăc aăng iănói;ăgi măkh iăl ngăd ăli uăc năx ălỦ
Hình 2.16 Sơ đồ rút trích đặc trưng tổng quát
RỎTăTRệCHăĐ CăTR σGăTI σGăσịI
Tríchăđ cătr ngăMFCCă(Mel - scaleăFrequencyăCepstralăCoefficient) 24 1 Ti nănh nă(Pre - emphasis)
MFCCălƠăph ngăphápătríchăđ cătr ngăd aătrênăđ căđi măc măth ăt năs ăơmă c aătaiăng i:ătuy nătínhăđ iăv iăt năs ănh ăh nă1kHzăvƠăphiătuy năđ iăv iăt năs ă trênă1kHză(theoăthangăt năs ăMel,ăkhôngăph iătheoăHz) Đ iăv iăph ngăphápăMFCC,ăvi cătínhăđ cătr ngăcóăs ăđ ănh ăsau:
Hình 2.17 Các bước tính đặc trưng MFCC
2.3.1.1 Ti nănh nă(Pre-emphasis):
Chúngătaăbi tărằngăph ăti ngănóiăh uăthanhăcóăkhuynhăh ngăsuyăgi mătoƠnă b ă-6ă dB/octaveă khiă t nă s ă tĕngă lên.ă Đi uă nƠyă lƠă doă khuynhă h ngă suyă gi mă-12ă dB/octaveă c aă ngu nă kíchă ơmă h uă thanhă vƠă tĕngă lênă +6ă dB/octaveă doă phátă ơmă mi ng.ăDoăđóăc năph iăbùă+6ădB/octaveătrênătoƠnăb ăbĕngăt n.ăĐi uănƠyăđ căg iălƠă pre-emphasisătínăhi u.ăTrongăx ălỦătínăhi uăs ,ăchúngătaădùngăb ăl căthôngăcaoăcóă t năs ăc tă3ădBă ăt năs ătrongăph măviăt ă100ăHzăđ nă1kăHz.ăPh ngătrìnhăsaiăphơn: y(n) = x(n) - a*x(n)ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.62)
Trongăđóăy(n)ălƠăm uăraăhi năt iăc aăb ăl căpre-emphasis,ăx(n)ălƠăm uăvƠoă hi năt i,ăx(n-1)ălƠăm uăvƠoătr căđóăvƠăaălƠăhằngăs ăth ngăđ căch năgi aă0.9ăvƠă1.ă
Trongăđóăz - 1 ălƠătoánăt ătr ăm uăđ năv ăSuyăraăhƠmătruy năH(z)ăc aăb ăl c:
2.3.1.2 C aăs ăhóaă(Windowing): Đ uătiênătínăhi uăti ngănóiăx(n)ăs ăđ căchiaăthƠnhăt ngăframeă(cóăth căhi nă ch ngăph ăm tăph nălênănhauă-ăoverlap)ăđ ăđ căTăframeăx’t(n).ăCôngăvi căc aăs ă hoáănƠyăs ăđ căth căhi năbằngăcáchănhơnătínăhi uăti ngănóiăv iăm tăhƠmăc aăs ă
G iăph ngătrìnhăc aăs ăhóaălƠăw(n)ă(0≤ănă≤ăσ-1;ăσ:ăs ăm uătrongă1ăframeătínăhi u),ă khiăđóătínăhi uăsauăkhiăđ căc aăs ăhóaălƠăXt(n):
HƠmăc aăs ăth ngăđ căd ngălƠăhƠmăc aăs ăHamming:
2.3.1.3 Bi năđ iăFourierănhanhă(FastăFourierăTransformă-ăFFT):
Ph ătínăhi uăsauăkhiănhơnăv iăc aăs ăHammingăs ăs ăd ngăphépăbi năđ iă FourierănhanhăăăTaăthuăđ căbiênăđ ăph ăch aăcácăthôngătinăcóăíchăc aătínăhi uăti ngă nói.ăBi năđ iăFourierănhanhă-ăFFTă(FastăFourierăTransform)ălƠăthu tătoánăr tăhi uă qu ăđ ătínhăDFTăc aăm tăchu iăs ă uăđi mălƠă ăch ănhi uătínhătoánăđ căl păl iădoă tínhătu năhoƠnăc aăs ăh ngăFourieră − � ăD ngăc aăDFTălƠ:
Cácănghiênăc uăv ăh ăth ngăthínhăgiácăc aăconăng iăchoăth y,ătaiăng iăcóă c mănh năđ iăv iăđ ăl năcácăt năs ăkhôngătheoăthangătuy nătính.ăCácăđ cătr ngăph ă t năs ăc aăti ngănóiăđ cătaiăng iăti pănh nănh ăngõăraăc aăm tădưyăcácăb ăl c.ă
T năs ătrungătơmăc aăcácăb ăl cănƠyăkhôngăphơnăb ătuy nătínhăd cătheoătr căt năs ă ThƠnhăph năph ăd iă1ă kHzăth ngăđ căt pătrungănhi uăb ăl căh nă vìănóăch aă nhi uăthôngătinăv ăơmăthanhăh n.ă ăt năs ăth păcácăb ăl căbĕngăh păđ căs ăd ngă đ ătĕngăđ ăphơnăgi iăt năs ăđ ăcóăđ căt năs ăc ăb năvƠăh aăt năv nă năđ nh,ăcònă ă t năs ăcaoăcácăb ăl căthôngăbĕngăr ngăđ căs ăd ngăđ ăthuăđ căcácăthƠnhăph năt nă s ăcaoăv năbi năđ ngăr tănhanh.
V iăn ăl cănhằmă môăt ăchínhăxácăs ăti pănh năt năs ăc aătaiăng i,ăm tă thangă t nă s ă đ că xơyă d ngă-ă thangă t nă s ăMelă d aă trênă c ă s ă th că nghi mă c mă nh năngheăc aăng i.ăT năs ă1ăkHzăđ căch nălƠă1000ăMel.ăM iăquanăh ăgi aăthangă t năs ăth că(v tălỦ)ăvƠăthangăt năs ăMelă(sinhălỦ)ăđ căchoăb iăcôngăth c:
= 9 log + 700 �� ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.67) v iăF Mel ălƠăt năs ăsinhălỦ,ăđ năv ăMel;ăFHzălƠăđ năv ăt năs ăth c,ăđ năv ăHz.
Hình 2.18 Đồ thị biểu diễn mối quan hệ giữa Mel và Hz
Trênăhìnhă2.18ăchoăth y,ăv iănh ngăt năs ănh ăh nă1ăkHz,ăthìăquanăh ăgi aă thangămelăvƠăt năs ăth călƠăg nătuy nătính.ăCònăcácăt năs ătrênă1ăkHzăthìăquanăh ă nƠyălƠălogarithm.ăσh ăv yăthayăvìăxơyăd ngăcácăb ăl cătrênăthangăt năs ăth cătaăcóă th ăxơyăd ngăcácăb ăl cănƠyă v iăt năs ătrungătơmăcáchăđ uătuy nătínhătrênăthangă Mel.
Trong đoạn này, công thức tính tần số trung tâm của một hệ thống được trình bày rõ ràng qua phương trình: \(f_m = f_{m-1} + \Delta f_m\), giúp xác định chính xác tần số dựa trên tần số trước đó cộng với sự điều chỉnh \(\Delta f_m\) Nếu tần số trung tâm ban đầu nằm trong khoảng nhỏ hơn 1 kHz, mức điều chỉnh sẽ nhỏ hơn hoặc bằng 10 dB, đảm bảo độ chính xác và ổn định của hệ thống Ngược lại, nếu tần số trung tâm vượt quá 1 kHz, thì công thức tính sẽ là \(f_m = 1.2 \times f_{m-1}\), phù hợp với các đặc tính kỹ thuật cần duy trì mức độ chính xác và hiệu quả của quá trình xử lý tín hiệu.
K tăqu ăsauăkhiăchoăph ătínăhi uăXt(k)ăquaăb ăl cătaăthuăđ căYt(m).
Sauăkhiăquaăb ăl căMel,ăph ătínăhi uăYt(m)ăs ăđ cătínhăLog10ătheo: log{|Y t (m)| 2 } (2.69)
B căcu iăcùngăđ ăthuăđ căcácăh ăs ăMFCCălƠăl yăbi năđ iăCosineăr iăr că c aăk tăqu ăchoăb iă(2.65):
Thôngăth ngăs ăđi măr iăr căkăc aăbi năđ iăng cănƠyăđ căch nă1ăă≤ăăkăă
≤ăă12.ăCácăh ăs ăMFCCăchínhălƠăs ăđi măr iăr cănƠy,ătaăcóăth ăcóă1-12ăh ăs ăMFCC.
Ph ngăphápămưăhóaăd ăbáoătuy nătínhăLPCă(LinearăPredictiveă Coding)
ụăt ngăc ăb năc aăph ngăphápă mưăhóaăd ăbáoătuy nătínhă(LPC)ălƠăt iă th iăđi măn,ăm uăti ngănóiăs(n)ăcóăth ăđ căx păxỉăb iăm tăt ăh pătuy nătínhăc aăpă m uătr căđó: s(n) ≈ a 1 s(n-1) + a 2 s(n-2) + … + a p s(n-p) (2.71)
Trongăđóăgi ăs ăa1,ăa2,ă ă,ăapălƠăhằngăs ătrênăkhungăd ăli uă(frame)ăđ că phơnătích.ăChúngătaăchuy năquanăh ătrênăthƠnhăd ngăđẳngăth căbằngăcáchăthêmăvƠoă s ăh ngăGu(n)ăg iălƠăngu năkíchăthích:
= ∑ = − + ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.72) Trongăđóău(n)ălƠăngu năkíchăthíchăđ căchuy năhóaăvƠăGăg iălƠăđ ăl iăc aă nó.ăTh căhi năbi năđ iăză ăhaiăv ăc aăph ngătrìnhătrên,ătaăcó:
= = � � ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(2.74) KỦăhi uăởă(n)ălƠăd ăbáoătuy nătínhăc aăs(n):
Khiăđóăthi tăl păl iăd ăbáoăe(n)ăđ căđ nhănghƿaălƠ:
= − ~ = − ∑ = − = ăăăăăă(2.75) Đ ătìmăt păcácăh ăs ăak,ăkă=ă1,ă2,ă ,ăpătrênăkhungăđ căphơnătích,ăcáchăti pă c năc ăb nălƠătaăc căti uăhóaăsaiăs ăbìnhăph ngătrungăbình.ăKhiăđóăs ăd năđ năvi că taă ph iă gi iă m tă h ă ph ngă trìnhă v iă pă nă s ă Cóă nhi uă ph ngă phápă đ ă gi iă h ă ph ngătrìnhăđó,ănh ngătrongăth căt ,ăph ngăphápăth ngăđ cădùngălƠăph ngă phápăphơnătíchăt ăt ngăquan.
Hình 2.19 Sơ đồ bộ xử lý LPC rút trích đặc trưng tiếng nói
M iă khungă sauă khiă đ că l yă c aă s ă s ă đ că đ aă quaă b că phơnă tíchă t ă t ngăquanăvƠăchoăraă(pă+ă1)ăh ăs ăt ăt ngăquan:
= ; = , , , ăăăăăăăăăăăăăăăăăăăăă(2.76) Trongăđóăgiáătr ăt ăt ngăquanăcaoănh t,ăp,ăđ căg iălƠăc păc aăphơnătíchă LPC.ăThôngăth ng,ătaăs ăd ngăcácăgiáătr ăpătrongăkho ngăt ă8ăđ nă16.
B cănƠy,ătaăs ăchuy năm iăkhungăg mă(pă+ă1)ăh ăs ăt ăt ngăquanăthƠnhăpă h ăs ăLPCăbằngăcáchădùngăthu tătoánăLevinsonă-ăDurbin.
Thu tătoánăLevinsonă-ăDurbinăth ăhi năquaămưăgi ăsau:
D ăli uăvƠoălƠă(pă+ă1)ăh ăs ăt ăt ngăquanăch aătrongăr;ăk tăqu ăraălƠăpăh ăs ă LPCăch aătrongăa.
Lúcă nƠy,ă taă cóă th ă dùngă cácă h ă s ă LPCă lƠmă vectoră đ că tr ngă choă t ngă khung.ăTuyănhiên,ăcóăm tăphépăbi năđ iăt oăraăd ngăh ăs ăkhácăcóăđ ăt pătrungăcaoă h năt ăcácăh ăs ăLPC,ăđóălƠăphépăphơnătíchăCepstral.
T ăpăh ăs ăLPCă ăm iăkhung,ătaăd năxu tăraăqăh ăs ăcepstralăc(m)ătheoăcôngă th căđ ăquyăsau: c0ă=ălnŃ 2
Trongăđó,ăŃ 2 ălƠăđ ăl iăc aămôăhìnhăLPC.ăThôngăth ngătaăch năQăảă(3/2)p
Doăđ ănh yăc aăcácăh ăs ăcepstralăc păth pălƠmăchoăph ăb ăđ ăd căvƠădoăđ ă nh yăc aăcácăh ăs ăcepstralăc păcaoăgơyăraănhi uănênătaăth ngăs ăd ngăkỹăthu tăđ tă tr ngăs ăđ ălƠmăgi măthi uăđ ănh yănƠy: ĉi (m) = c(m).w(m)
V iăw(m)ălƠăhƠmăđ tătr ngăs ăHƠmăđ tătr ngăs ăthíchăh păth ngălƠăb ăl că thôngăd i:
V iămi năti ngănóiăh uăthanhăcóătr ngătháiăg nă năđ nh,ămôăhìnhăt tăc ăcácă đi măc căđ iăc aăLPCăchoătaăm tăx păxỉăt tăđ iăv iăđ ngăbaoăph ăơm.ăV iăti ngă nóiăvôăthanh,ămôăhìnhăLPCăt ăraăítăh uăhi uăh năsoăv iăh uăthanh,ănh ngănóăv nălƠă môăhìnhăh uăíchăchoăcácăm căđíchănh năd ngăti ngănói.ăMôăhìnhăLPCăđ năgi năvƠă d ăcƠiăđ tătrênăph năc ngăl năph năm m.
MỌăHÌσHăMARKτVă σ
Chu iăMarkovăr iăr c
Xétăh ăth ngăcóătínhăch tănh ăsau:ă ăm tăth iăđi măb tăkỳ,ăh ăth ngăs ă ă m tătrongăNătr ngătháiănh ăhìnhăv ăd iăđơy.ăC ăsauăm tăkho ngăth iăgianăđ uăđ n,ă h ăth ngăs ăchuy năsangătr ngătháiăm iăho căgi ănguyênătr ngătháiătr căđó.ăTaăkỦă hi uăcácăkho ngăth iăgianăchuy nătr ngătháiălƠăt=1,ă2,ăầăvƠătr ngătháiăt iăth iăđi mătă c aăh ăth ngălƠăq t ,ăq t s ăcóăcácăgiáătr ă1,ă2,ăầ,ăN.ă1ătr ngătháiăt ngă ngăv iă1ăs ă ki n.ăQuáătrìnhătrênăđ căg iălƠăquáătrìnhăMarkov.
Hình 3.1 Minh họa mô hình Markov
Trongăhìnhăv ,ăa ij ălƠăxácăsu tăchuy năt ătr ngătháiăiăsangătr ngătháiăj,ătaăcóă cácăquanăh : a ij ă≥ă0,ă ∀ , ă
∑ = ă∀ ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(3.1) Taăchỉăxétăchu iăMarkovăb cănh tălƠănh ngăh ăth ngămƠătr ngătháiăhi năt iă chỉăph ăthu căvƠoătr ngătháiăngayătr căđó,ănghƿaălƠ: a ij =ăP[q t = j | q t - 1 = i]ă,ă1 ≤ i,ăj ≤ Năăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(3.2)
- Nătr ngătháiăc aămôăhình.ăKỦăhi uătr ngătháiă ăth iăđi mătălƠăq t
- Năs ăki n:ăEă=ă{e 1 , e 2 , e 3 , , e N }.ăM iăs ăki năt ngă ngăv iă1ătr ngăthái.ă
T iăm iăth iăđi măt,ătr ngătháiăphátăsinhăraăs ăki năt ngă ngăv iănó.
- A={a ij }ă-ălƠămaătr năphơnăph iăxácăsu tăchuy nătr ngăthái,ătrongăđóăa ij ălƠă xácăsu tăchuy năt ătr ngătháiăiă ăth iăđi mătăsangătr ngătháiăjă ăth iăđi măt+1: a ij = P[q t = j |q t- 1ă= i] 1 ≤ i, j ≤ N
- π =ă{π i }ă-ămaătr năphơnăph iătr ngătháiăbanăđ uătrongăđóăπ i ălƠăxácăsu tămôă hìnhă ătr ngătháiăi t iăth iăđi măbanăđ uăt =ă1; π i = P[q 1 = i] 1 ≤ i ≤ N
Ví dụ 1: ăTungăđ ngăxu. ăđơyăcóă2ătr ngăthái:ăS1ăt ngă ngăv iăs ăki năe1ă=ăX p;ăvƠăS2ăt ngă ngă v iăs ăki năe2ă=ăσg a.ă
Taăcóăcácăph năt ăc aămaătr năA:ăă ăăăăa11ă=ă0.5ăăa12ă=ă0.5ă ăăăăa21ă=ă0.5ăăa22ă=ă0.5ă
Cácăs ăki n:ă ăăăăX păX păσg aăσg aăX păσg aăX pă t ngă ngăv iăcácătr ngăthái:ă ăăăăS1ăăăS1ăăăS2ăăăS2ăăăS1ăăăS2ăăăS1
Ví dụ 2: ăTh iăti tăc aăm tăvùngăv iămôăhìnhăxácăsu tănh ăsau.
- Xácăsu tăc aăchu iăquanăsátă{rain,ărain,ărain,ăclouds,ăsun,ăclouds,ărain}ă ngă v iămôăhìnhăMarkovătrênălƠ:ă
Quanăsátă =ă {ăr,ăr,ăr,ăc,ăs,ăc,ăr}ă
Să =ă {S1,ăS1,ăS1,ăS2,ăS3,ăS2,ăS1}ăăă
- Xácăsu tăc aăchu iă{sun,ăsun,ăsun,ărain,ăclouds,ăsun,ăsun)ă ngăv iămôăhìnhă MarkovătrênălƠ:ă
Quanăsátă = {ăs,ăs,ăs,ăr,ăc,ăs,ăs}ă
Săăăăăăăăăăăăă = {S3,ăS3,ăS3,ăS1,ăS2,ăS3,ăS3}ă
Timeăăăăăăă = {1,ăă2,ăăă3,ăăă4ă,ăă5ă,ă6ă,ăă7}ă(days)ă
Khácăv iăchu iăMarkovănh ătrìnhăbƠyă ătrên,ămôăhìnhăMarkovă năcóănh ngă đ căđi măsau:
- T ă1ătr ngătháiăcóăth ăphátăsinhăh nă1ăs ăki nă(hayăcònăđ căg iălƠă1ăquană sát).
- Chu iăquanăsátălƠăhƠmăxácăsu tăc aătr ngăthái.
- Chúngătaăcóăth ătínhătoánăxácăsu tăc aăcácăchu iătr ngătháiăkhácănhauăt ă m tăchu iăquanăsát. σh ă v yă HMMă v nă phátă sinhă raă cácă quană sát.ă S ă l ngă tr ngă tháiă thôngă th ngăkhácăs ăl ngăquanăsát.ăKhiă ătr ngătháiăSi,ăcóăxácăsu tăp(o 1 ) đ ăphátăsinhăs ă ki nă1,ăxácăsu tăp(o 2 )ăđ ăphátăsinhăs ăki nă2
- NălƠăs ăl ngătr ngătháiăc aămôăhình.ă{1,2, ,N}ălƠăcácătr ngăthái.ăKỦăhi uă tr ngătháiă ăth iăđi mătălƠăq t
- MălƠăs ăl ngăquanăsátăphơnăbi t.ăCácăkỦăhi uăquanăsátăt ngă ngăv iătínă hi uăv tălỦămƠăh ăth ngăđangămôăt ăTaăkỦăhi uăt păquanăsátălƠăV={v 1 , v 2 , , v M }.ă Đ iăv iătínăhi uăti ngănói,ăMălƠăkíchăth căcodebook.ăv i lƠămưăc aăt ngăvector.
- A =ă{a ij }ă-ălƠămaătr năphơnăph iăxácăsu tăchuy nătr ngăthái,ătrongăđóăaijălƠă xácăsu tăchuy năt ătr ngătháiăiă ăth iăđi mătăsangătr ngătháiăjă ăth iăđi măt+1ă a ij = P[q t = j |q t - 1 = i] 1ă≤ i, j ≤ N
- B =ă{b j (k)}ă-ămaătr năphơnăph iăxácăsu tăcácăkỦăhi uăquanăsát,ătrongăđóă b j (k)ălƠăxácăsu tănh năđ căkỦăhi uăquanăsátăvkă ătr ngătháiăj: b j (k)ă=ăP[o t = v k |q t = j] 1ă≤ k ≤ M j=1,ă2,ăầăN
- π =ă{π i }ă-ămaătr năphơnăph iătr ngătháiăbanăđ uătrongăđóăπiălƠăxácăsu tăc aă môăhìnhă ătr ngătháiăiăt iăth iăđi măbanăđ uăt=1: π i =ăP[q 1 =i] 1ă≤ i ≤ N σh ăv yăđ ăđ căt ăđ yăđ ăm tăHMMăc năph iăcóăs ătr ngătháiăNăc aămôă hình,ăt păVăg măMăkỦăhi uăquanăsát,ămaătr năxácăsu tăchuy nătr ngătháiăA,ămaătr nă xácăsu tăcácăkỦăhi uăquanăsátăđ căBăvƠămaătr năxácăsu tătr ngătháiăbanăđ uăπ.
Víăd :ăTh iăti tăvƠăđ ă măkhôngăkhí.
MôăhìnhănƠyăcó:ăăăăS ătr ngătháiăN=3ă(g mă High, Medium, Low )ă
S ăkỦăhi uăquanăsátăM=3ă(g mă Rain, Cloud, Sun )ă
Cácăgiáătr ăcácăph năt ăc aămaătr năA,ăB,ă�ănh ătrênăhìnhătrên.
σ uăchoăchu iăquanăsátăO =ă{sun,ăsun,ăcloud,ărain,ăcloud,ăsun}ăvƠămôă hìnhăMarkovă nănh ăhìnhăv ătrên,ăthìăxácăsu tăđ ăcóăchu iătr ngătháiă{H, M, M, L, L,
ăXácăsu tăc nătìmă =ă bH(sun)*bM(sun)*bM(cloud)*bL(rain)*bL(cloud)*bM(sun)ă
Choă môă hìnhă Markovă nh ă hìnhă v ă trên.ă Tínhă xácă su tă đ ă cóă đ că chu iă quanăsátăτă=ă{sun,ăsun,ăcloud,ărain,ăcloud,ăsun}ăvƠăchu iătr ngătháiălƠă{H,ăM,ăM,ăL,ă L,ăM}.ă
�H*bH(s)*aHM*bM(s)*aMM*bM(c)*aML*bL(r)*aLL*bL(c)*aLM*bM(s)ă
Choă môă hìnhă Markovă nh ă hìnhă v ă trên.ă Tínhă xácă su tă đ ă cóă đ că chu iăquanăsátăτ={sun,ăsun,ăcloud,ărain,ăcloud,ăsun}vƠăchu iătr ngătháiălƠă{H,ăH,ăM,ă L,ăM,ăH}.ă
�H*bH(s)*aHH*bH(s)*aHM*bM(c)*aML*bL(r)*aLM*bM(c)*aMH*bH(s)ă
Đ nhănghƿaămôăhìnhăMarkovă n
V iăđ nhănghƿaăHMMă ătrên,ătaăcóăbaăv năđ ăc ăb năc năquanătơmătr căkhiă đ căápăd ngătrongăcácă ngăd ngăth căt i V năđ ăs ă căl ngă-ăchoătr căm tămôăhìnhă�ăvƠăm tădưyăc aăcácă quanăsátăX=(X 1 , X 2 , …, X T ),ăcóăxácăsu tălƠăP(X|ă�);ăxácăsu tăc aămôăhìnhăt oăraăchoă cácăquanăsátălƠăgì? ii V năđ ăgi iămưă-ăchoătr căm tămôăhìnhă�ăvƠăm tădưyăc aăcácăquană sátăX=(X 1 , X 2 , …, X T ),ădưyătr ngătháiăphùăh pănh tăSă=ă(s 0 , s 1 , s 2 , …, s T )ătrongămôă hìnhăt oăraăcácăquanăsátălƠăgì? iii V năđ ăh că-ăchoătr căm tămôăhìnhă�ăvƠăm tăt păcácăquanăsát,ălƠmă th ănƠoăchúngătaăcóăth ăđi uăchỉnhămôăhìnhăthamăbi nă�̂ăđ ăc căđ iăxácăsu tăliênăk tă (cóăth ăx yăra)ă∏ | � ? σ uăchúngătaăcóăth ă gi iăquy tă v năđ ăs ă căl ng,ăchúngătaăs ăcóă m tă cáchă căl ngălƠmăsaoăv iăm tăHMMăchoătr căĕnăkh păm tădưyăquanăsát.ăDoăđó,ă chúngătaăcóăth ăs ăd ngăHMMăđ ănh năd ngăm u,ăkhiăđóăxácăsu tăP( |�)ăcóăth ă đ căs ăd ngăđ ătínhătoánăxácăsu tăh uănghi măP(�| ),ăvƠăHMMăv iăxácăsu tăh uă nghi măcaoănh tăcóăth ăđ căxácăđ nhănh ăm uămongăđ iăchoădưyăquanăsát.ăσ uă chúngătaăcóăth ăgi iăquy tăv năđ ăgi iămư,ăchúngătaăcóăth ătìmăđ cădưyătr ngătháiă kh pănh tăv iăm tădưyăquanăsátăchoătr c,ăhayătrongăcácăt ăkhác,ăchúngătaăcóăth ă khámăpháădưyătr ngătháiă nălƠmăc ăs ăchoăquáătrìnhăgi iămưătrongănh năd ngăti ngă nóiăliênăt c.ăSauăcùngăn uăchúngătaăcóăth ăgi iăquy tăv năđ ăh c,ăchúngătaăs ăcóăth ă căl ngăt ăđ ngămôăhìnhăthamăbi năΦăt ăm tăb ăd ăli uăhu năluy n.ăBaăv năđ ă nƠyă đ că liênă k tă d iă n nă t ngă xácă su tă t ngă t ă S ă b ă sungă hi uă qu ă c aă cácă thu tătoánăchiaăs ăcácănguyênăt căc aăl pătrìnhăđ ngăsau.ă
Kháiăni măl pătrìnhăđ ngăcònăđ căbi tănh ăDTWă(Dynamic Time Warping)ă trongănh năd ngăti ngănói,ăđ căs ăd ngăr ngărưiăđ ăd năsu tătoƠnădi nătìnhătr ngă khôngăphơnăbi tărõăgi aăhaiăm uăti ngănói.ăPh ngăphápăDTWăcóăth ălƠmăl chăhaiă m uăti ngănóiă(x 1 ,x 2 ,…, x N )ăvƠă(y 1 , y 2 , …, y M )ătrongăchi uăth iăgianăđ ăgi măb tătìnhă tr ngăkhôngărõănh ăminhăh aătrongăhìnhăd i:
Trong bài viết so sánh giữa hai mẫu tiếng nói X=(x₁, x₂, , x_N) và Y=(y₁, y₂, , y_M), các tác giả sử dụng phương pháp đo khoảng cách để xác định mức độ giống nhau giữa hai mẫu Quá trình này bao gồm việc tính toán khoảng cách cặp (i, j), phản ánh sự khác biệt giữa phần tử x_i của mẫu X và y_j của mẫu Y, rồi sau đó tổng hợp các khoảng cách này để ước lượng độ chênh lệch tổng thể giữa hai mẫu Thậm chí, tác giả còn đề xuất một thuật toán tìm đường đi tối ưu từ điểm bắt đầu (1, 1) đến điểm kết thúc (N, M), nhằm xác định cách kết hợp các phần tử sao cho tổng khoảng cách là nhỏ nhất, qua đó giúp so sánh chính xác hơn các mẫu tiếng nói khác nhau trong các ứng dụng như nhận dạng giọng nói hay phân loại âm thanh.
Chúngătaăcóăth ăli tăkêăt tăc ăkh ănĕngăkho ngăcáchăch ngăch tăt ă(1,ă1)ăđ nă(N, M)ă vƠăxácăđ nhăm uăcóăkho ngăcáchăc căti u.ăKhiăcóăMăkh ănĕngădiăchuy năchoăm iă b căt ătráiăsangăph iătrongăhìnhătrên,ăt tăc ăđ ngăcóăkh ănĕngăt ă(1,ă1)ăđ nă(N, M)ă s ă theoă c pă s ă mǜ.ă σguyênă t că l pă trìnhă đ ngă cóă th ă gi mă m nhă l ngă tínhă toánă bằngăcáchătránhăs ăli tăkêăc aăcácădưyămƠăkhôngăth ăt iă u.ăKhiăđ ngăt iă uăt ngă t ăsauăđóăm iăb căph iăd aătrênăb cătr căđó,ăkho ngăcáchăc căti uăD(i, j)ăph iă th aămưnăbi uăth căsau:
Côngăth că(3.3)ăchoăbi tătaăchỉăc năxemăxétăvƠăgi ăl iăchỉăb căđiăt tănh tă đ iăv iăm iăc păm cădùăcóăth ăcóăMăkh ănĕngăb căđi.ăS ăđ ăquiăchoăphépătìmăki mă đ ngăd năt iă uăđ ăđ căti năhƠnhăgiaătĕngăt ătráiăquaăph i.ăV ăb năch t,ăl pătrìnhă đ ngăgiaoăphóăgi iăphápăđ ăquyăchoăv năđ ăconăc aăchínhănó.ăQuáătrìnhătínhătoánăb tă ngu năt ăv năđ ăconă(D(i-1,ăk))ăđ năv năđ ăconăl năh nă(D(i, j)).ăChúngătaăcóăth ă xácăđ nhăy jăĕnăkh pănh tăv iăx iăvƠăl uăl iăchỉăm cătrongăb ngăconătr ălùiăB(i, j)ălƠă chúngătaăđưăđiăqua.ăĐ ngăd năt iă uănh tăcóăth ăl năng căl iăsauăkhiăđ ngăd nă t iă uăđưăđ căxácăđ nh.ă
Toánăt ăti nă∝ ălƠăxácăsu tăc aăchu iăquanăsátăt ngăph năXă=ă(X 1 , X 2 ,…,
X t )ăvƠătr ngătháiăquanăsátăS i ăt iăth iăđi mătăv iăđi uăki năchoăHMMă�.
|� = ∑ = ∝ ăn uăđ căyêuăc uăđ ăk tăthúcătr ngătháiăsauăcùng, ă |� = ∝
Taăcóăth ăd ădƠngăbi tăđ căđ ăph căt păc aăthu tătoánăti nălƠăO(N 2 T)ăt tă h năsoăv iăđ ăph căt păc păs ămǜ.ăĐóălƠăb iăvìăchúngătaăcóăth ăs ăd ngătoƠnăb ăcácă ph năxácăsu tăđưătínhătoánăchoăhi uăqu ăđ căc iăti n.
Hình 3.3 Quá trình tính toán lưới tiến cho HMM của Dow Jones Industrial
Thu tătoánăti n,ătrongăph nătr c,ătínhătoánăxácăsu tămƠăm tăHMMăt oăraă chu iă quană sátă bằngă t ngă cácă xácă su tă c aă t tă c ă đ ngă d nă cóă th ,ă choă nênă nóă khôngăcungăc păđ ngăd năt tănh tă(ho cădưyătr ngăthái).ă ănhi uă ngăd ng,ăng iă taămongătìmăđ căđ ngăd nănh ăv y.ăTìmăđ ngăd năt tănh tă(dưyătr ngăthái)ălƠă n nămóngăchoăquáătrìnhătìmăki mătrongănh năd ngăti ngănóiăliênăt c.ăKhiădưyătr ngă tháiăđ că nă(khôngăđ căquanăsát)ătrongăn năt ngăHMM,ăh uăh tăs ăd ngăr ngărưiă nh tătiêuăchu nălƠăđ ătìmădưyătr ngătháiăcóăxácăsu tăcaoănh tăđ căl yătrongăkhiăt oă raă dưyă quană sát.ă σóiă cáchă khác,ă chúngă taă đangă tìmă ki mă dưyă tr ngă tháiăSă =ă (s 1,ă s 2,ăầ,ăs T )ămƠăc căđ iăP(S,ăX|Φ).ăV năđ ănƠyăr tăgi ngăv iăv năđ ăt iă uăđ ngăd nă trongăl pătrìnhăđ ng.ăH ăqu ălƠ,ăm tăkỹăthu tăchínhăth căd aătrênăl pătrìnhăđ ng,ăg iă lƠă thu tă toánăViterbi,ă cóă th ă đ că dùngă đ ă tìmă dưyă tr ngă tháiă t tă nh tă choă HMM.ă
Th că t ,ă ph ngă phápă t ngă t ă đ că dùngă đ ă đánhă giáă HMMă mangă l iă choă gi iă phápăx păxỉăg năv iătr ngăh păđ tăđ căvi căs ăd ngăthu tătoánăti nămôăt ă ătrên.ă
Thu tătoánăViterbiăcóăth ăđ căxemănh ăthu tătoánăl pătrìnhăđ ngăápăd ngă choăHMMăhayălƠăthu tătoánăti năs aăđ i.ăThayăvìăt ngăk tăxácăsu tăt ăcácăconăđ ngă khácăđ nătr ngătháiăđích,ăthu tătoánăViterbiăl yăvƠănh ăđ ngăd năt tănh t.ăĐ ăđ nhă nghƿaăxácăsu tăđ ngăd năt tănh t:
= , − , = |Φ ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(3.4) ălƠăxácăsu tăcóăkh ănĕngănh tăc aădưyătr ngătháiă ăth iăđi măt,ămƠăđưă t oăraăquanăsátă ă(choăđ năth iăđi măt)ăvƠăk tăthúcă ătr ngătháiăi.ăM tăth ăt căquiă n păt ngăt ăchoăthu tătoánăViterbiăcóăth ăđ cămôăt ănh ăsau:
Chỉăs ăt tănh tă=ăMax 1≤i≤N [ ]
S * ă=ă( ∗ , ∗ , … , ∗ )ă lƠădưyăt tănh t Đ ăph căt păc aăthu tătoánăViterbiălƠăO(N 2 T)ă
Hình 3.4 Quá trình tính toán lưới Viterbi cho HMM của Dow Jones Industrial
3.1.2.4 căl ngăcácăthamăbi năHMMă-ăThu tătoánăBaum-Welch:ă
Trong quá trình phân tích, việc xác định các dự đoán chính xác dựa trên các quan sát là rất quan trọng, đặc biệt khi đấu tranh với dữ liệu phức tạp như trong mô hình ẩn Markov (HMM) Thay vì chỉ dựa vào một phương pháp duy nhất, các nhà phân tích thường sử dụng thuật toán Baum-Welch để huấn luyện mô hình, so sánh với thuật toán tiến tiến hơn như forward-backward để tối ưu hóa khả năng dự đoán Điều này giúp mô hình không bị giới hạn bởi các giả định ban đầu và có khả năng tự điều chỉnh dựa trên dữ liệu thực tế, mang lại độ chính xác cao hơn trong việc nhận dạng các trạng thái ẩn trong dữ liệu quan sát.
Tr că khiă môă t ă thu tă toánă Baum-Welch,ă đ uă tiênă chúngă tôiă đ nhă nghƿaă m tă vƠiă thu tă ng ă c nă thi t.ă ă m tă hi uă chỉnhă t ngă t ă v iă xácă su tă ti n,ă chúngă taă đ nhă nghƿaăxácăsu tălùiănh ăsau:
= + | = , Φ ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(3.5) Trongăđóă ălƠăxácăsu tăt oăraăquanăsátăt ngăph nă + ă(t ăt+1ăđ năk tă thúc)ăchoătr c,ăHMMătrongătr ngătháiăiă ăth iăđi măt,ă ăcóăth ăsauăđóăđ cătínhă toánăm tăcáchăquiăn p;
M iăquanăh ăli năk ăαăvƠăβă(α t - 1 & α t vƠăβ t & β t+1)ăcóăth ăđ cămìnhăh aănh ă hìnhăbênăd i.ăα đ cătínhăm tăcáchăđ ăquiăt ătráiăsangăph i,ăβăđ ăquiăt ăph iăsangă trái.
Hình 3.5 Mối quan hệ α t - 1 & α t và β t & β t+1 trong thuật toán tiến-lùi
Ti pătheoăchúngătaăđ nhănghƿaă γ t (i, j)ălƠăxácăsu tăc aăs ăchuy năti păt ătr ngă tháiăiăsangătr ngătháiăjă ăth iăđi măt,ăchoătr cămôăhìnhăvƠădưyăquanăsát.
∑ = Chúngătaăc iăti năl păvéct ăthamăbi năHMMăΦă=ă(A,ăB,ăπ)ăbằngăcáchăc că đ iăxácăsu tăP(X|Φ)ăchoăm iăl năl p.ăChúngătaăs ăd ngă�̂ăđ ăbi uăth ăvéct ăthamă bi năm iăđưăd năsu tăt ăvéct ăthamăbi năΦătrongăvòngăl pătr căđó.ăQuáătrìnhăc că đ iăhóaălƠăt ngăt ăvi căc căđ iăhƠmăQănh ăsau:
Hình 3.6 Sự minh họa các phép toán yêu cầu cho việc tính toán của γ t (i, j)
KhiăchúngătaătáchăhƠmăQăthƠnhăbaăthu tăng ăđ căl p,ăth ăt căc căđ iăhóaă trênăQ(Φ,ă�̂)ăcóăth ăđ căth căhi năbằngăc căđ iănh ngăthu tăng ăđ năr iăr c,ăđ iă t ngăh ngăđ nălƠăcácărƠngăbu căxácăsu t.ăChúngătaăđ tăđ cămôăhìnhă căl ngă nh ăsau: ̂ = ∑ ∑ �= ∑ � ,
�= ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(3.7) Thu tătoánăti nălùiă(hayăthu tătoánăBaum-Welch)ăcóăth ăđ cămôăt ănh ăsau:
B că1: Kh iăt o:ăch năm tă căl ngăΦ.
B că2: E-step:ătínhăhƠmăph ătr ăQ(Φ,ă�̂)ătrênăc ăs ăΦ.
B că3:ă M-step:ătínhă�̂ătheoă căl ngătrongăbi uăth că(3.6)ăvƠă(3.7)ăđ ăc că đ iăhƠmăph ătr ăQ.
B că4: Quáătrìnhăl p:ăthi tăđ tă� = �̂,ăl păl iăt ăb căhaiăchoăđ năkhiăh iă t
V năđ ăth căt ătrongăs ăd ngăcácăHMM
V ăm tălỦăthuy t,ăthu tătoánăl ngăgiáăc aăHMMănênăđ tăđ năchỉăs ăt iăđaă c căb ăchoăkh ănĕngăx yăra.ăCơuăh iăthenăch tălƠălƠmăsaoăđ ăch năđúngă cătínhăbană đ uăc aăcácăthamăbi năHMMăsaoăchoăchỉăs ăt iăđaăc căb ătr ăthƠnhăt iăđaătoƠnăc c. ăHMMăr iăr c,ăn uăm tăxácăsu tăđ căkh iăt oălƠăkhông,ănóăs ăduyătrìălƠă khôngămưi.ăDoăđó,ăđi uăquanătr ngălƠăph iăcóăt păh păcácă căl ngăbanăđ uăh pălỦ.ă σghiênăc uătheoăkinhănghi măđưăchoăth y,ăđ iăv iăHMMăr iăr c,ătaăcóăth ăs ăd ngă phơnăph iăđ ngăb ănh ă căl ngăbanăđ u.ăσóăth căhi năt tăm tăcáchăh pălỦăchoă h uăh tă ngăd ngăti ngănói,ă căl ngăbanăđ uăt tălƠăluônăh uăíchăđ ătínhătoánăcácă xácăsu tăđ uăra.
Ti ngănóiălƠătínăhi uăkhôngăc ăđ nh.ăM iătr ngătháiăHMMăcóăkh ănĕngăgi ă m tăvƠiăphơnăđo năc ăđ nhătrongătínăhi uăti ngănóiăkhôngăc ăđ nh.ăC uătrúcăt ătráiă sangăph i,ălƠăthƠnhăph năt ănhiênăđ ămôăhìnhătínăhi uăti ngănói.ăσóăt ăchuy năti pă đ năm iătr ngăthái,ăđi uăđóăcóăth ăđ cădùngăđ ămôăhìnhăcácăđ cătr ngăti ngănóiă liênăt căthu căv ătr ngătháiăgi ngănhau.ăKhiăphơnăđo năti ngănóiăc ăđ nhărútăra,ăs ă chuy năti păt ătráiăsangăph iăchoăphépăs ăti nătri năt ănhiênăc aăcácăs ăthayăđ iănh ă v y.ăTrongăc uătrúcănh ăv y,ăm iătr ngătháiăph ăthu căphơnăph iăxácăsu tăđ uăra,ăcóă th ăđ cădùngăđ ăthôngăd chătínăhi uăti ngănóiăquanăsátăđ c.ăC uătrúcănƠyălƠăm tă c uătrúcăHMMăph ăbi nănh tăđ cădùngătrongăcácăh ăth ngănh năd ngăti ngănóiătiênă ti nănh t.
Tr ngătháiăph ăthu căphơnăph iăxácăsu tăđ uăraăv aăcóăth ăphơnăph iăr iăr că ho căh năh păch cănĕngăm tăđ ăliênăt c.ăĐơyălƠătr ngăh păđ căbi tăc aăchuy nă ti p-ph ăthu căcácăphơnăph iăxácăsu tăđ uăra.ăTr ngătháiăph ăthu căcácăxácăsu tăđ uă raăcóăth ăđ căxemănh ăn uăs ăchuy năti păph ăthu căcácăphơnăph iăxácăsu tăđ uăraă đưăđ căg năbóăđ iăv iăm iătr ngăthái. Đ iăv iătr ngătháiăHMMăph ăthu căt ătráiăsangăph i,ăthamăbi năquanătr ngă nh tătrongăxácăđ nhăc uătrúcălƠăs ătr ngăthái.ăL aăch năc aămôăhìnhăc uătrúcătùyătheoă d ăli uăhu năluy năs năcóăvƠănh ngăgìămôăhìnhăđ cădùng.ăσ uăm iăHMMăđ că dùngăđ ăđ iădi năchoăm tăơm,ătaăc năcóăítănh tăbaăđ nănĕmăphơnăph iăđ uăra.ăσ uă môăhìnhănh ăv yăđ cădùngăđ ăđ iădi năchoăm tăt ,ănhi uăh năcácătr ngătháiănóiă chungăđ căyêuăc u,ătùyăvƠoăphátăơmăvƠăkho ngăth iăgianăt năt iăc aăt ăChẳngăh nă nh ,ăt ătetrahydrocannabinoănênăcóănhi uătr ngătháiătrongăsoăsánhăv iăch ăa.ăTaăcóă th ădùngăítănh tă24ătr ngătháiăchoăph nătr căvƠăbaătr ngătháiăchoăph năsau.ăσ uătaă cóăs ăc aătr ngătháiătùyăvƠoăkho ngăth iăgianăt năt iăc aătínăhi u,ătaăcóăl ăc nădùngă
15ăđ nă25ătr ngătháiăchoăm iăgiơyăc aătínăhi uăti ngănói.ăM tăngo iăl ălƠ,ăđ iăv iă kho ngăl ng,ătaăcóăl ăc năcóăm tăc uătrúcăđ năgi năh n.ăĐơyălƠăvìăkho ngăl ngălƠăc ă đ nh,ăvƠăchỉăc nă1ăho că2ătr ngătháiăs ăđ
Hình 3.7 Mô hình Markov ẩn điển hình được dùng cho mô hình âm vị
Cóă3ătr ngătháiă(0-2)ăvƠăm iătr ngătháiăcóăm tăphơnăph iăxácăsu tăđ uăraăk tă h p.
L pă lu nă choă s ă că l ngă kh ă nĕngă x yă raă t iă đaă (MLEă-ă Maximumă LikelihoodăEstimation)ăđ căd aătrênăm tăgi ăđ nhălƠăphơnăph iăđúngăc aăti ngănóiă lƠăm tăthƠnhăviênăc aăcácăphơnăph iăđưăs ăd ng.ăCácăs ăl ngănƠyăxácănh năti ngă nóiăđ căquanăsátăth căs ăđ căt oăraăb iăHMMăđangădùng,ăvƠăthamăbi năkhôngărõă duyănh tălƠăgiáătr ăTuyănhiên,ăđi uănƠyăcóăth ăđ cătháchăth c.ăCácăHMMăđi năhìnhă t oăraănhi uăgi ăđ nhăkhôngăchínhăxácăv ăquyătrìnhăt oăraăti ngănói,ănh ălƠăgi ăđ nhă đ uăraăđ căl p,ăgi ăđ nhăMarkov,ăvƠăgi ăđ nhăhƠmăm tăđ ăxácăsu tăliênăt c.ăCácăgi ă đ nhăkhôngăchínhăxácălƠmăy uăđiăc ăs ăh pălỦăchoătiêuăchíăkh ănĕngăx yăraăt iăđa.ă Chẳngăh nănh ,ăph ngăphápă căl ngăkh ănĕngăx yăraăt iăđaălƠănh tăquánă(s ăh iă t ăđ năgiáătr ăđúng),ănóălƠăvôănghƿaăđ ăcóăm tătínhăch tănh ăv yăn uămôăhìnhăsaiă đ căs ăd ng.ăThamăbi năđúngătrongătr ngăh pănƠyăs ălƠăthamăbi năđúngăc aăcácă môăhìnhăsai.ăDoăđó,ătiêuăchu năph ngăphápă căl ngăcóăth ălƠmăvi căt tăm cădùă cácăgi ăđ nhăkhôngăchínhăxácănƠyănênăđ aăraăđ ăxácănh năchínhăxácăđ căsoăsánhă v iătiêuăchu năkh ănĕngăx yăraăt iăđa.ă
3.1.3.4 Phépăn iăsuyălo iăb : Đ ăc iăthi nătínhăch căch n,ăth ngăc năthi tăt ngăh pămôăhìnhăt ngăquátăđưă đ căhu năluy năt tă(nh ăđ căl păng iănói)ăv iănh ngămôăhìnhăđ căhu năluy nă kémănh ngăchiăti tăh nă(ph ăthu căng iănói).ăChẳngăh nănh ,ătaăcóăth ănơngăcaoă đ ăchínhăxácănh năd ngăti ngănóiăv iăhu năluy năph ăthu căng iănói.ăTuyăv y,ătaă cóăth ăkhôngăcóăd ăli uăđ ăchoăng iănóiăc ăth ăvìăv yămongămu năđ ăs ăd ngăm tă môăhìnhăng iănóiăđ căl pălƠăt ngăquátăh nănh ngăkémăchínhăxácăh nătrongăt iă uă môăhìnhăph ăthu căng iănói.ăM tăph ngăphápăhi uăqu ăđ ăđ tăđ căs ăch căch nă lƠăthêmăvƠoăc ăhaiămôăhìnhăv iăkỹăthu tăđ căg iălƠăphépăn iăsuyălo iăb ,ătrongăđóă đoăphépăn iăsuyăđưăs ăd ngă căl ngăquaăvi căh păth căhóaăd ăli u.ăHƠmăm cătiêuă lƠăđ ăt iă uăxácăsu tăc aămôăhìnhăt oăraăd ăli u.
Bơyăgi ,ăgi ăs ărằngăchúngătaămu năn iăsuyăhaiăt păh păc aăcácămôăhìnhă [PA(x)ăvƠăPB(x),ăv aăcóăth ăphơnăph iăxácăsu tăr iăr căho căhƠmăm tăđ ăliênăt c]ăđ ă t oăthƠnhăm tămôăhìnhăn iăsuyăPDI(x).ăTh ăt căphépăn iăsuyăcóăth ăbi uădi nă ăd ng:
M tăth căt ăđ năgi năchoămôăph ngăxácăsu tălƠăcƠngănhi uăs ăquanăsátăcƠngă t t,ălƠăc năthi tăđ ă năđ nhămôăhìnhă căl ngăcácăthamăbi n.ăTuyănhiên,ăth tăra,ăchỉă m tăs ăl ngăh năch ăd ăli uăhu năluy nălƠăs năcó.ăσ uăd ăli uăhu năluy năb ăgi iă h n,ăđi uănƠyăs ăd năđ năk tăqu ătrongăm tăvƠiăthamăbi năđưăhu năluy nălƠăkhôngă th aăđáng,ăvƠăs ăphơnălo iăd aătrênăcácămôăhìnhăhu năluy năkémăs ăd năđ năm căđ ă l iănh năd ngăcƠngăcao.ăCóănhi uăgi iăphápăh pălỦăđ ăgi iăquy tăv năđ ăc aăd ăli uă hu năluy năkhôngăđ yăđ ănh ăsau:
Taăcóăth ăgiaătĕngăkíchăth căc aăd ăli uăhu năluy n.
Taăcóăth ăgi măs ăthamăbi năt ădoăđ ăđ că căl ngăl i.ăĐi uănƠyăt oă nênăcácăh năch ăc aănó,ăvìăm tăs ăcácăthamăbi năđángăk ăluônăc nămôăhìnhăs ăki n.
Taăcóăth ăthêmăvƠoăm tăt păcácăthamăbi nă căl ngăv iăm tăt păkhácă c aăthamăbi nă căl ng,ătheoăđóăđ ăm tăl ngăd ăli uăhu năluy năt năt i.ăXoáăb ă phépăn iăsuyăđ căđ ăc pă ătrên,ăcóăth ăđ căs ăd ngăhi uăqu ăTrongăHMMăr iă r c,ăm tăph ngăphápăđ năgi nălƠăđ ăthi tăl păn năchoăc ăhaiăxácăsu tăchuy năti păvƠă xácăsu tăđ uăraăđ ălo iăb ăkh ănĕngă căl ngăkhông.
Taăcóăth ăgomăcácăthamăbi năv iănhauăđ ăgi măs ăc aăthamăbi năt ădo.
ChoăHMMăh năh păliênăt c,ătaăc năchúăỦăđ năt iă uămaătr n.ăCóăm tăs ă kỹăthu tătaăcóăth ăs ăd ng:
Taăcóăth ăn iăsuyămaătr năv iănh ngăm uăhu năluy năt tăh n.
Taăcóăth ăgomămaătr năGaussianăthôngăquaăcácăthƠnhăph năh năh păkhácă nhauăho căquaăcácătr ngătháiăMarkovăkhácănhau.
Taăcóăth ăs ăd ngămaătr năchéoăn uăt ngăquanăgi aăcácăh ăs ăđ cătr ngă lƠăy u,ăs ăđúngălƠătr ngăh pănƠyăn uătaăs ăd ngăcácăđ cătr ngăkhôngăt ngăquană nh ăMFCC.
Taăcóăth ăk tăh păcácăph ngăphápănƠyăv iănhau.
Trongăth căt ,ăchúngătaăcóăth ăgi măm căđ ăl iănh năd ngăti ngănóiăkho ngă
5-20%ăv iăcácăkỹăthu tăt iă uăkhácănhau,ătùyăvƠoăl ngăd ăli uăhu năluy năs năcó.
Khiăchúngătaătínhătoánăcácăxácăsu tătr căvƠăsauătrongăthu tătoánăForward- Backward,ă chúngă s ă ti pă c nă khôngă theoă xuă h ngă c pă s ă mǜă n uă chi uă dƠiă dưyă quanăsát,ăT,ătr ănênăđ ăl n.ăChoăTăđ ăl n,ădưyălinhăđ ngăcácăxácăsu tăs ăv tăquáă ph măviăđ ăchínhăxácăc aăb tăkỳăb ămáyănƠoăv ăc ăb n.ăDoăđó,ătrênăth căt ,ănóăs ă d năđ năthi uăh tătrênămáyătínhăn uăcácăxácăsu tăđ căbi uădi nătr căti p.ăChúngătaă cóăth ăgi iăquy tăv năđ ăthiăhƠnhănƠyăbằngăcáchăl yătỉăl ăcácăxácăsu tănƠyăv iăm tăs ă h ăs ătỉăl ăsaoăchoăchúngă ăbênătrongădưyălinhăđ ngăc aămáyătính.ăT tăc ăcácăh ăs ătỉă l ănƠyăcóăth ăđ căxoáăb ă vƠoăcu iă quáătrìnhătínhătoánă khôngă gơyă nhăh ngăđ ă chínhăxácăt ngăth
Víăd ,ăchoăα t (i)ănhơnăv iăh ăs ătỉăl ,ăS t :
Trongăđó,ăă∑ ă=ă1,ă1ă≤ t ≤ Tă,ă t(i)ăcóăth ăđ cănhơnăb iăS t ă,ă1ă≤ t ≤
Tă.ăS ăđ ăquyăđ căbaoăhƠmătrongăquáătrìnhătínhătoánăcácăbi năs ătr căvƠăsauăcóăth ă đ căl yătỉăl ă ăm iăgiaiăđo năc aăth iăgianătăb iăS t ă.ăChúăỦălƠăα t (i)ăvƠă t (i)ăđ cătínhă toánăm tăcáchăđ ăquyătrongăxuăh ngăc păs ămǜ.ăVìăth ,ă ăth iăđi mătăh ăs ătỉăl ă toƠnăb ăđưăápăd ngăchoăbi năs ătr căα t (i)ălƠ:
Scale α (t) = ∏ = ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(3.9) VƠăh ăs ătỉăl ătoƠnăb ăchoăbi năs ăsauă t (i)ălƠ:
Scale β (t) = ∏ = (3.10) Đóă lƠă b iă vìă cácă h ă s ă tỉă l ă riêngă đ că nhơnă cùngă v iă nhauă trongă đ ă quyă tr căvƠăsau.ăChoă∝ ′ ,ăβ ′ ,ăvƠă ′ , ăbi uăth ăcácăbi năs ătỉăl ăt ngă ng,ăm tă cáchămongăđ i.ăChúăỦălƠ:
Xácăsu tătỉăl ătr căti p,ă ′ , ,ăcóăth ăsauăđóăđ căvi tălƠ:
= ăăăăăăăăăăăăăăăăăăă(3.12) σh ăv y,ăcácăxácăsu tătr căti păcóăth ăđ căs ăd ngătrongăcùngăm tăcáchă nh ăcácăxácăsu tăkhôngătỉăl ,ăb iăvìăh ăs ătỉăl ăđưăđ căxóaăb ătrongăbi uăth cătrên.ă Choănên,ăvi că căl ngăl iăbi uăth căcóăth ăđ căgi ănguyênăm tăcáchăchínhăxácă ngo iătr ăP( |�)ănênăđ cătínhănh ăsau:
Trong bài viết, tác giả nhấn mạnh tầm quan trọng của việc phân tích dữ liệu để đưa ra quyết định chính xác Các phương pháp thống kê giúp xác định mối liên hệ giữa các yếu tố, từ đó hỗ trợ tối ưu hóa chiến lược và nâng cao hiệu quả công việc Đồng thời, việc hiểu rõ các yếu tố ảnh hưởng là chìa khóa để xây dựng giải pháp phù hợp với bối cảnh thực tế Khả năng dự đoán dựa trên dữ liệu cũng đóng vai trò quan trọng trong việc giảm thiểu rủi ro và tối đa hóa lợi ích Thông qua việc áp dụng các mô hình phân tích phù hợp, các tổ chức có thể nâng cao năng lực cạnh tranh và thích ứng với biến đổi thị trường nhanh chóng.
M tăcáchăthayăđ iăđ ătránhăs ăthi uăh tălƠăs ăd ngăbi uădi nălôgarităchoăt tă c ăcácăxácăsu t.ăĐi uănƠyăkhôngăchỉăch căch nătínhătỉăl ălƠăkhôngăc năthi t,ăvìăthi uă h tăkhôngăth ăx yăra,ămƠăcònăcungăc păl iăíchălƠăcácăs ănguyênăcóăth ăđ căs ăd ngă đ ăbi uădi năcácăgiáătr ălôgarit.
σh ngăh năch ăc aăHMM
Cóăm tăs ăh năch ătrongăquyă căHMM.ăChẳngăh nănh ,ăHMMăl yăkho ngă th iăgianăt năt iănh ăm tăphơnăph iătheoăc păs ămǜ,ăxácăsu tăchuy năti păchỉăd aă vƠoăngu năg căvƠăđích,ăvƠăt tăc ăcácăkhungăquanăsátăđ uăph ăthu căchỉătrênătr ngă tháiăđưăt oăraăchúng,ăkhôngăph iăg năk ăcácăkhungăquanăsát.ăCácănhƠănghiênăc uăđưă đ ăxu tăm tăs ăkỹăthu tăđ ăx ălỦăh năch ănƠy,ăm cădùăcácăgi iăphápănƠyăđưăkhôngă c iăti năđángăk ăđ ăchínhăxácăc aănh năd ngăti ngănóiătrongăcácă ngăd ngăth căt
3.1.4.1 Môăph ngăkho ngăth iăgianăt năt i:
M tăđi măy uăchínhăc aăquyă căHMMălƠăchúngăkhôngăcungăc păbi uădi nă thíchăđángăc aăc uătrúcăbi uăth ăth iăgianăc aăti ngănói.ăĐơyălƠăvìăxácăsu tăc aătr ngă tháiăth iăgianăgi mătheoăhƠmămǜăv iăth iăgianănh ăđưănêuătrongăbi uăth căbênăd i.ă Xácăsu tăc aăt cácăquanăsátăliênăt cătrongătr ngătháiăiălƠăxácăsu tăc aăs ăgi ăvòngăt ă l pă ătr ngăthái iăchoăth iăgianăt,ăcóăth ăđ căvi tănh ăsau:
(a) và thời gian tồn tại quá trình HMM tương ứng (b) nơi mà các sự tự chuyển đổi được đổi chỗ với phân phối xác suất quy trình cho mỗi trạng thái
C iăti năđ năHMMăchu năt oăraăb iăs ăd ngăHMMăv iăphơnăph iăquyătrìnhă th iăgianărõărƠngăchoăm iătr ngăthái.ăĐ ăgi iăthíchănguyênăt cămôăph ngăquyătrìnhă th iăgian,ăquyă căHMMăv iăm tăđ ăquyătrìnhătr ngătháiătheoăc păs ămǜăvƠăm tăquyă trìnhăth iăgianăHMMăv iăcácăm tăđ ăquyătrìnhătr ngătháiăđưăxácăđ nh.ăTrongă(a),ăxácă su tăquyătrìnhătr ngătháiăcóăm tăd ngătheoăc păs ămǜătrongăbi uăth că(3.15).ăTrongă(b),ăcácăxácăsu tăt ăchuy năđ iăđ căthayăth ăv iăm tăphơnăph iăxácăsu tăquyătrìnhă rõărƠng.ă ăth iăđi măt,ăquáătrìnhăđ aăvƠoătr ngătháiăiăchoăquyătrìnhă�ăv iăm tăđ ăxácă su tăd i (�),ă trongă lúcă cácă quáă trìnhă quană sátăX t+1 , X t+2 , … +� ă đ că t oă ra.ă Sauă đóă chuy năti păđ nătr ngătháiăjăv iăxácăsu tăchuy năđ iălƠăa ij ăchỉăsauăđóăcácăquanăsátă thíchăh pă�ăx yăraă ătr ngătháiăi.ăVìăth ,ăbằngăthi tăl păm tăđ ăxácăsu tăquyătrìnhăth iă gianăđ ăđ căm tăđ ătheoăc păs ămǜăc aăbi uăth că(3.15)ăquyătrìnhăth iăgianăHMMă cóăth ăđ căt oăraăt ngăđ ngăv iăHMMăchu n.ăCácăthamăbi năd i (�)ăcóăth ăđ că căl ngăt ăcácăquanăsátăphùăh păv iăcácăthamăbi năkhácăc aăHMMăđó.ăXétătínhă thi tăth c,ăm tăđ ăquyătrìnhăth ngăb ăc tăxénă ăgiáătr ăquyătrìnhăc căđ iăT d ăĐ ă că l ngăl iăcácăthamăbi năc aăHMMăv iămôăph ngăquyătrìnhăth iăgian,ăquáătrìnhăđ ă quyă ătr căđóăph iăđ căchỉnhăs aănh ăsau:
S ăchuy năti păt ătr ngătháiăi sangătr ngătháiăjăkhôngăchỉăph ăthu căxácăsu tă chuy năđ iăa ij ămƠăcònătrênăt tăc ăcácăkh ănĕngătrongăkho ngăth iăgiană�ăcóăth ăx yă raătrongătr ngătháiăj.ăBi uăth că(3.16)ăminhăh aăkhiătr ngătháiăjăđ căđ tăđ năt ătr ngă tháiăiătr căđó,ăcácăquanăsátăcóăth ăgi ă ătr ngătháiăjăchoăm tăkho ngăth iăgiană�ăv iă m tăđ ăquyătrìnhăd i (�),ăvƠăm iăquanăsátăt oăraăxácăsu tăđ uăraăc aăchínhănó.ăT tăc ă quyătrìnhăcóăkh ănĕngăph iăđ căxemăxét,ăv iăs ăt ngăk tămongămu năđ tăđ nă�.ăGi ă đ nhăđ căl păc aăcácăquanăsátămangăđ năk tăqu ătrongăthu tăng ă∏ăc aăcácăxácăsu tă đ uăra.ăT ngăt ,ăs ăđ ăquyă ăphíaăsauăcóăth ăđ căvi tănh ăsau:
Thuật toán Baum-Welch là phương pháp tối ưu hóa tham số của mô hình HMM dựa trên xác suất quan sát dữ liệu, giúp cải thiện độ chính xác của mô hình qua các vòng lặp Quá trình này liên quan đến việc tính toán xác suất kỳ vọng của các trạng thái ẩn dựa trên dữ liệu quan sát, sau đó cập nhật các tham số như xác suất chuyển trạng thái và xác suất phát ra sao cho tối đa hóa xác suất của dữ liệu Việc này giúp mô hình học hỏi từ dữ liệu thực tế, phù hợp hơn với các đặc điểm của dữ liệu đầu vào, đặc biệt trong các ứng dụng xử lý ngôn ngữ tự nhiên và nhận diện giọng nói Các bước của thuật toán bao gồm tính toán xác suất kỳ vọng (E-step) và tối ưu hóa tham số (M-step), lặp lại cho đến khi hội tụ Quá trình này phản ánh khả năng của Baum-Welch trong việc khai thác thông tin ngữ cảnh để cải thiện mô hình một cách liên tục.
Trongăth căt ,ăcácămôăph ngăquyătrìnhăđưăcungăc păs ăc iăti năbìnhăth ngă choănh năd ngăti ngănóiăliênăt căđ căl păng iănói.ăσhi uăh ăth ngăth măchíărútăraă xácăsu tăchuy năti păhoƠnătoƠnăb iăvìăcácăxácăsu tăđ uăraămangătínhăchiăph i.ăTuyă nhiên,ăthôngătinăquyătrìnhăr tăhi uăqu ăchoăvi căc tătỉaăkhôngăch căcácăph năthamăgiaă trongăquáătrìnhăgi iămưănh năd ngăti ngănóiăcóăb ăt ăv ngăl n.
3.1.4.2 Gi ăđ nhăb căđ uătiên:
Kho ngăth iăgianăt năt iăc aăm iăphơnăđo năc ăđ nhăgi ăbằngătr ngătháiăđ nă lƠăkhôngăth aăđángămôăhình.ăCáchăkhácăđ ălƠmăgi mănh ăv năđ ăkho ngăth iăgiană t năt iălƠăđ ălo iăb ăgi ăđ nhăs ăchuy năti păb căđ uătiênăvƠăđ ăt oănênădưyătrìnhăt ă tr ngătháiăd iăm tăchu iăMarkovăb căhai.ăK tăqu ălƠăxácăsu tăchuy năti păgi aăhaiă tr ngătháiă ăth iăđi mătăph ăthu căcácătr ngătháiămƠătrongăđóăquáătrìnhă ăth iăđi mătă
-ă1ăvƠătă-ă2.ăChoătr căm tădưyătr ngătháiăSă=ă{s1,ăs2,ăầăsT},ăxácăsu tăc aătr ngătháiă nênătínhătoánănh ăsau:
� = ∏ � − − ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(3.18) Trongăđóă �− �− � = | − − ălƠăxácăsu tăchuy năti pă ăth iăđi măt,ă choătr căhaiăb cătr ngăthái.ăTh ăt căs ă căl ngăl iăcóăth ăđ căm ăr ngăs năsƠngă trênăc ăs ă(3.18).
Trongăth căt ,ămôăhìnhăb căhaiăr tăt năkémătrongăquáătrìnhătínhătoánănh ă chúngătaăph iăxemăxétăkhôngăgianătr ngătháiăgiaătĕng,ămƠăcóăth ăth ngăđ cănh nă raă v iă môă hìnhă Markovă nă b că m tă t ngă đ ngă trênă khôngă giană tr ngă thái.ă σóă khôngăcungăc păgiaătĕngăđ ăchínhăxácăm tăcáchăđángăk ăđ ăs păx păchoăđ uănhauăs ă giaătĕngăc aănóătrongăđ ăph căt pătínhătoánăchoăh uăh tă ngăd ng.
3.1.4.3 Gi ăđ nhăđ căl păcóăđi uăkiện: Đi mă y uă chínhă th ă baă c aă HMMsă lƠă t tă c ăcácă khungă quană sátă đ uă ph ă thu căchỉătrênătr ngătháiăt oăraăchúng,ăkhôngăph iăg năk ăcácăkhungăquanăsát.ăGi ă đ nhă đ că l pă cóă đi uă ki nă khi nă nóă khóă mƠă x ă lỦă m tă cáchă hi uă qu ă cácă khungă khôngăc ăcóăm iăt ngăliênăm nhăm ăCóăm tăs ăcáchăđ ălƠmăgi mănh ăgi ăđ nhăđ că l păcóăđi uăki n.ăChẳngăh nănh ,ăchúngătaăcóăth ăgi ăđ nhăphơnăph iăxácăsu tăđ uăraă ph ăthu căkhôngănh ngătrênătr ngătháiămƠăcònătrênăkhungătr căđó.ăDoăđó,ăxácăsu tă c aătrìnhăt ătr ngătháiăchoătr căcóăth ăvi tăl iănh :
| , � = ∏ �= | − , , � ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(3.19) Vìăkhôngăgianăthamăbi nătr ănênăquáăl n,ăchúngătaăth ngăc năl ngăt ăhóaă
X t - 1 ătrongăm tăt păh pănh ăh năc aăcácăt ămưăđ ăcóăth ăgi ăchoăs ăcácăthamăbi năt ă doătrongăki măsoát.ăVìăv y,ăbi uăth că(3.20)ăcóăth ăđ căđ năgi nănh ăsau:
MỌăHÌσHăỂMăH C
L aăch năđ năv ăthíchăh păchoămôăhìnhăơmăh c
Đ iăv iăm cătiêuănh năd ngăti ngănóiătrênăb ăt ăv ngăl n,ăvi căxơyăd ngă cácămôăhìnhătoƠnăt ăg pănhi uăkhóăkhĕnăvì:
- M iătácăv ăm iăl iăch aăcácăt ăm iăl ămƠăkhôngăcóăb tăc ăd ăli uăhu nă luy năs năcóănƠo,ăchẳngăh nănh ngădanhăt ăriêngăvƠăcácăthu tăng ăm iăđ căđ aăra.
- Cóăquáănhi uăt ,ăvƠăcácăt ăkhácănhauănƠyăcóăth ăcóăcácăđ căđi măơmăthanhă khácănhau.ă
- Vi căl aăch năcácăđ năv ăc ăb năđ ăbi uădi năđ cătr ngăơmăh căvƠăthôngă tinăng ăơmăchoăngônăng ălƠăm tăv năđ ăr tăquanătr ngătrongăvi căthi tăk ăm tăh ă th ngăkh ăthi.ă
M tăs ăv năđ ăc năph iăxemăxétătrongăvi căl aăch năcácăđ năv ămôăhìnhăhóaă chínhăxác:
- Đ năv ănƠyăph iăchínhăxácăđ ăbi uădi năhi năth căơmăthanhăxu tăhi nătrongă cácăng ăc nhăkhácănhau.
- Đ năv ănƠyăph iăhu năluy năđ c.ăPh iăcóăđ ăd ăli uăđ ă căl ngăcácă thamăs ăchoăđ năv ănƠy.ăM cădùăt ălƠăđ năv ăchínhăxácăvƠătiêuăbi u,ăchúngăl iăítăcóă kh ă nĕngă hu nă luy nă nh tă trongă vi că xơyă d ngă m tă h ă th ngă kh ă thiă doă g nă nh ă khôngăth ăhu năluy năl păl iăhƠngătrĕmăl năchoăt tăc ăcácăt ,ătr ăkhiătaăxơyăd ngăm tă b ănh năd ngătrongăm tălƿnhăv căc ăth
- Đ năv ănƠyăph iăcóătínhăt ngăquátăđ ăb tăc ăt ăm iănƠoăcǜngăcóăth ă k ă th aăt ăm tăb năđ căđ nhănghƿaătr căđ iăv iăh ăth ngănh năd ngăti ngănóiăđ căl pă tácăv ăσ uăcóăm tăt păt păc ăđ nhăcácămôăhìnhăt ăthìăg nănh ăkhôngăcóăcáchănƠoăđ ă m tămôăhìnhăt ăm iăk ăth aăt ăđó
Trongăti ngăAnh,ăt ăth ngăđ căcoiălƠăđ năv ănh ănh tămangăỦănghƿaăvƠăcóă th ăs ăd ngăđ căl p.ăLƠăđ năv ăt ănhiênănh tăc aăti ngănói,ămôăhìnhătoƠnăt ăđưăđ că s ăd ngăr ngărưiăchoănhi uăh ăth ngănh năd ngăti ngănói.ăM tăl iăth ăc aăvi căs ă d ngămôăhìnhăt ălƠătaăcóăth ăn măb tăcáchăphátăơmăv năcóătrongănh ngăt ănƠy.ăKhiă b ăt ăv ngănh ,ătaăcóăth ăt oăcácămôăhìnhăt ăph ăthu căng ăc nh.
Trongă khiă t ă lƠă đ nă v ă phùă h pă choă nh nă d ngă ti ngă nóiă trênă b ă t ă v ngă nh ,ăchúngăl iăkhôngăph iălƠăl aăch năt tăđ iăv iănh năd ngăti ngănóiăliênăt cătrênă b ăt ăv ngăl năvìănh ngălỦădoăsau:
- M iăt ăph iăđ căx ălỦăriêngăl ,ă vƠăd ăli uă khôngăth ăđ căchiaăs ă v iă nhauătrongămôăhìnhăt ăĐi uănƠyăkhi năchoăs ăl ngăd ăli uăhu năluy năc năthi tălƠă r tăl n.
- Đ iă v iă m tă s ă tácă v ,ă cácă t ă v ngă nh nă d ngă cóă th ă baoă g mă cácă t ă khôngăxu tăhi nătrongăt păhu năluy n.
- R tăkhóăđ ălƠmăthíchănghiăm tămôăhìnhăt ăs năcóăchoăm tăng iănóiăm i,ă m tăkênhăm iăhayăm tăng ăc nhăm i.
ThayăvƠoăđó,ăchỉăcóăkho ngă50ăơmăt ătrongăti ngăAnhăvƠăchúngăcóăth ăđ că hu năluy năđ yăđ ăchỉăv iăvƠiătrĕmăcơu.ăKhôngănh ămôăhìnhăt ,ămôăhìnhăng ăơmă khôngăphátăsinhănhi uăv năđ ătrongăvi căhu năluy n.ăH năn a,ăchúngăđ căl păv iăt ă v ngăvƠăcóăth ăđ căhu năluy nătrênătácăv ănƠyăvƠăki mătraătrênătácăv ăkhác.ăDoăđó,ă cácăơmăt ăcóăkh ănĕngăhu năluy năcaoăh năvƠăt ngăquátăh n.ăTuyănhiên,ămôăhìnhă ng ăơmăkhôngăth aăđángăvìănóăgi ăđ nhărằngăm tăơmăv ătrongăm iăng ăc nhălƠăgi ngă nhau.ăDùătaăcóăth ăc ăg ngănóiăm iăt ănh ălƠăm tăchu iămócăn iăv iănhauăc aăcácă ơmăv ăđ căl p,ăcácăơmăv ănƠyăkhôngăđ căphátăsinhăm tăcáchăđ căl păvìăkh părĕngă c aătaăkhôngăth ădiăchuy năngayăl păt căt ăv ătríănƠyăđ năv ătríăkhác.ăDoăđó,ăhi nă th căc aăm tăơmăv ăb ă nhăh ngăm nhăm ăb iăcácăơmăv ăk ăsátănó.ăTrongăkhiămôă hìnhăt ăkhôngăt ngăquát,ămôăhìnhăng ăơmăl iăquáăt ngăquát,ăvƠăd năđ nămôăhìnhă kémăchínhăxác.
M tăs ăk tăh păgi aămôăhìnhăt ăvƠămôăhìnhăng ăơmălƠăs ăd ngăm tăđ năv ă ơmăti t.ăCácăđ năv ănƠyăbaoăg măcácăbóăơmăt ăch aăđ ngăh uăh tăcácătácăđ ngăthayă đ iăng ăc nh.ăTuyănhiênăătrongăkhiăph năgi aăc aăđ năv ănƠyăkhôngăph ăthu căng ă c nh,ăph năb tăđ uăvƠăph năcu iăv năb ătácăđ ngăb iăm tăvƠiătácăđ ngăng ăc nh.
3.2.1.2 L aăch năđ năv ăhu năluyệnăchoăti ngăViệt:
Trongăti ngăVi tăti ngălƠăđ nă v ăt ănhiênănh tăc uăt oănênăl iănói,ătuyăs ă l ngăti ngătrongăti ngăVi tăcóăgi iăh năkho ngă6.000-8.000ănh ngăn uăđ ngă ăgócă đ ănh năd ngăti ngănóiăthìăđóălƠăm tăs ăl ngăđángăk ă
Trongăkhiăđó,ăơmăv ătrongăti ngăVi tăbaoăg m:
- 22ăph ăơmăđ uăbaoăg mă/b,ăm,ăf,ăv,ăt,ăt’,ăd,ăn,ăz,ăʐ,ăs,ăş,ăc,ăʈ,ă ,ăl,ăk,ăχ,ăŋ,ă ,ă h,ăʔ/
- 1ăơmăđ mă/w/cóăch cănĕngălƠmtrầm hóa ơmăs căc aăơmăti t.
-16ăơmăchínhăbaoăg mă13ănguyênăơmăđ năvƠă3ănguyênăơmăđôi:ă/i,ăe,ăε,ă ,ă ớ,ă a,ăɯ,ăĕ,ău,ăo,ăɔ,ăɔớ,ăεớ,ăie,ăɯ ,ăuo/
- 8ăơmăcu iătíchăc căbaoăg mă6ăph ăơmă/m,ăn,ăŋ,ăp,ăt,ăk/ăvƠă2ăbánănguyênă ơm/-w,ă-j/.
Cóăth ăth yăs ăl ngăơmăv ăkhôngănhi u,ădoăđó,ăvi că ngăd ngămôăhìnhăng ă ơmăvƠoănh năd ngăti ngăVi tălƠăm tăgi iăphápăđángăquanătơm.ăTuyănhiênăv năđ ăkhóă khĕnăđ iăv iăti ngăVi tăchínhălƠăthanhăđi u.
Tuyă thanhă đi uă nhă h ngă lênă toƠnă b ă ti ng,ă nh ngă cóă th ă th yă nóă nhă h ngănhi uănh tălƠă ăcácănguyênăơm.ăVìăv yătaăcóăth ăchiaăm iănguyênăơmăraăthƠnhă6ăơm,ăt ngă ngă v iă6ăthanhăđi u.ăσh ăv yă t ngăs ăl ngăơmăc năhu năluy nălƠă kho ngă137ăơm,ănh ăh nănhi uăsoăv iăhu năluy nătheoăti ng.
Đánhăgiáăđ cătr ngăơmăh c
Sauă khiă táchă đ că tr ng,ă taă cóă m tă t pă cácă vectoră đ că tr ngă X,ă chẳngă h nă vectorăMFCCălƠăcácăd ăli uăđ uăvƠo.ăTaăc năph iă căl ngăxácăsu tăc aăcácăđ că tr ngăơmăh cănƠy,ăchoătr cămôăhìnhăt ăho cămôăhìnhăng ăơmăW,ăđ ăcóăth ănh nă d ngă d ă li uă đ uă vƠoă choă t ă đúng.ă Xácă su tă nƠyă đ că g iă lƠă xácă su tă ơmă h c,ă P(X|W).ă
Cóăth ăs ăd ngăcácăHMMăr iăr c,ăliênăt căho căbánăliênăt c.ăKhiăs ăl ngă d ăli uăhu năluy năđưăđ ,ăthamăs ărƠngăbu cătr ănênăkhôngăc năthi t.ăM tămôăhìnhă liênăt căv iăm tăs ăl ngăl năcácătr năl năd năđ năđ ăchínhăxácănh năd ngăt tănh t,ă m cădùăđ ăph căt pătínhătoánăc aănóăcǜngăăgiaătĕngătuy nătínhăv iăs ăl ngăcácăh nă h p.ăM tăkhác,ămôăhìnhăr iăr căcóăhi uăqu ăv ăm tătínhătoán,ănh ngăcóăhi uăsu tă th pănh tătrongăbaămôăhình.ăMôăhìnhăbánăliênăt căcungăc păm tăthayăth ăkh ăthiăgi aă kh ănĕngăhu năluy năvƠătínhăm nhăm ăc aăh ăth ng.
Khiăm tătrongăHMMăr iăr căhayăbánăliênăt căđ căs ăd ng,ăvi cădùngănhi uă codebookă choă m tă s ă đ că tr ngă s ă nơngă caoă hi uă su tă m tă cáchă đángă k ă M iă codebookăbi uădi năm tăt păcácăthamăs ăkhácănhau.ăM tăcáchăđ ăk tăh păcácăquană sátănhi uăđ uăraălƠăgi ăđ nhărằngăchúngăđ căl păv iănhau,ătínhătoánăxácăsu tăđ uăraă nh ălƠăs năph măc aăcácăxácăsu tăm iăcodebook.
= ∏ ∑ = ∣∣ ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(3.23) Trongă đó,ămă bi uă th ă cácă thamă s ă t ngă ngă codebook-m.ă M iă codebookă g măcóăcácăhƠmăm tăđ ăliênăt căh năh păL m
Thu tă toánă đánhă giáă l iă môă hìnhă Markovă nă d aă trênă nhi uă codebookă (multiple-codebook-basedăHMM)ăcóăth ăđ căm ăr ng.ăTíchăc aăm tăđ ăxácăsu tă đ uăraăc aăm iăcodebookăd năđ năcácătermăđ căl pătrongăhƠmăQ,ăv iăcodebook-m, ξ t
(j, k m ) cóăth ăđ căchỉnhăl iănh ăsau:
S ăd ngănhi uăcodebookăcóăth ălƠmăgiaătĕngănhanhăchóngăkh ănĕngăc aăVQă codebookăvƠăcóăth ăc iăti năc ăb năđ ăchínhăxácănh năd ngăti ngănói.ăTaăcóăth ăxơyă d ngăm tăcodebookăđi năhìnhăchoăc k ,ă∆c k ăvƠă∆∆c k ăl năl tătheoăth ăt ăSoăsánhăvi că xơyăd ngăm tăcodebookăđ năchoăx k ,ănh ăhìnhăd i,ăh ăth ngămultiple-codebookăcóă th ăgi măthi uătỷăl ăl iăh nă10%.
Hình 3.9 Tỉ lệ lỗi từ giữa các mô hình
Cóăth ăth yăHMMăbánăliênăt căcóăm căc iăti năđ ăchínhăxácănằmăgi aămôă hìnhăHMMăr iăr căvƠăHMMăliênăt căkhiăs ăl ngăd ăli uăhu năluy năcóăgi iăh n.ă Khiătaătĕngăkíchăth căd ăli uăhu năluy n,ăHMMăm tăđ ăh năh păliênăt căb tăđ uă t tăh năhẳnăsoăv iăc ăHMMăr iăr căvƠăHMMăbánăliênăt c,ădoăđóăvi căchiaăs ăcácă thamăs ămôăhìnhătr ănênăítăquanătr ngăh n.
Bài viết nhấn mạnh tầm quan trọng của việc tối ưu hóa hệ thống mạng để nâng cao hiệu quả truyền tải dữ liệu Các giải pháp như sử dụng công nghệ Gaussian giúp giảm thiểu sự mất mát dữ liệu và cải thiện tốc độ truyền tải lên đến 10-15% Ngoài ra, việc áp dụng các phương pháp liên kết và phân phối hợp lý còn giúp tăng năng suất lên đến 20% hoặc cao hơn, nhờ vào việc tối ưu hóa cấu trúc mạng và xử lý các yếu tố gây nhiễu Việc phân tích chính xác các dữ liệu mạng chính là chìa khóa để giảm thiểu thời gian trễ và nâng cao độ ổn định của hệ thống.
3.2.2.2 Hu năluyệnăti ngănóiăr iăr căsoăv iăliênăt c: σ uătaăxơyăd ngăm tăHMMăt ăchoăm iăt ătrongăb ăt ăv ngăchoănh năd ngă ti ngănóiăr iăr c,ăquáătrìnhăhu năluy năho cănh năd ngăcóăth ăđ căth căhi năm tă cáchă tr că ti p,ă s ă d ngă cácă thu tă toánă c ă b nă đ că trìnhă bƠyă ă ph nă môă hìnhă Markovă n.ăĐ ă căl ngăcácăthamăs ă môăhình,ăcácăm uăc aăm iăt ătrongăb ăt ă v ngăđưăđ căthuăth p.ăCácăthamăs ămôăhìnhăđ că căl ngăt ăt tăc ăcácăcácăm uă s ăd ngăthu tătoánăforward-backwardăvƠăcôngăth că căl ngăl i.ăKhôngăc năthi tă ph iăxácăđ nhăđi măcu iădoămôăhìnhăkho ngăl ngăt ăđ ngăxácăđ nhăgi iăh năc aănóă n uătaămócăn iăcácămôăhìnhăkho ngăl ngăv iămôăhìnhăt ă ăc ăhaiăđi măđ uăvƠăcu i. σ uăcácămôăhìnhăng ăơmăđ căs ăd ng,ătaăc năph iăchiaăs ăchúngăgi aăcácă t ăkhácănhauăđ iăv iănh năd ngăti ngănóiătrênăb ăt ăv ngăl n.ăCácăđ năv ăng ăơmă đ cămócăn iăđ ăt oăthƠnhăm tămôăhìnhăt ,ăcóăth ăthêmăcácămôăhìnhăkho ngăl ngăt iă đi măđ uăvƠăđi măcu i. Đ ămócăn iăcácăng ăơmăthƠnhăd ngămôăhìnhăt ,ăcóăth ăcóăs ăchuy năđ iăt ă tr ngătháiăcu iăcùngăc aămôăhìnhăMarkovă năng ăơmătr căsangătr ngătháiăkh iăt oă c aămôăhìnhăMarkovă năc aăng ăơmăk ăti p.ăCóăth ă căl ngăcácăthamăs ăc aămôă hìnhăMarkovă nă mócăn i.ăL uăỦărằngă vi căthêmăcungăchuy nătr ngătháiăr ngănênă th aă mưnă xácă su tă rƠngă bu că v iă xácă su tă chuy nă tr ngă tháiă c aă m iă môă hìnhă Markovă nă ng ă ơm.ă σ uă că l ngă cácă thamă s ă v iă môă hìnhă mócă n i,ă xácă su tă chuy nătr ngătháiăcungăr ngăa ij g ph iăth aămưnărƠngăbu c:
∑ + = ăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăăă(3.25)Vìăv y,ăxácăsu tăchuy nătr ngătháiăvòngăt ăl păc aătr ngătháiăcu iăcùngăluônă nh ăh nă1.ăĐ iăv iăk tăn iăliênăt ăhayămócăn iăbaoăg mănhi uăcáchăphátăơm,ătaăcóă th ăs ăd ngănhi uăcungăr ngăđ ămócăn iăcácămôăhìnhăđ năl ăv iănhau.
Trongăvíăd ătrongăhìnhăd i,ătaăcóă10ăch ăs ăti ngăAnhătrongăb ăt ăv ng.ă Xơyă d ngă m tă môă hìnhă Markovă nă choă m iă ơmă t ă ti ngăAnh.ă T ă đi nă cungă c pă thôngătinăcáchăphátăơmăc aăm iăt ăTrongăđóăcóăm tăt ăđ căbi tălƠăSilence,ăánhăx ă v iă/sil/ătrongămôăhìnhăMarkovă năcóăd ngătopologyănh ămôăhìnhăMarkovă năng ă ơmăchu n.ăV iăm iăt ătrongăb ăt ăv ng,ăđ uătiênătaăd năxu tăchu iăng ăơmăchoăm iă t ătrongăt ăđi n.ăSauăđóăk tăn iăcácămôăhìnhăng ăơmăv iănhauăthƠnhăd ngăm tămôă hìnhăMarkovă năm tăt ăchoăm iăt ătrongăb ăt ăv ng.
Hình 3.10 Cấu trúc của một mô hình từ rời rạc
Víăd ăv iăt ătwo,ăđ uătiênăt oăm tămôăhìnhăt ăb tăđ uăb iăsilenceă/sil/,ăơmăt ă /t/,ă/uw/ăvƠăk tăthúcăbằngăsilenceă/sil/.ăMôăhìnhăt ămócăn iăsauăđóăđ căxemănh ă m tă môă hìnhă Markovă nă t ngă h pă l nă chu n.ă S ă d ngă thu tă toánă Forward- Backwardă chu nă đ ă că l ngă cácă thamă s ăc aă môă hìnhă Markovă nă t ngă h pă t ă nhi uăm uăgi ngănóiăc aăt ătwo.ăSauăvƠiăl năl păl iăs ăt ăđ ngăthuăđ căcácăthamăs ă môăhìnhăMarkovă năchoă/sil/,ă/t/ăvƠă/uw/.ăDoăm tăơmăt ăcóăth ăđ căchiaăs ătrênăcácă t ăkhácănhau,ăcácăthamăs ăng ăơmăcóăth ăđ că căl ngăt ăd ăli uăơmăh cătrongă cácăt ăkhácănhau.
Kh ănĕngăt ăđ ngăs păx păm iămôăhìnhăMarkovă năđ năl ăthƠnhăchu iăquană sátăti ngănóiăkhôngăphơnăđo năt ngă ngălƠăm tătrongănh ngătínhănĕngăm ngăm ă nh tă trongă thu tă toánă Forward-Backward.ă Khiă s ă d ngă ph ngă phápă mócă n iă môă hìnhăMarkovă năchoăti ngănóiăliênăt căc năph iăs păx pănhi uăt ăthƠnhăd ngăm tămôă hìnhăMarkovă năcơuăd aătrênăb năghiăc aăl iănói.ăThu tătoánăForward-Backwardăh pă th ăm tădưyăcácăthôngătinăranhăgi iăt ăcóăth ăc aăcácămôăhìnhăm tăcáchăt ăđ ng,ăvìă th ăkhôngăc năph iăphơnăđo năti ngănóiăliênăt căm tăcáchăchínhăxác Đ ă căl ngăcácăthamăs ăc aămôăhìnhăMarkovă n,ăm iăt ăđ căkh iăt oă v iămôăhìnhăt ămócăn i.ăCácăt ătrongăcơuăđ cămócăn iăv iăcácămôăhìnhăsilenceătùyă ch năgi aăchúng.ă σóiăchung,ămôăhìnhăMarkovă năcơuăk tăn iăcóăth ăđ căhu năluy năs ăd ngă thu tătoánăforward-backwardăv iăchu iăquanăsátăt ngă ng.ăDoămôăhìnhăMarkovă nă toƠnăcơuăđ căhu năluy nătrênătoƠnăb ăchu iăquanăsátăchoăcơuăt ngă ng,ăh uăh tă cácăgi iăh năt ăcóăth ăđ uăđưăđ căxemăxét.ăCácăthamăs ăc aăm iămôăhìnhăđ căd aă trênăs ăliênăk tătr ngătháiăv iăti ngănóiă(state-to-speechăaligments)ăđó.ăPh ngăphápă hu năluy nănh ăv yăchoăphépăt ădoăhoƠnătoƠnăđ ăliênăk tăcácămôăhìnhăcơuăđ iăv iă quanăsátănƠy,ăvƠăkhôngăc năph iăc ăg ngătìmăgi iăh năt
Trongă gi iă mưă ti ngă nói,ă m tă t ă cóă th ă b tă đ uă vƠă k tă thúcă ă b tă kỳă đơuă trongăph măviătínăhi uăti ngănóiăchoătr c.ăVìăcácăgi iăh năt ăkhôngăth ăđ căphátă hi năm tăcáchăchínhăxác,ăt tăc ăcácăđi măb tăđ uăvƠăk tăthúcăph iăđ cătínhăđ n.
Hình 3.11 Mô hình Markov ẩn câu tổng hợp
Ph ngăphápătínhătoánăl i
căl ngăhi uăsu tăc aăcácăh ăth ngănh năd ngăti ngănóiălƠăm tăcôngăvi că r tăquanătr ng.ăTỷăl ăl iănh năd ngăt ăđ căs ăd ngăr ngărưi.ăKhiăsoăsánhăcácăthu tă toánămôăhìnhăơmăh c,ăđi uăquanătr ngălƠăsoăsánhăs ăgi măl iăt ngăđ iăc aăchúng.ă
Ph iăki mătraăm tăt păd ăli uăg măh nă500ăcơuă(v iă6ăđ nă10ăt ăm iăcơu)ăc aăt ă5ă đ nă10ăng iănóiăđ ă căl ngătỷăl ăl iănh năd ngăm tăcáchătinăc y.ăThôngăth ng,ă m tăthu tătoánăm iăđ căxemălƠăphùăh păkhiăgi măthi uăđ căt ă10%ăl iăătr ălên.
Cóă3ălo iăl iănh năd ngăt ăđi năhìnhătrongănh năd ngăti ngănói:
- Thayăt ă(Substitution):ăm tăt ăkhôngăđúngăthayăth ăchoăm tăt ăđúng.
- Xóaăt ă(Deletion):ăm tăt ăđúngăb ălo iăb ătrongăcơuănh năd ng.
- Thêmăt ă(Insertion):ăm tăt ăkhácăđ căthêmăvƠoătrongăcơuănh năd ng. Đ ăxácăđ nhătỷăl ăl iănh ănh t,ăs ăd ngăcôngăth căsau:
Trong quá trình xử lý và phân tích ngôn ngữ tự nhiên, việc hiểu rõ các mối liên hệ giữa các thành phần trong câu giúp tăng cường hiệu quả mô hình Các phương pháp tiếp cận dựa trên thống kê như mô hình ngôn ngữ Stochastic đóng vai trò quan trọng trong việc dự đoán từ tiếp theo dựa trên các dữ liệu đã huấn luyện Nhờ đó, mô hình có khả năng sinh văn bản tự nhiên, phù hợp với ngữ cảnh và ý nghĩa của đoạn văn Các kỹ thuật này cũng hỗ trợ tối ưu hóa các thuật toán cốt lõi trong xử lý ngôn ngữ, từ đó nâng cao chất lượng dịch thuật tự động, phân loại nội dung và tạo ra các ứng dụng AI đa dạng Hiểu rõ các phương pháp thống kê và mô hình ngôn ngữ là chìa khóa để phát triển các hệ thống AI thông minh, có khả năng thích nghi và phản hồi chính xác theo ngữ cảnh người dùng.
Cáchăph ăbi nănh tăbi uădi năcơu:ă“Mary loves that person”,ălƠăs ăd ngăcơyă nh ăminhăh aătrongăhìnhă(3.12).ăσútăSălƠănútăchaăc aănútăNP vƠăVPăchoăc mădanhăt ă vƠăc măđ ngăt ăm tăcáchămongăđ i.ăσútăVPălƠănútăchaăc aănútăVăvƠăNăchoăđ ngăt ă vƠădanhăt ăM iănútăláăđ căliênăk tă v iăt ătrongăcơuăđ ăđ căphơnătích.ăĐ ăxơyă d ngăm tăcơyăchoăm tăcơu,ăchúngătaăph iăbi tăc uătrúcăc aăngônăng ăVìăv yăt păcácă nguyênă t că vi tă l iă cóă th ă đ că s ă d ngă đ ă môă t ă c uă trúcă cơyă đ că choă phép.ă σh ngă lu tă nƠy,ă xácă đ nhă m tă kỦă hi uă ch căch nă cóă th ă đ că m ă r ngă trongă cơyă bằngăm tădưyăcácăkỦăhi u.ăC uătrúcăng ăphápăh ătr ătrongăvi căxácăđ nhăỦănghƿaăc aă cơu.ăσóăchoăchúngătaăbi tă“that”ătrongăcơuăchỉăperson.
Hình 3.12 Một biểu diễn cây của một câu và ngữ pháp tương ứng của nó
TrongălỦăthuy tăngônăng ăhìnhăth căChomsky,ăm tăc uătrúcăng ăphápăđ că đ nhănghƿaăG = (V, T, P, S),ătrongăđóăVăvƠăTălƠăt păh uăh năc aăcácăkỦăhi uăcu iăvƠă cácăkỦăhi uăkhôngăph iăcu i.ăVăbaoăg măt tăc ăcácăkỦăhi uăkhôngăph iăkỦăhi uăk tă thúc.ăChúngătaăth ngăs ăd ngăch ăhoaăđ ăbi uăth ăchúng.ăT păthu tăng ăTăbaoăg mă
Mary, loves, that, person,ăđ căbi uăth ăch ăth ng.ăPălƠăt păh uăh năc aăvi căvi tă l iăcácăquyăt c.ăSălƠăm tăkỦăhi uăđ căbi t,ăđ căg iălƠăkỦăhi uăb tăđ u.
Bảng 3.1 Hệ thống cấp bậc Chomsky và máy tương ứng cho phép ngôn ngữ
Lo i RƠngăbu c Hệăth ngăt ă σg ăphápăc uă đ ng trúcă αβ.ăĐơyălƠăng ăphápăt ngăquátănh t MáyăTuring σg ăphápăng ă c nhănh y M tăt păconăc aăng ăphápăc uătrúcăc măt ă
|α|≤|β|,ătrongăđóă|.|ăchoăbi tăchi uădƠiăc aă chu i.
H ăth ngăt ă đ ngătuy nătính σg ăphápăng ă c nhăt ădoă(CFGă
M tăt păconăc aăng ăphápăng ăc nhănh y.ă Quyăt căt oăraălƠăAăăβ,ătrongăđóăAălƠăă khôngăph iălƠăkỦăhi uăk tăthúc.ăHìnhăth că Chomsky:ăAăwăvƠăABC,ătrongăđóăwălƠă m tăkỦăhi uăk tăthúcăvƠăB,ăCăkhôngăph i.
H ăth ngăt ă đ ngăthúcăđ y σg ăphápăthôngă th ng M tăt păconăc aăCFG.ăQuiăt căt oăraăđ că môăt :ăAwăvƠăAwB H ăth ngăt ă đ ngătr ngătháiă h uăh n σgônăng ăđ căphơnătíchăv ăc ăb nălƠăm tăchu iăcácăkỦăhi uăthu tăng ,ănh ă
Mary yêu người đó vì tình cảm chân thành, phản ánh qua cách cô ấy dành thời gian và sự quan tâm đặc biệt Trong lý thuyết về ngôn ngữ, Chomsky nhấn mạnh khả năng của ngôn ngữ con người để biểu đạt ý tưởng phức tạp thông qua các quy tắc ngược dòng Điều này cho thấy hệ thống ngôn ngữ có cấu trúc nội tại hết sức linh hoạt, phản ánh khả năng suy nghĩ và diễn đạt của con người vượt ra ngoài các quy luật cơ bản Các mô hình như chuỗi Markov và mạng nơ-ron đã mở rộng hiểu biết của chúng ta về cách dự đoán và phân tích dữ liệu ngôn ngữ, giúp nâng cao hiệu quả trong xử lý tự động và truyền tải thông tin Tất cả những điều này khẳng định rằng ngôn ngữ không chỉ là phương tiện giao tiếp, mà còn là hệ thống phức tạp phản ánh những quy luật sâu xa và khả năng sáng tạo vô hạn của con người.
3.3.1.2 Phơnă tíchă cúă phápă đ ă th ă choă ng ă phápă ng ă c nhă t ă doă (CFGă-ăContextăFreeăGrammars):
Thu tătoánănƠyăđ căs ăd ngăr ngărưiătrongăcácăh ăth ngăhi uăngônăng ănóiă tiênăti n.
Từ trên xuống hay từ dưới lên:
PhơnătíchăcúăphápălƠăm tătr ngăh păđ căbi tăc aăv năđ ătìmăki măm tăcáchă t ngăquátăb tăg pătrongănh năd ngăti ngănói.ăTh ăt cătìmăki măcóăth ăb tăđ uăt ănútă g căc aăcơyăv iăkỦăhi uăS,ăngoƠiăraăcóăth ăb tăđ uăt ăcácăt ătrongăcơuănh păvƠoăvƠă xácăđ nhăm tăcơuăt ăsaoăchoăkh păm tăvƠiăkỦăhi uăkhôngăk tăthúc.ăTh ăt căt ăd iă lênăcóăth ăđ cănh căl iăv iăcácăkỦăhi uăphơnătíchăt ngăph năchoăđ năkhiănútăg că c aăcơyăho căkỦăhi uăb tăđ uăSăđ căxácăđ nh.ă
M tăph ngăphápăt ătrênăxu ngăb tăđ uăv iăS,ăsauăđóătìmăki măthôngăquaă nh ngăcáchăkhácăđ ăvi tăl iăcácăkỦăhi uăchoăđ năkhiăcơuănh păvƠoăđ căt oăra,ăhayă đ năkhiăt tăc ăxácăsu tăđ căki mătra.ăM tăd ngăăng ăphápăđ cănóiăđ năch pănh nă m tăcơuăn uăcóăm tăcơuăc aăcácăquiăt căchoăphépăchúngătaăvi tăl iăkỦăhi uăb tăđ uă trongăcơu.ăM tăcơuăc aăcácăquiăt căvi tăl iăcóăth ăđ căminhăh aănh ăsau:
σPăVPă(vi tăl iăSăs ăd ngăsσP)
ăσAMEăVPă(vi tăl iăσPăs ăd ngăσPσAME)
ăMaryăVPă(vi tăl iăσAMEăs ăd ngăσAMEMary) ầ
ăMaryălovesăthatăpersonă(vi tăl iăσăs ăd ngăσperson)
M tăcáchăthayăđ i,ăchúngătaăcóăth ăl yăcáchăti păc năt ăd iălênăđ ăb tăđ uă v iănh ngăt ătrongăcơuănh păvƠoăvƠăs ăd ngăquiăt căghiăl iăphíaăsauăđ ăgi măcơuăc aă cácăkỦăhi uăchoăđ năkhiănóătr ăthƠnhăS.ăPhíaăbênătayătráiăhayăm iăquiăt căđ căs ă d ngăđ ăghiăl iăkỦăhi uătrênăphíaăbênătayăph iănh ăsau:
ăσAMEălovesăthatăpersonă(ghiăl iăMaryăs ăd ngăNAMEMary)
ăσAMEăVăthatăpersonă(ghiăl iălovesăs ăd ngăB loves) ầ
ăσPăVPă(ghiăl iăσPăs ăd ngăSσPăVP)
Dưới đây là các câu khóa quan trọng phản ánh nội dung chỉnh chu của bài viết, tối ưu hóa theo quy tắc SEO: Việc thực hiện các biện pháp phù hợp góp phần nâng cao hiệu quả công trình Việc áp dụng những phương pháp đúng đắn giúp đảm bảo tiến độ và chất lượng dự án Đồng thời, các giải pháp còn hạn chế rủi ro và tối ưu hóa nguồn lực Đầu tư vào các phương pháp này sẽ mang lại lợi ích lâu dài cho các nhà xây dựng và khách hàng.
Phân tích cú pháp đồ thị từ dưới lên:
B că1:ăkh iăt o:ăđ nhănghƿaăm tădanhăsáchăđ căg iălƠăbi uăđ ăđ ăl uătr ăcácă hìnhă cungă vƠă m tă danhă sáchă đưă g iă danhă sáchă m tă s ă v nă đ ă đ ă l uă cácă thƠnhă ph năchoăđ năkhiăchúngăđ căthêmăvƠoăbi uăđ
B că2:ăl păl iăt ăb că2ăđ năb că7ăđ năkhiăkhôngăcònăd ăli uăđ uăvƠo.
B că3:ăthêmăvƠoăvƠăl yăraăt ădanhăsách:ăn uădanhăsáchălƠăr ng,ătìmăki măt ă ti pătheoătrongăđ uăvƠoăvƠăthêmăchúngăvƠoădanhăsách.ăL yăthƠnhăph năCăt ădanhă sách.ăσ uăCăt ngă ngăv iăv ătríăt ăw i đ năw j ăc aăcơuănh păvƠo,ăchúngătaăchiăbi uă th ănóăC[i, j].
B că 5:ă thêmă hìnhă cungă đánhă d uă vƠoă bi uă đ ăV iă m iă quiă t că trongă ng ă phápăd ngăXC Yă,ăthemăvƠoăđ ăth ăm tăhìnhăcungăd ngăX[i, j] o CY,ătrongăđóă o ă choăbi tăv ătríăquanătr ngăg iălƠăkhóaăbi uăth ăm iăth ătr că o ăcóăth ănhìnăth y,ă nh ngăsauă o ăch aăđ căliênăk t.
B că 6:ă diă chuy nă o ă qua:ă choă b tă c ă hìnhă cungă cóă hi uă l că c aă d ngă
X[1,j] Y… o C…Ză (tr căw i )ă trongă đ ă th ,ă themă m tă hìnhă cungă m iă cóă d ngă
B că 7:ă thêmă thƠnhă ph nă m iă vƠoă danhă sách:ă v iă m iă hìnhă cungă d ngă
Trong đoạn văn này, tác giả nhấn mạnh về sự tự do trong suy nghĩ và hoạt động của con người, cho thấy rằng chúng ta có thể thoải mái sáng tạo mà không bị giới hạn bởi những quy tắc cố hữu Đồng thời, nó cũng đề cập đến tầm quan trọng của việc giữ gìn tinh thần tự do để khám phá những ý tưởng mới mẻ và vượt qua những rào cản tâm lý Việc này giúp mở rộng khả năng tư duy và thúc đẩy sáng tạo trong cuộc sống hàng ngày.