3.Frequency Analysis for Audio3.1 Introduction 3.2 Fourier Analysis 3.3 The Fourier Transform 3.4 The Fourier Series 3.5 The Discrete-Time Fourier Transform 3.6 The Discrete Fourier T
Trang 1AUDIO AND SPEECH PROCESSING WITH MATLAB
Trang 23.Frequency Analysis for Audio
3.1 Introduction
3.2 Fourier Analysis
3.3 The Fourier Transform
3.4 The Fourier Series
3.5 The Discrete-Time Fourier Transform
3.6 The Discrete Fourier Transform (DFT)
3.7 Forward and Backwards Transform for the Four Types of Fourier Transforms
3.8 Example Discrete Fourier Transform
3.9 The Fast Fourier Transform: FFT
3.10 Windowing to Decrease Spectral Leakage and Improve Frequency Resolution
3.11 The Fast Fourier Transform (FFT): Its Use in Matlab
3.12 Zero Padding the FFT
3.13 Short-Term Fourier Transform: STFT
3.14 Frequency Domain Audio Processing Using the STFT 3.16 Audio Spectrograms and the Inverse STFT
3.15 Audio Spectrograms
3.16 Spectrogram Using Matlab
Trang 33 Frequency Analysis for Audio
3.2 Fourier Analysis
-Phân tích Fourier chính là biểu diễn các hàm số bằng xấp xỉ tổng của các hàm lượng giác đơn giản hơn
Trang 43.2 Fourier Analysis
Trang 63.2 Fourier Analysis
Trang 73.3 The Fourier Transform
Trang 83.3 The Fourier Transform
Continuous-Time Fourier Transform (CTFT) hay còn gọi tắt là Fourier Transform (FT)
Sử dụng cho các tín hiệu liên tục, vô hạn và không tuần hoàn ở cả 2 miền thời gian
và tần số
Được sử dụng để phân tích tín hiệu âm thanh ở thực tế (tín hiệu tương tự)
Trang 93.3 The Fourier Transform
3.3.1 Parseval’s Relation
Tổng năng lượng của tín hiệu x sẽ bằng tổng năng lượng của tín hiệu biến đổi X
Trang 103.4 The Fourier Series
Biến đổi Chuỗi Fourier dùng cho tín hiệu liên tục và hữu hạn tuần hoàn ở miền thời gian
Tín hiệu rời rạc, vô hạn và không tuần hoàn ở miền tần số
Trang 113.4 The Fourier Series
3.4.1 Parseval’s Relation (for Fourier Series)
Trang 123.5 The Discrete-Time Fourier Transform
Các tín hiệu rời rạc, vô hạn và không tuần hoàn ở miền thời gian.Các tín hiệu liên tục, hữu hạn tuần hoàn ở miền tần số
Trang 133.6 The Discrete Fourier Transform (DFT)
- DFT áp dụng cho một chu kỳ (tức là được xác định trong một phạm vi hữu hạn trong trường hợp độ dài N) tín hiệu rời rạc trong miền thời gian:
x[n] : n = 0, 1, 2, N - 1
- Tín hiệu rời rạc được biến đổi trong miền tần số hữu hạn có cùng độ dài như tín hiệu ban đầu:
X[k] : k = 0, 1, 2, N - 1
Trang 14- Do đó, DFT phân tích một tín hiệu trong miền thời gian (được xác định trong một phạm vi) thành một tổng hữu hạn của các hình sin phức có trọng số:
- Phép biến đổi Fourier rời rạc thuận được định nghĩa tương tự như phép biến đổi nghịch đảo, tức là tổng hữu hạn của các hình sin phức hợp có trọng số với các trọng số là các mẫu miền tín hiệu x [n]:
Trang 153.7 Forward and Backwards Transform for the Four Types of Fourier Transforms
Bảng sau đây cho thấy bốn biến thể của phép biến đổi Fourier với
sự biến đổi tiến và lùi của chúng
Trang 173.8 Example Discrete Fourier Transform.
- DFTs sử dụng trong xử lý âm thanh thường là lũy thừa của 2 theo thứ tự vài trăm mẫu( 512 hoặc 1024) Tuy nhiên ví dụ sau chỉ sử dụng DFT 8 điểm để minh họa biến đổi thuận:
+ X và x lần lượt là các vectơ biến đổi và vectơ tín hiệu bằng độ dài N
+ W là ma trận biến đổi N × N thực hiện chuyển tiếp DFT
DFT chuyển tiếp 8 điểm được định nghĩa là:
Trang 18trong đó: ω0 = 2N/π = π/4 π = π/π = π/4 4
Trang 213.9 The F ast Fourier Transform: FFT
- Thuật toán này nhận DFT có độ dài N và chia đệ quy nó thành hai nữa bằng nhau( N/π = π/4 2) xen kẽ các DFT Biểu thức FFT được biểu diễn:
Trong đó n thuộc khoảng [0,N-1]
Trang 22Circuit diagram
of a one stage length 8 Radix
2 FFT (using the Cooley and Tukey [1]
method)
Trang 23- Một giai đoạn duy nhất của thuật toán Radix-2 có thể được biểu diễn chính thức như sau (nghĩa là tách DFT ban đầu thành các thành phần chẵn và lẻ).
Trang 253.10 WINDOWING TO DECREASE SPECTRAL
LEAKAGE AND IMPROVE FREQUENCY RESOLUTION
Các cửa sổ hình vuông và các cửa sổ hanning được sử dụng để phân tích FFT
Trang 26
3.11 THE FFT: Its Use in MatLab
Trang 303.12 Zero Padding the FFT
FFT là gì ?
Trang 31Độ lớn FFT (và pha) của tín hiệu sử dụng Freqz Độ lớn FFT của tín hiệu sử dụng biểu đồ chu kỳ.
Trang 323.13 Short-Term Fourier Transform: STFT
STFT: khi chúng ta chia nhỏ tín hiệu thành từng khoảng nhỏ, dùng FFT trên từng đoạn đó và xem dải tần số của âm đó thay đổi như thế nào theo thời gian.
Trong đó:
R chiều dài bước nhảy(tính theo mẫu) x(n): Tín hiệu đầu vào.
m: Tham số điều khiển để chuyển cửa sổ w [n]: là hàm cửa sổ có độ dài M, ví dụ: cửa
Xm (ω): là STFT của dữ liệu cửa sổ x [n] sổ Hanning.): là STFT của dữ liệu cửa sổ x [n] sổ Hanning.
Trang 333.13.1 The Discrete STFT: The Practical Implementation
Xm [k]: là STFT của tín hiệu đầu vào x [n]
x [n]: là tín hiệu đầu vào được lập chỉ mục bởi n (thường là thời gian).
x [n + mR]: là tín hiệu đầu vào đã dịch chuyển được lập chỉ mục n + mR (thường là thời gian)
w [n]: là hàm cửa sổ có độ dài M, ví dụ: cửa sổ Hanning.
Trang 353.14 Frequency Domain Audio Processing Using the STFT and the Inverse STFT
Cách đơn giản nhất để đạt được sự tái tạo hoàn hảo của hệ thống STFT Discrete STFT Inverse Discrete là làm cho các cửa sổ phân tích và tổng hợp giống hệt nhau
Trường hợp này thì đầu ra của hệ thống WOLA được đặc trưng bởi:
Trang 36
Overlap and add time-frequency processing.
Trang 373.15 Audio Spectrograms
Trang 38Spectrogram using Matlab
Trang 40- Nếu sử dụng hàm matlab như sau, chúng ta có thể tạo ra cửa sổ
có độ dài mong muốn, độ chồng chéo và đồ dài của FFT tủy chọn
Trang 42- window là cửa sổ được xác định ( Hanning, Hamming,Kaiser, )
- noverlap là số chồng chéo
- nfft là độ dài của FFT
Trang 433.16 Aphex Twin Spectrogram Example
Trang 44Biểu đồ phổ mẫu của bản âm thanh “Windowlicker” của ban nhạc The Aphex Twin.