1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu thiết kế chế tạo thiết bị nghe bí mật qua mạng gsm ứng dụng cho trinh sát kỹ thuật

94 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên cứu thiết kế chế tạo thiết bị nghe bí mật qua mạng GSM ứng dụng cho trinh sát kỹ thuật
Tác giả Phạm Mạnh Cường
Trường học Đại học Bách Khoa Hà Nội
Chuyên ngành Kỹ thuật truyền thông và mạng di động
Thể loại Luận văn tốt nghiệp thạc sỹ
Thành phố Hà Nội
Định dạng
Số trang 94
Dung lượng 5,73 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

  • CHƯƠNG 1: GIỚI THIỆU TỔNG QUÁT VỀ ÂM THANH (10)
    • 1.1. Những khái niệm cơ bản về âm thanh (10)
      • 1.1.1. Bản chất của âm thanh (10)
      • 1.1.2. Tốc ủộ õm thanh (10)
      • 1.1.3. Cường ủộ õm thanh (11)
      • 1.1.4. Trường ủộ õm thanh (11)
      • 1.1.5. Cao ủộ õm thanh (11)
      • 1.1.6. Âm sắc (0)
      • 1.1.7. Phản xạ - Khúc xạ - Cộng hưởng (12)
    • 1.2. Giới thiệu về các loại Micro hiện nay (13)
      • 1.2.1. Micro tụ hay Micro ủiện dung (Condenser Micro) (13)
      • 1.2.2. Micro ủộng – Dynamic Micro (18)
      • 1.2.3. Micro Ribbon (Micro băng) (19)
      • 1.2.4. Carbon microphone (Micro các bon – Micro than) (20)
      • 1.2.5. Piezoelectric microphone (Micro Áp ủiện) (22)
      • 1.2.6. Fiber Optic Microphone (Micro quang) (23)
      • 1.2.7. Laser microphone (24)
      • 1.2.8. Micro Shotgun (25)
      • 1.2.9. Tớnh ủịnh hướng của Micro (26)
      • 1.2.10. Các tiêu chí lựa chọn Micro (29)
  • CHƯƠNG 2: KỸ THUẬT XỬ LÝ ÂM THANH TRONG THOẠI (32)
    • 2.2. Hệ thống số xử lý âm thanh (33)
      • 2.2.1 Kiến trúc hệ thống số xử lý âm thanh (35)
      • 2.2.2 Tần số lấy mẫu (37)
      • 2.2.3. Một số biểu thức toán trong xử lý âm thanh (37)
        • 2.2.3.1 Phộp biến ủổi Z (37)
        • 2.2.3.2. Phộp biến ủổi Fourier (39)
        • 2.2.3.3. Phộp biến ủổi Fourier rời rạc (40)
    • 2.3. Các phương pháp xử lý âm thanh (42)
      • 2.3.1. Các phương pháp lấy mẫu và mã hóa thoại (42)
        • 2.3.1.1. Lấy mẫu ở miền thời gian và tái tạo tín hiệu liên tục (42)
        • 2.3.1.2. Lấy mẫu tín hiệu ở miền tần số và tái tạo tín hiệu liên tục (43)
        • 2.3.1.3. Lấy mẫu tín hiệu ở miền tần số và tái tạo tín hiệu rời rạc (43)
        • 2.3.1.4. Tham khảo các chuẩn mã hóa âm thoại trong các hệ thống xử lý thoại (44)
        • 2.3.1.5. Mô tả hệ thống mã hóa âm thoại (48)
        • 2.3.1.6. Mô tả bộ mã hóa – giải mã âm thoại (49)
        • 2.3.1.7. Các yêu cầu cần có của một bộ mã hóa âm thoại (50)
    • 2.4. Các mô hình dùng trong xử lý âm thanh (51)
      • 2.4.1. Mô hình quang phổ (51)
        • 2.4.1.1. Mô hình sin (51)
        • 2.4.1.2. Tớn hiệu sin + nhiễu + ủệm (55)
        • 2.4.1.3. Mô hình PLC (56)
      • 2.4.2. Mô hình miền thời gian (56)
        • 2.4.2.1. Mỏy tạo dao ủộng số (56)
        • 2.4.2.2. Mỏy tạo dao ủộng bảng súng (58)
        • 2.4.2.3. Tổng hợp lấy mẫu bảng sóng (59)
        • 2.4.2.4 Tổng hợp hạt (với Giovanni De Poli) (59)
      • 2.4.3. Các mô hình phi tuyến (60)
        • 2.4.3.1. Điều pha và ủiều tần (60)
        • 2.4.3.2. Méo phi tuyến (62)
      • 2.4.4. Mô hình thời gian rời rạc (63)
    • 2.5 Dự đốn tuyến tính trong xử lý thoại (65)
      • 2.5.1. Thiết lập mô hình xử lý tín hiệu thoại (65)
      • 2.5.2. Cấu trúc của giải thuật dùng mô hình LPC (68)
        • 2.5.2.1. Bộ mã hóa (Encoder) (68)
        • 2.5.2.2. Công suất của chuỗi lỗi (68)
        • 2.5.2.3 Bộ giải mã trong thoại (69)
        • 2.5.2.4 Nhận xét giới hạn của mô hình PLC (69)
    • 2.6. Phân tích chất lượng xử lý thoại (70)
      • 2.6.1. Giới thiệu các phương pháp mã hoá thoại (70)
      • 2.6.2. Cỏc tham số liờn quan ủến chất lượng thoại (71)
      • 2.6.3. Cỏc phương phỏp ủỏnh giỏ chất lượng thoại cơ bản (71)
        • 2.6.3.1. Phương phỏp ủỏnh giỏ chủ quan (MOS) (73)
        • 2.6.3.2. Các phương pháp so sánh dựa trên mô hình giác quan (75)
  • CHƯƠNG 3: MỤC TIÊU VÀ NHỮNG YÊU CẦU CỦA ĐỀ TÀI (80)
    • 3.1. Modul thu bí mật GSM (80)
    • 3.2. Những chức năng, sản phẩm ủó làm ra ủạt ủược (80)
      • 3.2.1. Chức năng thiết bị (80)
      • 3.2.2. Các thông số kĩ thuật (80)
      • 3.2.3. Sạc pin (81)
      • 3.2.4. Khởi ủộng thiết bị (81)
      • 3.2.5. Lệnh tin nhắn (81)
      • 3.2.6. Lệnh cuộc gọi (82)
      • 3.2.7. Các thông báo lỗi (83)
    • 3.3 Mạch và Linh kiện (85)
    • 3.5. Lược ủồ tiến trỡnh (92)
  • TÀI LIỆU THAM KHẢO (93)

Nội dung

GIỚI THIỆU TỔNG QUÁT VỀ ÂM THANH

Những khái niệm cơ bản về âm thanh

1.1.1 Bản chất của âm thanh

Âm thanh là một hiện tượng vật lý đơn giản, được hình thành từ sự rung động của vật thể, và những rung động này lan truyền qua một môi trường trung gian đến tai người nghe.

Âm thanh được tạo ra khi một sợi dây rung động, tác động lên các phần tử không khí gần đó và khiến chúng dao động Khi sự dao động này xảy ra hàng chục, hàng ngàn lần trong một giây, lớp không khí sẽ có tính đàn hồi, giúp mỗi phần tử đẩy phần tử phía trước, tạo ra sóng âm Khi dây rung chuyển động ngược lại, âm thanh được thay thế bằng sự yên tĩnh và lại tiếp tục lặp lại Môi trường đàn hồi sẽ truyền các sóng âm từ đoạn này đến đoạn khác và đến tai người nghe Do đó, nếu không có môi trường lan truyền, âm thanh sẽ không tồn tại.

Ví dụ: Trong chân không sẽ không có âm thanh

Là tốc ủộ lan truyền của súng õm qua mụi trường

Tốc ủộ õm thanh phụ thuộc vào mụi trường mà trong ủú súng õm lan truyền

- Đơn vị ủo tốc ủộ õm thanh là : m/s

Tốc độ âm thanh trong không khí hoàn toàn không phụ thuộc vào tần số dao động, tức là dù vật thể dao động 20 lần/s hay 20,000 lần/s, tốc độ lan truyền âm thanh vẫn như nhau.

- Cường ủộ õm thanh là ủộ to, nhỏ, mạnh, nhẹ của õm thanh

- Đơn vị ủo cường ủộ õm thanh tớnh bằng Oỏt ( W) hoặc Đềxiben ( dB)

- Cụng thức chuyển ủổi của 2 loại ủơn vị ủo này là: Đềxiben = Logarit Oát dB = LogW

Trường ủộ õm thanh là khoảng thời gian của âm thanh, có thể dài hoặc ngắn, và được đo bằng đơn vị thời gian là giây (second) hoặc mili giây (ms).

Cao ủộ õm thanh được xác định bởi tần số của âm thanh, được đo bằng đơn vị Hertz (Hz) cùng với các bội số của nó như Kilo Hertz (KHz) và Mega Hertz (MHz).

- Âm sắc là sắc thỏi của õm thanh tạo nờn sự khỏc nhau mang tớnh ủặc trưng

3 của cỏc nguồn õm mặc dự cú cao ủộ giống nhau

Cùng một nốt mi, nhưng âm thanh của đàn Ghita, Piano hay Soprano lại có sự khác biệt rõ rệt Dù cùng một câu hát với cao độ giống nhau, nhưng khi được thể hiện bởi những người khác nhau, âm sắc vẫn không giống nhau Sự khác biệt này xuất phát từ việc ngoài tần số chuẩn, mỗi nguồn âm còn có các tần số phụ khác nhau, được gọi là hài âm hoặc hoạ âm.

1.1.7 Phản xạ - Khúc xạ - Cộng hưởng

Vỡ õm thanh là một dạng súng õm lan truyền nờn cũng tuõn theo cỏc ủịnh luật phản xạ và khúc xạ như ánh sáng vậy

* Gúc ủến bằng gúc phản xạ

Mỗi lần phản xạ hoặc khúc xạ, cường độ âm thanh của súng ống sẽ bị suy giảm Mức độ suy giảm này phụ thuộc vào môi trường và vật liệu mà âm thanh va chạm.

Ví dụ: ĐỘ SUY GIẢM

VẬT LIỆU PHẢN XẠ KHÚC XẠ

Để giảm thiểu sự phản xạ của sóng âm, cần sử dụng vật liệu có khả năng suy giảm âm tốt hoặc thiết kế mặt tường gồ ghề Trong các hội trường lớn, việc đặt loa cũng rất quan trọng; loa nên được bố trí sao cho sóng âm chịu va chạm nhiều lần trước khi đến tai người nghe, từ đó giúp giảm tiếng dội hiệu quả.

- Sự cộng hưởng của õm thanh phụ thuộc cỏc khoảng cỏch va ủập của súng

Âm thanh và tần số có mối liên hệ chặt chẽ Khi khoảng cách va chạm bằng một bội số chẵn của bước sóng, hiện tượng cộng hưởng đạt hiệu quả tối ưu Do đó, tần số thấp sẽ tạo ra buồng cộng hưởng lớn hơn, trong khi tần số cao sẽ dẫn đến khoảng cách cộng hưởng nhỏ hơn.

Giới thiệu về các loại Micro hiện nay

Microphone, hay còn gọi là mic, là thiết bị chuyển đổi âm thanh thành tín hiệu điện Được phát minh bởi Emile Berliner vào năm 1876, microphone đã trở thành công cụ quan trọng trong nhiều ứng dụng như điện thoại, máy ghi âm, hệ thống karaoke, máy trợ thính, phát thanh truyền hình và ghi âm giọng nói Hiện nay, trên thị trường có nhiều loại microphone khác nhau, bao gồm microphone cảm ứng điện từ, microphone tụ điện và microphone điều chế ánh sáng, mỗi loại đều có cách thức hoạt động riêng để tạo ra tín hiệu điện từ âm thanh.

1.2.1 Micro tụ hay Micro ủiện dung (Condenser Micro):

Các micro tụ, phát minh tại Phòng thí nghiệm Bell vào năm 1916 bởi

EC Wente, còn được gọi là micro tụ điện hoặc microphone tĩnh điện, hoạt động dựa trên nguyên lý của tụ điện Tấm màng ngăn của nó chuyển động như một bản của tụ điện, và các rung động tạo ra sẽ thay đổi khoảng cách giữa các tấm Micro này có hai loại, tùy thuộc vào phương pháp chiết xuất tín hiệu âm thanh từ bộ chuyển đổi: định thiên-DC và

Tần số vụ tuyến (RF) hoặc tần số cao (HF) có thể được điều chỉnh bằng cách sử dụng một micro ủịnh thiờn-DC, trong đó các ủĩa được điều chỉnh với một khoản phớ cố ủịnh (Q) Điện áp được duy trì thông qua sự thay đổi của các tấm tụ với các rung động trong không khí, theo phương trình điện dung $C = \frac{Q}{V}$, trong đó $Q$ là điện tích Coulombs, $C$ là điện dung farads và $V$ là khả năng biến đổi điện thế Điện dung của các ủĩa tỉ lệ nghịch với khoảng cách giữa chúng Việc lắp ráp các tấm cố định và di động được gọi là một "element" hoặc "capsule".

Luôn có một lượng điện tích được duy trì ổn định trên tụ điện Khi thay đổi điện dung, điện tích trên tụ điện thay đổi rất ít, nhưng ở tần số âm thanh thấp là hằng số hợp lý Điện dung của các phần tử (khoảng 5-100 pF) và giá trị của điện trở định thiên (100 megohms đến hàng chục gigohms) tạo thành một bộ lọc thông cao cho tín hiệu âm thanh, và thông thấp cho điện áp định thiên Trong khoảng thời gian của sự thay đổi điện dung (khoảng 50 ms với tín hiệu âm thanh ở tần số 20 Hz), điện tích là một hằng số và điện áp trên tụ điện ngay lập tức thay đổi để phản ánh sự thay đổi điện dung Các điện áp trên tụ điện biến đổi ở trên và dưới mức điện áp định thiên Điện áp trên điện trở được khuếch đại để truyền về hoặc ghi âm.

RF micro tụ sử dụng điện áp RF tương đối thấp, được tạo ra bởi một bộ dao động ồn Các tín hiệu từ bộ dao động có thể được điều biến bằng cách thay đổi điện dung dưới tác động của các sóng âm thanh chuyển động.

Khoảng cách giữa các lớp màng có thể là một phần của mạch cộng hưởng biến tần Quá trình giải điều chế tạo ra tín hiệu tần số âm thanh với một trở kháng nguồn rất thấp.

Micro tụ (Condenser) được sử dụng để truyền âm thanh từ các thiết bị như micro karaoke giá rẻ đến các micro ghi âm có độ trung thực cao Loại micro này tạo ra tín hiệu âm thanh chất lượng cao và hiện đang là sự lựa chọn phổ biến trong các ứng dụng ghi âm tại phòng thí nghiệm và studio Khác với các loại micro khác yêu cầu nguồn âm thanh mạnh mẽ hơn, micro tụ cần một nguồn năng lượng, có thể từ thiết bị cung cấp đầu vào hoặc từ pin nhỏ Năng lượng này cần thiết để thiết lập điện áp trên tụ điện và cấp nguồn cho micro, bao gồm các loại như micro electret và micro DC-phân cực.

Electret condenser microphone (Micro tụ từ tính)

Micro ủiện là thế hệ sau của micro tụ ủược phỏt minh ra vào năm 1962 tại phòng thí nghiệm Bell (Bang New Jersey) bởi Gerhard Sessler và Jim

Micro electret là loại micro mới với một lượng điện tích cố định trong vật liệu điện từ, thường được làm từ sắt và có khả năng giữ từ tính Với hiệu suất cao, dễ chế tạo và giá thành thấp, micro electret hiện nay chiếm ưu thế trên thị trường, ước tính hàng năm có hơn 1 tỷ micro được sản xuất Chúng được sử dụng rộng rãi trong các thiết bị như điện thoại di động, máy tính, và PDA, từ thiết bị ghi âm chất lượng cao đến những thiết bị nhỏ gọn Mặc dù trước đây micro electret bị coi là chất lượng thấp, nhưng các sản phẩm chất lượng tốt hiện nay có thể cạnh tranh với micro tụ truyền thống và có độ ổn định lâu dài Khác với các micro tụ khác, micro electret không yêu cầu điện áp phân cực nhưng thường được tích hợp với bộ tiền khuếch đại cần cấp điện áp.

Bộ tiền khuyếch đại (pre-amplifier) là thiết bị giúp tăng cường tín hiệu âm thanh, thường cung cấp mức tăng khoảng +/-6dB ở dải âm trầm hoặc âm cao Việc điều chỉnh này giúp tăng cường chất lượng âm thanh trước khi tín hiệu được gửi đến tầng khuếch đại (amplifier), đặc biệt là trong các dải bass và treble Sự điều chỉnh này dễ thực hiện hơn ở tầng pre-amplifier do công suất vào và ra thường nhỏ.

Ampli núi chung là nhiệm vụ khuếch ủại tớn hiệu ủủ lớn ủể ủưa ra loa ủồng thời can thiệp thay ủổi õm lượng, õm sắc của õm thanh

Bộ khuếch đại (Amplifier) là thiết bị tăng cường công suất, có khả năng nhận tín hiệu ở mức miliwatt (mW) và khuếch đại lên đến vài watt cho đến hàng ngàn watt Tuy nhiên, với lợi ích lớn này, việc duy trì độ tuyến tính trong phản ứng tần số gặp nhiều thách thức.

Micro thiết kế sử dụng cho mỏy tớnh cỏ nhõn ủụi khi ủược gọi là micro

Micro electret là loại micro condenser tích hợp bộ phân cực bên trong, sử dụng nguồn phantom 5V từ máy tính Khoảng 95% micro condenser trên thị trường là loại electret, hoạt động dựa trên nguyên tắc của tụ điện, với màng ngăn chịu các biến thể âm thanh, từ đó tạo ra xung điện Còn một loại micro khác gọi là true condenser, cần nguồn rời để hoạt động.

Micro động hoạt động thông qua cảm ứng điện từ, với công suất lớn, khả năng khuếch đại cao, chi phí thấp và khả năng chịu ẩm tốt Micro động sử dụng nguyên lý dynamic tương tự như loa, nhưng hoạt động theo chiều ngược lại Một cuộn dây cảm ứng điện từ rung động trong từ trường của nam châm vĩnh cửu được gắn với lớp vỏ ngăn Khi âm thanh đi vào, nó tạo ra những rung động cần thiết để chuyển đổi thành tín hiệu điện.

Micro hoạt động dựa trên 10 lớp màng, cho phép sóng âm thanh di chuyển và làm rung lớp vách ngăn Khi lớp vách này rung lên, cuộn dây chuyển động trong từ trường, tạo ra dòng điện nhờ hiện tượng cảm ứng điện từ Một lớp màng không thể đáp ứng cho mọi tần số âm thanh, vì vậy nhiều micro sử dụng nhiều lớp màng để thu nhận các phổ âm thanh khác nhau, từ đó kết hợp lại tạo ra tín hiệu cuối cùng Việc kết hợp nhiều tín hiệu một cách chính xác là rất khó, khiến cho loại micro có nhiều lớp màng trở nên hiếm và thường đắt tiền Một số thiết kế đặc thù nhắm đến các thành phần riêng biệt của phổ âm thanh, ví dụ như thiết kế nhạy với âm thanh trầm hơn âm thanh bổng Trong kỹ thuật âm thanh, nhiều loại micro thường được sử dụng đồng thời để đạt được kết quả tốt nhất Cụ thể, các micro điện động hoặc điện từ, nơi các rung động âm thanh tác động lên cuộn dây hoặc dải ribbon treo giữa các cực của nam châm, cũng tạo ra các xung điện theo nguyên tắc cảm ứng.

Micro băng được cấu tạo từ các dải kim loại được làm nhăn và treo trong từ trường Dải ruy băng được kết nối điện với đầu ra của micro, và sự rung động của nó trong từ trường tạo ra tín hiệu điện Micro băng tương tự như micro cuộn động.

Microphone cuộn di động hoạt động dựa trên hiện tượng cảm ứng điện từ để sản sinh âm thanh Với cấu tạo đặc biệt của băng, microphone băng thường thu âm thanh từ cả hai hướng, phía trước và phía sau Một số microphone được trang bị bộ phận triệt tiêu âm, cho phép thu âm chỉ từ một hướng nhất định Microphone băng thường mang lại chất lượng âm thanh tốt, nhưng tần số thấp chỉ được đáp ứng hiệu quả khi băng được treo lỏng, điều này có thể dẫn đến hỏng hóc Các vật liệu băng mới, bao gồm cả vật liệu nano, đã được phát triển để giải quyết vấn đề này và cải thiện dải tần số thấp Tấm chắn bảo vệ giúp giảm thiểu nguy cơ hỏng hóc của băng, từ đó nâng cao chất lượng âm thanh thu được Khác với các loại microphone khác, microphone băng không cần nguồn Phantom, vì nguồn này có thể gây hỏng một số microphone băng cổ Một số microphone băng hiện đại tích hợp bộ tiền khuếch đại, do đó cần nguồn cung cấp để hoạt động.

1.2.4.Carbon microphone (Micro các bon – Micro than)

KỸ THUẬT XỬ LÝ ÂM THANH TRONG THOẠI

Hệ thống số xử lý âm thanh

Tai người có độ nhạy rất cao, có khả năng phân biệt những âm thanh với cường độ rất nhỏ và chấp nhận âm thanh với tần số lớn Các đặc tính của tín hiệu mà tai người có thể nghe được có thể được đo lường bằng các công cụ phù hợp Thông thường, tai người nhạy nhất ở tần số từ 2kHz đến 5kHz, mặc dù một số người có thể nhận diện tín hiệu lên tới 20kHz Tầm nghe của tai người được phân tích và cho thấy có dạng phản ứng logarith.

Âm thanh được truyền qua hệ thống số dưới dạng chuỗi các bit Do bit có tính chất rời rạc, việc xác định số lượng bit trong một giây trở nên dễ dàng, giúp quyết định tốc độ truyền bit cần thiết để truyền tín hiệu mà không làm mất thông tin.

Có nhiều kỹ thuật xử lý tín hiệu âm thanh và áp dụng các giải thuật để khôi phục âm thanh Chất lượng của âm thoại phụ thuộc lớn vào mô hình giả định phù hợp với dữ liệu Đối với tín hiệu âm thanh, bao gồm âm thoại, nhạc và nhiễu không mong muốn, mô hình cần phải tổng quát và hiệu quả.

Khi phân tích các thương hiệu điện thoại, cần lưu ý rằng hầu hết đều là những thương hiệu phổ biến trong thực tế Mặc dù có những biến động trong thị trường, các giả định thường được đưa ra khi đánh giá thương hiệu có tính chất tĩnh trong một khoảng thời gian nhất định.

Mô hình Autoregressive (AR) phù hợp với nhiều lĩnh vực trong xử lý chuỗi thời gian, đặc biệt là trong phục hồi âm thanh, và được coi là mô hình chuẩn cho phân tích dự đoán tuyến tính Tín hiệu hiện tại được biểu diễn bằng tổng giá trị của P tín hiệu trước đó và tín hiệu nhiễu trắng, trong đó P là bậc của mô hình AR.

Mô hình AR đại diện cho các quá trình tuyến tính, chấp nhận tín hiệu tương tự nhiễu và tín hiệu tương tự điều hòa Mô hình auto regressive moving-average (ARMA) phù hợp hơn cho nhiều tình huống phân tích, cho phép xử lý các điểm cực cũng như điểm 0 Tuy nhiên, mô hình AR linh hoạt hơn trong phân tích, đặc biệt với tín hiệu nhạc phức tạp cần bậc P > 100 để biểu diễn, trong khi các tín hiệu đơn giản chỉ cần bậc 30 Việc lựa chọn bậc của mô hình để đảm bảo biểu diễn tín hiệu mà không làm mất thông tin là một nhiệm vụ phức tạp Có nhiều phương pháp ước lượng bậc của mô hình AR như phương pháp maximum likelihood/least-squares và phương pháp robust to noise Đối với xử lý các tín hiệu âm nhạc phức tạp, mô hình Sin (Sinusoidal) thường được sử dụng rất hiệu quả trong các ứng dụng.

26 õm thoại Mụ hỡnh Sin rất phự hợp trong cỏc phương phỏp dựng ủể giảm nhiễu Tớn hiệu ủược cho bởi cụng thức sau:

Đây là mô hình tổng quát cho các điều chế biên độ và điều chế tần số, tuy nhiên không phù hợp với các tín hiệu tương tự nhiễu, mặc dù tín hiệu nhiễu có thể được biểu diễn bằng một số lượng hàm sin rất lớn.

2.2.1 Kiến trúc hệ thống số xử lý âm thanh Đối với máy tính số xử lý âm thanh, người ta thường dùng phương pháp Điều chế xung (Pulse Code Modulation , viết tắt PCM) Dạng súng õm thanh ủược chuyển sang dãy số PCM như sau, xét tín hiệu hình sin làm ví dụ:

Hình 2.1 Dạng sóng âm thanh nguyên thủy

Sử dụng một microphone để thu tín hiệu âm thanh trong không khắc và chuyển đổi thành tín hiệu điện, với tầm điện áp đầu ra của microphone khoảng ±1 volt.

Hỡnh 2.2 Dạng súng của tớn hiệu ủiện

Tín hiệu analog được chuyển đổi thành dạng số bằng thiết bị chuyển đổi analog-số (ADC) Khi sử dụng bộ chuyển đổi 16 bit, giá trị đầu ra có thể dao động từ -32,768 đến +32,767, như được mô tả trong hình 3.3.

Hỡnh 2.3 Đầu ra của bộ chuyển ủổi tớn hiệu tương tự sang tớn hiệu số

Việc lấy mẫu không thể thực hiện cho tất cả các điểm thuộc trục thời gian do giới hạn về số lượng mẫu Quá trình này sẽ được thực hiện trong một khoảng thời gian nhất định Tần số lấy mẫu được định nghĩa là số lượng mẫu trong một giây.

Tốc độ lấy mẫu dẫn đến một chuỗi 43 chữ số, thể hiện các vị trí của dạng sóng theo thời gian trong một chu kỳ.

Mỏy tớnh sau ủú sẽ xõy dựng lại dạng súng của tớn hiệu bằng việc kết nối cỏc

28 ủiểm dữ liệu lại với nhau Dạng súng kết quả ủược mụ tả như hỡnh 3.4

Hỡnh 2.4 Dạng súng ủược tỏi tạo lại

Khi chuyển đổi âm thanh sang dạng số, tần số lấy mẫu của hệ thống xử lý cần đảm bảo tính trung thực và chính xác để có thể phục hồi lại dạng sóng tín hiệu ban đầu.

Theo định lý Nyquist và Shannon, tần số lấy mẫu quyết định tần số cao nhất của tín hiệu phục hồi Để tái tạo dạng sóng, cần lấy 2F mẫu trong một giây, với F là tần số của tín hiệu, và tần số này được gọi là tần số Nyquist Tuy nhiên, định lý Nyquist không phải lúc nào cũng tối ưu Ví dụ, với dạng sóng hình sin có tần số 500Hz, tần số lấy mẫu cần thiết là 1000Hz Nếu tần số lấy mẫu cao hơn tần số Nyquist, có thể xảy ra hiện tượng "aliasing", làm ảnh hưởng đến biên độ của tín hiệu và gây ra nhiễu Tuy nhiên, khi lấy mẫu cao hơn, các thành phần hài tần số thấp có thể được phục hồi chính xác hơn.

2.2.3 Một số biểu thức toán trong xử lý âm thanh:

Phộp biến ủổi z của một chuỗi ủược ủịnh nghĩa bởi cặp biểu thức:

Biến ủổi $z$ của $x(n)$ được định nghĩa bởi biểu thức (2.3a) $X(z)$ cũng được gọi là dãy công suất vô hạn theo biến $z^{-1}$, trong đó các giá trị của $x(n)$ là các hệ số của dãy công suất Miền hội tụ (ROC) được xác định là $\{z | |X(z)| < \infty\}$, tức là những giá trị của $z$ sao cho chuỗi hội tụ.

Thông thường miền hội tụ z có dạng:

Ví dụ: Cho x n ( ) = δ ( n − n 0 ) Theo công thức (2.3a), ta có X ( ) z = z − n 0

Ví dụ: cho x n ( ) = a u n n ( ) suy ra ( ) 1

Bảng 2.1 Chuỗi tớn hiệu và biến ủổi z tương ứng

Chuỗi tớn hiệu Biến ủổi z

Biến ủổi Fourier của tớn hiệu rời rạc thời gian ủược biểu diễn bởi biểu thức:

Các phương pháp xử lý âm thanh

2.3.1 Các phương pháp lấy mẫu và mã hóa thoại

2.3.1.1 Lấy mẫu ở miền thời gian và tái tạo tín hiệu liên tục Để xử lý một tín hiệu liên tục bằng các phương tiện xử lý tín hiệu số, ta phải ủổi tớn hiệu liờn tục ủú ra dạng một chuỗi số bằng cỏc lấy mẫu tớn hiệu liờn tục một cách tuần hoàn có chu kỳ là T giây Gọi x n ( )là tín hiệu rời rạc hình thành do quá trình lấy mẫu, tín hiệu liên tụcx a ( ) t , ta có

Các mẫu $x(n)$ phải được lượng hóa thành một tập các mức biên rời rạc trước khi đưa vào bộ xử lý số Hình 3.16 minh họa một cấu hình tiêu biểu cho hệ thống xử lý tín hiệu tương tự bằng phương pháp số Trong các phần sau, chúng ta sẽ bỏ qua sai số lượng hóa phát sinh trong quá trình biến đổi A/D.

Hình 2.5 minh họa cấu hình hệ thống xử lý tín hiệu tương tự bằng phương pháp số Để xác định mối quan hệ giữa phổ của tín hiệu liên tục và phổ của tín hiệu rời rạc được tạo ra từ quá trình lấy mẫu tín hiệu liên tục, chúng ta cần chú ý đến mối quan hệ giữa biến độc lập $t$ và $n$ của tín hiệu $x_a(t)$ và $x_n(nT)$.

2.3.1.2 Lấy mẫu tín hiệu ở miền tần số và tái tạo tín hiệu liên tục

Khi tín hiệu liên tục có năng lượng hữu hạn, nó sẽ có phổ liên tục Trong phần này, chúng ta sẽ xem xét quá trình lấy mẫu của các tín hiệu loại này một cách tuần hoàn và sự tái tạo tín hiệu từ các mẫu của phổ của chúng.

Xét một tín hiệu liên tục $x_a(t)$ với phổ liên tục $X_a(F)$ Giả sử chúng ta lấy mẫu $X_a(F)$ tại các thời điểm cách nhau $\Delta F$ Hertz Mục tiêu của chúng ta là tái tạo $X_a(F)$ hoặc $x_a(t)$ từ các mẫu $X_a(F)$.

Nếu tín hiệu tương tự $x_a(t)$ có giới hạn thời gian là $\mathcal{I}$ giây và $T_s$ được chọn sao cho $T_s > 2\mathcal{I}$, thì hiện tượng aliasing sẽ không xảy ra và phổ $X_a(f)$ có thể được khôi phục hoàn toàn từ các mẫu.

2.3.1.3 Lấy mẫu tín hiệu ở miền tần số và tái tạo tín hiệu rời rạc

Xột một tớn hiệu rời rạc khụng tuần hoàn x(n) cú phộp biến ủổi Fourier:

A/D Mạch xử lý tín hiệu số

Giả sử chúng ta lấy mẫu $X(\omega)$ tuần hoàn tại các điểm cách nhau $\Delta \omega$ rad Vì $X(\omega)$ tuần hoàn với chu kỳ $2\pi$, chỉ cần các mẫu trong phạm vi cơ bản Để thuận tiện, chúng ta lấy $N$ mẫu cách đều nhau trong khoảng $0 \leq \omega \leq 2\pi$ với khoảng cách $\Delta = \frac{\omega}{2\pi N}$.

Tín hiệu tuần hoàn x(n) có thể được nhận diện bằng cách lặp lại mỗi N mẫu, với chu kỳ N Tín hiệu này có thể được triển khai thông qua khai triển Fourier.

Có thể khôi phục tín hiệu $x_p(n)$ từ các mẫu của phổ $X(\omega)$ dựa trên công thức $x_p(n)$ Do đó, cần xác định mối tương quan giữa $x_p(n)$ và $x(n)$ để thực hiện việc khôi phục $x(n)$ từ $X(\omega)$.

Vỡ x p (n) là sự mở rộng tuần hoàn của x(n), cho phép khôi phục x(n) từ x p (n) mà không gặp hiện tượng aliasing trong miền thời gian Điều này chỉ xảy ra khi x(n) có thời gian giới hạn nhỏ hơn hoặc bằng chu kỳ N của x p (n).

2.3.1.4 Tham khảo các chuẩn mã hóa âm thoại trong các hệ thống xử lý thoại

Chuẩn mó húa õm thoại thường được nghiên cứu và phát triển bởi một nhóm các chuyên gia, những người dành thời gian và tâm huyết để thực hiện các công việc kiểm nghiệm và phỏng vấn nhằm đảm bảo đáp ứng các yêu cầu đã đề ra Chỉ có những tổ chức với nguồn tài nguyên khổng lồ mới có khả năng thực hiện những công việc khó khăn này.

Thời gian cần thiết để hoàn thành một chuẩn trong điều kiện thuận lợi thường khoảng bốn năm rưỡi Tuy nhiên, điều này không có nghĩa là một chuẩn được đưa ra sẽ không cần cải tiến Các chuẩn mới liên tục được phát triển để cải thiện và phù hợp hơn với các ứng dụng tương lai Hội đồng chuẩn là các tổ chức có trách nhiệm giám sát việc phát triển các chuẩn cho các ứng dụng cụ thể Dưới đây là một số hội đồng chuẩn nổi tiếng mà nhiều nhà cung cấp sản phẩm tuân theo.

Liên minh Viễn thông Quốc tế (ITU) đóng vai trò quan trọng trong việc thiết lập các chuẩn viễn thông, đặc biệt là chuẩn ITU-T, có uy tín trong việc quy định các tiêu chuẩn mô hình hóa âm thoại cho hệ thống mạng điện thoại, bao gồm cả mạng vô tuyến và hữu tuyến.

Hiệp hội công nghiệp viễn thông (TIA) chịu trách nhiệm phát triển các chuẩn mã hóa thoại cho ứng dụng cụ thể và là thành viên của Viện tiêu chuẩn quốc gia Hoa Kỳ (ANSI) TIA đóng góp quan trọng trong việc xây dựng các chuẩn cho hệ thống tổng đài tế bào số Bắc Mỹ, bao gồm các hệ thống sử dụng chuẩn phân chia thời gian (TDMA) và phân chia theo mã (CDMA).

Viện Tiêu chuẩn Viễn thông Châu Âu (ETSI) là tổ chức quy định các chuẩn sản xuất thiết bị viễn thông tại Châu Âu, với sự tham gia của các hội viên từ nhiều quốc gia và công ty trong khu vực Được thành lập bởi nhóm có ảnh hưởng lớn trong lĩnh vực di động, đặc biệt là Groupe Speciale Mobile (GSM), ETSI đã phát triển và triển khai nhiều chuẩn công nghệ hữu ích trên toàn cầu.

- Bộ quốc phòng Hoa Kỳ - United States Department of Defense

Các mô hình dùng trong xử lý âm thanh

Tớn hiệu õm thanh cú thể ủược triển khai từ tập hợp cỏc mụ hỡnh sin cú dạng

Trong thực tế, tín hiệu được xem xét là tín hiệu rời rạc theo thời gian thực, với thành phần biên độ $A_i(t)$ và tần số $\omega_i(t)$ tương ứng của thành phần sin thứ $i$.

Nếu giá trị của I rất lớn, mọi tín hiệu âm thanh có thể được biểu diễn dưới dạng hàm sin, cho phép áp dụng các tính toán liên quan Thực tế, tín hiệu nhiễu cũng có thể được phân tích thành nhiều tín hiệu sin, và việc xử lý tín hiệu này sẽ được tách riêng thành phần xử lý Stochastic, ký hiệu là \( e_n \).

The component Λ can be calculated using the Short-Time Fourier Transform method, as illustrated in Figure 1 This technique is utilized in software for spectral modeling synthesis, commonly referred to as SMS.

Hình 2.8 Phân tích các thành phần hình sin của phần stochastic

Phát hiện đỉnh và ghép (Peak detection and continuation) là quá trình phân tích các thành phần hình sin từ tín hiệu thặng dư, trong đó việc tìm kiếm và ghi chép các đỉnh tần số nổi trội là rất quan trọng Một chiến thuật hiệu quả để thực hiện điều này là vẽ “bảng chỉ dẫn” trong các khung STFT Để phân chia rõ ràng giữa tín hiệu và nhiễu, các tần số và pha cần được xác định một cách chính xác Hơn nữa, để tổng hợp lại hai tín hiệu đã được phân tích, biên độ của các thành phần nên được nội suy giữa các khung tín hiệu, với phương pháp nội suy tuyến tính thường được sử dụng Các tần số và pha của tín hiệu cũng có thể được nội suy, tuy nhiên cần lưu ý rằng phương pháp nội suy tần số có ảnh hưởng chặt chẽ đến phương pháp nội suy pha.

Trong giai đoạn tổng hợp lại, các thành phần sin có thể được tạo ra bằng nhiều phương pháp khác nhau, bao gồm máy tạo dao động số, máy tạo dao động bảng súng, hoặc kỹ thuật tổng hợp lấy mẫu bảng súng.

45 dựa trờn cơ sở FFT Kỹ thuật FFT ủược sở dụng nhiều do tớnh tiện lợi khi tớn hiệu có nhiều thành phần hình sin

Việc trích tín hiệu thặng dư có thể thực hiện bằng cách trích phổ ở miền tần số hoặc trực tiếp từ miền thời gian.

Sự hiệu chỉnh phổ thặng dư (Residual spectral fitting) liên quan đến thành phần stochastic của tín hiệu nhiễu băng rộng, được lọc bởi khối đặc trưng tuyến tính Phổ cường độ của tín hiệu thặng dư xấp xỉ giá trị trung bình của hàm piecewise-linear Tổng hợp trong miền thời gian được thực hiện bằng phương pháp FFT, sau khi ấn định một tập cường độ mong muốn và một tập pha ngẫu nhiên.

Hiệu chỉnh âm thanh sử dụng mô hình sin là một phương pháp hiệu quả, cho phép truyền tải âm thanh nhạc từ các bản ghi băng thực tế một cách chính xác.

Hình 2.9 Biểu diễn cơ cấu tổ chức cho việc truyền tín hiệu

2.4.1.2 Tớn hiệu sin + nhiễu + ủệm

Trong mô hình sin + nhiễu, các tín hiệu âm thanh là tổng hợp của nhiều tín hiệu sin tần số thấp và nhiễu băng rộng Khi xử lý, một thành phần âm thanh không được xem xét đến là nốt ẩm, và việc hiệu chỉnh âm thanh có thể thực hiện dễ dàng bằng cách tách riêng thành phần nốt ẩm để phân tích Hầu hết các dụng cụ âm nhạc mở rộng trường độ của một nốt nhạc mà không ảnh hưởng đến chất lượng xử lý Do đó, một mô hình mới là sin + nhiễu + nốt ẩm được phát họa trong việc phân tích âm thanh Ý tưởng chính là việc trích âm ẩm từ quan sát rằng các tín hiệu hình sin trong miền thời gian được ánh xạ qua miền tần thành các đỉnh có vị trí xác định, trong khi các xung ngắn ngẫu nhiên khi ánh xạ qua miền tần lại có dạng hình sin Mô hình sin có thể ứng dụng trong miền tần số để biểu diễn các tín hiệu hình sin Sơ đồ phân tích SNT được mô tả trong Hình 2.10.

Hỡnh 2.10 Phõn tớch tớn hiệu theo mụ hỡnh sin + nhiễu + nốt ủệm

Hỡnh 2.10 Phõn tớch tớn hiệu theo mụ hỡnhsin + nhiễu + nốt ủiện

Khối DCT trong Hỡnh 1.23 mụ tả hoạt ủộng của phộp rời rạc cosin

Phộp biến ủổi, ủược ủịnh nghĩa như sau:

Phộp biến ủổi DCT thực hiện việc một xung ủược biến ủổi thành dang cosin và ngược lại

Mã hóa dự đoán tuyến tính có thể được sử dụng để mô hình hóa phổ tĩnh Tổng hợp LPC được mô tả trong hình 1.24 Về bản chất, mô hình chính là thuật toán trừ tổng hợp thực hiện một tín hiệu cú phổ “mượt” được lọc bởi một bộ lọc cực Tín hiệu kích thích có thể sử dụng chính tín hiệu thặng dư e đã qua quá trình phân tích, hoặc có thể sử dụng các thông tin của tín hiệu thoại/phi thoại.

2.4.2 Mô hình miền thời gian

Mô tả âm thanh trong miền tần mang lại hiệu quả cao, nhưng trong một số ứng dụng, phân tích trong miền thời gian lại có lợi thế hơn cho việc nghiên cứu tổng hợp âm thanh.

2.4.2.1 Mỏy tạo dao ủộng số

Ta nhận thấy một õm thanh phức tạp ủuợc tổng hợp từ nhiều thành phần hỡnh a 1, a p

Phép tổng hợp FTT -1 cho 48 sin cho phép tổng hợp các thành phần hình sin một cách hiệu quả Nếu số lượng thành phần không quá nhiều, việc tổng hợp có thể thực hiện bằng cách lấy giá trị trung bình của máy tạo dao động số.

Với e j ω 0 n = x R ( ) n + j x I ( ) n ở dạng số phức, mỗi bước nhảy thời gian ủược ủịnh nghĩa như sau:

Thông số biên độ và pha ban đầu có thể tính dựa trên pha ban đầu $e^{j \omega_0}$ Tín hiệu $x_R(n + 1)$ có thể được đưa vào công thức sau: $$x_R(n + 1) = 2 \cos(\omega_0) x_R(n) - x_R(n - 1) \quad (2.28)$$ Đáp ứng xung của bộ lọc được mô tả như trên.

Giỏ trị cực của bộ lọc biểu thức 10 nằm trờn chu viủường trũn ủơn vị

Gọi $x_{R1}$ và $x_{R2}$ là hai biến trạng thái của hai mẫu trước của tín hiệu cửa ra $x_R$ Pha ban đầu $\phi_0$ có thể được tính theo hệ phương trình sau: $$x_{R1} = \sin(\phi_0 - \omega_0) $$ và $$x_{R2} = \sin(\phi_0 - 2\omega_0).$$

Mỏy tạo dao ủộng số ủặc biệt hữu ớch trong việc biểu diễn tổng hợp tớn hiệu, đặc biệt khi áp dụng cho các bộ vi xử lý Phương pháp này cho phép triển khai các phép toán trên dấu chấm ủộng, tuy nhiên, nó cũng gặp khó khăn trong việc tạo tớn hiệu sin.

Dự đốn tuyến tính trong xử lý thoại

Giải thuật dự đoán tuyến tính (LPC) là một trong những phương pháp quan trọng trong việc đơn giản hóa mô hình xử lý thoại, đặc biệt trong việc tạo ra các bộ mã hóa chuẩn cho xử lý âm thanh ở tần số thấp Với tốc độ 2.4 kbps, bộ mã hóa FS1015 LPC của hãng Tremain (1982) đã đánh dấu một bước tiến vượt bậc trong ngành xử lý âm thanh Mặc dù chất lượng âm thanh giải mã không cao, hệ thống giải mã lại rất đơn giản và dễ hiểu Thuật ngữ “mã hóa dự đoán tuyến tính” đã xuất hiện từ khi âm thanh thoại được tạo ra bằng các thuật toán ứng dụng mô hình LPC, trong đó chuẩn FS1015 được coi là tiêu chuẩn điển hình.

Ban ủầu trong việc phát triển truyền thụng bảo mật cho các ứng dụng quản sự, bộ mã hóa FS1015 được đặc trưng bởi tín hiệu thoại tổng hợp, cần thiết cho nhân viên vận hành Mặc dù hầu hết các bộ mã hóa thoại dựa vào công nghệ, việc huấn luyện sử dụng vẫn là yếu tố quan trọng.

LP hiện nay đạt hiệu suất cao hơn, nhưng nguồn gốc hoạt động vẫn từ LPC Cải tiến này nhằm mục đích nâng cao chất lượng và tối ưu hóa hiệu suất mã hóa.

2.5.1 Thiết lập mô hình xử lý tín hiệu thoại

Mô hình xử lý thoại sử dụng mã hóa dự đoán tuyến tính được xây dựng dựa trên việc quan sát các đặc tính cơ bản của tín hiệu thoại Mô hình này bắt chước kỹ thuật tạo âm thanh thoại của con người, và bộ lọc tổng hợp được thiết kế để mô phỏng hiệu quả.

Tín hiệu âm thanh từ miệng người có thể được phân loại thành âm thanh thoại và phi thoại, với đầu vào của bộ lọc được điều chỉnh tùy thuộc vào trạng thái âm thanh Mạch chuyển đổi sẽ được thiết lập ở vị trí thích hợp để chọn lựa đầu vào tương ứng Mức năng lượng của tín hiệu đầu ra được điều khiển bởi thông số độ lợi.

Mô hình phù hợp với ngữ cảnh của mã hóa âm thoại bằng cách xem xét các mẫu thoại riêng lẻ cho từng khung tín hiệu không chồng lấn nhau Đối với từng khung ngắn, tính chất của tín hiệu về cơ bản là hằng số Trong mỗi khung, các thông số của mô hình được ước lượng từ các mẫu thoại, bao gồm nhiều thông số khác nhau.

■ Dạng: tín hiệu thuộc khung là thoại hay phi thoại

■ Độ lợi: liờn quan chủ yếu ủến mức năng lượng của khung

■ Hệ số lọc: ủịnh rừ ủỏp ứng của bộ lọc tổng hợp

■ Chu kỳ õm thanh: trong trường hợp ủối với khung thoại, là chiều dài thời gian giữa các xung kích thích liên tiếp nhau

Quá trình ước lượng thông số được thực hiện cho từng khung, với các kết quả chính là thông tin của khung Thay vì truyền các xung PCM, các thông số của mô hình sẽ được gửi đi Điều này giúp giảm thiểu nhiễu và sự méo tín hiệu, với các bớt truyền được cấp phát theo chỉ định tương ứng với từng thông số, nhằm đạt được tỷ số nén tối ưu.

Hình 2.16 thể hiện khung tín hiệu phi thoại với 180 mẫu, sử dụng bộ mó húa FS1015 Các mẫu nguyên thủy được xử lý qua quá trình tổng hợp LPC để tạo ra âm thoại Tín hiệu nguyên thủy và tín hiệu sau khi tổng hợp có sự tương đồng về mặt phổ, cho thấy mật độ phổ cố suất gần như tương tự.

Hình 2.17 minh họa sơ đồ của khung âm thanh thoại, với bên trái thể hiện tín hiệu nguyên thủy và bên phải là tín hiệu tổng hợp Đường nét đứt cho thấy giá trị mật độ phổ công suất được ước lượng bằng phương pháp dự đoán LPC.

2.5.2 Cấu trúc của giải thuật dùng mô hình LPC

Hình 2.18 mô tả sơ đồ khối của bộ mô hóa Tín hiệu thoại đầu vào sẽ được phân cắt thành các khung tín hiệu không chồng lên nhau Bộ lọc đầu vào được thiết kế để hiệu chỉnh phổ của tín hiệu ngữ vào, trong khi bộ nhận dạng tiếng nói phân loại khung hiện tại đang xử lý là tín hiệu thoại hay phi thoại, và các đầu ra một bit biểu thị trạng thái của âm thoại.

Bộ lọc ủầu ủược dựng ủể phõn tớch LP bao gồm mười LPC, với các hệ số được lượng tử hóa dựa trên các chỉ số truyền thông tin từ khung Các LPC này được sử dụng để xây dựng bộ lọc dự đoán lỗi, nhằm lọc các tín hiệu âm thanh từ bộ lọc đầu, từ đó tạo ra tín hiệu dự đoán lỗi ở đầu ra.

2.5.2.2 Công suất của chuỗi lỗi

Cơng suất của chuỗi lỗi dự đốn ứng với hai trường hợp khung thoại và

60 khung phi thoại là khác nhau Ký hiệu chuỗi lỗi dự đốn là

[ ] , [ 0, 1 ] e n n ∈ N − với N là chiều dài của khung

Trường hợp tín hiệu là phi thoại:

Trường hợp tín hiệu là âm thoại, T là chu kỳ lớn nhất của tín hiệu thành phần

Với [•] là hàm tính giá trị nhỏ hơn hoặc bằng với toán hạng

Giả sử rằng N > T thỡ việc dựng [•] luụn ủảm bảo rằng việc tớnh toỏn luụn nằm trong vùng biên của khung

2.5.2.3 Bộ giải mã trong thoại vị, trong khi bộ tạo nhiễu trắng cú tớn hiệu ngừ ra cú biờn ủộ khỏc ủại lượng ủơn vị

Việc tính toán độ lợi được thực hiện như sau: Đối với tín hiệu phi thoại, công suất của tín hiệu từ bộ lọc tổng hợp phải bằng với lỗi dự đoán của bộ mã hóa Ký hiệu độ lợi là \( g \), ta có: \( g = p \).

2.5.2.4 Nhận xét giới hạn của mô hình PLC

Giới hạn 1: Trong một số trường hợp, một khung õm thanh cú ủược phân loại là tín hiệu dạng thoại hay phi thoại

Việc sử dụng hoàn toàn nhiễu ngẫu nhiên hoặc chuỗi xung có chu kỳ để tạo kích thích không phản ánh thực tế trong việc sử dụng tín hiệu âm thoại thực.

Giới hạn 3: Thông tin về pha của tín hiệu nguyên thủy không được xem xét Giới hạn 4: Phương pháp thực hiện tổng hợp các khung thoại, trong khi một chuỗi xung dựng để kích thích bộ lọc tổng hợp với các hệ số được từ việc phân tích LP vi phạm nền tảng của mô hình AR.

Phân tích chất lượng xử lý thoại

2.6.1 Giới thiệu các phương pháp mã hoá thoại

Dịch vụ thoại là dịch vụ cơ bản và quan trọng nhất trong các dịch vụ cung cấp cho khách hàng của các nhà khai thác di động ở Việt Nam và trên thế giới Để đảm bảo hỗ trợ tốt khách hàng và đạt được lợi thế cạnh tranh, các nhà khai thác di động cần chú trọng đến chất lượng dịch vụ thoại Việc đánh giá các chỉ tiêu chất lượng thoại có vai trò rất quan trọng Nhiều tổ chức viễn thông, như ITU và ETSI, đã nghiên cứu và xây dựng các phương thức đánh giá chất lượng thoại Phần này sẽ trình bày một số phương pháp đánh giá chất lượng thoại, đặc biệt cho mạng viễn thông cố định và di động.

Việc đảm bảo chất lượng thoại là yếu tố quan trọng đối với các nhà khai thác mạng di động và cố định Chất lượng thoại không chỉ là dịch vụ thông tin cơ bản mà còn là yếu tố cạnh tranh quyết định, vì vậy việc cung cấp dịch vụ này với chất lượng ổn định là rất cần thiết.

Phương pháp đánh giá chất lượng thoại được nhiều tổ chức tiêu chuẩn như ITU-T, ETSI, và 3GPP thực hiện chuẩn hóa Bài báo phân tích bản chất của một số phương pháp đánh giá chất lượng thoại cơ bản, bao gồm phương pháp đánh giá theo thang điểm MOS (Mean Opinion Score) dựa trên khuyến nghị ITU-T P.800, các phương pháp đánh giá dựa trên mô hình giác quan PSQM (Perceptual Speech Quality Measurement) theo khuyến nghị ITU-T P.861, PESQ (Perceptual Evaluation of Speech Quality) theo khuyến nghị ITU-T P.862, và phương pháp dựa trên mô hình đánh giá truyền dẫn E-

62 model theo tiờu chuẩn ETR 250 [4] của ETSI Cỏc phương phỏp này ủược so sỏnh về ưu nhược ủiểm và phạm vi ứng dụng

2.6.2 Cỏc tham số liờn quan ủến chất lượng thoại

Cỏc tham số truyền dẫn cơ bản liờn quan ủến chất lượng thoại là:

Tham số ủỏnh giỏ cường ủộ õm lượng/tổn hao tổng thể (OLR - Overall Loudness Rating) của hệ thống không được vượt quá giới hạn được định nghĩa trong khuyến nghị G.111 của ITU-T Các giá trị ủỏnh giỏ tổn hao phía phát và thu (SLR và RLR) đối với hệ thống GSM được ủỏnh giỏ cho đến giao diện POI Tuy nhiên, tham số ảnh hưởng chính là đặc tính của MS, bao gồm cả bộ chuyển đổi tương tự - số (ADC) và số tương tự (DAC) Do đó, thông thường, người ta ủỏnh giỏ OLR của giao diện vụ tuyến.

Trễ trong truyền dẫn tín hiệu giữa hai đầu cuối gây ra khó khăn trong việc hội thoại Các loại trễ bao gồm: trễ chuyển mã thoại, trễ mã hóa kênh, trễ mạng và trễ xử lý tín hiệu thoại nhằm loại bỏ tiếng vọng và giảm nhiễu trong chế độ Handsfree.

Cắt ngưỡng (clipping): là hiện tượng mất phần ủầu hoặc phần cuối của cụm tín hiệu thoại

Cỏc tớnh chất liờn quan ủến ủộ nhạy tần số

2.6.3 Cỏc phương phỏp ủỏnh giỏ chất lượng thoại cơ bản

Việc cải thiện chất lượng thoại trong mạng GSM và các hệ thống thông tin khác có thể thực hiện thông qua việc đánh giá các tham số truyền dẫn ảnh hưởng đến chất lượng thoại Điều này bao gồm việc xác định tác động của các tham số này đối với chất lượng tổng thể Tuy nhiên, quá trình đánh giá từng tham số lại rất phức tạp và tốn kém.

Chất lượng thoại được đánh giá thông qua tham số MOS (Mean Opinion Score), phản ánh ý kiến chủ quan của người dùng Mặc dù các phương pháp này mang tính chất chủ quan, chúng có thể được phân chia thành hai loại cơ bản trong việc đánh giá chất lượng thoại.

Các phương pháp đánh giá chủ quan dựa trên quan điểm của người sử dụng về mức chất lượng dịch vụ được thực hiện trong thời gian thực Phương pháp này được quy định trong khuyến nghị ITU-T P.800.

■ Cỏc phương phỏp ủỏnh giỏ khỏch quan: sử dụng một số mụ hỡnh ủể ước lượng mức chất lượng theo thang ủiểm MOS

Phương pháp đánh giá chất lượng có thể được phân thành ba loại chính: a) Các phương pháp so sánh, dựa trên việc so sánh tín hiệu thoại truyền dẫn với một tín hiệu chuẩn đã biết b) Các phương pháp ước lượng tuyệt đối, dựa trên việc ước lượng chất lượng tín hiệu thoại mà không cần các tín hiệu chuẩn đã biết; ví dụ: INMD (được sử dụng trong khuyến nghị P.561 của ITU-T) c) Các mô hình đánh giá truyền dẫn, xác định giá trị chất lượng thoại mong muốn dựa trên những hiểu biết về mạng; ví dụ: mô hình ETSI Model.

Việc phân chia các phương pháp đánh giá chất lượng thoại cho thấy rằng nhiều thiết bị có thể kết hợp nhiều phương pháp khác nhau Trong số đó, phương pháp so sánh (hay còn gọi là intrusive methods) cho kết quả đánh giá chính xác nhất Ngoài ra, các phương pháp đánh giá khác cũng có thể được áp dụng cho một số ứng dụng đặc thù.

Phân loại các phương pháp đánh giá chất lượng thoại bao gồm: a) Các phương pháp so sánh, b) Các phương pháp ước lượng tuyệt đối, c) Các mô hình đánh giá truyền dẫn.

2.6.3.1 Phương phỏp ủỏnh giỏ chủ quan (MOS)

Kỹ thuật đánh giá chất lượng thoại sử dụng phương pháp thống kê để tính điểm chất lượng cho một lượng lớn người nghe Điểm đánh giá bình quân thường được tính là điểm Mean Opinion Scoring (MOS), theo khuyến nghị P.800 của ITU Khuyến nghị P.830 cung cấp các phương pháp cụ thể để đánh giá chất lượng thoại cho các bộ mô hóa Cả hai khuyến nghị này mô tả phương thức đánh giá, cách tính điểm theo phương thức đánh giá chủ quan, giá trị của điểm, tính chất của các mẫu thoại được sử dụng để đánh giá, và các điều kiện khác mà việc kiểm tra chất lượng được thực hiện.

Phương thức ủỏnh giỏ theo MOS cú thể ủược thực hiện theo cỏc bài

Kiểm tra hội thoại hai chiều và bài nghe một chiều là các phương pháp đánh giá chất lượng âm thanh Bài nghe một chiều thường sử dụng các mẫu thoại chuẩn, cho phép người nghe đánh giá chất lượng tổng thể dựa trên thang điểm đã được quy định Tiêu chuẩn P.800 định nghĩa nhiều hình thức đánh giá chất lượng thoại theo phương pháp chủ quan, nhằm đảm bảo tính chính xác và đáng tin cậy trong quá trình kiểm tra.

■ Bài kiểm tra hội thoại (Conversation Opinion Test)

■ Đỏnh giỏ phõn loại tuyệt ủối (Absolute Category Rating (ACR) Test)

■ Phương thức phân loại theo suy hao (Degradation Category Rating (DCR))

Phương thức phân loại so sánh (Comparison Category Rating - CCR) sử dụng thang điểm đánh giá tương tự cho các phương thức khác nhau, chẳng hạn như thang điểm hội thoại và ACR Trong phương thức hội thoại, người nghe được hỏi về quan điểm của họ đối với kết nối đang sử dụng, trong khi ACR tập trung vào việc đánh giá chất lượng thoại Thang điểm cho cả hai phương thức này đều liên quan đến việc đánh giá chất lượng thoại, giúp cung cấp cái nhìn tổng quan về hiệu suất kết nối.

1 Rất tồi Đõy là thang ủiểm từ 3-5 thụng thường ủược sử dụng ủể tớnh MOS

Ví dụ thứ hai là điểm nỗ lực nghe trong phương thức ACR (ACR Listening Effort Score) Trong phương thức này, người tham gia được yêu cầu đánh giá nỗ lực của họ để hiểu nghĩa của các câu chuẩn được sử dụng làm mẫu Thang điểm được thiết lập như sau:

66 Điểm ủỏnh giỏ Mức ủộ cố gắng cần thực hiện ủể hiểu cõu

4 Cần chú ý nhưng không cần cố gắng nhiều

3 Cần tương ủối tập trung

Hiển nhiờn, cỏc thương thức cho ủiểm theo MOS cú một số nhược ủiểm như sau:

MỤC TIÊU VÀ NHỮNG YÊU CẦU CỦA ĐỀ TÀI

Ngày đăng: 29/08/2023, 15:10

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
5. Nguyễn Quốc Trung (2004) Xử lý tín hiệu và lọc số tập 1,2 Nhà xuất bản Khoa học và Kỹ thuật Sách, tạp chí
Tiêu đề: Xử lý tín hiệu và lọc số
Nhà XB: Nhà xuất bản Khoa học và Kỹ thuật
6. Trần Công Chí (1999) Âm thanh lập thể nguyên lý và công nghệ, Nhà xuất bản Khoa học và Kỹ thuậtTiếng Anh Sách, tạp chí
Tiêu đề: Âm thanh lập thể nguyên lý và công nghệ
Nhà XB: Nhà xuất bản Khoa học và Kỹ thuật Tiếng Anh
1. TS. Đặng Đình Lâm, TS. Chu Ngọc Anh, Ths. Hoàng Anh, Ths Khác
2. Trịnh Nhật Tiến, Một số vấn ủề về an toàn dữ liệu (Trang 3-37) - Đại học Công nghệ. Đại học quốc gia Hà Nội Khác
3. TS. Trịnh Anh Vũ, Giỏo trỡnh thụng tin di ủộng (Chương 5 trang 38- 48).Đại học Cộng nghệ - Đại học quốc gia Hà Nội Khác
4. TS Nguyễn thanh Bình, THS Võ Nguyễn Quốc Bảo Giáo trình Xử lý âm thanh hình ảnh Chương 1 tranh 8- trang 37 Học viện công nghệ bưu chính viễn thong Khác

HÌNH ẢNH LIÊN QUAN

Hỡnh 2.2 Dạng súng của tớn hiệu ủiện - Nghiên cứu thiết kế chế tạo thiết bị nghe bí mật qua mạng gsm ứng dụng cho trinh sát kỹ thuật
nh 2.2 Dạng súng của tớn hiệu ủiện (Trang 36)
Hỡnh 2.4 Dạng súng ủược tỏi tạo lại - Nghiên cứu thiết kế chế tạo thiết bị nghe bí mật qua mạng gsm ứng dụng cho trinh sát kỹ thuật
nh 2.4 Dạng súng ủược tỏi tạo lại (Trang 37)
Bảng 2.1 Chuỗi tớn hiệu và biến ủổi z tương ứng - Nghiên cứu thiết kế chế tạo thiết bị nghe bí mật qua mạng gsm ứng dụng cho trinh sát kỹ thuật
Bảng 2.1 Chuỗi tớn hiệu và biến ủổi z tương ứng (Trang 39)
Bảng 2.2 Chuỗi và biến ủổi DFT - Nghiên cứu thiết kế chế tạo thiết bị nghe bí mật qua mạng gsm ứng dụng cho trinh sát kỹ thuật
Bảng 2.2 Chuỗi và biến ủổi DFT (Trang 42)
Hình 2.5  Cấu hình hệ thống xử lý tín hiệu tương tự bằng phương pháp số - Nghiên cứu thiết kế chế tạo thiết bị nghe bí mật qua mạng gsm ứng dụng cho trinh sát kỹ thuật
Hình 2.5 Cấu hình hệ thống xử lý tín hiệu tương tự bằng phương pháp số (Trang 43)
Bảng 2.3 chuẩn mã hóa âm thoại trong các hệ thống xử lý thoại. - Nghiên cứu thiết kế chế tạo thiết bị nghe bí mật qua mạng gsm ứng dụng cho trinh sát kỹ thuật
Bảng 2.3 chuẩn mã hóa âm thoại trong các hệ thống xử lý thoại (Trang 47)
Hình 2.8 Phân tích các thành phần hình sin của phần stochastic - Nghiên cứu thiết kế chế tạo thiết bị nghe bí mật qua mạng gsm ứng dụng cho trinh sát kỹ thuật
Hình 2.8 Phân tích các thành phần hình sin của phần stochastic (Trang 53)
Hỡnh 2.10 Phõn tớch tớn hiệu theo mụ hỡnh sin + nhiễu + nốt ủệm - Nghiên cứu thiết kế chế tạo thiết bị nghe bí mật qua mạng gsm ứng dụng cho trinh sát kỹ thuật
nh 2.10 Phõn tớch tớn hiệu theo mụ hỡnh sin + nhiễu + nốt ủệm (Trang 55)
Hình 2.11 Tổng hợp PLC - Nghiên cứu thiết kế chế tạo thiết bị nghe bí mật qua mạng gsm ứng dụng cho trinh sát kỹ thuật
Hình 2.11 Tổng hợp PLC (Trang 56)
Hỡnh 2.12 Sơ ủồ khối phõn ró của quỏ trỡnh thay ủổi tần số lấy mẫu - Nghiên cứu thiết kế chế tạo thiết bị nghe bí mật qua mạng gsm ứng dụng cho trinh sát kỹ thuật
nh 2.12 Sơ ủồ khối phõn ró của quỏ trỡnh thay ủổi tần số lấy mẫu (Trang 59)
Hình 2.14 các giá trị của hàm Bessel  Băng thông có giá trị xấp xỉ bằng - Nghiên cứu thiết kế chế tạo thiết bị nghe bí mật qua mạng gsm ứng dụng cho trinh sát kỹ thuật
Hình 2.14 các giá trị của hàm Bessel Băng thông có giá trị xấp xỉ bằng (Trang 62)
Hỡnh 3.1 mụ tả một vớ dụ của việc tớn hiệu õm thoại ủược biểu diễn ở cả hai  dạng là tớn hiệu tương tự và dạng chuỗi cỏc mẫu ủược lấy mẫu ở tần số là 8kHz - Nghiên cứu thiết kế chế tạo thiết bị nghe bí mật qua mạng gsm ứng dụng cho trinh sát kỹ thuật
nh 3.1 mụ tả một vớ dụ của việc tớn hiệu õm thoại ủược biểu diễn ở cả hai dạng là tớn hiệu tương tự và dạng chuỗi cỏc mẫu ủược lấy mẫu ở tần số là 8kHz (Trang 64)
Hình 2.16 mô tả một khung tín hiệu phi thoại có 180 mẫu (sử dụng bộ - Nghiên cứu thiết kế chế tạo thiết bị nghe bí mật qua mạng gsm ứng dụng cho trinh sát kỹ thuật
Hình 2.16 mô tả một khung tín hiệu phi thoại có 180 mẫu (sử dụng bộ (Trang 67)
Hỡnh 2.18 mụ tả sơ ủồ khối của bộ mó húa. Tớn hiệu thoại ủầu vào ủầu  tiờn sẽ ủược phõn cắt thành cỏc khung tớn hiệu khụng chồng lờn nhau - Nghiên cứu thiết kế chế tạo thiết bị nghe bí mật qua mạng gsm ứng dụng cho trinh sát kỹ thuật
nh 2.18 mụ tả sơ ủồ khối của bộ mó húa. Tớn hiệu thoại ủầu vào ủầu tiờn sẽ ủược phõn cắt thành cỏc khung tớn hiệu khụng chồng lờn nhau (Trang 68)
Hỡnh  2.19  Phõn  loại  cỏc  phương  phỏp  ủỏnh  giỏ  chất  lượng  thoại:  a)  Cỏc  phương pháp so  sánh, b) Các  phương  pháp  ước lượng  tuyệt  ủối, c)  Cỏc  mụ  hỡnh ủỏnh giỏ truyền dẫn - Nghiên cứu thiết kế chế tạo thiết bị nghe bí mật qua mạng gsm ứng dụng cho trinh sát kỹ thuật
nh 2.19 Phõn loại cỏc phương phỏp ủỏnh giỏ chất lượng thoại: a) Cỏc phương pháp so sánh, b) Các phương pháp ước lượng tuyệt ủối, c) Cỏc mụ hỡnh ủỏnh giỏ truyền dẫn (Trang 73)

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm