Viết tắt Tiếng Anh Tiếng Việt DSCP Differentiated Services Code Point Điểm mã dịch vụ phân biệt DTMF Dual Tone Multiple Frequency Mã đa tần DTMF Dial Tone Multi Frequency Quay số đa tần
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
VŨ SƠN HOÀN
TÌM HIỂU CÔNG NGHỆ, NGHIÊN CỨU CẤU HÌNH
VÀ CHẤT LƯỢNG DỊCH VỤ CỦA MẠNG VOICE OVER IP ÁP DỤNG CHO HỆ THỐNG MẠNG CỦA
Hà nội 2009
Trang 2
MỤC LỤC LỜI CAM ĐOAN 3
MỤC LỤC 4
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT 7
DANH MỤC CÁC BẢNG 12
DANH MỤC CÁC HÌNH VẼ 13
MỞ ĐẦU 15
1 Chương 1 – TỔNG QUAN VỀ CÔNG NGHỆ VOIP 18
1.1 Ưu thế và xu hướng phát triển của dịch vụ thoại qua internet 18
1.1.1 Lịch sử và ưu thế của dịch vụ thoại qua đường truyền internet 18
1.1.2 Sự phát triển của dịch vụ thoại internet 20
1.1.3 Thị trường hiện tại với mạng internet 22
1.1.4 Xu hướng tương lai của thị trường thoại qua internet 23
1.2 Công nghệ thoại cơ sở cho VoIP 24
1.2.1 Kênh âm thanh 24
1.2.2 Các thông số ảnh hưởng 36
1.2.3 Tổng quan về IP 39
2 Chương 2 - GIAO THỨC BÁO HIỆU TRONG VOIP 53
2.1 H.323 53
2.1.1 Giới thiệu về H.323 53
2.1.2 Các thành phần trong hệ thống 54
2.1.3 Các kênh điều khiển 59
2.2 SIP (Session Initiation Protocol) 62
2.2.1 Các thành phần của SIP 63
2.2.2 Thông điệp SIP (SIP Message) 63
2.2.3 Hoạt động của SIP 64
Trang 32.3 MGCP 66
2.3.1 Các thành phần báo hiệu SGCP 66
2.3.2 Các thủ tục thiết lập và xóa bỏ kết nối 67
2.4 IAX 69
2.5 Cisco SCCP 70
3 Chương 3 – VẤN ĐỀ AN NINH MẠNG TRONG VIỆC TRUYỀN TIẾNG NÓI QUA INTERNET 70
3.1 Đặt vấn đề 70
3.2 Vấn đề an minh mạng với các giao thức báo hiệu 71
3.3 Đề xuất an ninh với VoIP 75
3.3.1 Những yêu cầu an ninh cho VoIP 75
3.3.2 Các ràng buộc an ninh với VoIP 76
3.3.3 Giải pháp đảm bảo an ninh cho VoIP 77
3.4 Kết luận 78
4 Chương 4 – TRIỂN KHAI DỊCH VỤ VOIP Ổ VPBANK 78
4.1 Giới thiệu dịch vụ VoIP cho doanh nghiệp 78
4.1.1 Giới thiệu giải pháp 79
4.1.2 Ưu và nhược điểm của giải pháp VoIP và thoại truyền thống 80
4.2 Yêu cầu đặt ra với VPBank 80
4.2.1 Yêu cầu đặt ra 81
4.2.2 Giả thiết đặt ra 81
4.3 Thiết kế hệ thống 81
4.3.1 Mô hình tổng quan 81
4.3.2 Sơ đồ chi nhánh 82
4.3.3 Các phương án và ưu nhược điểm 83
a Tổng đài IP-PABX 83
b Sử dụng Gateway IP kết hợp với thẻ nhà cung cấp dịch vụ
c SIP Server
Trang 44.3.4 Kết luận 84
4.4 Giải pháp SIP server tại VPBank 85
4.4.1 SIP server 85
4.4.2 Thiết kế hệ thống 89
4.4.3 Sơ kết nối thoại giữa các chi nhánh 89
4.4.4 Danh sách thiết bị 89
4.4.5 Mô hình thiết bị 90
4.4.6 Đặc điểm cuộc gọi 91
4.5 Giải pháp bảo mật cho hệ thống mạng VPN của VPBank 91
4.5.1 Phân tích các giải pháp cho ngành ngân hàng 91
4.5.2 Cài đặt và triển khai hệ thống Brekeke Sip Server 92
4.6 Vấn đề bảo mật cho mạng VPN 96
4.6.1 Giới thiệu 97
4.6.2 IPsec VPN: VPN ở lớp mạng 97
4.6.3 SSL VPN là gì? 97
4.6.4 SSL VPN hay IPsec VPN? 98
4.6.5 Xu hướng 101
4.6.6 Kết luận 102
KẾT LUẬN 103
TÀI LIỆU THAM KHẢO 104
Trang 5DANH MỤC CÁC KÍ HIỆU, CHỮ VIẾT TẮT
ACELP Algebraic Code Exited Linear
Prediction
Mã hóa kích thích tiên đoán tuyến tính theo mã
ACF Access Control Field Trường điều khiển truy nhập
ACF Admission Confirmation Xác định yêu cầu truy nhập
ACR Absolute Category Rating Tỉ lệ tuyệt đối
ADC Analog to Digital Converter Chuyển đổi tương tự số
ADPCM Adaptive Differential Pulse
Code Modulation
Điều chế xung mã vi phân thích nghi
ADSL Asymmetric Digital Subscriber
Line Đường dây thuê bao bất đối xứng
AF PHB Assured Forward PHB Chuyển tiếp đảm bảo PHB
AMR-WB Adaptive Multirate Wideband Bộ mã hóa băng rộng phát triển từ
ACELP ARJ Asmission Reject Từ chối truy nhập
ARQ Acknowledgement Request Xác nhận yêu cầu
ARQ Admission Request Yêu cầu truy nhập
ATM Asynchronous Transfer Mode Chế độ chuyển giao không đồng bộ
BA Bahavious Aggregate Đồng tác động
BAS Bit rate Allocation Signal Tín hiệu phân chia tốc độ bit
BB Bandwith Broker Phân bổ Băng thông
BCF Bandwidth Change
Confirmation
Công nhận thay đổi độ rộng băng tần
BE Best Effort Cố gắng tối đa
B-LCSE Bidirectional-Logical Channel
Signalling Entity Báo hiệu kệnh logic hai chiều
BR Border Router Bộ định tuyến Cổng
BRJ Bandwidth Change Reject Từ chối thay đổi độ rộng băng tần BRQ Bandwidth Change Request Yêu cầu thay đổi băng tần
CAC Call Admission Control Điều khiển chấp nhận cuộc gọi CBQ Class - based Queing Hàng đợi theo loại dịch vụ
CELP Code Excited Linear Prediction Mã hóa kích thích tiên đoán tuyến
tính CESE Capability Exchange Signalling
Entity Báo hiệu khả năng trao đổi CIC Cicuit Identification Code Nhận dạng mã chuyển mạch kênh CLCSE Close Logical Channel
Signalling Entity Phần tử báo hiệu đóng kênh logic CNG Comfort Noise Generator Bộ tạo ồn phù hợp
CR Core Router Bộ định tuyến Lõi
CS-ACELP
Conjugate Structure Algebraic CELP (Speech CODEC) Cấu trúc mã kết hợp CELP DAC Digital to Analog Convertor Biến đổi số tương tự
DID Direct Inward Dialling Quay số nội bộ trực tiếp
DRQ DiseBìnhge Request Yêu cầu giải phóng
Trang 6Viết tắt Tiếng Anh Tiếng Việt
DSCP Differentiated Services Code
Point Điểm mã dịch vụ phân biệt DTMF Dual Tone Multiple Frequency Mã đa tần
DTMF Dial Tone Multi Frequency Quay số đa tần
DTX Discontinuous Transmission La nguyen ly chuyen mach
ECS Encryption Control Signal Tín hiệu điều khiển mã hóa bảo
mật
EF PHB Expedited Forward PHB Chuyển tiếp tiến hành PHB
ER Edge Router Bộ định tuyến Biên
FAS Frame Alignment Signal Tín hiệu đồng bộ khung
FIFO Fist In Fist Out Vào trước ra trước
FR Frame relay Chuyển mạch khung
FSI Flow State Information Thông tin trạng thái Luồng
FXO Foreign Exchange Office Đầu nhận tone (đầu trên máy đt,
fax) FXS Foreign Exchange Station Đầu cấp tone (đầu mà nhà cung cấp
dịch vụ đưa đến) G.SHDSL Symmetric high-speed digital
subscriber line Là chuẩn mới của DSL GCF Gatekeeper Confirmation Xác nhận Gatekeeper
GK Gate Keeper Bộ Điều khiển Thoại IP
GRJ Gatekeeper Reject Từ chối Gatekeeper
GRQ Gatekeeper Request Yêu cầu Gatekeeper
GSTN Internet Assigned Talephone
Network Mạng điện thoại chuyển mạch kênh
IDD international direct dialing Dịch vụ gọi điện thoại quốc tế trực
tiếp IETF Internet Engineering Task Force Nhóm nghiên cứu chuẩn kỹ thuật
cho Internet IMS IP Multimedia Subsystem Một giải pháp truyền thông thế hệ
sau IMTC International Multimedia
Teleconferecing Consortium
Hiệp hội các nhà Multimedia quốc
tế
IN Intelligent Network Mạng thông minh
IP Internet Protocol Giao thức sử dụng địa chỉ IP
IPSEC IP security Phương pháp bảo mật cho mạng IP IPv4 Internet Protocol version 4 Giao thức Internet phiên bản 4 IPv6 Internet Protocol version 6 Giao thức Internet phiên bản 6 IPX Internetwork Protocol Exchange Chuyển đổi giao thức Internetwork IRQ Information Request Yêu cầu thông tin
IRR Information Request Response Đáp ứng yêu cầu thông tin
ISDN integrated services digital
network
Mạng tích hợp các dịch vụ thông minh
ISP Internet Service Provider Nhà cung cấp dịch vụ
Trang 7Viết tắt Tiếng Anh Tiếng Việt
ISUP Integrated Services User Part Giao thức trong SS7
ITU International
Telecommunication Union Liên minh Viễn thông Quốc tế IVR interactive voice response Âm thoại tương tác
JPEG joint photographic experts
group Chuẩn nén ảnh JPEG LAN Local Area Network Mạng cục bộ
LCF Location Confirmation Công nhận cấp phát
LCN Logical Channel Number Số kênh logic
LCSE Logical Channel Signalling
Entity Báo hiệu kênh logic LDCELP Low Delay Code Excited Linear
Prediction
Mã hóa kích thích tiên đoán tuyến tính chậm
LPC linear predictive coding Mã tiên đoán tuyến tính
LPF Lowpass Filter Lọc thông thấp
LRJ Location Reject Từ chối cấp phát
LRQ Location Request Yêu cầu cấp phát
LSI Link State Information Thông tin trạng thái Liên kết
MC Multipoint Controller Bộ điều khiển đa điểm
MIPS Million Instructions Per Second Đơn vị đo mức độ phức tạp
MOS Mean Opinion Score Đơn vị đo chất lượng dịch vụ mạng
qua ý kiến của khách hàng
MP Multipoint processor Bộ xử lí điều khiển đa điểm
MPLS MultiPotocol Label Switching Chuyển mạch nhãn Đa giao thức MSDSE Master Slave Detemination
Signalling Entity
Phần tử báo hiệu xác định Master/Slave
MSN Multiple Subscriber Number Số chung cho nhiều thuê bao
MVIP Multivendor Intergration
Protocol
Giao thức giao dịch giữa các nhà đầu tư
NAT Network Address Translation Phương pháp bảo mật bằng cách
chuyển đổi địa chỉ IP NGN Next Genaration Network Mạng thế hệ sau
NIC Network Interface Card Card giao diện mạng
OPWA One Pass With Advertising Thông tin về đặc tính giữ trước tài
nguyên của nút PABX Private auto branch exchange Tổng đài
Trang 8Viết tắt Tiếng Anh Tiếng Việt
PC Personal Computer Máy tính cá nhân
PCM Pulse Code Modulation Điều chế biên độ xung mã
PHB Per Hop Behavious Tác động từng chặng
POP Point Of Present Điểm Truy nhập Dịch vụ
PPP Point to Point Protocol Giao thức điểm - điểm
PSTN Public Switched Telephone
Network Dịch vụ điện thoại công cộng QCS QoS Customer Server Máy chủ QoS khách hàng
QNS QoS Network Server Máy chủ QoS mạng
QoS Quality of Service Chất lượng dịch vụ
RAS Registration - Admission –
Status
Trạng thái điều khiển đa kênh độc lập
RCF Registration Confirmation Công nhận đăng kí
RED Random Early Detection Phát hiện sớm, bỏ gói tin ngẫu
nhiên RFC Request For Comment Yêu cầu cho ý kiến
RPE Regular Pulse Excitation Phương pháp kích thích xung đều RPI Routing Path Information Thông tin Đường định tuyến
RRQ Registration Request Yêu cầu đăng kí
Rspec Reservation Specificaiton Đặc tính giữ trước tài nguyên RSVP Resources Reservation Setup
Protocol Giao thức giữ trước tài nguyên RSVP-
E2E RSVP for end-to-end-per-flow
RSVP cho từng luồng lưu lượng từ đầu cuối tới đầu cuối
RTCP Real Time Control Protocol Giao thức điều khiển thời gian thực RTP Real-Time Transport Protocol Giao thực truyền dẫn thời gian thực RTSP Real Time Stream Protocol Giao thức dòng thời gian thực SACP Simple Network Management
Protocol
Giao thức điều khiển chấp nhận đơn giản
SBE Single Byte Extension Byte mở rộng
SBM Subnet bandwidth Manager Quản lí dải tần
SDP Session Description Protocol Giao thức mô tả phiên
SGCP Simple Gateway Control
SLA Service Level Agreement Bản thoả thuận chất lượng dịch vụ SMTP Simple Mail Transfer Protocol Giao thức vận chuyển mail
Trang 9Viết tắt Tiếng Anh Tiếng Việt
SNMP Simple Network Management
Protocol Giao thức Quản lí Mạng đơn giản SPX Sequential Protocol Exchange Trao đổi giao thức thường
xuyên/theo dãy SRP Scalable Reservation Protocols Giao thức giữ trước tài nguyên theo
bước SSL Secure Socket Layer Phương pháp bảo mật cho mạng IP TCA Traffic Condition Agreement Thoả thuận tình trạng lưu lượng TCP Transmission Control Protocol Giao thức điều khiển truyền dẫn TOS Type of Service Loại dịch vụ
Tspec Traffic Specification Đặc tính lưu lượng
UA User agent Vùng người dùng
UCF Unregister Confirmation Công nhận không đăng kí
UDP User Datagram Protocol Giao thức dữ liệu gói người dùng UMTS Universal Mobile
Telecommunications System Mạng di động thế hệ 3 URQ Unregister Request Yêu cầu không đăng kí
VAD Voice Activity Detection Phát hiện khoảng lặng
VoIP Voice Over Internet Protocol Dịch vụ điện thoại trên nền internet VPN Virtual Private Network Mạng riêng ảo
WAN Wide Area Network Mạng rộng
WFQ Weight Fair Queuing Hàng đợi theo trọng số
WRED Weighted RED Phát hiện, bỏ gói tin theo trọng số xDSL ADSL, VDSL and other Digital
Subcriber Line Techniques
Họ công nghệ trên đường dây thuê bao số
DS Differentiated Services Các dịch vụ phân biệt
Trang 10DANH MỤC CÁC BẢNG
Bảng 1.1: Giá thành của dịch thoại truyền thống IDD và VoIP tính theo phút 18 Bảng 1.2: Sự phát triển của thoại qua IP 20 Bảng 1.3: Một số các kỹ thuật nén thoại ứng dụng trong VoIP 28 Bảng 1.4: Sự phân bố bit của các tham số của thuật toán CS-ACELP tốc
Bảng 1.5: Các tham số của bộ mã và giải mã CS-ACELP 36 Bảng 2.1: Các thông điệp báo hiệu cuộc gọi Q931 60
Bảng 4.3: So sánh IPSec VPN và SSL VPN theo quan điểm kiểu kết nối 99 Bảng 4.4: So sánh đặc trưng của VPN hai giải pháp IPSec và SSL 101
Trang 11DANH MỤC CÁC HÌNH VẼ
Hình 1.1: Sơ đồ mã hóa tiếng nói LPC 30
Hình 1.2: Sơ đồ nguyên lý chung của bộ mã hoá CELP 31
Hình 1.3: Sơ đồ nguyên lý của bộ giải mã CS-ACELP 34
Hình 1.4: Sơ đồ nguyên lý của bộ giải mã CS-ACEPT 35
Hình 1.5: Khoảng cách thời gian khác nhau giữa các gói tin đến 37
Hình 1.6 : Phát lại gói tin bị mất 39
Hình 1.12: Cấu trúc gói tin IPv4 45
Hình 1.13: Cấu trúc gói tin IPv6 56
Hình 1.14: Cấu trúc Header của giao thức RTP 47
Hình 1.15: Cấu trúc tổng thể của gói tin VoIP sử dụng RTP 49
Hình 2.6: Báo hiệu trực tiếp dùng Gateway 62
Hình 2.7: Chế độ hoạt động kiều Proxy 65
Hình 2.8: Mô hình kiểu Direct Server 66
Hình 2.9: Mô hình báo hiệu dùng giao thức SGCP 68
Hình 2.10 : Thiết lập liên kết 68
Hình 2.11: Mô hình báo hiệu RGW 69
Hình 2.12 : Kết hợp với các giao thức báo hiệu khác 70
Trang 12Tên Hình Trang
Hình 3.6: Quá trình truyền âm thanh từ nơi gửi đến nơi nhận 79
Hình 4.1: Mô hình nối tổng quan chi nhánh và HO 84
Hình 4.2: Mô hình nối tổng quan đến phòng giao dịch 85
Hình 4.3: Nguyên tắc hoạt động của Redirect server 88
Hình 4.4: Mô hình nhiều server 89
Hình 4.5: Mô hình server xác định vị trí 90
Hình 4.6: Mô hình cụ thể server xác định vị trí 90
Hình 4.7: Sơ đồ kết nối chi nhánh 91
Hình 4.8: Mô hình kết nối thiết bị 92
Hình 4.9: Mô hình kết nối các LAN qua internet 94
Hình 4.10: Mô hình kết nối các LAN qua VPN 94
Hình 4.11: Kết nối thiết bị với Router 95
Hình 4.12: Màn hình đăng nhập Brekeke SIP server 95
Hình 4.13: Màn hình trạng thái đăng nhập thành công 96
Hình 4.14: Màn hình tạo User 96
Hình 4.15: Giải pháp IPSec VPN 97
Hình 4.16: Giải pháp SSL VPN 100
Trang 13Đi đôi với sự phát triển liên tục và nhanh chóng của thị trường băng thông rộng toàn cầu, điện thoại VoIP (điện thoại băng thông rộng) dựa trên kĩ thuật VoIP trở thành dịch vụ nóng hổi toàn cầu Xu thế phát triển trên toàn cầu cho thấy sự phát triển VoIP là tất yếu và chắc chắn sẽ đem lại rất nhiều áp lực đối với các nhà khai thác dịch
vụ viễn thông truyền thống Sự chuyển dịch kinh doanh vào các mạng IP công cộng bao gồm các mạng riêng ảo (VPN) đã đem lại nhiều lợi ích cho các khách hàng kinh doanh như giảm các chi phí, độ phức tạp trong công tác điều hành và các rủi ro về đầu
tư Triển khai dịch vụ thoại dựa trên công nghệ IP là một cơ hội lớn cho các nhà cung cấp dịch vụ trong những năm gần đây Yêu cầu chính để thu hút các khách hàng kinh doanh là đưa ra các dịch vụ có cam kết QoS và bảo mật
Chất lượng dịch vụ (QoS) là một thành phần quan trọng của các mạng gói
đa dịch vụ Với sự bùng nổ của Internet, tầm quan trọng của việc đảm bảo QoS ngày càng tăng Đối với ngành ngân hàng đi kèm với chất lượng dịch vụ tốt cần phải
có độ bảo mật rất cao và đa dạng các dịch vụ gia tăng mà mạng chuyển mạch kênh không thể làm được Khi sử dụng đường truyền VPN trong mạng internet không sử dụng đường dây riêng như (Leaseline), nên cần có sự bảo mật rất cao Vấn đề này được đáp ứng bởi mạng NGN mà VNPT đang triển khai ở Việt Nam
Công nghệ IP và các ứng dụng của nó đã có những bước phát triển đột phá trên
phạm vi toàn thế giới Nó đã và đang tạo ra nhiều cơ hội và thách thức mới cho các nhà cung cấp dịch vụ viễn thông Hơn nữa, xu hướng tích hợp mạng theo hướng NGN trên thế giới và theo đó là định hướng phát triển viễn thông của Việt Nam tới năm
2015 là tiến tới xây dựng một mạng tích hợp băng rộng cung cấp đa dịch vụ đặt ra nhiều vấn đề trong đó có vấn đề hỗ trợ chất lượng dịch vụ QoS Hiện tại, giới khoa học
và các tổ chức IETF, ITU, RFC đang tập trung nghiên cứu phát triển các cấu trúc, giao
Trang 14thức và công nghệ mới theo hướng ấn định và tối ưu hoá các tài nguyên mạng như
IntServ và MPLS nhằm nâng cao khả năng hỗ trợ chất lượng dịch vụ (QoS) và bảo
mật lớp 2 và 3 cho các mạng hiện có để đáp ứng yêu cầu người sử dụng, tiến tới toàn mạng IP hóa, loại bỏ mạng chuyển mạch kênh
Trên thế giới, mạng VoIP đã được nghiên cứu và khai thác từ những năm 1970 Ngay từ lúc mới ra đời mạng thoại IP đã chứng tỏ một tiềm năng phát triển lâu dài và bền vững Đến năm 1998, VoIP đã bắt đầu được khai thác và phát triển ở Việt Nam Chỉ trong một thời gian ngắn, công nghệ VoIP đã phát triển với tốc độ chưa từng có ở Việt Nam và đã chứng tỏ ưu thế của mình so với các công nghệ tương tự khác Điều
đó cho thấy việc đi sâu nghiên cứu mạng VoIP là một điều hết sức cần thiết Cho đến nay đã có rất nhiều công trình nghiên cứu về lĩnh vực này Có thể kể ra một số công
trình tiêu biểu như: “Chất lượng cuộc gọi trên mạng VoIP - Những vấn đề cần quan
tâm”, tác giả: Lê Quốc Hùng, Đào Nguyên Trung, tạp chí Bưu chính viễn thông, (8/ 2001) Hay như công trình: “Nâng cao chất lượng dịch vụ VoIP”, tác giả: Đàm Thuận
Trinh, Trịnh Quang Khải, tạp chí Bưu chính viễn thông, (9/ 2001) Và mới đây là công
trình: “Đo kiểm chất lượng thoại VoIP trên hạ tầng NGN”, tác giả: Trần Đại Dũng, tạp
chí Bưu chính viễn thông, (4/2004) Có khá nhiều công ty nghiên cứu mạng VoIP cho
các doanh nghiệp vừa và lớn Nhưng chưa có đề tài nghiên cứu chất lượng thoại và
bảo mật cho mạng VoIP của các doanh nghiệp như ngân hàng và nhiều dịch vụ
hỗ trợ cho ngân hàng Đề tài nghiên cứu để sử dụng VoIP cho ngân hàng có những đặc tính riêng của ngành như đòi hỏi mức độ bảo mật cao, độ ổn định tốt
Từ trên, chúng tôi quyết định đi sâu, tìm hiểu những đặc điểm kĩ thuật, phân tích, đánh giá, nâng cao độ ổn định và nhiều tính năng hỗ trợ cho ngành ngân, mức độ bảo mật từ đó đưa vào khai thác và ứng dụng hệ thống VoIP một cách hiệu quả nhất
Đó là lý do chúng tôi chọn đề tài: “Tìm hiểu công nghệ, nghiên cứu cấu hình và chất lượng dịch vụ của mạng Voice over IP áp dụng cho hệ thống mạng của ngân hàng VPB” Tên đề tài không có vấn đề bảo mật nhưng hệ thống mạng của ngân hàng luôn gắn chức năng bảo mật hệ thống là quan trong nhất
Trang 152 Đối tượng và phạm vi nghiên cứu
Hệ thống mạng VoIP cho các doanh nghiệp vừa và lớn nhất là cho ngành ngân hàng có yêu cầu cao về ổn định, bảo mật và các dịch vụ gia tăng là đối tượng và phạm
vi nghiên cứu trong luận văn này
3 Phương pháp nghiên cứu
Để thực hiện đề tài này, chúng tôi đã áp dụng các phương pháp nghiên cứu chuyên ngành như: Phân tích, thống kê và thực nghiệm đồng thời áp dụng cài hệ thống máy chủ SIP chạy trên mạng của ngân hàng VPBank
4 Kết cấu của luận văn
Ngoài phần mở đầu và kết luận, luận văn gồm 4 chương:
Chương 1: TỔNG QUAN VỀ CÔNG NGHỆ VOIP
Giới thiệu về lịch sử phát triển, phân tích các đặc tính mới, giá thành của thoại trên nền mạng internet Nghiên cứu phân tích các đặc tính về âm thanh, các giao thức truyền tải (TCP/IP, UDP, RTP, RTCP, SRVP) các tín hiệu yêu cầu thời gian thực trên mạng TCP/IP
Chương 2: GiAO THỨC BÁO HIỆU TRONG VOIP
Giới thiệu và phân tích một số giao thức báo hiệu phổ biến: SCCP, MGCP, MEGACO/H.248, IXA, H323 Trình bầy nguyên lý làm việc của hai giao thức SIP và H.323
Chương 3: VẤN ĐỀ AN NINH MẠNG TRONG VIỆC TRUYỀN TIẾNG NÓI QUA INTERNET
Tổng quát về các phương pháp bảo mật cho mạng tiếng nói Vấn đề bảo mật cho các giao thức báo hiệu phổ biến Tổng quan về các giải pháp an ninh mạng cho các doanh nghiệp sử dụng mạng internet công cộng
Chương 4: TRIỂN KHAI MẠNG VOIP TẠI VPBANK
Đây là chương quan trọng nhất của luận văn Giới thiệu các đặc điểm và tính năng giải pháp VoIP cho doanh nghiệp, yêu cầu mạng VoIP đặt ra với VPBank cho mạng VoIP phải đạt được Cấu trúc kết nối mạng theo kiểu hình cây của hệ thống ngân hàng Phân tích các ưu nhược điểm của các giải pháp chúng ta chọn giải pháp SIP cho ngân hàng Nghiên cứu cách hoạt động giải pháp SIP cho toàn bộ hệ thống ngân hàng Triển khai hệ thống VoIP với Brekeke SIP Server Phân tích các vấn đề bảo mật cho mạng VPN và hệ thống VoIP cụ thể tại ngân hàng
Trang 161 Chương 1 TỔNG QUAN VỀ CÔNG NGHỆ VOIP
1.1 Ưu thế và xu hướng phát triển của dịch vụ thoại qua internet
1.1.1 Lịch sử và ưu thế của dịch vụ thoại qua đường truyền internet
Từ năm 1980 đánh dấu sự phát triển của mạng IN(Intelligent Network) là nền tảng cho sự bùng nổ các dịch vụ viễn thông sau này Công nghệ viễn thông phát triển đến ngày nay qua các giai đoạn: IN->NGN->IMS Ngày nay xu thế hội tụ di động, cố định và gộp mạng tiếng nói, dữ liệu tạo nên mạng thế hệ kế tiếp Các ứng dụng giá trị gia tăng và tích hợp các dịch vụ đa phương tiện như: Web, tin nhắn, voice over IP, truyền hình hội nghị, ứng dụng chia sẻ, điện thoại, VoD (video on demand)… VoIP là một dịch vụ của mạng thế hệ mới Hiện nay phát triển bùng nổ của internet đưa đến dịch vụ thoại chỉ là một trong những dịch vụ gia tăng của mạng thế hệ kế tiếp
Vào năm 1995 công ty VocalTec đã ra sản phẩm phần mềm Internet Telephony đầu tiên trên thế giới Sau đó nhiều công ty viễn thông lớn đã đầu tư ra những sản phẩm thương mại nhưng kết quả còn nhiều hạn chế Gần đây cùng với sự phát triển của công nghệ thông tin, chất lượng của thoại Internet đã gần đạt đến chất lượng của thoại truyền thống PSTN Một số hãng viễn thông lớn như AT&T Sprint và Telstra đã thông báo về việc chuyển các mạng viễn thông chủ đạo sang nền chuyển mạch gói Điều này có nghĩa là phần lớn lưu lượng thoại sẽ được truyền qua mạng mạch gói trong thời gian không xa Thoại qua Internet đã gây được sự chú ý mạnh mẽ và có khả năng để trở thành nền tảng cho mạng thoại của công nghệ tương lai Một bí quyết thành công của dịch vụ thoại qua mạng Internet là khả năng đáp ứng như dịch vụ thoại truyền thống đặc biệt là trong thoại đường dài
Bảng 1.1: Giá thành của dịch thoại truyền thống IDD và VoIP tính theo phút
Giao dịch Điện thoại
Gọi truyền thống (IDD) Voice over IP Việt Nam-USA 3.700 đ 291 đ Việt Nam-Canada 3.700 đ 291 đ Việt Nam-Australia 3.700 đ 391 đ Việt Nam-China 3.700 đ 355 đ Việt Nam-France 3.700 đ 318 đ Việt Nam-U.K 3.700 đ 336 đ Bảng giá ngày 30/08/2009 theo điện thoại cố định tính theo phút truyền thống của VTI thuộc tập đoàn VNPT và giá điện thoại VoIP của công ty mạng truyền thông quốc tế (http://ifone.com.vn)
Công nghệ chuyển mạch gói sử dụng hiệu quả hơn so với công nghệ chuyển mạch kênh truyền thống Khi mạng PSTN được lắp đặt (Vào cuối thế kỷ 19, đầu thế
kỷ 20), thiết bị chuyển mạch rất đắt trong khi đó chi phí cho dây dẫn lại thấp Đến
Trang 17những năm 70, giá thành của các thiết bị máy tính giảm Vì vậy giá thành của các thiết
bị chuyển mạch cũng hạ rất nhanh, tốc độ giảm chi phí cho lắp đặt cáp cũng không theo kịp (Theo ý kiến của Gordon Moore, một trong những nhà sáng lập công ty Intel) Ngày nay các bộ Router với giá thành thấp đã thay thế bộ chuyển mạch và dây dẫn với giá thành đang tăng dần, thì những chuyển mạch gói tiết kiệm hơn, do đó sẽ cung cấp được dữ liệu có hiệu quả hơn nhiều Đối với giá thành là khoảng 36 đồng/1MB của chuyển mạch gói với 1000 đồng/1MB dữ liệu của chuyển mạch kênh (so sánh giữa Mega VNN của VNPT với gọi điện thoại quốc tế của VTI của VNPT)
Một số người vẫn băn khoăn về việc chia tín hiệu thoại thành một số lượng lớn các gói và việc thêm phần mào đầu vào mỗi gói để đa ra luồng dữ liệu Điều này ít nhiều có ý nghĩa quan trọng trong việc cập nhật kỹ thuật nén mà được tạo ra bởi các đầu cuối của Internet hơn là nâng cấp phần cứng của PSTN Trong hệ thống chuyển mạch kênh, toàn bộ phần cứng trong toàn bộ mạng cần được nâng cấp để tận dụng đư-
ợc các tiến bộ của kỹ thuật nén Các đầu cuối Internet, các PC chuẩn có thể thực hiện bất kể công nghệ nén tốt nhất hay không và bất kể là chúng ở đâu
Khách hàng có thể sử dụng IP cho mọi việc do đó có được mạng chung cho cả dịch vụ thoại trên Internet hoặc Intranet như multimedia
Khách hàng có thể sử dụng IP cho mọi việc do đó có được mạng chung cho cả dịch vụ thoại trên Internet hoặc Intranet như multimedia
Ngay cả trong trường hợp đơn giản nhất, tiếng nói được chuyển qua Internet cũng khó mà sai lệch hơn so với tiếng nói trong dạng tương tự truyền qua cáp đồng xoắn Vấn đề chủ yếu khi đóng gói phần mềm mã hoá tín hiệu thoại thành các gói cũng bị biến đổi Ngày xưa nhiều nhà toán học đã cho rằng phải cần đến Super Computer hoạt động trong vài ngày, thậm chí vài tuần để thực hiện được cuộc gọi trong hai phút, đấy là tiếng nói còn hình ảnh chắc là lớn hơn rất nhiều
Tình kinh tế của quy mô rất thấy rõ trong hệ thống, bởi vì Internet cũng như PSTN là một hệ thống gồm nhiều mạng Thậm chí một PSTN nhỏ cũng tận dụng được kết nối với các mạng khác
Các tiêu chuẩn chung cho dịch vụ thoại qua Internet:
Hầu hết các nhà đầu tư trên thị trường đều chấp nhận tiêu chuẩn H.323 và SIP
có khả năng hoạt động trong phạm vi quốc tế (Thực hiện tiêu chuẩn này có một ý nghĩa là bất IP nào cũng có thể nói chuyện được với một IP khác miễn là được kết nối với nhau) Theo Fost và sullivan, người ta hi vọng rằng tiêu chuẩn quốc tế mới này sẽ dẫn đến sự tăng trưởng mạnh ở trên thị trường của dịch vụ thoại Internet trong những năm tới
Dịch vụ thoại Internet đã bỏ qua hệ thống tính giá quốc tế Một nhà cung cấp dịch vụ thoại Internet với Gateway trong phạm vi nước ngoài chỉ phải trả phí giao dịch
Trang 18quốc tế của quốc gia đó, hoặc chi phí cho cuộc gọi nội hạt chứ không phải là thanh toán chi phí quốc tế.
1.1.2 Sự phát triển của dịch vụ thoại internet
Bảng 1.2: Sự phát triển của thoại qua IP
-PC-Fax -PC-điện thoại -Điện thoại -điện thoại Loại khách hàng Nhà phát triển phần mềm
VoIP
-ISP -Nhà bán lẻ -Nhà khai thác mạng Khả năng hoạt động
chuẩn nén, và đường truyền có thể tốt hơn hoặc kém hơn PSTN
Điện thoại Internet không chỉ còn là công nghệ cho giới sử dụng máy tính mà cho cả người sử dụng điện thoại quay vào Gateway Dịch vụ này được một số nhà khai thác lớn cung cấp và chất lượng thoại không thua kém chất lượng của mạng thoại thông thường, đặc biệt là trên các tuyến quốc tế Ngay nay giao thức SIP làm việc tương tự như “http://” được sử dụng phổ biến trong mạng mức độ tương thích của các Gateway cao, các tiêu chuẩn H.323, SIP được ITU chuẩn hóa và sử dụng rộng rãi
Suốt từ khi các máy tính bắt đầu kết nối với nhau, vấn đề các mạng phức hợp luôn là mối quan tâm của mọi người Mạng máy tính phát triển bên cạnh mạng điện thoại Các mạng máy tính và mạng điện thoại song song tồn tại ngay trong cùng một
cơ cấu, giữa các cơ cấu khác nhau và trong mạng rộng WAN Công nghệ thoại IP không ngay lập tức đe dọa đến mạng điện thoại toàn cầu mà nó sẽ dần thay thế thoại chuyển mạch kênh truyền thống Hiện nay hệ thống PSTN của VNPT đang chuyển dịch lên mạng thế hệ mới NGN (All IP) đi theo hướng chuẩn hóa IMS Sau đây là các ứng dụng của dịch vụ thoại Internet tiêu biểu:
Thoại thông minh
Hệ thống điện thoại ngày càng trở nên hữu hiệu, rẻ, phổ biến, dễ sử dụng, cơ động Nhưng nó hoàn toàn đơn giản, nó chỉ có 12 phím để điều khiển Trong những năm gần đây, người ta đã cố gắng để tạo ra thoại thông minh, đầu tiên là các thoại để bàn, sau là đến các điện thoại số sử dụng đường dây thuê bao số ISDN có rất nhiều dịch vụ tiện ích trên đường số và điện thoại có nhiều chức năng Nhưng mọi có gắng đều thất bại do tồn tại các hệ thống điện thoại tương tự có sẵn Internet sẽ thay đổi điều
Trang 19này, kể từ khi Internet phủ khắp toàn cầu, nó đã sử dụng để tăng thêm tính thông minh cho mạng điện thoại toàn cầu Giữa máy tính và mạng điện thoại tồn tại một mối liên
hệ Internet cung cấp cách giám sát và điều khiển cuộc gọi một cách tiện lợi hơn Chúng ta có thể thấy được khả năng kiểm soát và điều khiển các cuộc thoại thông qua mạng Internet
Dịch vụ tính cước cho thuê bao bị gọi
Thoại Internet giúp bạn có khả năng cung cấp dịch vụ tính cước cho thuê bao bị gọi đến các khách hàng nước ngoài cũng giống như khách hàng trong nước Để thực hiện được điều này, bạn chỉ cần PC với hệ điều hành Linux hoặc Windows, đường kết nối Internet (tốc độ 56 kbps, ngày nay thường sử dụng đường dây thuê bao ADSL) dùng chương trình phần mềm VoIP client của một nhà cung cấp dịch vụ VoIP nào đấy Ngày nay các nhà cung cấp dịch vụ VoIP còn cho phép gọi điện thoại ngay trên Website của họ
Thay vì gọi qua mạng điện thoại truyền thống, khác hàng có thể gọi cho bạn qua Internet bằng việc sử dụng chương trình phần mềm chẳng hạn như Internet phone của Vocaltec hoặc Netmeeting của Microsoft Với các chương trình phần mềm này, khách hàng có thể gọi đến công ty của bạn cũng giống như việc họ gọi qua mạng PSTN
Bằng việc sử dụng chương trình chẳng hạn Internet Phone JACK bạn cũng có thể xử lý các cuộc gọi cũng giống như xử lý các cuộc gọi khác Bạn có thể định tuyến các cuộc gọi này tới nhà vận hành, tới các dịch vụ trả lời tự động, gọi hội nghị Trong thực tế hệ thống dịch vụ điện thoại qua Internet có thể bao trùm hệ thống điện thoại truyền thống
Dịch vụ fax qua IP
Nếu bạn gửi nhiều fax từ PC, đặc biệt là gửi ra nước ngoài thì việc sử dụng dịch
vụ Internet fax sẽ giúp bạn tiết kiệm đợc tiền và cả kênh thoại Dịch vụ này sẽ chuyển trực tiếp từ PC của bạn qua kết nối Internet Hàng năm, thế giới tốn hơn 30 tỷ USD cho việc gửi fax trên kênh thoại đường dài Nhưng ngày nay Internet fax đã làm thay đổi điều này Việc sử dụng Internet không những được mở dùng cho thoại mà cho cả dịch vụ fax Một trong những dịch vụ gửi fax được ưa chuộng nhất là comfax
Khi sử dụng dịch vụ thoại và fax qua Internet, có hai vấn đề cơ bản:
Những người sử dụng dịch vụ thoại qua Internet cần có chương trình phần mềm chẳng hạn Quicknet’s Technologies Internet Phone JACK Cấu hình này cung cấp cho người sử dụng khả năng sử dụng thoại Internet thay cho sử dụng điện thoại để bàn truyền thông
Trang 20Kết nối một Gateway thoại qua Internet với hệ thống điện thoại hiện hành Cấu hình này cung cấp dịch vụ thoại qua Internet giống như việc mở rộng hệ thống hiện hành của bạn
Dịch vụ Call center
GateWay call center với công nghệ thoại IP cho các nhà kiểm duyện trang Web với các PC trang bị multimedia kết nối được với bộ phận phân phối các cuộc gọi tự động Một ưu điểm của thoại IP là khả năng kết hợp cả thoại và dữ liệu trên cùng một kênh
1.1.3 Thị trường hiện tại với mạng internet
Hiện nay, tại Việt Nam cũng có rất nhiều nhà khai thác dịch vụ thoại VoIP như VTN, VTI, Viettel, EVN telecom, VTC và các nhà khai thác nhỏ khác Điện thoại qua Internet (Chủ yếu truyền qua mạng Internet công cộng) có thể giúp các nhà bán lẻ dịch
vụ thoại giảm được chi phí tăng lãi Ngày trước nhà cung cấp dịch vụ này không nói rõ dịch vụ của họ là thoại Internet và thường sử dụng tuyến Internet như một tuyến chính nhằm giảm chi phí truyền dẫn Hàng triệu người không biết là mình đã từng sử dụng điện thoại trên đường truyền Internet
Đối với các nhà vận hành mạng mới đang triển khai dịch vụ Internet băng thông rộng, điện thoại Internet là một dịch vụ mới để cung cấp cho khách hàng, doanh nghiệp và cơ sở để tiếp cận thị trường Đối với các nhà cung cấp dịch vụ Internet, đây
là một dịch vụ bổ sung làm cơ sở cho việc cạnh tranh và tạo nguồn thu mới
Lưu lượng thoại trên internet tăng trưởng mạnh (chủ yếu là trên tuyến viễn thông liên tỉnh và viễn thông quốc tế Sự tăng trưởng này được thúc đẩy do giá cả chênh lệch lớn trên các tuyến viến thông đường dài Nó đặc biệt thành công cho các tuyến kết nối tới các nước nơi mà không mở cửa thị trường viễn thông cho cạnh tranh
Ở đây, các nhà cung cấp dịch vụ thoại Internet có thể lợi dụng các kẽ hở trong quy định hay chỉ đơn thuần hi vọng việc làm của mình không bị để ý Tuy nhiên, điện thoại Internet cạnh tranh tốt được các thị trường có cạnh tranh mạnh và thừa dung lượng
Điện thoại Internet hiện tác động lên thời lượng cuộc lên các tuyến đường dài nhất là tuyến thoại quốc tế và tác động này có thể còn tiếp tục tăng
Điện thoại Internet có một số ưu điểm xét trên hiệu quả kỹ thuật và điều này đồng nghĩa với việc cắt giảm phí vận hành: +Mạng IP tự động cắt quãng tạo ra khoảng lặng gói tin không được tạo ra khi không có âm thanh; +Mạng IP có độ tin cậy cao; +Nén tín hiệu thoại làm giảm dung lượng truyền tin
Cả hai điều trên cho thấy tính ưu việt của mạng IP so với mạng chuyển mạch kênh, đặc biệt khả năng tiết kiệm dung lượng và cắt giảm chi phí, tài nguyên dư thừa Tuy nhiên, để điện thoại Internet có thể chiếm lĩnh được thị trường thoại, cần thiết phải thay đổi toàn bộ cấu trúc của thị trường Internet
Trang 211.1.4 Xu hướng tương lai của thị trường thoại qua internet
Cứ mỗi năm trong suốt thập kỷ vừa qua, Internet lại tăng gấp đôi quy mô của
nó Trong các công ty nghiên cứu thị trường Internet, thì có một nhận định thống nhất
là tổng doanh số bán trong năm 1996 là từ 2 tỷ đến 3 tỷ USD Mục tiêu đặt ra là thị trường sẽ tăng trởng rộng lớn với dao động từ 110% đến 175% Forrester dự đoán là đến năm 2010, trị giá giao dịch sẽ đạt ở mức 927 tỷ USD, Active Media là 814 tỷ USD
Theo ý kiến của Kelly của ITU, thị trường giao dịch thoại quốc tế được phân thành 3 lĩnh vực sau:
Giữa các quốc gia, những tập đoàn quốc tế như Concert, Global One và AT&T Unisource sẽ chào bán thiết bị kết nối đầu cuối đến đầu cuối (end to end) Những tập đoàn này sẽ phải đối mặt với sự cạnh tranh ngày càng tăng lên từ phía dịch vụ thoại Internet, từ các chủ các phương tiện quốc tế (chẳng hạn như người điều hành vệ tinh, các nhà điều hành cáp hưu tuyến ) bán trực tiếp cho khách hàng và từ phía các thị trư-ờng giao ngay với mức giá bán lại
Đối với các cuộc gọi gốc, cạnh tranh sẽ ngày càng trở lên gay gắt bỏi những người mới thâm nhập thị trường như các dịch vụ call–back, thoại Internet và những người bán lại thông qua việc kêu gọi sử dụng card và bản quyền
Đối với những đầu cuối cuộc gọi, cạnh tranh sẽ bị chậm lại bởi vì các nhà độc quyền trước kia sẽ tiếp tục thống trị và định ra các mức giá cho các cuộc gọi quốc tế
Vị trí độc quyền của họ sẽ bị suy yếu một cách chậm chạp nên sẽ phải mất một thời gian dài và một lượng đầu tư đáng kể để triển khai các mạng mới Do vậy PTO vẫn định giá cao nhất mà họ có thể cho các đầu cuối cuộc gọi khi mà họ vẫn đang ở vị trí độc quyền
Theo ITU thì việc kiểm tra khả năng tồn tại của thoại Internet và việc triển khai
nó một cách rộng rãi là cách tốt nhất Thậm chí các nhà cung cấp dịch vụ thoại Internet hoặc các công ty phát triển phần mềm đều có thể mua các ISP
Do ưu điểm giá thành rẻ và các dịch vụ mở rộng như đã trình bày ở trên, dịch
vụ thoại Internet đã và đang tạo ra một thị trờng rộng lớn gồm mọi đối tượng sử dụng như: các thuê bao gia đình, các doanh nghiệp nhỏ, vừa và lớn, các tổ chức và các cơ quan nhà nước
Theo dự báo của IDC, số các giao dịch quốc tế theo phương pháp truyền thống
sẽ đạt 79 tỷ phút vào cuối năm 1999, và hằng năm sẽ tăng 15% Theo nhận định của ông Fischer thì tổng giá trị giao dịch trên thị trường là 300 tỷ USD Các nguồn tin tư-ơng tự cũng cho biết, giao dịch qua Internet ngày nay đạt 1898 triệu phút và sẽ tăng lên ở mức 220% hàng năm
Dự đoán thị trường sẽ đạt ở mức 900 triệu USD vào cuối năm 2009 Khi đó có hơn 106 triệu người sử dụng Tổng giá trị giao dịch qua thị trường thoại qua Internet
Trang 22dự đoán đạt mức 9.89 tỷ USD vào cuối năm 2009 Theo Frost & Sullivan thị trường sẽ đạt mức tăng trưởng hàng năm là 149% trong 5 năm liền
Dự báo trong năm 2010, một số bộ phận lớn dân cư sẽ chuyển sang sử dụng thoại Internet Chủ tịch kiêm giám đốc điều hành RSL COM, Itzhak Fischer dự báo rằng đến năm 2010 sẽ có 75% cuộc gọi thoại quốc tế được tiến hành qua Internet và một số người cho rằng đến năm 2015 con số này sẽ tăng lên 94% Theo dự đoán Phillip Tarifica cũng báo cáo rằng số người sử dụng thoại truyền thống sẽ giảm rất nhiều do sử dụng Email và thoại qua Internet
Thị trường điện thoại Internet sẽ tăng trưởng và đạt doanh thu cỡ 8,7 tỷ USD vào năm 2010 (Mc Kinsey Telecom Practice)
1.2 Công nghệ thoại cơ sở cho VoIP
1.2.1 Kênh âm thanh (Voice channel)
Một chuyển mạch mềm VoIP có hai phần chính: Quản lý cuộc gọi (hoặc chuyển mạch) và truyền âm
Để truyền âm thanh cần đóng gói, truyền, nhận và xây dựng lại âm thanh số từ kênh truyền trên mạng TCP/IP Có một số bước trong việc xử lý truyền âm trên kênh truyền: Lấy mẫu, số hóa, mã hóa, truyền, giải mã hóa và khôi phục lại âm thanh Một kênh âm thanh trong điện thoại truyền thống là 64kbps bởi vì lấy mẫu ở tần số 8000
Hz, mỗi mẫu bao gồm 8 bit vậy ta có 64000 bit suy ra dung lượng của kênh âm thanh
là 64kbps[14]
1.2.1.1 Lấy mẫu và số hóa
ADC là bộ biến đổi âm thanh nghe được ra dạng số để có thể truyền đi trong mạng VoIP DAC là bộ biết đổi ngược lại từ tín hiệu số nhận được ra âm thanh nghe được
Bộ ADC hoạt động theo nguyên tắc: lọc thông dải tín hiệu âm để lấy phần phổ chủ yếu của tín hiệu (300-3200 Hz) sau đó lấy mẫu 8000 Hz tiếp theo là lượng tử hóa mẫu Quá trình trên là điều chế xung mã (PCM) là kỹ thuật rất phổ biến
Bộ DAC là làm ngược lại quá trình ADC, nó xử lý chuỗi số rồi lọc thông thấp để tạo ra tín hiệu tương tự đưa ra loa phát ra âm thanh
1.2.1.2 Các chuẩn mã hóa
Có thể chia mã hoá thoại làm 3 loại là: mã hoá dạng sóng (waveform), mã hoá nguồn và mã hoá lai ghép là kết hợp của 2 loại trên Nguyên lý của mã hoá dạng sóng rất đơn giản mà đại diện nổi tiếng của phương pháp này là PCM và ADPCM và tất cả chúng ta đã biết nên ko cần nói lại Ưu điểm của phương pháp này là không
Trang 23phức tạp, giá rẻ, độ trễ thấp Tuy nhiên tại các tốc độ bit thấp (<64kbps) nó lại ko đảm bảo được chất lượng Bộ mã hoá nguồn sẽ khắc phục điểm yếu này Nguyên lý của bộ mã hoá nguồn là mã hoá kiểu phát âm (tức là cách thức mà bạn phát âm ra: âm
vô thanh (voiceless sound) hay âm hữu thanh (voiced sound) Cái này muốn tìm hiểu
kỹ lại phải đọc về xử lý âm thanh số và đọc về giải phẫu sinh lý cơ quan phát âm của người bên môn sinh học) Ví dụ về bộ mã hoá này là mã hoá dự báo tuyến tính LPC Các bộ mã hoá kiểu này có thể mã hoá tín hiệu thoại ở tốc độ rất thấp như 2kbps Nguyên lý cụ thể như sau: giả thiết tín hiệu tiếng nói bao gồm âm vô thanh và hữu thanh Đối với âm hữu thanh, nguồn kích thích bộ máy phát âm sẽ là một dãy các xung, còn đối với âm vô thanh thì nó sẽ là nguồn nhiễu ngẫu nhiên Các tham số này
sẽ được đóng gói và gửi đến bên thu để phân tích và tái tạo lại dạng của nguồn âm Mã hoá lai ghép là sự kết hợp của mã hoá dạng sóng và mã hoá nguồn Tiêu biểu là CELP
dự đoán tuyến tính kích thích mã Hoặc ACELP dự đoán tuyến tính kích thích mã đại
dB Hai giải thuật µ-law được mã hóa ở dạng các mẫu PCM tuyến tính 14-bit và Law là 13-bit với mẫu 8-bit Như vậy, bộ mã hóa G.711 sẽ tạo được luồng dữ liệu bit
A-có tốc độ 64kbit/giây với tần số lấy mẫu là 8kHz
G.722 là chuẩn ITU-T dùng cho mã hóa tiếng nói băng tần rộng hoạt động với tốc độ truyền 32-64 kbit/giây Công nghệ mã hóa dựa trên việc phân chia băng tần ADPCM G.722.1 cung cấp được việc nén dữ liệu với tốt độ bit thấp Một biến thể mới của G722.1 là G.722.2, được biết dưới tên là AMR-WB (Adaptive Multirate Wideband), cho phép việc nén với tốc độ thấp hơn nữa, có thể đáp ứng tốt với các kiểu nén khác nhau cũng như các thay đổi địa hình mạng Trong trường hợp sau, băng thông được tự động bảo tồn khi có sự nghẽn mạch cao Khi việc nghẽn quay trở về ở mức bình thường, thì chế độ tốc độ bit cao hơn và mức nén thấp hơn được phục hồi Chuẩn G.722 và dữ liệu mẫu âm thanh tại tốc độ 16kHz, gấp đôi tốc độ xử lý tại các giao tiếp thoại truyền thống, kết quả là chất lượng thoại tốt hơn Chuẩn G.722.1, được biết qua tên khác là “Siren™”, là một chuẩn quốc tế cho mã hóa âm thanh băng rộng ở
Trang 24tốc độ 24 và 32 kbps (băng thông thoại 50Hz-7kHz, tần số lấy mẫu là 16 ksps) tốc độ 16kb/giây), sử dụng trong các hệ thống hội nghị truyền hình được phê chuẩn vào 30 tháng 09 năm 1999 Chuẩn G.722.1 là bộ nén dựa trên sự biến đổi sao cho tối ưu hóa
cả âm thoại lẫn nhạc Độ phức tạp tính toán tương đối thấp đối với bộ nén chất lượng cao, độ trễ của giải thuật của hai điểm đầu cuối là 40ms Phiên bản G.722.1/Annex C, được phê chuẩn bởi ITU-T vào 14 tháng 05 năm 2005, còn được biết thông qua tên Siren14™, được phát triển bởi Polycom với dạng không cần bản quyền truyền với tần
số 14kHz (32ksps) Số lượng mã hóa âm thanh băng tần rộng ITU đôi khi không được hiểu chính xác Thực tế, có ba loại mã hóa cơ bản phân biệt, nhưng điều có chung một tên là G.722 Đầu tiên, G.722 là mã hóa với tần số 7kHz, sử dụng ADPCM hoạt động với tốc độ truyền 48-64kbps Một phiên bản khác G.722.1 hoạt động với tốc độ dữ liệu bằng một nửa nhưng có chất lượng tốt như G.722 với phương pháp mã hóa dựa vào nền tảng chuyển đổi Và chuẩn G.722.2, hoạt động với âm thoại băng tần rộng với tốc
độ bit truyền rất thấp, sử dụng giải thuật CELP based Về vấn đề bản quuyền, đến thời điểm này, giấy đăng ký bản quyền cho G.722 đã hết hạn cho nên hiện tại chuẩn này được xem như là chuẩn miễn phí G.722.1 thuộc bản quyền của tập đoàn Polycom và chuẩn G.722.2 còn có tên là AMR-WB, thuộc quyền sở hữu của tập đoàn Voice Age G.722.2 (GSM AMR WB) Adaptive Multi Rate – Wide Band hay AMR-WB là một chuẩn mã hóa tiếng nói được phát triển sau khi AMR sử dụng cùng công nghệ tương
tự như ACELP Mã cung cấp chất lượng âm thoại tuyệt vời bởi vì sử dụng băng tần thoại rộng hơn 50-7000 Hz khi so sánh với các mã âm thoại băng hẹp hiện đang dùng rộng rãi trong các POTS với 300-3400Hz AMRWB được hệ thống hóa thành G.722.2,
là một chuẩn mã hóa âm thoại chuẩn ITU-T Các trạng thái hoạt động của ARM: AMR-WB hoạt động tương tự AMR với nhiều tốc độ bit khác nhau gồm: 6.60; 8.85; 12.65; 14.25; 15.85; 18.25; 19.85; 23.05 và 23.85 kbps Tín hiệu truyền với tốc độ thấp nhất cho chất lượng thoại tốt nhất ứng với môi trường không nhiễu là 12.65 kbps Tốc
độ bit cao rất hữu dụng trong môi trường có nhiễu và trong trường hợp tín hiệu truyền
là âm nhạc Tốc độ bit 6.60 tới 8.85 cung cấp chất lượng chấp nhận được khi so sánh với mã hóa băng tần hẹp AMR-WB được chuẩn hóa cho việc sử dụng trong tương lai trong các hệ thống mạng như UMTS Chuẩn này cung cấp chất lượng thoại tốt hơn rất nhiều và được chọn dùng cho nhiều mạng cũ hỗ trợ cho băng rộng Tháng 10 năm
2006, kiểm nghiệm AMR-WB đầu tiên được thực hiện trên hệ thống mạng thực do Mobile và Ericssion phối hợp tại Đức
T-G.723 là một chuẩn ITU-T mã hóa âm thoại băng tần rộng, là chuẩn mở rộng của G.721 điều chế xung sai phân tương thích với tốc độ truyền 24 và 40 kbps cho các ứng dụng thiết bị nhân mạch số, hiện nay G.723 được thay thế bởi chuẩn G.276, do đó hiện tại chuẩn này là lỗi thời Chuẩn G.723.1 là chuẩn mã hóa âm thanh cho thoại với tính năng nén thoại trong khung 30 mili giây, chu kỳ 7.5ms cũng được sử
Trang 25dụng Nhạc hoặc âm tone như DTMF hoặc fax tone không thể truyền tin cậy với chuẩn
mã hóa này, do đó một số các phương pháp khác như G.711 hoặc phương pháp ngoài dãy băng tần dùng để truyền các tín hiệu này Chuẩn G.723.1 chủ yếu dùng trong các ứng dụng Voice over IP (VoIP) vì yêu cầu băng thông thấp Nó trở thành chuẩn ITU-T vào năm 1995, điều phức tạp của giải thuật là yêu cầu là dưới 16MIPS với 2,2kB Có hai tốc độ bit mà G.723.1 có thể hoạt động: 6,3 kbit/s (sử dụng khung 24 byte), dùng giải thuật MPC-MLQ (MOS 3,9); 5,3 kbit/s (sử dụng khung 20 byte) dùng giải thuật ACELP (MOS 3.62) G.726 là chuẩn mã hóa tiếng nói ITU-T ADPCM truyền âm thanh với các tốc độ 16, 24, 32, và 40 kbps Là chuẩn thay thế cho cả G.721 (ADPCM tốc độ 32kbps) và chuẩn G.723 (ADPCM với tốc độ 24 và 40 kbps) G.726 hoạt động với tần số là 16 kbps Bốn tốc độ bit thường sử dụng cho chuẩn G.726 tương ứng với kích thước của một mẫu theo thứ tự là 2-bits, 3-bits, 4-bits, và 5-bits Tốc độ thường dùng là 32 kbps, bởi vì đây chính là tốc độ bằng một nửa so với chuẩn G.711, như thế làm gia tăng dung lượng của mạng lên 50% Thông thường được dùng trong các mạng điện thoại quốc tế cũng như hệ thống điện thoại không dây DECT G.721 được giới thiệu lần đầu tiên vào năm 1984, trong khi chuẩn G.723 được giới thiệu vào năm 1988
Cả hai được gộp chung thành chuẩn G.726 vào năm 1990 G.727 được giới thiệu cùng thời điểm với G.726, cùng tốc độ bít nhưng tối ưu hơn cho môi trường PCM Packet Circuit Multiplex Equipment Điều này đạt được bằng cách nhúng bộ lượng tử hóa 2 bit vào bộ lượng tử hóa 3 bit, cho phép hủy bỏ bit có trọng số nhỏ nhất trong chuỗi bit truyền mà không có ảnh hưởng xấu đến tín hiệu âm thoại
G.728 là chuẩn ITU-T mã hóa âm thoại với tốc độ 16kbps Công nghệ sử dụng là LDCELP (Low Delay Code Excited Linear Prediction) Độ trễ của mã chỉ 5 mẫu (0.625 ms) Dự đoán tuyến tính được thực hiện tính toán với bộ lọc LPC ngược bậc 50 Ngõ vào kích thích được tạo ra để đảm bảo nhận được độ lợi VQ Chuẩn được đưa ra vào năm 1992 dưới dạng giải thuật mã dấu chấm động Năm 1994, bản dùng cho dấu chấm tĩnh được phát hành G.728 có tốc độ lên đến 2400 bps Độ phức tạp của bảng mã là 30 MIPS, với yêu cầu 2.2kByte về RAM G.729 là một giải thuật nén dữ liệu âm thanh dùng cho tín hiệu thoại, nén tín hiệu âm thanh với khung 10 mili giấy Các tone nhạc như DTMF hoặc fax không thể truyền với bộ mã hóa này, mà phải sử dụng G.711 hoặc phương pháp ngoại băng tần để truyền các tín hiệu này
G.729 đa số dùng trong các ứng dụng Voice over IP với yêu cầu băng tần thấp Chuẩn G.729 hoạt động ở tốc độ 8 kbps, nhưng các phiên bản mở rộng có thể hoạt động tại 6.4 kbps đối với môi trường truyền xấu và 11.8 kbps với yêu cầu chất lượng thoại tốt hơn Trong thực tế, người ta thường dùng chuẩn G.729a, tương tự như G.729 nhưng có độ tính toán đơn giản hơn, tuy nhiên chuẩn này lại không cho chất lượng thoại tốt hơn Phiên bản G.729b là một chuẩn có bản quyền, sử dụng module VAD để phát hiện tín hiệu thoại hay phi thoại Nó cũng bao gồm một module DTX
Trang 26dùng để quyết định nâng cấp các thông số nhiễu nền cho tín hiệu phi thoại (các khung nhiễu) Các khung này được truyền để thực hiện việc nâng cấp này được gọi là các khung SID Một bộ tạo nhiễu (CNG) cũng được tích hợp trong chuẩn này, bởi vì trong một kênh truyền, nếu việc truyền bị dừng lại vì lý do tín hiệu là tín hiệu phi thoại, thì site còn lại sẽ xem như đường kết nối này bị đứt Vì thế khi sử dụng chuẩn này cần phải thận trọng Những năm gần đây, chuẩn G.729 đã được nghiên cứu mở rộng để hỗ trợ cho tín hiệu âm thoại băng tần rộng và mã hóa âm thanh thành chuẩn G.729.1 Bộ
mã hóa G.729.1 được thiết kế theo mô hình phân cấp, tốc độ bit và chất lượng điều hiệu chỉnh đơn giản bằng cách thức cắt giảm chuỗi bit truyền G.729.1 thêm chức năng băng tần rộng so với G.729 thông qua các lớp được nhúng vào Lớp đầu tiên trên cùng G.729 (12kps) vẫn là dạng băng tần hẹp, 14 kbps thêm vào chất lượng băng tần rộng thông qua việc tái tạo phổ, sử dụng đóng gói thời gian và đóng gói tần số (có tốc độ truyền cộng thêm là 2kbps) Các lớp khác (ứng với từng bước 2 kbps) thêm nhiều thông tin về nội dung của phổ ở các tần số cao và như thế làm gia tăng chất lượng tín hiệu Các mã được phát triển bởi sự phối hợp của các tổ chức: France Telecom, tập đoàn Mitsubishi Electric, tập đoàn Nippon Telegraph & Telephone (NTT) và University deSherbrooke
G.728: mô tả kỹ thuật nén thoại CELP tại tốc độ 16kbps
G.723.1: nén thoại hay âm thanh ở tốc độ rất thấp là 5.3 hoặc 6.3 kbps Phương pháp để đánh giá chất lượng thoại phụ thuộc từng phương pháp mã hoá là điểm đánh giá trung bình MOS 4.1 thang điểm 5 được dùng để đánh giá chất lượng Cao nhất là phương pháp PCM với MOS 4.1, trễ chỉ có 0.125ms và thấp nhất
là ACELP với tốc độ 5.3 kbps trễ cao nhất là 30ms và MOS là 3.65
Bảng 1.3: Một số các kỹ thuật nén thoại ứng dụng trong VoIP
Trang 271.2.1.3 Các kỹ thuật mã hóa và giải mã
Framing là quá trình xử lý thời gian thực bằng cách chia nhỏ thông tin âm
thanh số để quản lý việc truyền dẫn trên mạng Người ta thường chia làm 20 ms để được một Frame Vậy mỗi một giây tạo ra 50 frames
Phát hiện khoảng lặng (VAD): Như chúng ta đã biết trong
thoại PSTN thông thường, 2 kênh đi và về luôn bị chiếm trong cuộc đàm thoại giữa 2 người, ngay cả khi 1 trong 2 người không nói câu nào Điều này làm lãng phí băng thông một cách khủng khiếp (có thể tới hơn 50%) vì khi một người nói thì người kia sẽ ngừng nói để nghe Những khoảng ngừng nói đấy gọi là khoảng lặng Trong VoIP, VAD được sử dụng tại bộ phát để tách lời thoại và khoảng lặng Chỉ có lời thoại được
mã hoá và truyền đi để tiết kiệm băng thông Cơ chế của bộ VAD là so sánh năng lượng tín hiệu với 1 ngưỡng nhiễu trong mỗi khung thoại Thoại được phát hiện nếu năng lượng tín hiệu lớn hơn ngưỡng nhiễu Khi VAD phát hiện năng lượng tín hiệu giảm dưới ngưỡng nhiễu nó sẽ quy đó là khoảng lặng và cắt bỏ các xung thoại dưới khoảng đó và dừng việc chèn khung thoại vào gói (Có một vấn đề ở đây là ngưỡng nhiễu ở đây sẽ được xác định như thế nào chưa tìm hiểu được trong đề tài này) Một vấn đề nữa là tại các đoạn chuyển giao giữa thoại và khoảng lặng (mở đầu hay kết thúc khoảng lặng) có thể có một đoạn nhỏ tín hiệu có thể bị xén mất và do đó chất lượng thoại cũng bị ảnh hưởng Thêm 1 vấn đề là việc phân biệt tín hiệu thoại và tạp âm nền trong điều kiện người nói trong môi trường có nhiều tạp âm và VAD rất khó để phân biệt được tín hiệu thoại với nhiễu nền đó
Nguyên lý bộ mã hoá nguồn là mã hóa kiểu phát âm (vocoder) Ví dụ như
bộ mã hoá dự báo tuyến tính (LPC) Các bộ mã hoá này có thể thực hiện được tại tốc
độ bít cỡ 2 Kbps Hạn chế chủ yếu của mã hoá kiểu phát âm LPC là giả thiết rằng: tín hiệu tiếng nói bao gồm cả âm hữu thanh và vô thanh Do đó, đối với âm hữu thanh thì nguồn kích thích bộ máy phát âm sẽ là một dãy xung, còn đối với các âm vô thanh thì
nó sẽ là một nguồn nhiễu ngẫu nhiên Trong thực tế, có rất nhiều cách để kích thích cơ quan phát âm và để đơn giản hoá, người ta giả thiết rằng chỉ có một điểm kích thích trong toàn bộ giai đoạn lên giọng của tiếng nói, dù cho đó là âm hữu thanh hay vô thanh
Vào năm 1982 Atal đã đề ra một mô hình mới về kích thích, được gọi là kích thích đa xung Trong mô hình này, không cần biết trước đó là âm hữu thanh hay
vô thanh hay có phải là giai đoạn lên giọng không Sự kích thích được mô hình hoá bởi một số xung (thông thường là 3 xung trên 5ms) có biên độ và vị trí được xác định bằng cực tiểu hoá sai lệch, có tính đến trọng số thụ cảm, giữa tiếng nói gốc và tiếng nói tổng hợp Việc đưa ra mô hình này đã tạo lên một sự chú ý to lớn và đó là mô hình đầu tiên của một thế hệ mới của các bộ mã hoá tiếng nói phân tích bằng tổng hợp Chúng có khả năng cho tiếng nói chất lượng cao tại tốc độ bit quanh 10 kbps và có thể đến tận
Trang 284,8 kbps Tín hiệu kích thích sẽ được tối ưu hoá một cách kỹ lưỡng và người ta sử dụng kỹ thuật mã hoá dạng sóng để mã hoá tín hiệu kích thích này một cách có hiệu quả Hình dưới đưa ra mô hình tổng quát của bộ mã hoá tiếng nói theo phương pháp LPC phân tích tổng hợp
Mô hình mã mã hóa tiếng nói LPC phân tích bằng tổng hợp:
Hình 1.1: Sơ đồ mã hóa tiếng nói LPC
Trong đó: u(n): tín hiệu kích thích
S*(n): tín hiệu tiếng nói tổng hợp S(n): tín hiệu tiếng nói gốc
E w (n ): tín hiệu sai số
Mô hình bao gồm ba phần chính:
Phần 1: Bộ lọc tổng hợp LPC là bộ lọc toàn cục biến đổi theo thời gian để
mô hình hoá đường bao phổ ngắn hạn của dạng sóng tiếng nói Đầu ra của bộ lọc tổng hợp là tín hiệu nói tổng hợp
Phần 2: Bộ tạo kích thích Bộ này sẽ cho ra dãy kích thích cấp cho bộ lọc tổng hợp để tạo ra tiếng nói tái tạo ở máy thu Việc kích thích sẽ được tối ưu hoá bằng cách cực tiểu hoá sai lệch, các trọng số thụ cảm, giữa tiếng nói gốc và tiếng nói tổng hợp
Phần 3: Thủ tục được sử dụng trong việc tối thiểu hoá sai lệch (Gồm 2 khối: tính trọng số sai số và cực tiểu hoá sai số) Tiêu chuẩn cực tiểu hoá sai lệch được sử dụng rộng rãi nhất là sai lệch bình phương trung bình (mes: mean squared error) Trong mô hình này tiêu chuẩn cực tiểu hoá sai số được sử dụng là: tín hiệu sai lệch
ew(n) được đưa qua một bộ lọc đánh giá trọng số sai số, có tính trọng số thụ cảm và bộ
S* (n) TiÐng nãi t«ng hîp
b/ Bé Gi¶i m·
TiÕng nãi gèc
Bé t¹o tÝn hiÖu kÝch thÝch Bé läc tæng hîp TÝnh träng sè sai sè
Cùc tiÓu ho¸ sai
sè
Bé t¹o tÝn hiÖu kÝch thÝch Bé läc tæng hîp
u(n) S*(n) e(n)
a/ Bé m· ho¸
e w (n)
Trang 29lọc này sẽ tạo dạng phổ tạp âm theo một cách nào đó để công suất tín hiệu sẽ tập chung nhất tại các tần số formant của phổ tiếng nói
Thủ tục mã hoá: Bao gồm 2 bước
Bước 1: thông số của bộ lọc tổng hợp được xác định từ mẫu tiếng nói Bước 2: dãy kích thích tối ưu đối với bộ lọc này được xác định bằng cách cực tiểu hoá sai số, có tính trọng số thụ cảm, giữa tiếng nói gốc và tiếng nói tổng hợp Khoảng thời gian tối ưu hoá kích thích khoảng 4-7.5 ms, thấp hơn khung thời gian cập nhật thông số LPC Khung tiếng nói được chia thành nhiều khung con việc kích thích được xác định riêng rẽ cho từng khung con Các tham số của bộ lọc và tín hiệu kích thích sẽ được lượng tử hoá trước khi gửi đến phía thu
Thủ tục giải mã: Cho tín hiệu kích thích đã được giải mã qua bộ lọc tổng
hợp để tiếng nói được khôi phục
Có rất nhiều phương pháp mô hình hoá sự kích thích: Phương pháp kích thích đa xung (MPE), phương pháp kích thích xung đều (RPE), phương pháp dự đoán tuyến tính kích thích mã (CELP) Ở đây chỉ đề cập đến phương pháp dự đoán tuyến tính kích thích mã CELP Hiện nay phương pháp này đã trở thành công nghệ chủ yếu cho mã hoá tiếng nói tốc độ thấp
Nguyên lý chung của bộ mã hoá CELP
Tín hiệu kích thích là một mục từ của một bảng mã rất lớn được phân bố một cách ngẫu nhiên
Sơ đồ nguyên lý của phương pháp tổng hợp CELP được đưa ra:
Hình 1.2: Sơ đồ nguyên lý chung của bộ mã hoá CELP Tại phía phát: Các tham số của bộ lọc tổng hợp cùng tăng ích và độ trễ của các bảng mã (bao gồm bảng mã thích ứng và bảng mã ngẫu nhiên) được truyền đi Tại
S*(n) Tiếng nói tổng hợp
Bộ lọc tổng hợp
Trễ khung con
Trang 30phía thu: cũng sử dụng những bảng thích ứng và ngẫu nhiên như thế để xác định tín hiệu kích thích tại lối vào bộ lọc tổng hợp LPC để tạo tiếng nói tổng hợp
Bảng mã kích thích gồm L từ mã (là các véc tơ ngẫu nhiên) có độ dài N mẫu (thông thường L=1024, N=40 mẫu ứng với một khung kích thích 5ms) Bằng cách tìm kiếm triệt để toàn bộ bảng mã ngẫu nhiên người ta sẽ chọn được tín hiệu kích thích của một khung tiếng nói dài N mẫu Bộ lọc tổng hợp đã tính trọng số được cho bởi:
) (
1 /(
1 ) / ( / 1 ) (
a z
A z
Trong đó:
g là một phân số từ 0 đến 1
{a k } là các tham số bộ lọc tổng hợp LPC (gọi là hệ số dự đoán)
P là bậc của bộ lọc tổng hợpLPC hay bậc của bộ dự đoán
Sau khi đã xác định được các tham số của bảng mã thích ứng ( bao gồm có
hệ số tăng ích và độ trễ lên giọng) thì tiếng nó tổng hợp đã tính trọng số s*(n) được cho là:
) (
* )
( )
(
* ) ( )
ya(n) = c’a(n)*h(n) là phản ứng trạng thái không của bộ lọc tổng
hợp đã tính trọng số với từ mã c’a(n) được lựa chọn từ bảng mã thích ứng
Sai số đã tính trọng số giữa tiếng nói tổng hợp và tiếng nói gốc được cho bởi:
) (
* )
( )
Trang 31Độ phức tạp của bộ mã hoá này tăng khi tốc độ bit giảm Thí dụ CELP có thể cho tiếng nói tốc độ thấp tới 4.8 kbps với trả giá rất cao về đòi hỏi tính toán do tín hiệu kích thích tối ưu được tìm kiếm thông qua bảng mã rất lớn (kích thước bảng mã thường gồm khoảng 1024 mục từ) Đối với bảng mã có 1024 từ mã và một khung kích thước 40 mẫu thì cần thực hiện khoảng 40.000 phép nhân để soát bảng mã
Có thể nhận xét rằng: nhược điểm của phương pháp CELP là: có một thủ tục đòi hỏi tính toán rất lớn rất khó có thể thực hiện trong thời gian thực Vậy có một ph-ương pháp đơn giản hoá thủ tục soát bảng mã sao cho không ảnh hưởng tới chất lượng tiếng nói Đó là phương pháp sử dụng các bảng mã đại số ACELP (Algebraic CELP) trong đó các bảng mã được tạo ra nhờ các mã sửa lỗi nhị phân đặc biệt là để nâng cao hiệu quả rà soát bảng mã, người ta sử dụng các bảng mã đại số có cơ cấu liên kết CS-ACELP (Conjugate-Structure ACELP) Khuyến nghị ITU G.729 đưa ra nguyên lý của
bộ mã hoá tiếng nói sử dụng phương pháp CS-ACELP mã hoá tiếng nói tốc độ thấp 8kbps
Nguyên lý mã hoá CS-ACELP
Tín hiệu PCM 64 kbps đầu vào (theo quy luật A hoặc µ) qua bộ mã hoá thuật toán CS-ACELP, được lẫy mẫu tại tần số 8khz, sau đó qua bộ chuyển đổi thành tín hiệu PCM đều 16 bit đưa tới đầu vào bộ mã hoá Tín hiệu đầu ra bộ giải mã sẽ đ-ược chuyển đổi thành tín hiệu PCM (theo quy luật A hoặc µ) theo đúng tín hiệu vào Các đặc tính đầu vào/đầu ra khác, giống tín hiệu PCM 64 kbps (theo khuyến nghị ITU G.711), sẽ được chuyển đổi thành tín hiệu ra PCM theo đúng quy luật của tín hiệu đầu vào ở bộ giải mã
Bộ mã hoá CS-ACELP dựa trên cơ sở của bộ mã dự báo tuyến tính kích thích mã CELP Bộ mã hoá CS-ACELP thực hiện trên các khung tiếng nói chu kỳ 10
ms tương đương với 80 mẫu tại tốc độ lấy mẫu 8000 mẫu/s Cứ mỗi một khung 10 ms, tín hiệu tiếng nó lại được phân tích để trích lấy các tham số của bộ mã CELP (đó là: các hệ số của bộ lọc dự báo thích ứng, chỉ số các bảng mã cố định và bảng mã thích ứng cùng với tăng ích của bảng mã) Các tham số này sẽ được mã hoá và truyền đi Sự phân bố bit của các tham số mã hoá được trình bày ở bảng dưới:
Trang 32Bảng 1 4: Sự phõn bố bit của cỏc tham số của thuật toỏn CS-ACELP tốc độ 8 kbit/s
(khung 10 ms)
Tham số Từ mó
Số bit trong khung con 1
Số bit trong khung con 2
Tổng số bit trong 1 khung
Tại phớa thu: Sử dụng cỏc tham số này để khụi phục cỏc tham số tớn hiệu kớch thớch và cỏc tham số của bộ lọc tổng hợp Tớn hiệu tiếng núi sẽ được khụi phục bằng cỏch lọc cỏc tham số tớn hiệu kớch thớch này thụng qua bộ lọc tổng hợp ngắn hạn
Bộ lọc tổng hợp ngắn hạn dựa trờn cơ sở bộ lọc dự bỏo tuyến tớnh LP bậc
10 Bộ lọc tổng hợp dài hạn hay bộ lọc tổng hợp độ cao dựng cho việc làm trũn mó thớch ứng.Sau khi khụi phục, nhờ bộ lọc sau tiếng núi sẽ làm tăng độ trung thực
Sơ đồ khối của bộ giải mó được mụ tả trong hỡnh dưới
Hỡnh 1.3: Sơ đồ nguyờn lý của bộ giải mó CS-ACELP Tớn hiệu đầu vào đưa qua bộ tiền xử lý, bộ này cú hai chức năng: Lọc thụng cao và tớnh toỏn tớn hiệu Tớn hiệu đầu ra bộ tiền xử lý là tớn hiệu đầu vào của cỏc khối tổng hợp tiếp sau Sự tổng hợp dự bỏo tuyến tớnh (LP) được thực hiện một lần trong một khung 10ms để tớnh cỏc hệ số của bộ lọc dự bỏo tuyến tớnh (LP) Cỏc hệ số này
Khối tiền
xử lý Khối tổng hợp LP
sự l-ợng tử hoá và nội suy
Bộ lọc tổng hợp +
+ Bảng mã
thích ứng
Bảng mã
cố định
Bộ lọc tổng hợp độ cao
Tìm bảng mã cố định
Độ cảm nhận
Sự l-ợng tử hoá
độ khuếch đại
Sự l-ợng tử hoá độ khuếch đại
luồng bit phát đi
Gp
Trang 33được biến đổi thành các cặp vạch phổ và được lượng tử bằng phương pháp lượng tử hoá véc tơ dự báo hai bước 8 bit Tín hiệu kích thích được lựa chọn bằng cách cực tiểu hoá sai số, có tính đến trọng số thụ cảm, giữa tiếng nói gốc và tiếng nói tổng hợp Các tham số kích thích (gồm: bảng mã cố định và bảng mã thích ứng) được xác định qua từng khung con 5ms (tương đương 40mẫu) Các hệ số của bộ lọc đã được lượng tử và chưa được lượng tử được sử dụng cho phân khung thứ 2, còn tại phân khung thứ nhất các hệ số của bộ lọc LP đã được nội suy sẽ được sử dụng (trong cả hai trường hợp đã lượng tử và chưa lượng tử) Độ trễ bước mạch vòng hở sẽ được tính toán một lần trong một khung 10ms dựa trên độ lớn tín hiệu thoại Sau đó các phép tính này sẽ lặp lại trong từng phân khung tiếp theo Tín hiệu ban đầu x(n) được tính bằng cách lọc độ dư
LP thông qua bộ lọc tổng hợp W(z)/A(z) Trạng thái ban đầu của bộ lọc này là tín hiệu lỗi giữa tín hiệu dư LP và tín hiệu kích thích Sự phân tích bước của mạch vòng đóng
sẽ thực hiện sau đó (để tìm độ trễ mã thích ứng và hệ số khuếch đại) dùng tín hiệu ban đầu x(n) và đặc tuyến xung h(n), bằng cách làm tròn giá trị độ trễ bước của mạch vòng
hở Độ trễ bước được mã hoá bằng mã 8 bit trong phân khung thứ nhất, hệ số vi sai của độ trễ được mã hoá bằng mã 5 bit trong phân khung thứ 2 Tín hiệu x’(n) là tín hiệu của 2 tín hiệu: tín hiệu ban đầu x(n) và tín hiệu mã thích ứng là tín hiệu mã cố định Tín hiệu này được dùng trong việc tìm tín hiệu kích thích tối ưu Giá trị kích thích mã cố định được mã hoá bằng mã đại số 17 bit (trong đó: chỉ số bảng mã cố định được mã hoá bằng từ mã C1, C2-13 bit; Dấu bảng mã cố định được mã hoá bằng từ mã S1,S2-3bit).Các bộ khuếch đại bảng mã cố định và bảng mã thích ứng được lượng tử hoá bằng véc tơ 7 bit (Trong đó: Ở bước 1 được mã hoá bằng từ mã GA1, GA2 -3 bit ;
ở bước 2 được mã hoá bằng từ mã GB1, GB2-4 bit ) tại đây sự dự đoán trung bình động cho bộ khuếch đại mã cố định Cuối cùng, dựa vào các bộ nhớ lọc sẽ xác định được tín hiệu kích thích
Nguyên lý bộ giải mã CS-ACELP
Sơ đồ khối của bộ giải mã được mô tả trong hình dưới:
Hình 1.4: Sơ đồ nguyên lý của bộ giải mã CS-ACEPT Đầu tiên, các chỉ số của các tham số được trích ra từ buồng bit thu Các chỉ
số này sẽ được giải mã để thu lại các tham số của bộ mã hoá trong 1 khung tiếng nói
10 ms Các tham số đó là: các hệ số LSP, 2 phần độ trễ bước (độ trễ bước và độ vi sai
Bảng mã cố định
Bảng mã thích ứn
g
Bộ lọc ngắn hạn
bộ xử
lý trạm
Gc
Gp
Trang 34của độ trễ bước), 2 vector bảng mã cố định (chỉ số mã cố định và chỉ số bảng mã cố định) và 2 tập hợp độ khuếch đại bảng mã cố định và bảng mã thích ứng Các hệ số LSP được nội suy và được chuyển đổi thành các hệ số bộ lọc LP cho mỗi phân khung Sau đó, cứ mỗi phân khung thực hiện các bước tiếp theo:
Giá trị kích thích được khôi phục là tổng của véc tơ bảng mã cố định và bảng mã thích ứng nhân với các giá trị khuếch đại tương ứng của chúng
Tiếng nói được khôi phục bằng cách lọc giá trị kích thích này thông qua bộ lọc tổng hợp LP
Tín hiệu tiếng nói khôi phục được đưa qua bước xử lý trạm, bao gồm bộ lọc thích ứng dựa trên cơ sở các bộ lọc tổng hợp ngắn hạn và dài hạn sau đó qua bộ lọc thông cao và bộ nâng tín hiệu
Bảng 1.5: Các tham số của bộ mã và giải mã CS-ACELP
Khuếch đại bảng mã (bước 1) của khung con thứ nhất Khuếch đại bảng mã (bước 2) của khung con thứ nhất
Khuếch đại bảng mã (bước 1)của khung con thứ hai Khuếch đại bảng mã (bước 2)của khung con thứ hai
1.2.2.1 Độ trễ và thời gian chờ (Delay/Latency)
Trễ (delay/latency) là khoảng thời gian tín hiệu cần để đi từ đầu thu của người nói tới đầu phát của người nghe
Khi xây dựng và triển khai một giải pháp VoIP, nhiều thuộc tính kĩ thuật khác nhau sẽ ảnh hưởng chất lượng cuối cùng của hệ thống Các đặc tính này bao gồm việc chọn thuật toán mã hóa, trễ của hệ thống, sự độc lập của kết nối và nhiều chỉ tiêu khác Giả sử rằng giải pháp VoIP sử dụng một bộ mã hóa tiêu chuẩn công nghiệp thì
Trang 35trễ sẽ trở thành thuộc tính quan trọng nhất mà các thiết kế phải giải quyết vì nó quyết định chất lượng dịch vụ
Trễ thường được đo bằng mili giây khoảng thời gian từ khi người nói phát
ra một từ đến lúc người nghe thực sự nghe được từ đó và được gọi là trễ từ miệng đến tai hay trễ một chiều, người sử dụng cần biết đến nó khi sử dụng hệ thống
Trễ vòng được tính bằng tổng của hai lần trễ một chiều trong một cuộc thoại Trong mạng điện thoại truyền thống, trễ vòng cho một cuộc gọi nội hạt hầu như nhỏ hơn 150 ms Ở mức này, trễ là không đáng kể đối với hầu hết mọi người nhưng nhiều cuộc gọi quốc tế (đặc biệt là qua vệ tinh), trễ vòng có thể vượt quá 1 giây và gây khó chịu cho người sử dụng Hệ thống truyền vệ tinh cần 250 ms để truyền thông tin tới vệ tinh và 250 ms nữa để truyền thông tin quay trở về trái đất, do đó trễ tổng cộng
là 500 ms Khuyến cáo của ITU-T chỉ ra rằng độ trễ này nằm ngoài khoảng chấp nhận của chất lượng thoại nhưng nhiều cuộc gọi vẫn diễn ra mỗi ngày qua các kết nối vệ tinh Như vậy, chất lượng thường được định nghĩa là những gì mà người sử dụng chấp nhận và sử dụng.[16]
Hình 1.5: Khoảng cách thời gian khác nhau giữa các gói tin đến
Jitter là vấn đề cố hữu trong các mạng chuyển mạch gói Nguyên nhân từ cơ chế xử lý lưu giữ và chuyển gói tại các nút mạng như đã được đề cập Ngoài ra do các gói đi đến đích theo các đường truyền khác nhau trên mạng, có thể phải truyền lại Loại bỏ jitter đòi hỏi phải thu thập các gói và giữ chúng trong buffer đủ lâu để cho
Trang 36phép các gói chậm đến đích để được phát lại (play) đúng thứ tự, chính điều này lại làm cho tổng độ trễ tăng lên nhưng tiếng nối phát ra nghe sẽ đều và liền mạch
Ngay cả khi thời gian trễ có thể giảm tối thiểu, một sự thay đổi thời gian trễ từ gói này đến gói sau cũng làm giảm chất lượng thoại Để khử jitter người ta dùng một
bộ đệm gọi là jitter buffer, đó có thể là một hàng đợi động với kích thước thay đổi phụ thuộc vào khoảng thời gian giữa hai lần gói đến của các gói trước vì bộ đệm cố định nếu quá lớn thì làm tăng trễ và nếu quá nhỏ thì làm mất gói[16]
1.2.2.3 Âm phản xạ (Echo)
Echo trong điện thoại có thể từ không đáng kể đến không thể chấp nhận được Nghe tiếng của mình tại ống nghe trong khi đang nói chuyện là điều bình thường, nhưng nếu nghe tại ống nghe mà trễ hơn 25 ms có thể gây ra sự ngắt quãng và phá vỡ nhịp điệu cuộc nói chuyện
Trong mạng thoại truyền thông, Echo được sinh ra bởi sự không phối hợp trở kháng trong mạch chuyển đổi hai dây - bốn dây Trong mạng chuyển mạch gói hiện nay, ta có thể tạo những bộ khử Echo trong các codec tốc độ bit thấp Ở một số hãng, Echo được khử bằng phần mềm
Để hiểu được bộ khử Echo làm việc như thế nào, trước hết, chúng ta tìm hiểu nguyên nhân sinh ra Echo
Giả sử rằng người sử dụng A gọi đến cho người sử dụng B Tiếng nói của A đến B gọi là G Khi G gặp sự không phối hợp trở kháng hoặc những môi trường gây ra Echo Nó bị bật trở lại A, A có thể nghe thấy trễ vài mili giây so với tiếng A nói thực
tế
Để loại bỏ echo ra khỏi đường dây một thiết bị giữ lại phần đảo của tiếng nói từ phía A trước khi truyền đi đến nơi nhận phía B Mic của phía B có thể thu được tiếng nói phía A lúc trước và lại truyền sang phía A khoảng thời gian này được gọi là
t0 Bộ khử Echo cho phép so sánh âm nhận được trong thời gian t0 với âm đã được lưu lại trong thời gian t0, so sánh chúng với nhau để loại bỏ âm vọng lại Đó chính là công dụng của bộ echo
Bộ khử Echo bị giới hạn bởi tổng số thời gian đợi cho tiếng nói phản xạ về, gọi là Echo tail Cisco đã tạo cấu hình cho Echo tail là 16, 24 và 32 ms
Điều quan trọng là đặt cấu hình thích hợp cho bộ khử Echo khi khởi tạo cài đặt thiết bị VoIP Nếu ta không đặt cấu hình thích hợp cho bộ khử Echo, người gọi sẽ nghe thấy tiếng vọng trong suốt cuộc gọi Làm người nghe rất khó chịu và làm giảm chất lượng thoại
Trang 371.2.2.4 Mất gói tin (Packet loss)
Mạng IP cũng như các mạng chuyển mạch gói khác không thể cung cấp một
sự đảm bảo tất cả các gói tin sẽ được chuyển tới đích Có nhiều nguyên nhân dẫn đến
sự mất gói như chất lượng đường truyền xấu hay các gói bị loại bỏ tại các nút mạng khi bị quá tải hay trong thời gian tắc nghẽn Tuy nhiên, việc truyền lại gói thì không phù hợp vì trễ quá lớn, ngay cả với các gói đến quá muộn cũng không được dùng và coi như mất
Hình 1.6 : Phát lại gói tin bị mất Gói thứ nhất, thứ hai, thứ ba đến được đích nhưng gói thứ tư bị mất trên đường truyền Sau khi bên thu đợi một khoảng thời gian, nó sử dụng một thuật toán
“che dấu”, chẳng hạn bằng cách phát lại gói thứ ba Người nghe hầu như không cảm nhận được vì tín hiệu thoại bị mất chỉ là 20 ms (ví dụ) Tuy nhiên nếu mất gói liên tục hoặc tỉ lệ mất gói lớn thì chất lượng thoại sẽ bị giảm vì các kiểu “làm giả” gói thoại như vậy không thể kéo dài Sự tổn thất gói trên 10% nói chung là không chấp nhận được
Tóm lại, tín hiệu thoại bản chất là tín hiệu tương tự, liên tục theo thời gian Lưu lượng thoại về cơ bản là không chịu được trễ và sự mất gói bởi vì khi đó chất lượng thoại cung cấp cho người dùng cuối bị suy giảm đáng kể cho dù dùng chuẩn nén
và các biện pháp hỗ trợ có tốt đến đâu Khi trễ và tỉ lệ mất vượt quá ngưỡng cho phép thì sẽ xảy ra hiện tượng mất âm tiết hay xuất hiện các âm thanh lạ Do đó trong những mạng IP đồng thời có cả thoại và dữ liệu thì chắc chắn phải cần đảm bảo chất lượng dịch vụ Sau đây là các yêu cầu để tiến tới giải quyết trễ và độ tổn thất gói cho lưu lượng thoại:
Mạng phải cung cấp sự kiểm soát lưu lượng nghiêm ngặt
Băng thông dành cho lưu lượng thoại phải đảm bảo những yêu cầu tối thiểu
Trang 38Lưu lượng thoại yêu cầu mức dịch vụ ưu tiên cao hơn luồng dữ liệu khi truyền trên cùng một tuyến liên kết.
1.2.3 Tổng quan về IP
1.2.3.1 Khái quát về giao thức truyền tải cho VoIP
Cơ chế truyền tài: TCP và UDP là hai giao thức ở tầng giao vận, hoạt động
trên IP, có các đặc điểm khác nhau Nếu sự tin cậy quan trọng hơn độ trễ thì TCP/IP
được sử dụng, ngược lại thì dùng UDP/IP[12]
TCP/IP:
Hình dưới là mô hình về mạng mạng trên thực tế nhưng chúng ta nghin cứu vào mạng VoIP là đám mây ở gữa có nhãn là IP network Chúng ta tập chung vào IP networking, IP protocol, routing ở trong IP network
Hình 1.7: Giao thức mạng VoIPGiao thức TCP/IP là giao thức rất phổ biến và thân thiện qua hàng trăm giao thức kết nối dữ liệu sử dụng cho máy tính trong mạng
Hình 1.8: Mô hình tổng quan các lớp cửa TCP/IP Khi sử dụng thuật ngữ TCP/IP, tức là đang đề cập đến nhiều hơn hai giao thức TCP và IP Trong thực tế, họ đang đề cập đến một họ giao thức khoảng hơn một
Trang 39trăm giao thức khác nhau Chúng ta gọi là bộ nghi thức được dùng để cho phép truyền thông giữa những máy tính trên mạng IP trên khắp thế giới ngày nay
Vì bộ giao thức TCP/IP chắc chắn bao gồm TCP và IP trên hình nhìn trên lớp 3 và lớp 4 Mô hình ISO có bẩy lớp nhưng mô hình rất quen thuộc và phổ thông là TCP/IP có 5 lớp, lớp IP và TCP thuộc lớp 3 và 4 trong mô hình trên
Nhưng từ lớp 3 trở lên trong danh sách những từ viết tắt là các nghi thức khác nhau trong bộ giao thức phù hợp tạo điều kiện cho khả năng đặt biệt và các dịch
vụ trên mạng IP
Hiện nay, tại sao TCP/IP và internet rất phổ thông và mối quan hệ giữa chúng Về cơ bản internet là mạng toàn thế giới bao gồm các mạng kết nối với nhau một cách lỏng lẻo không có cơ quan hành chính nào quản lý và điều khiển Trong thực
tế không có cơ quan nào có thẩm quyền tập trung thực hiện để thiết lập các tiêu chuẩn hiệu suất trên mạng internet
Hình 1.9: TCP/IP và Internet Internet là ngôn ngữ phổ thông với giao thức phù hợp TCP/IP và cụ thể IP cung cấp một lược đồ tiêu chuẩn và cơ chế chuyển tiếp cho các gói dữ liệu qua mạng
IP và TCP cung cấp một mức độ tin cậy cho các dịch vụ truyền tải tải Trên mạng IP cũng tiềm ẩn việc truyền các gói tin không đáng tin cậy
Không tin cậy nghĩa là không có sự đảm bảo rằng gói IP đến đích thành
công, bởi vì nó có thể bị trễ, không được định tuyến hay bị hỏng trong quá trình chia
và tái hợp lại các đoạn tin IP không có sơ chế điều khiển luồng hay tin cậy, do đó không có trường kiểm tra trong gói tin mà chỉ kiểm tra cho thông tin của phần header Công việc kiểm tra và điều khiển luồng thuộc về các tầng khác trong mô hình hệ thống
mà chỉ có cơ chế báo lỗi trong IP bằng cách gửi các bản tin báo lỗi
Không liên kết có nghĩa là IP không quan tâm những node nào mà các
datagram sẽ đi qua hay trạm bắt đầu và kết thúc của datagram Các datagram được truyền độc lập với nhau Điều này có nghĩa là các gói IP được phân phất không có trật
Trang 40tự Nếu một nguồn gửi đi hai gói tin liên tiếp (A trước, B sau) tới cùng một đích, mỗi gói được định tuyến độc lập và đi theo các đường khác nhau đến đích, B đến sau A
UDP: Là một trong giao thức nằm tại lớp 4 Khác với TCP, và thích ứng với
một số ứng dụng Được sử dụng cho các ứng dụng không đòi hỏi truyền lại và đòi hỏi
độ tin cậy không cao Nếu các ứng dụng cung cấp không yêu cầu bảo vệ nó phải khôi phục lỗi bằng phần mềm ứng dụng
Hình 1.10: Gói tin UDP UDP rất đơn giản như thấy trong phần tiêu đề, UDP cung cấp một khả năng ghép kênh qua cổng nguồn và cổng đích như thấy trong giao thức TCP UDP còn cung cấp khả năng kiểm tra lỗi để biết được khi mà gói tin đến đích có lỗi không
Với giao thức TCP khi nhận được gói tin sai nó sẽ yêu cầu truyền lại nhưng với UDP nó không yêu cầu truyền lại mà chỉ đơn giản là báo cáo rằng “Gói tin đã bị sai lệch” và không có gì thêm Trên thực tế với một số ứng dụng thì như vậy là đủ tốt như tiếng nói và video
Như vậy UDP cung cấp một khả năng phân kênh và nhận dạng gói tin xấu tại phía nhận[16]
1.2.3.2 Địa chỉ IP/Định tuyến
IP là một tầng mạng, với giao thức được quy định trên tiêu đề gói tin Được gọi là IP header hay Packet header chứa thông tin tiêu đề hỗ trợ việc chuyển tiếp các gói tin trong mạng IP Thông tin quan trọng của IP header gồm địa chỉ nguồn và địa chỉ đích để có thể chuyển gói tin di một cách tối ưu Truyền thông qua mạng IP mang tính chất không kết nối (Connectionless), cung cấp các truyền thông không tin cậy và dịch vụ chuyển phát[12]
Internet protocol: