Thông thường, các tín hiệu hình ảnh chứa khoảng100Mb/s thông tin, dựatrên những đặc tính của hình ảnh có nhiều phương thức xử lý đã được phát triểnnhư: Phương pháp dự đoán bù chuyển động
Trang 1TỔNG CÔNG TY VIỄN THÔNG TOÀN CẦU
Trang 2Mục Lục
Mục Lục 2
Danh mục hình vẽ 3
Lời mở đầu: 4
1 Chức năng, hoạt động của xử lý dữ liệu 5
1.1 Xử lý hình ảnh 5
1.1.1 Công nghệ mã hoá phần tử ảnh 5
1.1.2 Vị trí hình ảnh của các video khác 7
1.1.3 Xử lý âm thanh và thoại 13
1.2 Phân tích dự đoán tuyến tính 14
1.2.1 Các công nghệ ngoại vi dùng trong thông tin di động 15
1.2.2 Mã hóa thoại đa tốc độ thích ứng (AMR) trong IMT-2000 17
1.2.3 Các hệ thống xử lý tín hiệu đa phương tiện 20
2 Khái quát về phân tích dữ liệu 22
2.1 Kiểm tra dữ liệu (Data Screening) 22
2.2 Khoảng ước lượng 25
2.3 Xác định những giá trị vượt trội (Outliers) và các giá trị lỗi (Roque values) 27
2.4 Thống kê mô tả (Descriptive Statistics) 27
Kết luận 30
Trang 3Danh mục hình vẽ
Hình 1: Phương pháp mã hoá dự đoán bù chuyển động giữa các khung hình 6
Hình 2: Khái niệm về DTC 6
Hình 3: Sự tương quan giữa MPEG-4 và các tiêu chuẩn khác 7
Hình 4: Phạm vi ứng dụng của MPEG-4 11
Hình 5: Quá trình giải mã RVLC 13
Hình 6: Cách tạo giọng nói trong phương pháp mã hoá CELP 14
Hình 7: Phương pháp phân tích dự đoán tuyến tính 15
Hình 8: Kết quả đánh giá chất lượng của AMR 19
Hình 9: Lịch sử của các tiêu chuẩn về thiết bị đầu cuối nghe nhìn 21
Trang 4Lời mở đầu:
Trong những năm gần đây, phần cứng máy tính và các thiết bị liên quan đã
có sự tiến bộ vượt bậc về tốc độ tính toán, dung lượng chứa, khả năng xử lý ,đáp ứng được nhu cầu quản lý, lưu trữ thông tin và có khả năng khai thác dữliệu đa chiều, nhằm hỗ trợ những công việc thiết thực giúp những nhà quản lýcũng như bộ phận trong trung tâm giám sát đảm bảo an toàn dữ liệu
Trong hoàn cảnh đó thành phần xử lý, phân tích dữ liệu đang là một lĩnh vựcđược quan tâm và trở thành những thành phần hết sức quan trọng việc quản lý
và mã hoá dữ liệu Để phát huy vị trí, vai trò của từng thành phần trong hệ
thống xử lý chuyên đề nhánh “ Nghiên cứu thành phần xử lý, phân tích dữ liệu
trong trung tâm giám sát ” sẽ cho ta thấy thấy hiệu quả to lớn, cung cấp thông
tin hữu ích bảo đảm an toàn và phát triển các ứng quan trọng cho nhà điềuhành trung tâm giám sát
Trang 51 Chức năng, hoạt động của xử lý dữ liệu.
1.1 Xử lý hình ảnh
Phương pháp mã hoá hình ảnh MPEG-4 được sử dụng trong các dịch vụ đaphương tiện IMT2000 khác nhau như điện thoại video và truyền video Phầnnày giới thiệu các kỹ thuật và đặc trưng của các phương pháp mã hoá hình ảnh
đã ra đời trước chuẩn MPEG-4
1.1.1 Công nghệ mã hoá phần tử ảnh.
Thông thường, các tín hiệu hình ảnh chứa khoảng100Mb/s thông tin, dựatrên những đặc tính của hình ảnh có nhiều phương thức xử lý đã được phát triểnnhư:
Phương pháp dự đoán bù chuyển động giữa các khung hình (IMCP), phươngpháp biến đổi cosin rời rạc (DCT), phương pháp mã hoá độ dài biến thiên(VLC) Các phương pháp này còn được gọi là các công nghệ xử lý phần tửảnh.Phương pháp dự đoán bù chuyển động giữa các khung hình (IMCP)
Hình 1 minh hoạ ý tưởng cơ bản của phương pháp mã hoá dự đoán bùchuyển động (IMCP) IMCP là kỹ thuật mã hoá độ lớn và hướng chuyển độngcủa một phần tử ảnh hiện tại (xác định bằng cách so sánh các hình ảnh trước vàsau ảnh hiện tại) thay vì mã hoá từng ảnh (khung hình) Hướng và độ lớnchuyển động (vectơ chuyển động) thay đổi theo các khối trong mỗi ảnh Vì vậy,một ảnh được chia thành các khối (block) có kích thước 16x16 điểm ảnh ( đượcgọi là khối ảnh lớn ) để xác định được vectơ chuyển động của mỗi khối Sựkhác nhau giữa các khối ảnh lớn trên hình ảnh hiện tại và trên hình ảnh trước đóđược gọi là sai số dự đoán được DTC được ứng dụng để mã hoá sự khác nhaunày
Trang 6Khung hình hiện đại khung hình kế tiếp
Hình 1: Phương pháp mã hoá dự đoán bù chuyển động giữa các khung hình.
a DCT
Mỗi hình ảnh trong video được biểu diễn là tổng hợp của các thành phần ảnh
từ đơn giản (thành phần tần số thấp) đến phức tạp (thành phần tần số cao) Như
đã biết, thông tin chủ yếu tập trung ở các thành phần tần số thấp ư đóng vai tròquan trọng đối với thị giác Sau khi thực hiện DCT, người ta tách lấy các thànhphần tần số quan trọng ở đầu cuối để nén thông tin Phương pháp này được ápdụng rộng rãi vì việc chuyển đổi thông tin hình ảnh sang miền tần sốưkhônggian có thể được tiến hành một cách hiệu quả
Trong thực tế, DCT được áp dụng với mỗi block của một khung hình (8x8điểm ảnh) Trong hình 2, “ai ” là hệ số DCT Hệ số này được lượng tử hoá vàlàm tròn đến một mức lượng tử, sau đó được mã hoá theo phương pháp mã hoá
độ dài biến thiên (VLC) Hình 2 minh hoạ khái quát về DCT
Hình 2: Khái niệm về DTC
Trang 7
b. VLC
VLC được dùng để nén thông tin dựa vào tính chất bất thường của các giá trịtín hiệu (phần tử ảnh) đầu vào Phương pháp này phân chia các mã ngắn cho cácgiá trị tín hiệu xuất hiện thường xuyên và mã dài cho các giá trị tín hiệu xuấthiện ít thường xuyên hơn.Vị trí của các phương pháp mã hoá hình ảnh động(video) khác nhau
1.1.2 Vị trí hình ảnh của các video khác.
Các phương pháp mã hoá hình ảnh động theo tiêu chuẩn quốc tế bao gồm:H.261, MPEG-1, MPEG-2, H.263 và MPEG-4 Hình 3 trình bày các phạm viứng dụng củamỗi phương pháp Phần dưới đây sẽ miêu tả cách ứng dụng cáccông nghệ mã hoá phần tử ảnh đã giới thiệu ở trên trong mỗi phương pháp đểtăng hiệu suất nén và sự khác nhau về chức năng của các phương pháp mã hoáhình ảnh động này
Hình 3: Sự tương quan giữa MPEG-4 và các tiêu chuẩn khác
Trang 8a Mã hoá Video H.261.
Là chuẩn Quốc tế đầu tiên cho mã hoá hình ảnh video, chuẩn hoá bởi ITU-Tnăm 1990, được dùng trong dịch vụ thoại thấy hình ISDN, hội nghị truyền hình.H.261 áp dụng tất các công nghệ mã hoá phần tử ảnh đã giới thiệu ở phần trên,
đó là:
Dự đoán vectơ chuyển động của một khối 16x16 điểm ảnh để thực hiệnIMCP.DTC được ứng dụng để mã hoá sự khác nhau (lỗi dự đoán được) giữa cáckhối của khung hình hiện tại và kế tiếp (mỗi khối có kích thước 8x8 điểm ảnh).Đối với các vùng hình ảnh có sự thay đổi lớn vượt quá ngưỡng chất lượngcủa lỗi dự đoán được thì phương pháp IMCP không được sử dụng, thay vàođóngười ta sử dụng phương pháp DTC với các khối 8x8 điểm ảnh để tăng hiệuquả mã hoá
Thực hiện VLC riêng biệt cho vectơ chuyển động thu được từ IMPC và kếtquả của DCT.H.261 được áp dụng cho camera truyền hình thông thường và màngiám sát Các dạng tín hiệu TV (khung và dòng quét) theo các tiêu chuẩn khuvực về hệ truyền hình trên thế giới là khác nhau, để phục vụ thông tin liên lạcmang tính quốc tế các dạng tín hiệu này phải được chuyển thành một định dạngtrung gian Định dạng trung gian này có tên là định dạng trung gian chúng (CIF)với đặc tính: “352x288 điểm ảnh , số hình trên giây lớn nhất là 30 "
b Mã hoá video MPEG-1/MPEG-2.
MPEG-1 được chuẩn hoá bởi ISO/IEC vào năm 1993 dùng cho các phươngtiện lưu trữ dữ liệu hình ảnh (CD-ROM) với tốc độ khoảng 1,5Mbit/s MPEG-1đáp ứng được yêu cầu xử lý thời gian thực, vì thế có thể áp dụng được các công
Trang 9nghệ mới với các khả năng như: tìm kiếm ngẫu nhiên Về cơ bản MPEG-1 cũnggiống như H.261 nhưng có thêm các tính năng mới sau:
- Nếu H261 dự đoán các vectơ chuyển động từ những hình ảnh trước đó
để thực hiện IMCP (dự đoán xuôi ) thì MPEG-1 có thêm khả năng dựđoán từ các hình ảnh sau (dự đoán ngược ) nhờ các đặc tính của công cụlưu trữ Thêm vào đó, MPEGư1 thực hiện so sánh các lỗi dự đoán được
từ các phương 125 pháp dự đoán xuôi, ngược và giá trị trung bình của 2phương pháp này sau đó lấy giá trị nhỏ nhất để tăng tỷ lệ nén
- Trong khi H261 dự đoán các vector chuyển động trong các đơn vị 1điểmảnh, MPEGư1 dự đoán trong các đơn vị 0,5 điểm ảnh bằng các tạo
ra mộthình ảnh nội suy thông qua giá trị trung bình của các điểm ảnh liền
kề nhau Dự đoán chuyển động đa khung với hình ảnh nội suy cho phépnâng cao tỷ lệ nén
Với các khả năng mới này MPEG-1 được dùng rộng rãi như bộ mã hoá vàđọc video cho các máy tính cá nhân.MPEG-2 được chuẩn hoá bởi ISO/IEC vàonăm 1996 và được sử dụng cho viễnthông, thông tin quảng bá và lưu trữ hìnhảnh với tốc độ 3-20Mbit/s Trong thực tế, MPEG-2 được dùng rộng rãi chotruyền hình số, truyền hình độ phân giải cao (HDTV),DVD MPEG-2 thừahưởng các đặc tính của MPEG-1 và có thêm các đặc tính sau:
- Khả năng mã hoá một cách hiệu quả hình ảnh xen kẽ dùng trong các tínhiệu TV thông thường.Tính năng điều chỉnh kích thước, chất lượng hìnhảnh theo ý muốn bằng cách chỉ khôi phục lại một phần dữ liệu đã được
mã hoá Vì các đặc tính được thêm vào cho các mục sử dụng khác nhaunên phải bảo đảmtính tương thích của các dữ liệu được mã hoá MPEGư2
đã đưa vào khái niệm mới là“profile” và “level” để phân lớp sự khácnhau của các chức năng và sự phức tạp việc xử lý
Trang 10c Mã hoá Video H.263
Được chuẩn hoá bởi ITU-T năm 1996, là phương pháp mã hoá hình ảnh vớitốc độ bit cực thấp 28,8Kb/s, kế thừa các đặc tính mới của chuẩn MPEG-1 Cáctính năng cơ bản bắt buộc của H.263 là: Dự đoán bù chuyển động giữa cáckhung hình trong các đơn vị 0,5 điểm ảnh, mã hoá VLC Ngoài ra, các tuỳ chọnnhư:
Dự đoán bù chuyển động giữa các khung hình cho các khối 8x8 điểm ảnh,giảm nhiễu khối trong các hình ảnh v.v cũng được thêm vào H263 hiện tạiđược dùng trong một số các thiết bị phục vụ hội nghị truyền hình, điện thoạithấy hình trong ISDN
d Mã hoá video MPEG-4.
MPEG-4 được ISO/IEC phát triển dựa trên những ưu điểm của H263 củaITU-T vào năm 1999 , bao gồm khả năng chống lỗi cao.Với MPEG-2 được xâydựng chủ yếu dùng cho việc xử lý hình ảnh trong các máy tính cá nhân, truyềnhình số và thông tin tốc độ cao Ngoài các dịch vụ kể trên, MPEG-4 được chuẩnhoá với sự tập trung đặc biệt vào các ứng dụng viễn thông nói chung và thôngtin di động nói riêng MPEG-4 được đánh giá là công nghệ then chốt cho cácdịch vụ đa phương tiện: vide-thư, truyền video cũng như điện thoại video trongITM-2000
Trang 11Hình 4: Phạm vi ứng dụng của MPEG-4.
e Profile và Level
Để đảm bảo khả năng hoán đổi và tương tác của dữ liệu được mã hoá đối vớicác ứng dụng khác nhau, các chức năng của MPEG-4 được phân lớp theoprofile (lớp chức năng) còn mức độ phức tạp tính toán được phân lớp theo level(mức) như trong MPEG-2
Các lớp chức năng được định nghĩa gồm: Lớp đơn giản (Simple), lớp lõi(Core), lớp chính (Main) và lớp đơn giản mở rộng (Simple Scalable) trong đólớp đơn giản định nghĩa các chức năng cơ bản
VD: Dự đoán bù chuyển động đa khung với 8x8 điểm ảnh trong H 263 nằmtrong lớp đơn giản
Thông tin:
- Điện thoại di động video
- Điện thoại di động có thể truyền hình hội nghị
- Thông tin quảng bá
- T.V di động Phát tán thông tin di động ( Video và âm thanh)
Trang 12Máy tính
- Thư Video
- Thông tin đa phương
- tiện theo yêu cầu
- Internet di động 127
Với lớp đơn giản, các hình ảnh QCIF với kích thước bằng 1/4 của CIF được
xử lý ở mức 0 và 1 còn CIF ở mức 2.Các tiêu chuẩn ITM 2000, tiêu chuẩn chođiện thoại thấy hình 3GPP 3G-324M trong ITM2000 đòi hỏi các chức năng cơbản trong H263 như là phương thức mã hoá hình ảnh bắt buộc và khuyến nghị
sử dụng MPEG-4 với Simple profile và level 0 Simple profile bao gồm cáccông cụ chống lỗi:
Đồng bộ lại : Hạn chế lỗi truyền dẫn bằng cách chèn mã đồng bộ lại vàotrong dữ liệu VLC và xắp xếp mã này vào vị trí hợp lý ở trong khung dữ liệu
Vì thông tin tiêu đề nối tiếp ngay sau mã đồng bộ lại để xác định các tham số
mã hoá nên cho phép dữ liệu được khôi phục lại nhanh chóng từ trạng thái củacác lỗi mã hoá
Phân chia dữ liệu: Dấu lỗi bằng cách chèn mã đồng bộ SC vào ranh giớigiữa các loại dữ liệu VD: nhờ chèn SC vào giữa dữ liệu của vectơ chuyển động
và hệ số DCT, vectơ chuyển động có thể được truyền đi một cách chính xácngay cả khi một lỗi bit bị lẫn vào phần hệ số DCT
VLC nghịch (RVLC) : Có thể giải mã các dữ liệu theo cả hai chiều, được ápdụng đối với hệ số DCT Với công cụ này, tất cả các khối điểm ảnh lớn (macro)đều có thể được giải mã trừ các khối nằm giữa các lỗi bit sẽ bị bỏ qua
Trang 131.1.3 Xử lý âm thanh và thoại.
a Thuật toán CELP.
Có ba phương pháp mã hoá thoại thông dụng là: mã hoá dạng sóng âm(waveform), mã hoá giọng nói (vocoder) và mã hoá kết hợp (Hybrid)
Mã hoá dạng sóng âm: Giống như PCM và APCM, mã hoá dạng sóng âmthực hiện mã hoá dạng sóng tín hiệu ở mức chính xác nhất có thể, không phụthuộc vào tính chất tự nhiên của tín hiệu nên khi tốc độ bit đủ lớn thì chất lượng
là tốt nhất (16kbit/s), tuy nhiên khi tốc độ bít giảm thì chất lượng sẽ giảm đi rấtnhanh chóng
Mã, mã hoá các tham số của mô hình này Mặc dù phương pháp này chophép tốc độ bit thấp (2kbit/s), nhưng rất khó để cải thiện chất lượng tiếng nóingay cả khi tốc độ bít được nâng cao vì chất lượng tiếng nói phụ thuộc rất lớnvào mô hình tạo tiếng nói
Trang 14Mã hoá kết hợp: Là phương pháp kết hợp hai phương pháp trên Phân tíchcác tham số của bộ tạo tiếng nói và mã hoá dạng sóng đối với phần thông tincòn lại CELP là phương pháp mã hoá tiêu biểu cho phương pháp này và đượcdùng rộng rãi trong thông tin di động.
Hình 6 mô tả một bộ tạo tiếng nói trong phương pháp mã hoá CELP Bộ mãhoá và giải mã CELP có cùng cấu trúc bên trong Bộ giải mã gồm có: bộ lọctổng hợp dự đoán tuyến tính và hai bộ tham chiếu (bảng mã) tạo tín hiệu điềukhiển bộ lọc Bộ lọc đóng vai trò như khoang miệng tái tạo lại phổ của tín hiệutiếng nói, tín hiệu điều khiển đóng vai trò như âm thanh của thanh quản CELPtái tạo lại hệ thống phát âm của con người
Hình 6: Cách tạo giọng nói trong phương pháp mã hoá CELP
1.2 Phân tích dự đoán tuyến tính.
Dựa vào tính tương quan tạm thời của tín hiệu thoại và dự đoán tín hiệu dựavào các tín hiệu trước đó Sự khác nhau giữa tín hiệu dự đoán được và tín hiệugốc gọi là phần dư dự đoán, mã hoá CELP tính toán độ tương quan của các tínhiệu thoại và hệ số dự đoán tuyến tính
Bậc của hệ số dự đoán trong băng tần thoại thông thường chỉ là 10 Vì vậykhó xác định sự ổn định của bộ lọc, các hệ số của bộ lọc được chuyển đổi thànhcác hệ số tương đương và hệ số ổn định, ví dụ như các hệ số phản hồi, sau đó
Trang 15được lượng tử hoá để truyền đi Bộ giải mã tạo thành một bộ lọc tổng hợp với
hệ số truyền dẫn ai điều khiển bộ lọc và phần dư dự đoán tái tạo tín hiệu thoại Đặc tính tần số của bộ lọc tương đương với đường bao phổ tín hiệu thoại.Bộlọc tải theo độ nhạy (Perceptual Weighing Filter) CELP mã hoá tín hiệu bằngcách tìm các mẫu và độ lớn trong mỗi bảng mã (codebook) sao cho lỗi giữa tínhiệu thoại tổng hợp và tín hiệu thoại đầu vào là nhỏ nhất, kỹ thuật này được gọi
là phân tích bằng tổng hợp (AưbưS) là một trong những đặc tính của CELP
Hình 7: Phương pháp phân tích dự đoán tuyến tính
Bảng mã tương thích lưu trữ các tín hiệu kích thích trước đó trong bộ nhớ vàthay đổi chúng một cách linh động Nếu tín hiệu kích thích là tuần hoàn, giốngnhư tiếngnói, tín hiệu kích thích có thể được biểu diễn hiệu một cách hiệu quảkhi sử dụng bảng mã vì tín hiệu này lặp lại tại đỉnh chu kỳ tương ứng với đỉnhcủa giọng nói
1.2.1 Các công nghệ ngoại vi dùng trong thông tin di động
Trong thông tin di động, các công nghệ ngoại vi được áp dụng để đáp ứngđược với các điều kiện đặc biệt như: sử dụng các đường truyền vô tuyến, sửdụng dịch vụ các dịch vụ ngoài trời hoặc trong khi di chuyển
Trang 16- Công nghệ sửa lỗi
Mã sửa lỗi dùng để sửa các lỗi do quá trình truyền dẫn tạo ra trên các kênh
vô tuyến Phương pháp sửa lỗi đường truyền lựa chọn bít (BSưFEC) hayphương pháp chống lỗi không đồng đều ( UEP) sửa lỗi khá hiệu quả vì chúng sửdụng các mã sửa lỗi với các khả năng khác nhau phụ thuộc vào độ nhạy với lỗicủa bit thông tin mã hoá thoại
- Công nghệ ẩn lỗi
Nếu một lỗi không thể sửa được bằng các phương pháp trên, hoặc thông tin
bị mất thì không thể giải mã chính xác đối với tín hiệu thu Trong trường hợpnày thì phần bị lỗi của tín hiệu thoại được tái tạo bằng phép nội suy giá trị dựavào các thông tin thoại đã biết, để giảm thiểu sự suy giảm chất luợng thoại Đây
- Truyền dẫn gián đoạn