Hình 1.2: Lấy mẫu tín hiệu với các tần số khác nhau Như vậy, ta thấy rằng nếu tần số lấy mẫu càng cao thì dạng của tín hiệu càng có khả năng khôi phục giống như tín hiệu gốc.. Hình 1.4:
Trang 1LỜI MỞ ĐẦU
Truyền hình từ trước đến nay luôn có sự biến đổi và phát triển mạnh mẽ Thời kỳ đầu còn là những thiết bị thô sơ, tín hiệu hầu như được truyền bằng tương tự Ngày nay với sự phát triển mạnh mẽ của hệ thống thông tin số và truyền dẫn số Đặc biệt là truyền dẫn bằng tín hiệu HD với độc sắc nét cao về hình ảnh
Vì vậy, em đã lựa chọn đề tài này làm báo cáo thực tập Dưới sự hướng
dẫn nhiệt tình của thầy Vũ Việt Hưng mà em có thể hoàn thành báo cáo này.
Trong quá trình làm báo cáo, do thời gian có hạn nên trong báo cáo còn nhiều thiếu sót Vì vậy, em rất mong nhận được sự đóng góp nhiệt tình từ các thầy cô và các bạn trong Khoa để báo cáo được hoàn thiện hơn
Trang 2được chuyển thành số nhị phân để có thể xử lý được Vấn đề ở đây là phải lấy mẫu như thế nào để có thể khôi phục lại tín hiệu gốc Tín hiệu lâýu mẫu của tín hiệu gốc s(t) biểu diễn là s(nT) với T là chu kỳ lấy mẫu.
Trang 3Hình 1.1: Tín hiệu lấy mẫu và phổ
Quá trình lấy mẫu mô tả ở trên là quá trình lấy mẫu lý tưởng Trong thực
tế, do tín hiệu u(t) là các xung lấy mẫu với chu kỳ T, độ rộng τ và biên độ a nên phổ tín hiệu thực tế sẽ không chỉ là hàm S(f) mà là:
( ) sin f( )
S f a
f
π ττ
1.1 Tần số lấy mẫu
Xét tín hiệu sin có tần số f và quá trình lấy mẫu với các chu kỳ lấy mẫu khác nhau
Hình 1.2: Lấy mẫu tín hiệu với các tần số khác nhau
Như vậy, ta thấy rằng nếu tần số lấy mẫu càng cao thì dạng của tín hiệu càng có khả năng khôi phục giống như tín hiệu gốc Tuy nhiên, nếu tần số càng cao thì cần phải dùng dung lượng lớn hơn để lưu trữ và đồng thời tốc độ
xử lý sẽ chậm lại do cần xử lý số lượng dự liệu lớn Từ đó, ta cần xác định tần
Trang 4số lấy mẫu sao cho có thể khôi phục lại gần đúng dạng tín hiệu với yêu cầu tốc độ xử lý giới hạn trong mức cho phép.
1.2 Định lý lấy mẫu
Định lý lấy mẫu xác định điều kiện để một tập mẫu có thể cho phép khôi phục lại chính xác tín hiệu trước khi lấy mẫu Như khảo sát ở trên (hình 1.1), phổ của tín hiệu lấy mẫu là tín hiệu có chu kỳ trên miền tần số Để khôi phục lại dạng của tín hiệu, ta chỉ cần giới hạn phổ tần của tín hiệu Quá trình này có thể thực hiện bằng một mạch lọc thông thấp với hàm truyền:
( )
s s
Trang 5Hình 1.3: Khôi phục tín hiệu sau khi lấy mẫu
Như vậy, ta có thể khôi phục lại tín hiệu trước khi lấy mẫu khi phổ tín hiệu sau khi qua mạch lọc phải giống hệt với phổ tín hiệu gốc Theo hình 1.3, điều kiện này thỏa mãn khi phổ tín hiệu gốc không chứa thành phần tần số lớn hơn fs/2
Trong trường hợp ngược lại, phổ của tín hiệu lấy mẫu sẽ bị méo dạng nên khi sử dụng mạch lọc để khôi phục tín hiệu thì tín hiệu này sẽ khác với tín
hiệu gốc, hiện tượng này gọi là chồng phổ (aliasing).
Hình 1.4: Hiện tượng chồng phổ
Từ đó định lý lấy mẫu phát biểu như sau:
"Một tín hiệu không chứa bất kỳ thành phần tần số nào lớn hơn hay bằng một giá trị f m có thể biểu diễn chính xác bằng tập các giá trị của nó
Trang 6với chu kỳ lấy mẫu T = 1/2f m ".
Như vậy, tần số lấy mẫu phải thỏa mãn điều kiện fs ≥ 2fm trong đó fm là thành phần tần số lớn nhất có trong tín hiệu Tần số giới hạn này được gọi là tần số Nyquist và khoảng (-fs/2, fs/2) gọi là khoảng Nyquist Trong thực tế, tín hiệu trước khi lấy mẫu sẽ bị giới hạn bằng một mạch lọc để tần số tín hiệu nằm trong khoảng Nyquist
Vi dụ như tín hiệu âm thanh thường nằm trong khoảng (300, 34000) Hz nên người ta sẽ đưa tín hiệu qua mạch lọc thông thấp để loại các thành phần tần số bậc cao và thực hiện lấy mẫu ở tần số tối thiểu là 6,8 KHz
1.3 Lấy mẫu tín hiệu sin và tín hiệu ngẫu nhiên
1.3.1 Tín hiệu sin
Xét s(t) = cos(2 ftπ + θ) với 0≤ θ ≤ π/ 2 được lấy mẫu với chu kỳ T=1
Tín hiệu lấy mẫu là:
1.3.2 Tín hiệu ngẫu nhiên
Xét tín hiệu s(t) được lấy mẫu với chu kỳ T, tín hiệu ngẫu nhiên rời rạc tạo ra s(nT) sẽ có hàm phân phối xác suất biên độ giống như s(t) Hàm tự tương quan của tín hiệu rời rạc s(nT) là:
Trang 7Như vậy, chuỗi r(n) cũng chính là chuỗi tạo ra từ quá trình lấy mẫu tín hiệu rxx( )τ Tương tự công thức (1.3), quan hệ giữa hàm mật độ phổ công suất của tín hiệu rời rạc (f )Φ và tín hiệu liên tục Φxx( )f là:
2 Lượng tử hóa
Lượng tử hóa là quá trình xấp xỉ các giá trị của tín hiệu lấy mẫu s(nT)
bằng bội số của một giá trị q (q gọi là bước lượng tử) Nếu q không thay đổi
thì quá trình lượng tử gọi là đồng nhất Quá trình này thực hiện bằng hàm bậc thang mô tả như sau:
Hình 1.5: Hàm lượng tử với bước lượng tử q = 1
Quá trình lượng tử có thể thực hiện bằng cách định nghĩa giá trị trung
Trang 8tâm của hàm lượng tử Ví dụ như trong hình 1.5, các giá trị trong khoảng từ (n
- 1/2)q đến (n + 1/2) q sẽ được làm tròn là n Phương pháp này sẽ cực tiểu hóa công suất của tín hiệu lỗi Một phương pháp khác có thể sử dụng là dùng hàm cắt, nghĩa là các giá trị trong khoảng [nq, (n+1)q] sẽ làm tròn thành n
- Thống kê của e(n) không thay đổi theo thời gian (nhiễu lượng tử hóa là quá trình ngẫu nhiên dừng)
- Nhiễu lượng tử e(n) là chuỗi các biến ngẫu nhiên không tương quan
Trang 9- Nhiễu lượng tử e(n) không tương quan với tín hiệu ngõ vào s(n).
- Hàm mật độ xác suất của e(n) phân bố đều trên tầm các giá trị của sai
số lượng tử
Như vậy, nhiễu lượng tử được phân bố đều trên khoảng (-q/2, q/2) và có phương sai (công suất nhiễu lượng tử) là:
2 2 e
q12
σ =
(1.16)Tín hiệu được lấy mẫu và lượng tử hóa bao gồm một tập hợp các số và được lưu trữ ở dạng nhị phân Đối với số nhị phân N bit sẽ có tối đa 2N giá trị khác nhau ứng với 2N mức lượng tử khác nhau Như vậy, phạm vi lượng tử sẽ
bị giới hạn trong khoảng từ q đến 2Nq, bất kỳ biên độ tín hiệu nào vượt quá giá trị này thì sẽ bị cắt bỏ
Giả sử tín hiệu mã hóa có biên độ trong khoảng [-Am, Am]:
Từ đó, giả sử công suất tín hiệu là σs2 thì tỷ số tín hiệu trên nhiễu lượng
tử hóa (SQNR - signal to Quantizing Noise Ratio) là:
2
A10logσ =6.02 N 1− +10.79 20log−
3 Mã hóa
Tín hiệu ở ngõ ra bộ lượng tử hóa được đưa đến bộ mã hóa, bộ mã hóa
sẽ gán một số nhị phân cho mỗi mức lượng tử Quá trình này gọi là mã hóa
Có nhiều phương pháp mã hóa khác nhau nhưng trong đa số hệ thống xử
lý tín hiệu số sử dụng phương pháp bù 2 Một ví dụ đối với N = 3 như sau:
Số nhị phân Giá trị Số nhị phân Giá trị
Trang 10Luật mã hóa 13 đoạn (13 - segment coding law) thực hiện chuyển đổi biên độ của tín hiệu x thành tín hiệu y như sau:
Trang 11Hình 1.7: Mô tả luật mã hóa 13 đoạn với biên độ dương
Trang 122 Chuẩn MPEG 2
Chuẩn MPEG là một chuẩn thông dụng Đã được sử dụng rộng rãi trong hơn một thập kỷ qua Tuy nhiên, kích thước file lớn so với những chuẩn mới xuất hiện gần đây, và có thể gây khó khăn cho việc truyền dữ liệu
Ví dụ như trong MPEG-2, nơi mà nội dung được tạo ra từ nhiều nguồn như video ảnh động, đồ họa, văn bản… và được tổ hợp thành chuỗi các khung hình phẳng, mỗi khung hình (bao gồm các đối tượng như người, đồ vật, âm thanh, nền khung hình…) được chia thành các phần tử ảnh pixels và xử lý đồng thời, giống như cảm nhận của con người thông qua các giác quan trong thực tế Các pixels này được mã hóa như thể tất cả chúng đều là các phần tử ảnh video ảnh động Tại phía thu của người sử dụng, quá trình giải mã diễn ra ngược với quá trình mã hóa không khó khăn Vì vậy có thể coi MPEG-2 là một công cụ hiển thị tĩnh, và nếu một nhà truyền thông truyền phát lại chương trình của một nhà truyền thông khác về một sự kiện, thì logo của nhà sản xuất chương trình này không thể loại bỏ được Với MPEG-2, bạn có thể bổ xung thêm các phần tử đồ họa và văn bản vào chương trình hiển thị cuối cùng (theo phương thức chồng lớp), nhưng không thể xóa bớt các đồ họa và văn bản có trong chương trình gốc
3 Chuẩn MPEG 4
Trang 13MPEG - 4 là chuẩn cho các ứng dụng MultiMedia MPEG-4 trở thành một tiêu chuẩn cho nén ảnh kỹ thuật truyền hình số, các ứng dụng về đồ họa
và Video tương tác hai chiều (Games, Videoconferencing) và các ứng dụng Multimedia tương tác hai chiều (World Wide Web hoặc các ứng dụng nhằm phân phát dữ liệu Video như truyền hình cáp, Internet Video…) MPEG - 4 đã trở thành một tiêu chuẩn công nghệ trong quá trình sản xuất, phân phối và truy cập vào các hệ thống video Nó đã góp phần giải quyết vấn đề về dung lượng cho các thiết bị lưu trữ, giải quyết vấn đề về băng thông của đường truyền tín hiệu Video hoặc kết hợp cả hai vấn đề trên
Với MPEG-4, các đối tượng khác nhau trong một khung hình có thể được mô tả, mã hóa và truyền đi một cách riêng biệt đến bộ giải mã trong các dòng cơ bản ES (Elementarry Stream) khác nhau Cũng nhờ xác định, tách và
xử lý riêng các đối tượng (như nhạc nền, âm thanh xa gần, đồ vật, đối tượng ảnh video như con người hay động vật, nền khung hình…), nên người sử dụng có thể loại bỏ riêng từng đối tượng khỏi khuôn hình Sự tổ hợp lại thành khung hình chỉ được thực hiện sau khi giải mã các đối tượng này
4 Chuẩn H 2.64
Chuẩn H 2.64 VC, cũng được biết đến như là chuẩn MPEG 10, nổi lên dẫn đầu trong lĩnh vực công nghệ nén hình ảnh tốt nhất, kích thước file nhỏ nhất, hỗ trợ DVD, và truyền với tốc độ cao so với các chuẩn trước đó H 2.64 cũng là một chuẩn phức hợp
Moving Picture Experts Group (MPEG), thuộc ISO/IEC Nhóm các chuyên gia hình ảnh động và âm thanh kỹ thuật số Từ năm 1998 nhóm đưa ra tiêu chuẩn MPEG-1 nó là nền tảng để sản xuất các Video CD, đĩa CD tương tác và các file nhạc nén MP3 sau này
Sau đó là tiêu chuẩn MPEG-2, nó là nền tảng cho các chương trình truyền hình kỹ thuật số và đĩa DVD
Kế tiếp không phải là MPEG-3, người ta dự định tổ chức chuẩn này để
Trang 14phục vụ cho truyền hình có độ phân giải cao, nhưng sau này sáp nhập với chuẩn MPEG-2.
MPEG-4 là tiêu chuẩn cho các phương tiện đa truyền thông tích hợp trong trang Web tĩnh hay động, truyền hình kỹ thuật số và tương tác đồ họa ứng dụng MPEG-4 đang trở thành chuẩn multimedia toàn cầu trong giai đoạn hiện nay và sẽ phát triển mạnh mẽ hơn nữa ở tương lai gần
Tiếp theo là MPEG-7 tiêu chuẩn để mô tả nội dung đa truyền thông và truy tìm âm thanh cũng như các nội dung trực quan khác, rồi bắt đầu từ tháng 6/2000 mới hơn nữa là chuẩn MPEG-21 "Multimedia Franmework"
Tìm hiểu về chuẩn MPEG
Chuẩn MPEG (Moving Picture Experts Group) là chuẩn nén, giải nén và đồng bộ hóa các tín hiệu Video và Audio Với tỷ lệ nén dữ liệu 1.2 Mbps, với
độ phân giải 352 x 240 quét 30 Hz thông thường thì chất lượng Video có thể
so sánh với chuẩn VHS
Chất lượng hình ảnh có thể được cải thiện đáng kể bằng cách dùng tỷ lệ nén dữ liệu lớn hơn mà không cần thay đổi độ phân giải MPEG không phải là một công cụ nén đơn lẻ mà ưu điểm của nén MPEG chính là ở chỗ nó có một tập hợp các công cụ mã hóa chuẩn, chúng có thể được kết hợp với nhau một cách linh động để phục vụ cho một loạt các ứng dụng khác nhau
Các chuẩn MPEG hiện có gồm:
+ MPEG-1: là chuẩn lưu trữ và phục hồi ảnh động và Audio trong lưu
trữ Media, MPEG-1 có thể nén tín hiệu video tới 1.5 Mbits/s với chất lượng VHS và âm thanh lập thể (stereo audio) với tốc độ 192 bit/s Nó được dùng để lưu trữ video và âm thanh trên CD-ROM
+ MPEG-2: là chuẩn cho TV số.
+ MPEG-4: là chuẩn cho các ứng dụng MultiMedia MPEG-4 trở thành
một tiêu chuẩn cho nén ảnh kỹ thuật truyền hình số, các ứng dụng về đồ họa
và Video tương tác hai chiều (Games, Videoconferencing) và các ứng dụng
Trang 15Multimedia tương tác hai chiều (World Wide Web hoặc các ứng dụng nhằm phân phát dữ liệu Video như truyền hình cáp, Internet Video…) MPEG-4 đã trở thành một tiêu chuẩn công nghệ trong quá trình sản xuất, phân phối và truy cập vào các hệ thống Video Nó đã góp phần giải quyết vấn đề về dung lượng cho các thiết bị lưu trữ, giải quyết vấn đề về băng thông của đường truyền tín hiệu Video hoặc kết hợp cả hai vấn đề trên.
+ MPEG-7: chứa đặc tả thông tin, giao diện cho việc tìm kiếm thông tin.
MPEG-1 và MPEG-2 đã được chuẩn hóa trong khi MPEG-4 và MPEG-7 đang được phát triển Dữ liệu MPEG bao gồm 2 lớp:
+ Lớp hệ thống (System Layer) chứa thông tin về thời gian (Timing) và các thông tin khác cần thiết cho việc tách các dòng dữ liệu Video và Audio đồng thời đồng bộ hóa Video và Audio trong quá trình phát (Playback)
+ Lớp dữ liệu nén (Compression Layer) bao gồm các dòng dữ liệu Video
và Audio
Hệ thống giải mã sẽ tách các thông tin về thời gian từ dữ liệu hệ thống MPEG và gửi nó đến thiết bị hệ thống khác (việc đồng bộ hóa sẽ cần thêm nhiều thông tin về thời gian) Hệ thống giải mã cũng tách các dữ liệu Video và Audio từ dữ liệu ban đầu, sau đó gửi chúng đến từng bộ giải mã thích hợp
Bộ giải mã Video (Video Decoder) và Audio (Audio Decoder) giải nén các dòng dữ liệu Video và Audio Hầu hết các sơ đồ nén MPEG đều dùng kỹ thuật lấy mẫu bổ xung (Sbusambling) và lượng tử hóa (Quantization) trước khi mã hóa Lấy mẫu bổ xung nhằm mục đích để làm giảm kích thước khung hình đầu vào theo cả theo chiều ngang và chiều dọc, như vậy sẽ giảm số lượng các điểm ảnh trước mã hóa Trong một số trường hợp người ta còn lấy mẫu bổ xung theo thời gian để làm giảm số lượng các khung hình trong cảnh trước khi mã hóa Đây được xem như là một kỹ thuật rất cơ bản nhằm loại bỏ
sự dư thừa dựa vào khả năng lưu ảnh của mắt người cảm thụ
Chuẩn MPEG định nghĩa một kiểu phân cấp cấu trúc trong dữ liệu Video
Trang 16như sau:
- Cảnh (Video Sequence): bắt đầu với một Sequence Header, bao gồm
một hoặc một nhóm khung hình và kết thúc với mã End-of-Sequence
-GOP (Group of Picture): một dãy liên tiếp các ảnh (Picture) trong cảnh.
- Khung hình (Picture): là thành phần mã hóa chính Thường thường
chúng ta có thể phân biệt sự thay đổi về độ sáng của ảnh (Brightness) tốt hơn
so với sự thay đổi về màu (Chrominance) Do đó trước hết các sơ đồ nén MPEG sẽ tiến hành chia khung hình ảnh các thành phần độ sáng Y và thành phần độ màu Cb, Cr (một thành phần về độ sáng và hai thành phần về độ màu) Một khung hình sẽ gồm có ba ma trận ứng với các thành phần về độ sáng (Y) và hai thành phần về độ màu Cb và Cr
Ma trận Y có số hàng và cột bằng nhau (ma trận vuông) Ma trận Cb và
Cr có số hàng và cột bằng nửa ma trận Hình 3 cho thấy quan hệ và vị trí của
Y và các thành phần Cb và Cr Lưu ý rằng cứ 4 giá trị Y lại có 2 giá trị kết hợp một của Cb và một nửa của Cr (Vị trí của giá trị Cb và Cr là tương đương)
- Slide: Dãy các Mảcoblock, thứ tự của các Macroblock bên trong Slide được xác định từ trái qua phải, trên xuống dưới Slide rất quan trọng trong việc định lỗi Nếu dòng dữ liệu (Bitstream) có chứa lỗi, bộ giải mã có thể bỏ qua và tiếp tục ở Slide kế tiếp Nhiều Slide trên dòng dữ liệu cho phép che dấu lỗi tốt hơn và được dùng để cải thiện chất lượng hình ảnh
- Macroblock: 16 pixel trong 16 hàng của thành phần Y tương ứng với 8 pixel trong 8 hàng của thành phần Cb và Cr Trong hình 3 cho thấy không gian của thành phần Y và Cb, Cr Một Macroblock chứa 4 Y Block với 1 Cb Block và 1 Cr Block như trong hình 4 với các con số ứng với thứ tự của Block trong dòng dữ liệu
- Block: là tập hợp 8 pixel trong 8 hàng các giá trị của thành phần Y hoặc
Cb, Cr
Trang 17Chuẩn MPEG cũng định nghĩa cấu trúc phân cấp dữ liệu được chấp nhận, giải mã và xuất ra Audio Dữ liệu MPEG Audio cũng như MPEG Video gồm hàng loạt các gói (Packet) Mỗi gói chứa Audio Packet Header và dãy các Audio Frame.
Mỗi Audio Header chứa các thông tin sau:
+ Packet Start Code: xác định gói là Audio Parket.
+ Packet Leghth: xác định lượng thông tin trong Audio Packet.
Mỗi Audio Frame chứa các thông tin:
+ Audio Frame Header: chứa đồng bộ, ID, độ nén thông tin (Bit rate), thông tin về tần số lấy mẫu
+ Error Checking Code: chứa thông tin cho việc kiểm tra lỗi
+ Audio Data: chứa thông tin
+ Ancillary Data (dữ liệu phụ thuộc): chứa dữ liệu do người dùng xác định
Nén MPEG là sự kết hợp hài hòa của bốn kỹ thuật cơ bản: Tiền xử lý (Preprocessing), đoán trước sự chuyển động của các khung hình (Picture) ở
bộ mã hóa (Temporal Prediction), bù chuyển động ở bộ giải mã (Motion Compensation) và mã lượng tử hóa (Quatization Coding)
Các bộ lọc tiền xử lý sẽ lọc ra những thông tin không cần thiết từ tín hiệu Video và những thông tin khó mã hóa nhưng không quan trọng cho sự cảm thụ của mắt người Kỹ thuật đoán chuyển động dựa trên nguyên tắc là các khung hình trong một cảnh Video (Video Sequence) dường như có liên quan mật thiết với nhau theo thời gian: Mỗi khung hình tại một thời điểm nhất định
sẽ có nhiều khả năng giống với các khung hình đứng ngay phía trước và ngay phía sau nó Các bộ mã hóa sẽ tiến hành quét lần lượt từng phần nhỏ trong mỗi khung hình gọi là Macroblock, sau đó nó sẽ phát hiện Macroblock nào không thay đổi từ khung hình này tới khung hình khác Bộ mã hóa sẽ tiên đoán trước sự xuất hiện của các Macroblock khi biết vị trí và hướng chuyển
Trang 18động của nó Do đó chỉ những sự thay đổi giữa các Macroblock trong khung hình hiện tại và các Macroblock được tiên đoán mới được truyền tới bên phía thu Phía bên thu tức bộ giải mã đã lưu trữ sẵn những thông tin mà không thay đổi từ khung hình này tới khung hình khác trong bộ nhớ đệm của nó và chúng được dùng để điền thêm một cách đều đặn vào các vị trí trống trong ảnh được khôi phục.
Nén tín hiệu Video được thực hiện nhờ việc loại bỏ cả sự dư thừa về không gian (Spatial Coding) và thời gian (Temporal Coding) Trong MPEG, việc laọi bỏ dư thừa về thời gian (nén liên khung hình) được thực hiện trước hết nhờ sử dụng các tính chất giống nhau giữa các khung hình liên tiếp (Inter-Picture) Chúng ta có thể sử dụng tính chất này để tạo ra các khung hình mới nhờ vào những thông tin từ những khung hình đã gửi trước nó Do vậy ở phía
bộ mã hóa, chỉ cần gửi những khung hình có thay đổi so với những khung hình trước trước, sau đó dùng phương pháp nén về không gian (Spatial Coding) để loại bỏ sự dư thừa về không gian trong chính khung hình sai khác này Nén về không gian dựa trên nguyên tắc là phát hiện sự giống nhau của các điểm ảnh (pixel) lân cận nhau (Intra - Picture)
Tuy CD có sự cải thiện về chất lượng đáng kể so với trước đây, nhưng để
so sánh chất lượng một cách tuyệt đối còn phải cân nhắc Nhưng, điểm thực tế
Trang 19là kỹ thuật ghi và truyền dẫn số cho phép thay đổi một cách mềm dẻo mức độ chất lượng, điều mà kỹ thuật tương tự không thể thực hiện được Trước tiên tín hiệu Video và Audio được số hóa và nội dung được chuyển đổi thành dạng
số liệu Các số liệu này được cất giữ giống như các loại số liệu chung khác Như vậy, tín hiệu Video và Audio đã được chuyển đổi thành số liệu và có thể
xử lý bằng công nghệ máy tính
Sự hội tụ của kỹ thuật máy tính và Audio/ Video dẫn tới việc tìm ra mối liên hệ mấu chất giữa kỹ thuật tính toán và kỹ thuật mã hóa xung (Pulse Code Modulation) Phương tiện giao tiếp số có thể lưu trữ bất kỳ loại thông tin số nào, nhưng sẽ thuận lợi hơn khi sử dụng những thiết bị lưu trữ của máy tính
để lưu trữ tín hiệu Audio và Video Một trạm làm việc phi tuyến tính chính là
ví dụ đầu tiên về ứng dụng của sự hội tụ công nghệ mà không cần đến phần tương tự (Analogue) dẫn trước Một ví dụ khác, kỹ thuật đa phương tiện Multimedia là sự kết hợp bộ nhớ của các loại khác nhau như Audio, Video, Graphic, Text và các dữ liệu khác
a Nguyên nhân nén tín hiệu
Có hai kỹ thuật nén cơ bản có thể áp dụng để giảm bớt số lượng số liệu truyền tải nội dung thông tin Về cơ bản các hệ thống nén là sự kết hợp của hai nguyên lý này nhưng với nhiều cách thực hiện khác nhau
Kỹ thuật thứ nhất là cải thiện hiệu quả mã hóa Có rất nhiều phương pháp để mã hóa một lượng thông tin có sẵn, và hầu hết các số liệu Video và Audio đơn giản đều chứa phần dư thừa Khái niệm Entropy sẽ được đề cập ở phần sau
Có nhiều phương pháp được sử dụng để loại bỏ phần dư thừa; như hệ thống mã (run-length coding) và mã hóa có độ dài thay đổi như mã Huffman Khi được sử dụng hợp lý, kỹ thuật này cho phép chuyển đổi ngược một cách hoàn hảo để sao cho sau khi phân tích, dữ liệu nhận được giống như dữ liệu gốc đưa vào hệ thống Đây là loại nén không tổn hao Các chương trình lưu
Trang 20trữ máy tính như PKZip sử dụng nén không tổn hao.
Rõ ràng, nén không tổn hao là lý tưởng, nhưng nó không thể đáp ứng được mức độ nén mà các thiết bị Audio và Video yêu cầu Tuy nhiên vì nó là nén không tổn hao nên người ta có thể bố trí nó tại bất cứ điểm nào trong hệ thống, và thực tế chúng hay được lắp ở tầng cuối của hệ thống nén có tổn hao.Nếu như việc loại bỏ phần dư thừa không làm giảm đáng kể như yêu cầu đặt ra thì có thể bỏ đi một phần thông tin có ích Hệ thống nén có tổn hao loại
bỏ số liệu bằng cách bớt đi những thông tin không liên quan hoặc ít liên quan Đây không phải là kỹ thuật chung có thể cung cấp cho mọi dòng dữ liệu; việc đánh giá tính liên quan có thể chỉ được tạo ra bởi tình huống cụ thể của từng ứng dụng, với sự hiểu biết về loại số liệu cụ thể hay mục đích sử dụng chúng Đối với kỹ thuật truyền hình thì hình ảnh và âm thanh và hình ảnh của con người để thiết kế hệ thống nén phù hợp
Một số thông tin trong tín hiệu Video sẽ không thể cảm nhận được bằng
hệ thống mắt người, do vậy đây thực sự là thông tin rất quan trọng để loại bỏ phần dư thừa sinh lý này cho hệ thống Một hệ thống nén loại bỏ phần thông tin hình ảnh không liên quan được hiểu như một hệ thống nén không tổn hao
b Nén trong các thiết bị truyền hình
Tín hiệu truyền hình, dù là tương tự hay số đều mang một lượng thông tin rất lớn, vì vậy kỹ thuật làm giảm băng tần luôn được sử dụng trong mọi phạm vi hoạt động Có thể kỹ thuật quét cách dòng là ví dụ đầu tiên thực hiện việc làm giảm độ rộng băng tần của tín hiệu truyền hình Với một số lượng dòng quét và tỷ lệ khuôn hình xác định, quét cách dòng đã giảm độ rộng băng tần yêu cầu xuống còn một nửa Quá trình này không làm mất thông tin, quét cách dòng đã tạo ra một cảm giác giả do sự tác động giữa thông tin về mặt (vertical) và thông tin về thời gian, vì vậy đã giảm được độ phân giải về mặt (vertical) của hình ảnh
Tuy nhiên, do đã bỏ đi số lượng lớn các thành phần không liên quan nên
Trang 21quét cách dòng chỉ là cách biểu diễn đơn giản và có giá trị trong thời điểm ra đời mà thôi Thật không may khi quét cách dòng và hiệu ứng giả mà nó tạo ra lại làm rối loạn và gây phức tạp cho sơ đồ nén số Cấu trúc MPEG-2 trở nên phức tạp hơn rất nhiều khi phải cố gắng duy trì tín hiệu quét cách dòng, đồng thời đây còn là nguyên nhân gây mất mát thông tin trong mã hóa hiệu quả so với tín hiệu quét liên tục.
Ví dụ đáng kể tiếp theo là việc giảm băng tần đối với tín hiệu màu Camera màu tạo ra tín hiệu RGB, bình thường thì ba tín hiệu này tạo ra lượng thông tin lớn gấp ba lần tín hiệu chói - nhưng trong truyền dẫn, ba tín hiệu màu được truyền đi với băng thông chỉ bằng tín hiệu đen trắng
Phần đầu tiên được truyền đi là tín hiệu độ sáng (thông thường là tín hiệu Y) cộng với hai thành phần màu U và V, hoặc I và Q Thông thường tín hiệu
độ sáng được truyền đi bằng kênh dẫn tương ứng với tín hiệu đen trắng, còn tín hiệu màu được hạn chế về băng tần
Về mặt sinh học, hệ thống mắt người rất nhạy cảm đối với độ sáng, và có thể nhìn hình ảnh với độ phân giải rất cao Nhưng mắt người lại không nhạy cảm với thành phần màu và nó cảm nhận màu sắc với độ phân giải tương đối thấp Kết quả là với một giới hạn băng tần, tín hiệu đen trắng thu nhận được là không rõ ràng thì các thông tin về màu sắc vẫn sắc nét Rõ ràng là không thể tận dụng được đặc điểm này khi ta làm việc với tín hiệu RGP khi mỗi tín hiệu đều bao gồm cả thành phần độ sáng và màu sắc Tuy nhiên, trong không gian YUV, hầu hết thông tin về độ sáng đều được thể hiện qua tín hiệu Y và chỉ có một phần rất nhỏ chứa đựng trong tín hiệu hiệu màu Vì vậy có thể lọc bớt tín hiệu màu để giảm bớt thông tin cho truyền dẫn
Một số kỹ thuật trong thế giới số là hoàn toàn khác nhau nhưng lại có chung một nguyên lý Ví dụ MPEG chuyển đổi tín hiệu sang dạng hiệu để đơn lập thông tin không liên quan
Trong hệ thống truyền hình truyền thống, tín hiệu RGB của Camera
Trang 22được chuyển đổi thành tín hiệu Y, Pb, Pr thành phần dùng cho quá trình sản xuất và mã hóa thành tín hiệu Video composite để truyền dẫn Trong các thiết
bị hiện đại ngày nay, tín hiệu này được chuyển đổi thành Y, Cr, Cb dưới dạng tín hiệu số nối tiếp (SDI) cho quá trình sản xuất hay mã hóa MPEG cho truyền dẫn (hình vẽ 1) Rõ ràng MPEG là giải pháp để các nhà quảng bá lựa chọn để thay thế hiệu quả cho tín hiệu Video composite Nhìn chung, MPEG
có khả năng linh hoạt hơn rất nhiều so với mã hóa Video composite vì tốc độ bit có thể điều chỉnh một cách tùy ý để phù hợp với lĩnh vực ứng dụng Với tốc độ bit và độ phân giải thấp, MPEG có thể dùng cho các hội thảo Video hay ứng dụng Video phone
Hình 1
DVB và ATSC (tiêu chuẩn truyền hình số quảng bá của Châu Âu và Mỹ)
Sẽ không thể tồn tại được nếu không áp dụng nén tín hiệu vì giải thông yêu cầu là quá lớn
Nén tín hiệu còn cho phép kéo dài thời gian phát của các DVD (Digital Virsatile Disk), cho phép ghi chọn một phim dài lên một đĩa, không gây cảm giác khó chịu cho người xem khi phải dừng lại để thay đĩa
c Nén tín hiệu Video
Trong tất cả các chương trình gốc, có hai loại thành phần của tín hiệu: thành phần tín hiệu mới không thể đoán trước được và thành phần tín hiệu có thể cảm thấy trước được Thành phần tín hiệu mới được gọi là Entropy và đó chính là phần mang thông tin của tín hiệu Phần còn lại của tín hiệu được gọi
là phần dư thừa Phần dư thừa có thể là không gian, đó là khoảng không gian