Trong những năm gần đây, với chính sách mở cửa đúng đắn của Đảng và nhà nước nền kinh tế của nước nhà đ• và đang phát triển với một tốc độ cao. Các thành tựu khoa học kỹ thuật mới trên thế giới đ• nhanh chóng thâm nhập vào nước ta. Đặc biệt trong lĩnh vực điện tử-viễn thông, sự xuất hiện những công nghệ hiện đại, những dây chuyền sản xuất mới có mức độ tự động hóa cao với hệ thống điều khiển tự động tiên tiến...đ• tạo điều kiện thúc đẩy các thành phần kinh tế trong nước phát triển vượt bậc cả về số lượng lẫn chất lượng. Sự phát triển không ngừng của kỹ thuật số đ• xâm nhập vào hầu hết tất cả các lĩnh vực khoa học kĩ thuật, kĩ thuật truyền hình cũng không nằm ngoài quá trình đó. Công nghệ số diễn ra trong truyền hình ngày nay không chỉ do yêu cầu ngày càng cao về chất lượng của dịch vụ truyền hình mà còn do sức ép đang tăng lên đối với nguồn tài nguyên phổ tần số. Đối với những nước có nền công nghiệp truyền hình-viễn thông phát triển mạnh, vấn đề này đang trở nên gay gắt hơn bao giờ hết. Bên cạnh đó, nhu cầu cạnh tranh trong nền kinh tế thị trường đ• thúc ép các nước này phải nhanh chóng xác lập và lựa chọn chuẩn số thích hợp, để sớm tung ra các thiết bị hay dịch vụ số để chiếm thế thượng phong trên thị trường. Hầu hết các nước hiện nay đ• đặt ra lộ trình chuyển đổi sang số và sẽ chấm dứt truyền hình tương tự trong khoảng thời gian từ 10 đến 15 năm tới. Đối với Việt Nam, một nước nghèo với những đặc thù riêng của mình, vấn đề số hoá lại còn có một ý nghĩa khác. Về tài nguyên phổ tần, có lẽ trong vòng 10 đến 15 năm tới, chúng ta cũng chưa bị thúc ép gay gắt như các nước có ngành truyền hình-viễn thông phát triển hiện nay. Bên cạnh mục đích nâng cao chất lượng phục vụ người xem, truyền hình Việt Nam trong 10 đến 15 năm nữa sẽ buộc phải chuyển sang số vì các thiết bị tương tự sẽ không được sản suất nữa. Như vậy, số hoá truyền hình là con đường tất yếu mà truyền hình Việt Nam cần phải đi mặc dù còn rất nhiều khó khăn trước mắt như điều kiện kinh tế còn eo hẹp, nền công nghiệp và trình độ khoa học kỹ thuật còn non trẻ... Trong khuôn khổ của đồ án, em đề cập tới các vấn đề của quá trình thực hiện số hoá đối với tín hiệu truyền hình tương tự, đồng thời trình bày khái quát về các phương thức truyền dẫn, các tiêu chuẩn truyền hình số. Bố cục đồ án bao gồm 6 chương: Chương1: Giới thiệu chung : trình bày về quá trình phát triển, giới thiệu khái quát về hệ thống truyền hình số. Chương2: Xử lý tín hiệu video : bao gồm số hoá và thực hiện nén tín hiệu video. Chương3: Xử lý tín hiệu audio : số hoá và thực hiện nén tín hiệu audio. Chương4: Ghép kênh và truyền tải các dịch vụ : trình bày về quá trình ghép kênh các kênh video, audio,số liệu phụ...của một hay nhiều chương trình truyền hình. Chương5: Các hệ thống truyền hình số : trình bày về các hệ thống truyền hình số ATSC, DVB, ISDB. Chương6: Truyền dẫn tín hiệu truyền hình số : trình bày về các phương thức dịch vụ truyền dẫn như qua cáp, vệ tinh, phát mặt đất...
Trang 1
Lời nói đầu
Trong những năm gần đây, với chính sách mở cửa đúng đắn của Đảng và nhà nớcnền kinh tế của nớc nhà đã và đang phát triển với một tốc độ cao Các thành tựu khoahọc kỹ thuật mới trên thế giới đã nhanh chóng thâm nhập vào nớc ta Đặc biệt tronglĩnh vực điện tử-viễn thông, sự xuất hiện những công nghệ hiện đại, những dây chuyềnsản xuất mới có mức độ tự động hóa cao với hệ thống điều khiển tự động tiên tiến đãtạo điều kiện thúc đẩy các thành phần kinh tế trong nớc phát triển vợt bậc cả về số lợnglẫn chất lợng
Sự phát triển không ngừng của kỹ thuật số đã xâm nhập vào hầu hết tất cả các lĩnhvực khoa học kĩ thuật, kĩ thuật truyền hình cũng không nằm ngoài quá trình đó Côngnghệ số diễn ra trong truyền hình ngày nay không chỉ do yêu cầu ngày càng cao vềchất lợng của dịch vụ truyền hình mà còn do sức ép đang tăng lên đối với nguồn tàinguyên phổ tần số Đối với những nớc có nền công nghiệp truyền hình-viễn thông pháttriển mạnh, vấn đề này đang trở nên gay gắt hơn bao giờ hết Bên cạnh đó, nhu cầucạnh tranh trong nền kinh tế thị trờng đã thúc ép các nớc này phải nhanh chóng xác lập
và lựa chọn chuẩn số thích hợp, để sớm tung ra các thiết bị hay dịch vụ số để chiếm thếthợng phong trên thị trờng Hầu hết các nớc hiện nay đã đặt ra lộ trình chuyển đổi sang
số và sẽ chấm dứt truyền hình tơng tự trong khoảng thời gian từ 10 đến 15 năm tới Đối với Việt Nam, một nớc nghèo với những đặc thù riêng của mình, vấn đề số hoálại còn có một ý nghĩa khác Về tài nguyên phổ tần, có lẽ trong vòng 10 đến 15 nămtới, chúng ta cũng cha bị thúc ép gay gắt nh các nớc có ngành truyền hình-viễn thôngphát triển hiện nay Bên cạnh mục đích nâng cao chất lợng phục vụ ngời xem, truyềnhình Việt Nam trong 10 đến 15 năm nữa sẽ buộc phải chuyển sang số vì các thiết bị t -
ơng tự sẽ không đợc sản suất nữa Nh vậy, số hoá truyền hình là con đờng tất yếu màtruyền hình Việt Nam cần phải đi mặc dù còn rất nhiều khó khăn trớc mắt nh điều kiệnkinh tế còn eo hẹp, nền công nghiệp và trình độ khoa học kỹ thuật còn non trẻ
Trong khuôn khổ của đồ án, em đề cập tới các vấn đề của quá trình thực hiện số hoá
đối với tín hiệu truyền hình tơng tự, đồng thời trình bày khái quát về các phơng thứctruyền dẫn, các tiêu chuẩn truyền hình số Bố cục đồ án bao gồm 6 chơng:
Chơng1: Giới thiệu chung : trình bày về quá trình phát triển, giới thiệu khái
quát về hệ thống truyền hình số
1
Trang 2
Chơng2: Xử lý tín hiệu video : bao gồm số hoá và thực hiện nén tín hiệu video Chơng3: Xử lý tín hiệu audio : số hoá và thực hiện nén tín hiệu audio.
Chơng4: Ghép kênh và truyền tải các dịch vụ : trình bày về quá trình ghép kênh
các kênh video, audio,số liệu phụ của một hay nhiều chơng trình truyền hình
Chơng5: Các hệ thống truyền hình số : trình bày về các hệ thống truyền hình số
ATSC, DVB, ISDB
Chơng6: Truyền dẫn tín hiệu truyền hình số : trình bày về các phơng thức dịch
vụ truyền dẫn nh qua cáp, vệ tinh, phát mặt đất
Mặc dù bản thân đã có nhiều cố gắng song do trình độ chuyên môn còn giới hạn, tàiliệu tham khảo hạn chế cộng với thời gian thực hiện không dài nên trong quá trình thựchiện chắc không tránh đợc những sai lầm, thiếu sót Vì điều kiện thực tế không chophép nên đồ án của em chỉ dừng lại ở mức độ lý thuyết Rất mong đợc sự thông cảm vàhớng dẫn, chỉ bảo thêm của các thầy cô và bè bạn để em có thể hiểu rõ hơn về lĩnh vựcnày
Cuối cùng, em xin chân thành cảm ơn các thầy cô, bạn bè đã giúp đỡ em trong quá
trình thực hiện Đặc biệt là sự hớng dẫn tận tình của thầy Nguyễn Tiến Khải, thầy đã
trực tiếp chỉ dẫn, định hớng, tạo mọi điều kiện để em hoàn thành đồ án
Trang 3
Chơng 1
Giới thiệu chung.
Trong những năm gần đây kĩ thuật số đã có những bớc phát triển nhảy vọt với cácsản phẩm công nghệ cao, giá thành hạ đang đợc ứng dụng mạnh mẽ vào các ngành kĩthuật khác Trớc khi kĩ thuật số đợc áp dụng vào kĩ thuật truyền hình, công nghệ kĩthuật số đã phát triển ở mức độ cao trong các hệ thống xử lý dữ liệu và hệ thống truyềntin Kết quả là truyền hình số đã phát triển rất nhanh, thể hiện nhiều u điểm so vớitruyền hình tơng tự và đang dần chiếm lĩnh u thế tạo nên một cuộc cách mạng thực sựtrong công nghiệp truyền hình
Sự dịch chuyển từ các dịch vụ truyền hình dựa trên các ứng dụng của kỹ thuật tơng tựsang các dịch vụ truyền hình dựa trên ứng dụng các kỹ thuật số đang phát triển mộtcách nhanh chóng Sự dịch chuyển của các dịch vụ truyền hình này một phần là nhờkết quả của sự hội tụ của các lĩnh vực: truyền hình, viễn thông, các ngành khoa học và
đồ hoạ máy tính thông qua việc sử dụng kỹ thuật số
Tín hiệu đầu vào và đầu ra của các hệ thống truyền hình, tại camera và tại đầu thu
t-ơng ứng vốn là là tín hiệu tt-ơng tự Nh vậy, có một câu hỏi tự nhiên đợc đặt ra tại saophải số hoá Trong khi sự suy giảm tín hiệu của các tín hiệu tơng tự đợc tích luỹ thìkhả năng để tái tạo lại một chuỗi xung số một cách chính xác rất dễ dàng Luồng bit số
có thể đợc xen kẽ trong một kênh, quá trình xen kẽ này cho phép phát xạ, truyền dẫn,
lu trữ , hoặc xử lý tín hiệu phụ cùng với tín hiệu video và audio Hơn nữa, các kỹ thuậtnén số dựa trên sự cắt giảm độ d thừa có thể đợc ứng dụng để số hoá các dịch vụ video
và audio cho phép truyền một dịch vụ HDTV hoặc nhiều dịch vụ truyền hình bình ờng trên một kênh có độ rộng bằng kênh phát hình tơng tự quảng bá hiện tại
Sử dụng phơng pháp số để tạo,lu trữ và truyền tín hiệu của chơng trình truyền hìnhtrên kênh thông tin mở ra một khả năng đặc biệt rộng rãi cho các thiết bị truyền hình.Trong một số ứng dụng tín hiệu số đợc thay thế hoàn toàn cho tín hiệu tơng tự vì nó cókhả năng thực hiện đợc các chức năng mà tín hiệu tơng tự hầu nh không thể làm đợchoặc rất khó thực hiện, nhất là trong việc xử lý tín hiệu và lu trữ
So với tín hiệu tơng tự, tín hiệu số cho phép tạo, lu trữ, ghi đọc nhiều lần mà khônglàm giảm chất lợng hình ảnh Tuy nhiên, không phải trong tất cả các trờng hợp tín hiệu
số đều đạt đợc hiệu quả cao hơn với tín hiệu tơng tự (ví dụ nh bộ lọc) Mặc dù vậy xu
3
Trang 4
hớng chung cho sự phát triển công nghiệp truyền hình trên thế giới, nhằm đạt đợc một
sự thống nhất chung, là một hệ thống truyền hình hoàn toàn kĩ thuật số có chất lợngcao và dễ dàng phân phối trên kênh thông tin
Sự ra đời của các đầu ghi băng video số thế hệ hai và ba, các bộ chuyển mạch, đồ hoạchuyển động và các bộ tạo kỹ xảo đặc biệt và sự thoả thuận sử dụng giao diện số nốitiếp năm 1990 đã đẩy nhanh việc cài đặt các thiết bị sản xuất chơng trình truyền hình
số Việc sản xuất chơng trình truyền hình số sử dụng các đầu ghi hình số đã cho phépcác nhà sản xuất chơng trình có thể sao chép nhiều lần hơn so với đầu ghi hình tơng tự
mà vẫn đảm bảo chất lợng Các ứng dụng của kỹ thuật số cho phép giảm thời gian cài
đặt camera từ vài giờ xuống gần nh tức thời Các hệ thống th viện số làm cho các
ph-ơng tiện đợc ghi, bảo quản t liệu một cách tiện lợi và tìm kiếm thông tin nhanh và dễdàng
Các lĩnh vực chính trong phát quảng bá còn lại đối với thế giới tơng tự là truyền dẫngiữa các trung tâm sản xuất chơng trình và truyền dẫn đến đến ngời sử dụng Các ngăncản cuối cùng này cũng đã đợc vợt qua vào đầu những năm 1990 với những ứng dụngcủa kỹ thuật nén số, nhìn chung đợc xây dựng dựa trên ứng dụng của mã hoá chuyểndạng cosin rời rạc (DCT), sử dụng điều chế biên độ vuông góc (QAM) và các kỹ thuật
điều chế đa mức gần đây
Vào khoảng năm 1990, các tổ chức truyền hình Bắc Mỹ với nỗ lực của mình đã tìm
ra phơng tiện phát hình ảnh HDTV trong kênh truyền hình 6Mhz hiện tại, kênh truyềnhình UHF đợc tập trung chủ yếu vào việc sử dụng các phơng thức và kỹ thuật nén số để
đáp ứng đợc các yêu cầu của hệ thống Các kết quả mô phỏng có tính khả thi thực tếcủa các hệ thống khác nhau ở Bắc Mỹ đã nhanh chóng đợc phát triển ở nhiều nơi nh ởChâu Âu và các nớc và vùng châu á Thái Bình Dơng
Kết quả quá trình số hoá hình ảnh truyền hình 525 dòng, 625 dòng tạo ra dòng sốliệu video 270Mbit/s, số hoá hình ảnh HDTV tạo ra luồng số liệu 1200Mbit/s Mộtkênh có độ rộng 6, 7, 8Mhz chỉ có thể thể mang đợc tốc độ số liệu tối đa cỡ khoảng20Mbit/s Do vậy yêu cầu phải nén số liệu với tỷ lệ 60:1 đối với các dịch vụ truyềnhình HDTV
Vào giữa năm 1991, các báo cáo về công việc đang đợc làm ở Mỹ, các nớc Bắc Âu,Anh, Pháp,ý, Nhật và các nớc khác đã chỉ ra rằng phơng thức giảm tốc độ bit với tỷ lệ60:1 có thể đợc áp dụng cho cả hình ảnh HDTV và các hình ảnh truyền hình thông th-ờng Kết quả này cho thấy hình ảnh của truyền hình có độ phân giải cao HDTV có thể
Trang 5
đợc truyền trên các kênh tơng đối hẹp với tốc độ bit từ 15 đến 25Mbits/s và các dịch vụtruyền hình analog thông thờng có thể có thể đợc truyền với tốc độ 1,5 - 12Mbit/s tuỳthuộc vào chất lợng của dịch vụ Sử dụng các tiêu chuẩn, các kỹ thuật điều chế đa mức
sẽ có thể truyền một kênh truyền hình HDTV hoặc nhiều kênh truyền hình thông thờngtrong các kênh truyền hình dải VHF và UHF hiện tại có băng thông 6, 7 hoặc 8Mhz Trong khoảng thời gian từ 1991 tới 1995 sự phát triển của các chuẩn giao tiếp chunggiữa các hệ thống vệ tinh số, cáp và phát quảng bá mặt đất đã mở ra một bớc ngoặtmới Nhóm làm việc 11/3 của ITU đã đa ra các khuyến nghị đối với các thành phầnchung của hệ thống quảng bá truyền hình số mặt đất Những chi tiết đối với phục vụquảng bá bằng vệ tinh số, cáp đợc chấp thuận ở một số vùng lãnh thổ theo các khuyếnnghị của ITU và chuẩn theo vùng địa lý
Những ứng dụng của kỹ thuật số đối với truyền hình đã đem lại công nghệ truyềnhình số với rất nhiều u điểm Công nghệ truyền hình số đã và đang bộc lộ thế mạnhtuyệt đối so với công nghệ truyền hình tơng tự trên nhiều lĩnh vực:
Chất lợng của dịch vụ cao, cung cấp hình ảnh rõ nét, âm thanh trung thực do tínhiệu số ít nhạy cảm với các dạng méo xảy ra trên đờng truyền, có khả năng pháthiện lỗi và sửa sai (nếu có)
Tính linh hoạt, đa dạng trong quá trình xử lý tín hiệu
Giá thành hoạt động thấp thông qua việc sử dụng các kỹ thuật nén và độ tin cậycủa hệ thống cao
Mật độ chơng trình đợc gia tăng, khả năng cung cấp nhiều dịch vụ trên mộtkênh dịch vụ truyền hình hiện tại, hiệu quả sử dụng dải thông cao, gia tăng hiệuquả sử dụng tần số
Có tính phân cấp, ví dụ: một dòng dữ liệu có thể đợc sử dụng để truyền một
ch-ơng trình truyền hình có độ phân giải cao duy nhất hoặc một vài chch-ơng trìnhtruyền hình có độ phân giải tiêu chuẩn
Khả năng truyền tải nhiều dạng thông tin khác nhau, có khả năng cung cấpnhiều loại hình dịch vụ cho đông đảo khán giả hoặc từng cá nhân tạo ra một thị tr-ờng đa dạng
Tiết kiệm năng lợng,với cùng một công suất phát sóng, diện phủ sóng rộng hơn
so với công nghệ tơng tự
Khoá mã đơn giản
Hoàn toàn có khả năng hoà nhập vào môi trờng truyền thông đa phơng tiện
5
Trang 6số để tạo đà phát triển cho hệ thống mới này Trớc những vấn đề trên, truyền hình sốngày càng thể hiện rõ các u điểm của mình và chắc chắn sẽ dần thay thế hệ thốngtruyền hình tơng tự trong một tơng lai không xa để kết hợp với các mạng truyền thôngkhác tạo thành một thế giới thông tin số đa phơng tiện phục vụ cho con ngời một cáchhữu hiệu Để dịch vụ truyền hình số phát triển nhanh chóng bắt buộc phải có sự hợpnhất giữa các chuẩn về mã hoá kênh, mã hoá nguồn, phơng thức điều chế, nhận dạngtrong, chống lỗi và sửa sai
Số hoá toàn bộ hệ thống truyền hình có nghĩa là chuyển tín hiệu tơng tự sang dạng
số từ camera truyền hình, máy phát hình, kênh truyền đến máy thu hình Việc số hoá
hệ thống truyền hình hiện nay (các hệ truyền hình PAL, NTSC, SECAM) chủ yếu làcác khâu phân tích ảnh cho đến đầu vào máy phát hình (điều chế, sửa và xử lý tínhiệu) Số lợng các máy thu hình hiện nay là rất lớn, nên việc số hoá hệ thống truyềnhình phải đợc thực hiện qua từng giai đoạn (ngoại trừ các hệ thống truyền hình mới, ví
dụ hệ thống truyền hình chất lợng cao HDTV)
Sử dụng các hệ thống số trong truyền hình đòi hỏi phải biến đổi video tơng tự (từcamera truyền hình ở studio) thành tín hiệu video số Biến đổi tín hiệu số thành tín hiệutơng tự ở đầu vào máy phát hình Các thông số của hệ thống số phải đợc chọn sao chochất lợng hình ảnh bằng hoặc tốt hơn so với hệ thống số tơng tự Đó là giai đoạn sửdụng hỗn hợp truyền hình tơng tự và truyền hình số
Các ứng dụng của kĩ thuật số vào ngành truyền hình có một số nguyên tắc kỹ thuật
và các tiến trình riêng biệt bao gồm :
Sự phát triển của phơng thức nén số liệu , hình ảnh, âm thanh tơng thích với cácnhu cầu của hệ thống phát hình số và cung cấp các mức thích hợp của hiệu năng hệthống
Phải có sự nhận dạng của ghép kênh hình ảnh, âm thanh, số liệu , các đặc điểmmã hoá kênh và điều chế đáp ứng yêu cầu của hệ thống
Trang 7Gia c«ngsè
Gia c«ng
t ¬ng tùADC
Gia c«ngsè
TÝn hiÖutiÕng
TÝn hiÖuphôTÝn hiÖu ®o
kiÓm tra
Trang 8
Hình 1.1 : Sơ đồ cấu trúc tổng quát hệ thống truyền hình số Đầu vào của thiết bị truyền hình số sẽ tiếp nhận tín hiệu truyền hình t ơng tự Trongthiết bị mã hoá (biến đổi A/D), tín hiệu hình sẽ đợc biến đổi thành tín hiệu truyền hình
số, các tham số và đặc trng của tín hiệu này đợc xác định từ hệ thống truyền hình đã
đ-ợc lựa chọn
Tín hiệu truyền hình số đợc đa tới thiết bị phát Sau đó qua kênh thông tin rồi đợc đatới thiết bị thu cấu tạo từ thiết bị biến đổi tín hiệu ngợc lại với quá trình xử lý tại phíaphát
Giải mã tín hiệu truyền hình thực hiện biến đổi tín hiệu truyền hình số thành tín hiệutruyền hình tơng tự Hệ thống truyền hình số sẽ trực tiếp xác định cấu trúc mã hoá vàgiải mã tín hiệu truyền hình
Mã hoá kênh đảm bảo chống các sai sót cho tín hiệu trong kênh thông tin Thiết bịmã hoá kênh phối hợp đặc tính của tín hiệu số vói kênh thông tin Khi tín hiệu số đợctruyền đi theo kênh thông tin, các thiết bị biến đổi trên đợc gọi là bộ điều chế và giải
điều chế Khái niệm mã hoá trong kênh đợc phổ biến không những trong đờng thôngtin mà trong cả một số khâu của hệ thống truyền hình số ví dụ nh máy ghi hình số, bộ
điều chỉnh khoảng cách thời gian số, gia công tín hiệu truyền hình số
Trang 9
Chơng2
Xử lý tín hiệu video.
2.1 / Số hoá tín hiệu video.
Số hoá tín hiệu video là việc thực hiện biến đổi tín hiệu video tơng tự sang dạng số
Có hai phơng pháp biến đổi:
Biến đổi trực tiếp tín hiệu video màu tổng hợp thành tín hiệu video số tổng hợp
Hình 2.1: Biến đổi A/D tín hiệu video màu tổng hợp
Biến đổi riêng từng tín hiệu video màu thành phần thành các tín hiệu videothành phần số:
9
Đồng bộ
Lọc thông thấp
Tín hiệu t
ơng tự
Tín hiệu số
Đồng bộ
Lọc thông thấp
Tín hiệu t
ơng tự
Tín hiệu số
Đồng bộ
Lọc thông thấp
Lọc thông thấp
Lọc thông thấp
Trang 10
Hình 2.2: Biến đổi A/D tín hiệu video màu thành phần
Việc lựa chọn phơng pháp biến đổi tín hiệu video phụ thuộc vào nhiều yếu tố: yêucầu về khả năng thuận lợi khi xử lý tín hiệu, yêu cầu về truyền dẫn phát sóng Số hoátín hiệu video tổng hợp có u điểm là tốc độ bít thấp, điều đó cũng có nghĩa là dung l-ợng cần để lu trữ nhỏ hơn, lợi hơn về dải tần Tuy nhiên tín hiệu video số tổng hợp bộc
lộ nhiều nhợc điểm trong quá trình xử lý số, tạo kĩ xảo, dựng hình và nó còn mang
đầy đủ những khiếm khuyết của video tơng tự nhất là hiện tợng can nhiễu chói - màu
Số hoá tín hiệu video thành phần khắc phục đợc các nhợc điểm trong số hoá tín hiệuvideo tổng hợp nhng nó lại tạo ra dòng số có tốc độ bit cao hơn Với sự phát triển củacông nghệ điện tử nh ngày nay, các chíp có tốc độ cao ra đời cho phép truyền toàn bộchuỗi số liệu video số thành phần nối tiếp nhau trên một dây dẫn duy nhất đã tạo thuậnlợi cho quá trình xử lý số tín hiệu video thành phần
Mặc dù cả hai phơng pháp trên đều đợc nghiên cứu và áp dụng trong kĩ thuật truyềnhình số nhng do nhờ những tính chất u việt nên phơng pháp biến đổi tín hiệu videothành phần đợc khuyến khích sử dụng Các kĩ thuật của phơng pháp này đang đợc sửdụng rộng rãi và hình thành nên các tiêu chuẩn thống nhất cho truyền hình số Video
số thành phần đợc coi là phơng pháp số hoá sử dụng trong hiện tại cũng nh trong tơnglai tại các studio hoàn toàn số Chính vì vậy trong phần xử lý tín hiệu video em chỉtrình bày các kĩ thuật xử lý tín hiệu video thành phần
Quá trình chuyển đổi tín hiệu video thành phần từ tơng tự sang số gồm nhiều vấn đềcần xem xét nghiên cứu, nó phải qua nhiều công đoạn và có một số mấu chốt nh: tần sốlấy mẫu, phơng thức lấy mẫu, tỷ lệ giữa tần số lấy mẫu tín hiệu chói và tín hiệu màu, l-ợng tử hoá,mã hoá
2.1.1 / Lấy mẫu.
Tín hiệu video do có đặc trng riêng nên ngoài việc thoả mãn định lý lấy mẫu Nyquist,quá trình lấy mẫu còn phải thoả mãn các yêu cầu về cấu trúc lấy mẫu, tính tơng thíchgiữa các hệ thống Quá trình này phải xác định đợc tần số lấy mẫu, cấu trúc lấy mẫunhằm đạt đợc chỉ tiêu về chất lợng hình ảnh,tính tơng thích giữa các hệ truyền hình, tốc
độ bít thích hợp và mạch thực hiện đơn giản Việc chọn tần số lấy mẫu tối u sẽ khácnhau với các thành phần tín hiệu khác nhau đồng thời nó cũng phụ thuộc vào hệ thốngtruyền hình màu Cấu trúc lấy mẫu chính là sự phân bổ toạ độ các điểm lấy mẫu Vị trícác điểm lấy mẫu đợc xác định dựa trên các dòng,mành và thời điểm lấy Cấu trúc lấy
Trang 11
mẫu phù hợp với tần số lấy mẫu sẽ cho phép khôi phục hình ảnh tốt nhất Có ba dạngliên kết vị trí các điểm lấy mẫu đợc sử dụng phổ biến cho cấu trúc lấy mẫu tín hiệuvideo:
Hình 2.4: Cấu trúc “ quincunx “ mành.
Cấu trúc “ quincunx “ dòng
Các mẫu trên dòng kề nhau của một mành sẽ lệch nhau nửa chu kì lấy mẫu Các mẫutrên 1 dòng của mành 1 lệch so với các mẫu trên dòng kế tiếp với nó của mành 2 cũngmột nửa chu kì lấy mẫu
11
Trang 12
Hình 2.5: Cấu trúc “ quincunx “ dòng
Với cấu trúc trực giao độ phân giải ảnh bị giảm, cần sử dụng tốc độ bit lớn Với cấutrúc “quincunx” mành sẽ xuất hiện nhấp nháy các điểm ảnh, phổ tần của mành 2 bịdịch so với phổ mành 1 và có thể lồng với phổ tần cơ bản gây ra méo ở các chi tiết ảnhkhi hình ảnh có các sọc hoặc các đờng thẳng đứng Còn đối với cấu trúc “quincunx”dòng sẽ xuất hiện các vòng tròn theo chiều ngang (méo đờng biên) tuy nhiên khôngxảy ra lồng phổ biên với phổ chính Tóm lại cấu trúc trực giao cho chất lợng ảnh caonhất vì đối với mắt ngời thì độ phân giải bị giảm dễ chấp nhận hơn là hai loại méo trên.Chính vì vậy cấu trúc lấy mẫu trực giao hay đợc sử dụng hơn cả
Sự lựa chọn tần số lấy mẫu tín hiệu video cho các hệ truyền hình không chỉ thoả mãntiêu chuẩn Nyquist và cấu trúc lấy mẫu mà còn phải đạt điều kiện là tần số lấy mẫuchung cho cả hai tiêu chuẩn truyền hình 525 và 625 dòng để có thể tiến tới một tiêuchuẩn video số chung cho toàn thế giới Nhiều cuộc tranh luận về xác định tần số lấymẫu đã xảy ra tại các hội nghị quốc tế về phát thanh truyền hình Tần số lấy mẫu càngcao chất lợng video càng cao,tuy nhiên tần số lấy mẫu lớn đòi hỏi thiết bị, đờng truyềnphải có dải thông rộng và các bộ nhớ có dung lợng lớn do đó chi phí cho toàn bộ hệthống tăng lên nhiều lần Tần số lấy mẫu thích hợp đợc xác định trong khoảng 12
14 MHz Từ năm 1982 các tổ chức phát thanh truyền hình (SMPTE, EBU, CCIR) đãthống nhất lựa chọn tần số lấy mẫu fs = 13,5 MHz cho cả hai tiêu chuẩn 525 và 625dòng 13,5 MHz là tần số duy nhất trong khoảng 12 MHz 14 MHz có giá trị bằngmột số nguyên lần tần số dòng cho cả hai tiêu chuẩn:
13,5 MHz = 864 fH với chuẩn 625 dòng (fH = 15625 Hz)
13,5 MHz = 858 fH với chuẩn 525 dòng (fH = 15750 Hz)
Thời gian một dòng của hệ 625 dòng là 64 s, hệ 525 dòng là 63,56 s Thời giantích cực của một dòng trong hệ 625 dòng là 52 s Nếu cả hai hệ đều lấy thời gian tích
Trang 14
Hình 2.7: Quan hệ giữa dòng video số và dòng video tơng tự hệ 625 dòng / 50 mành
Với tín hiệu video thành phần, tần số lấy mẫu thờng đợc biểu thị thông qua tỉ lệ giữatần số lấy mẫu tín hiệu chói và tần số lấy mẫu các tín hiệu hiệu màu Tần số lấy mẫu sẽquyết định bề rộng tối đa của dải phổ tín hiệu Theo tiêu chuẩn Nyquist tần số lấy mẫutối thiểu phải gấp 2 lần tần số cao nhất của tín hiệu Có nhiều tiêu chuẩn lấy mẫu chotín hiệu video thành phần, điểm khác nhau chủ yếu ở tỉ lệ giữa tần số lấy mẫu và phơngpháp lấy mẫu tín hiệu chói và các tín hiệu hiệu màu trong đó bao gồm tiêu chuẩn 4:4:4,4:2:2, 4:2:0, 4:1:1 Số 4 đầu tiên biểu thị tần số lấy mẫu tín hiệu chói là 13,5 MHz, haicon số tiếp biểu thị tỉ lệ giữa tần số lấy mẫu tín hiệu hiệu màu so với tín hiệu chói Các
định dạng số video có nén chỉ lấy mẫu cho các dòng tích cực của video
Tiêu chuẩn 4:4:4
Tín hiệu chói Y và các tín hiệu hiệu màu CR, CB đợc lấy mẫu tại tất cả các điểm lấymẫu trên dòng tích cực của tín hiệu videovới cùng tốc độ lấy mẫu là 13,5 MHz
Trang 15
Hình 2.8 : Tiêu chuẩn 4:4:4
Tiêu chuẩn 4::2:2
Việc lấy mẫu trên 1 dòng tích cực đợc thực hiện nh sau:
Điểm đầu tiên lấy mẫu toàn bộ ba tín hiệu Y, CR, CB
Điểm kế tiếp chỉ thực hiện lấy mẫu tín hiệu Y Khi giải mã, màu suy ra từ màucủa điểm ảnh trớc
Điểm tiếp theo lại lấy mẫu đủ cả ba tín hiệu
Tuần tự nh vậy cứ 4 lần lấy mẫu Y thì có hai lần lấy mẫu CR và hai lần lấy mẫu CB
tạo nên cơ cấu 4:2:2
Hình 2.9 : Tiêu chuẩn 4::2:2
Tiêu chuẩn 4:2:0
Tín hiệu Y đợc lấy mẫu tại tất cả các điểm ảnh của dòng còn tín hiệu hiệu màu thì
cứ cách một điểm thì lấy mẫu cho một tín hiệu hiệu màu Tín hiệu hiệu màu đợc lấyxen kẽ, nếu hàng chẵn lấy mẫu cho tín hiệu CR thì hàng lẻ sẽ lấy mẫu cho tín hiệu CB
Hình 2.10 : Tiêu chuẩn 4:2:0
Tiêu chuẩn 4:1:1
15
Trang 16
Trong điểm ảnh đầu lấy mẫu đủ cả ba tín hiệu Y, CR, CB Ba điểm ảnh tiếp theo chỉlấy mẫu tín hiệu Y Khi giải mã, màu của ba điểm ảnh sau phải suy từ điểm ảnh đầu
Hình 2.11 : Tiêu chuẩn 4:1:1
Trong các tiêu chuẩn trên tiêu chuẩn 4:4:4 có khả năng khôi phục lại chất lợng hình
ảnh tốt nhất đợc dùng cho hậu kỳ (xử lý phức tạp), thiết bị studio có chất lợng cao,
Tiêu chuẩn 4:2:0 đợc dùng trong các ứng dụng đặc biệt nh: định dạng phân phối tínhiệu số có nén tốc độ bit MPEG
2.1.2 / Lợng tử hoá.
Trong hầu hết các thiết bị video số chất lợng studio quá trình lợng tử hoá là lợng tửhoá đồng đều Méo lợng tử xuất hiện trong tín hiệu video ở 2 dạng chính: hiệu ứng đ-ờng viền và nhiễu hạt ngẫu nhiên Hiệu ứng đờng viền đợc khắc phục bằng cách tăng
số mức lợng tử khi sử dụng từ mã 8 bit để biểu diễn mẫu thì hiệu ứng đờng viền sẽ gần
nh không còn nhận biết đợc nữa Nhiễu hạt ngẫu nhiên đợc sử dụng để hiệu chỉnh chấtlợng ảnh bằng cách cộng tín hiệu “dither” vào tín hiệu video
Dạng thức video số đợc quy định bởi các thông số:
Mức danh định
Khoảng bảo vệ cần thiết (biên bảo hiểm)
Số bit tơng ứng với mỗi mẫu
Trang 17
Mã “cấm”
Thông số chi tiết của các dạng thức video số đợc thể hiện qua các bảng dới đây
Bảng 2.1: Giá trị các từ mã ứng với các mức và điện áp tín hiệu Y
1111 1110:
1110 1100
FE:EC
254:236
Mức video
700,000:0,000
1110 1011:
0001 0000
EB:10
235:16Khoảng trống
dự phòng
-3,196:-47,945
0000 1111:
0000 0001
0F:01
15:1Mức cấm đối
11 1111 1111
:
11 1111 1100
3FF:3FC
1023:1020Khoảng trống
dự phòng
763,128:700,799
11 1111 1011
:
11 1010 1101
3FB:3AD
1019:941
Mức video
700,000:0,000
11 1010 1100
:
00 0100 0000
3AC:040
940:64
17
Trang 18:4Mức cấm đối
với dòng tích
cực
-48,744:-51,142
00 0000 0011
:
0000 0000
003:000
1111 1110:
1110 1100
FE:EC
254:236
Mức video
350,000:0,000:-350,000
1110 1011:
1000 0000:
0001 0000
EB:80:10
235:128:16Khoảng trống
dự phòng
-353,125:-396,875
0000 1111:
0000 0001
0F:01
15:1Mức cấm đối
Trang 19
với dòng tích
cực
:396,785
:
11 1111 1100
:3FC
:1020Khoảng trống
dự phòng
396,094:350,781
11 1111 1011
:
11 1100 0001
3FB:3C1
1019:961
Mức video
350,000:0,000:-350,000
940:512:64Khoảng trống
dự phòng
-350,781:-396,875
00 0011 1111
:
00 0000 0100
03F:004
63:4Mức cấm đối
với dòng tích
cực
-397,656:-400,000
00 0000 0011
:
00 0000 0000
003:000
động trong khoảng 0.5 -0.5 ta cần nhân các giá trị đó với các hệ số tơng ứng
CR’ = KR (R’ - Y’) = 0.5R’ - 0.419G’ - 0.081B’
CB’ = KB (B’ - Y’) = -0.169R’ - 0.331G’ - 0.5B’
Với KR = 0.713
KB = 0.564
R’, G’, B’ là các tín hiệu màu cơ bản sau khi sửa méo gama
2.1.3 / Tín hiệu chuẩn thời gian TRS (Time Reference Signal).
19
Trang 20
Tiêu chuẩn số hoá tín hiệu video thành phần không thực hiện lấy mẫu các xung đồng
bộ Để đồng bộ dòng tín hiệu video tại đầu và cuối mỗi dòng số tích cực tín hiệu chuẩnthời gian đợc ghép vào cùng với dòng video số tổng hợp.Trong mỗi khoảng xoá dòng
có 8 từ mã dùng làm chuẩn thời gian Tín hiệu SAV (Start of Active Video) gồm 4 từmã xuất hiện ở điểm đầu mỗi dòng Tín hiệu EAV (End of Active Video) cũng gồm 4
từ mã xuất hiện ở điểm cuối mỗi dòng Nh vậy khoảng thời gian bắt đầu từ EAV và kếtthúc tại SAV là khoảng xoá dòng
Tín hiệu chuẩn thời gian cho tín hiệu video bao gồm 4 từ mã, mã hoá hệ hex đ ợc sắpxếp nh sau:
Mã hoá 8 bit : FF 00 00 XY
Mã hoá 10 bit : 3FF 000 000 XYZ
Trong cả 2 trờng hợp dùng mã hoá 8 bit và 10 bit 3 từ mã đầu đều có giá trị cố định
Các bit P0, P1, P2, P3 dùng để phát hiện và sửa lỗi
2.1.4 / Dữ liệu phụ ANC (Ancillary Data).
Có hai dạng dữ liệu phụ: Dử liệu phụ theo dòng và dữ liệu phụ theo mành Dữ liệuphụ đợc gửi chèn vào bất kì thời điểm nào trong dòng số trừ thời gian dành cho tín hiệuTRS và dữ liệu video.Mức của dữ liệu phụ cũng không đợc phép bằng 00 và FF (mứcdành cho TRS) Một chuỗi dữ liệu phụ đợc khởi đầu bằng tín hiệu chuẩn thời gian chotín hiệu phụ TRS – ANC gồm 6 từ mã:
00 FF FF TT MM LL
Trang 21
Ba từ mã đầu có giá trị không đổi Từ mã thứ t TT là mã nhận dạng dữ liệu Dữ liệu
có thể là tín hiệu audio số,chữ viết,thông tin phụ khác Từ mã thứ 5 và thứ 6 là MM và
LL chứa thông tin về số dòng hoặc số lợng từ mã
ANC có thể xuất hiện nhiều lần trong một dòng nếu ta truyền nhiều dòng dữ liệukhác nhau
2.1.5 / Quan hệ giữa mành số và mành tơng tự.
Hệ 525 dòng
Trong hệ 525 dòng một ảnh video số đợc chia làm 2 mành: mành 1 có 262 dòng vàmành 2 có 263 dòng Thời gian xoá của mỗi mành là 19 dòng Số dòng tích cực tơngứng với mỗi mành bằng243 và 244 dòng
Hình 2.12 : Quan hệ giữa mành số và mành tơng tự hệ 525 dòng / 60 mành
Hệ 625 dòng
Trong hệ 625 dòng một ảnh video số cũng đợc chia làm 2 mành, mành 1 có 312dòng, mành 2 có 313 dòng Thời gian xoá của mành 1 có 24 dòng, thời gian xoá củamành 2 có 25 dòng
21
Trang 22điểm của hình ảnh nguồn và nội dung ảnh
Trong nén ảnh số có các loại d thừa sau:
D thừa dữ liệu theo thống kê: gần nh tất cả các ảnh đều chứa một số lợng lớncác giá trị dữ liệu thông tin giống nhau D thừa dữ liệu tồn tại trong các vùng rộngcủa một ảnh (d thừa không gian) và giữa một chuỗi các ảnh liên tiếp (d thừa thờigian) Các hệ thống nén sử dụng yếu tố dữ liệu giống nhau không cần phải lặp lại
và không cần truyền hết mà chỉ mã hoá một dữ liệu đó và lặp lại toàn bộ ở phầngiải mã Quá trình nhận dạng sự giống nhau đó đợc gọi là giải tơng quan dữ liệu
Trang 23
D thừa tâm sinh lý: giá trị của các mẫu trong cùng một ảnh đợc hệ thống nhìncủa mắt ngời HVS (Human Visual System) tiếp nhận không đều nhau Hiện tợngnày xuất phát từ sự thật là HVS không đáp ứng đợc với cùng độ nhậy của tất cả cácthông tin nhìn thấy Nếu HVS không thể nhận thấy một sai số thì sai số này khôngtác động lên chất lợng thu nhận của ảnh khôi phục Do đó, một số giá trị có thể đ-
ợc thay đổi hoặc loại bỏ mà không ảnh hởng đến độ dung sai về giảm chất lợng
ảnh
Để xác định dung lợng tối thiểu cần sử dụng cho miêu tả, truyền tải thông tin hình
ảnh trớc hết cần đánh giá lợng thông tin chứa đựng trong hình ảnh Lợng thông tinchứa trong một hình ảnh tỷ lệ nghịch với khả năng xuất hiện của hình ảnh Nói cáchkhác, một sự kiện ít xảy ra sẽ chứ đựng nhiều thông tin hơn một sự kiện có nhiều khảnăng xảy ra hơn Đối với hình ảnh, lợng thông tin của một hình ảnh bằng tổng số lợngthông tin của từng phần tử ảnh Lợng thông tin của một phần tử ảnh đợc định nghĩabằng:
I (xi) = - Log2P(x) Trong đó : I (xi) là lợng thông tin của phần tử ảnh xi
P(xi) là xác suất xuất hiện của phần tử ảnh xi Lợng tin tức bình quân của cả tập hợp các phần tử ảnh trong hình ảnh đợc gọi làentropy và tính theo công thức:
Các hệ thống nén dữ liệu là sự phối hợp của nhiều kĩ thuật xử lý nhằm làm giảm tốc
độ bit của các tín hiệu số xuống một giá trị dung hoà đợc với mức chất lợng của ảnhtrong các ứng dụng
Nhiều kĩ thuật nén có tổn thất và không có tổn thất đã đợc đề xuất trong những nămvừa qua tuy nhiên chỉ có một số là thích hợp cho các ứng dụng video Ngoài ra cònnhiều kĩ thuật khác vẫn còn tiếp tục đợc nghiên cứu hoặc khó thực hiện nh: biến đổiKLT (Karhuren-Loève Transform), WHT(Walsh-Hadamard Transform), lợng tử hoá
23
Trang 24
vector, wavelets, fractal Riêng lẻ từng kĩ thuật giảm dữ liệu không có ứng dụng đáng
kể trong thực tế Tuy nhiên khi phối hợp một số các kĩ thuật này sẽ mang lại những hệthống nén rất hiệu quả nh JPEG,MPEG-1, MPEG-2
JPEG, MPEG-1, MPEG-2Hình 2.14 : Sự phối hợp các kĩ thuật nén
Trong kĩ thuật nén video cần phân biệt 2 nhóm đó là nén có tổn thất và nén không cótổn thất
Nén không tổn thất.
Nén không tổn thất cho phép khôi phục lại thông tin nh ban đầu sau khi đã giải nén
Đó là một quá trình mã hoá đảo ngợc đợc Nén không tổn thất đối với ảnh có chất lợngtruyền hình sẽ không cho tỷ lệ nén cao (nhỏ hơn 2:1) Hệ số nén phụ thuộc vào chi tiết
ảnh đợc nén Các kĩ thuật nén không tổn thất bao gồm:
Mã hoá chiều dài thay đổi (VLC : Variable Length Coding): trên thực tế mộtvài giá trị nhất định sẽ xảy ra thờng xuyên hơn các giá trị khác sau khi khung hình
đợc mã hoá dự đoán, chuyển dạng DCT và lợng tử hoá VLC sử dụng đặc điểmnày để thực hiện mã hoá, các giá trị xảy ra thờng xuyên đợc gán với các từ mãngắn, các giá trị ít xảy ra sẽ đợc gán với các từ mã dài Khi thực hiện giải nén, cácthiết lập mã trùng hợp sẽ đợc sử dụng để tạo lại giá trị ban đầu Mã hoá VLC đợcxem nh là mã hoá entropy và mã hoá Huffman Mã hoá và giải mã Huffman đợcthực hiện một cách dễ dàng bằng cách sử dụng các bảng tìm kiếm trong phầncứng
Trang 25
Mã hóa chiều dài động (RLC : Run Length Coding): kĩ thuật này dựa vào sựlặp lại cùng giá trị mẫu dữ liệu để tạo ra các mã đặc biệt chỉ thị sự bắt đầu và kếtthúc một giá trị đợc lặp lại Chỉ các mẫu có giá trị khác không mới đợc mã hoátheo số chạy Số mẫu có giá trị bằng không sẽ đợc truyền đi dọc theo cùng dòngquét Các chuỗi 0 đợc tạo ra bằng quá trình giải tơng quan nh phơng pháp DCThay DPCM
Sử dụng khoảng xoá dòng và mành: vùng xoá dòng và mành của tín hiệu video
sẽ không đợc ghi và truyền
Mã hóa chuyển dạng cosin rời rạc (DCT: Discrete Cosine Transfom): DCT sẽchuyển các khối 8x8 điểm ảnh từ miền không gian hai chiều sang miền tần số Cácgiá trị tần số gia tăng theo trục hoành từ trái sang phải, các giá trị tần số theo trụctung tăng từ trên xuống dới Do vậy góc trái trên cùng sẽ đại diện cho tần số 0 haymột chiều DC, góc phải phía dới sẽ là tần số cao nhất.Chú ý rằng, quá trình chuyểndạng không làm giảm tốc độ bít, bởi vì cùng một số giá trị bít trên một hệ số đợcyêu cầu cho khối đợc chuyển dạng Điểm mấu chốt của quá trình này là các hệ sốtần số đợc chuyển dạng sẽ phù hợp hơn cho kỹ thuật giảm tốc độ bit Đặc biệt là ởchỗ các khối hình ảnh đợc chuyển dạng có chứa các giá trị hệ số bằng 0 và gầnbằng 0 Thực tế trong bộ mã hoá tín hiệu video MPEG, DCT đợc áp dụng chokhung hình sau khi nó đợc đa đến mã hoá dự đoán giữa các khung hình Do vậycác giá trị biên độ thờng là nhỏ điều này dẫn đến khối đợc chuyển dạng có chứanhiều giá trị nhỏ
Nén có tổn thất.
Nén có tổn thất đợc thực hiện bằng cách liên kết 2 hoặc nhiều kĩ thuật xử lý để biểudiễn tín hiệu hình Nén có tổn thất có thể đạt tỷ lệ nén cao từ 2:1 đến 100:1 Tỉ số nénphụ thuộc vào nội dung ảnh đợc dùng trong các ứng dụng Chất lợng ảnh khôi phụckhông đợc nh ban đầu vì có sự làm tròn và giảm dữ liệu trong một frame và giữa cácframe Kĩ thuật nén có tổn thất bao gồm:
Lấy mẫu băng tần con: đây là phơng pháp giảm tốc độ dữ liệu rất có hiệu quảnhng sự tổn thất độ phân giải ảnh và các thanh phần chồng phổ sẽ làm giảm chất l-ợng nội dung ảnh gốc Vì lý do này nên ngời ta không dùng lấy mẫu băng tần concho tín hiệu chói Các phơng pháp lấy mẫu băng tần con tín hiệu hiệu màu trongcác định dạng 4:2:0 và 4:1:1 hiện đợc sử dụng trong các ứng dụng ghi
25
Trang 26
Mã hoá dự báo DPCM (Defferencial Pulse Code Modulation): chỉ truyền phầnchênh lệch giữa các mẫu mà không truyền giá trị mẫu đầy đủ Phần chênh lệch đợccộng vào giá trị mẫu đã giải mã và tại đầu cuối giải mã tạo một giá trị mẫu đã khôiphục lại Quá trình nén đợc thực hiện bằng cách lợng tử hoá thô tín hiệu vi sai vàdùng kĩ thuật VLC cho tín hiệu kết quả Để loại bỏ sai số truyền, sẽ truyền một giátrị mẫu đầy đủ theo chu kì nhất định
Lợng tử hoá và thực hiện VLC cho các hệ số DCT: kết hợp ba quá trình này sẽcho phép biểu diễn một khối các byte của pixel bằng một số lợng nhỏ brt và tạo đ-
ợc kĩ thuật nén hiệu quả và kinh tế nhất
Để có sự nhìn nhận trực quan hơn về nén tín hiệu video, dới đây em xin trình bày cụthể một số kĩ thuật và hệ thống nén thông dụng
2:2:1 / Mã hoá dự báo DPCM.
Trên thực tế mã hoá DPCM cũng sử dụng kết hợp với các kĩ thuật dự đoán và lợng tửhoá thích nghi để hoàn thiện thêm kĩ thuật nén này, tuy nhiên thì độ phức tạp có tănglên Sơ đồ khối bộ mã hóa và giải mã DPCM nh sau:
Trang 27Có hai phơng pháp tạo tín hiệu dự báo:
Dự báo cố định hay còn gọi là dự báo độc lập với ảnh truyền hình
Dự báo thích nghi hay còn gọi là dự báo phụ thuộc ảnh truyền hình
Việc chọn thuật toán tối u tạo tín hiệu dự báo phụ thuộc vào hệ truyền hình đang sửdụng
Bớc tiếp theo của DPCM là chọn phơng pháp lợng tử hoá tối u Dựa trên đặc điểmcủa mắt ngời ta có thể sử dụng đặc trng lợng tử hoá tuyến tính lẫn phi tuyến Đặc tuyếncần lựa chọn sao cho khi mã hoá tín hiệu bằng số bít nhỏ nhất mà méo lợng tử vẫn cóthể ở mức chấp nhận đợc Trong DPCM, ngoài méo lợng tử tính chất của PCM cònxuất hiện méo đặc trng đối với các phơng pháp vi sai nh: nén đờng biên (stope over-load), nhiễu hạt (granular noise), nhiễu chuyển động đờng biên (edge busyness)
Cũng giống nh việc tạo dự báo, đặc trng của lợng tử trong DPCM có thể là cố định
độc lập với ảnh lợng tử hay phụ thuộc vào tín hiệu lợng tử hoá
DPCM giữa các mành (Interframe DPCM).
Tín hiệu dự báo đợc tạo trên cơ sở các mẫu nằm ở các mành kề trớc đó Phơng phápnày tận dụng quan hệ chặt chẽ giữa các mành kế nhau của ảnh và đặc trng củamắt(nhạy với méo trong ảnh tĩnh hơn ảnh động).Nghiên cứu thống kê về cấu trúc ảnh
và tín hiệu video cho thấy rằng sự khác nhau giữa các ảnh là không lớn Để tạo lại các
ảnh một cách trung thực chỉ cần truyền các điểm ảnh làm biến đổi và khôi phục lại tạiphía thu tất cả các điểm ảnh còn lại từ mành trớc hoặc ảnh trớc trong bộ nhớ
Phơng pháp cơ bản của DPCM giữa các mành là mã hoá trực tiếp vi sai giữa cácmành kề nhau Nguyên tắc hoạt động đợc trình bày nh trong sơ đồ sau:
27
Mạchtrừ
L ợng tửhoá m mức
Kênhtruyền
Cộng
Trễmành
CộngTrễ
dự báo
Trang 28
Hình 2.17 : Sơ đồ khối DPCM liên mành
Trong nhiều biến thể của DPCM giữa các mành, có thể thực hiện việc mã hoá tiếtkiệm Nó dựa trên đặc điểm của mắt ngời, cho phép giảm độ phân giải đối với ảnhchuyển động nhiều hơn so với ảnh tĩnh Phơng pháp này chỉ truyền các điểm ảnh cầnthiết và ở phía thu khôi phục tất cả các điểm ảnh còn lại bằng phơng pháp nội suy Đốivới tín hiệu video thờng sử dụng hàm nội suy tuyến tính
2:2:2 / Mã chuyển vị (Transform Coding).
Việc mã hoá riêng rẽ các điểm ảnh sẽ không tận dụng đợc mối quan hệ giữa các khối
điểm trong ảnh số Mã chuyển vị là một cách có hiệu quả trong việc mã hoá khối điểmthông qua biến đổi tuyến tính các điểm này thành các hệ số chuyển vị và thực hiện mãhoá các hệ số chuyển vị đó Phơng pháp này tập trung vào một số ít các hệ số chuyển
vị chứ không phải là các điểm ảnh của ảnh gốc, trong khi đó lợng thông tin chỉ cótrong một số ít các hệ số chuyển vị nh vậy số bit dùng cho quá trình mã hoá sẽ ít đi.Một lý do nữa là HVS không thể nhận biết đợc hoàn toàn các chi tiết của ảnh khinhững chi tiết đó biến đổi nhanh so với các biến đổi chậm, bởi vậy để mã hoá các hệ sốchuyển vị ở tần số cao ta chỉ cần một số ít bit mà chất lợng hình ảnh cảm nhận đợc gần
nh không thay đổi
Với biến đổi một chiều (1D), thực hiện theo:
Y = T XT: ma trận thuận n * n với các hệ số aij (i, j trong khoảng 1 n)
n: số mẫu trên dòng quét
X: xác định n vector
T phải thoả mãn là ma trận trực giao
Với biến đổi 2D các khối điểm n * n mẫu đợc biểu diễn dới dạng ma trận X có cácphần tử xij Ma trận Y với các phần tử ykl đợc xác định theo công thức:
ykl =
n j
n
k 1 1 aklijxij
Biến đổi ngợc:
Trang 29Phơng pháp chuyển đổi tối u cho mã chuyển vị là phơng pháp mà đạt đợc bình phơngcủa lỗi trong quá trình xây dựng lại ảnh (với một số bit đã cho) là nhỏ nhất Theonghiên cứu ngời ta thấy rằng phơng pháp chuyển đổi tối u là chuyển đổi KL nhng nókhông có một thuật toán biến đổi nhanh tổng quát Do đó phơng pháp này không phổbiến Ngời ta đã nghiên cứu và đa ra các phơng pháp chuyển đổi gần tối u để thay thế,phơng pháp thông dụng nhất là biến đổi DCT (Discrete Cosine Trasform) DCT đợc đa
ra vào năm 1974, từ đó tới nay đã có rất nhiều thuật toán biến đổi nhanh cho việc tínhtoán DCT và ta sẽ xem xét dới đây
DCT một chiều.
DCT một chiều biến đổi một bảng số biểu diễn các biên độ tín hiệu của các điểmkhác nhau theo thời gian hoặc theo không gian thành một bảng khác của các số, mỗi sốbiểu diễn biên độ của một thành phần tần số nhất định từ tín hiệu gốc.Bảng kết quảchứa đựng cùng số giá trị nh bảng gốc, phần tử thứ nhất là trung bình của tất cả cácmẫu trong bảng đầu vào và đợc coi nh hệ số điều chế DC, các phần tử còn lại, mỗiphần tử biểu thị biên độ của một thành phần tần số đặc trng của bảng đầu vào và đợcgọi là các hệ số AC
Phép biến đổi đợc tính theo công thức:
x
N
)12(cos)(
1 0
Trang 30C k X
N
)12(cos)()(
1 0
Trang 31
Các giá trị hệ số DCTHình 2.18 : Quá trình mã hoá DCT một chiều
u i j
i f v
C u C N
N j
N
) 1 2 ( cos 2
) 1 2 ( cos ).
, ( )
( ).
(
0
1 0
Trong đó: C(u), C(v) nhận giá trị 12 với u=0, v=0
C(u), C(v) nhận giá trị 1 với u,v còn lại
Phơng trình trên là một liên kết của hai phơng trình DCT một chiều Hệ số u=v=0 là
hệ số điều chế của tín hiệu video (hệ số DC)
Phép biến đổi ngợc đợc tính toán theo công thức:
f(i,j) =
N
v j N
u i v
u F v C u C N
)12(cos)
,()
()
(
0
1 0
0 0 0
Hình 2.19 : Biến đổi DCT hai chiều
Hình (a) biểu diễn bảng tỷ lệ mức chói, hình (b) biểu diễn giá trị mức chói của cácphần tử ảnh tơng ứng, hình (c) biểu diễn khối các hệ số sau khi thực hiện DCT
Đặc điểm của các hệ số DCT hai chiều là hệ số điều chế DC nằm ở góc trái trêncùng Các hệ số dới giá trị thành phần một chiều biểu thị các tần số cao hơn theo chiềudọc Các hệ số bên phải của thành phần một chiều biểu thị các tần số cao hơn theo
31
Trang 32
chiều ngang Hệ số trên cùng cận phải (0,7) đặc trng cho tín hiệu có tần số cao nhấttheo phơng nằm ngang của ma trận Hệ số hàng cuối cùng bên trái (7,0) đặc trng chotín hiệu có tần số cao nhất theo phơng thẳng đứng Các hệ số còn lại ứng với nhữngphối hợp khác nhau của các tần số theo chiều dọc và chiều ngang
Khi biến đổi DCT áp dụng cho các tín hiệu video số thành phần Y, CR, CB các tínhiệu màu CR, CB có biên độ cực đại là 128 giá trị nhị phân trong hệ thống sử dụng 8bit biểu diễn mẫu, và biên độ chói Y có biên độ từ 0255 Để đơn giản cho các bộ mãhoá DCT, tín hiệu chói Y đợc dịch xuống mức ngang bằng với mức tín hiệu CR, CB
Nh vậy khi giải mã DCT giá trị 128 sẽ đợc cộng với từng giá trị điểm ảnh để thu đợctín hiệu Y ban đầu
Khối các hệ số DCT thu đợc có hệ số DC lớn đặc trng cho giá trị trung bình thànhphần một chiều, còn lại các hệ số AC có giá trị rất nhỏ và phần lớn bằng 0 biểu diễncho các thành phần tần số cao theo hớng ngang và theo hớng thẳng đứng Mặc dù cónhiều hệ số tần số bằng 0, giá trị của các hệ số có tần số cao đóng vai trò quan trọngtrong việc tạo lại hình ảnh trong quá trình biến đổi DCT ngợc Các hệ số AC theo hớngngang thờng lớn hơn các hệ số AC theo chiều thẳng đứng
Tóm lại DCT làm giảm độ tơng quan không gian của thông tin trong khối điểm ảnh
Điều đó cho phép biểu diễn thích hợp ở miền DCT do các hệ số DCT có xu h ớng cóphần d thừa ít hơn Hơn nữa, các hệ số DCT chứa thông tin về nội dung tần số khônggian của thông tin trong khối điểm ảnh Nhờ đặc tính tần số không gian của HVS các
hệ số DCT có thể đợc mã hoá phù hợp để chỉ có các hệ số DCT quan trọng nhất mới
đ-ợc mã hoá và truyền đi
2.2.3 / Nén trong ảnh (Intra-frame Compression).
Nén trong ảnh là loại nén nhằm giảm bớt thông tin d thừa trong miền không gian, nóbao gồm cả hai quá trình có và không tổn hao để giảm bớt dữ liệu trong một ảnh.Quátrình này không sử dụng thông tin của các ảnh trớc và sau ảnh đang xét
Thuật ngữ ảnh ở đây cần đợc hiểu một cách chính xác bởi lẽ trong kĩ thuật nén ảnhcho phép sử dụng mành (field) hoặc ảnh (frame) nh một ảnh gốc Nếu kĩ thuật néndùng mành thì nén trong ảnh sẽ tạo ra hai ảnh trong một ảnh Vì vậy, khi bàn về nén,thuật ngữ ”ảnh” không luôn luôn đồng nghĩa với thuật ngữ ảnh trong lĩnh vực truyền
hình
Trang 33
Hình 2.20 : Nén theo ảnh (Frame)
Hình 2.21 : Nén theo mành (Field)
Sơ đồ nguyên lý chung của quá trình nén trong ảnh nh sau:
Hình 2.22 : Nén trong ảnh (Intra-frame Compression)
Tiền xử lý.
Trớc khi thực hiện DCT cả ảnh đợc chia thành các khối lớn MB (Macro Block) riêngbiệt không chồng nhau Mỗi MB bao gồm 4 block các mẫu tín hiệu chói và một số cácblock của tín hiệu hiệu màu phụ thuộc vào tiêu chuẩn lấy mẫu tín hiệu video
L ợng tửhoá
Mã hoá
entropy
Mạchtrộn
Bảng l ợng tử
Nguồn
ảnh
Tín hiệu
ảnh nén
Trang 34
Tất cả các block đều có cùng kích thớc và là một ma trận 8*8 điểm ảnh đợc lấy từmột ảnh màn hình theo chiều từ trái sang phải, từ trên xuống dới Số đánh trên mỗiblock xác định thứ tự của block đó trong chuỗi gửi đến bộ mã hoá DCT Kích thớcblock là 8*8 đợc chọn bởi hai lý do:
Từ nghiên cứu cho thấy hàm hiệp phơng sai suy giảm rất nhanh khi khoảngcách từ pixel mà ở đó nó đợc định nghiã vợt quá 8
Nếu kích thớc block tăng sẽ gây khó khăn cho việc tính toán và thiết kế mạchcứng
Hiện nay, DCT đã trở thành tiêu chuẩn quốc tế cho các hệ thống mã chuyển vị bởi nó
có đặc tính gói năng lợng tốt, cho kết quả là số thực và có các thuật toán nhanh để thểhiện chúng
Các phép tính DCT đợc thực hiện trong phạm vi các khối đã đợc chia ở phần tiền xử
lý Hiệu quả của việc chia này là một trong những hớng quan trọng của mã hoá video
DC đều có thể nhận biết dễ dàng bởi nó làm thay đổi mức chói trung bình của khối Lợng tử hoá đợc thực hiện bằng việc chia các hệ số F(u,v) cho các hệ số ở vị trí tơngứng trong bảng lợng tử Q(u,v) Các hệ số có tần số thấp đợc chia cho các giá trị nhỏ,
Trang 35
các hệ số ứng với tần số cao đợc chia cho các giá trị lớn hơn, sau đó các hệ số đợc làmtròn (bỏ đi phần thập phân) Kết quả nhận đợc là bảng Fq(u,v) mới trong đó phần lớncác hệ số tần số cao sẽ bằng 0
Mức độ tổn hao thông tin của quá trình lợng tử phụ thuộc vào giá trị các hệ số trênbảng lợng tử Với sự lựa chọn các giá trị của Q(u,v) thích hợp sự khác nhau giữa ảnhgốc và ảnh biểu diễn sẽ nhỏ đến mức mắt ngời không cảm nhận đợc
Mã hoá entropy.
Khi dùng mã hoá entropy có hai vấn đề đợc đặt ra: thứ nhất là nó làm tăng độ phứctạp và yêu cầu bộ nhớ hơn so với mã độ dài cố định, thứ hai là nó gắn liền với tínhkhông ổn định của tín hiệu video do đó sẽ làm tốc độ bit thay đổi theo thời gian Bởivậy cần có một cơ cấu điều khiển bộ đệm khi mã hoá nguồn tốc độ bit biến đổi đợcghép với kênh tốc độ bit hằng Trong qua trình mã hoá này mã Huffman đợc dùng phổbiến, ngoài ra còn sử dụng thêm mã RLC để tăng hiệu suất nén
Để mã hoá entropy các hệ số đợc lợng tử hoá, trớc hết cần biến đổi mảng hai chiềucác hệ số thành một chuỗi số một chiều bằng cách quét zig-zag
Hình 2.24 : Quét zig-zag các hệ số lợng tử hoá DCT
Việc xử lý 64 hệ số của khối bằng cách quét zig-zag làm tăng tối đa chuỗi các giá trị
0 liên tiếp và do vậy làm tăng hiệu quả nén khi dùng RLC
Sau khi thực hiện RLC, các từ mã RLC có tần suất xuất hiện cao đợc mã hoá bằngcác từ mã ngắn, các từ mã RLC có tần suất xuất hiện thấp đợc mã hoá bằng các từ mãdài Quá trình này đợc gọi là mã hoá với độ dài từ mã thay đổi (VLC) Tại đầu ra VLCtất cả các từ mã của cùng một khối DCT đợc kết hợp tạo thành một dòng tín hiệu ra
Điều khiển tốc độ bit.
35
Trang 36Quá trình giải nén trong ảnh dựa trên cơ sở thực hiện thuật toán ngợc với quá trìnhnén Các bảng lợng tử và bảng mã Huffman xác định tại bộ mã hoá DCT đợc sử dụng
để phục hồi các giá trị hệ số DCT của khối 8*8 điểm ảnh Sau giải nén ta thu đ ợc ảnhkhác biệt rất ít so với ảnh gốc, sự khác nhau này không làm ảnh hởng nhiều đến sựnhận biết của mắt Tuy nhiên việc làm giảm mức lợng tử hoá sẽ dẫn đến việc làm giảmlợng thông tin của ảnh đợc truyền, nếu tăng mức nén sẽ gây ra méo ảnh, chính vì vậycác họ nén sử dụng DCT đợc xếp vào nhóm có mất thông tin
Nh vậy có thể khái quát quá trình nén trong ảnh và giải nén trong ảnh cơ bản theo sơ
đồ sau:
Hình 2.25 : Quá trình néntrong ảnh
L ợng tửhoá
Quétzig-zag
RLC
đệm
Bảng trọng số
BảngHuffman
Hệ sốcân bằngMã DPCM
hệ số DC
Phân lớp năng l ợng khối
Điều khiển đệmXác định khối
Lựa chọn tốc
độ dòng bit ra
Dòng tín hiệu nén
Trang 37
Hình 2.26 : Quá trình giải nén trong ảnh
2.2.4 / Nén liên ảnh (Inter-frame Compression).
Một phơng pháp mạnh của việc giảm tốc độ bit thông tin là dự đoán các phần tử ảnh
từ các khung hình trớc đó, sau đó sẽ so sánh sự khác nhau giữa hình ảnh thực tế vàhình ảnh dự đoán và truyền đi sự sai khác đó Đây chính là quá trình loại bỏ thông tin
d thừa trong miền thời gian của tín hiệu video
Trong hầu hết các hình ảnh giá trị khác nhau giữa các hình ảnh gần nhau là rất nhỏ
nh vậy việc mã truyền các thông tin sai khác này sẽ tốn rất ít số bit, điều này cho phépgiảm tốc độ bit một cách đáng kể Tại bộ giải mã quá trình dự đoán đợc làm giống nh
bộ mã hóa, giá trị dự đoán sẽ đợc thêm vào giá trị sai khác đợc truyền để nhận đợc giátrị phần tử ảnh nguyên gốc
Để cải thiện quá trình dự đoán, các khối 16x16 điểm ảnh trong mành hiện thời đợc sosánh với các khối trong vùng tìm kiếm đợc xác định trong mành trớc đó Khối nào cógiá trị gần giống nhất sẽ đợc lựa chọn và trừ đi giá trị của khối hiện thời
Quá trình này sẽ giảm tối thiểu giá trị khác nhau đợc phát Nó đợc xem nh là quátrình bù cho sự chuyển động của các đối tợng trong hình ảnh Giá trị véc tơ xác định vịtrí liên quan đến khung phù hợp nhất với khung hiện thời về mặt không gian sẽ đợc mãhoá và truyền đi đến bộ giải mã
37
Vị trí của khối hiện thời trong khung hình n-1
Vị trí của khối hiện thời trong khung hình n-1
Véc tơ chuyển
động
Cửa số tìm kiếm
Trang 38
Hình 2.27 : Sự bù chuyển động
Để giảm quá trình tính toán vector chuyển động, độ phân giải của ảnh có thể đợcgiảm xuống theo cả hai chiều ngang và chiều thẳng đứng Bằng cách này có thể làmgiảm số bit cần xử lý và dự đoán các phần tử chính đợc thay thế trọng khung hình
Dự báo bù chuyển động dựa trên các khung hình trớc là dự đoán một chiều đơn giản
và thờng gọi là dự đoán thuận Các khung hình dự đoán đợc gọi là các khung P(Predicted Frame)
Dự báo nội suy bù chuyển động là dự đoán hai chiều, sử dụng thông tin trong mộtkhung hình trớc và một khung hình tơng lai sau khung hình hiện tại để dự báo khunghình hiện tại gọi là khung hình B (Bidirectionally Predicted Frame) Dự báo hai chiềucho khả năng nén số liệu cao hơn dự đoán một chiều, tuy nhiên dự đoán ng ợc chỉ thựchiện đợc khi khung hình tơng lai đợc truyền đi trớc khung hình hiện tại B
Khung hình I là khung hình mã hoá dự đoán trong mành, khung hình P là khung hình
dự đoán giữa các mành, khung hình B là khung hình dự đoán hai chiều giữa khung I vàkhung P
Hình 2.28 : Các khung hình I, B và P
Khung đợc dự đoán (5) nhận đợc từ khung I (1) đã đợc gửi Trong ví dụ này 3 khung
B đợc gửi giữa khung P và khung I Khung (2), (3), (4) đợc nội suy từ khung hình trớc(1) và khung hình tơng lai (5) Để thực hiện tìm kiếm trong khung hình tơng lai tất cả
Forward Prediction
Trang 39
các khung đợc lu trữ trớc khi xử lý Một điểm thuận lợi của nội suy hai chiều là khunghình tiếp sau có thể cung cấp thông tin về cảnh thay đổi cho khung hình hiện tại màkhung hình trớc đó không cung cấp Do khung B có thể nhận đợc ở bộ giải mã màkhông cần gửi thêm nhiều thông tin nh các khung hình khác nên tốc độ bit có thể đợcgiảm rất nhiều Điểm không thuận lợi của việc sử dụng khung hình B là yêu cầu xử lýphức tạp, yêu cầu nhiều bộ nhớ hơn, đặc biệt gía thành của bộ giải mã sẽ đắt hơn
Hình 2.29 : Nén liên ảnh
Trên hình vẽ là sơ đồ khối nguyên lý của mạch nén liên ảnh (với ảnh dự đoán trớc) vàmạch nén liên ảnh (với ảnh dự doán hai chiều) Sự khác nhau cơ bản giữa hai mạch,mạch tạo ảnh B và mạch tạo ảnh P ở bộ nhớ ảnh so sánh Để tạo ảnh P chỉ cần nhớ ảnhtrớc đó, trong khi đó để tạo ảnh B phải nhớ cả hai ảnh: ảnh trớc và sau ảnh đang xét Thông thờng sau quá trình nén liên ảnh, để tăng hiệu quả nén cần sử dụng kĩ thuậtnén trong ảnh để xử lý độ d thừa không gian của phần thừa bù chuyển động Sự kết hợpgiữa nén trong ảnh và nén liên ảnh là cơ sở cho công nghệ nén video MPEG (MotionPiture Expert Group)
2.2.5 / Chuẩn nén video MPEG.
MPEG( Moving Picture Expert Group) là một tổ chức quốc tế đợc thành lập dới sựbảo trợ của ISO và IEC Mục đích của MPEG trớc đây là đa ra chuẩn cho việc mã hoáhình ảnh động và âm thanh cho các phơng tiện lu trữ số DSM (Digital Storage Media)
có thông lợng từ 1.5 Mbit/s đến 10Mbit/s Phơng pháp mã hoá đợc định nghĩa để ứngdụng cho nhiều lĩnh vực khác nhau nh phân phát và truyền thông
39
Trang 40 Bộ đồng bộ và dồn kênh tín hiệu audio và video.
Hệ thống video
Hệ thống audio
MPEG-1 đợc khởi đầu vào năm 1988 đợc dùng để nén video với tốc độ 1,5Mbit/s.Chuẩn này rất thích hợp cho các thiét bị lu trữ nh CD-ROM và các kênh truyền dẫn sốPDH có tốc độ 1,554 Mbit/s và 2,048 Mbit/s trong hệ thống truyền dẫn của mạng viễnthông thế hệ cũ
MPEG-2 đợc phát triển sau, dự định đợc sử dụng cả cho nén HDTV Sự phát triểncủa tiêu chuẩn MPEG-2 đợc khởi đầu vào tháng 6 năm 1990 Mục đích để định nghĩatiêu chuẩn mã hoá thông tin hình ảnh và âm thanh với chất lợng phát quảng bá với tốc
độ lên tới 15Mbit/s, dựa trên khuyến nghị của tiêu chuẩn truyền hình số ITU-R BT601 Vào tháng 3 năm 1993 MPEG đã họp ở Sydney và tháng 6 ở New York, các chỉ tiêu
kỹ thuật về các mức "Level" và các mô tả "Profile" đã đợc thông qua Bảng dới đâycung cấp định nghĩ vắn tắt của 5 mô tả và danh sách các độ phân giải cho 4 mức, nócũng chỉ ra tốc độ bit cực đại đối vói sự kết hợp của các mức và mô tả