2.1.2 Chuẩn mã hóa MPEG-4 VTC MPEC-4 VTC là một thuật toán được sử dụng để nén các ảnh tĩnh và sau này lại được sử dụng trong các ảnh chụp 3D thực tế.. Tiêu chuẩn JPEG 2000 sử dụng mã hó
Trang 1BỘ THÔNG TIN VÀ TRUYỀN THÔNG HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
-THUYẾT MINH DỰ THẢO TIÊU CHUẨN QUỐC GIA
HỆ THỐNG MÃ HÓA HÌNH ẢNH JPEG2000 – CÁC MỞ RỘNG ĐỐI
VỚI DỮ LIỆU BA CHIỀU
HÀ NỘI -2015 MỤC LỤC
Trang 31 Tên gọi và ký hiệu tiêu chuẩn
“Hệ thống mã hóa hình ảnh JPEG 2000 – Các mở rộng đối với dữ liệu ba chiều”
Ký hiệu tiêu chuẩn: TCVN xxxx:xxxx
2 Tình hình chuẩn hóa về mã hóa ảnh tĩnh
2.1 Các chuẩn mã hóa ảnh tĩnh
2.1.1 Chuẩn mã hóa PNG
Portable Network Graphics (PNG) là một phương thức mã hóa định dạng hình ảnh sửdụng thuật toán nén không mất dữ liệu PNG được tạo ra để cải tiến và thay thế định dạngGIF (Graphics Interchange Format) và là một định dạng tập tin hình ảnh không yêu cầubản quyền
PNG hỗ trợ hình ảnh dựa trên bảng màu (24 bit RGB hoặc 32 bit RGBA), ảnh xám(có hoặc không có kênh alpha), và ảnh RGB (có hoặc không có kênh alpha)
PNG cung cấp các lựa chọn trong suốt Với hình ảnh màu thực và màu xám, giá trịmỗi điểm ảnh có thể được xác định là trong suốt hoặc một kênh alpha có thể được thêmvào (cho phép bất kỳ tỷ lệphần trăm của độ trong suốt được sử dụng)
PNG được sử dụng rộng rãi trên mạng internet do nó hỗ trợ tính trong suốt, và nó sửdụng một thuật toán nén không mất dữ liệu
2.1.2 Chuẩn mã hóa MPEG-4 VTC
MPEC-4 VTC là một thuật toán được sử dụng để nén các ảnh tĩnh và sau này lại được
sử dụng trong các ảnh chụp 3D thực tế Phương pháp này dựa trên biến đổi sóng con rờirạc (DWT), lượng tử scala, và mã hóa số học
Đặc tính ưu việt nhất của MPEG-4 VTClà năng lực mã hóa các đối tượng có địnhdạng tùy ý Khả năng này được thực hiện bởi các phương tiện DWT thích ứng theo địnhdạng và mã hóa định dạng MPEG-4 Một số đối tượng có thể được mã hóa riêng rẽ, có
Trang 4thể với chất lượng khác nhau , và sau đó được tập hợp tại bộ giải mã để thu được ảnh giải
mã cuối cùng Tuy nhiên, MPEG-4-VTC không hỗ trợ mã hóa không tổn thất
2.1.3 Các chuẩn mã hóa JPEG
Có nhiều phương pháp nén ảnh, nhưng đều dựa trên nguyên tắc tìm ra các “phần tửthừa” trong dữ liệu và mã hóa chúng theo nhiều mức độ khác nhau Một công nghệ nénảnh tương đối hiệu quả có thể làm việc với các ảnh kích cỡ lớn, nhiều màu đó là côngnghệ JPEG (Joint Photographic Experts Group) Tiêu chuẩn JPEG – Định dạng ảnh JPEG
là một tiêu chuẩn nén ảnh được phát triển bởi Nhóm chuyên gia xử lý ảnh JPEG thành lậpnăm 1986 với sự hợp tác của các tổ chức ITU (International Telecommunication Union –Liên minh Viễn thông quốc tế), ISO (International Organization for Standardization – Tổchức tiêu chuẩn quốc tế) và IEC (International Electrotechnical Commission - Ủy ban Kỹthuật điện tử quốc tế), và do đó tiêu chuẩn được đặt tên của nhóm JPEG
Kỹ thuật này có thể đạt được hệ số nén hơn tám mươi lần so với ảnh gốc Tuy nhiên,
hệ số nén càng cao thì hình ảnh sau khi giải nén sẽ càng bị sai lệch nhiều hơn, nó chỉ gầngiống như ban đầu chứ không đạt hoàn toàn như hình ảnh gốc Dù sao thì với mắt thườngrất khó nhận ra điều khác biệt
Nguyên lý của phương pháp nén JPEG là: Cắt hình ảnh thành từng khối nhỏ, phân tíchtất cả các dữ liệu về màu sắc, độ sáng mà các khối đó chứa bằng các phương trình matrận Ảnh màu trong không gian RGB (Red, Green, Blue) được chuyển đổi qua hệ YUV.Trong khi thị giác của con người lại rất nhạy cảm với hệ Y, ít nhạy cảm hơn nhiều với hệ
U, V Hệ thống sẽ nén thành phần Y của ảnh ở mức độ ít hơn nhiều so với U và V Kếtiếp là dùng biến đổi Cosin rời rạc, sau nữa là mã hóa theo phương pháp Hoffman Khigiải nén ảnh, các bước thực thi sẽ làm ngược lại quá trình nói trên
Tiêu chuẩn này có hai phương pháp nén ảnh cơ bản là: phương pháp dựa trên biến đổicosin rời rạc (Discrete Cosine Transformation - DCT) được đặc tả dành cho nén ảnh cótổn thất (lossy) và phương pháp tiên đoán (predictive) được đặc tả dành cho nén ảnhkhông tổn thất (lossless)
Trang 5Chuẩn JPEG ban đầu đã nhận được sự đón nhận rộng rãi và hiện tại có mặt ở khắp nơithông qua các ứng dụng của máy tính: nó là khuôn dạng chính cho các ảnh chụp trongweb toàn cầu và được sử dụng rộng rãi trong lưu trữ hình ảnh Hơn nữa, ảnh số hóa ngàycàng phổ biến với người dùng và yêu cầu chất lượng ngày tăng lên, vì vậy các vấn đề xử
lý hình ảnh cũng tăng theo Tuy nhiên, việc nén hình ảnh không chỉ làm giảm dung lượnglưu trữ và các yêu cầu băng thông, mà còn cho để nguyên ghép tách, ghép để sắp xếp xử
lý và đáp ứng các mục tiêu trên các ứng dụng và thiết bị cụ thể Ngoài ra, yêu cầu về hiệusuất nén tốt hơn với tỷ số nén cao đã dẫn tới sự phát triển của tiêu chuẩn JPEG 2000.Tháng 12 năm 2000, Nhóm ban hành tiêu chuẩn JPEG 2000 Phần 1 với tên chính thức
là tiêu chuẩn ISO/IEC 15444-1 | ITU-T T.800 Tiêu chuẩn JPEG 2000 sử dụng mã hóa cogiãn độ phân giải (scalable) ảnh tĩnh liên tục (từ có tổn thất đến không tổn thất) dựa trênbiến đổi wavelet Tiêu chuẩn không chỉ cung cấp khả năng nén ảnh với chất lượng vàhiệu quả cao hơn hệ thống JPEG cơ bản mà nó còn có khả năng biểu diễn một ảnh vớinhiều tính năng hơn, hỗ trợ trong cùng luồng bit đáp ứng được rất nhiều ứng dụng hiện có
và ứng dụng mới
Hiện nay có 3 phiên bản về JPEG được công bố như sau:
2.1.3.1 Tiêu chuẩn JPEG năm 1992
Tiêu chuẩn JPEG sử dụng mã hóa ảnh tĩnh liên tục có tổn thất (lossy) dựa trên biến đổicosin rời rạc DCT, đã được ITU công bố là một tiêu chuẩn viễn thông ITU-TRecommendation T.81 và được công nhận là tiêu chuẩn quốc tế với tên chính thức
là ISO/IEC 10918-1:1994 Mục tiêu của tiêu chuẩn JPEG năm 1992 là hỗ trợ nén ảnh vớinhiều kích cỡ/không gian màu sắc, với tỉ lệ nén theo yêu cầu người dùng, hỗ trợ tái tạo lạiảnh với chất lượng cao và hỗ trợ quản lý mức độ phức tạp tính toán khi nén ảnh
Bảng 1: Các tiêu chuẩn quốc tế về mã hóa hình ảnh JPEG
Trang 6N ă m
c ô n g
b ố
S ố ISO /IE C
Số ITU Tên tiêu chuẩn
JP
hần1
1992
I
SO /IEC10918-1
ITU-TRec
T
81
Công nghệ thông tin – Nén số
và mã hóa ảnh có sắc độ liên tục– Yêu cầu và hướng dẫn
Phần2
1994
I
SO /IEC10918-2
ITU-TRec
T.83
Công nghệ thông tin – Nén số
và mã hóa ảnh có sắc độ liên tục– Bài đo tuân thủ
Phầ
199
I
SO /
ITU-TRec
Công nghệ thông tin – Nén số
và mã hóa ảnh có sắc độ liên tục– Phần mở rộng
Trang 7N ă m
c ô n g
b ố
S ố ISO /IE C
Số ITU Tên tiêu chuẩn
3
10918-3P
hần4
1998
I
SO /IEC10918-4
ITU-TRec
T.86
Công nghệ thông tin – Nén số
và mã hóa ảnh có sắc độ liên tục– Đăng ký JPEG Profiles, SPIFFProfiles, SPIFF Tags, các khônggian màu SPIFF, APPn Markers,các loại nén SPIFF và cơ quanđăng ký (REGAUT)
Phần5
2013
I
SO /IEC10918-5FC
Công nghệ thông tin – Nén số
và mã hóa ảnh có sắc độ liên tục– JPEG File Interchange Format(JFIF)
Trang 8N ă m
c ô n g
b ố
S ố ISO /IE C
Số ITU Tên tiêu chuẩn
D
2.1.3.2 Tiêu chuẩn JPEG-LS
Tiêu chuẩn JPEG-LS sử dụng mã hóa ảnh tĩnh liên tục không tổn thất (lossless) và tổnthất ít (nearlossless) dựa trên mã hóa tiên đoán và mã hóa ngẫu nhiên, đã được công bố làtiêu chuẩn quốc tế ISO/IEC IS 14495-1|ITU-T Recommendation T.87
Bảng 2: Các tiêu chuẩn quốc tế về mã hóa hình ảnh JPEG-LS
Trang 9N ă m
c ô n g
b ố
Số ISO/
IEC
Số ITU Tên tiêu chuẩn
JP
EG-LS
Phần1
1998
IS
O /IEC14495-1
ITU-TRec
T.87
Công nghệ thông tin – Nénkhông tổn thất và gần như khôngtổn thất ảnh có sắc độ liên tục –
Cơ sở
Phần2
2000
IS
O /IEC14495-2
ITU-TRec
T.870
Công nghệ thông tin – Nénkhông tổn thất và gần như khôngtổn thất ảnh có sắc độ liên tục –Các mở rộng
2.1.3.3 Tiêu chuẩn JPEG 2000
Kỹ thuật nén JPEG sẽ làm mất thông tin lúc giải nén, càng nén với hệ số cao thì thông tincàng mất nhiều khi giải nèn Công nghệ JPEG 2000 sẽ giải quyết vấn đề này Với JPEG
2000 kỹ thuật xử lý hình ảnh sẽ đạt được những kết quả rất khả quan vì có thể nén nhỏ từ100-200 lần mà hình ảnh không sai sót bao nhiêu so với hình ảnh gốc JPEG 2000sử dụng
Trang 10mã hóa co giãn (scalable) ảnh tĩnh liên tục (từ có tổn thất đến không tổn thất) dựa trênbiến đổi wavelet (một công cụ xử lý tín hiệu rất thành công, đặc biệt là xử lý ảnh) Là mộttiện ích toán học cho phép mô tả bằng một công thức đơn giản những gì xảy ra tại mộtthời điểm chính xác của tín hiệu Với một chuỗi sóng ngắn, chỉ cần biểu diễn bằng vàicông thức, đường biểu diễn không đều mà không cần phải mô tả đặc tính của từng điểmmột Và lẽ dĩ nhiên sẽ rất đắc lực khi phân tích tỉ mỉ một file ảnh kỹ thuật số.
Thuật toán trong kỹ thuật JPEG 2000 là chọn một số nhỏ các sóng ngắn, các sóng nàyđược lập lại ở những nơi khác nhau, tỷ lệ khác nhau đã mô tả chính xác tín hiệu của hìnhảnh File ảnh nén không chứa nhiều hơn số lượng chỉ vị trí và giãn nở của từng sóngngắn Và kỹ thuật mã hóa theo từng khối, theo từng khu vực ưu tiên của hình ảnh (ROI-Regional Of Interest) được áp dụng cũng là một tiến bộ đáng kể trong thuật toán mã hóaJPEG 2000
Tiêu chuẩn JPEG 2000 không chỉ cung cấp khả năng nén ảnh với chất lượng và hiệu quảcao hơn hệ thống cơ bản JPEG mà nó còn có khả năng biểu diễn một ảnh với nhiều tínhnăng hơn, hỗ trợ trong cùng bit-stream (chuỗi bit được mã hóa hoặc giải mã một phầnchứa đoạn mã hóa dữ liệu ngẫu nhiên) đáp ứng được rất nhiều ứng dụng hiện có và ứngdụng mới
Không giống tiêu chuẩn JPEG truyền thống, kỹ thuật mã hóa dựa trên biến đổi cosin rờirạc (DCT – Dicrete Cosin Transform) dùng mã hóa Huffman, JPEG 2000 sử dụng kỹthuật mã hóa sóng con rời rạc (DWT – Decrete Wavelet Transform) dùng mã hóa số học
Sử dụng DWT cho phép nâng cao độ phân giải tần số mang tính không gian trong thểhiện biến đổi hình ảnh Sơ đồ khối của quá trình nén và giải nén theo chuẩn JPEG 2000được mô tả ở hình dưới đây
Trang 11Hình 1: Sơ đồ quá trình nén và giải nén theo chuẩn JPEG 2000
JPEG 2000 nhiều chức năng đặc biệt hơn mọi chuẩn nén ảnh tĩnh khác như JPEG hayGIF Dưới đây là các chức năng ưu việt của JPEG 2000 so với các chuẩn nén ảnh tĩnhkhác :
- Cho chất lượng ảnh tốt nhất khi áp dụng nén ảnh tĩnh có tổn thất
- Sử dụng được với các truyền dẫn và hiển thị lũy tiến về chất lượng, về độ phângiải, các thành phần màu và có tính định vị không gian
- Sử dụng cùng một cơ chế nén ảnh cho cả hai dạng thức nén
- Truy cập và giải nén tại mọi thời điểm trong khi nhận dữ liệu
- Giải nén từng vùng trong ảnh mà không cần giải nén toàn bộ ảnh
- Có khả năng mã hóa với tỷ lệ nén theo từng vùng khác nhau
- Nén một lần nhưng có thể giải nén với nhiều cấp chất lượng khác nhau tùy theoyêu cầu của người sử dụng
Bảng 3: Các tiêu chuẩn quốc tế về mã hóa hình ảnh JPEG 2000
Trang 12N ă m
c ô n g
b ố
Số ISO/
IEC
Số ITU Tên tiêu chuẩn
JP
EG
2000
Phần1
2000
IS
O /IEC15444-1
ITU-TRec
T.800
Công nghệ thông tin – Hệthống mã hóa hình ảnh JPEG
2000 – Phần mềm chuẩn - Hệthống mã hóa lõi
Phần2
2004
IS
O /IEC15444-2
ITU-TRec
T.801
Công nghệ thông tin – Hệthống mã hóa hình ảnh JPEG
2000 – Các mở rộng
Phần
2002
IS
O /IEC15444-3
ITU-TRec
T.802
Công nghệ thông tin – Hệthống mã hóa hình ảnh JPEG
2000 –Motion JPEG 2000
Trang 13N ă m
c ô n g
b ố
Số ISO/
IEC
Số ITU Tên tiêu chuẩn
Phần4
2002
IS
O /IEC15444-4
ITU-TRec
T.803
Công nghệ thông tin – Hệthống mã hóa hình ảnh JPEG
2000 – Kiểm tra sự phù hợp
Phần5
2003
IS
O /IEC15444-5
ITU-TRec
T.804
Công nghệ thông tin – Hệthống mã hóa hình ảnh JPEG
2000 – Phần mềm chuẩn
Phần6
2003
IS
O /IEC15444-6
ITU-TRec
T.805
Công nghệ thông tin – Hệthống mã hóa hình ảnh JPEG
2000 – Định dạng tập tin hìnhảnh hợp thành
Trang 14N ă m
c ô n g
b ố
Số ISO/
IEC
Số ITU Tên tiêu chuẩn
Phần8
2007
IS
O /IEC15444-8
ITU-TRec
T.807
Công nghệ thông tin – Hệthống mã hóa hình ảnh JPEG
2000 – Các vấn đề an toàn(JPSEC)
Phần9
2005
IS
O /IEC15444-9
ITU-TRec
T.808
Công nghệ thông tin – Hệthống mã hóa hình ảnh JPEG
2000 – Các công cụ tương tác,các giao thức và API
Phần
2008
IS
O /IEC15444-10
ITU-TRec
T.809
Công nghệ thông tin – Hệthống mã hóa hình ảnh JPEG
2000 – Các mở rộng đối với dữliệu 3 chiều
Trang 15N ă m
c ô n g
b ố
Số ISO/
IEC
Số ITU Tên tiêu chuẩn
0Phần
11
2007
IS
O /IEC15444-11
ITU-TRec
T.810
Công nghệ thông tin – Hệthống mã hóa hình ảnh JPEG
2000 – Các ứng dụng vô tuyến(JPWL)
Phần
12
2004
IS
O /IEC15444-12
ITU-TRec
T.811
Công nghệ thông tin – Hệthống mã hóa hình ảnh JPEG
2000 – Định dạng tập tin truyềnthông căn cứ theo tiêu chuẩn ISO
Phầ
200
IS
O /IEC
ITU-TRec
Công nghệ thông tin – Hệthống mã hóa hình ảnh JPEG
2000 – Bộ mã hóa JPEG 2000
Trang 16N ă m
c ô n g
b ố
Số ISO/
IEC
Số ITU Tên tiêu chuẩn
n
13
4-13
T.812
Phần
14
2013
IS
O /IEC15444-14
ITU-TRec
T.813
Công nghệ thông tin – Hệthống mã hóa hình ảnh JPEG
2000 – Cơ cấu XML đại diện vàtham khảo
2.2 So sánh các tiêu chuẩn mã hóa ảnh tĩnh
Tính năng quan trọng và là ưu điểm rõ nét nhất của JPEG 2000 so với JPEG cũng nhưcác chuẩn nén ảnh khác như MPEG 4 VTC hay JPEG – LS v.v… là JPEG 2000 đưa ra cảhai kĩ thuật nén ảnh có tổn thất và không tổn thất theo cùng một cơ chế mã hóa, nghĩa làJPEG 2000 thực hiện tất cả các dạng thức của JPEG chỉ bằng một cơ chế mã hóa duy
Trang 17nhất Nếu xét về sự tồn tại của 2 kĩ thuật này thì JPEG cũng có khả năng nén ảnh có tổnthất và không tổn thất thông tin
Hình 2: So sánh JPEG và JPEG 2000
Tuy nhiên với JPEG thì cơ chế mã hóa với hai dạng này là khác nhau và rấtkhó để sử dụng cả hai dạng này cùng lúc cho cùng một ứng dụng Do đó, có thểthấy rằng JPEG có tính mềm dẻo hơn bất kì chuẩn nén ảnh tĩnh nào trước đây Hơnthế, những thống kê thực tế cho thấy với cùng một tỉ lệ nén và một loại ảnh thì ảnhđược nén bởi JPEG 2000 luôn có chất lượng tốt hơn so với JPEG Chúng ta xemxét hai ảnh trên hình 2 để thấy rõ điều này, ảnh bên trái được nén theo JPEG cònảnh bên phải được nén theo JPEG 2000 Tính năng ưu việt thứ 2 của JPEG 2000 sovới JPEG là trong dạng thức nén có tổn thất thông tin, JPEG 2000 có thể đưa ra tỉ lệnén cao hơn nhiều so với JPEG Các phần mềm nén ảnh JPEG hiện nay (kể cảPhotoshop) cũng chỉ thiết kế để có thể nén được tới tỉ lệ 41:1 với JPEG 2000 thì tỉ
lệ nén có thể lên tới 200:1
Với hai ảnh ở hình 2, sự so sánh về tham số PSNR(tỷ số tín hiệu đỉnh trên tạpâm) được cho trên bảng 2 Để so sánh dễ dàng hơn, ta xét ảnh được nén với các tỉ lệ
Trang 18khác nhau (đo lường bởi hệ số bít/pixel hay bpp) Tất cả các số liệu trên bảng đềucho thấy JPEG 2000 nén ảnh tốt hơn là JPEG: hơn thế hệ số PSNR mà chúng ta xéttrong bảng được đo trong hệ đơn vị logarit
Bảng 4: So sánh JPEG và JPEG 2000
Bit per pixel 0.125 0.50 2.00 Ảnh 1 theo JPEG 24.42 31.17 35.15 Ảnh 1 theo JPEG 2000 28.12 32.95 37.35 Ảnh 2 theo JPEG 22.6 28.92 35.99 Ảnh 2 theo JPEG 2000 24.85 31.13 38.80
Tính năng ưu việt thứ 3 của JPEG 2000 so với JPEG là chuẩn nén ảnh này cóthể hiển thị được các ảnh với độ phân giải và kích thước khác nhau từ cùng một ảnhnén Với JPEG thì điều này là không thể thực hiện Sở dĩ có điều này là bởi JPEG
2000 sử dụng kĩ thuật phân giải ảnh và mã hóa đính kèm mà chúng ta đã đề cập tớitrong phần mã hóa ảnh theo JPEG 2000 Tính năng này chính là một lợi thế đặcbiệt quan trọng của JPEG 2000, trong khi JPEG cũng như các chuẩn nén ảnh tĩnhtrước đây phải nén nhiều lần để thu được chất lượng với từng lần nén khác nhau, thìvới JPEG 2000 ta chỉ cần nén một lần còn chất lượng ảnh sẽ được quyết định tùytheo người sử dụng trong quá trình giải nén ảnh theo JPEG 2000 Một tính năng nổibật nữa của JPEG 2000 là tính năng mã hóa ảnh theo vùng (ROI – Region ofInterest) mà chúng ta đã đề cập trong phần mã hóa ảnh theo JPEG 2000 Chấtlượng của toàn bộ ảnh cũng được thấy rõ trên hình 3, chất lượng của vùng ảnh đượclựa chọn tăng cao hơn khi vùng đó được áp dụng phương pháp nén ảnh ROI