Nguyên lý của phương pháp nén JPEG là: Cắt hình ảnhthành từng khối nhỏ, phân tích tất cả các dữ liệu về màu sắc, độ sáng mà các khối đó chứa bằng các phương trình ma trận.Ảnh màu trong k
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
──────── * ───────
BÁO CÁO
Môn học: Truyền thông đa phương tiện
Đề tài 3 Tìm hiểu sơ đồ nén ảnh JPEG, khảo sát và đánh giá thực nghiệm chất lượng ảnh JPEG trong các
Nguyễn Mạnh Cường 20121365
Lê Thị Hải Yến 20122839
Trang 2Nguyễn Đình Phúc 20122233
Hà Nội, tháng 12 năm 2015
Mục Lục
I TÌM HIỂU CHUNG VỀ CHUẨN JPEG VÀ CÁC LOẠI JPEG 3
1 Tổng quan về JPEG 3
2 Ưu nhược điểm của phương pháp nén ảnh JPEG 4
2.1 Ưu điểm 4
2.2 Nhược điểm 4
3 Các loại JPEG 5
3.1 JPEG 1992 5
3.2 JPEG-LS 5
3.3 JPEG Search 6
3.4 JPEG XR 6
3.5 JPEG 2000 7
II SƠ ĐỒ NÉN ẢNH JPEG CƠ BẢN (BASELINE JPEG), SỰ KHÁC NHAU GIỮA SƠ ĐỒ JPEG VÀ SƠ ĐỒ NÉN JP-LS 8
1 Quá trình mã hóa và giải mã JPEG tuần tự 8
1.1 Xử lý màu chuyền về không gian màu YcBCr 9
1.2 Ảnh đầu vào được phân thành các khối 8x8 để xử lý 9
1.3 Biến đổi DCT 10
1.4 Lượng tử hóa: Dùng bảng lượng tử 12
1.5 Quá trình mã hóa 13
1.6 Ghép các khối tạo thành các dòng dữ liệu, dòng bit 15
2 Sự khác nhau giữa sơ đồ JPEG và sơ đồ nén JPEG-LS
15
Trang 32.2 Sơ đồ nén ánh JPEG-LS 15 2.3 So sánh sơ đồ nén ảnh JPEG-LS và sơ đồ JPEG cơ bản 18 2.4 Khả năng ứng dụng của JPEG-LS 19
III CÀI ĐẶT THỬ NGHIỆM ỨNG DỤNG NÉN ẢNH JPEG CƠ BẢN20
Trang 4I TÌM HIỂU CHUNG VỀ CHUẨN JPEG VÀ CÁC LOẠI JPEG
1 Tổng quan về JPEG
Có nhiều phương pháp nén ảnh, nhưng đều dựa trênnguyên tắc tìm ra các “phần tử thừa” trong dữ liệu và mãhóa chúng theo nhiều mức độ khác nhau Một công nghệ nénảnh tương đối hiệu quả có thể làm việc với các ảnh kích cỡlớn, nhiều màu đó là công nghệ JPEG (Joint PhotographicExperts Group) Tiêu chuẩn JPEG – Định dạng ảnh JPEG làmột tiêu chuẩn nén ảnh được phát triển bởi Nhóm chuyên gia
xử lý ảnh JPEG thành lập năm 1986 với sự hợp tác của các tổchức ITU (International Telecommunication Union – Liên minhViễn thông quốc tế), ISO (International Organization forStandardization – Tổ chức tiêu chuẩn quốc tế) và IEC(International Electrotechnical Commission - Ủy ban Kỹ thuậtđiện tử quốc tế), và do đó tiêu chuẩn được đặt tên của nhómJPEG
Kỹ thuật này có thể đạt được hệ số nén hơn tám mươi lần
so với ảnh gốc Tuy nhiên, hệ số nén càng cao thì hình ảnhsau khi giải nén sẽ càng bị sai lệch nhiều hơn, nó chỉ gầngiống như ban đầu chứ không đạt hoàn toàn như hình ảnhgốc Dù sao thì với mắt thường rất khó nhận ra điều khácbiệt Nguyên lý của phương pháp nén JPEG là: Cắt hình ảnhthành từng khối nhỏ, phân tích tất cả các dữ liệu về màu sắc,
độ sáng mà các khối đó chứa bằng các phương trình ma trận.Ảnh màu trong không gian RGB (Red, Green, Blue) đượcchuyển đổi qua hệ YUV Trong khi thị giác của con người lạirất nhạy cảm với hệ Y, ít nhạy cảm hơn nhiều với hệ U, V Hệthống sẽ nén thành phần Y của ảnh ở mức độ ít hơn nhiều sovới U và V Kế tiếp là dùng biến đổi Cosin rời rạc, sau nữa là
mã hóa theo phương pháp Hoffman Khi giải nén ảnh, cácbước thực thi sẽ làm ngược lại quá trình nói trên
Tiêu chuẩn này có hai phương pháp nén ảnh cơ bản là:phương pháp dựa trên biến đổi cosin rời rạc (Discrete CosineTransformation - DCT) được đặc tả dành cho nén ảnh có tổnthất (lossy) và phương pháp tiên đoán (predictive) được đặc
tả dành cho nén ảnh không tổn thất (lossless)
Trang 5Các loại JPEG được phân loại theo phương thức thực hiện
mã hóa:
Chuẩn JPEG ban đầu đã nhận được sự đón nhận rộng rãi vàhiện tại có mặt ở khắp nơi thông qua các ứng dụng của máytính: nó là khuôn dạng chính cho các ảnh chụp trong webtoàn cầu và được sử dụng rộng rãi trong lưu trữ hình ảnh.Hơn nữa, ảnh số hóa ngày càng phổ biến với người dùng vàyêu cầu chất lượng ngày tăng lên, vì vậy các vấn đề xử lýhình ảnh cũng tăng theo Tuy nhiên, việc nén hình ảnh khôngchỉ làm giảm dung lượng lưu trữ và các yêu cầu băng thông,
mà còn cho để nguyên ghép tách, ghép để sắp xếp xử lý vàđáp ứng các mục tiêu trên các ứng dụng và thiết bị cụ thể.Ngoài ra, yêu cầu về hiệu suất nén tốt hơn với tỷ số nén cao
đã dẫn tới sự phát triển của tiêu chuẩn JPEG 2000 Tháng 12năm 2000, Nhóm ban hành tiêu chuẩn JPEG 2000 Phần 1 vớitên chính thức là tiêu chuẩn ISO/IEC 15444-1 | ITU-T T.800.Tiêu chuẩn JPEG 2000 sử dụng mã hóa co giãn độ phân giải(scalable) ảnh tĩnh liên tục (từ có tổn thất đến không tổnthất) dựa trên biến đổi wavelet Tiêu chuẩn không chỉ cungcấp khả năng nén ảnh với chất lượng và hiệu quả cao hơn hệthống JPEG cơ bản mà nó còn có khả năng biểu diễn một ảnhvới nhiều tính năng hơn, hỗ trợ trong cùng luồng bit đáp ứngđược rất nhiều ứng dụng hiện có và ứng dụng mới
2 Ưu nhược điểm của phương pháp nén ảnh JPEG
2.1 Ưu điểm
Phương pháp nén ảnh theo chuẩn JPEG có thể đạt hệ sốnén tới 80:1 hay lớn hơn, nhưng phải chịu mất thông tin(ảnh sau khi giải nén khác với ảnh ban đầu), lượng thông tinmất mát tăng dần theo hệ số nén Tuy nhiên sự mất mátthông tin này không bị làm một cách cẩu thả JPEG tiến hànhsửa đổi thông tin ảnh khi nén sao cho ảnh mới gần giống nhưảnh cũ, khiến phần đông mọi người không nhận thấy sự khác
Trang 6biệt Và bạn hoàn toàn có thể quản lý sự mất mát này bằngcách hạn chế hệ số nén Như thế người dùng có thể cân nhắcgiữa cái lợi của việc tiết kiệm bộ nhớ và mức độ mất thôngtin của ảnh, để chọn phương án thích hợp.
JPEG cho phép hiển thị các hình ảnh đầy đủ màu hơn colour) cho định dạng di động mà kích thước file lại nhỏ hơn.JPEG cũng được sử dụng rất nhiều trên Web Lợi ích chính củachúng là chúng có thể hiển thị các hình ảnh với màu chínhxác true-colour (chúng có thể lên đến 16 triệu màu), điều đócho phép chúng được sử dụng tốt nhất cho các hình ảnhchụp và hình ảnh minh họa có số lượng màu lớn
(full-2.2 Nhược điểm
Nhược điểm chính của JPEG là chúng được nén bằng thuậttoán lossy (mất dữ liệu) Điều này có nghĩa rằng hình ảnhcủa bạn sẽ bị mất một số chitiết khi chuyển sang định dạngJPEG Đường bao giữa các khối màu có thể xuất hiện nhiềuđiểm mờ, và các vùng sẽ mất sự rõ nét, tỉ số nén càng caothì sự mất mát thông tin trên ảnh JPEG càng lớn Nói mộtcách khác định dạng JPEG thực hiện bảo quản tất cả thôngtin màu trong hình ảnh đó, tuy nhiên với các hình ảnh chấtlượng màu cao high-colour như hình ảnh chụp thì điều này
sẽ không hề hấn gì Các ảnh JPEG không thể làm trong suốthoặc chuyển động-trong trường hợp này bạn sẽ sử dụng địnhdạng GIF (hoặc định dạng PNG để tạo trong suốt)
3 Các loại JPEG
3.1 JPEG 1992
Tiêu chuẩn JPEG sử dụng mã hóa ảnh tĩnh liên tục có tổnthất (lossy) dựa trên biến đổi cosin rời rạc DCT, đã được ITUcông bố là một tiêu chuẩn viễn thông ITU-T RecommendationT.81 và được công nhận là tiêu chuẩn quốc tế với tên chínhthức là ISO/IEC 10918-1:1994 Mục tiêu của tiêu chuẩn JPEGnăm 1992 là hỗ trợ nén ảnh với nhiều kích cỡ/không gianmàu sắc, với tỉ lệ nén theo yêu cầu người dùng, hỗ trợ tái tạolại ảnh với chất lượng cao và hỗ trợ quản lý mức độ phức tạptính toán khi nén ảnh
Trang 7Phương pháp nén ảnh dựa trên nguyên lý sau: Ảnh màutrong không gian của 3 màu RGB (Red Green Blue) được biếnđổi về hệ YUV (hay YCBCr) (điều này không phải là nhấtthiết, nhưng nếu thực hiện thì cho kết quả nén cao hơn) HệYUV là kết quả nghiên cứu của các nhà sản xuất vô tuyếntruyền hình hệ Pal, Secam và NTSC, nhận thấy tín hiệu video
có thể phân ra 3 thành phần Y, U, V (cũng như phântheo màu chuẩn đỏ, xanh lá cây và xanh da trời).Và một điềuthú vị là thị giác của con người rất nhạy cảm với thành phần
Y và kém nhạy cảm với hai loại U và V Phương pháp JPEG đãnắm bắt phát hiện này để tách những thông tin thừa củaảnh Hệ thống nén thành phần Y của ảnh với mức độ íthơn sovới U, V, bởi người ta ít nhận thấy sự thay đổi của U và V sovới Y
Vì phương pháp này thực hiện với các vùng ảnh (thôngthường là 8 x 8 pixel) nên hay xuất hiện sự mất mát thôngtin trên vùng biên của các vùng (block) này Hiện nay người
ta đã giải quyết vấn đề này bằng cách làm trơn ảnh sau khibung nén để che lấp sự khác biệt của biên giới giữa cácblock Một hệ nén ảnh theo chuẩn JPEG cùng algorithm làmtrơn ảnh đã được công ty ASDG đưa ra trong hệ ArtDepartment Professional
3.2 JPEG-LS
LS-JPEG được phát triển như sự bổ sung muộn màng choJPEG vào năm1993, bằng cách sử dụng một kỹ thuật khácnhau từ tiêu chuẩn JPEG cũ Nó sử dụng 1 hệ thống dự báođược sắp xếp dựa trên ba điểm lân cận (upper, leftandupper-left) và entropy mã hóa dựa trên các lỗi dự báo
Tiêu chuẩn JPEG-LS sử dụng mã hóa ảnh tĩnh liên tục khôngtổn thất (lossless) và tổn thất ít (nearlossless) dựa trên mãhóa tiên đoán và mã hóa ngẫu nhiên, đã được công bố là tiêuchuẩn quốc tế ISO/IEC IS 14495-1|ITU-T RecommendationT.87
Trang 83.3 JPEG Search
Ngày nay, nhiều định dạng siêu dữ liệu khác nhau tồn tại đ
ể mô tả hình ảnh nhưng vẫn còn nhiều vấn đề trong khảnăng tương tác.Trong bối cảnh đó, trọng tâm chính của JPEGSearch là cung cấp một khả năng tương tác tốt hơn trong tìmkiếm hình ảnh Phiên bản hiện tại của dự án JPSearch đượcchia thành 5 phần chính:
trúc tổng thể của JP Search, một tập hợp lớn cáctrường hợp và phác thảo một kho phục hồi hình ảnh
và các thành phần của nó
Management of Metadata Schema): cố gắng vượt quanhững rắc rối trong mô hình siêu dữ liệu
Format): cung cấp một giao thức thông báo chuẩn đểkhôi phục hình ảnh
vào dữ liệu hình ảnh (JPEG và JPEG 2000)
Repositories)
3.4 JPEG XR
Là 1 định dạng hình ảnh cung cấp 1 số cải tiến so với JPEG:
trợ tỷ lệ nén cao hơn so với JPEG để mã hóa một hìnhảnh với chất lượng tương đương
- Hỗ trợ cấu trúc lát (Tile structure support)
Trang 93.5 JPEG 2000
Kỹ thuật nén JPEG sẽ làm mất thông tin lúc giải nén, càngnén với hệ số cao thì thông tin càng mất nhiều khi giải nèn.Công nghệ JPEG 2000 sẽ giải quyết vấn đề này Với JPEG
2000 kỹ thuật xử lý hình ảnh sẽ đạt được những kết quả rấtkhả quan vì có thể nén nhỏ từ 100-200 lần mà hình ảnhkhông sai sót bao nhiêu so với hình ảnh gốc JPEG 2000sửdụng mã hóa co giãn (scalable) ảnh tĩnh liên tục (từ có tổnthất đến không tổn thất) dựa trên biến đổi wavelet (một công
cụ xử lý tín hiệu rất thành công, đặc biệt là xử lý ảnh) Làmột tiện ích toán học cho phép mô tả bằng một công thứcđơn giản những gì xảy ra tại một thời điểm chính xác của tínhiệu Với một chuỗi sóng ngắn, chỉ cần biểu diễn bằng vàicông thức, đường biểu diễn không đều mà không cần phải
mô tả đặc tính của từng điểm một Và lẽ dĩ nhiên sẽ rất đắclực khi phân tích tỉ mỉ một file ảnh kỹ thuật số
Thuật toán trong kỹ thuật JPEG 2000 là chọn một số nhỏcác sóng ngắn, các sóng này được lập lại ở những nơi khácnhau, tỷ lệ khác nhau đã mô tả chính xác tín hiệu của hìnhảnh File ảnh nén không chứa nhiều hơn số lượng chỉ vị trí vàgiãn nở của từng sóng ngắn Và kỹ thuật mã hóa theo từngkhối, theo từng khu vực ưu tiên của hình ảnh (ROI -Regional
Of Interest) được áp dụng cũng là một tiến bộ đáng kể trongthuật toán mã hóa JPEG 2000
Tiêu chuẩn JPEG 2000 không chỉ cung cấp khả năng nénảnh với chất lượng và hiệu quả cao hơn hệ thống cơ bản JPEG
Trang 10mà nó còn có khả năng biểu diễn một ảnh với nhiều tínhnăng hơn, hỗ trợ trong cùng bit-stream (chuỗi bit được mãhóa hoặc giải mã một phần chứa đoạn mã hóa dữ liệu ngẫunhiên) đáp ứng được rất nhiều ứng dụng hiện có và ứng dụngmới.
Các đặc điểm nén ảnh JPEG-2000
với ảnh JPEG nén dựa trên DCT
- Phù hợp nén lũy tiến với kỹ thuật truyền dòng bit
phương pháp nén
II SƠ ĐỒ NÉN ẢNH JPEG CƠ BẢN (BASELINE JPEG), SỰ
KHÁC NHAU GIỮA SƠ ĐỒ JPEG VÀ SƠ ĐỒ NÉN JP-LS
1 Quá trình mã hóa và giải mã JPEG tuần tự
Các bước chủ yếu thực hiện nén ảnh:
- Xử lí màu chuyển về không gian màu YCbCr
- Ảnh đầu vào được phân chia thành các khối 8*8 để xử lí
- Thực hiện biến đổi Cosin (DCT) đối với mỗi khối và xử lí tuần tựcác khối
- Lượng tử hóa : Dùng bảng lượng tử
- Quá trình mã hóa :
Trang 11+ Thành phần DC: mã hóa dự đoán DPCM+ Thành phần AC sắp xếp lại theo zig-zag và mã hóa RLC,
mã hóa Huffman
- Ghép các khối tạo thành các dòng dữ liệu, dòng bit
Hình: Sơ đồ nén ảnh JPEG
1.1 Xử lý màu chuyền về không gian màu YcBCr
Bước tiền xử lý: Level Offset
- Để đơn giản việc thiết kế bộ mã hóa DCT
- Nếu dùng quá trình DCT cho các tín hiệu số thành phần Y, Cr,Cbthì các tín hiệu Cr,Cb có biên độ cực đại ±128 ( giá trị nhị phân trong hệthống lấy mẫu 8 bit), còn tín hiệu Y có một khoảng cực đại từ 0 đến 255giá trị nhị phân Để đơn giản việc thiết kế bộ mã hóa DCT, tín hiệu Yđược dịch mức xuống dưới bằng cách trừ 128 từ từng giá trị pixel trongkhối để có khoảng cực đại của tín hiệu giống như đối với các tín hiệu CR
và CB Ở phần giải mã DCT, giá trị này (128) được cộng vào các giá trịpixel chói Giá trị hệ số DC của khối DCT có một khoảng từ –1024 đến
1016 Đối với hệ số AC ( với u,v=1,2, ,7), C(u) và C(v)=1 và các giá trịcực đại của nó nằm trong khoảng ±1020 theo phương trình FDCT Khối8×8 các giá trị của hệ số DCT đưa ra 1 giá trị DC lớn (ví dụ =591), biểudiễn độ sáng trung bình của khối 8×8 và các giá trị rất nhỏ của các thànhphần tần số cao theo chiều ngang và chiều đứng
Bước tiên xử lý: Chuyển đổi không gian màu
- Biến đổi ảnh từ không gian màu RGB sang YCbCr : tăng thànhphần độ chói, giảm các thành phần màu sắc (mắt người nhạy cảm với độsáng hơn màu sắc ), sử dụng các công thức biến đổi :
Y‘ = 0.299*R' + 0.587*G' + 0.114*B‘
U‘ = -0.147*R' - 0.289*G' + 0.436*B' = 0.492*(B'- Y')
Trang 12V‘ = 0.615*R' - 0.515*G' - 0.100*B' = 0.877*(R'- Y')
R' = Y' + 1.140*V'G' = Y' - 0.394*U' - 0.581*V'B' = Y' + 2.032*U'
1.2 Ảnh đầu vào được phân thành các khối 8x8 để xử lý
Mục đích : Giảm thời gian tính toán cũng như làm tăng
khả năng chính xác khi tính toán Do các điểm ảnh lân cân có
độ tương quan cao, do đó phép biến đổi DCT cho từng khốinhỏ sẽ tập trung năng lượng vào một số ít các hệ biến đổi.Việc loại bỏ một số năng lượng thấp trong các khối chỉ tạo ramất mát thông tin cục bộ giúp nâng cao chất lượng ảnh
1.3 Biến đổi DCT
Vai trò : DCT (Discrete Cosine Transform) là phép biến đổi Cosin
rời rạc để chuyển tín hiệu từ miền không gian sang miền tần số
Đặc điểm của phép biến đổi này là tín hiệu ảnh trong miền không gian
chuyển sang miền tần số thì các thành phần DC và thành phần AC manghầu hết các thông tin chứa trong ảnh gốc Trong đó DC là thành phầnquan trọng nhất mang độ chói trung bình của ảnh, các thành phần ACchứa các thông tin chi tiết của ảnh Sau đó khi đi qua tầng lượng tử hóa,các hệ số ít quan trọng sẽ bị loại bỏ và chỉ giữ lại một số hệ số đầu tiêngọi là hệ số DCT Vai trò chủ yếu của phương pháp DCT là giảm độ dưthừa dữ liệu trong pixcel ở miền tần số cao ( bởi vì bất kì một giá trịpixcel nào đó cũng có thể dự đoán từ các giá trị pixcel lân cân của nó nênthông tin từ các pixcel tương đối nhỏ) Không những vậy, sau khi biếnđổi DCT thì hàm giải tương quan giảm đi một các đáng kể Chính vì vậy
mà hiệu suất nén đạt được tỉ số nén cao
Trang 13tín hiệu vào các thành phần có thành phần tần số tương ứng để lưu trữahoặc truyền dẫn tạo ) hoặc các giá trị thấp đối với các thành phần tần sốcao, nhờ đặc tính của mắt người, các hệ số DCT có thể mã hóa phù hợp.Chỉ các hệ số DCT quan trọng nhất mới được mã hóa và truyền đi DCTthuận kết hợp với video đầu vào được mãi hóa bằng các mẫu dài 8 bit.Nếu hệ số được lượng tử hóa bằng 11 bit thì nén sẽ tổn hao Sau khi thựchiện DCT năng lượng thấp sẽ tập trung chủ yếu ở miền tần số thấp.
Biến đổi DCT một chiều
+ N- số mẫu có trong tín hiệu
C ( k )={√12k=0
1 k ≠ 0
Biến đổi DCT 2 chiều
- Để tách tương quan nội dung ảnh cao hơn, mã hóa DCT 2 chiềuđược dùng cho các khối 8*8 giá trị điểm chói Quá trình biến đổi DCTtiến FDCT (forward DCT) dùng trong tiêu chuẩn JPEG được định nghĩanhư sau:
- Biến đổi DCT là một trong những công đoạn quan trọng trongJPEG Nhiệm vụ của nó là tập trung năng lượng vào một số các giá trị đểgiải tương quan tất nhất nhằm nâng cao tỉ số nén