Trong những năm gần đây với nhu cầu các dịch vụ dữ liệu trên mạng di động, nhất là dữ liệu đa phương tiện tăng nhanh dẫn đến nảy sinh nhiều vấn đề đặt như làm thế nào tìm được kỹ thuật mã hóa dữ liệu then chốt tăng hiệu quả để lưu trữ và truyền tải dữ liệu này một cách nhanh nhất. Trong đồ án này sẽ đi vào trình bày kỹ thuật nén ảnh tĩnh theo chuẩn nén JPEG được phát triển từ năm 1992. Nội dung chính của đồ án như sau:Chương 1: TỔNG QUAN VỀ XỬ LÝ ẢNH.Nội dung chính của chương nêu khái quát về lịch sử ra đời, phát triển của xử lý ảnh, một số khái niệm cơ bản có liên quan đến xử lý ảnh như là: điểm ảnh, màu, mức xám…. Dựa trên những khái niệm này để ta có thể tìm hiều sâu, phục vụ nghiên cứu cho quá trình nén ảnh. Có 4 cách tiếp cận cơ bản trong nén ảnh:•Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp. •Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh để tiến hành mã hóa.•Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không bảo toàn, dựa vào các phép biến đổi để nén dữ liệu. •Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sự lặp lại của các chi tiết.Nêu ra 1 số ứng dụng của xử lý ảnh trong đời sống hiện nay.Chương 2: CÁC KỸ THUẬT NÉN ẢNH. Nội dung chính của chương đi tìm hiểu về các kĩ thuật nén ảnh và tiêu chí để đánh giá chất lượng hình ảnh sau khi nén. Nêu ra một số khái niệm cơ bản như: điểm ảnh, mức xám, tỉ lệ nén ảnh,... Các hình thức phân loại phương pháp nén ảnh như:•Theo nguyên lí nén: Nén tổn hao Nén không tổn hao•Theo cách thực hiện nén: Phương pháp không gian Phương pháp sử dụng biến đổiNêu ra 1 số phương pháp nén không tổn hao, tổn hao như phương pháp mã hóa Huffman, phương pháp mã LZW (LempelZivWelch), phương pháp mã hóa RLC (Run Length Coding), phương dự đoán tổn hao và không tổn hao, ….Trong đó phương pháp dự đoán tổn hao khác với dự đoán không tổn hao là có thêm bộ lượng tử hóa, giá trị sai lệch giữa giá trị dự đoán với giá trị gốc sẽ được mã hóa entropi sau khi đã được lượng tử hóa và quá trình lượng tử hóa làm tổn hao dữ liệu. Đồng thời còn có phương pháp nén ảnh sử dụng biến đổi không gian tín hiệu, nguyên lý chung của các phương pháp nén này là sử dụng các phép biến đổi tuyến tính (như biến đổi Fourier, biến đổi DCT v.v.) để ánh xạ ảnh số sang không gian khác. Ngoài ra giới thiệu một vài tiêu chuẩn nén ảnh tĩnh và động hiện nay. Chương 3: PHƯƠNG PHÁP NÉN ẢNH TĨNH THEO CHUẨN JPEG.Nội dung chính của chương làm rõ quá trình thực hiện nén ảnh theo chuẩn nén JPEG. Cấu trúc chương gồm:Khái niệm về chuẩn nén JPEG:JPEG (Joint Photographic Expert Group ) được thành lập vào năm 1982. Năm 1986, JPEG chính thức được thiết lập nhờ sự kết hợp giữa nhóm ISOIEC và ITV. Chuẩn JPEG được ứng dụng để nén ảnh tĩnh đơn sắc và ảnh màu. Hệ số nén ảnh tĩnh theo phương pháp JPEG có thể đạt từ 10 – 50 (lần) mà không làm ảnh hưởng nhiều đến chất lượng hiển thị của ảnh. Ảnh màu được chia thành các ảnh đơn sắc sau đó qua biến đổi DCT, lượng tử hóa, mã hóa entropy và kết hợp với header tạo thành file ảnh nén theo chuẩn JPEG.Các bước tiến hành:•Chuyển đổi ảnh từ không gian màu RGB sang YCrCb, chia thành block 8x8•Biến đổi DCT•Lượng tử hóa•Quét ZigZag •Mã hóa Entropy•Ghi lại vào file jpegNén JPEG lũy tiếnChương 4: QUÁ TRÌNH THỰC HIỆN CHƯƠNG TRÌNH VÀ ĐÁNH GIÁ KẾT QUẢ.Nội dung chính của chương trình bày các bước tiến hành, thực hiện và đánh giá kết quả của chương trình nén ảnh JPEG.Sơ đồ khối cho quá trình nén ảnh của chuẩn nén JPEG.
Trang 1CÁC TỪ VIẾT TẮT
JPEG Joint Photographic Experts Group Tên của một tổ chức nghiên cứu về
các chuẩn nén ảnh
CCITT Consultative Committee for
International Telephone and Telegraph
CIF Common Intermediate Format
DCT Discrete Cosine Transform Biến đổi Cosine rời rạc
DPCM Differized Pulse Code Modulation Điều xung mã vi sai
GIF Graphics Interchange Format
ISDN Integrated Services Digital Network Mạng kỹ thuật số các dịch vụ tổng hợp
ISO International Organization for
Standardization
Tổ chức tiêu chuẩn hóa quốc tế
ITU International Telecommunication Union
Trang 2MPEG The Moving Picture Experts Group Tên viết tắt hội phim ảnh thế giới
NTSC National Television System Committee Ủy ban hệ thống truyền hình quốc gia
PAL Phase Alternative Line
PSNR Peak Signal to Noise Ratio Tỷ số tín hiệu đỉnh trên nhiễu
PSTN Public Switched Telephone Mạng chuyển mạch điên thoại công
cộng
QCIF Quarter Common Intermediate Format
SECAM Sequential Color with Memory
SQCIF Sub Quarter Common Intermediate
Format
SSIM The structural similarity Chỉ số tương quan cấu trúc
TIFF Tagged Image File Format
Trang 3CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH
1.1 Giới thiệu chương:
Nội dung chương đi vào tìm hiểu về lịch sử phát triển của xử lý ảnh, nghiên cứu giải thích và giới thiệu những vấn đề cơ bản liên quan đến xử lý ảnh như: khử nhiễu, chỉnh mức xám, trích chọn đặc trưng, nhận dạng, nén ảnh… Đồng thời nêu ra một số ứng dụngcủa xử lý ảnh phát triển trong đời sống của chúng ta
Nội dung chương bao gồm các phần:
• Lịch sử phát triển của xử lý ảnh
• Xử lý ảnh là gì
• Các vấn đề cơ bản trong xử lý ảnh
• Một số ứng dụng của xử lý ảnh
1.2 Lịch sử phát triển của xử lý ảnh:
Do nhu cầu phát triển dẫn đến nảy sinh nhiều vấn đề như làm thế nào để chất lượng ảnh được tốt hơn, giảm dung lượng ảnh làm khả năng truyền tải nhanh hơn, chỉnh biến dạng ảnh, khử vét bẩn trên ảnh… Vì vậy xử lý ảnh cần thiết phải ra đời nhằm giải quyết cho các vấn đề đó
Phương pháp xử lý ảnh bắt đầu từ hai ứng dụng chính: nâng cao chất lượng thông tinảnh và xử lý số liệu cho máy tính
Ứng dụng đầu tiên được biết đến là việc nâng cao chất lượng ảnh báo truyền từ London đến New York vào năm 1920 qua đường cáp Bartlane
• Mã hóa dữ liệu khôi phục ảnh
• Thời gian truyền ảnh từ 1 tuần 3 tiếng
Việc nâng cao chất lượng ảnh chính thức phát triển vào khoảng những năm 1955 vì sau thế chiến II máy tính phát triển tạo điều kiện cho quá trình xử lý ảnh số được thuận lợi
Từ năm 1960 trở về sau các phương tiện xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng và áp dụng rộng rãi trong đời sống thu được nhiều kết quả, đặc biệt đầu những năm 1970 xử lý ảnh phục vụ vào các ứng dụng ảnh trong các lĩnh vực
Trang 4như y học, địa chất, thiên văn học, khí tượng học… Đến nay xử lý ảnh đã có những bướctiến dài trong nhiều ngành khoa học từ những ứng dụng đơn giản đến phức tạp, các phương pháp và cách thức xử lý ảnh ngày càng được nghiên cứu, phát triển để phục vụ cho nhu cầu phát triển của khoa học, cuộc sống của loài người.
Sau đây là 1 vài hình ảnh minh họa cho thấy quá trình phát triển của xử lý ảnh:
Hình 1.1: Ảnh số được tạo từ băng mã hóa của 1 máy in điện tín, năm 1921 [5]
Hình 1.2: Ảnh số được tạo ra từ card đục lỗ sau 2 lần truyền qua Đại Tây Dương,
năm 1922 [5]
Hệ thống đầu tiên có khả năng mã hóa hình ảnh với mức xám là 5 và tăng lên 15 vào năm 1929
Trang 5Hình 1.3: Ảnh 15 cấp độ xám được truyền từ London đến New Yord, năm 1929 [5]
Vào 32/07/1964, ảnh đầu tiên của mặt trăng đưa về Trái Đất thông qua các máy chụptrên tàu vũ trụ Ranger 7 và được đưa đến phòng thí nghiệm Jet Pulsion ( Pasadena, California ) cho máy tính xử lý chỉnh méo
Hình 1.4: Ảnh mặt trăng đầu tiên, năm 1964 [5]
1.3 Xử lý ảnh là gì :
Mọi thông tin có trong môi trường sống của chúng ta được cảm nhận thông qua các giác quan, trong đó thị giác giữ vai trò quan trọng nhất Thị giác là cơ quan cảm nhận hình ảnh quang học tương đối hoàn hảo, cho phép con người cảm nhận được hình ảnh quang học trong thiên nhiên nhưng chỉ đối với sóng điện từ có bước sóng giới hạn nhất định mà ảnh đưa vào xử lý có thể được tạo ra bởi các nguồn bức xạ có phổ rộng hơn Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đó
Trang 6phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống Xử lý ảnh và đồ hoạđóng một vai trò quan trọng trong tương tác giữa người và máy.
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào qua khâu xử lý nhằm cho ra kết quả mong muốn Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận nào đó
Ảnh “Tốt hơn”
Ảnh Xử lý ảnh
Kết luận
Hình 1.5: Sơ đồ quá trình xử lý ảnh [2]
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như là đặc trưngcường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong không gian và nó có thể xem như một hàm n biến P(c1, c2, , cn) Do đó, ảnh trong xử lý ảnh cóthể xem như ảnh n chiều
Sơ đồ tổng quát của một hệ thống xử lý ảnh:
Hệ quyết định
Thu nhận ảnh Tiền xử Trích chọn Hậu xử So sánh
(Camera, Senser, Scanner) lý đặc trưng lý kết luận
Lưu trữ
Trang 7
Hình 1.6: Sơ đồ tổng quát của một hệ thống xử lý ảnh [2]
Các cấp độ trong xử lý ảnh:
• Level 0: Thu nhận ảnh, lấy mẫu, lượng tử hóa, nén
• Level 1: Tăng cường ảnh, khôi phục ảnh, phân đoạn ảnh
• Level 2: Trích chọn đặc trưng (khai thác và lựa chọn tính năng)
• Level 3: Tham số quyết định (công nhận và giải thích)
1.4 Các vấn đề cơ bản trong xử lý ảnh:
1.4.1 Một số khái niệm cơ bản:
Gốc của ảnh (trong tự nhiên) là ảnh liên tục về không gian và độ sáng Để xử lý bằngmáy tính, ảnh cần phải được số hóa Số hóa ảnh là sự biến đổi gần đúng 1 ảnh liên tục thành 1 tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng
Vì thế ta có:
• Điểm ảnh và ảnh: Điểm ảnh được xem như là đặc trưng cường độ sáng hay
1 dấu hiệu nào đó tại 1 toạ độ nào đó trong không gian của đối tượng vàảnh được xem như là 1 tập hợp các điểm ảnh
• Mức xám và màu: Là số các giá trị có thể có (độ sáng ) của các điểm ảnhcủa ảnh
1.4.2 Nắn chỉnh biến dạng:
Ảnh được thu nhận thông qua các thiết bị quang học và điện tử thường xuất hiện biến dạng, chính vì thế cần phải nén chỉnh ảnh thành ảnh tốt hơn
Trang 8Hình 1.7: (a) Ảnh thu nhận - (b) Ảnh mong muốn [2]
Trang 9Để cho → min :
Giải hệ phương trình tuyến tính tìm được: a1,b1,c1
Tương tự như trên tìm được: a2, b2, c2
⇒ Xác định được hàm f
1.4.3 Khử nhiễu:
Trong quá trình thu nhận ảnh thường xuất hiện nhiễu gây ảnh hưởng đến chất lượng ảnh
Có 2 loại nhiễu cơ bản:
• Nhiễu hệ thống: Là nhiễu xảy ra theo 1quy luật cụ thể do đó có thể khử bằngcác phép biến đổi
• Nhiễu ngẫu nhiên: Là những vết bẩn xuất hiện không rõ nguyên nhân do đóchỉ có thể khử bằng các phép lọc
1.4.4 Chỉnh mức xám:
Trong hệ thống thu nhận ảnh gây xuất hiện tính không đồng đều, để khắc phục thôngthường có 2 hướng tiếp cận:
Trang 10• Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau thànhmột bó, trường hợp chỉ có 2 mức xám thì chính là chuyển về ảnh đen trắng.Ứng dụng: In ảnh màu ra máy in đen trắng
• Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹthuật nội suy Kỹ thuật này nhằm tăng cường độ mịn cho ảnh
• Đặc trưng về biên và đường biên: Rất hữu ích trong việc trích chọn các thuộctính bất biến được dùng khi nhận dạng đối tượng, các đặc trưng có thể đượctrích chọn nhờ toán tử gradient, toán tử la bàn, toán tử Laplace, toán tử “chéokhông” (zero crossing) v.v Việc trích chọn hiệu quả các đặc trưng giúp choviệc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dunglượng nhớ lưu trữ giảm xuống
1.4.6 Nhận dạng:
Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại và phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng trong nhiềungành khoa học khác nhau Tuy nhiên, một câu hỏi đặt ra là: mẫu (pattern) là gì?
Watanabe, một trong những người đi đầu trong lĩnh vực này đã định nghĩa: “Ngược lại
Trang 11với hỗn loạn (chaos), mẫu là một thực thể (entity), được định nghĩa một cách mơ hồ (vaguely defined) và có thể gán cho nó một tên gọi nào đó” Ví dụ mẫu có thể là ảnh của vân tay, ảnh của một vật nào đó được chụp, một chữ viết, khuôn mặt người hoặc
một ký đồ tín hiệu tiếng nói Khi biết một mẫu nào đó, để nhận dạng hoặc phân loại mẫu đó có thể:
Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích phân biệt (discriminant analyis), trong đó mẫu đầu vào được định danh như một thành phần của một lớp đã xác định
Hoặc phân loại không có mẫu (unsupervised classification hay clustering) trong đó các mẫu được gán vào các lớp khác nhau dựa trên một tiêu chuẩn đồng dạng nào đó Các lớp này cho đến thời điểm phân loại vẫn chưa biết hay chưa được định danh
Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn chủ yếu sau đây:
1. Thu nhận dữ liệu và tiền xử lý
2. Biểu diễn dữ liệu
3. Nhận dạng và ra quyết định
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
1. Đối sánh mẫu dựa trên các đặc trưng được trích chọn
2. Phân loại thống kê
3. Đối sánh cấu trúc
4. Phân loại dựa trên mạng nơ-ron nhân tạo
Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cận đơn lẻ để phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương pháp và cách tiếp cận khác nhau Do vậy, các phương thức phân loại tổ hợp hay được sử dụng khi nhận dạng vànay đã có những kết quả có triển vọng dựa trên thiết kế các hệ thống lai (hybrid system) bao gồm nhiều mô hình kết hợp
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy sinh trong cuộc sống không chỉ tạo ra những thách thức về thuật giải, mà còn đặt ra những yêu cầu về tốc
độ tính toán Đặc điểm chung của tất cả những ứng dụng đó là những đặc điểm đặc trưng
Trang 12cần thiết thường là nhiều, không thể do chuyên gia đề xuất, mà phải được trích chọn dựa trên các thủ tục phân tích dữ liệu.
1.4.7 Nén ảnh:
Nhằm giảm thiểu dung lượng của ảnh, thường được tiến hành theo cả hai khuynh hướng là nén có tổn hao và không tổn hao thông tin Nén tổn hao có khả năng nén cao nhưng khả năng phục hồi thì kém hơn nén không tổn hao Trên cơ sở hai khuynh hướng trên, có 4 cách tiếp cận cơ bản trong nén ảnh:
• Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất hiệncủa giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp.Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF
• Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểmảnh, lợi dụng sự giống nhau của các điểm ảnh trong các vùng gần nhau để tiếnhành mã hóa Ví dụ cho kỹ thuật này là mã nén *.PCX
• Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nénkhông bảo toàn, do vậy kỹ thuật thường nén hiệu quả hơn *.JPG chính là tiếpcận theo kỹ thuật nén này
• Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sựlặp lại của các chi tiết Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốcảnh và quy luật sinh ra ảnh theo nguyên lý Fractal
1.5 Một số ứng dụng của xử lý ảnh:
Xử lý ảnh vệ tinh, ảnh viễn thám
Thiên văn, nghiên cứu không gian, vũ trụ
Thăm dò địa chất
Robot, tự động hóa
Lĩnh vực y tế
• Ảnh tia X quang
Trang 13• Ảnh trong dãi cực tím
• Ảnh Gamma
• Lĩnh vực giám sát, an ninh, phát hiện chuyển động
• Nhận dạng dấu vân tay
Trang 14• Nhận dạng chữ viết
• Nhận dạng khuôn mặt
Trang 15• Nhận dạng mắt
• Lĩnh vực khí tượng
Trang 161.6 Kết luận chương:
Qua những kiến thức vừa nêu ở trên, chúng ta có thể khái quát phần nào về lĩnh vực
xử lý ảnh cũng như những vấn đề đặt ra xoay quanh nó Đồng thời xử lý ảnh được ứng dụng rất nhiều vào trong thực tế phục vụ cho nhu cầu phát triển của đời sống con người,trong đó nén ảnh là một phần của quá trình xử lý ảnh nhưng cũng là yếu tố quan trọng giúp giải quyết cho việc lưu trữ và truyền tải hình ảnh được thực hiện tốt hơn Nén ảnh còn có nhiều vấn đề cần được tìm hiểu, nên chương tiếp theo sẽ nêu lên một số phương pháp nén ảnh cụ thể
CHƯƠNG 2: CÁC KỸ THUẬT NÉN ẢNH
2.1 Giới thiệu chương:
Chương này chúng ta sẽ đi vào tìm hiểu về nén ảnh, phân loại nén ảnh, các phương pháp nén, yếu tố liên quan và 1 vài tiêu chuẩn nén ảnh có mặt hiện nay
Nội dung chương bao gồm các phần:
Trang 17• Khái quát về kỹ thuật nén ảnh.
• Cách phân loại các kỹ thuật nén ảnh
• Tiêu chí đánh giá chất lượng hình ảnh
• Mô hình hóa hệ thống nén ảnh
• Các phương pháp nén ảnh không tổn hao
• Các phương pháp nén ảnh có tổn hao
• Các chuẩn nén ảnh tĩnh và động hiện nay
2.2 Khái quát về kỹ thuật nén ảnh:
2.2.1 Giới thiệu về nén ảnh:
Nén ảnh là một kỹ thuật mã hóa các ảnh số hóa nhằm mục đích giảm số lượng các bit
dữ liệu cần thiết để biểu diễn ảnh
Mục đích là làm giảm đi những chi phí trong việc lưu trữ ảnh và thời gian để truyền ảnh đi xa, nhanh trong truyền thông nhưng vẫn đảm bảo được chất lượng của hình ảnh.Nén ảnh thực hiện được do thông tin trong bức ảnh không phải xuất hiện ngẫu nhiên
mà có trật tự, có tổ chức vì thế khi phân tách được tính trật tự, tính tổ chức đó thì sẽ biết phân biệt được phần thông tin nào quan trọng nhất trong bức ảnh để biểu diễn và truyền
đi với số lượng ít bit hơn so với ảnh gốc Còn ở bên nhận là quá trình ngược lại nó sẽ giải
mã, tổ chức, sắp xếp lại cho ra bức ảnh xấp xỉ chính xác gần với ảnh gốc nhưng vẫn thỏa mãn yêu cầu về chất lượng
Phương pháp nén hiệu quả nhất thông thường sử dụng các biến đổi toán học để biến
ma trận các điểm ảnh từ không gian hai chiều này sang một không gian hai chiều khác, nơi mức độ tương quan giữa các hệ số biến đổi mới nhỏ hơn
Nén ảnh có rất nhiều ứng dụng trong thực tế như: truyền các văn bản đồ họa qua đường điện thoại (Fax), nén ảnh trong y tế và truyền hình cáp, nén ảnh để giảm không gian lưu trữ, tăng tốc độ truyền tải… Chính vì khả năng ứng dụng trong nhiều lĩnh vực cùng với sự tiến bộ của lĩnh vực vi điện tử dẫn đến sự ra đời của các tiêu chuẩn nén ảnh
Các kỹ thuật nén ảnh ra đời hướng tới giải quyết bài toán làm giảm thiểu khối lượng thông tin mô tả ảnh số mà chất lượng vẫn tốt, nền tảng của quá trình nén là loại bỏ dư thừa có trong tín hiệu Độ dư thừa trong tín hiệu ảnh số phụ thuộc vào mức độ tương quan giữa các điểm ảnh, độ tương quan lớn thì độ dư thừa cũng lớn
Trang 18Các loại dư thừa :
• Dư thừa thông tin về không gian: trong một bức ảnh luôn tồn tại sự tươngquan giữa các điểm ảnh cạnh nhau
• Dư thừa thông tin về cấp xám: là dư thừa dựa vào sự tương quan giữa các màusắc cạnh nhau
• Dư thừa thông tin về thời gian: trong một chuỗi ảnh video, tồn tại sự tươngquan giữa các điểm ảnh của các frame khác nhau
Nén ảnh là lĩnh vực nghiên cứu khá lâu đời Thời gian đầu, các nghiên cứu đi theo hướng xử lý tín hiệu video tương tự, nhằm nén "bề rộng phổ" của tín hiệu này Nén videotrong những năm 1950 được thực hiện bằng công nghệ tương tự có tỷ số nén thấp Các hệtruyền hình tương tự NTSC, PAL, SECAM sử dụng kỹ thuật nén tín hiệu video bằng cách giảm độ rộng băng tần thành phần màu so với thành phần chói Ví dụ trong hệ NTSC thành phần màu I và Q có bề rộng phổ 1.3 MHz và 0.6 MHz, bề rộng phổ thành phần chói là 4.2 MHz
Sự phát triển của kỹ thuật số và việc sử dụng công nghệ số vào kỹ thuật truyền hình làm cho khái niệm “nén video” trở thành đề tài nóng hổi trong những năm gần đây Như chúng ta đã biết, tiêu chuẩn định dạng video thành phần 4:2:2 (CCIR-601) với quy định
bề rộng băng tần tín hiệu chói và màu là 5.75 MHz và 2.75 MHz (± 0.1 dB) Sau khi số hóa với tần số lấy mẫu tiêu chuẩn 13.5 MHz (cho kênh chói), tốc độ bit tổng cộng của tín hiệu chói và màu là 270 Mbps Dòng dữ liệu video số có tốc độ cao như trên không thể được truyền qua vệ tinh với độ rộng dải tần mỗi kênh 27 MHz hoặc qua hệ thống truyền hình quảng bá trên mặt đất với quy định 7÷8 MHz cho một kênh truyền hình tiêu chuẩn
Do vậy, nén tín hiệu video là công đoạn không thể thiếu để khắc phục được những khó khăn trên Từ những năm 1980, các nhà khoa học đã đạt được những thành tựu quan trọng trong việc nén tín hiệu video và audio Có rất nhiều hãng sản xuất thiết bị nén tín hiệu video, chủ yếu các thiết bị này làm việc với hai định dạng nén được coi là tiêu chuẩn
là JPEG (Joint Photographic Experts Group) – áp dụng cho ảnh tĩnh và MPEG (Moving Picture Experts Group) - áp dụng cho ảnh động
2.2.2 Một số khái niệm cơ bản :
Trang 19• Điểm ảnh (Picture Element): Điểm ảnh được xem như là đặc trưng cường độ sánghay 1 dấu hiệu tại 1 toạ độ nào đó trong không gian của đối tượng Như vậy mộtảnh là một tập hợp các điểm ảnh, mỗi điểm ảnh gồm một cặp tọa độ (x,y) vàmàu.Cặp tọa độ (x,y) tạo nên độ phân giải(resolution).
• Mức xám (Graylevel): Mức xám là kết quả của sự mã hóa tương ứng của mỗicường độ sáng của mỗi điểm ảnh với một giá trị số ( kết quả của quá trình lượng
• Tỷ lệ nén: Là 1trong các đặc trưng quan trọng của mọi phương pháp nén
Tỷ lệ nén =
Với r là tỷ số nén , r =
Như vậy hiệu suất nén = (1-Tỷ lệ nén)*100%
2.3 Phân loại các phương pháp nén ảnh:
Có 2 hình thức phân loại nén ảnh :
• Phân loại theo nguyên lý nén:
• Nén không tổn hao (lossless data reduction): Là phương pháp nén mà sau khigiải nén thu được chính xác dữ liệu gốc nhưng tỷ lệ nén thấp
• Nén có tổn hao (loss data reduction): Là phương pháp nén mà sau khi giải nén
sẽ không thu được dữ liệu giống như bản gốc nhưng tỷ lệ nén cao
• Phân loại theo cách thực hiện nén:
Trang 20• Phương pháp không gian (Spatial Data Compression): Các phương pháp nénbằng cách tác động trực tiếp lên điểm ảnh.
• Phương pháp sử dụng biến đổi (Transform Coding): Phương pháp nén sử dụngcác phép biến đổi không gian, quá trình nén được thực hiện bằng cách tác độnglên ảnh biến đổi
2.4 Tiêu chí đánh giá chất lượng hình ảnh:
Quá trình nén ảnh thường đi đôi với việc ảnh nén bị biến dạng so với ảnh gốc Vì vậy, cần xác định tiêu chí và phương pháp đánh giá một cách khách quan lượng thông tin
về ảnh đã bị mất đi sau khi nén Có thể đánh giá mức độ sai số giữa hai ảnh thông qua mức sai lệch trung bình bình phương - RMS (Root Mean Square)
Cho f(x,y) là ảnh gốc, f(x,y) là ảnh khôi phục sau khi nén dẫn đến khác biệt tuyệt đốigiữa hai ảnh là:
e(x,y) = f(x,y) – f(x,y) [1] (2.1)
Sai số trung bình bình phương được tính theo công thức sau:
Thông thường, khi giá trị RMS thấp, chất lượng ảnh nén sẽ tốt Tuy nhiên, trong một số trường hợp chất lượng hình ảnh nén không nhất thiết phải tỷ lệ thuận với giá trị RMS
Trang 21Một phương pháp đánh giá chất lượng ảnh nén khác dựa trên tỷ lệ tín hiệu/nhiễu được tính theo công thức sau:
SNR (Signal to Noise Ratio) - tỷ lệ tín hiệu/ nhiễu
Trên thực tế chất lượng hình ảnh phụ thuộc rất nhiều vào cảm nhận tâm sinh lý của con người Các thông số nêu trên chỉ cho phép đánh giá chất lượng ảnh nén một cách gầnchính xác Trong đồ án này sử dụng một thông số đánh giá dựa vào cấu trúc của ảnh nén sao với ảnh gốc, là thông số SSIM
SSIM(structural similarity) là phương pháp đo lường sự giống nhau giữa hai hình ảnh Chỉ số SSIM một số liệu tham khảo đầy đủ, nói cách khác việc đo đạc chất lượng của hình ảnh dựa trên một hình ảnh không nén hay biến dạng ban đầu như một sự tham khảo SSIM được thiết kế để cải thiện những phương pháp so sánh truyền thống như PSNR và MSE, những phương pháp đã được chứng minh là không phù hợp với nhận định của mắt người
Sự khác biệt đối với các kỹ thuật khác được đề cập trước đây như MSE hoặc PSNR
là phương pháp so sánh này ước tính các lỗi nhận thức, mặc khác SSIM xem xét sự suy thoái hình ảnh qua việc thay đổi trong thông tin về cấu trúc của 2 hình ảnh
Chỉ số SSIM được tính toán trên các cửa sổ khác nhau của hình ảnh Tiêu chuẩn đánh giá giữa hai cửa sổ x và y có chung kích thước NxN là:
Trang 22Trong đó:
µx là trung bình của x
µy là trung bình của y
là phương sai của x
là phương sai của y
là hiệu phương sai của x và y
c1 =(k1*L)2, c2=(k2*L)2 là 2 biến để làm ổn định sự phân chia với mẫu số yếu
k 1 = 0.01 và k 2 =0.03 được cho bởi định nghĩa
Trang 23Gồm các bộ phận chức năng sau:
• Bộ chuyển đổi: thường dùng các phép biến đổi không gian để chuyển ảnhtrong không gian thực sang một không gian khác, nơi các hệ số chuyển đổi cómức độ tương quan thấp hơn Kết quả nhận được là ma trận các hệ số biếnđổi
• Bộ lượng tử hoá: sử dụng phương pháp lượng tử không đồng đều nhằm triệttiêu các hệ số biến đổi có năng lượng thấp hoặc đóng vai trò không quan trọngkhi khôi phục ảnh Quá trình lượng tử không có tính thuận nghịch: ảnh khôiphục sẽ bị biến dạng so với ảnh gốc
• Bộ mã hoá: gán một từ mã (một dòng bit nhị phân) cho một mức lượng tử
2.5.2 Bộ giải mã nguồn:
Sơ đồ khối:
Ảnh Bộ giải Bộ chuyển Ảnh
nén mã đổi giải nén
Hình 2.2: Sơ đồ khối giải mã nguồn [1]
Gồm các bộ phận chức năng sau:
• Bộ giải mã thực hiện giải mã tín hiệu nhận được để cho ra ma trận các hệ sốcủa ảnh biến đổi
Trang 24• Bộ chuyển đổi thực hiện biến đổi nghịch (so với quá trình biến đổi ở bộ mãhóa) để khôi phục lại ảnh số ban đầu.
2.6 Các phương pháp nén không tổn hao:
Có nhiều ứng dụng về nén ảnh tín hiệu cần phải được nén không làm mất mát thông tin, ví dụ như khi nén các file chương trình trong máy tính hay nén những hình ảnh nhận được từ các thiết bị khảo sát vũ trụ do vệ tinh gởi về ( những ảnh này thường có giá trị sử dụng cao cần được giữ nguyên chất lượng ban đầu) Đồng thời còn có các phương pháp nén tổn hao thường có hiệu quả nén cao hơn rất nhiều so với nén không tổn hao Đặc điểm của các phương pháp nén này là hiệu quả nén càng cao thì mức độ tổn hao càng lớn,nói cách khác chất lượng ảnh nén sẽ giảm đi khi hệ số nén tăng lên Một số phương pháp nén ảnh có tổn hao có thể đạt hệ số nén tới 100 lần trong khi chất lượng ảnh nén vẫn còn chấp nhận được Cần chú ý rằng hệ số nén cũng như chất lượng ảnh nén trong trường hợpnén tổn hao phụ thuộc tương đối nhiều vào tính chất của hình ảnh gốc
Sau đây chúng ta phân tích một số phương pháp nén ảnh không tổn hao và tổn hao tiêu biểu :
2.6.1 Phương pháp mã hóa Huffman:
Phương pháp mã hóa Huffman là phương pháp giảm dư thừa thống kê, dựa vào mô hình thống kê của tín hiệu Phân tích dữ liệu gốc, người ta tính tần suất xuất hiện của các
ký tự Các ký tự có tần suất cao nhất sẽ được mã hóa bằng từ mã ngắn nhất và ngược lại Tóm lại, với cách mã hóa trên, chúng ta đã làm giảm chiều dài trung bình của từ mã đượcdùng để mã hóa dữ liệu
2.6.2 Phương pháp mã LZW (Lempel-Ziv-Welch):
Đây là phương pháp mã hóa từ điển, quá trình mã hóa được thực hiện bằng cách thaychuỗi dữ liệu gốc có độ dài khác nhau bằng từ mã có độ dài cố định Khác với mã
Huffman, kỹ thuật LZW không cần biết tần suất của các ký tự trong tín hiệu gốc
Để mã hóa theo phương pháp LZW, chuỗi dữ liệu phải được đưa vào tra cứu trong
"từ điển" để tìm ra mã tương ứng với nó "Từ điển" được hình thành ngay trong quá trình
Trang 25mã hóa Ví dụ: khi nén ảnh đen-trắng được mã hóa bằng 8 bits/pixel, từ điển được khởi tạo bao gồm 256 từ tương ứng với các mức chói 0,1,2…255 Sau đó, coder sẽ phân tích lần lượt chuỗi ký tự (mức xám) liên tiếp trong dữ liệu nguồn, khi phát hiện trong từ điển không có chuỗi ký tự tương đương, coder sẽ ghi chuỗi ký tự liên tiếp đó vào vị trí còn trống của từ điển Ví dụ: nếu hai điểm ảnh đầu tiên có giá trị 255, thì chuỗi 255-255 sẽ được ghi vào vị trí thứ 256, sau đó tổ hợp 255-255 có thể được truyền đi với từ mã là
256 Như vậy thay vì truyền hai ký tự có 16 bits, ta chỉ cần truyền đi từ mã 9 bits "Từ điển" bao gồm các từ mã 9 bits có thể lưu được 512 từ mã Có thể thấy rằng, khi "từ điển"quá nhỏ, số lượng chuỗi ký tự được mã hóa sẽ ít, ngược lại khi "từ điển" quá lớn từ mã sẽcó độ dài lớn do đó hiệu quả nén cũng bị giảm Cần lưu ý rằng, "từ điển" sử dụng khi mã hóa không cần phải chuyển sang phía giải mã, trong quá trình giải mã LZW, "từ điển" này sẽ được khôi phục tự động Giải thuật nén LZW thường được sử dụng cho các loại ảnh nhị phân Chuẩn nén này được sử dụng để tạo ra các dạng ảnh GIF và TIFF
2.6.3 Phương pháp mã hóa RLC (Run Length Coding):
Kỹ thuật mã hóa RLC được pháp triển ban đầu để nén ảnh nhị phân như ảnh scan từ văn bản, ảnh nhận được từ máy Fax Kỹ thuật nén này dựa trên nguyên lý tìm trong tín hiệu số nhị phân chuỗi bít "1" hoặc "0" liên tiếp, sau đó mã hóa chuỗi đó bằng hai thông số: giá trị bit lặp và số lượng bít lặp (chiều dài chuỗi) Đôi khi, để nâng cao hiệu quả nén, giá trị chiều dài các chuỗi có thể được mã hóa bằng mã có chiều dài thay đổi (ví dụ mã Huffman) Chiều dài chuỗi bits trong ảnh nhị phân đôi khi có thể lớn hơn 255 Vì thế, để có thể dùng 1 byte để mã hóa giá trị số bit lặp lại, người ta hạn chế chiều dài chuỗi bằng
255 Phương pháp nén RLC được sử dụng để lưu trữ các ảnh Bitmap theo dạng PCX, BMP
2.6.4 Phương pháp mã hóa theo vùng đồng trị:
Ảnh gốc được chia thành nhiều khối nhỏ có kích thước mxn pixel Chúng ta phân biệt ba loại khối ảnh: khối toàn màu trắng, toàn màu đen và khối có độ sáng hỗn hợp Sauđó, các khối ảnh có tần suất cao được mã hóa với từ mã ngắn nhất, ví dụ từ mã "0" Hai khối còn lại được mã hóa bằng từ mã 2 bits: "01" và "10" Như vậy, thay vì phải truyền đigiá trị mxn điểm ảnh trong mỗi khối, với khối toàn trắng và toàn đen ta chỉ cần truyền đi các từ mã có độ dài 1 hoặc 2 bits
Trang 262.6.5 Phương pháp mã dự đoán không tổn hao:
Phương pháp mã hóa này dựa trên tính tương quan giữa hai điểm ảnh nằm kề nhau, kỹ thuật tách và truyền thông tin "mới" chứa trong mỗi pixel ảnh Theo những nghiên cứu thống kê về phân bố biên độ tín hiệu video, mức độ tương quan giữa các điểm ảnh nằm gần nhau trong miền không gian là khá cao, điều này có nghĩa là sự khác biệt giữa hai điểm ảnh kế bên rất nhỏ hoặc bằng 0, vì thế khi mã hóa độ chênh lệch này cần số lượng bit ít hơn so với khi mã hóa toàn bộ biên độ các mẫu
Thông tin "mới" trong điểm ảnh được xác định bằng hiệu giữa điểm ảnh thực và điểm ảnh dự đoán Phương pháp mã dự đoán còn gọi là điều xung mã vi sai DPCM Trong bộ mã hóa DPCM cũng sử dụng thêm các kỹ thuật lượng tử hóa thích nghi và mã hóa entropy để tăng hệ số nén Các thành phần chính của hệ thống DPCM được mô tả trên hình 2.3
(a)
(b)Hình 2.3: Sơ đồ khối bộ mã hóa (a) và giải mã (b) DPCM [1]
Trong thành phần bộ mã hóa và giải mã đều có khối dự đoán Khi một mẫu fn của ảnh được đưa tới bộ mã hóa, khối dự đoán sẽ thực hiện xấp xỉ giá trị mẫu ảnh đó dựa trênthông tin đã có về các điểm ảnh trước Sau đó giá trị xấp xỉ được làm tròn fn và đưa tới mạch trừ để tìm ra sai số giữa điểm ảnh thực và điểm ảnh dự đoán:
Trang 27e n = f n - [1] (2.5)
Giá trị sai số en (thường là nhỏ) được mã hóa bằng mã có độ dài thay đổi (mã
Entropy) trước khi đưa vào đường truyền
Ở phía thu, sau khi dữ liệu nén được giải mã Entropy, giá trị sai số en được đưa tới bộ
dự đoán để khôi phục giá trị điểm ảnh fn:
f n = + e n[1] (2.6)
Để có được giá trị n dựa trên các mẫu tới trước, có thể sử dụng các phương pháp xấp
xỉ cục bộ, toàn cục hoặc phương pháp thích nghi Thông thường, được xác định dựa trên giá trị của m mẫu đến trước như sau:
Trong đó : α - hệ số dự đoán với i = 1, 2,…,m
Round() - toán tử làm tròn tới số nguyên gần nhất
2.7 Các phương pháp nén có tổn hao:
2.7.1 Phương pháp mã hóa dự đoán có tổn hao:
Sơ đồ khối của bộ mã hóa dự đoán có tổn hao (hình 2.4) khác với bộ mã hóa không tổn hao do có thêm bộ lượng tử hóa Quá trình lượng tử hóa sẽ làm tròn giá trị n e tới mức lượng tử gần nhất là n e Hiệu quả nén của hệ thống mã hóa và sai số giữa ảnh nén
và ảnh gốc sẽ phụ thuộc vào số mức lượng tử được sử dụng trong coder
Trang 28Để kết quả dự đoán ở coder và decoder như nhau, các mẫu tới trước dùng để dự đoántại coder phải chứa cả thành phần sai số do lượng tử hóa tạo ra vì sai số này tồn tại trong tín hiệu đưa tới bộ dự đoán trong decoder:
n = n + [1] (2.8)
Với cũng được sấp xỉ theo công thức (2.7)
Trong bộ giải mã, giá trị các điểm ảnh giải nén cũng được xác định bởi (2.8)
(a)
(b)Hình 2.4: Sơ đồ khối bộ mã hóa (a) và giải mã (b) dự đoán có tổn hao [1]
2.7.2 Phương pháp nén sử dụng phép biến đổi không gian tín hiệu:
Trang 29Trong phần này chúng ta sẽ phân tích kỹ thuật nén ảnh số sử dụng các phép biến đổi không gian tín hiệu, nguyên lý chung của kỹ thuật nén này là sử dụng các phép biến đổi tuyến tính (như biến đổi Fourier, biến đổi Cosin, biến đổi DCT - Discrete Cosine
Transform v.v.) để ánh xạ ảnh số sang không gian khác Tập hệ số kết quả của các biến đổi tuyến tính sau đó được lượng tử hóa và mã hóa Ưu điểm quan trọng của các phép biến đổi là các hệ số khai triển thường có mức tương quan nhỏ hơn so với mức độ tương quan giữa các điểm ảnh trong không gian thực Ngoài ra, phần lớn năng lượng của tín hiệu tập trung tại các hệ số nằm trong miền tần số thấp Quá trình nén dữ liệu có thể đượcthực hiện trong giai đoạn lượng tử hóa: khi lựa chọn mức lượng tử tương đối lớn, các hệ số biến đổi có năng lượng nhỏ (thường nằm ở miền tần số cao) sẽ bị loại bỏ bớt Ảnh nén nhìn chung sẽ không hoàn toàn giống được ảnh gốc, tuy nhiên có thể dự đoán rằng, ảnh hưởng của các thành phần cao tần bị loại bỏ thường không lớn, do đó chất lượng ảnh hầu như không bị thay đổi kể cả khi tín hiệu bị nén khá nhiều Hình 2.5 mô tả sơ đồ khối tổngquát hệ thống nén ảnh sử dụng phép biến đổi không gian Coder thực hiện bốn bước cơ bản: 1- Chia ảnh thành các block (để tiện xử lý trong máy tính, các block thường có kích thước 8x8 pixel), 2- Thực hiện phép biến đổi với từng block, 3- Lượng tử hóa các hệ số biến đổi, 4- Mã hóa Decoder thực hiện quá trình biến đổi ngược lại (ngoài việc lượng tử hóa)
Ảnh Chia khối Biến đổi Lượng tử Mã hóa Ảnh
số kích thước n*n thuận hóa Entropy nén
(a)Ảnh Giải mã Biến đổi Tập hợp các Ảnh
Nén Entropy nghịch khối ảnh giải nén
Trang 302.8.1 Các chuẩn nén ảnh tĩnh:
Hiện nay trong lĩnh vực ảnh số có khá nhiều chuẩn nén đang được sử dụng Một số định dạng nén không tổn hao được hầu hết các phần mềm xử lý ảnh số chuyên nghiệp như Photoshop (hãng Adobe Systems) hay Photo Paint (Corel Corp.) hỗ trợ là: BMP, PCX, GIF, TIFF… Tuy nhiên như đã phân tích ở trên, các chuẩn nén không tổn hao thường có hệ số nén rất thấp, do đó chúng chỉ được sử dụng để nén ảnh có kích thướng nhỏ Phương pháp nén ảnh có tổn hao được sử dụng rộng rãi vì có hiệu quả nén cao hơn nhiều so với nén không tổn hao Hai phương pháp nén đáng chú ý nhất hiện nay đều dựa trên các phép biến đổi không gian, đó là phương pháp nén theo JPEG và nén ảnh sử dụngbiến đổi Wavelet (Wavelet transform) Cả hai phương pháp nén nói trên có hiệu quả nén rất cao, tuy nhiên, chuẩn nén JPEG được sử dụng rộng rãi hơn Tiêu chuẩn nén JPEG được hỗ trợ trong nhiều chương trình xử lý ảnh, trên các web browser; kỹ thuật nén JPEGcòn được tích hợp trong các hệ thống nén ảnh động MPEG, là chuẩn nén thông dụng cho tín hiệu truyền hình số hiện nay
2.8.2 Các chuẩn nén ảnh động:
2.8.2.1 Chuẩn nén H.261 và H.263:
Chuẩn H.261 ITU (CCITT) H.261 được phát triển để nén tín hiệu hình ảnh cho dịch vụ truyền hình hội nghị và video phone qua đường truyền ISDN ở tốc độ px64kbps (p=1 30) Trên đường truyền 64kbps, luồng 48kbps dùng để truyền tín hiệu video,
16kbps – dành cho audio Kỹ thuật nén ảnh được sử dụng trong chuẩn H.261 sẽ làm nền tảng cho các chuẩn nén sau này như MPEG 1, 2
Trong chuẩn nén H.261 có sử dụng các kỹ thuật nén trong ảnh dựa trên biến đổi DCT, nén liên ảnh với bộ bù chuyển động H.261 hỗ trợ hai độ phân giải CIF (Common Intermediate Format) và QCIF (Quarter Common Intermediate Format) Phương pháp lấymẫu tín hiệu chói và màu: YCbCr 4:2:0
Đây là chuẩn nén được cải tiến từ H.261 tạo ra luồng video tốc độ thấp, có thể truyềntrên mạng điện thoại công cộng PSTN Chuẩn nén H.263 được công nhận năm 1996 Giống như H.261, H.263 sử dụng biến đổi DCT cho quá trình nén trong ảnh và ảnh sai số(là hiệu của ảnh gốc và ảnh nén) Chuẩn H.263 hỗ trợ các độ phân giải SQCIF, QCIF, CIF,4 CIF và 16CIF
Trang 31Format Video Resolution
2.8.2.2 Chuẩn nén MPEG:
MPEG là chuẩn mở rộng của JPEG Theo chuẩn này, ảnh động được tạo ra từ chuỗi các ảnh tĩnh có thể được nén trong ảnh bằng phương pháp JPEG MPEG chỉ thực hiện nén dữ liệu trong mỗi ảnh nên hiệu quả nén thấp hơn so với các phương pháp nén ảnh động khác Hệ số nén đạt được khi nén ảnh động theo phương pháp MPEG phụ thuộc vàochất lượng ảnh nén: tín hiệu video nén MPEG chất lượng cao (dùng trong studio) thường có tốc độ dòng bits trên 24 Mbit/s Khi tỷ số nén quá cao, trong ảnh nén sẽ bị "vỡ" thành các ô vuông có kích thước 8x8 pixel còn gọi là artefact Vì các ảnh được mã hóa độc lập với nhau nên quá trình ghép cảnh khi dàn dựng trong studio sẽ có độ chính xác tới từng ảnh Đây chính là điểm mạnh của chuẩn nén MPEG Kỹ thuật nén ảnh MPEG được sử dụng rộng rãi trong công nghệ sản xuất chương trình truyền hình, tạo kỹ xảo, trong các máy quay video số, các hệ thống dàn dựng video trong gia đình (video home studio).Các thiết bị sử dụng định dạng nén MPEG có nhược điểm sau:
• Các thiết bị sử dụng phương pháp nén theo định dạng MPEG không thể sửdụng cho truyền dẫn, phát sóng vì tốc độ dòng bit sau khi nén còn cao
• Kỹ thuật nén MPEG chưa được chuẩn hóa như các định dạng nén khác (JPEG,MPEG-2 v.v.), nên thiết bị nén của các hãng khác nhau thường không có tínhtương thích cao, do đó khó có thể trao đổi trực tiếp số liệu cho nhau
• Các phần mềm giải mã video hỗ trợ định dạng MPEG còn chưa phổ biến
2.9 Kết luận chương:
Trang 32Thông qua những kiến thức ở trên, cho ta thấy được nén ảnh là quá trình làm giảm dung lượng của bức ảnh xuống giúp cải thiện không gian lưu trữ, truyền tải bức ảnh xa hơn và thời gian nhanh hơn Có nhiều phương pháp thực hiện việc nén ảnh trong đó có 2 phương pháp nén ảnh chính là nén ảnh không tổn hao khôi phục lại bức ảnh như ảnh gốc (không làm mất mát dữ liệu) nhưng hiệu quả nén không cao, còn nén ảnh có tổn hao thì loại bỏ những dư thừa thông tin trong bức ảnh và hình ảnh khôi phục lại gần giống với ảnh gốc trong một thông số chất lượng cho phép Một trong những chuẩn nén ảnh tốt và phổ biến nhất hiện nay là phương pháp nén ảnh theo chuẩn JPEG, chuẩn nén ảnh này sẽ được trình bày cụ thể trong chương tiếp theo.
CHƯƠNG 3: PHƯƠNG PHÁP NÉN ẢNH TĨNH THEO
CHUẨN JPEG
3.1 Giới thiệu chương:
Nội dung của chương đi vào làm rõ phương pháp nén ảnh, quá trình thực hiện nén ảnh tĩnh theo chuẩn JPEG
Nội dung chương bao gồm các phần: