THUYET TRINH XỬ LÝ ÂM THANH HÌNH ẢNH

XỬ LÍ ẢNHI • Xử lí ảnh số II • Các giai đoạn,thành phần chính trong hệ thống XLAIII • Ứng dụng IV • Số hóa ảnh,Lượng tử hóa V • Các tiêu chuẩn lấy mẫu VI • Phương pháp xác đinh và dự đo

Trang 1

THÀNH VIÊN NHÓM: Trần Văn Hải Nguyễn Đức Duy Phan Văn Duy Phan Anh Minh Phạm Văn Nam Nguyễn Hoàng Phi

GVHD: Chu Hồng Hải

XỬ LÝ ÂM THANH

HÌNH ẢNH

Trang 2

XỬ LÍ ẢNH

I • Xử lí ảnh số

II • Các giai đoạn,thành phần chính trong hệ thống XLAIII • Ứng dụng

IV • Số hóa ảnh,Lượng tử hóa

V • Các tiêu chuẩn lấy mẫu

VI • Phương pháp xác đinh và dự đoán biên ảnh

Trang 4

XỬ LÍ ẢNH

*Tại sao cần xử lí ảnh số

*Tại sao phải nén tín hiệu?

-Ảnh được sủ dụng mọi lúc, mọi nơi

-Hạn chế về không gian lưu trữ và tốc độ đường truyền

Trang 6

XỬ LÍ ẢNH

A.Các giai đoạn chính của hệ thống sử lí ảnh

II Các giai đoạn,thành phần chính của hệ thống xử lí ảnh

Trang 7

XỬ LÍ ẢNH

II Các giai đoạn,thành phần chính của hệ

thống xử lí ảnh

+ Thu nhận ảnh: - Qua các camera (tương tự, số)

- Từ vệ tinh qua các bộ cảm ứng (Sensors)

- Qua các máy quét ảnh (Scaners)

+ Số hóa ảnh: Biến đổi ảnh tương tự thành ảnh rời rạc để

xử lý bằng máy tính: Thông qua quá trình lấy mẫu (rời rạc

về mặt không gian) và lượng tử hóa(rời rạc về mặt biên độ)

Trang 8

XỬ LÍ ẢNH

II Các giai đoạn,thành phần chính của hệ

Trang 9

XỬ LÍ ẢNH

B Các thành phần chính của hệ thống xử lí ảnh

II Các giai đoạn,thành phần chính của hệ thống xử lí ảnh

Trang 10

XỬ LÍ ẢNH

III Các ứng dụng của xử lí ảnh

-Trong lĩnh vực địa chất, hình ảnh nhận được từ vệ tinh có thể được phân tích để xác định cấu trúc bề mặt trái đất

- Trong ngành khí tượng học, ảnh nhận được từ hệ thống

vệ tinh theo dõi thời tiết cũng được xử lý, nâng cao chất lượng và ghép hình để tạo ra ảnh bề mặt trái đất

- Xử lý ảnh còn được sử dụng nhiều trong các hệ thống

quản lý chất lượng và số lượng hàng hóa trong các dây truyền tự động, ví dụ như hệ thống phân tích ảnh để

phát hiện bọt khí bên vật thể đúc bằng nhựa

Trang 11

XỬ LÍ ẢNH

IV Số hóa ảnh

• Phương pháp chung để số hóa ảnh là lấy mẫu theo

Trang 12

về mặt không gian, nhưng liên tục về mặt biên độ.

• Tiến trình lượng hóa: lượng tử hóa về mặt biên độ (độ sáng) cho dòng ảnh vừa được rời rạc hóa

Trang 13

XỬ LÍ ẢNH

IV Lượng tử hóa

• Lượng hóa ảnh nhằm ánh xạ từ một biến liên tục

u(biểu diễn giá trị độ sáng) sang một biến rời rạc u*

với các giá trị thuộc tập hữu hạn

• Cơ sở lý thuyết của lượng hóa là chia dải độ sáng biến

thiên từ Lmin đến Lmax thành một số mức (rời rạc và

nguyên)- Phải thỏa mãn tiêu chí về độ nhậy của mắt

Thường Lmin=0, Lmax là số nguyên dạng

(Thường chọn B=8, mỗi điểm ảnh sẽ được mã hóa 8 bít)

Trang 14

XỬ LÍ ẢNH

Ảnh tương tự và lượng tử hóa

Trang 15

XỬ LÍ ẢNH

V Các tiêu chuẩn lấy mẫu

• Tiêu chuẩn 4:4:4: Tín hiệu chói và màu được lấy mẫu tại tất cả các điểm lấy mẫu trên dòng tích cực của tín hiệu video Cấu trúc lấy mẫu trực giao

Trang 16

chói

Trang 17

một tín hiệu màu Tại dòng chẵn chỉ lấy mẫu tín hiệu màu

CR, tại dòng lẻ lấy mẫu tín hiệu CB Như vậy, nếu tần số lấy mẫu tín hiệu chói là fD, Thì tần số lấy mẫu tín hiệu màu sẽ là fD/2.

Trang 19

XỬ LÍ ẢNH

VI Các phương pháp xác định đường biên

 1- Phương pháp phát hiện đường biên trực tiếp dựa trên các phân tích về sự thay đổi độ chói của ảnh Kỹ thuật chủ yếu dùng để phát hiện biên là dùng đạo hàm Khi lấy đạo hàm bậc nhất của ảnh ta có phương pháp gradient, khi lấy đạo hàm bậc hai ta có kỹ thuật

Laplace.

 2- Phương pháp phát hiện đường biên trong ảnh màu: phân tích

ảnh màu thành các ảnh đơn sắc (R,G,B) và xác định đường biên trên cơ sở sự thay đổi màu sắc trong các ảnh đơn sắc nói trên.

 3- Phân tích ảnh thành vùng theo các đặc điểm đặc trưng (thí dụ kết cấu bề mặt (texture)), ranh giới giữa các vùng chính là đường biên của ảnh.

Trang 23

TV

Trang 24

NÉN ẢNH

 Ví dụ:

- Một camera số (4Mpixel)

Dữ liệu ban đầu – 24bits, 5.3M pixels  16M bytes

256M memory card ($30-50)  16 pictures

Nén JPEG

ảnh thô

(16M bytes) compressed JPEG file (1M bytes)

compression ratio=16  256 pictures

II MỤC ĐÍCH CỦA NÉN ẢNH

Trang 26

NÉN ẢNH

III CÁC KHÁI NIỆM NẾN ẢNH

• Dư thừa dữ liệu:

- Sự phân bố kí tự

- Sự lặp lại ký tự

- Sự phân bố của các chuỗi ký tự

- Dư thừa trong pixel (Interpixel Redundancy)

- Dư thừa tâm lý thị giác

Trang 27

NÉN ẢNH

• Sự phân bố ký tự

- Một số ký tự (pixel) xuất hiện với tần suất lớn hơn so với các

ký tự khác trong dữ liệu gốc (ảnh) Ta có thể thay thế các ký

tự này bằng từ mã nhị phân ít bít hơn và các ký tự xuất hiện nhiều hơn bằng từ mã nhị phân có nhiều bit hơn.

- Dùng mã hóa Huffman để mã hóa loại dư thừa này.

Trang 28

NÉN ẢNH

• Sự lặp lại các ký tự:

- Một chuỗi các ký tự (bit 1 hoặc 0) được lặp lại nhiều lần

Ta có thể mã hóa chuỗi lặp đó bằng ít bit hơn Đây chính

là nguyên tắc hoạt động của mã hóa RLC ( Run-Length Coding)

Trang 29

NÉN ẢNH

• Sự lặp lại của các chuỗi ký tự:

• Một số chuỗi ký tự (pixel) có tần suất xuất hiện tương đối cao.

• Có thể mã hóa các chuỗi đó bằng từ mã ít bít hơn

• Để xử lý loại dư thừa này ta sử dụng phương pháp mã hóa LWZ (mã hóa kiểu từ điển)

III CÁC KHÁI NIỆM NÉN ẢNH

Trang 30

IV PHÂN LOẠI NÉN ẢNH

Trang 31

NÉN ẢNH

JPEG decoder

original raw image (262,144 bytes)

compressed JPEG file

0

Trang 32

Trang 33

NÉN ẢNH

V PHƯƠNG PHÁP NÉN ẢNH

+ Các phương pháp nén mất thông tin:

- Lấy mẫu phụ sắc độ Điều này lợi dụng thực tế là mắt

người nhận thấy sự thay đổi không gian của độ sáng mạnh hơn so với màu sắc, bằng cách lấy trung bình hoặc bỏ một số thông tin sắc độ trong ảnh.

- Mã hóa chuyển đối Đây là phương pháp phổ biến nhất

- Nen Fractal.

Trang 34

NÉN ẢNH

V PHƯƠNG PHÁP NÉN ẢNH

+ Các phương pháp nén không mất thông tin:

- Mã hóa thay đổi độ dài được sử dụng trong phương thức mặc định trong PCX và là một trong những điều có thể có trong BMP, TGA, TIFF

- Mã hóa Entropy

- Mã chuỗi

Trang 35

NÉN ẢNH

VI SƠ ĐỒ KHỐI HỆ THỐNG NÉN ẢNH

 Bộ chuyển đổi: thường dùng phép biến đổi Cosin rời rạc để tập trung năng lượng tín hiệu vào một số lượng nhỏ các hệ số khai triển để thực hiện phép nén hiệu quả hơn là dùng tín hiệu nguyên thủy.

 Bộ lượng tử hoá: tạo ra một lượng ký hiệu giới hạn cho ảnh nén với hai kỹ thuật:

lượng tử vô hướng (thực hiện lượng tử hoá cho từng phần dữ liệu) và lượng tử vectơ (thực hiện lượng tử hoá một lần một khối dữ liệu) Quá trình này không thuận nghịch.

 Bộ mã hoá: gán một từ mã, một dòng bit nhị phân cho mỗi ký hiệu

Trang 37

Các tiêu chuẩn nén ảnh

• JPEG (The Joint Photographic Expert Group): dùng cho nén ảnh tĩnh, phát triển bởi sự kết hợp giữa ITU-TS (the International Telecommunications Union-Telecommunication Sector)

và ISO (International Standards Organization)

• MPEG-1, MPEG-2, MPEG-4, MPEG-7: do Ủy ban ISO IEC/JTC1/SC29- /WG11 phát triển cho mã hoá kết hợp giữa video và audio.

• H.261: do Nhóm nghiên cứu XI phát triển và được biết rộng rãi như tiêu chuẩn mã hoá video cho các dịch vụ nghe nhìn tốc độ nx 64Kbps.

• ITU-TS H.263 cho các ứng dụng điện thoại thấy hình tốc độ dưới 64Kbps.

Trang 38

Các kỹ thuật mã hoá entropy (mã hóa không tổn thất)

• Huffman

• Lempel Ziv – Wench (LZW)

Trang 39

o Tạo cây huffman

Dựa vào mô hình thống kê tính tần suất xuất hiện các ký tự Gán cho các ký tự có tần xuất cao bằng một từ mã ngắn, các

ký tự có tần xuất thấp bằng một từ mã dài.

Trang 40

• Được Jacob Braham Ziv đưa ra lần đầu tiên năm 1977, sau đó phát triển thành một họ giải thuật nén từ điển là

LZ.

• Năm 1984, Terry Welch cải tiến giải thuật LZ thành một

giải thuật tốt hơn :LZW

• Dùng để giảm dư thữa trong pixel

• Không cần biết trước xác suất phân bố của các pixel

• Thường được dùng để nén các loại văn bản, ảnh đen trắng, ảnh màu, ảnh đa mức xám Và là chuẩn nén cho các dạng ảnh GIF và TIFF

Mã LZW

Trang 42

• Từ điển được xây dựng đồng thời với quá trình đọc dữ liệu Sự có mặt của một chuỗi con trong từ điển khẳng định rằng chuỗi đó đã từng xuất hiện trong phần dữ liệu đã đọc

• Thuật toán liên tục “tra cứu ” và cập nhật từ điển sau mỗi lần đọc một kí tự ở dữ liệu đầu vào

• Do kích thước bộ nhớ không phải vô hạn và để đảm bảo tốc độ tìm kiếm, từ điển chỉ giới hạn 4096 ở phần

tử dùng để lưu lớn nhất là 4096 giá trị của các từ mã Như vậy độ dài lớn nhất của mã là 12 bít(4096= 212)

Mã LZW

Trang 45

Giới thiệu chuẩn JPEG

• JPEG là một tiêu chuẩn nén ảnh được áp dụng trong nhiều lĩnh vực: Lưu trữ ảnh, Fax màu, camera số,…

• Công nghệ JPEG nén hiệu quả với tỷ lệ đạt mức vài chục lần (hệ số nén 80:1)

• Xử lý tốt mất mát thông tin trong quá trình nén khiến

người nhìn không nhận ra sự khác biệt

• Ảnh đã nén sau khi giải mã trùng khớp với ảnh ban đầu

• Nguyên lý nén đơn giản, dựa vào sự thiếu nhạy cảm của mắt người với không gian màu U,V để ẩn giấu các thông tin dư thừa trong ảnh

Trang 46

1 Chuyển ảnh ban đầu thành các block 8x8

• Block là một ma trận điểm ảnh 8x8 pixel

• Mục đích: tính toán DCT cho từng vùng dư thừa dữ liệu khác nhau

• Tất cả các block có cùng kích thước và mỗi block là một

ma trận điểm ảnh 8×8 pixel được lấy từ một ảnh màn

hình theo chiều từ trái sang phải, từ trên xuống dưới

Kích thước block là 8×8 được chọn bởi hai lý do sau:

o Kích thước block lớn làm tăng độ phức tạp thuật toán

o Khoảng cách giữa các pixel vượt quá 8 sẽ làm cho hàm tương quan suy giảm nhanh

Trang 47

2 Biến đổi Cosin rời rạc DCT (Discrete Cosine Transform)

DCT (Discrete Cosine Transform): biến đổi dữ

liệu dưới dạng biên độ thành dữ liệu dưới dạng

tần số Mục đích: loại bỏ sự dư thừa dữ liệu trong

không gian DCT chia thành 2 loại:

• DCT một chiều.

• DCT hai chiều.

Thuật toán DCT là phần quan trọng nhất trong

nén ảnh JPEG, mình sẽ sử dụng DCT hai chiều

cho code nên trong bài viết này mình xin giới

thiệu qua về DCT-2d

Trang 48

2D-DCT

Trang 49

Chuẩn JPEG

Trang 51

Chuyển ảnh thành các MB

Tất cả các block có cùng kích thước và mỗi block là một ma trận điểm ảnh 8 8 pixel được lấy từ một ảnh màn hình theo chiều từ trái sang phải, từ trên xuống dưới Kích thước MB là 8 8 được chọn bởi hai lý do sau:

1 Qua việc nghiên cứu cho thấy hàm tương quan suy giảm rất nhanh khi khoảng cách giữa các pixel vượt quá 8

2 Tiện lợi cho việc tính toán và thiết kế phần cứng Nói chung, độ phức tạp về tính toán sẽ tăng nếu kích thước block tăng

Trang 52

Chuyển mức điểm ảnh (trừ 128)

Ví Dụ:

-128

Trang 53

Biến đổi DCT

Ví Dụ:

Biến đổi DCT và làm tròn các hệ số

DCT

Trang 54

Lượng tử hóa

Ví dụ:

Sử dụng Ma trận lượng tử hóa (Q)

Trang 55

Chia các phần tử của ma trận DCT với các phần tử tương ứng của

ma trận lượng tử hóa ở trên theo công thức:

Trang 56

Quét zig-zag các hệ số lượng tử hóa DCT.

Trang 58

Ví dụ

Trang 59

Mã hóa DC

Trang 61

Bảng mã DC

Trang 62

Mã hóa AC

Trang 63

Bảng mã AC

Trang 64

Mã hóa AC

Trang 65

Ví dụ: DC coefficient of the previous block is 60

Biết rằng hệ sô DC của khối trước là 60 Hãy mã hóa ma trận ảnh thành mã nhị phân.

Cho ma trận ảnh lượng tử:

Trang 66

Kết quả

• “11011001, 100010, 001, 1111100001, 0110, 0110, 000,1010”

Trang 68

TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI

THÀNH PHỐ HỒ CHÍ MINH

Trang 69

• Yêu cầu về hiệu suất nén với tỉ số nén cao

Trang 70

TỔNG QUAN

• Hệ thống nén JPEG2000 có tỉ lệ xuyên âm thấp hơn các công nghệ JPEG truyền thống

• Cho phép tách các phân giải khác nhau, các điểm ảnh, các miền quan tâm, các thành phần và hơn nữa, tất cả chúng được đưa vào một dòng bít nén riêng rẽ

• JPEG2000 sử dụng kỹ thuật biến đổi sóng con rời rạc (DWT) dùng mã hóa số học

Trang 71

CÁC TÍNH NĂNG CỦA JPEG2000

Trang 72

CÁC TÍNH NĂNG CỦA JPEG2000

• Sử dụng cùng một cơ chế nén ảnh cho cả hai dạng thức nén.

• Truy nhập và giải nén tại mọi thời điểm trong khi nhận dữ

liệu.

• Khả năng vượt trội trong khôi phục lỗi.

Trang 73

PHƯƠNG PHÁP NÉN ẢNH THEO CHUẨN

Ảnh nén

Xử lý trước

biến đổi Biến đổi liên thành phần

Lượng tử hóa

SƠ ĐỒ NÉN ẢNH TRONG JPEG2000

Trang 74

Bước 1: Xử lý trước biến đổi

• Giai đoạn đảm bảo dữ liệu đưa vào nén ảnh có dạng đối

xứng qua 0

CÁC BƯỚC THỰC HIỆN NÉN ẢNH

Trang 75

Bước 2: Biến đổi liên thành phần

• Loại bỏ tính tương quan

Trang 76

Bước 3: Biến đổi riêng các thành phần

• Sử dụng biến đổi WAVELET Chia tín hiệu thành các băng con và mỗi băng sẽ được mã hóa riêng rẽ

• Thường sử dụng hàm Wavelet Daubechies

Trang 77

Bước 4: Lượng tử hóa

• Cho phép đạt tỉ lệ nén cao hơn bằng cách thể hiện các

giá trị biến đổi với độ chính xác tương ứng cần thiết với mức chi tiết của ảnh cần nén

• Các hệ số biến đổi sẽ được lượng tử hoá theo phép lượng

tử hoá vô hướng

Trang 78

Bước 5: Mã hóa

• Các hệ số biến đổi sẽ được lượng tử hoá theo phép lượng

tử hoá vô hướng

• Trong thực tế sử dụng 2 phương pháp phổ biến là SPIHT

và EZW

Trang 79

SPIHT (Set Partitioning in HierarchicalTrees)

• Phương pháp mã hoá phân cấp theo phân vùng

• SPIHT được thiết kế tối ưu cho truyền dẫn luỹ tiến

• Sử dụng kỹ thuật embedded coding- Có nghĩa là: một ảnh sau nén với kích cỡ (lưu trữ) lớn (tỷ lệ nén thấp) sẽ chứa chính dữ liệu sau nén của ảnh có kích cỡ (lưu trữ) nhỏ (tỷ lệ nén cao)

Trang 80

EZW(Embedded Zerotree Wavelet Encoder)

• Cũng dựa trên phương pháp mã hóa lũy tiến

• Phương pháp này chủ yếu dựa trên khái niệm về cây

zero (zerotree)

Trang 81

Bài tập

Trang 83

CHUẨN JPEG2000 VÀ NÉN ẢNH MÀU

• Giải nén: Làm ngược lại các bước trên

Xử lý sau biến đổi

Giải mã

Biến đổi ngược liên thành phần

Biến đổi ngược riêng thành phần

Gải lượng

tử hóa Ảnh

nén

Trang 84

Các chuẩn nén ảnh hiện nay

Trang 85

Ưu điểm của chuẩn nén JPEG2k

Trang 86

Bài tập

Trang 87

• Nén tín hiệu video theo chuẩn MPEG là phương pháp nén ảnh động không làm dư thừa không gian như JPEG

mà còn làm giảm dư thừa thời gian giữa các khung ảnh, đây là khác biệt so với JPEG là chuẩn nén ảnh tĩnh chỉ làm giảm dư thừa không gian trong một khung ảnh

• Trong chuẩn MPEG, người ta quy định 3 loại khung ảnh phụ thuộc vào phương pháp nén:nén trong khung ảnh (khung I),nén ước đoán ( khung P ) và nén nội suy 2

chiều theo thời gian ( khung B )

MPEG

Trang 88

Chuẩn MPEG bao gồm các tiêu chuẩn nén video có tốc độ luồng bit khác nhau

MPEG

Trang 89

• MPEG-1 ~ 1-1.5Mbps (early 90s)

• For compression of 320x240 full-motion video at rates around 1.15Mb/s

• Applications: video storage (VCD)

• MPEG-2 ~ 2-80Mbps (mid 90s)

• For higher resolutions

• Support interlaced video formats and a number of features for HDTV

• Address scalable video coding

• Also used in DVD

• MPEG-4 ~ 9-40kbps (later 90s)

• For very low bit rate video and audio coding

• Applications: interactive multimedia and video telephony

• MPEG-21 ~ ongoing

MPEG

Trang 90

• Tiêu chuẩn MPEG là sự kết hợp giữa nén trong ảnh và nén liên ảnh

• Phương pháp nén có tổn hao dựa trên sự biến đổi DCT

• Bù chuyển động

MPEG

Trang 91

Cấu trúc dòng bit MPEG

Trang 92

Ứng dụng MPEG trong truyền thông đa phương tiện

Trang 93

Ứng dụng MPEG trong truyền thông đa phương tiện

Trang 94

THANK YOU

Định dạng
Số trang	94
Dung lượng	4,42 MB