Definition of Digital Image Khái niệm ảnh sốẢnh số là tập hợp hữu hạn các điểm ảnh với mức xám phù hợp dùng để mô tả ảnh gần với ảnh thật Tùy thuộc vào thông tin của mỗi pixel, ảnh có
Trang 1XỬ LÝ ẢNH TRONG CƠ ĐIỆN TỬ
Machine Vision
Giảng viên: TS Mạc Thị Thoa Đơn vị: Bộ môn Cơ điện tử, Viện Cơ khí
Trang 21 Image Sensing and Acquisition (cảm biến và thu nhận hình ảnh)
2 Image Sampling and Quantization (Lấy mẫu và lượng tử hóa hình
ảnh)
3 Some Basic Relationships Between Pixels (Mối quan hệ cơ bản giữa
4 Basic Mathematical Tools Used in Digital Image Processing (Các
Trang 3Image Sensing and Acquisition
Figure shows the three principal sensor arrangements used to transform incident energy into digital images (ba cách bố trí cảm biến chính được sử dụng
để biến đổi năng lượng tới thành hình ảnh kỹ thuật số)
(a) Single sensing element
(b) Line sensor
(c) Array sensor
Trang 4Image Acquisition Using a Single Sensing Element
Trang 5Image Acquisition Using Sensor Strips (Thu nhận hình ảnh sử dụng dải
cảm biến)
(a) Image acquisition using a linear sensor strip
Trang 6Image Acquisition Using Sensor Arrays
An example of digital image acquisition (a) Illumination (energy) source (b) A scene (c) Imaging system (d) Projection of the scene onto the image plane (e) Digitized image.
Trang 7Definition of Digital Image (Khái niệm ảnh số)
Ảnh số là tập hợp hữu hạn các điểm ảnh với mức xám phù hợp dùng để mô tả
ảnh gần với ảnh thật
Tùy thuộc vào thông tin của mỗi pixel, ảnh có thể được chia thành ảnh nhị phân, hình ảnh thang độ xám, ảnh RGB …
Picture Element (Điểm ảnh)
Điểm ảnh (Pixel) là một phần tử của ảnh số tại tọa độ (x,y) với độ xám hoặc màunhất định
Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao chomắt người cảm nhận sự liên tục về không gian và mức xám/ màu của ảnh số
Trang 9Sắc màu của ảnh
Các màu sắc cơ sở để dùng biểu diễn một ảnh màu tạo thành một hệ màu và
được đề xuất dựa trên các nghiên cứu thị giác của con người
Hệ màu RGB (Red, Green, Blue) là một trong các mô hình phổ biến nhất, trong
đó mỗi điểm ảnh được biểu diễn bằng 3 giá trị thuộc khoảng [0 255]
Trang 10Sắc màu của ảnh- Các mô hình màu
• Red, Green, Blue tại 3 trục nhận giá trị [0 255].
Mô hình RGB có thể biểu diễn hơn 16 triệu màu Trong
Trang 11Mức xám của ảnh
Mức xám: Là kết quả của sự biến đổi tương ứng 1 giá trịn độ sáng của một
điểm ảnh với một giá trị nguyên dương, thông thường là [0 255] tùy thuộc vào
giá trị mỗi điểm ảnh được biểu diễn
Các thang giá trị xám thông thường: 16, 32, 64, 128, 256 (256 là mức phổ dụng
do KTMT dùng 1 byte-8bit để biểu diễn mức xám)
Trang 12Độ sâu mà của ảnh số
Là đại lượng mô tả khả năng biểu diễn của các màu sắc trong ảnh số khi biểu
thị trên các thiết bị màn hình hoặc in ấn Đại lượng này được tính bằng số bít
cần dùng để biểu diễn một điểm ảnh
Có thể phân biệt ba loại ảnh: màu, xám, nhị phân qua độ sâu màu với ảnh nhị
phân là 1, xám là 8, ảnh màu là 24 hoặc 32
Ví dụ ảnh cô Lena xinh đẹp ở ảnh màu được biến đối sang ảnh xám và ảnh nhị phân như 3 hình dưới
Trang 14Ảnh mức xám
Trang 16Ảnh chỉ số Jpeg, Gif
Trang 17Độ sâu mà của ảnh số
Ảnh nhị phân (binary image): giá trị mỗi điểm ảnh là 0 hoặc 1, nghĩa là trắng
hoặc đen Trong thực tế khi xử lý trên máy tính thì người ta dùng ảnh xám (xem khái niệm bên dưới) để biểu diễn ảnh nhị phân và lúc này 2 giá trị là 0 hoặc 255
Ảnh xám (gray image): giá trị mỗi điểm ảnh nằm trong giải giá trị từ 0 đến 255, nghĩa là cần 8 bits hay 1 byte để biểu diễn mỗi điểm ảnh này
Ảnh màu (color image): mỗi điểm ảnh có giá trị gồm 3 màu đỏ (red) + xanh lục (green) + xanh dương (blue) Mỗi màu có giá trị từ 0 đến 255, nghĩa là mỗi điểm ảnh cần 24bits hay 3bytes để biểu diễn Bạn có thể kiểm tra bằng cách dùng
phần mêm Paint của Windows, tạo một ảnh có kích thước 1024x1024 rồi lưu với định dạng màu BMP, rồi xem thông tin bức ảnh sẽ thấy size là 3MB
Trang 18Độ phân giải của ảnh
Định nghĩa: độ phân giải của ảnh (Resolution) của ảnh là mật độ điểm ảnh được ấn
định trên một ảnh số được hiển thị Hiểu một cách đơn giản đó chính là số lượng điểm ảnh chứa trên 1 màn hình hiển thị Độ phân giải thường được đo bằng
pixcel, megapixcel (1 megapixcel = 1 triệu pixcel)
Tổng số pixel (điểm ảnh) được gọi là độ phân giải Cách tính, quy đổi và gọi tên
độ phân giải như sau: nhân các cột điểm ảnh và hàng điểm ảnh rồi chia cho 1triệu Ví dụ, ảnh có độ phân giải 1220 x 1019 thì số điểm ảnh của nó
là 1.243.180 pixcel, độ phân giải gần đúng là 1,2 megapixce
Kết hợp với các yếu tố khác như kích thước cảm biến, chất lượng ống kính,
thấu kính, độ phân giải ảnh vẫn có những công dụng sau đây:
- Tăng độ sắc nét, giảm độ nhiễu của hình ảnh trên màn hình có kích thước nhỏ hơn
Hữu ích khi in hình khổ lớn như các tạp chí và khi cần crop ảnh
Trang 19Xử lý ảnh số
Định nghĩa: là một lĩnh vực khoa học công nghệ chuyên nghiên cứu thay đổi
trạng thái ban đầu của ảnh nhằm:
Cải thiện thông tin ảnh trực quan theo cách hiểu của con người hoặc nén ảnh
Làm cho ảnh phù hợp hơn với tri giác máy
Trang 20Xử lý ảnh số
Làm ảnh sắc nét hơn
Trang 21Xử lý ảnh số
Lọc bỏ nhiễu
Trang 22Xử lý ảnh số
Loại bỏ sự mờ do chuyển động (nhòe)
Trang 23Xử lý ảnh số: Làm cho ảnh đơn giản gọn gàng và đơn giản hơn
Tách biên của ảnh
Trang 24Xử lý ảnh số: Làm cho ảnh đơn giản gọn gàng và đơn giản hơn
Loại bỏ các chi tiết thừa
Trang 25Biểu diễn ảnh số
Trang 26hình ảnh)
Basic Concepts in Sampling and Quantization
Số hóa các giá trị tọa độ được gọi là lấy mẫu Số hóa các giá trị biên độ được
gọi là lượng tử hóa
(a) Continuous image (b) A scan line
showing intensity variations along line
AB in the continuous image (c)
Sampling and quantization (d) Digital
scan line (The black border in (a) is
included for clarity It is not part of the
Trang 27Basic Concepts in Sampling and Quantization
Một ảnh g(x, y) ghi được từ Camera là ảnh liên tục tạo nên mặt phẳng hai chiều Ảnh cần chuyển sang dạng thích hợp để xử lí bằng máy tính Phương pháp biến đổi một ảnh (hay một hàm) liên tục trong không gian cũng như theo giá trị thành dạng số rời rạc được gọi là số hoá ảnh Việc biến đổi này có thể gồm hai bước:
Bước 1: Đo giá trị trên các khoảng không gian gọi là lấy mẫu
Bước 2: Ánh xạ cường độ (hoặc giá trị) đo được thành một số hữu hạn các mức
rời rạc gọi là lượng tử hoá
Trang 28Lấy mẫu: Lấy mẫu là một quá trình, qua đó ảnh được tạo nên trên một vùng có
tính liên tục được chuyển thành các giá trị rời rạc theo tọa độ nguyên Quá trình
này gồm 2 lựa chọn:
- Một là: khoảng lấy mẫu.
- Hai là: cách thể hiện dạng mẫu
Lựa chọn thứ nhất được đảm bảo nhờ lý thuyết lấy mẫu của Shannon Lựa chọn
thứ hai liên quan đến độ đo (Metric) được dùng trong miền rời rạc
Trang 29Các dạng lấy mẫu: Dạng lẫy mẫu (Tesselation) điểm ảnh là cách bài trí các điểm
mẫu trong không gian hai chiều Một số dạng mẫu điểm ảnh được cho là dạng chữ nhật, tam giác, lục giác Mỗi một mẫu, ngoài việc thể hiện hình dáng còn cho biết
đặc điểm liên thông của chúng Ví dụ, mẫu chữ nhật có liên thông 4 hoặc 8 (nói về
các mẫu liền kề); mẫu lục giác có liên thông 6; mẫu tam giác có liên thông 3 hoặc 6.
Trang 30Basic Concepts in Sampling and Quantization
(a) Continuous image projected (b) Result of image sampling
Trang 31Representing Digital Images
(a) Image plotted as a surface (b) Image displayed as a visual intensity array (c) Image shown as a 2-D
numerical array (The numbers 0, 5, and 1 represent black, gray, and white, respectively.)
Trang 32Representing Digital Images
Coordinate convention used to represent digital images
Because coordinate values are integers, there is a one-to-one
correspondence between x and
y and the rows (r) and columns
(c) of a matrix.
Trang 33Representing Digital Images
Trang 34Representing Digital Images
The number of intensity levels: L
Ảnh đen trắng chỉ bao gồm 2 màu: màu đen và màu trắng Người ta phân mức đen trắng
đó thành L mức Nếu sử dụng số bit B=8 bít để mã hóa mức đen trắng (hay mức xám) thì L được
xác định :
L=2 B(trong ví dụ của ta L=2 8 = 256 mức)
Nếu L bằng 2, B=1, nghĩa là chỉ có 2 mức: mức 0 và mức 1, còn gọi là ảnh nhị phân Mức
1 ứng với màu sáng, còn mức 0 ứng với màu tối Nếu L lớn hơn 2 ta có ảnh đa cấp xám.
• Ảnh nhị phân mỗi điểm ảnh được mã hóa trên 1 bit, còn với ảnh 256 mức, mỗi điểm ảnh được mã hóa trên 8 bit Như vậy, với ảnh đen trắng: nếu dùng 8 bit (1 byte) để biểu diễn mức xám, số các mức xám có thể biểu diễn được là 256 Mỗi mức xám được biểu diễn dưới dạng là một số nguyên nằm trong khoảng
từ 0 đến 255, với mức 0 biểu diễn cho mức cường độ đen nhất và 255 biểu diễn cho mức cường độ
sáng nhất.
• Ảnh nhị phân khá đơn giản, các phần tử ảnh có thể coi như các phần tử logic Ứng dụng chính của nó
được dùng theo tính logic để phân biệt đối tượng ảnh với nền hay để phân biệt điểm biên với điểm khác.
Trang 35Representing Digital Images
• Ảnh màu tổ hợp từ 3 màu cơ bản: đỏ (R), lục (G), lơ (B) và thường thu nhận
trên các dải băng tần khác nhau
• Với ảnh màu, cách biểu diễn cũng tương tự như với ảnh đen trắng, chỉ khác
là các số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm: đỏ
(red), lục (green) và lam (blue)
• Để biểu diễn cho một điểm ảnh màu cần 24 bit 24 bit này được chia thành
ba khoảng 8 bit
• Mỗi màu cũng phân thành L cấp màu khác nhau (thường L=256) Mỗi
khoảng này biểu diễn cho cường độ sáng của một trong các màu chính
• Do đó, để lưu trữ ảnh màu người ta có thể lưu trữ từng màu riêng biệt, mỗi
màu lưu trữ
Trang 36Spatial and Intensity Resolution
Spatial resolution ( độ phân giải không
gian) is a measure of the smallest
discernible (rõ ràng) detail in an image
Dots per unit distance is a measure of
image resolution used in the printing and
publishing industry In the U.S., this
measure usually is expressed as dots per
inch (dpi)
Intensity resolution (độ phân giải cường
độ) is the number of bits used to quantize
intensity Effects of reducing spatial resolution The images shown
Trang 37Spatial and Intensity Resolution
Trang 38Spatial and Intensity Resolution
(a) Image with a low level of detail (b) Image with a medium level of detail (c) Image with a
Trang 39Image Interpolation
(a) Image reduced to 72 dpi and zoomed back to its original 930 dpi using nearest neighbor
Trang 40 A digital path (or curve) from pixel p with coordinates (x0, y0) to pixel q with
coordinates (x n , y n) is a sequence of distinct pixels with coordinates:
If (x0, y0) = (x n , y n ) the path is a closed path
n is the length of the path
Trang 41Let S represent a subset of pixels in an image
Two pixels p and q are said to be connected in S if there exists a path between
them consisting entirely of pixels in S.
The set of pixels that are connected to p in S is called a connected component of
S.
If it only has one component, and that component is connected, then S is called a
connected set.
Trang 42Let R represent a subset of pixels in an image
We call R a region of the image if R is a connected set.
Two regions, R i and R j are said to be adjacent if their union forms a connected
set
Regions that are not adjacent are said to be disjoint.
Foreground: the union of all the K disjoint regions (R u)
Background: the complement of the set R u : (R u)c
Trang 43background
foreground
Trang 44 The boundary (also called the border or contour) of a region R is the set of pixels
in R that are adjacent to pixels in the complement of R.
intensity discontinuities closed paths
Trang 45Distance Measures
For pixels p, q, and s, with coordinates (x, y), (u, v), and (w, z), respectively, D is a
distance function or metric if:
Trang 46Distance Measures
The Euclidean distance between p and q is defined as:
The distance D4, (city-block distance) The distance D 8 , (chessboard distance)
Trang 47Elementwise Versus Matrix Operations
An elementwise operation involving one or more images is carried out on a
pixel-by-pixel basis
The elementwise product of these two images is
The matrix product of the images
Trang 48Linear Versus Nonlinear Operations
Consider a general operator, H, that produces an output image, g(x, y), from a
given input image, f(x, y):
H is said to be a linear operator if
An operator that fails to satisfy above equation is said to be nonlinear.
Trang 49Arithmetic Operations
Arithmetic operations between two images f(x, y) and g(x, y)
Trang 50100, 500, and 1,000 noisy images,
respectively All images are of size pixels, and all were scaled so that their intensities would span the full [0, 255] intensity scale.
Using image addition (averaging) for noise reduction
Trang 51Arithmetic Operations Comparing images using subtraction.
Trang 52Basic Set Operations
Trang 53Basic Set Operations
Trang 54Basic Set Operations
Set operations involving grayscale images (a) Original image (b) Image negative obtained using grayscale set complementation (c) The union of image (a) and a constant image.
Trang 55Logical Operations
Trang 56Logical Operations
Illustration of logical operations involving foreground (white) pixels
Black represents binary 0’s and white binary 1’s
The dashed lines are shown for reference only
They are not part of the result.
Trang 57Single-Pixel Operations
(a) An 8-bit image (b) Intensity transformation function used to obtain the digital equivalent of a “photographic”
Trang 58Neighborhood Operations
Local averaging using neighborhood processing The procedure is illustrated in (a) and (b) for a rectangular neighborhood (c) An aortic angiogram (d) The result of using Eq (2) with m = m = 41 The images are of size
790 x 686 pixels.
(2)
Trang 59Geometric Transformations
Trang 60Geometric Transformations Phép biến dạng (Shearing)
Trang 61Geometric Transformations
(a) A 541 x 421 image of the letter T (b) Image rotated -21 0 using nearest-neighbor interpolation for intensity assignments (c) Image rotated -21 0 using bilinear
interpolation (d) Image rotated -21 0 using bicubic interpolation (e)-(h) Zoomed
sections (each square is one pixel, and the numbers shown are intensity values).
Trang 62Geometric Transformations
(a) A digital image (b) Rotated image (note the counterclockwise direction for a positive angle of rotation) (c) Rotated image cropped to fit the same area as the original image (d) Image enlarged to accommodate the entire rotated image.
Trang 63Image Registration
Image registration (a) Reference image (b) Input (geometrically distorted image) Corresponding tie points are shown as small white squares near the corners (c) Registered (output) image (note the errors
in the border) (d) Difference between (a) and (c), showing more registration errors.
Trang 64Vector and Matrix Operations
Trang 65Image Transforms
2-D linear transforms
Inverse transform
Trang 66Image Transforms
General approach for working in the linear transform domain.
Trang 67Image Transforms
(a) Image corrupted by sinusoidal interference (b) Magnitude of the Fourier transform showing the bursts of energy caused by the interference (the bursts were enlarged for display purposes) (c) Mask used to eliminate the energy bursts (d) Result of computing the inverse of the modified Fourier transform.
Trang 68CÂU HỎI ÔN TẬP
1 Nêu khái niệm và định nghĩa điểm ảnh
2 Thế nào là độ phân giải ảnh, cho ví dụ?
3 Trình bày định nghĩa mức xám, cho ví dụ
4 Nêu quan hệ giữa các điểm ảnh
5 Trình bày về khoảng cách đo và phân loại khoảng cách giữa các điểmảnh
6 Nêu ý nghĩa của các phép biến đổi ảnh, liệt kê một số phép biến đổi vàcho ví dụ.