1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nhận dạng nhãn hiệu để phân biệt rượu thật và rượu giả trên thị trường

26 154 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 26
Dung lượng 1,44 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Việc nghiên cứu các ứng dụng nhận dạng và xử lý ảnh để nhận biết sản phẩm rượu bị làm giả, làm nhái nhãn hiệu thật, để phục vụ tốt cho công tác quản lý, kiểm tra, kiểm soát thị trường là

Trang 1

NGUYỄN THỊ UYÊN PHƯƠNG

NHẬN DẠNG NHÃN HIỆU ĐỂ PHÂN BIỆT

RƯỢU THẬT VÀ RƯỢU GIẢ TRÊN THỊ TRƯỜNG

Chuyên ngành: Khoa học máy tính

Mã số: 60.48.01

TÓM TẮT LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Đà Nẵng – Năm 2018

Trang 2

Công trình được hoàn thành tại TRƯỜNG ĐẠI HỌC BÁCH KHOA

Người hướng dẫn khoa học: TS HUỲNH HỮU HƢNG

Có thể tìm hiểu luận văn tại:

Trung tâm Học liệu, Đại học Đà Nẵng tại Trường Đại học Bách

khoa

Thư viện Khoa Công nghệ thông tin, Trường Đại học Bách khoa – ĐHĐN

Trang 3

MỞ ĐẦU

1 Lý do chọn đề tài

Hiện nay, ở Việt Nam số lượng các mặt hàng tiêu dùng bị làm giả, làm nhái nhãn hiệu đang được bày bán tràn lan trên thị trường, hàng giả không chỉ làm ảnh hưởng đến quyền lợi người tiêu dùng,

mà còn ảnh hưởng đến hình ảnh, thương hiệu và thiệt hại về kinh tế của nhà sản xuất

Công tác quản lý thị trường hàng hoá còn nhiều bất cập, rất khó kiểm soát nạn hàng giả, hàng nhái trên thị trường Đặc biệt, rượu

là một trong những sản phẩm hàng hoá thường bị làm giả mạo nhãn hiệu sản phẩm thật Việc nghiên cứu các ứng dụng nhận dạng và xử

lý ảnh để nhận biết sản phẩm rượu bị làm giả, làm nhái nhãn hiệu thật, để phục vụ tốt cho công tác quản lý, kiểm tra, kiểm soát thị trường là cần thiết trong điều kiện hiện nay

Với những lí do trên, tôi xin đề xuất chọn đề tài: “Nhận dạng nhãn hiệu để phân biệt rượu thật và rượu giả trên thị trường”

2 Mục tiêu và nhiệm vụ nghiên cứu

2.1 Mục tiêu nghiên cứu

Nghiên cứu ứng dụng máy Vector hỗ trợ trong việc nhận dạng nhãn hiệu rượu để phân biệt sản phẩm rượu Vodka thật hay giả

2.2 Nhiệm vụ nghiên cứu

- Nghiên cứu các kỹ thuật xử lý ảnh, nhận dạng hình ảnh, các

mô hình học máy, các phương pháp xử lý ảnh

- Tìm hiểu và thu thập hình ảnh nhãn hiệu rượu Vodka trên thị

trường

- Xây dựng chương trình demo để kiểm tra tính hiệu quả

3 Đối tượng và phạm vi nghiên cứu

Trang 4

3.1 Đối tượng nghiên cứu

- Nhãn hiệu thật và giả các sản phẩm rượu Vodka

- Cơ sở lý thuyết về nhận dạng hình ảnh,

- Các kỹ thuật xử lý ảnh để phục vụ nhận dạng

3.2 Phạm vi nghiên cứu

- Nghiên cứu các phương pháp phân lớp, nhận dạng hình ảnh

- Dùng thuật toán SVM trong phân lớp và nhận dạng mẫu

4 Phương pháp nghiên cứu

4.1 Phương pháp nghiên cứu lý thuyết

- Thu thập, tham khảo các đề tài, bài báo, tài liệu và thông tin

liên quan đến phân lớp và nhận dạng

- Các tài liệu về cơ sở lý thuyết: Xử lý ảnh, lọc trích đặc trưng

ảnh, xác định biên, nghiên cứu các kỹ thuật nhận dạng mẫu

4.2 Phương pháp nghiên cứu thực nghiệm

- Thực nghiệm trên dữ liệu đầu vào là ảnh sản nhãn hiệu rượu

Vodka

- Cài đặt chương trình, thực hiện chương trình với mẫu nhãn

hiệu rượu Vodka

5 Ý nghĩa khoa học và thực tiễn của luận văn

5.1 Ý nghĩa khoa học

Nghiên cứu nhằm ứng dụng khoa học và công nghệ, đề xuất giải pháp xây dựng hệ thống nhận dạng hình ảnh sản phẩm thật hay giả hỗ trợ trong việc quản lý thị trường hàng hoá

5.2 Ý nghĩa thực tiễn

Góp phần hỗ trợ cho việc nhận dạng hình ảnh nhãn hiệu rượu bằng xử lý ảnh một cách hiệu quả, ứng dụng hỗ trợ tích cực trong công tác quản lý thị trường

Trang 5

CHƯƠNG 1- TỔNG QUAN VỀ NHẬN DẠNG VÀ XỬ LÝ ẢNH 1.1 Các bước cơ bản trong xử lý ảnh số

Trang 6

1.3.3 Tách nhiễu và lấy ngưỡng

1.3.4 Biến đổi âm bản

Hình 1.9 Ảnh âm bản 1.3.5 Biến đổi ảnh đen trắng

Hình 1.10 Ảnh trắng đen 1.3.6 Lược đồ xám(Histogram)

Hình 1.13 Cân bằng mức xám của ảnh 1.3.7 Kỹ thuật cải thiện ảnh nhị phân

Ảnh gốc Ảnh giãn

Hình 1.14 Minh hoạ của phép giãn ảnh

Trang 7

𝐺 𝑖

log𝐶(𝑖, 𝑗)

Năng lượng (Energy) = 𝐶(𝑖, 𝑗)2

𝐺 𝑗

𝐺 𝑖

Độ tương phản (contrast) = (𝑖 − 𝑗)2 𝐶(𝑖, 𝑗)

𝐺 𝑗

𝐺 𝑖

Trang 8

Quá trình nhận dạng dựa vào những mẫu học biết trước gọi là

nhận dạng có thầy hay học có giám sát, trong những trường hợp ngược lại gọi là học không có giám sát

1.5.2 Máy vector hỗ trợ (SVM)

SVM là một phương pháp phân lớp xuất phát từ lý thuyết học thống kê SVM sẽ cố gắng tìm cách phân lớp dữ liệu sao cho có lỗi xảy ra trên tập kiểm tra là nhỏ nhất

Ý tưởng của nó là ánh xạ (tuyến tính hoặc phi tuyến) dữ liệu vào không gian các vector đặc trưng mà ở đó một siêu phẳng tối ưu được tìm ra để tách dữ liệu thuộc hai lớp khác nhau

1.5.3 K-láng giềng gần nhất (k-Nearest Neighbors)

1.5.4 Mô hình Markov ẩn (Hidden Markov Models)

1.5.5 Mạng nơ-ron nhân tạo

1.6 Đánh giá ưu điểm của thuật toán SVM

• SVM rất hiệu quả để giải quyết bài toán dữ liệu có số chiều lớn

• SVM giải quyết vấn đề overfitting rất tốt (dữ liệu có nhiễu và tách dời nhóm hoặc dữ liệu huấn luyện quá ít)

• Là phương pháp phân lớp nhanh

• Có hiệu suất tổng hợp tốt và hiệu suất tính toán cao

Với khả năng vượt trội của SVM về tính hiệu quả, độ chính xác, khả năng xử lý bộ dữ liệu một cách linh hoạt, việc sử dụng máy vec-tơ hỗ trợ SVM đã và đang là sự lựa chọn tối ưu nhất trong việc giải quyết bài toán phân loại

1.7 KẾT CHƯƠNG

Chương 1 tác giả đã trình bày tổng quan về các vấn đề liên quan tới nhận dạng và xử lý ảnh số Tiếp theo Chương 2, tác giả sẽ trình bày nghiên cứu về các kết quả nhận dạng và phân tích mẫu, ứng dụng thuật toán SVM để ứng dụng nhận dạng nhãn hiệu rượu Vodka

Trang 9

CHƯƠNG 2 – PHƯƠNG PHÁP ĐẶC TRƯNG

VÀ NHẬN DẠNG 2.1 Các công trình nghiên liên quan

Trang 10

2.3.3 Thuật toán Watershed và đối sánh mẫu để phát hiện bệnh thối trên xoài

Hình 2.13 Cấu trúc hệ thống đề xuất

2.4 KẾT CHƯƠNG

Trong chương 2, tác giả tìm hiểu các đặc trưng cơ bản nhất của ảnh, đó là đặc trưng màu sắc ảnh và kết cấu ảnh, các bài toán về nhận dạng và phân loại ảnh chụp, nhãn hiệu và bản chỉ dẫn Thông qua các công trình nghiên cứu hiện tại tác giả đã hiểu biết được một số thuật toán và các đặc trưng cần trích xuất cho một bài toán nhận dạng và phân loại Chương 3 tác giả sẽ ứng dụng các kiến thức và sự hiểu biết của mình để áp dụng vào bài toán“Nhận dạng nhãn hiệu để phân biệt rượu thật và rượu giả trên thị trường”

Trích xuất Đặc trưng Phân lớp

Bình thường

Bị bệnh

Trang 11

CHƯƠNG 3 – ỨNG DỤNGMÁY VECTƠ HỖ TRỢ TRONG NHẬN DẠNG NHÃN HIỆU RƯỢU VODKA 3.1 Phương pháp phân lớp dữ liệu máy vector hỗ trợ SVM

3.1.1 Giới thiệu

Hình 3 1 Siêu phân hoạch tập mẫu từ không gian Rn sang không gian Rd

SVM thực hiện chuyển tập mẫu từ không gian biểu diễn Rncủa chúng sang một không gian Rd

có số chiều lớn hơn Trong không gian Rd tìm một siêu phẳng tối ưu để phân hoạch tập mẫu này dựa trên phân lớp của chúng

3.1.2 Ý tưởng của phương pháp

Cho trước một tập huấn luyện, được biểu diễn trong không gian vector, trong đó mỗi tài liệu là một điểm, phương pháp này tìm ra

một siêu phẳng f quyết định tốt nhất có thể chia các điểm trên không

gian này thành hai lớp riêng biệt tương ứng là lớp + và lớp - Chất lượng của siêu phẳng này được quyết định bởi khoảng cách (gọi là biên) của điểm dữ liệu gần nhất của mỗi lớp đến mặt phẳng này Khi

đó khoảng cách biên càng lớn thì mặt phẳng quyết định càng tốt, đồng thời việc phân loại càng chính xác

Hình 3.2 Siêu phẳng phân chia dữ liệu với khoảng cách biên lớn nhất

Trang 12

3.1.3 Các bước chính của phương pháp

Phương pháp SVM yêu cầu dữ liệu được diễn tả như các vector của các số thực Như vậy nếu đầu vào chưa phải là số thì ta cần phải tìm cách chuyển chúng về dạng số của SVM

• Tiền xử lý dữ liệu: Thực hiện biến đổi dữ liệu phù hợp cho quá trình tính toán, tránh các số quá lớn mô tả các thuộc tính Thường nên co giãn(scaling) dữ liệu chuyển về đoạn [-1,1] hoặc [0,1]

• Chọn hàm hạt nhân: Lựa chọn hàm hạt nhân phù hợp tương ứng cho từng bài toán cụ thể để đạt độ chính xác cao trong quá trình phân lớp

• Thực hiện việc kiểm tra chéo để xác định các tham số cho ứng dụng: Điều này cũng quyết định đến tính chính xác của quá trình phân lớp

• Sử dụng các tham số cho việc huấn luyện với tập mẫu: Trong quá trình huấn luyện sẽ sử dụng thuật toán tối ưu hóa khoảng cách giữa các siêu phẳng trong quá trình phân lớp, xác định hàm phân lớp trong không gian đặc trưng nhờ việc ánh xạ dữ liệu vào không gian đặc trưng bằng cách mô tả hạt nhân và cuối cùng là kiểm thử tập dữ liệu

3.1.4 Cơ sở lý thuyết

Hình 3 3 Minh họa cho bài toán phân hai lớp

3.2 Nhận dạng nhãn hiệu rƣợu Vodka với máy vetor hỗ trợ

Trang 13

Để nhận dạng nhãn hiệu rượu Vodka, tác giả đề xuất thực hiện các bước xử lý như sau:

Bước 1: Thu nhận tập ảnh huấn luyện và ảnh kiểm tra

Bước 2: Thực hiện các bước tiền xử lý, nâng cao chất lượng ảnh,

chuyển ảnh màu RGB sang ảnh màu HSV, tách các kênh H, S, V riêng biệt

Bước 3:Trích xuất đặc trưng, tính giá trị trung của mỗi kênh màu

HSV và độ lệch chuẩn của mỗi kênh màu trong không gian màu HSV làm tham số cho màu sắc, Ảnh màu kênh màu V được dùng trích lọc đặc trưng kết cấu, ảnh V làm tham số đầu vào kết hợp sóng con Gabor và lược đồ mức xám được tính toán bằng ma trận GLCM

để trích lọc đặc trưng kết cấu đưa vào huấn luyện

Bước 4: Thuật toán SVM được sử dụng để thực hiện phân lớp, so

khớp các tham số đặc trưng của nhãn hiệu rượu Vodka cần kiểm tra với tập CSDL các đặc trưng của nhãn hiệu rượu Vodka đã được phân lớp, kết quả trả về nhãn hiệu rượu Vodka giả hoặc thật

Hình 3.9 Mô hình nhận dạng ảnh nhãn hiệu Rượu Vodka

Chuyển và tách kênh màu, xoá nền xử

lý hình thái học, cải thiện ảnh

Rút trích đặc trưng

Đặc trưng màu sắc (độ lệch chuẩn) Đặc trưng kết cấu (sóng con Gabor, GLCM)

Tiền xử lý

Chuyển và tách kênh màu, xoá nền xử

lý hình thái học, cải thiện ảnh

Rút trích đặc trưng

Đặc trưng màu sắc (độ lệch chuẩn) Đặc

trưng kết cấu (sóng con Gabor, GLCM)

Tập ảnh mẫu huấn luyện

Nhãn hiệu Ruợu Vodka thật/giả

Trang 14

3.3 Tiền xử lý

Nếu ảnh có độ tương phản kém sovới nền, ta có thể thay đổi theo các hàm

Trong Matlab, để thực hiện nâng cao độ tương phản của ảnh

đầu vàoin_img ta sử dụng câu lệnh sau:

Chuyển ảnh màu RGB sang ảnh màu HSV và tách cách kênh màu

u

b u a V a

u

a u u

L là số mức xám cực đại

Trang 15

RGB HSV Ảnh kênh H Ảnh kênh S Ảnh kênh V

Hình 3.12 Ảnh màu RGB chuyển đổi sang ảnh màu HSV và ảnh các

số đặc trưng cho màu sắc

Phương pháp tính độ lệch chuẩn (Standard Deviation) từ một dãy n giá trị cho trước x1, x2, xn:

Bước 1: Tìm mean của dãy số đã cho (x1+x2+ +xn) / n

Bước 2: Với mỗi x trong dãy số đã cho, tính độ lệch

(deviation) của nó so với mean bằng phép tính (x - mean)

Trang 16

Bước 3: Tính bình phương của các giá trị thu được ở bước 2 Bước 4: Tìm mean của các bình phương độ lệch tìm được ở

bước 3 Giá trị này được biết đến như là phương sai (Variance) σ2

Bước 5: Tính căn bậc hai (square root) của phương sai

(Variance) ta được kết quả cần tìm

Ảnh màu RGB đầu vào sau khi được chuyển đổi sang không gian màu HSV và được tách ra từng kênh H, S, V riêng biệt thì kênh đơn màu V được dùng làm đầu vào cho sóng con Gabor để trích lọc đặc trưng kết cấu, sóng con Gabor có rất nhiều tham số khác nhau, vì vậy tại bước này phải thực hiện để điều chỉnh và chọn lọc các giá trị tham số đầu vào của sóng con Gabor sao cho kết quả xử lý ảnh đơn màu V nổi rõ kết cấu nhất Sau đưa vào sóng con Gabor một ảnh đơn kênh mới có kết cấu rõ nhất được tạo ra (ảnh V’), ảnh V’ này được đưa vào ma trận đồng hiện mức xám để đo lường các giá trị kết cấu của ảnh V’ Kết quả từ ma trận đồng hiện mức xám được dùng làm

dữ liệu đầu xây dựng tập CSDL huấn luyện hoặc làm tham số đầu vào để phân lớp đối tượng

Hình 3.13 Mô hình trích lọc và đo lường đặc trưng kết cấu

Trang 17

a) Sóng con Gabor – Gabor Wavelet

Trong xử lý ảnh, sóng con Gabor là một bộ lọc tuyến tính thường được sử dụng để phát hiện biên, phần vùng ảnh, phân tích đặc trưng ảnh, phân lớp ảnh, Tần số và hướng được thể hiện trong các sóng con Gabor tương tự như hệ thống thị giác của con người Tập hợp các sóng con Gabor với tần số và hướng khác nhau có thể trợ giúp cho việc trích lọc đầy đủ các đặc trưng trong ảnh Sóng con Gabor hai chiều (2-D Gabor) được áp dụng trong ảnh với tỉ lệ và tần

số khác nhau Hàm Gabor 2-D được biến đổi từ đường hình sin phức tạp của hàm Gaussian 2-D Hàm sóng con Gabor trong miền không gian có dạng như sau:

) ' 2 cos(

) 2 ' ' exp(

) ,

2 2 2 ,

lệ co giãn trong không gian và nó xác định tính đơn giản của hàm Gabor, và độ lệch chuẩn σ xác định kích thước của hàm Gaussian

tuyến tính Băng thông (b) bán đáp ứng (half-response) trong không

gian tần số và tỉ lệ giữa σ/có quan hệ như sau:

2

2ln2

2lnlog2

121

Trang 18

Bảng 3 1 Các tham số của hàm Gabor Wavelet và đặc trưng kết cấu

ảnh V Ảnh màu RGB Gabor Wavelet Ảnh kết cấu

36 , 10 , 1

, 5 0 ], 2 [ , 8

72 , 10 , 1

, 5 0 ], 2 [ , 8

108 , 10 , 1

, 5 0 ], 2 [ , 8

144 , 10 , 1

, 5 0 ], 0 [ , 8

180 , 10 , 1

, 5 0 ], 2 [ , 8

b) Ma trận đồng hiện mức xám Co-occurrence

GLCM là một trong những phương pháp trích lọc đặc trưng quan trọng trong lĩnh vực phân tích kết cấu ảnh được đề xuất từ rất sớm bởi Haralick vào năm 1973 GLCM của ảnh f(x,y) có kích thước MxM và có G mức độ xám là một ma trận hai chiều C(i, j) Mỗi phần

tử của ma trận thể hiện xác suất xảy ra cùng giá trị cường độ sáng i

Trang 19

và j tại một khoảng cách d và một góc θ xác định Do đó, có thể có nhiều ma trận GLCM khác nhau phụ thuộc vào cặp giá trị d và θ Một số đặt trưng quan trọng có thể kể đến như năng lượng (energy), độ tương phản (contrast), độ nhiễu (entropy), độ tương đồng (Correlation), tính đồng nhất (homogeneity),

Bảng 3 2 Các giá trị tham số của GLCM

Ảnh màu RGB Gabor Wavelet Các giá trị tham số của

GLCM

36 , 10 , 1

, 5 0 ], 2 0 [ , 8

Entropy: 0.265715 Contrast: 0.143287 Correlation: 0.716450 Energy: 0.625673 Homogeneity: 0.632575

72 , 10 , 1

, 5 0 ], 2 0 [ , 8

Entropy: 0.596124 Contrast: 0.343675 Correlation: 0.574691 Energy: 0.626423 Homogeneity: 0.451565

108 , 10 , 1

, 5 0 ], 2 0 [ , 8

Entropy: 0.365885 Contrast: 0.241668 Correlation: 0.724789 Energy: 0.621576 Homogeneity: 0.594648

144 , 10 , 1

, 5 0 ], 2 0 [ , 8

Entropy: 0.357885 Contrast: 0.341568 Correlation: 0.615239 Energy: 0.632326 Homogeneity: 0.548535

180 , 10 , 1

, 5 0 ], 0 [ , 8

Entropy: 0.432624 Contrast: 0.241714 Correlation: 0.527460 Energy: 0.621873 Homogeneity: 0.628845

Trang 20

3.5 Thực nghiệm

Hình 3.14 Rượu Vodka thật

Hình 3.15 Rượu Vodka giả

Yêu cầu của chương trình là thu nhận hình ảnh chai Rượu Vodka ở đầu vào, đầu ra của chương trình nhằm chẩn đoán nhãn hiệu chaiRượu Vodka, đưa ra thông báo giả hay không Hiện nay để xử lý ảnh ta có thể sử dụng các ngôn ngữ C#, Matlab,…Tôi lựa chọn ngôn ngữ lập trình Matlab vì trong thư viện của Matlab có nhiều hàm đã được hỗ trợ sẵn

Trang 21

3.5.3 Xử lý

Mở ảnh và thực hiện xử lý, trong giai đoạn này ta thực hiện cải thiện nhằm nâng cao chất lượng ảnh đầu vào, khử nền, lọc nhiễu, thay đổi độ phản,

Chuyển kênh màu ảnh RGB  HSV sử dụng bộ lọc Gabor để làm rõ đặc trưng kết cấu ảnh và thu nhận ảnh sóng con kết cấu với các đặc trưng rõ nhất, sóng con Gabor dùng làm ảnh đầu vào cho GLCMđể trích xuất được các tham số năng lượng (energy), độ tương phản (contrast), entropy, độ tương đồng (Correlation), tính đồng nhất (homogeneity),

Sau quá trình xử lý, kết quả ta thu được hình ảnh đã chuyển sang không gian màu HSV, các ảnh kênh H, kênh S, kênh V sẽ được lưu trữ làm dữ liệu đầu vào cho quá trình trích xuất các đặc trưng của ảnh, tính toán các tham số trung bình và độ lệch chuẩn giữa các kênh màu

Sau quá trình thực hiện ở các bước tiền xử lý ta được ảnh kết cấu và sóng con Gabor với các đặc trưng rõ nét nhất Ảnh này sẽ tiếp tục làm dữ liệu đầu vào cho GLCM để trích xuất các tham số đặc trưng Entropy, Contrast, Correlation, Energy, Homegeneity ứng với các giá trị λ, φ, γ, b,N, và hướng (góc) θ khác nhau

Hình 3.16 Giao diện trích xuất đặc trưng

Ngày đăng: 11/08/2018, 07:09

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w