Untitled BỘ GIÁO DỤC VIỆN HÀN LÂM KHOA HỌC VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ Nguyễn Tuấn Vũ NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP TRA CỨU ẢNH SỬ DỤNG ĐỘ ĐO TƯƠNG TỰ VÀ ỨNG DỤNG T[.]
TỔNG QUAN CƠ BẢN VỀ TRA CỨU ẢNH VÀ ĐỘ ĐO TƯƠNG TỰ
KHÁI QUÁT VỀ TRA CỨU ẢNH
1.1.1 CÁC KHÁI NIỆM CƠ BẢN[2]
Xử lý ảnh hiện nay là lĩnh vực quan trọng hàng đầu, đóng vai trò cốt lõi để thúc đẩy các nghiên cứu phát triển tiếp theo trong ngành Hai đặc tính chính của quy trình xử lý hình ảnh là nâng cao chất lượng thông tin hình ảnh và ứng dụng trong xử lý số, giúp cải thiện khả năng phân tích và sử dụng dữ liệu hình ảnh một cách hiệu quả.
Quá trình xử lý hình ảnh bắt đầu bằng việc thu thập các ảnh đầu vào, là các hình ảnh số có đặc điểm tương tự nhau, sau đó gửi tới máy tính để lưu trữ và chuẩn bị cho các bước xử lý tiếp theo Phần mềm xử lý ảnh có nhiệm vụ can thiệp vào thuật toán, điều chỉnh dữ liệu và cấu trúc của ảnh sao cho phù hợp với các mục đích sử dụng khác nhau Việc lưu trữ và xử lý chính xác giúp nâng cao hiệu quả trong các ứng dụng liên quan đến nhận dạng, phân tích hoặc biên tập hình ảnh số.
Trong quá trình xử lý ảnh, cần nhận dạng chính xác các đối tượng để tiếp tục các thao tác tiếp theo nhằm đạt được kết quả mong đợi Mục tiêu của xử lý ảnh là tạo ra đầu ra là một hình ảnh "chuẩn hơn" hoặc các kết quả phù hợp với yêu cầu đề ra Việc xử lý này đảm bảo ảnh đầu vào được cải thiện rõ rệt, giúp nâng cao độ chính xác và chất lượng của kết quả cuối cùng trong các ứng dụng như nhận dạng, phân loại hoặc xử lý hình ảnh chuyên sâu.
Hình 1.1 Quá trình ảnh được xử lý
Trong xử lý hình ảnh, tôi có thể thích các hình ảnh đa chiều, vì chúng được tạo thành từ tập hợp các pixel Mỗi pixel giúp xác định các đặc điểm quan trọng tại một vị trí cụ thể trong không gian hình ảnh, đóng vai trò trong việc nhận diện đối tượng Do đó, quá trình xử lý hình ảnh có thể được mô tả như một hàm của các biến n chiều, trong đó P (c1, c2, , cn) đại diện cho các đặc trưng hoặc dấu hiệu tại các điểm khác nhau trong không gian hình ảnh.
Sơ đồ tổng quát xử lý ảnh của một hệ thống:
Hình 1.2 Các bướccủamộthệthốngxử lý ảnhcơ bản
1.1.2 XU HƯỚNG TRA CỨU VÀ CHÚ Ý TRONG TRUY VẤN ẢNH
Giai đoạn xử lý đầu tiên trong xử lý hình ảnh kỹ thuật số là tiền xử lý, nhằm nâng cao chất lượng hình ảnh ban đầu Các bước tiếp theo trong quá trình này bao gồm nâng cấp, khôi phục hình ảnh, điều chỉnh hình học và giảm nhiễu để cải thiện độ rõ nét và độ chính xác của hình ảnh Đặc điểm nổi bật của tra cứu ảnh là khả năng xử lý linh hoạt và tối ưu hóa hình ảnh để phục vụ các ứng dụng tìm kiếm dựa trên nội dung hình ảnh.
- Thông tin hoàn toàn số hóa
- Hình thức biểu hiện: pixel
- có thể được đọc và tải xuống qua Internet
- Nội dung truyền tải bằng văn bản, bằng hình ảnh
Hệ thống đa truy cập cho phép nhiều người dùng cùng lúc truy cập và sử dụng phần mềm hoặc dịch vụ từ nhiều điểm truy cập khác nhau Về mặt lý thuyết, một sản phẩm có thể được truy cập nhiều lần thông qua các điểm truy cập đa dạng, tận dụng tài nguyên điện tử có sẵn 24/7 Điều này đảm bảo tính linh hoạt và khả năng phục vụ liên tục cho người dùng mọi lúc mọi nơi, phù hợp với xu hướng sử dụng dịch vụ trực tuyến hiện nay.
- Tốc độ: Tìm kiếm, thu thập, tóm tắt thông tin chính vào những hỉnh ảnh khác, tìm kiếm và tham chiếu chéo giữa nhiều hình ảnh khác nhau
- Chức năng: hình ảnh cho phép người dùng xem và và đối sánh nội dung đó bằng những phương pháp khác nhau
- Nội dung: Hình ảnh có thể chứa một ý nghĩa
Phân đoạn hình ảnh là bước quan trọng để xác định các đối tượng trong ảnh dựa trên đặc trưng như màu sắc, cấu trúc và vị trí của điểm ảnh Các phương pháp phân đoạn thường sử dụng kỹ thuật nhóm cụm (clustering) để tạo ra các vùng liên thông có cùng đặc điểm, giúp dễ dàng xác định các khu vực tương tự trong ảnh Mục tiêu của việc phân đoạn là chia ảnh thành các phần có tính đồng nhất cao, từ đó làm cơ sở để xây dựng chữ ký nhị phân và mô tả nội dung hình ảnh Quá trình này dựa trên các thông tin cấp thấp như màu sắc, vị trí và kết cấu của điểm ảnh, nhằm tự động hóa và nâng cao hiệu quả phân đoạn ảnh.
1.1.2.1.MỘT SỐ HỆ THỐNG TRUY VẤN ẢNH VÀ HÌNH THÁI TRUY VẤN
* Trích chọn ra đặc điểm
Các đặc điểm của đối tượng xuất phụ thuộc vào mục tiêu nhận dạng, được xác định trong quá trình xử lý hình ảnh Việc khai thác các tính năng giúp nhận diện chính xác các đối tượng hình ảnh, đồng thời đảm bảo tốc độ xử lý nhanh và tối ưu hóa lưu trữ dung lượng.
Bạn có thể xác định một khu vực trong hình ảnh bằng cách ghi lại tọa độ của nó Phương pháp này cho phép áp dụng cho các hình ảnh khác để nhận diện cùng một vị trí một cách chính xác Việc ghi lại tọa độ giúp mở rộng khả năng phân tích hình ảnh trong các dự án xử lý hình ảnh và nhận dạng đối tượng hiệu quả hơn.
Có thể cố gắng xác định cường độ đặc trưng của vùng giá trị mệnh giá trong hình ảnh, chọn và thao tác với vùng giá trị của nó
Nhận dạng tự động, miêu tả đối tượng, tra cứu và gộp các mẫu là các vấn đề quan trọng trong lĩnh vực thị giác máy tính, ngày nay còn được ứng dụng rộng rãi trong các nghiên cứu khoa học khác Các mẫu có thể là hình ảnh vân tay, hình ảnh của một đối tượng, từ viết tay, khuôn mặt người hoặc biểu đồ tín hiệu lời nói Quá trình nhận dạng mẫu bao gồm việc xác định, mô tả và tra cứu các mẫu để nhận diện chính xác các đối tượng trong hệ thống thị giác máy tính.
Trong quá trình tra cứu dữ liệu, có thể sử dụng các phương pháp giám sát như phân biệt hoặc phân tích để xác định các mẫu dựa trên đặc điểm đã được xác định trước Ngoài ra, các phương pháp tra cứu hoặc phân cụm không giám sát sẽ phân loại các mẫu dựa trên các tiêu chuẩn chung nhưng chưa xác định rõ các lớp cụ thể Các lớp này thường còn ở trạng thái chưa xác định hoặc chưa phân biệt rõ ràng khi thực hiện tra cứu.
Hệ thống định dạng auto bao gồm 3 giai đoạn tương xứng với ba giai đoạn liệt kê như sau:
• Tiền xử lý, và thu thập dữ liệu
• Miêu tả của dữ liệu
• Xác định và đưa quyết định
4 cách khác nhau tiếp cận đối với nhận dạng qua lý thuyết là:
• Mẫu phù hợp dựa trên những tính năng được chọn
• Tra cứu số liệu thống kê
• Tra cứu dựa trên mạng lưới thần kinh do con người tạo ra
Các ứng dụng tra cứu không thể dựa vào duy nhất một phương pháp để đạt được kết quả tối ưu; do đó, việc kết hợp nhiều phương pháp tiếp cận khác nhau cùng lúc là cần thiết Phương pháp tra cứu tổ hợp đang ngày càng được sử dụng phổ biến để nhận dạng chính xác hơn trong hệ thống, đặc biệt là trong thiết kế hệ thống lai Các kỹ thuật này mang lại những kết quả đầy hứa hẹn, góp phần nâng cao hiệu quả và độ chính xác của quá trình tra cứu dữ liệu.
Các ứng dụng mới phát sinh trong cuộc sống đặt ra những thách thức về thuật toán và yêu cầu phải có các giải pháp phù hợp Đặc điểm chính của các ứng dụng này là chúng thường dựa trên các tính năng thiết yếu, không thể đề xuất bởi các chuyên gia, mà phải được trích xuất từ quá trình phân tích dữ liệu Việc nhận dạng và xử lý các ứng dụng này đóng vai trò quan trọng trong việc nâng cao hiệu quả của các hệ thống tự động và phân tích dữ liệu lớn.
Ảnh xám được chuyển từ ảnh màu dựa trên cách thể hiện dữ liệu pixel trong hình ảnh kỹ thuật số Mỗi pixel của hình ảnh màu gồm ba thành phần màu chính là Đỏ (R), Xanh lục (G), và Xanh lam (B), với các mức độ cường độ ánh sáng khác nhau, mỗi thành phần thường biểu thị bằng 8 bit tương ứng với 256 cấp độ màu Để tạo ra các màu nhìn thấy được, các màu chính R, G, và B được sắp xếp gần nhau và phối hợp tạo thành khoảng gần 17 triệu màu khác nhau trong ảnh màu Trong khi đó, hình ảnh thang độ xám chỉ sử dụng một thành phần màu duy nhất, với 256 mức độ xám tương ứng với 8 bit, giúp tái tạo hoàn chỉnh cấu trúc hình ảnh dựa trên mức xám mà không cần đến các thành phần màu phụ.
Trong xử lý hình ảnh, việc chú trọng đến cấu trúc và hình ảnh chính thường khiến chúng ta bỏ qua tác động trực tiếp của màu sắc Do đó, chuyển đổi hình ảnh màu sang ảnh thang độ xám là một phương pháp phổ biến nhằm tối ưu hóa quá trình xử lý Việc này giúp giảm độ phức tạp của thuật toán và tăng tốc xử lý hình ảnh một cách hiệu quả.
* Lược đồ Histogram mức xám của ảnh
Hình ảnh kỹ thuật số có lược đồ màu xám những mức màu xám ở phạm vi
ĐỘ ĐO KHOẢNG CÁCH
Dựa trên ý tưởng về giao điểm của lược đồ được so sánh, chúng ta tổng hợp các giá trị thu nhận từ lược đồ này để xác định các đo tối thiểu cần thiết Phép đo tối thiểu dựa trên việc tính toán giá trị tối thiểu tại từng K bin, đảm bảo độ chính xác và hiệu quả trong phân tích dữ liệu Trong khi đó, phép đo max dựa trên các giá trị tối đa tại mỗi K bin, giúp xác định các điểm đặc trưng quan trọng trong lược đồ Các phương pháp này giúp tối ưu hóa việc đo lường và phân tích, cung cấp cái nhìn toàn diện về dữ liệu và hỗ trợ trong việc ra quyết định chính xác hơn.
Khoảng cách Euclid được tính K Bin bằng công thức như sau:
Trong bài viết này, chúng ta xem xét về khái niệm của bảng chữ cái (A), gồm các ký hiệu hữu hạn, còn gọi là chữ cái, từ đó tạo thành các trình tự hoặc chuỗi ký tự Chuỗi ký tự s = s1s2 sn được hình thành từ các ký hiệu trong bảng chữ cái A, trong đó s có thể là một chuỗi ký tự có độ dài từ 1 trở lên hoặc là chuỗi rỗng (ký hiệu là ε), có độ dài null Hiểu rõ về các khái niệm này giúp nắm bắt các phần mềm liên quan đến lý thuyết ngôn ngữ hình học và xây dựng các mô hình xử lý ngôn ngữ tự nhiên hiệu quả.
Trong lĩnh vực nhận dạng và học máy, trình tự này được sử dụng để mã hóa các đối tượng dựa trên cấu trúc tương đối đồng nhất của chúng Bên cạnh đó, tôi sẽ giới thiệu ngắn gọn về các loại máy đo khoảng cách phổ biến nhất, giúp hệ thống xác định chính xác vị trí và khoảng cách của các đối tượng trong môi trường thực tế.
2.1.3 ĐỘĐO KHOẢNG CÁCH HAMMING Đây là một trong những biện pháp đơn giản nhất: đối với hai chuỗi có độ dài bằng nhau, nó đếm vị trí của các ký hiệu khác nhau Để tránh mất tính tổng quát, hãy s = s1s2 sn và t = t1 t2 tn, đó là các chuỗi nhị phân
Khoảng cách Hamming sau đó được xác định như sau d Ham (s, t) = ∑n k
Chỉ số (sk # tk) không phải là một biện pháp linh hoạt vì nó giả định các chuỗi có độ dài cố định, trong khi thực tế, nhiều vấn đề yêu cầu xử lý các chuỗi có độ dài thay đổi Thêm vào đó, các vị trí tượng trưng cho sự phù hợp có thể không ổn định, khiến các biến thể nhỏ về vị trí dẫn đến các giá trị khoảng cách Hamming bị phóng đại đáng kể.
Một khoảng trống Hamming mờ đã được đề xuất để tạo ra khoảng cách Hamming rất nhạy cảm, phù hợp cho các chuỗi có độ dài bằng nhau Khoảng cách này dựa trên việc chuyển đổi một chuỗi thành một chuỗi khác bằng các thao tác chỉnh sửa như chèn, xóa và thay đổi ký tự, với các giá trị trọng số cins, cdel và csub được gán tương ứng Các hoạt động chỉnh sửa này giúp đo lường độ tương đồng giữa các chuỗi một cách chính xác và hiệu quả trong các ứng dụng xử lý dữ liệu và mã hóa.
Các hoạt động dịch chuyển tức thời giúp chuyển đổi 1 bit trong một chuỗi thành gần 1 bit trong chuỗi khác với chi phí thấp hơn, nhờ vào thao tác xóa và chèn Quá trình này được sử dụng để biến đổi một chuỗi ký tự thành một chuỗi khác, trong đó tổng chi phí của các hoạt động được tối thiểu hóa để đảm bảo sự khác biệt giữa hai chuỗi là nhỏ nhất có thể, tối ưu cho các ứng dụng so sánh chuỗi và tìm kiếm văn bản.
Xấp xỉ Cách Hamming mờ là số liệu nếu cdel = cins và cho kích thước tuyệt đối
Precision đo lường tỷ lệ các điểm được phân loại là positive thực sự đúng (TP) trên tổng số điểm được phân loại là positive (TP + FP), giúp đánh giá độ chính xác của mô hình Recall phản ánh khả năng của mô hình trong việc phát hiện các điểm thực sự là positive, bằng tỷ lệ các điểm true positive trên tổng số điểm thực sự là positive (TP + FN) Cả Precision và Recall đều là các phân số có tử số giống nhau (TP), nhưng mẫu số khác nhau, thể hiện các khía cạnh khác nhau của hiệu quả mô hình trong phân loại.
TPR và Recall là hai đại lượng bằng nhau, cho thấy chúng thể hiện cùng một khái niệm trong đánh giá mô hình Cả Precision và Recall đều là các số không âm nhỏ hơn hoặc bằng một, đảm bảo tính hợp lệ của các chỉ số đánh giá Precision cao thể hiện độ chính xác của các điểm được phát hiện là rất cao, trong khi Recall cao cho thấy tỷ lệ True Positive Rate (tỉ lệ các điểm thực sự dương tính được phát hiện) là lớn, tức là mô hình ít bỏ sót các điểm dương tính thực sự.
ĐỘ ĐO HỖN HỢP
Trong các phép tính hỗn hợp được Goodall đề cập, việc đo lường mức độ giống nhau giữa các lớp đối tượng đóng vai trò quan trọng Đầu tiên, cần tính toán số lượng cho từng thuộc tính của các lớp này, sau đó tổng hợp những số liệu đó để đưa ra kết luận chính xác Quá trình này giúp nâng cao hiệu quả trong phân tích và so sánh các lớp đối tượng, đáp ứng các yêu cầu của các phương pháp phân tích dữ liệu phức tạp.
Trong quá trình phân tích dữ liệu, cần xem xét các phép biến đổi theo từng loại để đảm bảo tính liên tục và phù hợp với thuộc tính rời rạc Ngoài ra, việc đánh giá các biện pháp có thuộc tính loại thứ tự cũng rất quan trọng nhằm khai thác thông tin mang tính thứ tự trong dữ liệu Đồng thời, cần phân biệt rõ các thuộc tính riêng biệt để tối ưu hóa quy trình xử lý và phân tích dữ liệu, từ đó nâng cao hiệu quả của các phương pháp phân tích thống kê và hệ thống hỗ trợ quyết định.
2.2.1 ĐỘĐO CÓ THUỘC TÍNH RỜI RẠC Đầu tiên xem xét thuộc tính có tính rời rạc Các thuộc tính giá trị không giống nhau sẽ không đem để so với nhau
Trong phân tích, các cặp giá trị không giống nhau thường có độ tương tự gần bằng 0, thể hiện sự khác biệt rõ ràng giữa các dữ liệu Ngược lại, các đôi giá trị chồng chéo nhau thường có độ tương tự cao, phản ánh mức độ liên kết chặt chẽ và phụ thuộc lớn giữa chúng Các cặp trùng lặp giá trị với xác suất xuất hiện thấp hơn thường có độ tương tự cao hơn, cho thấy sự trùng lặp ít xảy ra nhưng có mối liên hệ mạnh mẽ khi xảy ra Việc hiểu rõ các đặc điểm này giúp cải thiện quá trình phân tích dữ liệu và tối ưu hóa các chiến lược SEO liên quan.
Gọi Vi biểu sẽ biểu thị giá trị ứng với thuộc tính khác nhau Hiện diện xác suất của các giá trị này sẽ là:
Gọi S ij là độ tương quan của 2 cặp V i và V i , khi đó:
Thêm vào đó: Đặt Pij là khả năng hiện diện của một cặp định nghĩa có độ tương quan (Vi, Vj) nhỏ hơn Ta thấy:
Q được tính theo công thức đã đề cập, trong đó các xác suất p_i thường không biết trước nhưng có thể ước lượng dựa trên tần suất xuất hiện của chúng trong mẫu Số lượng m đại diện cho số đơn vị có trong tệp mẫu, còn f_i là số lần lặp lại của V_i, giúp chúng ta ước lượng gần đúng độ đo dựa trên dữ liệu thực tế.
Một thuộc tính riêng biệt thường có một tập hợp các miền (giá trị) được xác định trước và gồm các giá trị rời rạc, giúp phân loại dữ liệu một cách rõ ràng Ví dụ, thuộc tính "loại ô tô" gồm các giá trị như {xe tải, xe hơi hành khách, xe hơi, taxi}, thể hiện các loại xe khác nhau một cách rõ ràng và dễ nhận diện.
Việc phân chia dữ liệu dựa trên kiểm tra tính hợp lệ là một bước quan trọng trong xử lý dữ liệu, trong đó sự rời rạc được lựa chọn khi một trường hợp cụ thể có giá trị cố định cho thuộc tính đó Các bài kiểm tra logic đơn giản như kiểm tra xem giá trị có thuộc miền xác định hay không (ví dụ: X với miền X) giúp giảm tải tài nguyên máy tính và đảm bảo tính chính xác của dữ liệu Đối với các thuộc tính liên tục, chẳng hạn như thuộc tính định dạng ảnh, tập giá trị không xác định rõ ràng, do đó cần sử dụng kiểm tra nhị phân dựa trên giá trị của thuộc tính (ví dụ: value(A)) để phân loại dữ liệu hiệu quả hơn.
Trong đó, θ là hằng số ngưỡng được xác định dựa trên các giá trị riêng lẻ hoặc các cặp giá trị liền kề của thuộc tính liên tục trong tập dữ liệu đào tạo Việc xác định ngưỡng θ tối ưu nhằm phân chia dữ liệu một cách chính xác, phù hợp với chiến lược của từng thuật toán Đối với thuộc tính liên tục, cần kiểm tra các giá trị phân biệt d để tìm ngưỡng θbest bằng cách xem xét d-1 (A) ≤ i với i = 1 d-1 Thuật toán chọn ngưỡng trung bình của hai giá trị liền kề để đạt hiệu quả phân chia tối ưu.
2.2.2 ĐỘĐO CÓ THUỘC TÍNH CÓ THỨ TỰ Ở đây, chúng ta cần tính đến thứ tự trong cùng một biện pháp Do thứ tự, độ tương tự sẽ ít hơn một cặp giá trị khi đem so sánh giữa chúng Thí dụ, Giả sử có cặp (B, C) lúc này có độ tương tự hơn A, C và cặp B, E Nhưng, ở đây chưa thể so sánh nếu so sánh với cặp A, C và cặp B, E Xác suất hiện hiện sẽ được dùng công thức để xác định giá trị
Giả sử những giá trị có thuộc tính V 1 ,V 2 , ,V n
Xác suất Pij có thể xuất hiện một cặp có sẽ có độ tương đồng hơn V i ,V j được cho bởi công thức:
Trong phân cụm, một yếu tố quan trọng là thuật toán cần bất biến với sự biến đổi đều của các giá trị tương tự giữa các đối tượng, đảm bảo tính ổn định của kết quả Việc ước lượng các giá trị tương tự bởi các chuyên gia theo một thang đo có thứ tự là cần thiết để nâng cao độ chính xác của phân tích Thêm vào đó, thuật toán phân cụm cũng phải không nhạy cảm với việc lựa chọn độ đo phù hợp hoặc không phù hợp, giúp đảm bảo tính khách quan và độ tin cậy của các kết quả phân tích dữ liệu.
2.2.3 ĐỘĐO CÓ THUỘC TÍNH LIÊN TỤC
Trong thuộc tính này, khoảng cách được tính dựa trên chênh lệch giữa các giá trị được xem xét, nhằm đo độ tương tự một cách chính xác Tiêu chí chính để đánh giá mức độ giống nhau là dựa trên giá trị của khoảng cách đó; các cặp dữ liệu trùng nhau sẽ có độ tương tự lớn hơn so với các cặp có giá trị khác nhau Điều này giúp xác định rõ ràng mức độ tương đồng giữa các đối tượng để phục vụ các phân tích dữ liệu chính xác và hiệu quả hơn.
Các giá trị có khoảng cách bé sẽ giống hơn so với các cặp lớn hơn Khi đó thì cặp mang độ đo giống nhau cần sử dụng công thức tính:
2.2.4 ĐỘĐO KẾT HỢP CÁC THUỘC TÍNH
Các thuộc tính mang độ đo tương tục thể hiện giá trị liên tục của từng thuộc tính cụ thể Phép đo độ đo tương tự được áp dụng cho các cặp đối tượng để xác định mức độ liên kết giữa chúng Quá trình liên kết này yêu cầu giả định rằng các giá trị của các thuộc tính đều độc lập với nhau, giúp đảm bảo tính chính xác và khách quan của phép đo Các phương pháp này đóng vai trò quan trọng trong phân tích dữ liệu và xây dựng mô hình dự báo chính xác hơn.
ĐỘ ĐO TƯƠNG TỰ DỰA TRÊN HISTOGRAM [9]
2.3.1 GIỚI THIỆU VÀ KHÁI NIỆM
Histogram là một dạng biểu đồ dạng cột thể hiện tần suất Dữ liệu sẽ được mô tả 1 cách đơn giản, không làm mất thông tin của dữ liệu
Lược đồ ở mức xám của bất kỳ hình ảnh nào chứa lượng thông tin nhất định, giúp xác định rõ các đặc điểm quan trọng trong ảnh Các loại hình ảnh này được xác định hoàn toàn dựa trên sơ đồ gắn với mức xám đã được định nghĩa, từ đó tối ưu hóa quá trình phân tích và xử lý hình ảnh.
Việc tính toán cho biểu đồ cũng trở lên giản đơn khi được một hình ảnh được sao chép từ các vị trí khác khau
Biểu đồ mức xám là một công cụ hiển thị quan trọng trong xử lý ảnh, thể hiện số lượng pixel của từng cấp độ màu xám trong ảnh Trục dọc của biểu đồ biểu thị tần suất, tức là số pixel tương ứng với mỗi mức xám Đây là một phương pháp phân tích hình ảnh giúp nhận biết mức độ phân bố của các màu xám trong ảnh, hỗ trợ quá trình chỉnh sửa và xử lý ảnh hiệu quả.
Có nhiều phương pháp xác định lược đồ mức xám nhằm đánh giá tính hữu ích của nó Ví dụ, một hình ảnh có thể được phân tích thông qua hàm D(x, y), trong đó hàm này thay đổi chậm từ vùng cao xuống thấp tại trung tâm của mức xám Việc này giúp làm rõ đặc điểm và cấu trúc của hình ảnh dựa trên mức xám, hỗ trợ các ứng dụng xử lý ảnh một cách hiệu quả.
Chọn cấp độ màu xám D1 để xác định các kết nối liên kết các điểm biểu diễn giá trị D1 lại với nhau Phương pháp này tạo thành một tập hợp các đường cong kín bao quanh các khu vực có độ màu xám lớn hoặc bằng D1 Quá trình này giúp phân vùng vùng có màu xám đáng kể, hỗ trợ phân tích hình ảnh chính xác hơn.
Hàm A (D) của hình ảnh liên tục của vùng đóng, biểu đồ mức xám của hình ảnh liên tục mang giá trị âm trong biểu đồ của nó
Với hàm rời rạc thì trường hợp này, ta đặt D=1 thì:
Diện tích hình ảnh kỹ thuật số chỉ đơn giản là số lượng Pixcel có mức xám lớn, có thể bằng bất kỳ mức xám D nào
* Lược đồ hai chiều của mức xám
Thông thường mọi người tạo ra sơ đồ cấp độ xám với kích thước từ hai trở lên Điều này đặc biệt hữu ích cho các bức ảnh màu)
Lược đồ tỷ lệ xám hai chiều thể hiện sự phân bố của hai biến mức xám trong một hàm, sử dụng hai màu xanh và đỏ để biểu diễn Tọa độ (DR, DB) đại diện cho mức xám tương ứng của hình ảnh màu đỏ và màu xanh, trong đó mỗi pixel được xác định bởi mức độ xám DR trong ảnh màu đỏ và mức độ xám DB trong ảnh màu xanh Đây là công cụ quan trọng giúp phân tích và so sánh sự khác biệt giữa các kênh màu trong ảnh đa phổ, nâng cao khả năng nhận diện và xử lý hình ảnh hiệu quả.
Pixcel sẽ có mức độ xám màu đỏ, sẽ tập trung ở trên đường chéo của lược đồ và ngược lại
2.3.2 LƯỢC ĐỒ XÁM VÀ TÍNH CHẤT
Khi biểu diễn một hình ảnh dưới dạng lược đồ mức xám, các dữ liệu khác của hình ảnh sẽ bị loại bỏ, chỉ tập trung vào số lượng pixel ở mỗi cấp độ màu xám mà không liên quan đến vị trí của chúng trong hình Lược đồ mức xám xác định phân bố mức xám của hình ảnh, nhưng không phản ánh các chi tiết về vị trí hay hoạt động của các đối tượng trong ảnh Nhiều hình ảnh khác nhau có thể có sơ đồ mức xám giống nhau, do các hoạt động di chuyển không ảnh hưởng đến phân bố mức xám Nếu giả sử hình ảnh chỉ chứa một màu xám duy nhất trên nền và ranh giới được xác định bởi mức xám D1, thì sơ đồ mức xám giúp phân biệt các vùng dựa trên mức độ sáng tối.
Trong một hình ảnh chứa nhiều đối tượng, các ranh giới của chúng được thể hiện bằng các đường viền màu xám ở mức D1, giúp xác định diện tích của tất cả các đối tượng Hàm tính diện tích này cũng tạo ra phân phối tích lũy của hình ảnh, giúp phân tích chính xác hơn Lược đồ mức xám còn có lợi ích quan trọng khác là đếm số lượng pixel trong từng cấp độ xám, hỗ trợ trong các quá trình phân đoạn hình ảnh Khi hình ảnh có hai vùng riêng biệt và lược đồ mức xám đã biết, có thể thêm chúng vào một lược đồ chưa xử lý, mở ra khả năng áp dụng trong nhiều lĩnh vực chuyên biệt.
Lược đồ xám là yếu tố cơ bản trong kỹ thuật xử lý ảnh trong miền không gian, đóng vai trò quan trọng trong nâng cao chất lượng ảnh Việc xử lý lược đồ xám giúp làm rõ chi tiết và tăng cường độ tương phản của hình ảnh Áp dụng các phương pháp chuyển đổi lược đồ xám hiệu quả sẽ giúp cải thiện rõ rệt kết quả xử lý ảnh Trong lĩnh vực xử lý ảnh, nắm vững kỹ thuật xử lý lược đồ xám là bước quan trọng để tối ưu hóa chất lượng hình ảnh.
Lược đồ xám là một công cụ rất hữu ích trong các ứng dụng khác của xử lý ảnh, chẳng hạn như nén ảnh và phân đoạn ảnh
Việc tính toán trên lược đồ xám rất đơn giản, nên việc thiết kế phần cứng để thực hiện các công việc tính toán này rất “tiết kiệm”
2.3.3 QUAN HỆ GIỮA ẢNH TRA CỨU VÀ LƯỢC ĐỒẢNH XÁM
Lược đồ mức xám của một ảnh thường chỉ có duy nhất một, giúp dễ dàng xác định và định dạng ảnh Mặc dù kỹ thuật này ít thường được sử dụng, nhưng nó cung cấp những hiểu biết sâu sắc về lược đồ và là nền tảng để phát triển các phương pháp xử lý hình ảnh nâng cao hơn.
Ví dụ: cần tính toán sơ đồ mức xám, ta có một hình ảnh mà hàm đã cho:
Việc xác định diện tích trong các mức độ xám là khá khó khăn do tính chất phức tạp của dữ liệu Do đó, cần thực hiện bước nhận lược đồ và tính diện tích dựa trên biểu diễn hình ảnh trước để đạt độ chính xác cao hơn Quan sát kỹ lưỡng hình ảnh giúp bạn nhận diện rõ các vùng cần phân tích, từ đó dễ dàng tính toán diện tích chính xác hơn trong các ứng dụng xử lý ảnh.
Trong bài viết này, chúng ta bắt đầu bằng ví dụ về diện tích, trong đó từ "diện tích" chủ yếu đề cập đến chiều dài, giúp làm rõ mối quan hệ giữa lược đồ và hình ảnh minh họa Diện tích là yếu tố quan trọng trong việc hiểu cách thể hiện và liên kết các yếu tố không gian trong các bản đồ và hình ảnh trực quan Việc nắm rõ mối liên hệ này giúp người đọc dễ dàng hình dung và phân tích các dữ liệu không gian một cách chính xác hơn.
Nhận thấy các xung một chiều Gauss được đưa ra bởi:
Khi x >= 0 (không âm), hàm số thể hiện tính đơn điệu rõ ràng, đồng thời khu vực chỉ đơn thuần biểu diễn ảnh Do đó, trong trường hợp này, ta có thể sử dụng hàm I(x) để làm hàm cấp độ xám, giúp dễ dàng xử lý và phân tích ảnh một cách hiệu quả và chính xác.
Một nửa hình ảnh sẽ được đối lại với diện tích Hai nửa sẽ đối xứng, diện tích khi đó gấp đôi
Lược đồ được cho bởi:
Chức năng khu vực tập trung vào phía bên phải của hình ảnh, phản ánh tính đối xứng của hai nửa hình Lược đồ trở nên rõ nét hơn khi D = 0 do các vùng mức xám nhỏ hơn so với mức xám tại vị trí x Đỉnh sắc nét đạt giá trị nhỏ khi D = 1, thể hiện độ dốc (độ dốc) của ảnh tại mức này.
0 tại x = 0 (ví dụ: xung Gaussian "phẳng" cục bộ ở trên cùng)
Quy trình xử lý tương tự được áp dụng cho hình ảnh hai chiều, đặc biệt tập trung vào việc cân đối đối xứng trong ảnh Đặc biệt, chúng ta có thể đạt được đối xứng tròn nhờ vào việc sử dụng hàm Gaussian đối xứng tập trung vào trung tâm của hình ảnh Hình ảnh này được mô tả trong hệ tọa độ cực, giúp dễ dàng phân tích các đặc điểm đối xứng Bên cạnh đó, với một vòng tròn có bán kính xác định, các đường bao xung quanh gồm những khu vực quan trọng cần chú ý trong quá trình xử lý và phân tích hình ảnh.
Hình ảnh theo nội dung được tìm kiếm (CBIR) hay truy xuất hình ảnh dựa trên truy vấn là một ứng dụng quan trọng trong lĩnh vực thị giác máy tính, giúp tra cứu hình ảnh một cách chính xác Phần mềm xử lý nội dung hình ảnh này có khả năng phân tích và hiểu rõ nội dung thực tế của hình ảnh, nâng cao hiệu quả các hệ thống tìm kiếm hình ảnh dựa trên nội dung.
CHƯƠNG 3: ỨNG DỤNG ĐỘĐO TƯƠNG TỰ TRONG VIỆC TRA CỨU ẢNH TRONG FILE CAMERA ĐƯỜNG PHỐ
GIỚI THIỆU
Giới thiệu về bài toán:
Nhiệm vụ của bài toán là xây dựng chương trình có chức năng sau:
Sơ đồ khố mô tả hoạt động của chương trình:
Khi người dùng cần tra cứu một hình ảnh để xác định xem nó có nằm trong các khung hình của file camera đường phố hay không, hệ thống sẽ xử lý và phân tích dữ liệu Chương trình sử dụng tập hợp 100 khung hình ảnh thu thập từ camera đường phố để so sánh, giúp đưa ra kết quả chính xác và nhanh chóng Điều này hỗ trợ trong việc giám sát và quản lý an ninh đô thị hiệu quả hơn.