1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dân

82 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dân
Tác giả Nguyễn Xuân Dương
Người hướng dẫn PGS. TS Phạm Thế Bảo
Trường học Trường Đại học Ngoại ngữ - Tin học Thành phố Hồ Chí Minh
Chuyên ngành Ngành Công nghệ Thông tin
Thể loại Luận văn Thạc sĩ
Năm xuất bản 2019
Thành phố TP. Hồ Chí Minh
Định dạng
Số trang 82
Dung lượng 1,17 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

  • 1.1. Lý do chọn đề tài (12)
  • 1.2. Mục đích nghiên cứu của luận văn (13)
    • 1.2.1. Về khoa học (13)
    • 1.2.2. Về thực tiễn (13)
  • 1.3. Các phương pháp nghiên cứu (13)
    • 1.3.1. Phương pháp nghiên cứu lý thuyết (13)
    • 1.3.2. Phương pháp nghiên cứu thực nghiệm (14)
    • 1.3.3. Đề tài nhằm thực hiện mục tiêu sau (14)
    • 1.3.4. Đối tượng của luận văn (14)
  • CHƯƠNG I: GIỚI THIỆU TỔNG QUAN BÀI TOÁN TRÍCH XUẤT THÔNG TIN TỰ ĐỘNG TỪ ẢNH THẺ CĂN CƯỚC CÔNG DÂN (16)
    • 1.1. Giới thiệu thẻ căn cước công dân (16)
    • 1.2. Bài toán trích xuất thông tin tự động từ thẻ CCCD (18)
    • 1.3. Các hướng tiếp cận (18)
    • 1.4. Các khó khăn và thách thức (19)
    • 1.5. Đề xuất hướng giải quyết bài toán (20)
      • 1.5.1. Tiền xử lý ảnh (21)
      • 1.5.2. Phân đoạn tách các vùng dữ liệu (21)
      • 1.5.3. Nhận dạng ký tự và xuất thông tin các vùng dữ liệu (21)
      • 1.5.4. Phương pháp thực hiện (21)
    • CHƯƠNG 2: CƠ SỞ LÝ THUYẾT (23)
      • 2.1. Tiền xử lý (23)
        • 2.1.1. Bộ lọc thông thấp (0)
        • 2.1.2. Lọc băng thông cao (25)
        • 2.1.3. Bộ lọc High boost (27)
      • 2.2. Hiệu chỉnh độ nghiêng của văn bản (27)
        • 2.2.1. Xác định góc nghiêng dựa trên biến đổi Hough (28)
      • 2.3. Nhị phân hóa ảnh (29)
        • 2.3.1. Phân loại các phương pháp xác định ngưỡng T (31)
        • 2.3.2. Phương pháp xác định ngưỡng T theo Niblack (32)
        • 2.3.3. Phương pháp Otsu (33)
        • 2.3.4. Nhận xét (35)
      • 2.4. Tổng quan về mạng nơron (35)
        • 2.4.1. Mạng nơron nhân tạo (35)
        • 2.4.2. Các đặc trưng cơ bản của mạng nơron (35)
        • 2.4.3. Các thành phần cơ bản của mạng nơron nhân tạo (36)
        • 2.4.4. Các cấu trúc của mạng nơ ron (40)
        • 2.4.5. Mạng hồi quy (41)
        • 2.4.6. Huấn luyện mạng Nơron (42)
        • 2.4.7. Các phương pháp học (42)
        • 2.4.8. Mạng truyền thẳng (46)
        • 2.4.9. Kết luận chương (48)
    • CHƯƠNG 3: XÂY DỰNG THUẬT TOÁN PHÂN TÍCH (49)
      • 3.1. Tiền xử lý (49)
        • 3.1.1. Chuyển ảnh màu về ảnh đa cấp xám (49)
        • 3.1.2. Làm trơn ảnh (50)
        • 3.1.3. Nhị phân hóa ảnh (50)
        • 3.1.4. Căn chỉnh độ nghiêng (51)
      • 3.2. Phân đoạn các vùng (52)
        • 3.2.1 Phân tích các trường thông tin ở mặt trước (52)
        • 3.2.2. Xác định các vùng có ký tự ở mặt trước (52)
        • 3.2.3. Phân đoạn vùng Số CCCD (53)
        • 3.2.4. Tách các trường thông tin còn lại (56)
        • 3.2.5. Tìm mặt nạ dòng (57)
        • 3.2.6. Tách các đối tượng thuộc mỗi dòng (57)
        • 3.2.7. Xoá tiêu đề (59)
        • 3.2.8. Phục hồi các ký tự bị mất (60)
        • 3.2.9. Tách các trường thông tin ở mặt sau (61)
      • 3.3. Huấn luyện mạng nơ ron phân tích ảnh để nhận dạng ký tự (64)
      • 3.4. Kết luận chương (69)
  • CHƯƠNG IV: KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN (70)
    • 4.1. Xây dựng bộ dữ liệu (70)
    • 4.2. Môi trường thực nghiệm (73)
    • 4.3. Thời gian thực nghiệm (75)
    • 4.4. Kết quả thực nghiệm (75)
      • 4.4.1. Kết quả trên tập dữ liệu A1 (76)
      • 4.4.2. Kết quả trên tập dữ liệu A2 (76)
    • 4.5. Đánh giá (77)
      • 4.5.1. Ưu điểm (77)
      • 4.5.2. Khuyết điểm (78)
    • 4.6. Hướng phát triển (79)
    • 4.7. Kết luận (80)

Nội dung

Luận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dânLuận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dânLuận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dânLuận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dânLuận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dânLuận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dânLuận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dânLuận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dânLuận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dânLuận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dânLuận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dânLuận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dânLuận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dânLuận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dânLuận văn Thạc sĩ Công nghệ thông tin: Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dân

Mục đích nghiên cứu của luận văn

Về khoa học

+ Xây dựng các thuật toán giải quyết bài toán trích xuất thông tin tự động từ thẻ CCCD

+ Đóng góp hỗ trợ các ứng dụng khác.

Về thực tiễn

Trong lĩnh vực cải cách thủ tục hành chính, việc giảm thiểu thời gian, công sức và chi phí đã mang lại hiệu quả rõ rệt trong nâng cao năng lực xử lý và trích xuất dữ liệu Công nghệ số giúp lưu trữ dữ liệu nhanh chóng, chính xác, góp phần nâng cao hiệu quả quản lý và dịch vụ trong nhiều lĩnh vực khác nhau.

Các lĩnh vực có thể áp dụng rộng rãi bao gồm sân bay, nhà ga, bến tàu, khách sạn, ngân hàng, bảo hiểm, y tế, phòng công chứng, văn phòng UBND các cấp và các sở ban ngành Việc triển khai trong các lĩnh vực này giúp nâng cao hiệu quả công việc, đảm bảo an ninh và thuận tiện cho khách hàng Áp dụng công nghệ vào các ngành này cũng góp phần thúc đẩy sự phát triển bền vững và hiện đại hóa dịch vụ công cộng.

+ Đề tài đáp ứng được yêu cầu kỹ thuật công nghệ thông tin trong tự động hóa.

Các phương pháp nghiên cứu

Phương pháp nghiên cứu lý thuyết

Nghiên cứu tổng hợp về nâng cao chất lượng ảnh số là một lĩnh vực quan trọng trong xử lý ảnh, tập trung vào các phương pháp và thuật toán tiên tiến nhằm cải thiện độ rõ nét và chi tiết của hình ảnh tài liệu Các phương pháp nâng cao chất lượng ảnh tài liệu như tăng cường độ tương phản, lọc nhiễu và nâng cao độ phân giải đã được phân tích và so sánh để xác định hiệu quả trong nhiều ứng dụng thực tế Việc tìm hiểu các kiến thức liên quan giúp phát triển các kỹ thuật mới phù hợp với yêu cầu ngày càng cao của việc số hóa và lưu trữ tài liệu số Nghiên cứu này cung cấp cơ sở nền tảng cho các giải pháp tối ưu nhằm nâng cao chất lượng ảnh digital, góp phần nâng cao khả năng nhận dạng và phân tích dữ liệu hình ảnh trong các hệ thống chuyển đổi số.

+ Nghiên cứu các tài liệu, bài báo liên quan là cơ sở lý luận của luận văn

Nghiên cứu các phương pháp tiếp cận, kỹ thuật và kỹ thuật hiện tại đã được các tác giả trong và ngoài nước công bố liên quan đến lĩnh vực xử lý ảnh, nhận dạng mẫu và máy học chuyên sâu Những công trình này đóng vai trò quan trọng trong việc nâng cao hiệu quả và độ chính xác của các hệ thống nhận dạng hình ảnh, góp phần phát triển các ứng dụng công nghệ thông minh Việc tổng hợp và phân tích các phương pháp này giúp xác định các xu hướng mới và đề xuất các hướng nghiên cứu tiềm năng trong lĩnh vực trí tuệ nhân tạo.

+ Nghiên cứu các xu thế và hướng phát triển tương lai liên quan đến luận văn.

Phương pháp nghiên cứu thực nghiệm

+ Sau khi nghiên cứu lý thuyết, phát biểu bài toán, đưa ra giải pháp xử lý, mô phỏng thử nghiệm chương trình trên ngôn ngữ lập trình python

+ Tiến hành phân tích, xây dựng giải pháp xử lý ảnh, nhận dạng gồm có: Tiền xử lý, trích chọn đặc trưng, huấn luyện mô hình, hậu xử lý

Chúng tôi tập trung vào xây dựng và kiểm thử các phương pháp nhận dạng bằng ngôn ngữ lập trình Python, kết hợp với các kỹ thuật máy học chuyên sâu và mạng nơ-ron nhân tạo để nâng cao độ chính xác Việc ứng dụng các thuật toán tiên tiến này giúp đánh giá hiệu quả của phương pháp nhận dạng một cách chính xác và tin cậy Đưa ra các kết quả thực nghiệm cho thấy sự cải thiện rõ rệt về hiệu suất nhận dạng khi sử dụng sự kết hợp giữa Python, học máy và mạng nơ-ron nhân tạo Các giải pháp này phù hợp cho các hệ thống yêu cầu độ chính xác cao và có thể dễ dàng mở rộng, tối ưu hóa cho các ứng dụng thực tế.

Đề tài nhằm thực hiện mục tiêu sau

+ Nghiên cứu tổng quan và đánh giá một số phương pháp tiêu biểu trong xử lý ảnh, nhận dạng, lọc nhiễu, lấy biên, trích xuất dữ liệu

+ Xây dựng thuật toán, mô phỏng một thuật toán để ứng dụng vào “Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dân”.

Đối tượng của luận văn

Hệ thống trích xuất tự động thông tin từ ảnh căn cước công dân giúp tối ưu quá trình xử lý dữ liệu và nâng cao độ chính xác Luận văn khảo sát và đánh giá các phương pháp nâng cao chất lượng ảnh số phổ biến và hiệu quả nhất để cải thiện chất lượng ảnh tài liệu Bài viết tập trung sâu vào việc thử nghiệm các phương pháp nâng cao chất lượng ảnh nhằm chứng minh tính đúng đắn và khả năng ứng dụng thực tế của hệ thống trong công việc thu thập và xác minh dữ liệu căn cước.

Với những yêu cầu đã đặt ra ở trên, cấu trúc của luận văn sẽ bao gồm bốn chương với những nội dung sau đây:

Chương 1: Giới thiệu tổng quan bài toán trích xuất thông tin tự động từ ảnh thẻ căn cước công dân Trong chương này giới thiệu tổng quan về bài toán

15 trích xuất thông tin từ ảnh căn cước công dân, các hướng tiếp cận, khó khăn và thách thức, đề xuất hướng giải quyết

Chương 2: Cơ sở lý thuyết Tác giả sẽ nghiên cứu các cơ sở lý thuyết, các thuật toán ứng dụng trong xử lý ảnh, phương pháp Niblack, Otsu, mạng nơ ron nhân tạo, mạng nơ ron nhân tạo chuyên sâu vv

Chương 3: Xây dựng thuật giải cho bài toán phân tích trích xuất trong tin tự động từ ảnh thẻ căn cước công dân Chương này sẽ phân tích thẻ CCCD, quy trình hệ thống xử lý, tiền xử lý, phân đoạn ảnh, xác định vùng xử lý, xây dựng hệ thống nhận dạng xử lý, trích xuất trong tin tự động từ ảnh thẻ căn cước công dân

Chương 4: Kết quả nghiên cứu, thực nghiệm và hướng phát triển của đề tài Trên cơ sở lý thuyết đã trình bày ở chương 1, 2 và 3 chúng tôi sẽ tiến hành xây dựng bộ dữ liệu, cài đặt chương trình, thử nghiệm hệ thống trích xuất thông tin tự động từ thẻ căn cước công dân và đánh giá kết quả và kết luận, định hướng phát triển của đề tài

GIỚI THIỆU TỔNG QUAN BÀI TOÁN TRÍCH XUẤT THÔNG TIN TỰ ĐỘNG TỪ ẢNH THẺ CĂN CƯỚC CÔNG DÂN

Giới thiệu thẻ căn cước công dân

Thẻ căn cước công dân (CCCD) là giấy tờ tùy thân quan trọng của công dân Việt Nam, được xác nhận bởi cơ quan nhà nước có thẩm quyền về lý lịch cá nhân Được ban hành lần đầu vào ngày 1/1/2016, CCCD thay thế cho giấy chứng minh nhân dân, giúp nâng cao hiệu quả quản lý công dân Thẻ căn cước công dân có hình chữ nhật, bốn góc cắt tròn, kích thước tiêu chuẩn gồm chiều dài 85,6 mm, chiều rộng 53,98 mm, và độ dày 0,76 mm.

Mặt trước thẻ Căn cước công dân gồm các thông tin quan trọng, trong đó bên trái là hình Quốc huy nước Cộng hòa xã hội chủ nghĩa Việt Nam cùng với các đặc điểm nhận dạng rõ nét Thông tin này giúp xác định danh tính người sở hữu và đảm bảo tính hợp pháp của thẻ trong các giao dịch hành chính Thiết kế của thẻ nhằm tăng cường tính an ninh, bảo vệ quyền lợi của công dân và đáp ứng các yêu cầu về chứng minh nhân thân theo quy định của pháp luật Việt Nam.

14 mm; ảnh chân dung của người được cấp thẻ Căn cước công dân cỡ 20 mm x

Căn cước công dân có giá trị đến ngày 30 mm; gồm các thông tin quan trọng như dòng chữ “CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM”, thể hiện quyền độc lập, tự do và hạnh phúc của đất nước Trên mặt bên phải của thẻ có các chi tiết như số CCCD, họ và tên, ngày tháng năm sinh, giới tính, quốc tịch, quê quán và nơi thường trú, như hình 1.1a.

Mặt sau thẻ Căn cước công dân gồm các thông tin quan trọng như mã vạch hai chiều ở phần trên cùng, giúp kiểm tra nhanh chóng thông tin cá nhân Bên trái thẻ gồm hai ô, ô trên chứa vân tay ngón trỏ trái, ô dưới là vân tay ngón trỏ phải của người sở hữu, đảm bảo xác thực chính xác Bên phải, từ trên xuống dưới, phản ánh đặc điểm nhận dạng của người được cấp thẻ cùng ngày, tháng, năm cấp thẻ Căn cước công dân Thêm vào đó, thẻ còn có họ, chữ đệm, tên, chức danh, chữ ký của người có thẩm quyền cấp thẻ, kèm dấu có hình Quốc huy của cơ quan cấp thẻ, như hình 1.1b, để tăng tính xác thực và đảm bảo quyền sở hữu hợp pháp.

Hình 1.1 Mẫu “Căn cước công dân”

Thẻ Căn cước công dân gồm hai mặt: mặt trước và mặt sau, đều có hoa văn màu xanh nhạt Mặt trước thẻ in hình ảnh trống đồng, bản đồ Việt Nam, hoa sen cùng các họa tiết trang trí, thể hiện nét đẹp truyền thống của đất nước Mặt sau của thẻ gồm các hoa văn phối hợp hài hòa với các họa tiết đường cong vắt chéo đan xen, tạo nên nét đặc trưng riêng biệt Quốc huy và ảnh chân dung của công dân được in màu trực tiếp trên thẻ, giúp đảm bảo tính xác thực và rõ nét của thông tin cá nhân.

Thẻ Căn cước công dân được sản xuất bằng chất liệu nhựa, ngoài cùng của hai mặt có phủ lớp màng nhựa mỏng trong suốt

Ngôn ngữ trên thẻ Căn cước công dân bắt buộc là tiếng Việt có dấu Trong trường hợp quốc tế, nếu Việt Nam ký kết điều ước hoặc thỏa thuận cho phép sử dụng thẻ Căn cước công dân thay cho hộ chiếu trên lãnh thổ của nhau, các ngôn ngữ khác sẽ được quy định rõ ràng trong các điều ước này.

Thời hạn sử dụng của thẻ Căn cước công dân được quy định theo độ tuổi đổi thẻ theo Điều 21 Luật Căn cước công dân Thông tư này có hiệu lực từ ngày 01/01/2016, thay thế Thông tư 57/2013/TT-BCA ban hành ngày 13/11/2013 của Bộ trưởng Bộ Công an về mẫu Chứng minh nhân dân Mẫu thẻ Căn cước công dân mới áp dụng từ ngày 01/01/2016 theo quy định tại thông tư này Trong trường hợp địa phương chưa đủ điều kiện để triển khai cấp đổi theo mẫu mới, vẫn tiếp tục thực hiện theo Quyết định số 998/2001/QĐ-BCA ngày 10/10/2001 về mẫu biểu trong công tác quản lý hành chính về trật tự xã hội để cấp, đổi, cấp lại Chứng minh nhân dân, chậm nhất đến ngày 01/01/2016.

2020 phải thực hiện thống nhất theo mẫu quy định tại Thông tư này[3]

Bài toán trích xuất thông tin tự động từ thẻ CCCD

Trong nhiều giao dịch dân sự, việc sử dụng thẻ CCCD hoặc CMND là bắt buộc, như khi mở tài khoản ngân hàng, thực hiện giao dịch tại bưu điện, hoặc tại các công ty viễn thông như Mobiphone, Vinaphone, Viettel, FPT, và ở các văn phòng ủy ban nhân dân các cấp Tuy nhiên, việc nhân viên phải đọc và nhập thủ công thông tin từ thẻ vào hệ thống dẫn đến sai sót và chậm trễ, gây phiền toái cho khách hàng Sau khi nhập dữ liệu, nhân viên còn phải photo hoặc quét thẻ để lưu trữ, tốn nhiều thời gian và công sức Trong bối cảnh cuộc cách mạng công nghiệp 4.0 và chuyển đổi số quốc gia, chúng tôi đề xuất xây dựng hệ thống trích xuất tự động thông tin từ thẻ CCCD, nhằm giảm thiểu thủ tục hành chính và nâng cao hiệu quả, đáp ứng yêu cầu cấp bách của thời đại công nghệ số.

Hệ thống tự động trích xuất thông tin từ ảnh thẻ CCCD dựa trên nhận dạng mẫu và phân tích xử lý ảnh kết hợp mạng nơ ron nhân tạo, đảm bảo độ chính xác cao Sau quá trình quét thẻ, hệ thống tự động xuất ra tập tin văn bản chứa đầy đủ thông tin của cả mặt trước và mặt sau của thẻ CCCD trong thời gian rất ngắn Việc xây dựng hệ thống này mang lại hiệu quả vượt trội về tốc độ và độ chính xác trong quá trình xử lý dữ liệu.

Dữ liệu đầu vào: Ảnh thẻ CCCD chụp hoặc quét trên máy quét hai mặt, mặt trước và mặt sau

Dữ liệu xuất ra: Tập tin ảnh và tập tin văn bản chứa dữ liệu trong CCCD

+ Tập tin ảnh gồm: Ảnh chân dung, ngón trỏ phải, ngón trỏ trái

Tập tin văn bản chứa các thông tin quan trọng như số CCCD, họ tên, ngày tháng năm sinh, giới tính, quốc tịch, quê quán, nơi thường trú, đặc điểm nhân dạng của người được cấp thẻ CCCD, cùng với ngày, tháng, năm cấp thẻ và ngày hết hạn Các dữ liệu này giúp xác minh danh tính chính xác và phục vụ các mục đích quản lý nhà nước hiệu quả Việc lưu trữ đầy đủ thông tin trong tập tin đảm bảo tính chính xác và dễ tra cứu khi cần thiết.

Các hướng tiếp cận

Trong những thập niên vừa qua, lĩnh vực xử lý ảnh trên thế giới đã phát triển mạnh mẽ và nhanh chóng, đạt được nhiều thành tựu đáng kể Đặc biệt, việc tích hợp xử lý ảnh với trí tuệ nhân tạo đã mở ra nhiều cơ hội đột phá trong nghiên cứu và ứng dụng Các công trình nghiên cứu liên tục nâng cao hiệu quả và khả năng của công nghệ xử lý ảnh, góp phần thúc đẩy sự tiến bộ của ngành công nghiệp AI.

Các ứng dụng thực tiễn của công nghệ mang lại nhiều lợi ích về khoa học và kinh tế, đặc biệt trong các lĩnh vực như nhận diện hình ảnh, nhận diện khuôn mặt và nhận diện ký tự quang học Những tiến bộ trong hệ thống máy học giúp nâng cao độ chính xác và hiệu quả của các giải pháp này, góp phần thúc đẩy phát triển công nghệ thông minh và tối ưu hóa các hoạt động kinh doanh.

Một số quốc gia như Mỹ và một số nước châu Âu đã nghiên cứu và ứng dụng công nghệ nhận dạng quét thông tin trên hộ chiếu để làm thủ tục xuất nhập cảnh tại các sân bay quốc tế Công nghệ này giúp quá trình kiểm tra giấy tờ diễn ra thuận tiện và nhanh chóng hơn, nâng cao hiệu quả trong quy trình xuất nhập cảnh và tăng cường an ninh hàng không.

Nhận dạng mẫu trong phân tích và nhận dạng ảnh tài liệu (xuất phát từ hệ thống nhận dạng ký tự quang học) là ứng dụng phổ biến giúp số hóa các trang giấy như sách, báo, tạp chí Năm 2012, tác giả Lê Đức Hiếu từ Đại học Công nghệ Hà Nội đã nghiên cứu “Ứng dụng một số kỹ thuật xử lý ảnh trong phân tích giấy chứng minh nhân dân”, sử dụng các kỹ thuật xử lý ảnh kết hợp thư viện mã nguồn mở OpenCV Mặc dù đã đạt được một số kết quả ban đầu, nhưng chưa tạo ra các ứng dụng thực tế, và đến nay chưa ai nghiên cứu sâu về ứng dụng phân tích, trích xuất tự động thông tin từ thẻ CCCD.

Các khó khăn và thách thức

Thẻ căn cước công dân được làm bằng chất liệu nhựa chất lượng cao, với lớp màng nhựa mỏng trong suốt bảo vệ hai mặt của thẻ Việc tách chính xác các trường thông tin trên thẻ là cần thiết để phục vụ quá trình nhận dạng, nhưng gặp phải những khó khăn nhất định do đặc điểm cấu tạo của thẻ Các vấn đề này bao gồm việc xác định chính xác các vùng dữ liệu cần thiết, tránh làm hỏng hoặc làm mất thông tin quan trọng khi tách hoặc xử lý thẻ Trong quá trình xử lý thẻ căn cước, việc đảm bảo độ chính xác và an toàn thông tin là yếu tố then chốt để nâng cao hiệu quả và độ tin cậy của quá trình nhận dạng.

+ Các trường thông tin có thể bị lệch so với dòng chuẩn hoặc đè lên phần tiêu đề đã được in trước

+ Nét chữ không đều nhau giữa các dòng trong CCCD, thậm chí là trong cùng một CCCD: có chỗ chữ quá đậm hoặc quá mờ

+ CCCD có thể bị ố, mờ, gãy, cong, biến dạng do sừ dụng lâu ngày, bảo quản không tốt…

Trên mặt trước, trong một số trường hợp, hoa văn nền được in rõ nét, tuy nhiên nét chữ lại mờ nhạt, gây khó khăn trong việc phân biệt giữa các nét chữ và hoa văn nền.

Trên mặt sau của tài liệu, nhiều trường hợp ngày tháng năm cấp bị in lệch so với vị trí chuẩn, gây khó khăn trong việc xác định chính xác thông tin Đặc điểm nhận dạng chữ nhỏ, không rõ ràng, thường bị in dính hoặc lem mực, khiến việc đọc và xác minh trở nên khó khăn hơn Các yếu tố này làm giảm tính chính xác và độ tin cậy của các tài liệu cần kiểm tra, đòi hỏi phải chú ý đến các chi tiết nhỏ khi phân tích.

Ngôn ngữ trên thẻ Căn cước công dân được quy định là tiếng Việt có dấu, điều này gây ra nhiều khó khăn trong việc nhận dạng ký tự so với các ngôn ngữ không dấu như tiếng Anh.

Việc xử lý thông tin trên thẻ CCCD gặp nhiều khó khăn, chẳng hạn như khi quét hoặc chụp hình bằng máy ảnh, thông tin có thể bị mờ, nhòe hoặc không rõ do ảnh chụp không chuẩn Thẻ CCCD làm bằng nhựa nhưng nếu sử dụng lâu ngày và không bảo quản cẩn thận có thể dẫn đến vênh, cong hoặc gãy Nội dung in trên thẻ có thể không đồng đều do in lệch, chữ in thường, in hoa, chữ lớn, chữ nhỏ, hoặc có màu đỏ, màu đen khác nhau, kèm theo vân in chìm hoặc nổi trên bề mặt Thông tin cùng một vùng dữ liệu có thể được in thành dòng hoặc thành hai dòng, như quê quán và nơi cư trú, dẫn đến sự khác biệt về độ dài và cách trình bày của dữ liệu của từng cá nhân.

Yêu cầu của bài toán là từ ảnh CCCD màu được quét bằng máy quét với độ phân giải 1024 dpi, tách lấy các trường thông tin quan trọng như ảnh chân dung, họ và tên, ngày tháng năm sinh, giới tính, quốc tịch, quê quán, nơi thường trú, đặc điểm nhân dạng của người cấp thẻ, ngày, tháng, năm cấp thẻ, ngày hết hạn trên thẻ, cũng như ngón trỏ trái và ngón trỏ phải Các trường thông tin này nằm trên cả hai mặt của CCCD, mỗi mặt lại có đặc điểm khác nhau, do đó, tôi đề xuất hai thuật toán riêng biệt để tách các trường thông tin trên từng mặt.

Đề xuất hướng giải quyết bài toán

Ảnh đầu vào thẻ CCCD thường có chất lượng rất khác nhau, có thể bị ố, lệch hoặc nghiêng khi chụp Mặt khác, hai mặt trước và sau của thẻ có hoa văn nền rõ nét, đòi hỏi kỹ thuật xử lý ảnh để đảm bảo tách các trường thông tin chính xác Để nâng cao hiệu quả nhận dạng và kết quả sau này, cần áp dụng các kỹ thuật xử lý ảnh chuyên sâu nhằm cải thiện chất lượng hình ảnh đầu vào Trước các khó khăn này, chúng tôi đề xuất phương án chia nhỏ bài toán thành các bước xử lý riêng biệt, giúp tối ưu hóa quá trình nhận dạng và trích xuất dữ liệu từ thẻ CCCD.

Mục tiêu 1: Tăng cường để có thể trích các vùng dữ liệu chính xác nhất có thể chúng tôi sử dụng bộ lọc băng thông rộng để giải quyết

Mục tiêu 2 là điều chỉnh để ảnh CCCD không bị nghiêng, vì ảnh CCCD có hình chữ nhật với các cặp cạnh song song Để đạt được điều này, chúng tôi đề xuất sử dụng phương pháp Hough để xác định các cạnh của hình ảnh, đây là bước quan trọng làm cơ sở cho việc cân chỉnh ảnh chính xác và hiệu quả.

1.5.2 Phân đoạn tách các vùng dữ liệu

Mặt trước của giấy căn cước công dân (CCCD) chứa các thông tin quan trọng như các vùng dữ liệu ảnh chân dung, số CCCD, họ và tên, ngày tháng năm sinh, giới tính, quốc tịch, quê quán, nơi thường trú, và ngày hết hạn của giấy tờ Các dữ liệu này giúp xác định chính xác danh tính của chủ sở hữu, đồng thời đảm bảo tính pháp lý và xác thực của giấy tờ Việc nắm rõ các thông tin này là cần thiết để tiến hành các thủ tục hành chính và giao dịch an toàn.

Mặt sau: Có các vùng dữ liệu ảnh ngón trỏ trái, ảnh ngón trỏ phải, Đặc điểm nhận dạng, Ngày cấp thẻ

Dựa vào tiêu chuẩn vị trí và kích thước cúa CCCD chúng tôi đề xuất trích xuất tách từng vùng dữ liệu dựa vào thuật toán phương pháp Otsu

1.5.3 Nhận dạng ký tự và xuất thông tin các vùng dữ liệu

Chúng tôi phân chia dữ liệu của hai mặt CCCD thành 13 vùng khác nhau dựa trên nội dung Các vùng này bao gồm vùng chứa hình ảnh như ảnh chân dung, ảnh ngón trỏ trái và phải; vùng chứa số CCCD; vùng chứa ngày tháng năm sinh, ngày hết hạn sử dụng, ngày cấp theo định dạng dd/mm/yyyy; vùng chứa các ký tự như họ tên, giới tính, quốc tịch; và vùng có cả ký tự lẫn số thể hiện nơi cư trú Chúng tôi đề xuất mô hình nhận dạng các vùng dữ liệu này để tối ưu hóa quá trình trích xuất thông tin từ CCCD.

- Vùng ảnh: Ảnh chân dung, ngón trỏ trái, ngón trỏ phải

- Vùng số: Nhận dạng vùng ký tự chỉ chứa số là vùng số CCCD

- Các vùng khác còn lại: vừa có ký tự vừa có số ký tự số

Chúng tôi áp dụng mạng nơ rơn nhân tạo để huấn luyện nhận dạng và trích xuất thông tin các vùng

Tiền xử lý ảnh là bước quan trọng giúp chuyển ảnh màu sang ảnh đen trắng để loại bỏ nền nhưng vẫn giữ nguyên đặc trưng của nét chữ Quá trình này bao gồm nhị phân hóa ảnh, căn chỉnh độ nghiêng, tăng cường độ nét cho ảnh, sử dụng các bộ lọc như bộ lọc băng thông thấp, bộ lọc băng thông cao, bộ lọc high boost và áp dụng Thuật toán Hough để nhận diện các đường viền chính xác và tối ưu hóa quá trình xử lý ký tự.

Tách vùng Ảnh: Ảnh chân dung, ảnh ngón trỏ trái, ảnh ngón trỏ phải

Tách trường Số CCCD: Dựa vào đặc điểm nổi bật riêng để tách, vùng này chỉ chứa số, màu đỏ, in đậm

Tách các trường còn lại: Tách lấy các dòng thông tin như phân tích ở 1.5.3 sau đó loại bỏ đi phần tiêu đề của các trường

Hệ thống tự động trích xuất thông tin từ ảnh thẻ căn cước công dân sử dụng công nghệ máy học chuyên sâu và mạng nơ-ron nhân tạo Quá trình huấn luyện mô hình giúp chương trình xử lý dữ liệu hiệu quả, xuất ra các tập tin văn bản chính xác (Sơ đồ 1.1)

Sơ đồ 1.1 Sơ đồ xử lý hệ thống xử lý

Phân tích ảnh Tiền xử lý ký tự

Mạng nơron nhận dạng ký tự

Hậu xử lý dữ liệu Thu nhận ảnh CCCD

CƠ SỞ LÝ THUYẾT

Tiền xử lý ảnh đóng vai trò quan trọng trong việc nâng cao chất lượng ảnh để tăng độ chính xác của các thuật toán nhận dạng và phân tích, bằng cách khử nhiễu, biến đổi ảnh và làm nổi bật các đặc trưng quan trọng Các kỹ thuật lọc ảnh thường được sử dụng để giảm nhiễu, làm rõ nét, cũng như phát hiện cạnh và biên của ảnh, chủ yếu nhằm kiểm soát các tần số cao trong hình ảnh Các loại lọc ảnh chính bao gồm lọc tuyến tính như lọc trung bình, lọc thông thấp, lọc thông cao và lọc đạo hàm, và lọc phi tuyến như lọc trung vị, lọc đồng hình, cùng với các phép lọc dựa trên láng giềng gần nhất Việc áp dụng các phương pháp lọc phù hợp giúp cải thiện chất lượng ảnh trước khi thực hiện các bước phân tích hoặc nhận dạng tiếp theo.

2.1.1 Bộ lọc băng thông thấp

Bộ lọc Gauss đóng vai trò quan trọng trong lý thuyết và thực tiễn xử lý ảnh, giúp giảm noise và làm mượt hình ảnh một cách hiệu quả Quá trình lọc hình ảnh được thực hiện bằng cách sử dụng kernel dạng đối xứng xuyên tâm của hàm Gauss 2-D liên tục, được xác định theo công thức (2.1), phù hợp với các ứng dụng xử lý hình ảnh chuyên nghiệp.

Các bộ lọc trung bình thường được sử dụng để giảm nhiễu trong hình ảnh, giúp cải thiện chất lượng hình ảnh Đặc trưng của nhiễu là hàm mật độ xác suất thể hiện phân bố của nhiễu đó, từ đó giúp lựa chọn phương pháp xử lý phù hợp Hàm phân phối Gauss được sử dụng phổ biến để làm mờ ảnh và giảm nhiễu một cách hiệu quả Trong trường hợp nhiễu một chiều, phân phối Gauss theo công thức (2.2) cung cấp mô hình chính xác cho quá trình xử lý nhiễu trong ảnh.

Trong phân phối có độ lệch chuẩn là 𝜎 và trung bình bằng 0, hàm phân phối Gauss được sử dụng để xử lý hai chiều Hình thành tích của hai hàm Gauss một chiều x và y được tính bằng công thức (2.3), giúp mô tả rõ ràng mối quan hệ giữa hai biến trong không gian xác suất.

Bộ lọc Gauss băng thông thấp theo công thức (2.4)

Với D (u,v) là khoảng cách từ điểm (u,v) đến tâm xấp xỉ rời rạc để hàm liên tục này sử dụng hai tham số tự do là:

- Các kích thước mong muốn của các kernel (như là một mặt nạ lọc N × N);

Giá trị độ lệch chuẩn của hàm Gauss quyết định mức độ làm mịn của bộ lọc, khác biệt với bộ lọc trung bình ở chỗ mức độ này được điều chỉnh dựa trên các thông số độ lệch, chứ không phải kích thước hạt nhân tuyệt đối Ứng dụng chính của bộ lọc Gauss là làm mịn ảnh, giúp giảm nhiễu và làm nổi bật các đặc trưng quan trọng trong hình ảnh Một đặc tính quan trọng của hàm Gauss là biến đổi Fourier của nó cũng là một hàm Gauss, điều này thuận tiện cho phân tích miền tần số của bộ lọc theo thuật toán đã được nghiên cứu.

Thuật toán 2.1 Lọc băng thông thấp Gauss

Output: Ảnh sau khi lọc khi dung bô lọc thông thấp Gauss

1 P = size (f, 1) tạo bộ lọc có kích thước bằng với ảnh

Sau khi thực hiện lọc, độ biến thiên tần số của ảnh giảm so với ảnh gốc, đồng thời các giá trị tần số sau lọc cao hơn so với ban đầu Phép lọc Gaussian giúp làm mượt ảnh hơn so với ảnh gốc, mang lại kết quả rõ ràng và hạn chế nhiễu, như thể hiện trong Hình 2.1.

Hình 2.1 So sánh miền tầng số trước và sau khi lọc băng thông thấp

Bộ lọc Gauss là bộ lọc thông thấp trên miền tần số, giúp giảm thành phần tần số cao trong hình ảnh Trong toán học, Gaussian Blur được thực hiện bằng cách tính tích chập hình ảnh với hàm Gauss, tạo hiệu ứng làm mờ mịn như lớp màn trong suốt bị mờ Không giống với hình ảnh bị mờ do lỗi ống kính hoặc bóng do ánh sáng, bộ lọc Gauss giúp làm giảm nhiễu và loại bỏ các chi tiết không mong muốn của hình ảnh.

Phép lọc thông cao hai chiều theo công thức (2.5), thuật toán 2.2

Hình 2.2 Tầng số trước và sau khi sử dụng lọc băng thông cao

Thuật toán 2.2 Lọc băng thông cao Gauss Input: Ảnh bị nhiễu cần lọc

Output: Ảnh sau khi lọc dùng bộ lọc thông cao Gauss

1 P = size ( f, 1); tạo bộ lọc có kích thước bằng với ảnh

12 H = fftshift(h); chuyển bộ lọc qua miền tầng số

13 P = size ( f ,1); tạo bộ lọc có kích thước bằng với ảnh

2.1.3 Bộ lọc High boost Đây là một lọc dùng phép trừ băng thông thấp từ mở rộng của f như công thức (2.6)

Kết quả là giống ảnh ban đầu nhưng các cạnh sẽ nổi bật hơn

2.2 Hiệu chỉnh độ nghiêng của văn bản Đối với những chương trình nhận dạng, có ảnh đầu vào là những trang tài liệu dạng văn bản thì các ảnh thu nhận được thường bị lệch so với ảnh gốc một góc bất kỳ Nguyên nhân là do trong quá trình thu nhận: ảnh gốc bị đặt lệch, thiết bị ghi nhận hình ảnh đặt không đúng vị trí hay thu nhận ảnh bị xê dịch…, điều này là không thể tránh khỏi Do đó, để cho các bước xử lý tiếp theo (phân tích và nhận dạng) được chính xác cần phải có thao tác hiệu chỉnh độ nghiêng của ảnh thu nhận được Trong đó, xác định góc nghiêng là thao tác quan trọng nhất và khó khăn nhất Có rất nhiều phương pháp khác nhau để xác định góc nghiêng: có thể trực tiếp dựa vào các thống kê, đánh giá góc nghiêng của các đối tượng trong ảnh hay phân tích, đánh giá trên ảnh đã được biến đổi Trong đó có

Trong bài viết này, chúng tôi giới thiệu ba phương pháp phổ biến để xử lý hình ảnh và nhận dạng đối tượng, bao gồm phương pháp dựa trên biến đổi Hough, phương pháp láng giềng gần nhất và phương pháp sử dụng chiếu nghiêng Các phương pháp này sẽ được trình bày chi tiết hơn trong các phần tiếp theo để làm rõ ưu điểm và ứng dụng của từng kỹ thuật trong thực tế.

502 Bad GatewayUnable to reach the origin service The service may be down or it may not be responding to traffic from cloudflared

Thuật toán 2.3 Xoay ảnh Input: Ảnh (nhị phân) bị nghiêng I

Output: Ảnh đã chỉnh độ nghiêng I'

Duyệt tất cả các điểm ảnh g(x, y) trong ảnh I

Bướ c 1 Xác định vị trí mới g'(x', y') trong ảnh I' x' = x0 + (x-x0).cos(α) - (y-y0).sin(α) y' = y0 + (x-x0).sin(α) + (y-y0).cos(α)

Bướ c 2 Chuyển giá trị điểm ảnh: g'(x', y') = g(x, y)

2.2.1 Xác định góc nghiêng dựa trên biến đổi Hough

502 Bad GatewayUnable to reach the origin service The service may be down or it may not be responding to traffic from cloudflared

Trong đó: x và y được thay thế bởi xi và yi, θ là góc giữa vector khoảng cách

(tính từ gốc tọa độ đến điểm gần nhất thuộc đường thẳng) và trục x, ρ là khoảng cách từ gốc tọa độ tới đường thẳng

502 Bad GatewayUnable to reach the origin service The service may be down or it may not be responding to traffic from cloudflared

+Thực hiện phép biến đổi Hough

+Tính toán luỹ tích để tìm góc nghiêng

Trong quá trình xác định góc nghiêng, phương pháp biến đổi Hough đóng vai trò chủ đạo Các bước đầu tiên và thứ hai của quá trình gồm thực hiện phép biến đổi Hough để phát hiện các đường thẳng trong ảnh Tiếp theo, các bước thứ ba và thứ tư sẽ tiến hành thống kê dữ liệu từ kết quả biến đổi để xác định chính xác góc nghiêng theo thuật toán 2.4 Phương pháp này giúp nâng cao độ chính xác trong việc đo lường góc nghiêng của các đối tượng trong hình ảnh.

Thuật toán 2.4 Xác định góc nghiêng dựa vào biến đổi Hough

Input: Ảnh (nhị phân) bị nghiêng I

(Đếm số lượng điểm thuộc đường thẳng)

Bướ c 2 Duyệt tất cả các điểm ảnh:

Duyệt tất cả các góc có thể θi

Bướ c 3 Tìm k phần tử trong mảng h[ρi][θi] có giá trị lớn nhất

(Tìm k đường thẳng trong ảnh)

Bướ c 4 α là trị số trung bình của các góc trong k phân tử trên

(Tính góc nghiêng chung bình của k đường thẳng)

Biến đổi Hough ban đầu yêu cầu nhiều phép tính do phải xử lý từng điểm ảnh riêng lẻ Tuy nhiên, đã có các cải tiến giúp tăng tốc độ thực hiện bằng cách thao tác trên các chùm điểm ảnh liên tục, bao gồm các dải đen tiếp nhau theo chiều ngang hoặc dọc Mỗi chùm điểm ảnh được mã hóa dựa trên độ dài và vị trí kết thúc của nó, giúp giảm thiểu số lượng phép tính cần thiết Nhờ vào những cải tiến này, thuật toán Hough trở nên phù hợp để xác định các góc nghiêng khoảng 15 độ với độ chính xác rất cao.

2.3 Nhị phân hóa ảnh Ảnh nhận được từ các thiết bị thu nhận hình ảnh như máy ảnh hay camera thường là ảnh màu hay ảnh đa cấp xám, các thành phần trong ảnh là rất phức tạp (màu sắc, kết cấu…) Do đó muốn làm nổi bật các đặc trưng trong ảnh thì phải chuyển về dạng ảnh nhị phân, ảnh chỉ có hai màu (đen và trắng) – tương ứng với nền và tiền cảnh (đối tượng “quan tâm”) Nhị phân hóa ảnh (hay còn gọi là phân

30 ngưỡng) là thao tác chuyển từ ảnh đa cấp xám (hoặc ảnh màu) về ảnh nhị phân theo thuật toán 2.5

Thuật toán 2.5 Nhị phân hóa ảnh

Input: Ảnh màu hoặc ảnh đa cấp xám

2 | max-min|< T Xác định ngưỡng T

4 For i= min to max Chuyển ảnh về dạng nhị phân

5 for I(i, j) with in the image I

+ I(x, y): Là cường độ sáng tại điểm ảnh (x, y) của ảnh xám

+ a, b, c: Các thông số dùng để tính toán cường độ sáng cho ảnh

+ Red(x, y): Là giá trị của kênh màu Red(Đỏ) tại điểm ảnh (x, y) của ảnh màu(RGB)

+ Green(x, y): Là giá trị của kênh màu Green(Xanh lá cây) tại điểm ảnh (x, y) của ảnh màu(RGB)

+ Blue(x, y): Là giá trị của kênh màu Blue(Xanh lơ) tại điểm ảnh (x, y) của ảnh màu(RGB)

XÂY DỰNG THUẬT TOÁN PHÂN TÍCH

Trong quá trình xử lý thẻ căn cước công dân, ảnh đầu vào thường có chất lượng không đồng đều, có thể bị ố, mốc, nhàu, mờ hoặc lệch, nghiêng, méo, cong Mặt trước của thẻ có hoa văn nền rõ nét, vì vậy để đảm bảo việc tách các trường thông tin chính xác và nâng cao hiệu quả nhận dạng, cần áp dụng các kỹ thuật xử lý ảnh như cân chỉnh góc, làm rõ nét, loại bỏ nhiễu và chỉnh sửa các sai lệch về hình dạng Các kỹ thuật này đóng vai trò quan trọng trong việc nâng cao chất lượng ảnh đầu vào nhằm đảm bảo quá trình trích xuất dữ liệu và nhận dạng chính xác hơn.

+ Chuyển từ ảnh màu về ảnh đa cấp xám

3.1.1 Chuyển ảnh màu về ảnh đa cấp xám

Các phương pháp nhị phân ảnh thường được áp dụng trên ảnh đa cấp xám, do đó cần chuyển đổi ảnh màu đầu vào sang ảnh đa cấp xám trước khi thực hiện bước nhị phân ảnh Trong không gian màu RGB, mỗi điểm ảnh gồm ba thành phần màu R (Red), G (Green) và B (Blue), với giá trị từ 0 đến 255, còn trong ảnh đa cấp xám, mỗi điểm ảnh chỉ mang một trị số mức xám từ 0 đến 255 Để chuyển đổi giữa hai không gian màu này, người ta thường sử dụng công thức tính độ sáng theo tiêu chuẩn NTSC, dựa trên khả năng cảm nhận của thị giác con người Quá trình chuyển đổi này giúp tạo ra ảnh có hoa văn nền rõ nét hơn, phù hợp cho các phương pháp xử lý ảnh nhị phân.

Nhận thấy rằng, điểm sảnh nền có mức độ chênh lệch lớn giữa thành phần màu G và R, ảnh hưởng đến quá trình chuyển đổi màu Do đó, để chuyển đổi từ ảnh màu sang ảnh đa cấp xám hiệu quả, ta sử dụng thành phần màu G cộng với độ chênh lệch giữa hai thành phần màu G và R theo công thức (3.1), nhằm giữ lại các đặc điểm quan trọng của hình ảnh.

50 Điều này giúp làm nổi bật các nét chữ, trong khi hoa văn nền mờ đi nhưng nét chữ vẫn giữ nguyên đặc trưng, đồng thời làm mờ đi mực nhoè màu đỏ ở trường.

Số CCCD lên trường Họ tên, hình 3.1

Hình 3.1 Tiền xử lý ảnh mặt trước CCCD

(a) Ảnh đầu vào; (b) Ảnh đa cấp xám; (c) Ảnh nhị phân

3.1.2 Làm trơn ảnh Ảnh đa cấp xám thu được ở bước trên thường không được “mịn” (vẫn còn“ráp”) do một số thành phần nền quá rõ nét, để làm mịn ảnh và loại bỏ các nhiễu ta cần áp dụng một phép lọc để làm trơn ảnh, áp dụng phương pháp làm trơn thích ứng

Bước tiếp theo trong xử lý ảnh là xác định ngưỡng để phân đoạn ảnh đa cấp xám thành ảnh nhị phân, giúp phân biệt rõ nền và đối tượng Các phương pháp đã trình bày ở trên có thể cho kết quả tốt trong một số trường hợp, nhưng có thể gặp hạn chế hoặc chưa đạt hiệu quả cao trong các tình huống khác Việc chọn ngưỡng phù hợp là bước quan trọng để nâng cao độ chính xác của quá trình phân đoạn ảnh.

Thuật toán 3.1 Nhị phân hóa ảnh CCCD

Ouput: Ảnh CCCD nhị phân hóa tách ngưỡng tự động

1.For T= (0 to 255) / 2 xác định giá triT

4 If Type 2 x > T (iAverage) for Type1 (iAverage1) and Type2 (iAverage2) tính giá tri cường độ sáng tb

6.T2 = (iAverage1 + iAverage2) / 2 Tính giá trị T2

7 Compare T1 and T2 so sánh T1 và T2

8 If T1 and T2 Delta, then go back to Step 1

51 khác lại cho kết quả không tốt Phương pháp Otsu: Khử nền của ảnh khá tốt theo thuật toán 3.1

Dù sử dụng thiết bị chuyên dụng để thu nhận ảnh, nhưng vẫn tồn tại khả năng ảnh bị nghiêng, gây ảnh hưởng đến độ chính xác của quá trình phân tích Để đảm bảo phân đoạn và phân tích ảnh chính xác, cần phải căn chỉnh độ nghiêng của ảnh sau khi thu nhận Phương pháp dựa trên biến đổi Hough cho kết quả chính xác nhưng tốn nhiều thời gian, đặc biệt với ảnh kích thước lớn, trong khi phương pháp láng giềng gần nhất không phù hợp với ảnh chứa ký tự Tiếng Việt có dấu Vì vậy, phương pháp sử dụng chiếu nghiêng được áp dụng, mang lại kết quả tốt và thời gian thực hiện nhanh Ảnh màu đầu vào còn được dùng để tách trường Số CCCD, và việc hiệu chỉnh độ nghiêng được thực hiện trên cả ảnh nhị phân và ảnh màu dựa trên góc nghiêng đã xác định từ ảnh nhị phân, theo thuật toán 3.2.

Thuật toán 3.2 Hiệu chỉnh độ nghiêng của ảnh tài liệu

Input: Ảnh (nhị phân) bị nghiêng

Output: Ảnh đã chỉnh độ nghiêng

Bướ c 1 Xác định góc nghiêng α

Bướ c 2 Xoay ảnh với góc nghiêng α

3.2.1 Phân tích các trường thông tin ở mặt trước

Chuyển ảnh màu sang ảnh xám và nhị phân để xóa nền ảnh, sử dụng thuật toán Otsu để phân vùng dựa trên tỉ lệ tương đối của các vùng Các đặc trưng của mặt trước thẻ CCCD bao gồm ảnh chân dung bên trái: ảnh màu 2x3 cm, dưới Quốc huy; số CCCD nằm trên một dòng dưới vùng CĂN CƯỚC CÔNG DÂN; họ và tên nằm trên hai dòng dưới vùng SỐ CCCD; ngày tháng năm sinh nằm trên một dòng dưới họ và tên; giới tính nằm trên một dòng bên phải dưới họ và tên; quốc tịch nằm bên trái dưới họ và tên; quê quán đề trên hai dòng dưới vùng chữ giới tính và quốc tịch; nơi thường trú trên hai dòng dưới vùng quê quán; ngày hết hạn nằm dưới hình thẻ, thể hiện các thông tin rõ ràng, chính xác và phù hợp với quy chuẩn của giấy tờ tùy thân.

3.2.2 Xác định các vùng có ký tự ở mặt trước

Thẻ CCCD mặt trước gồm 9 trường thông tin riêng biệt, mỗi vùng có đặc điểm nhận dạng rõ ràng Ảnh chân dung chỉ chứa hình màu của người cấp thẻ, không có ký tự Số CCCD là số màu đỏ, thể hiện duy nhất trên thẻ Tên họ in hoa đậm, màu đen, giúp dễ dàng nhận diện Ngày tháng năm sinh được định dạng theo dd/mm/yy, cung cấp thông tin chính xác về sinh mệnh Giới tính thể hiện bằng chữ in hoa đầu từ, chữ in thường màu đen để rõ ràng Quốc tịch cũng dùng chữ in hoa đầu từ, chữ in thường màu đen, dễ phân biệt Quê quán được trình bày với chữ in hoa đầu từ mỗi ký tự, chữ in thường, phản ánh chính xác nguồn gốc Nơi thường trú bao gồm chữ in hoa, thường, số, ký tự đặc biệt, tất cả dùng màu đen để đảm bảo tính rõ ràng Ngày hết hạn thẻ thể hiện theo định dạng ngày tháng dd/mm/yy, giúp xác định thời hạn sử dụng của thẻ CCCD.

Hình 3.2 Vùng thông tin cần tách ở mặt trước CCCD

Trường Số CCCD có màu đỏ nổi bật, dễ nhận biết so với các trường khác, giúp dễ dàng tách riêng trường này trước khi xác định các trường còn lại dựa trên vị trí tương đối Đặc biệt, mặt trước của CCCD có các hoa văn nền màu xám xanh khá rõ nét, yêu cầu áp dụng các kỹ thuật tiền xử lý ảnh phù hợp để loại bỏ các thành phần nền phức tạp Thuật toán nhận dạng bao gồm các bước chính nhằm xử lý ảnh hiệu quả và chính xác hơn.

Tiền xử lý ảnh gồm các bước chuyển ảnh màu sang ảnh đen trắng nhằm loại bỏ nền, đồng thời giữ lại các đặc trưng của nét chữ, giúp nâng cao độ chính xác trong nhận dạng Quá trình này còn bao gồm căn chỉnh độ nghiêng của ảnh để đảm bảo dữ liệu đầu vào phù hợp cho các bước xử lý tiếp theo, từ đó tăng hiệu quả của hệ thống nhận dạng ký tự quang học (OCR).

Để tách trường Số CCCD hiệu quả, cần dựa vào các đặc điểm nổi bật riêng của từng trường, sau đó loại bỏ các đường lượn vân chìm để đảm bảo độ chính xác cao Quá trình này vẫn phải giữ lại các nét chữ đặc trưng để đảm bảo tính nhận diện và phân biệt chính xác Việc phân tách trường Số CCCD bằng cách phân tích đặc điểm độc đáo giúp tối ưu hóa quy trình xử lý dữ liệu, nâng cao hiệu quả trong các ứng dụng nhận diện tự động.

Tách các trường còn lại: Tách lấy các dòng thông tin sau đó loại bỏ đi phần tiêu đề của các trường

3.2.3 Phân đoạn vùng Số CCCD

Trong quá trình này, chúng tôi thực hiện phân đoạn để loại bỏ các đường lượn sóng ngang mà vẫn giữ nguyên đặc trưng nét bút của chữ số Điều này đòi hỏi sự chính xác cao vì các chữ số có thể bị mờ, nét chữ thay đổi độ đậm nhạt, và các đường lượn sóng có bề dày đa dạng hoặc tương đồng với bề dày nét bút Do đó, việc ước lượng chính xác bề dày nét là yếu tố then chốt để xử lý hiệu quả.

54 và làm mờ đường lượn sóng trước khi tiến hành phân đoạn, chúng tôi đề xuất (thuật toán 3.3) để giải quyết

Thuật toán 3.3 Phân đoạn vùng Số CCCD Input: Ảnh màu vùng Số CCCD: IColor = IRed × IGreen × IBlue

Output: Ảnh nhị phân: I Bin2

Bước 1 Chuyển về ảnh đa cấp xám: I Gray1 = I Green

Bước 2 Nhị phân ảnh: I Bin1 = Sauvola(I Gray1 , w, k=0.0125)

Bước 3 Ước lượng bề dày đường nền: thick

Bước 4 Làm mờ đường nền: I Gray2 = Median(I Gray1 , thick+1, thick+3)

Bước 5 Nhị phân ảnh: I Bin2 = Sauvola(I Gray2 , w, k=0.1)

3.2.3.1 Xác định vùng có thể là trường Số CCCD Để xác định các vùng có thể là trường Số CCCD, trước tiên cần làm nổi bật những vùng có màu đỏ trong ảnh, sau đó tách lấy các vùng này Những vùng này có giá trị của thành phần màu R lớn hơn hẳn so với các thành phần màu khác, ngược lại ở vùng nền thì thành phần màu Green lại có giá trị lớn nhất Dựa vào đặc trưng này để khử đi thành phần nền màu Green và làm nổi bật các vùng màu Red Các bước của thuật toán như trong thuật toán 3.4

Thuật toán 3.4 Xác định các vùng có thể là Trường Số CCCD

Input: Ảnh màu đã chỉnh độ nghiêng: I Color = U(I Red , I Green , I Blue )

Output: Các vùng có thể là Số CCCD: L = {b i }, với b i = (xb i , yb i , wb i , hb i )

Bước 1 Chuyển về ảnh đa cấp xám: I Gray = Max(I Red – I Green , 0)

Bước 2 Áp dụng toán tử Closing 31x7

Bước 3 Nhị phân ảnh bằng phương pháp Otsu

Bước 4 Đảo ngược mức xám

Bước 5 Tách lấy các thành phần liên thông: L

Trong quá trình xử lý ảnh màu, mỗi điểm ảnh được thao tác bằng cách tính hiệu giữa thành phần màu đỏ và thành phần màu xanh lá cây Nếu kết quả này nhỏ hơn không, nó sẽ được gán bằng không để giữ cho ảnh đa dạng màu sắc phù hợp Phương pháp này giúp tối ưu hóa việc xử lý ảnh màu đầu vào và tạo ra các ảnh đa dạng, phù hợp với các ứng dụng xử lý hình ảnh chuyên nghiệp.

KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN

Ngày đăng: 01/01/2023, 19:35

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1. Luật căn cước công dân ngày 20/11/2014 của chính phủ nước Cộng hòa xã hội chủ nghĩa Việt nam Sách, tạp chí
Tiêu đề: Luật căn cước công dân ngày 20/11/2014 của chính phủ nước Cộng hòa xã hội chủ nghĩa Việt Nam
Năm: 2014
2. Nghị định số 137/2015/NĐ-CP ngày 31 tháng 12 năm 2015 quy định chi tiết một số điều và biện pháp thi hành Luật căn cước công dân Sách, tạp chí
Tiêu đề: Nghị định số 137/2015/NĐ-CP ngày 31 tháng 12 năm 2015 quy định chi tiết một số điều và biện pháp thi hành Luật căn cước công dân
Năm: 2015
3. Thông tư 07/2016/TT-BCA quy định chi tiết một số điều của luật căn cước công dân Sách, tạp chí
Tiêu đề: Thông tư 07/2016/TT-BCA quy định chi tiết một số điều của luật căn cước công dân
Năm: 2016
4. GS. TS. Đỗ Hoàng Toàn (2006), Giáo trình lý thuyết nhận dạng ứng dụng trong quản lý, NXB Khoa học và Kỹ thuật Sách, tạp chí
Tiêu đề: Giáo trình lý thuyết nhận dạng ứng dụng trong quản lý
Tác giả: Đỗ Hoàng Toàn
Nhà XB: NXB Khoa học và Kỹ thuật
Năm: 2006
5. Lê Đức Hiếu, Ứng dụng một số kỹ thuật xử lý ảnh trong phân tích giấy chúng minh nhân dân, ĐH QG hà nội 2012 Sách, tạp chí
Tiêu đề: Ứng dụng một số kỹ thuật xử lý ảnh trong phân tích giấy chúng minh nhân dân
Tác giả: Lê Đức Hiếu
Nhà XB: Đại học Quốc gia Hà Nội
Năm: 2012
6. Trần Văn Nam, Nhận dạng ký tự bằng mạng neural lan truyền ngược, Tạp chí khoa học và công nghệ số 14 tháng 6/2014Anh ngữ Sách, tạp chí
Tiêu đề: Nhận dạng ký tự bằng mạng neural lan truyền ngược
Tác giả: Trần Văn Nam
Nhà XB: Tạp chí khoa học và công nghệ số
Năm: 2014
7. Anoop M Namboodiri and Anil Jain,“Document Structure and Layout Analysis”, in Digital Document Processing: Major Directions and Recent Advances B. B. Chaudhuri (ed.), Springer-Verlag, London, (ISBN:978-1- 84628-501-1), Jan. 2007 Sách, tạp chí
Tiêu đề: Document Structure and Layout Analysis
Tác giả: Anoop M Namboodiri, Anil Jain
Nhà XB: Springer-Verlag, London
Năm: 2007
8. Chris Solomon, Toby Breckon (2011), Fundamentals of Digital Image Processing:Practical Approach with Examples in Matlab, Wiley Sách, tạp chí
Tiêu đề: Fundamentals of Digital Image Processing:Practical Approach with Examples in Matlab
Tác giả: Chris Solomon, Toby Breckon
Nhà XB: Wiley
Năm: 2011
9. Frank Y. Shih (2010), Image processing and Pattern recognition: Fundamentals and Techniques, Wiley Sách, tạp chí
Tiêu đề: Image Processing and Pattern Recognition: Fundamentals and Techniques
Tác giả: Frank Y. Shih
Nhà XB: Wiley
Năm: 2010
10. K. Kpalma and J. Ronsin, “An Overview of Advances of Pattern Recognition Systems in Computer Vision”, 2007 Sách, tạp chí
Tiêu đề: An Overview of Advances of Pattern Recognition Systems in Computer Vision
Tác giả: K. Kpalma, J. Ronsin
Năm: 2007
11. Pierre Soille (2002), Morphological image analysis: principles and application 2nd, Springer Sách, tạp chí
Tiêu đề: Morphological image analysis: principles and application
Tác giả: Pierre Soille
Nhà XB: Springer
Năm: 2002
12. Michael A. Nielsen (2013), Neural Networks And Deep Learning, Determination Press Sách, tạp chí
Tiêu đề: Neural Networks And Deep Learning
Tác giả: Michael A. Nielsen
Nhà XB: Determination Press
Năm: 2013

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm