Tự Động hoá quá trình kiểm tra thông tin học sinh

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề	Tự Động Hoá Quá Trình Kiểm Tra Thông Tin Học Sinh Từ Ảnh Bằng Tốt Nghiệp THCS
Tác giả	Phạm Thị Bích Nhu
Người hướng dẫn	TS. Trương Quốc Định
Trường học	Trường Đại Học Cần Thơ
Chuyên ngành	Hệ Thống Thông Tin
Thể loại	Đề Án Tốt Nghiệp
Năm xuất bản	2024
Thành phố	Cần Thơ

Định dạng
Số trang	79
Dung lượng	1,36 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

CHƯƠNG 1. MỞ ĐẦU............................................................................................ 1 1.1. Lý do chọn đề tài (12)
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT (18)
- 2.1. Một số khái niệm cơ bản (19)
  - 2.1.1. Kỹ thuật học sâu (19)
  - 2.1.2. Phát hiện đối tượng (20)
  - 2.1.3. Nhận dạng đối tượng (23)
  - 2.1.4. Nhận dạng văn bản (24)
  - 2.1.5. Tăng cường dữ liệu (25)
- 2.2. Phương pháp phát hiện và nhận dạng đối tượng (30)
  - 2.2.1. Phương pháp mô tả đặc trưng (HOG) (30)
  - 2.2.2. Mạng nơ-ron tích chập theo vùng (R-CNN) (31)
  - 2.2.3. Mô hình Faster R-CNN (32)
  - 2.2.4. Mô hình mạng CNN với YoLo.............................................................. 21 2.3. Huấn luyện mô hình YOLOv8 phát hiện đối tượng .................................... 23 2.3.1. Chuẩn bị dữ liệu huấn luyện.................................................................. 23 2.3.2. Tạo Dataset ............................................................................................ 23 2.3.3. Quá trình huấn luyện ............................................................................. 24 2.3.4. Đánh giá mô hình................................................................................... 25 2.4. Phát hiện và nhận dạng văn bản với OCR ................................................... 27 2.5. Sửa lỗi chính tả............................................................................................. 30 2.5.1. Thuật toán Hamming Distance .............................................................. 31 2.5.2. Thuật toán Smith-Waterman.................................................................. 32 2.5.3. Thuật toán Levenshtein Distance (33)
CHƯƠNG 3. PHƯƠNG PHÁP NGHIÊN CỨU (18)
- 3.4. Xử lý dữ liệu (48)
CHƯƠNG 4. KẾT QUẢ VÀ THẢO LUẬN (18)
- 4.1.2. Độ chính xác của mô hình khi nhận dạng văn bản từ ảnh (60)
- 4.1.3. Độ chính xác của mô hình khi ứng dụng thuật toán Levenshtein (61)
- 4.2. Phân tích kết quả nghiên cứu (62)
  - 4.2.1. Kết quả huấn luyện trên tập dữ liệu gốc (62)
  - 4.2.2. Kết quả huấn luyện trên tập dữ liệu tăng cường (64)
  - 4.2.3. Kết quả nhận dạng văn bản (67)
- 4.3. Một số giao diện và chức năng của hệ thống (68)
CHƯƠNG 5. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN (18)
- 4.9. Đồ thị F1- Confidence trên tập dữ liệu tăng cường (0)

Nội dung

Trong lĩnh vực thị giác máy tính, việc áp dụng đột phá và nhanh chóng của các kỹ thuật học sâu Deep learning đã là tiền đề tạo ra rất nhiều giải pháp về nhận dạng đối tượng Object detect

CƠ SỞ LÝ THUYẾT

Một số khái niệm cơ bản

Học sâu, một lĩnh vực con của học máy, áp dụng mạng nơ-ron để phân tích và học từ dữ liệu Mạng nơ-ron mô phỏng cấu trúc và chức năng của não người, bao gồm các lớp nút được kết nối với nhau Mỗi nút nhận đầu vào từ lớp trước, thực hiện các phép toán và truyền đầu ra cho lớp tiếp theo.

Học sâu đã cách mạng hóa lĩnh vực thị giác máy tính, mang lại khả năng phát hiện đối tượng một cách chính xác và hiệu quả Các thuật toán học sâu được thiết kế để nhận diện các mẫu trong dữ liệu và đưa ra dự đoán dựa trên những mẫu đó Trong quy trình phát hiện đối tượng, các thuật toán này được huấn luyện trên các tập dữ liệu lớn chứa các đối tượng quan trọng, từ đó giúp nhận dạng và dự đoán các đối tượng thông qua việc xác định các mẫu trong dữ liệu.

Học sâu là phương pháp tiên tiến trong trí tuệ nhân tạo, mô phỏng tư duy của não bộ và vượt trội hơn các phương pháp truyền thống Nó có khả năng xử lý và hiểu các mẫu dữ liệu phức tạp như hình ảnh, văn bản và âm thanh với độ chính xác cao Mạng nơ-ron nhân tạo, với cấu trúc nhiều lớp, tự động nhận diện và rút trích các đặc điểm quan trọng từ dữ liệu đầu vào, giúp giải quyết các vấn đề phức tạp như nhận dạng đối tượng và dự đoán ngôn ngữ tự nhiên.

Hình 2.1 Mô hình mạng học sâu Nguồn: aws

Các thành phần của mạng học sâu: Lớp đầu vào, Lớp ẩn, Lớp đầu ra

Lớp đầu vào của mạng nơ-ron nhân tạo bao gồm nhiều nút dùng để nhập dữ liệu Các nút này có vai trò quan trọng trong việc xử lý thông tin và truyền tải dữ liệu đến các lớp sâu hơn trong mạng.

Các lớp ẩn trong mạng học sâu xử lý thông tin ở nhiều cấp độ khác nhau, cho phép chúng thích ứng với hành vi khi tiếp nhận thông tin mới Với hàng trăm lớp ẩn, các mạng này có khả năng phân tích vấn đề từ nhiều góc độ đa dạng.

- Lớp đầu ra bao gồm các nút xuất dữ liệu Các mô hình học sâu xuất ra đáp án

"có" hoặc "không" chỉ có hai nút trong lớp đầu ra Mặt khác, các mô hình xuất ra nhiều đáp án hơn sẽ có nhiều nút hơn.

Học sâu giúp máy tính hiểu và phân tích hình ảnh tương tự như con người thông qua việc nhận diện các đặc trưng và đưa ra dự đoán Thị giác máy tính đã được ứng dụng rộng rãi trong nhiều lĩnh vực, bao gồm nhận dạng khuôn mặt, phân loại hình ảnh và kiểm duyệt nội dung Mạng nơ-ron tích chập CNN là một kiến trúc phổ biến trong lĩnh vực này, với nhiều mô hình nổi bật như AlexNet, VGGNet và GoogleNet.

Phát hiện đối tượng (Object Detection) là kỹ thuật quan trọng trong lĩnh vực thị giác máy tính, giúp xác định và định vị các đối tượng trong hình ảnh hoặc video Công nghệ học sâu đã đóng vai trò cách mạng hóa lĩnh vực này, mang lại khả năng phát hiện đối tượng với độ chính xác và hiệu quả cao.

Phát hiện đối tượng là một kỹ thuật trong thị giác máy tính, tập trung vào việc xác định và định vị các đối tượng trong hình ảnh hoặc video Mục tiêu chính là phát hiện tất cả các đối tượng quan trọng, đồng thời cung cấp thông tin chi tiết về vị trí và kích thước của chúng.

Phát hiện vật thể có vai trò quan trọng trong nhiều lĩnh vực như giám sát, xe tự lái và robot Trong xe tự lái, công nghệ này giúp nhận diện và tránh chướng ngại vật, trong khi ở robot, nó hỗ trợ trong việc xác định và thao tác với các vật thể xung quanh.

Phát hiện đối tượng là một nhiệm vụ quan trọng trong lĩnh vực thị giác máy tính, nhằm xác định vị trí và loại của các đối tượng trong hình ảnh hoặc video Mục tiêu chính là không chỉ nhận diện sự hiện diện của các đối tượng mà còn xác định vị trí của chúng thông qua các hộp giới hạn (bounding boxes) Quy trình này thường được thực hiện bằng cách sử dụng các mô hình học sâu, như mạng nơ-ron tích chập (CNN), để xử lý các đặc trưng hình ảnh và dự đoán tọa độ của các hộp giới hạn xung quanh các đối tượng.

Trong phát hiện đối tượng, các thuật toán học sâu được đào tạo trên tập dữ liệu lớn chứa các hình ảnh của đối tượng cần nhận diện Thuật toán học cách nhận dạng đối tượng thông qua việc xác định các mẫu trong dữ liệu và áp dụng những mẫu này để dự đoán Các bước triển khai phát hiện đối tượng bằng học sâu bao gồm việc thu thập dữ liệu, huấn luyện mô hình và đánh giá hiệu suất.

Thu thập tập dữ liệu hình ảnh

Chú thích tập dữ liệu ảnh

Tiền xử lý tập dữ liệuĐào tạo mô hình học sâu

Sử dụng mô hình Đánh giá mô hình

Hình 2.2 Các bước phát hiện đối tượng bằng học sâu Bước 1: Thu thập tập dữ liệu hình ảnh

Trong quy trình triển khai hệ thống phát hiện đối tượng bằng học sâu, bước đầu tiên là thu thập tập dữ liệu hình ảnh đại diện cho các đối tượng mục tiêu, như ô tô Để đạt độ chính xác cao, tập dữ liệu cần đa dạng về góc độ, kích thước và điều kiện ánh sáng, giúp mô hình nhận diện đối tượng trong nhiều tình huống khác nhau Sự đa dạng này tăng cường khả năng tổng quát của mô hình và giảm thiểu sai sót trong thực tế Ngoài việc sử dụng các tập dữ liệu công khai như COCO, ImageNet và Pascal VOC, các nhà nghiên cứu có thể xây dựng tập dữ liệu riêng để tùy chỉnh theo nhu cầu và cải thiện hiệu quả mô hình trong ứng dụng thực tiễn.

Bước 2: Chú thích tập dữ liệu

Sau khi thu thập dữ liệu hình ảnh, bước tiếp theo là chú thích dữ liệu Quá trình này bao gồm việc gán nhãn cho từng hình ảnh với thông tin liên quan đến các đối tượng xuất hiện trong đó Thông tin này thường bao gồm vị trí chính xác của đối tượng và nhãn mô tả các đối tượng.

Để thực hiện việc chú thích cho 10 tượng, người dùng có thể sử dụng các công cụ hỗ trợ như LabelImg và RectLabel Những công cụ này cho phép vẽ hộp giới hạn xung quanh các đối tượng và gán nhãn mô tả cho chúng Mặc dù quá trình này tốn thời gian, nhưng nó là bước quan trọng trong việc đào tạo các mô hình học sâu, giúp mô hình học và nhận diện các đối tượng một cách chính xác.

Bước 3: Tiền xử lý tập dữ liệu

Sau khi hoàn tất quá trình chú thích tập dữ liệu, bước tiếp theo là tiền xử lý hình ảnh, bao gồm thay đổi kích thước, chuẩn hóa giá trị pixel và áp dụng các kỹ thuật tăng cường dữ liệu như xoay, lật và thu phóng Tăng cường dữ liệu đóng vai trò quan trọng trong việc cải thiện khả năng tổng quát của mô hình và giảm thiểu tình trạng quá khớp, xảy ra khi mô hình học quá mức từ dữ liệu đào tạo và không hoạt động tốt trên dữ liệu mới Các kỹ thuật này giúp mở rộng sự đa dạng của tập dữ liệu đào tạo, nâng cao khả năng nhận diện đối tượng trong các điều kiện khác nhau và chưa biết.

Bước 4: Đào tạo mô hình học sâu

PHƯƠNG PHÁP NGHIÊN CỨU

Ngày đăng: 03/01/2025, 08:51

Nguồn tham khảo

Tài liệu tham khảo

Loại

Chi tiết

[2] N. Thanh Cong, N. Dinh Tuan and T. Quoc Long, "Information ExtractionFrom Id Card Via Computer Vision Techniques,"https://eprints.uet.vnu.edu.vn/eprints/id/eprint/3281/, 2018

Sách, tạp chí

Tiêu đề:	Information ExtractionFrom Id Card Via Computer Vision Techniques

[3] A. M. ADITYA PAL, “Vartani Spellcheck – Automatic Context-Sensitive Spelling Correction of OCR-generated Hindi Text Using BERT and Levenshtein Distance,” 2020

Sách, tạp chí

Tiêu đề:	Vartani Spellcheck – Automatic Context-SensitiveSpelling Correction of OCR-generated Hindi Text Using BERT andLevenshtein Distance

[6] Nguyễn Thành Lợi, Đào Xuân Phúc, Nguyễn Thị Tố Uyên và Nguyễn Hữu Phát, “Đề Xuất Mô Hình Yolo V5 Ứng Dụng Trong Nhận Diện Biển Số Xe,”2023

Sách, tạp chí

Tiêu đề:	Đề Xuất Mô Hình Yolo V5 Ứng Dụng Trong Nhận Diện Biển Số Xe

[7] Y. LeCun, Y. Bengio và G. Hinton, “Deep learning,” Nature, tập 521, p.436–444, 2015

Sách, tạp chí

Tiêu đề:	Deep learning,”"Nature

[8] Z.-Q. Zhao, P. Zheng, S.-t. Xu và X. Wu, “Object Detection with Deep Learning: A Review,” 2017

Sách, tạp chí

Tiêu đề:	Object Detection with DeepLearning: A Review

[9] M. Adnan, M. Imran and E. S. Singh, "Survey of Techniques and Applications in Object Recognition," 2024

Sách, tạp chí

Tiêu đề:	Survey of Techniques and Applicationsin Object Recognition

[10] R. Jain, R. Kasturi and B. G. Schunck, "Object Recognition," in Machine Vision, 1995, pp. 459-491

Sách, tạp chí

Tiêu đề:	Object Recognition

[11] C. Shorten and T. M. Khoshgoftaar, "A survey on Image Data Augmentation," J Big Data 6, vol. 60, 11 2019

Sách, tạp chí

Tiêu đề:	A survey on Image DataAugmentation

[12] Z. Zou, K. Chen, Z. Shi, Y. Guo and J. Ye, "Object Detection in 20 Years: A Survey," p. DOI: 10.1109/TPAMI.2019.2959969, 2019

Sách, tạp chí

Tiêu đề:	Object Detection in 20 Years: ASurvey

[13] Mupparaju Sohan; Thotakura SaiRam; Ch. Venkata RamiReddy, "A Review on YOLOv8 and its Advancements," 2024

Sách, tạp chí

Tiêu đề:	A Reviewon YOLOv8 and its Advancements

[14] P. Ba Cuong Quoc, "VietOCR," 2021. [Online]. Available:https://github.com/pbcquoc/vietocr. [Accessed 2024]

Sách, tạp chí

Tiêu đề:	VietOCR

[15] V. A. K. T. R. Abraham Bookstein, "Generalized Hamming Distance," p.doi:10.1023/A:1020499411651

Sách, tạp chí

Tiêu đề:	Generalized Hamming Distance

[16] Zhan Su, Byung-Ryul Ahn, Ki-Yol Eom, Min-Koo Kang, Jin-Pyung Kim and Moon-Kyun Kim, "Plagiarism Detection Using the Levenshtein Distance and Smith-Waterman Algorithm," Innovative Computing Information and Control, 2008 (ICICIC'08), 3rd International Conference on IEEE, 2008.63PHỤ LỤC

Sách, tạp chí

Tiêu đề:	Plagiarism Detection Using the Levenshtein Distance andSmith-Waterman Algorithm