1. Trang chủ
  2. » Luận Văn - Báo Cáo

đồ án môn học công nghệ tri thức và thị giác máy tính và robot

15 94 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 15
Dung lượng 319,62 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Các nội dung kiến thức sinh viên cần tìm hiểu: • OCR optical character recognition • Rút trích các từ khóa, là các từ chính thể hiện nội dung văn bản keyword extractor • So sánh 2 công c

Trang 1

ĐỒ ÁN MÔN HỌC

#2

Tài liệu này mô tả đồ án môn học cho môn học Nhập môn Công nghệ thông tin 2 theo hướng chuyên ngành Khoa học máy tính – Công nghệ tri thức và Thị giác máy tính & Robot

Khoa Công nghệ Thông tin Đại học Khoa học Tự nhiên TP HCM

Tháng 03/2016

Trang 2

MỤC LỤC

Các nội dung chính 1

1 Nội dung đồ án 2

2 Các sản phẩm cần đạt được 7

3 Hướng dẫn thực hiện theo tuần 8

4 Các công cụ gợi ý 8

Trang 3

ĐỒ ÁN MÔN HỌC

Các nội dung chính

• Mô tả nội dung đồ án và các kết quả cần đạt được

• Hướng dẫn thực hiện đồ án theo tuần cho giảng viên và sinh viên

• Cách thức đánh giá

Trang 4

Nội dung đồ án

Nội dung chính

Có tất cả 3 chủ đề Nhóm sinh viên chọn một trong ba để thực hiện

Chủ đề 1 - Nhận dạng ảnh: Xây dựng một video demo cho một hệ thống tìm kiếm thông tin bằng hình ảnh văn

bản Đồng thời, sinh viên tìm hiểu nội dung kiến thức liên quan

Chủ đề 2 – Khai thác dữ liệu: Xây dựng một video demo cho một hệ thống khai thác ý kiến người dùng qua internet Đồng thời, sinh viên tìm hiểu các nội dung kiến thức liên quan

Chủ đề 3 – Bảo mật: Xây dựng một video demo cho một mô hình bảo mật ở một công ty truyền thông Đồng

thời, sinh viên tìm hiểu các nội dung kiến thức liên quan

Mục tiêu đồ án

Sinh viên thực hiện đồ án sẽ nắm được các kiến thức:

• Kiến thức cơ bản cho một số chủ đề thuộc 3 chuyên ngành KHMT, CNTT và TGMT

• Cách tiến hành thực hiện một dự án theo mô hình linh hoạt

• Một số công cụ hỗ trợ làm việc cộng tác trên môi trường Internet

• Xây dựng mô hình sản phẩm theo yêu cầu

Sinh viên thực hiện đồ án sẽ rèn luyện các kĩ năng:

• Lập kế hoạch, làm việc nhóm, tổ chức và quản lí nhóm

• Tìm hiểu và viết báo cáo

• Đọc hiểu tiếng Anh và các tài liệu chuyên ngành

Trang 5

1.1

Đồ án 1 - Nhận dạng ảnh

Xây dựng video demo cho một hệ thống tìm kiếm thông tin bằng hình ảnh văn bản Đồng thời sinh viên tìm hiểu các nội dung kiến thức liên quan Biết rằng hệ thống hoạt động theo mô hình sau:

• Đầu vào là một tập tin ảnh của một từ, câu hoặc một đoạn văn bản(text) Đầu ra là các tài liệu có nội dung liên quan đến nội dung của văn bản được tìm thấy từ Internet

• Hệ thống sẽ chuyển tập tin hình ảnh thành dạng văn bản bằng công cụ OCR Tiếp theo, văn bản rút được sẽ được sử dụng trực tiếp (đối với trường hợp chỉ là một từ hoặc câu ngắn) hoặc phải qua rút trích từ khóa (đối với trường hợp là một đoạn văn bản) để tìm các tài liệu từ Internet Việc tìm kiếm các tài liệu này được thực hiện bởi các chương trình tìm kiếm như Google, Yahoo!

Video demo cần thể hiện được:

• Đầy đủ các bước được đề cập phía trên và theo đúng trình tự

• Ở mỗi bước, cần thể hiện được kĩ thuật nào được sử dụng, cũng như đầu vào và đầu ra ở mỗi bước

• Video cần dễ hiểu và trực quan sinh động

Các nội dung kiến thức sinh viên cần tìm hiểu:

• OCR (optical character recognition)

• Rút trích các từ khóa, là các từ chính thể hiện nội dung văn bản (keyword extractor)

• So sánh 2 công cụ tìm kiếm, ví dụ Google và Yahoo!

Đánh giá

ĐÁNH GIÁ SẢN PHẨM ĐỀ TÀI A (50% điểm của đề tài)

100%) OCR - Nhận dạng chữ viết (25%) Biết được các khái

niệm cơ bản, ứng d

ụng

Hiểu được các khái niệm cơ bản, ứng dụng

Liệt kê được phương pháp OCR

Hiểu được các khái niệm, ứng dụng

Trình bày các phương pháp OCR

Hiểu các khái niệm, ứng dụng Trình bày các phương pháp OCR

Thử nghiệm các công cụ OCR(có minh chứng)

Rút trích từ khóa (20%) Biết được các khái

niệm cơ bản Hiểu được các khái niệm cơ bản Hiểu được các khái niệm

Biết các phương pháp rút trích từ khóa

Hiểu các khái niệm,

Biết các phương pháp rút trích từ khóa

Thử nghiệm các công cụ (có minh chứng

So sánh công cụ tìm kiếm (20%) So sánh được, nhưng

số lượng tiêu chí ≤ 3

So sánh được, nhưng số lượng tiêu chí ≤ 5

So sánh được, nhưng số lượng tiêu chí > 5

So sánh được, nhưng số lượng tiêu chí > 5

Trang 6

Có số liệu rõ ràng

của mô hình Hình ảnh nhiều chỗ không phù hợp với nội dung

Thể hiện đủ các bước mô hình Nêu rõ các kĩ thuật

sử dụng ở mỗi bước

Hình ảnh phù hợp với nội dung

Sử dụng hoàn toàn hình ảnh không tự quay

Thể hiện đủ các bước mô hình Nêu rõ các kĩ thuật sử dụng ở mỗi bước

Hình ảnh phù hợp với nội dung

<50% hình ảnh

sử dụng là tự quay

Thể hiện đủ các bước mô hình Nêu rõ các kĩ thuật sử dụng ở mỗi bước Hình ảnh phù hợp với nội dung

> 50% hình ảnh

sử dụng là tự quay

1.2

Đồ án 2 – Khai thác dữ liệu

Xây dựng một video demo cho một hệ thống khai thác ý kiến người dùng (opinion mining) qua internet Đồng thời, sinh viên tìm hiểu các nội dung kiến thức liên quan Biết rằng hệ thống hoạt động theo mô hình sau:

• Đầu vào là từ khóa liên quan đến một sản phẩm hoặc sự kiện nào đó Đầu ra là thống kê có bao nhiêu phần trăm ý kiến trên internet thích hay không thích sản phẩm hoặc sự kiện

• Khi nhận được từ khóa, hệ thống sẽ thực hiện tìm kiếm các status, comment (dạng văn bản) của người dùng trên một số trang web như Facebook, Twitter, blogs… có chứa từ khóa trong khoảng thời gian nhất định Tiếp đó, hệ thống sẽ phân loại thái độ (thích hay không thích) từ các status thu được Cuối cùng tính số lượng phần trăm thích và không thích tương ứng

Video demo cần thể hiện được:

• Đầy đủ các bước được đề cập phía trên và theo đúng trình tự

• Ở mỗi bước, cần thể hiện được kĩ thuật nào được sử dụng, cũng như đầu vào và đầu ra ở mỗi bước

• Video cần dễ hiểu và trực quan sinh động

Các nội dung kiến thức sinh viên cần tìm hiểu:

• Web crawler (lấy dữ liệu từ internet)

• Opinion mining (khai thác ý kiến người dùng)

Đánh giá

ĐÁNH GIÁ SẢN PHẨM ĐỀ TÀI B (50% điểm của đề tài)

100%) Web crawler (lấy dữ liệu từ internet)

(30%)

Biết được các khái niệm cơ bản, ứng d

ụng

Hiểu được các khái niệm cơ bản, ứng dụng

Liệt kê được phương pháp OCR

Hiểu được các khái niệm, ứng dụng

Trình bày các phương pháp OCR

Hiểu các khái niệm, ứng dụng Trình bày các phương pháp OCR

Thử nghiệm các công cụ OCR(có

Trang 7

minh chứng)

Opinion mining (khai thác ý kiến người

dùng) (35%)

Biết được các khái niệm cơ bản, ứng d

ụng

Hiểu được các khái niệm cơ bản, ứng dụng

Hiểu được các khái niệm, ứng dụng

Biết các phương pháp rút trích từ khóa

Hiểu các khái niệm, ứng dụng Biết các phương pháp rút trích từ khóa

Thử nghiệm các công cụ (có minh chứng

của mô hình Hình ảnh nhiều chỗ không phù hợp với nội dung

Thể hiện đủ các bước mô hình Nêu rõ các kĩ thuật

sử dụng ở mỗi bước

Hình ảnh phù hợp với nội dung

Sử dụng hoàn toàn hình ảnh không tự quay

Thể hiện đủ các bước mô hình Nêu rõ các kĩ thuật sử dụng ở mỗi bước

Hình ảnh phù hợp với nội dung

<50% hình ảnh

sử dụng là tự quay

Thể hiện đủ các bước mô hình Nêu rõ các kĩ thuật sử dụng ở mỗi bước Hình ảnh phù hợp với nội dung

> 50% hình ảnh

sử dụng là tự quay

1.3

Đồ án 3 - Bảo mật

Xây dựng một video demo cho một mô hình bảo mật ở một công ty truyền thông Đồng thời, sinh viên tìm hiểu các nội dung kiến thức liên quan Những vấn đề bảo mật quan tâm là:

• Các sản phẩm (hình ảnh, video) được thiết kế/quay bởi công ty cần được chứng thực Chứng thực như một cách đánh dấu (hay kí tên) cho sản phẩm

• Các hình ảnh/video có thể gửi qua lại giữa các phòng ban và cần được bảo mật trước thời điểm công bố

Mô hình bảo mật hoạt động như sau:

• Các tập tin sản phẩm được áp dụng kĩ thuật ẩn dữ liệu để ẩn chữ kí chứng thực vào bên trong (mà không thể phá vỡ được)

• Các sản phẩm trước khi gửi đi đến các phòng ban cần được mã hóa trước Người nhận mong muốn sẽ phải giải mã để có sản phẩm gốc

Video demo cần thể hiện được:

• Đầy đủ các bước được đề cập phía trên và theo đúng trình tự

• Ở mỗi bước, cần thể hiện được kĩ thuật nào được sử dụng, cũng như đầu vào và đầu ra ở mỗi bước

Trang 8

• Video cần dễ hiểu và trực quan sinh động

Các nội dung kiến thức sinh viên cần tìm hiểu:

• Ẩn dữ liệu (data hiding)

• Mã hóa dữ liệu

Ngoài ra, sinh viên sẽ phải tự quay một video giới thiệu về nhóm để demo cho mô hình của mình

Đánh giá:

ĐÁNH GIÁ SẢN PHẨM ĐỀ TÀI C (50% điểm của đề tài)

100%)

Ẩn dữ liệu (data hiding)

(25%)

Biết được các khái niệm cơ bản, ứng d

ụng

Hiểu được các khái niệm cơ bản, ứng dụng

Liệt kê được phương pháp

Hiểu được các khái niệm, ứng dụng

Trình bày các phương pháp

Hiểu các khái niệm, ứng dụng Trình bày các phương pháp Thử nghiệm các công cụ OCR(có minh chứng)

Mã hóa dữ liệu (25%)

Biết được các khái niệm cơ bản, ứng d

ụng

Hiểu được các khái niệm cơ bản, ứng dụng

Hiểu được các khái niệm, ứng dụng

Biết các phương pháp rút trích từ khóa

Hiểu các khái niệm, ứng dụng Biết các phương pháp rút trích từ khóa

Thử nghiệm các công cụ (có minh chứng

của mô hình Hình ảnh nhiều chỗ không phù hợp với nội dung

Thể hiện đủ các bước mô hình Nêu rõ các kĩ thuật

sử dụng ở mỗi bước

Hình ảnh phù hợp với nội dung

Sử dụng hoàn toàn hình ảnh không tự quay

Thể hiện đủ các bước mô hình Nêu rõ các kĩ thuật sử dụng ở mỗi bước

Hình ảnh phù hợp với nội dung

<50% hình ảnh

sử dụng là tự quay

Thể hiện đủ các bước mô hình Nêu rõ các kĩ thuật sử dụng ở mỗi bước Hình ảnh phù hợp với nội dung

> 50% hình ảnh

sử dụng là tự quay

Video giới thiệu nhóm (20%) Đầy đủ các thông tin

các thành viên Hình ảnh nghèo nàn

Đầy đủ thông tin các thành viên Hình ảnh và âm thanh phù hợp

Đầy đủ thông tin các thành viên Nội dung hấp dẫn, sáng tạo

Trang 9

Các sản phẩm cần đạt được

1 Project plan (phác thảo dự án) Kế hoạch thực hiện dự án theo qui trình Scrum

2 Meeting minutes (chi tiết cuộc họp) Ghi lại nội dung các cuộc họp hang tuần của nhóm Các thành phần cơ

bản gồm có: Các công việc của tuần trước, tiến độ của các công việc này (đã xong, đã hoàn thành ?%), các vấn đề còn tồn động và các giải pháp đã chọn sau khi thảo luận, các công việc mới, phân công công việc cho tuần mới

3 Reflective report (báo cáo rút kinh nghiệm) Báo cáo rút kinh nghiệm sau khi hoàn thành dự án: nhận xét

những điểm đã làm tốt, những điểm còn tồn đọng, mức độ đóng góp của các thành viên

4 Báo cáo Slide Báo cáo dạng Slide về sản phẩm của nhóm (về video & nội dung kiến thức)

5 Sản phẩm demo

Trang 10

Hướng dẫn thực hiện theo tuần

Mục tiêu

Nội dung thực hiện được viết trên cơ sở 5 tuần thực hiện

Tuần 7 TH:

18/04/2016 Giới thiệu đề tài và các yêu cầu Lên kế hoạch cho dự án

Tuần 8 TH:

25/04/2016 Tìm hiểu một qui trình và các công cụ sẽ sử dụng

Tuần 9 TH:

02/05/2016 Tiến hành thử nghiệm quy trình Mô tả quy trình

Tuần 10 TH:

09/05/2016 Tiến hành thử nghiệm quy trình Mô tả quy trình

Tuần 11 TH:

16/05/2016 Hoàn chỉnh sản phẩm, slide & báo cáo

Tuần 12 TH:

23/05/2016

Báo cáo đồ án 2 vào giờ lí thuyết

Nhóm (đứng đầu là trưởng nhóm với vai trò Scrum Master) báo cáo hàng tuần cho Giảng viên hướng dẫn thực

hành (vai trò Product Owner) trong giờ thực hành hàng tuần

Kết quả thảo luận nhóm cần được ghi lại trong meeting minutes

Trang 11

a IrfanView

b MS Paint

c VietOCR

A Java/.NET GUI frontend for Tesseract OCR engine Supports optical character recognition for

Vietnamese and other languages supported by Tesseract

VietOCR is released and distributed under the Apache License, v2.0

http://vietocr.sourceforge.net/

d Other OCR tools

các tool OCR tham khảo Sinh viên được khuyến khích sử dụng và so sánh kết quả của các tool khác nhau

Đa phần các tool này cho phép dùng thử Sinh viên cần submit thông tin để download bản trial.

http://en.wikipedia.org/wiki/List_of_optical_character_recognition_software

C Các công cụ xử lý phim

e Window Movie Maker

Window Live Movie Maker - có sẵn trong máy Windows

f Adobe Premiere

Adobe Premiere Pro is a timeline-based video editing software application It is part of the Adobe

Creative Suite, a suite of graphic design, video editing and web

http://www.adobe.com/cfusion/tdrc/index.cfm?product=premiere_elements&loc=us g

Other video_editing_softwares

Các tool tham khảo Sinh viên được khuyến khích sử dụng và so sánh độ tiện dụng và hiệu quả của các tool khác nhau Một số tool miễn phí, một số trial Sinh viên cần submit thông tin để download bản trial.

http://en.wikipedia.org/wiki/Comparison_of_video_editing_software

Trang 12

h Adobe After Effects, tool Roto Brush.

Adobe After Effects is a digital motion graphics and compositing software package published by Adobe Systems, used in the post-production process of filmmaking and television production Its main uses are the origination of 2D and 2.5D animation, visual effects compositing and finishing (image adjustment, color correction etc.) After Effects can also be used as a basic non-linear editor and a media transcoder

http://www.adobe.com/cfusion/tdrc/index.cfm?product=after_effects

i Một số tool tham khảo khác

http://en.wikipedia.org/wiki/Adobe_After_Effects#Comparable_products

j Jet Audio

JetAudio là một trong những trình nghe nhạc vào loại bậc nhất hiện nay, có khả năng

chơi hầu hết các định dạng phổ biến và các định dạng khác, JetAudio còn có

riêng một bộ Equalizer của riêng mình làm tăng chất lượng âm thanh khi chơi bằng JetAudio

k Audacity

Audacity® là một phần mềm nguồn mở, tự do cho việc ghi âm và chỉnh sửa âm thanh Rất nhỏ gọn và nhanh

http://audacity.sourceforge.net/

http://vi.wikipedia.org/wiki/Audacity

http://www.youtube.com/watch?v=3TyF_vukSVY

http://www.youtube.com/watch?v=5rQr5YVNqI0

l MKVToolNix

MKVToolnix cho phép lấy phần audio của bộ phim chất lượng kém hơn ghép qua phim chất lượng cao của bạn Tất cả các yêu cầu trên có thể thực hiện dể dàng với MKVToolnix Dù tên là MKVToolnix nhưng

Trang 13

MKVToolnix hỗ trợ hầu hết các định dạng video, audio và sub hiện có, hơn nữa, đây là công cụ miễn phí 100%

http://www.bunkus.org/videotools/mkvtoolnix/downloads.html#windows http://forum.taiphanmem.org/index.php?topic=605.0

m Video Edit magic

Khi bạn có nhiều đoạn phim và muốn nối lại với nhau bằng các hiệu ứng độc đáo hay chèn chữ giới thiệu, Video Edit Magic là một công cụ hữu ích Phần mềm này chỉ có 12,8 MB nên không yêu cầu máy tính cấu hình cao Ngoài ra, Video Edit Magic còn có thể chụp hình từ webcam và chèn luôn vào đoạn phim đang chỉnh sửa Bản dùng thử 30 ngày sẽ chèn đoạn chữ quảng cáo vào sản phẩm cuối cùng Phần hướng dẫn được thực hiện dưới

dạng flash giúp người dùng dễ dàng theo dõi

http://www.download.com.vn/audio+video/video+editor+studio/5020_video-edit-magic.aspx

n Audio To Video Mixer

Công cụ “Audio to Video Mixer” sẽ giúp bạn thực hiện việc lồng âm thanh vào video số

chỉ bằng một vài cú click chuột

http://www.download.com.vn/timkiem/Audio+to+Video+Mixer/index.aspx

http://diendan.yeulaptop.com/phan-mem-long-am-thanh-vao-video-audio-video-mixer-3-0-7-a-

15524.html

E Các công cụ xử lý ngôn ngữ tự nhiên

o VLSP

Hệ thống trình diễn một số sản phẩm của nhánh đề tài "Xử lí văn bản" là một phần của đề tài KC01.01/06-10 "Nghiên cứu phát triển một số sản phẩm thiết yếu về xử lí tiếng nói và văn bản tiếng Việt" (VLSP)

Hệ thống tích hợp sản phẩm do Nguyễn Việt Cường và Nguyễn Lê Minh (JAIST) phát triển Các công cụ xử lí tiếng Việt do các nhóm thực hiện cung cấp Hệ thống tích hợp sử dụng các công cụ mã nguồn mở: PHP,

Ngày đăng: 27/05/2020, 21:45

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w