BỘ KHOA HỌC VÀ CÔNG NGHỆ CHƯƠNG TRÌNH KH&CN TRỌNG ĐIỂM CẤP NHÀ NƯỚC KC.01/11-15 BÁO CÁO TỔNG HỢP KẾT QUẢ KHOA HỌC CÔNG NGHỆ ĐỀ TÀI NGHIÊN CỨU, XÂY DỰNG HỆ THỐNG GỢI Ý QUẢNG CÁO TRONG
Trang 1BỘ KHOA HỌC VÀ CÔNG NGHỆ
CHƯƠNG TRÌNH KH&CN TRỌNG ĐIỂM CẤP NHÀ NƯỚC
KC.01/11-15
BÁO CÁO TỔNG HỢP
KẾT QUẢ KHOA HỌC CÔNG NGHỆ ĐỀ TÀI
NGHIÊN CỨU, XÂY DỰNG HỆ THỐNG GỢI Ý QUẢNG CÁO TRONG CÁC DỊCH VỤ CHIA SẺ HÌNH ẢNH TRỰC TUYẾN
Trang 2BỘ KHOA HỌC VÀ CÔNG NGHỆ
CHƯƠNG TRÌNH KH&CN TRỌNG ĐIỂM CẤP NHÀ NƯỚC KC.01/11-15
BÁO CÁO TỔNG HỢP
KẾT QUẢ KHOA HỌC CÔNG NGHỆ ĐỀ TÀI
NGHIÊN CỨU, XÂY DỰNG HẸ THỐNG GỢI Ý QUẢNG CÁO TRONG CÁC DỊCH VỤ CHIA SẺ HÌNH ẢNH TRỰC TUYẾN
Mã số KC.01.TN10/11-15
Chủ nhiệm đề tài/dự án:
Nguyễn Khánh Toàn
Cơ quan chủ trì đề tài/dự án:
Nguyễn Xuân Tài
Ban chủ nhiệm chương trình Bộ Khoa học và Công nghệ
Trang 3Hà nội, ngày tháng 12năm 2012
BÁO CÁO THỐNG KÊ KẾT QUẢ THỰC HIỆN ĐỀ TÀI
I THÔNG TIN CHUNG
1 Tên đề tài/dự án:Nghiên cứu, xây dựng hệ thống gợi ý quảng cáo trong các dịch
vụ chia sẻ hình ảnh trực tuyến
Mã số đề tài, dự án: KC.01.TN10/11-15
Thuộc: Chương trình KH&CN trọng điểm cấp nhà nước KC.01/11-15
2 Chủ nhiệm đề tài/dự án:
Họ và tên: NGUYỄN KHÁNH TOÀN
Ngày, tháng, năm sinh: 01/09/1984 Nam/ Nữ: Nam
Học hàm, học vị: Kỹ sư
Điện thoại: Tổ chức: 04.3767.8458 Nhà riêng:
Mobile: 0983.190.084Fax: 04.3767.8024 E-mail: toannk@socbay.com
Tên tổ chức đang công tác: Công ty cổ phần dịch vụ Công nghệ thông tin Naiscorp
Địa chỉ tổ chức: 101 Tòa nhà B1, đường Nguyễn Khánh Toàn, Cầu Giấy, Hà Nội
Địa chỉ nhà riêng: Số 15 ngõ 396, đường Trương Định, Hoàng Mai, Hà Nội
3 Tổ chức chủ trì đề tài/dự án:
Tên tổ chức chủ trì đề tài: Công ty cổ phần Dịch vụ Công nghệ thông tin Naiscorp
Điện thoại: 04.3767.8458 Fax: 04.3767.8024
E-mail: search@socbay.com Website: www.naiscorp.com
Địa chỉ: 101 Tòa nhà B1, đường Nguyễn Khánh Toàn, Cầu Giấy, Hà Nội
Họ và tên người đứng đầu tổ chức: Nguyễn Xuân Tài
Số tài khoản: 3711.9057491
Ngân hàng: Kho bạc Nhà nước quận Cầu Giấy – Hà Nội
Tên cơ quan chủ quản đề tài: Công ty cổ phần Dịch vụ Công nghệ thông tin Naiscorp
II TÌNH HÌNH THỰC HIỆN
1 Thời gian thực hiện đề tài/dự án:
- Theo Hợp đồng đã ký kết:từ 10 tháng 1 năm 2012 đến 10 tháng 1 năm 2013
Trang 4- Thực tế thực hiện:từ 10 tháng 1 năm 2012 đến 10 tháng 1 năm 2013
- Được gia hạn (nếu có):
Thời gian (Tháng, năm)
Kinh phí (Tr.đ)
Ghi chú (Số đề nghị quyết toán)
* 12 triệu =108 triệu
3 Các văn bản hành chínhtrong quá trình thực hiện đề tài/dự án:
Trang 5(Liệt kê các quyết định, văn bản của cơ quan quản lý từ công đoạn xác định nhiệm vụ, xét chọn, phê duyệt kinh phí, hợp đồng, điều chỉnh (thời gian, nội dung, kinh phí thực hiện nếu có); văn bản của tổ chức chủ trì đề tài, dự án (đơn, kiến nghị điều chỉnh nếu có)
TSTT
Số, thời gian ban
Ghi chú
1 15/12/2011 Quyết định số 3853/QĐ-BKHCN ngày
15/12/2011 của Bộ trưởng Bộ Khoa học và Công nghệ về việc phê duyệt kinh phí, tổ chức và cá nhân chủ trì các nhiệm vụ khoa học và công nghệ bắt đầu thựchiện trong kế hoạch 2011 của Chương trình: “Nghiên cứu ứng dụng và phát triển công nghệ Thông tin
và Truyền thông”, mã số KC.01/11-15
2 10/01/2012 Hợp đồng Nghiên cứu khoa học và phát
triển công nghệ số KC.01/11-15 và Thuyết minh đề tài
19/2011/HĐ-ĐTTN-“Nghiên cứu, xây dựng hệ thống gợi ý quảng cáo trong các dịch vụ chia sẻ hình ảnh trực tuyến”, mã số KC.01.TN10/11-15
3 10/01/2012 Bản quy chế chi tiêu kinh phí của đề tài
“Nghiên cứu, triển khai hệ thống chia sẻ hình ảnh cho cộng đồng”, mã số KC.01.TN10/11-15
4 Tổ chức phối hợp thực hiện đề tài, dự án:
Nội dung tham gia chủ yếu
Sản phẩm chủ yếu đạt được
tế MICA
Nghiên cứu công nghệ nhận dạng ảnh
Module nhận dạng ảnh
- Lý do thay đổi (nếu có):
5 Cá nhân tham gia thực hiện đề tài, dự án:
(Người tham gia thực hiện đề tài thuộc tổ chức chủ trì và cơ quan phối hợp, không quá 10 người kể cả chủ nhiệm)
Số Tên cá nhân Tên cá nhân Nội dung tham Sản phẩm chủ yếu Ghi
Trang 6TT đăng ký theo
Thuyết minh
đã tham gia thực hiện
Chủ nhiệm đề tàiNghiên cứu thuật toán nhận dạng đối tượng trong ảnh
Website thử nghiệm hệ thống gợi ý quảng cáo
2 Nghiêm Tiến
Viễn
Nghiêm Tiến Viễn
Xây dựng hệ thống gợi ý trên ảnh và gắn Watermark vào ảnh
Module gợi ý quảng cáo trong dịch vụ chia sẻ hình ảnh trực tuyến Upanh
3 Nguyễn Đức
Chính
Nguyễn Đức Chính
Xây dựng hệ thống gợi ý trên ảnh và gắn Watermark vào ảnh
Module gợi ý quảng cáo trong dịch vụ chia sẻ hình ảnh trực tuyến Upanh
4 Lê Thị Lan Lê Thị Lan Trích chọn thông
tin cho bài toán nhận dạng đối tượng
Chương trình phần mềm nhận dạng đối tượng/ khung cảnh trong ảnh
5 Trần Thị Thanh
Hải
Trần Thị Thanh Hải
Phương pháp học cho bài toán nhận dạng đối tượng
Chương trình phần mềm nhận dạng đối tượng/ khung cảnh trong ảnh
6 Đồng Văn Thái Đồng Văn
Thái
Xây dựng mô đun nhận dạng đối tượng trong ảnh
Chương trình phần mềm nhận dạng đối tượng/ khung cảnh trong ảnh
7 Phạm Ngọc Hải Phạm Ngọc
Hải
Xây dựng mô đun nhận dạng đối tượng trong ảnh
Chương trình phần mềm nhận dạng đối tượng/ khung cảnh trong ảnh
8 Lê Văn Hùng Lê Văn Hùng Kiểm tra, thử
nghiệm hệ thống
Website thử nghiệm hệ thống
Trang 7gợi ý quảng cáo, module gợi ý quảng cáo trong dịch vụ chia sẻ hình ảnh trực tuyến Upanh
9 Nguyễn Văn
Trường
Nguyễn Văn Trường
Thiết lập hệ thống kho lưu trữ
Website thử nghiệm hệ thống gợi ý quảng cáo
10 Phạm Quốc
Hiệp
ThS Trần Thị Hoàn
Tích hợp vào hệ thống
Website thử nghiệm hệ thống gợi ý quảng cáo
- Lý do thay đổi ( nếu có): Vì lý do cá nhân, KS Phạm Quốc Hiệp xin rút khỏi đề tài Đề tài đã mời Ths Trần Thị Hoàn tham gia để hoàn thiện đề tài đúng tiến độ
6 Tình hình hợp tác quốc tế:
Số
TT
Theo kế hoạch
(Nội dung, thời gian, kinh
phí, địa điểm, tên tổ chức
hợp tác, số đoàn, số lượng
người tham gia )
Thực tế đạt được (Nội dung, thời gian, kinh phí, địa điểm, tên tổ chức hợp tác, số đoàn, số lượng người tham gia )
Ghi chú*
- Lý do thay đổi (nếu có):
7 Tình hình tổ chức hội thảo, hội nghị:
Thực hiện theo kế hoạch
2 01 Hội nghị khoa học ở MICA
năm 2012
Hội thảo: “Các công nghệ được sử dụng để xây dựng hệ thống quảng cáo trên hình ảnh” ngày 24/12/2012 tại Công ty cổ phần dịch vụ Công nghệ
Thực hiện theo kế hoạch
Trang 8thông tin Naiscorp
- Lý do thay đổi (nếu có): Không
Trang 10III SẢN PHẨM KH&CN CỦA ĐỀ TÀI, DỰ ÁN
1 Sản phẩm KH&CN đã tạo ra:
Theo kế hoạch Thực tế đạt được
-Hiển thị thông tin về 10 lớp đối tượng -Hiển thị thông tin về 10 lớp đối tượng -Hiện thị thông tin về 05 khung hình (trong
trường hợp không có đối tượng trong lớp quan tâm)
-Hiện thị thông tin về 05 khung hình (trong trường hợp không có đối tượng trong lớp quan
-Nhận dạng đối tượng trong ảnh/khung cảnh của ảnh người dùng upload lên với 10 lớp đối tượng hoặc 05 khung hình (trong trường hợp không có đối tượng trong lớp quan tâm) với độ
-Đưa ra các gợi ý quảng cáo dựa vào các nhãn được gán, sinh các quảng cáo dưới dạng watermark gán vào ảnh dưới dạng text hoặc banner lên ảnh người dùng upload
-Đưa ra các gợi ý quảng cáo dựa vào các nhãn được gán, sinh các quảng cáo dưới dạng watermark gán vào ảnh dưới dạng text hoặc banner lên ảnh người dùng upload -Hiện thị ảnh và phần quảng cáo -Hiện thị ảnh và phần quảng cáo
1
Website thử
nghiệm hệ thống
gợi ý quảng cáo
-Thời gian thực hiện gần với thời gian thực (khoảng 1 giây)
-Thời gian thực hiện gần với thời gian thực (khoảng 1 giây)
Trang 11Nhận dạng đối tượng trong ảnh/khung cảnh
của ảnh với 10 lớp đối tượng hoặc 05 khung hình (trong trường hợp không có đối tượng trong lớp quan tâm) với độ chính xác 80%
Nhận dạng đối tượng trong ảnh/khung cảnh của ảnh với 10 lớp đối tượng hoặc 05 khung hình (trong trường hợp không có đối tượng trong lớp quan tâm) với độ chính xác 80%
Đưa ra các gợi ý quảng cáo dựa vào các nhãn được gán, sinh các quảng cáo dưới dạng watermark gán vào ảnh dưới dạng text hoặc banner cho các trang Web chia sẻ hình ảnh thế
hệ mới
Đưa ra các gợi ý quảng cáo dựa vào các nhãn được gán, sinh các quảng cáo dưới dạng watermark gán vào ảnh dưới dạng text hoặc banner cho các trang Web chia sẻ hình ảnh thế
Đáp ứng được 100.000 lượt người dùng đồng thời, 100.000.000 lượt truy xuất ảnh có quảng cáo mỗi ngày
Đáp ứng được 1.000 lượt người dùng đồng thời, 10.000 lượt truy xuất ảnh có quảng cáo
Kết nối cơ sở dữ liệu ảnh,cơ sơ ̉dữ liệu xâu text quảng cáo, xuất ra hệ thống web portal để tạo thành một sản phẩm tương đối hoàn thiện Cơ
sở dữ liệu ảnh được thiết kế phân tán, đáp ứng khả năng lưu trữ ảnh số lượng lớn
Kết nối cơ sở dữ liệu ảnh,cơ sơ ̉dữ liệu xâu text quảng cáo, xuất ra hệ thống web portal để tạo thành một sản phẩm tương đối hoàn thiện Cơ
sở dữ liệu ảnh được thiết kế phân tán, đáp ứng khả năng lưu trữ ảnh số lượng lớn
Đáp ứng được 1.000 lượt người dùng đồng thời, 10.000 lượt truy xuất ảnh có quảng cáo
3 01 Chương trình Đầu vào là một ảnh Đầu vào là một ảnh
Trang 12-Đầu ra là các đối tượng tồn tại ở trong ảnh và các thông tin về đối tượng như vị trí, kích thước, sự quan trọng của đối tượng
-Đầu ra là các đối tượng tồn tại ở trong ảnh và các thông tin về đối tượng như vị trí, kích thước, sự quan trọng của đối tượng -Có khả năng hoạt động trong trường hợp trong
cùng một ảnh có nhiều đối tượng quan tâm
-Có khả năng hoạt động trong trường hợp trong cùng một ảnh có nhiều đối tượng quan tâm -Cho phép nhận dạng 05 khung cảnh đối với
ảnh không có đối tượng quan tâm
-Cho phép nhận dạng 05 khung cảnh đối với ảnh không có đối tượng quan tâm
và thời gian tính toán Hệ thống được xây dựng cần:
- Cho phép phát hiện 10 lớp đối tượng cơ bản (người, nhà, xe cộ, ) với độ chính xác (precision) 70% trên cơ sở dữ liệu xây dựng
và thời gian tính toán Hệ thống được xây dựng cần:
- Cho phép phát hiện 10 lớp đối tượng cơ bản (người, nhà, xe cộ, ) với độ chính xác (precision) 70% trên cơ sở dữ liệu xây dựng
- Lý do thay đổi (nếu có):
Đề tài đặt ra kế hoạch là: “Đáp ứng được 100.000 lượt người dùng đồng thời, 100.000.000 lượt truy xuất ảnh có quảng cáo mỗi ngày” nhưng thực tế không thực hiện được vì hệ thống QUANGCAOANH.COM đang trong quá trình xây dựng và
Trang 13thử nghiệm Đề tài mới chỉ thử nghiệm ở mức “Đáp ứng được 1.000 lượt người dùng đồng thời, 10.000 lượt truy xuất ảnh có quảng cáo mỗi ngày.”
Thời gian thực hiện đề tài là quá ngắn nên không đủ để đưa sản phẩm vào kinh doanh
Yêu cầu khoa học cần đạt
Số
TT Tên sản phẩm
Theo kế hoạch Thực tế đạt được
Số lượng, nơi công bố (Tạp chí,
Được chấp nhận trình bày và đăng tải trên kỷ yếu của hội nghị, hội thảo
Computing, Management &
Telecommunications Conference (ComManTel 2013)
2 Nhận dạng ảnh đồi trụy
trong hệ thống chia sẻ
ảnh quy mô lớn
Được chấp nhận trình bày và đăng tải trên kỷ yếu của hội nghị, hội thảo
Được chấp nhận đăng tải trên tạp chí
Tạp chí Khoa học và Công nghệ, trường CĐ kĩ thuật Công nghệ Thủ Đức, tp HCM, số quý 1/2013
3 Object detection and
classification for
advertising service
based on image content
Được chấp nhận trình bày và đăng tải trên kỷ yếu của hội nghị, hội thảo
Được chấp nhận trình bày và đăng tải trên kỷ yếu của hội nghị, hội thảo
HUST - CNRS/UMI 2954 - Grenoble INP Hanoi University of Science and Technology
Trang 14b) Thống kê danh mục sản phẩm KHCN đã được ứng dụng vào thực tế
2 Module gợi ý quảng
cáo trong dịch vụ chia
2 Đánh giá về hiệu quả do đề tài, dự án mang lại:
a) Hiệu quả về khoa học và công nghệ:
(Nêu rõ danh mục công nghệ và mức độ nắm vững, làm chủ, so sánh với trình độ công nghệ so với khu vực và thế giới…)
Tổng quan về cách nội dung nghiên cứu trong đề tài là:
Thiết lập nền tảng phục vụ cho hệ thống quảng cáo trên ảnh
Các vấn đề công nghệ phục vụ cho mục tiêu là:
Vấn đề nghiên cứu 1: Công nghệ Webserver Portal phục vụ cho chia sẻ ảnh - cho
phép cân bằng tải, phục vụ cho hàng trăm triệu request về ảnh mỗi ngày
Tình hình nghiên cứu thế giới:
- Áp dụng các công nghệ phân tán, công nghệ tính toán đám mây để tăng hiệu năng của hệ thống, đáp ứng cho nhiều người sử dụng là những điều không mới Tất cả các công ty, tổ chức lớn đều đi theo hướng này Tuy nhiên, đặt trong bài toán chia sẻ ảnh với mục tiêu phục vụ cho 100.000 người sử dụng đồng thời, lưu trữ 50 triệu ảnh, chúng tôi chọn mô hình phân tán để xử lý vì nó phù hợp nhất về giá cả, độ khó của công nghệ, số lượng người phục vụ…
- Nói chung, các website chia sẻ ảnh lớn trên thế giới không công bố công nghệ của họ Tuy nhiên, qua quá trình tìm hiểu, thử nghiệm, chúng tôi cho rằng họ cũng thiết kế theo hướng có thể hoạt động theo cụm cluster server, tối ưu và sử dụng nhiều mô hình để quản lý các cụm máy chủ này
Trang 15- Vấn đề xây dựng hệ thống theo hướng phân tán đã được nhiều tổ chức, công ty, nhiều nhóm nghiên cứu và công bố kết quả dưới dạng tài liệu và mã nguồn mở Chúng tôi sử dụng các thành quả nghiên cứu này bằng cách nghiên cứu, tìm hiểu nhiều kết quả và lựa chọn cho mình công nghệ phù hợp nhất
Tình hình nghiên cứu Việt nam:
Các công ty ở Việt Nam cũng áp dụng các công nghệ phân tán theo trào lưu nghiên cứu chung của thế giới Tuy nhiên cũng có những sự khác biệt:
• Phần lớn các website ở Việt nam có quy mô vừa và nhỏ nên họ không cần phải tập trung nghiên cứu về công nghệ mà chỉ cần tăng số lượng server là đủ
• Với các công ty lớn, chắc chắn họ cũng đầu tư, nghiên cứu các công nghệ phân tải, phân tán; nhưng trong lĩnh vực hẹp là công nghệ phân tải phục vụ cho chia
sẻ ảnh, cũng chỉ có 1 vài công ty như Zing Photo, AnhSo.net nghiên cứu, ứng dụng Theo đánh giá của chúng tôi, công nghệ của các công ty này vẫn đang trong quá trình hoàn thiện
Kết quả nghiên cứu của đề tài:
Đề tài nghiên cứu thành công công nghệ này.Trình độ nghiên cứu tương đương với các kết quả nghiên cứu trên thế giới
Vấn đề nghiên cứu 2: Công nghệ lưu trữ phân tán các file ảnh - cho phép phục
vụ hàng trăm triệu lượt download mỗi ngày
Tình hình nghiên cứu thế giới và Việt Nam:
Cũng như vấn đề công nghệ Webserver Portal, vấn đề này được nghiên cứu nhiều ở thế giới; tuy nhiên ở Việt Nam, trong lĩnh vực hẹp là xây dựng hệ thống chia sẻ ảnh, công nghệ của các công ty xử lý ảnh vẫn còn đang hạn chế
Kết quả nghiên cứu của đề tài:
Đề tài nghiên cứu thành công công nghệ này.Trình độ nghiên cứu tương đương với các kết quả nghiên cứu trên thế giới
Vấn đề nghiên cứu 3 : Phát hiện và nhận dạng các đối tượng trong ảnh
Phát hiện và nhận dạng đối tượng trên ảnh là xác định có hay không đối tượng trong ảnh và xác định xem nó thuộc lớp đối tượng nào Đây là bài toán hấp dẫn thu hút sự quan tâm của nhiều nhà nghiên cứu trong và ngoài nước Kết quả của bài toán này có thể áp dụng trong các hệ thống giám sát từ xa, hệ thống điều khiển, trợ giúp, v.v
Trang 16Bài toán phát hiện và nhận dạng đối tượng thường được chia thành ba bài toán con:
• Biểu diễn đối tượng: liên quan đến việc trích chọn các đặc trưng sẽ được sử dụng và xác định mô hình biểu diễn đối tượng từ các đặc trưng này
• Học cách phân lớp đối tượng: thông qua mô hình biểu diễn đối tượng, các bộ phân lớp đối tượng sẽ được học từ các dữ liệu huấn luyện
• Nhận dạng: cho phép nhận dạng dữ liệu mới từ các bộ phân lớp đã được học
từ trước
Tại Việt Nam, trong một vài năm gần đây, một số nghiên cứu trong lĩnh vực này đã được thực hiện Các giảng viên Khoa điện – Điện tử – Trường Đại học GTVT đã có đề tài nghiên cứu: Hệ thống thu thập dữ liệu giao thông ứng dụng công nghệ xử lý ảnh cho phép đếm số lượng xe ở trên đường Học viện kỹ thuật quân sự
đã nghiên cứu và triển khai thành công hệ thống ghi vé ô tô, xe máy tự động Hệ thống gồm máy tính, camera, máy in Khi xe đi qua trạm ghi vé, camera sẽ chụp ảnh xe và biển số xe Ảnh này được đưa vào xử lý và nhận dạng biển số Kết quả của việc nhận dạng tự động biển số cho phép quản lý xe cộ và in vé tự động một cách dễ dàng và nhanh chóng, tiết kiệm được chi phí cho người ghi phát vé, đảm bảo lưu thông luồng nhanh Ngoài ra hệ thống còn cho phép thống kê phân tích và tìm kiếm dữ liệu xe gửi nên đảm bảo mức độ an ninh an toàn cao Trạm ghi phát vé
tự động là một hệ thống nhỏ, có thể áp dụng trong các bãi đỗ xe Các giải pháp về
xử lý ảnh được thiết kế trong những điều kiện tương đối lý tưởng: tốc độ xe nhỏ, ánh sáng không đổi, không gian thu nhận ảnh tương đối hẹp Vì thế việc nhận dạng
xe và biển số thực hiện dễ dàng Khi áp dụng các hệ thống nhận dạng trong môi trường không ràng buộc về điều kiện chiếu sáng, góc thu nhận ảnh, chuyển động của đối tượng, việc nhận dạng đối tượng vẫn đang còn là một là thách thức lớn đối với các nhà nghiên cứu về xử lý ảnh và thị giác máy tính
Trong khuôn khổ của đề tài độc lập cấp nhà nước mã số ĐTĐL "Nghiên cứu, thiết kế, tích hợp robot thông minh có khả năng ứng dụng trong khai thác các thông tin đa phương tiện" do Trung tâm MICA chủ trì thực hiện, nhóm xử lý ảnh của trung tâm tham gia thực hiện các mô đun nhận dạng cử chỉ tay
42/2009G/HĐ-và nhận dạng cảm xúc của người thông qua gương mặt trong ứng dụng tương tác người máy Các giải thuật phát hiện tự động lớp đối tượng như bàn tay, gương mặt trong ảnh/video trong thời gian thực đã cho những kết quả rất hứa hẹn Những nghiên cứu này có thể mở rộng để áp dụng vào việc phát hiện nhận dạng các loại đối tượng khác như người, đồ vật trong phòng
Trang 17Nhận xét chung:
Mặc dù đã có rất nhiều kết quả nghiên cứu về phát hiện và nhận dạng đối tượng và hiểu ảnh trên thế giới cũng như ở Việt Nam Đây vẫn còn là một thách thức trong lĩnh vực xử lý ảnh và thị giác máy vì mỗi lớp đối tượng có những tính chất và thể hiện khác nhau Ngoài ra các đối tượng trong cùng một lớp cũng rất đa dạng vì thế một hệ thống nhận dạng không có tính khái quát sẽ khó hoạt động hiệu quả Một hệ thống phát hiện và nhận dạng tự động đối tượng ảnh hoạt động hiệu quả là một hệ thống phải đáp ứng cả 2 yêu cầu: (1) cho độ chính xác cao với thời gian chấp nhận được và (2) có khả năng hoạt động được trong môi trường thực với
sự thay đổi của các yếu tố như độ sáng, phông nền, góc nhìn, thang đo v.v
Vấn đề nghiên cứu 4:Tìm kiếm text quảng cáo phù hợp với nội dung của ảnh
Sau khi đã nhận dạng đối tượng và hiểu ảnh ở một mức chấp nhận được, bài toán đặt ra ở đây là sử dụng thông tin về các đối tượng này để tìm ra xâu quảng cáo phù hợp Với mỗi yêu cầu quảng cáo của khách hàng, chúng tôi yêu cầu họ phải xác định ra một số đối tượng, đặc trưng, thể loại mà họ muốn quảng cáo
Vấn đề cần nghiên cứu ở đây không chỉ là việc tìm kiếm xâu quảng cáo phù hợp mà là việc thống kê các sự kiện quảng cáo.Bài toán tìm kiếm text quảng cáo đã được chúng tôi giải quyết trong quy mô phòng thí nghiệm Một hệ thống quảng cáo trong thực tế sẽ phải nhận hàng nghìn các request về tìm text quảng cáo phù hợp, đồng thời phải thống kê, tính toán chi phí online và chúng tôi chưa có điều kiện để thực hiện
Tình hình nghiên cứu thế giới:
Trình độ nghiên cứu cỉa về các vấn đề tính toán song song, thống kê số lượng lớn của thế giới là rất tốt.Các hệ thống quảng cáo của các công ty lớn như Google, Microsoft, Amazone đã hoàn thiện với quy mô toàn cầu
Tình hình ở Việt nam:
Các công ty Việt nam thường chọn mô hình quảng cáo theo thời gian: Ngày, tháng để dễ dàng cho việc triển khai chứ không chọn đến mức Click, View Thống kê đến mức Click, View đòi hỏi phải đầu tư nghiên cứu rất nhiều về hệ thống tính toán, xác thực
Kết quả nghiên cứu của đề tài:
Đề tài nghiên cứu thành công công nghệ ở quy mô phòng thí nghiệm.Các kết quả này so với các hệ thống lớn trên thế giới thì vẫn còn khá khiêm tốn
Trang 18b) Hiệu quả về kinh tế xã hội:
(Nêu rõ hiệu quả làm lợi tính bằng tiền dự kiến do đề tài, dự án tạo ra so với các sản phẩm cùng loại trên thị trường…)
b1 Mô hình kinh doanh của hệ thống QUANGCAOANH
Hình 12: Mô phỏng quá trình sử dụng dịch vụ quảng cáo theo ảnh
Chú thích:
- Có nhiều công ty cần quảng cáo (10.000 công ty), các công ty này gửi link và xâu text cần quảng cáo đến công ty Quảng cáo
- Công ty quảng cáo xây dựng cơ sở dữ liệu text cần quảng cáo
- Trên các website, forum có ảnh, bao gồm ảnh có hoặc không có chứa text Các website này gửi ảnh/link chứa ảnh thô đến công ty quảng cáo
- Công ty quảng cáo trả về Ảnh + text quảng cáo phù hợp
- Các website, forum hiển thị ảnh + text quảng cáo trên website của mình
- Người dùng xem ảnh, click vào link quảng cáo (do các công ty cần quảng cáo cung cấp)
b2 Quá trình thanh toán (Hình 13)
Trang 19Hình 13: Minh họa quá trình thanh toán
Chú thích:
1 10.000 công ty cần quảng cáo trả tiền cho công ty quảng cáo
2 Công ty quảng cáo chia sẻ doanh thu cho các website, forum
b3 Danh mục sản phẩm hàng hóa hình thành từ kết quả KH&CN
Sản phẩm hàng hóa chính của đề tài chính là dịch vụ tìm xâu quảng cáo phù hợp với ảnh Chúng tôi tạo ra các gói sản phẩm khác nhau để tạo thành các sản phẩm khác nhau
Ghi chú
1 View1 Cho phép View tối đa 1.000 lần
xâu quảng cáo trên các website khác nhau
Các doanh nghiệp nhỏ
2 View2 Cho phép View tối đa 5.000 lần
xâu quảng cáo trên các website khác nhau
Các doanh nghiệp vừa
3 View3 Cho phép View tối đa 10.000 lần
xâu quảng cáo trên các website khác nhau
Các doanh nghiệp lớn
Dịch vụ này không giới hạn
về thời gian; cho đến khi người dùng xem đủ số xâu quảng cáo
4 Click1 Cho phép Click tối đa 1.000 lần
xâu quảng cáo trên các website khác nhau
Thời hạn gói cước tối đa 1 tháng
Các doanh nghiệp nhỏ
Gói cước giới hạn về thời gian vì có thể xâu quảng cáo
Trang 205 Click2 Cho phép Click tối đa 5.000 lần
xâu quảng cáo trên các website khác nhau
Thời hạn gói cước tối đa 1 tháng
Các doanh nghiệp vừa
6 Click3 Cho phép Click tối đa 10.000 lần
xâu quảng cáo trên các website khác nhau
Thời hạn gói cước tối đa 1 tháng
Các doanh nghiệp lớn
không hấp dẫn, người dùng xem ảnh nhưng không click vào link
7 ClickView
1
Cho phép View tối đa 1.000 lần xâu quảng cáo trên các website khác nhau
Cho phép Click tối đa 500 lần
Các doanh nghiệp nhỏ
8 ClickView
2
Cho phép View tối đa 5.000 lần xâu quảng cáo trên các website khác nhau
Cho phép Click tối đa 2.000 lần
Các doanh nghiệp vừa
9 ClickView
3
Cho phép View tối đa 10.000 lần xâu quảng cáo trên các website khác nhau
Cho phép Click tối đa 5.000 lần
Các doanh nghiệp lớn
Gói cước sẽ kết thúc tùy theo điều kiện click hay view đến trước
Trong quá trình sử dụng dịch vụ, các công ty cần quảng cáo có thể xem, thống kê, kiểm soát và biết số lần view, click với từng xâu quảng cáo của mình
b4 Thị trường của sản phẩm
Sản phẩm hướng đến một thị trường rất rộng lớn là các công ty có nhu cầu quảng cáo Tùy theo quy mô, nhu cầu quảng cáo… mà các công ty có thể lựa chọn cho mình những gói cước phù hợp
b5 Thiết bị trong dây chuyền công nghệ, nguyên vật liệu đảm bảo cho sản xuất :
Thiết bị chủ yếu trong dây chuyền công nghệ là các cụm server được đặt phân tán trên các ISP khác nhau của Việt nam Các cụm server sẽ được lập trình để có thể liên lạc, kết nối và trao đổi dữ liệu với nhau, đảm bảo khả năng tính toán phân tán,
sử dụng lợi thế đường truyền nội mạng ISP để cung cấp dữ liệu nhanh nhất đến người sử dụng
Đầu vào cho sản xuất là các thuật toán nhận dạng ảnh, server và đường truyền.Cả 3 yếu tố trên đều cần phải được quan tâm, đầu tư đúng mức.Chúng tôi sẽ đầu tư hệ thống server có cấu hình đủ mạnh để có thể xử lý được nhiều ảnh, đặt server ở nhiều ISP khác nhau để tăng băng thông đường truyền Các công việc sẽ
được xử lý cả online và offline để tăng hiệu năng của hệ thống
Trang 21b6 Kế hoạch sản xuất kinh doanh trong 3-5 năm đầu tiên
I.Nhu cầu thị trường
Số lượng có thể tiêu thụ trong
8 ClickView2 lượt 6,000 9,000 13,500 Cho phép View tối đa
5.000 lần, Click 2.000 lần
9 ClickView3 lượt 4,000 6,000 9,000 Cho phép View tối đa
10.000 lần, Click 5.000 lần
Trang 22II Doanh thu dự kiến (lúc đạt 100% công suất)
Số lượng có thể tiêu thụ trong năm: Đơn vị tính 1000 đồng
Đơn giá Thành tiền Chú thích
8 ClickView2 lượt 13,500 420 5,670,000 Cho phép View tối đa
2.000 lần, Click 2.000 lần
9 ClickView3 lượt 9,000 210 1,890,000 Cho phép View tối đa
10.000 lần, Click 5.000 lần
Tổng tiền 14,411,250 Chia sẻ doanh thu 30% cho các website 4,323,375
Doanh thu còn lại 10,087,875
Doanh thu của dự án dự kiến ổn định vào năm 2015 với số tiền là
10.087.875.000 đồng/năm
b8 Phương án nâng cao năng lực sản xuất kinh doanh
Để nâng cao năng lực sản xuất kinh doanh, chúng tôi sử dụng các cách thức
sau
Trang 23• Các thuật toán, các nghiên cứu mới của đề tài sẽ được cập nhật thường xuyên cho các server để nâng cao chất lượng dịch vụ
• Chúng tôi đưa ra các gói cước khác nhau là để có thêm nhiều lựa chọn cho khách hàng
• Liên kết với công ty Naiscorp để quảng cáo trên các sản phẩm của Naiscorp như Socbay iMedia, Socbay News Portal…
• Cho phép sử dụng miễn phí dịch vụ trong thời gian đầu
• Ký kết hợp đồng làm việc với các Website để hợp tác kinh doanh
Liên kết, đặt server ở nhiều nhà mạng khác nhau để đảm bảo băng thông
và độ ổn định hệ thống
b9 Các ràng buộc về bản quyền công nghệ
Các kết quả về nhận dạng đối tượng/khung cảnh trong ảnh nghiên cứu và phát triển trong đề tài thuộc về bản quyền của Trung tâm nghiên cứu quốc tế MICA, Trường Đại học Bách Khoa Hà Nội Các kết quả chỉ được sử dụng trong các sản phẩm đã đăng ký của đề tài phục vụ cho việc đánh giá, nghiệm thu
đề tài Việc sử dụng kết quả này trong phát triển kinh doanh, xây dựng doanh nghiệp khoa học cần phải được sự chấp nhận của Trung tâm nghiên cứu quốc tế MICA, Trường Đại học Bách Khoa Hà Nội
3 Tình hình thực hiện chế độ báo cáo, kiểm tra của đề tài, dự án:
Số
Thời gian thực hiện
Ghi chú (Tóm tắt kết quả, kết luận chính, người chủ trì…)
I Báo cáo định kỳ
- Về số lượng: Đảm bảo đúng tiến độ
đã ký trong hợp đồng với bộ, một số chuyên đề đã làm vượt so với thời hạn
ký trong hợp đồng
- Về chất lượng: Đảm bảo các chương trình, module chạy ổn định, đạt yêu cầu