1. Trang chủ
  2. » Thể loại khác

Xây dựng ứng dụng trao đổi dữ liệu đa phương tiện theo chuẩn NewsML G2 ứng dụng tại Thông tấn xã Việt Nam : Luận văn ThS. Công nghệ thông tin: 60 48 01 04

58 19 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 58
Dung lượng 2,87 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Sau sự ra đời của các công nghệ mới để biểu diễn dữ liệu - chủ yếu là XML – việc phát triển IIM đã bị ngừng lại vào năm 1997, chỉ có một thay đổi nhỏ được ứng dụng trong năm 2014.. - IIM

Trang 1

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

NGUYỄN KHẮC MINH

Xây dựng ứng dụng trao đổi dữ liệu đa phương tiện theo chuẩn NewsML G2 ứng dụng tại

Thông tấn xã Việt Nam

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

HÀ NỘI – 2015

Trang 2

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

NGUYỄN KHẮC MINH

Xây dựng ứng dụng trao đổi dữ liệu đa phương tiện

theo chuẩn NewsML G2 ứng dụng tại

Thông tấn xã Việt Nam

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS.NGUYỄN HẢI CHÂU

HÀ NỘI – 2015

Trang 3

LỜI CAM ĐOAN

- Tôi xin cam đoan rằng luận văn của tôi là công trình nghiên cứu của bản thân Luận văn hoàn toàn không phải là bản sao chép công trình nghiên cứu của một người khác, nó mang tính độc lập nhất định với tất cả các công trình nghiên cứu trước đây Tất cả các tài liệu tham khảo đều có xuất xứ rõ ràng và được trích dẫn hợp pháp

- Nếu có vi phạm gì, tôi xin hoàn toàn chịu trách nhiệm

Hà Nội, ngày 29 tháng 05 năm 2015

Học viên Nguyễn Khắc Minh

Trang 4

LỜI CẢM ƠN

- Để hoàn thành bài luận văn này và có kiến thức như ngày hôm nay, đầutiên tôi xin gửi lời cảm ơn đến cán bộ hướng dẫn khoa học PGS.Nguyễn Hải Châuđã tận tình hướng dẫn, quan tâm và động viên tôi trong quá trình tìm hiểu, nghiên cứu, xây dựng

và hoàn thành luận văn này

- Tôi xin gửi lời cảm ơn đến Ban Giám Hiệu cùng toàn thể thầy cô khoa Công nghệ thông tin - Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội đã tận tình giảng dạy, truyền đạt kiến thức cũng như những kinh nghiệm quý báu cho tôi cùng toàn thể các học viên cao học khóa 19 trong suốt quá trình học tập và nghiên cứu tại trường

- Tôi xin bày tỏ lòng biết ơn sâu sắc đến Ban Lãnh Đạo cùng toàn thể anh chị em đồng nghiệp Phòng Quản trị hệ thống-Trung tâm kỹ thuật thông tấn xã Việt Nam đã cho phép và tạo mọi điều kiện ủng hộ và giúp đỡ tôi trong suốt khóa học Thạc sĩ này

- Tôi cũng xin chân thành cảm ơn những người thân trong gia đình, bạn bè đã động viên và tạo mọi điều kiện giúp tôi trong quá trình học tập, công tác cũng như trong cuộc sống

- Mặc dù cố gắng hoàn thành luận văn nhưng do thời gian và khả năng còn nhiều hạn chế nên luận văn khó tránh khỏi những sai sót nhất định, rất mong được sự thông cảm cũng như sự chỉ dẫn, góp ý của thầy cô và bạn bè để luận văn được hoàn thiện hơn

- Cuối cùng tôi xin gửi lời chúc sức khỏe và thành đạt tới tất cả quý thầy cô, quý đồng nghiệp cùng gia đình và bạn bè

Hà Nội, ngày 29tháng 05 năm 2015

Học viên Nguyễn Khắc Minh

Trang 5

ĐỀ TÀI:

Xây dựng ứng dụng trao đổi dữ liệu đa phương tiện theo chuẩn NewsML-G2

ứng dụng tại Thông tấn xã Việt Nam

Chương I: 7

HỆ THỐNG QUẢN LÝ ẢNH CỦA THÔNG TẤN XÃ VIỆT NAM 7

1.1 Quy trình nhận ảnh của Thông tấn xã Việt Nam 7

1.1.1 Mô hình nhận ảnh của TTXVN 7

1.1.2 Mô tả chi tiết các luồng thông tin nhận ảnh quốc tế 7

1.1.3 Mô tả chi tiết các luồng thông tin nhận ảnh Trong nước 9

1.2 Quy trình Biên tập ảnh của Thông tấn xã Việt Nam 10

Chương 2: 13

CHUẨN NEWSML-G2 13

2.1 Các chuẩn G2 Standards IPTC 13

2.1.1 Chuẩn IIM 13

2.1.2 ChuẩnIPTC7901 Định dạng truyền tải văn bản 13

2.1.3 Chuẩn Định dạng văn bản tin tức NITF 14

2.1.4 Chuẩn NewsML 1 14

2.1.5 Chuẩn EventsML-G2 14

2.1.6 Chuẩn Sport ML-G2 15

2.1.7 Chuẩn NewsML-G2 15

2.2 Giới thiệu Chuẩn NewsML-G2: 15

2.2.1 Các mục NewsML-G2 15

2.2.2 Cấu trúc mục 16

2.3 NewsML-G2 văn bản 19

2.3.1 Cấu trúc tài liệu 20

2.3.2 Nội dung văn bản 21

2.4 NewsML-G2 hình ảnh 22

2.4.1 Siêu dữ liệu nhúng 22

2.4.2 Cấu trúc 24

2.4.3 Dữ liệu hình ảnh 25

2.5 NewsML-G2 Video 26

Chương 3: 30

DỊCH VỤ WEB 30

Trang 6

3.1 Tổng quan web services 30

3.1.1 Khái niệm: 30

3.1.2 Đặc điểm của Web service 31

3.1.3 Ưu và nhược điểm 32

3.2 Kiến trúc của Dịch vụ Web 32

3.2.1 Mô hình hoạt động 32

3.2.2 Kiến trúc của Dịch vụ Web 34

3.3 Các thành phần của web service 35

3.3.1 XML – Ngôn ngữ đánh dấu mở rộng 35

3.3.2 WSDL – Ngôn ngữ mô tả dịch vụ web 35

3.3.3 UDDI - Tích hợp, khám phá và mô tả đa năng 37

3.3.4 SOAP –Giao thức truy cập đối tượng đơn giản 37

Chương 4:

XÂY DỰNG CHƯƠNG TRÌNH ỨNG DỤNG VÀ KẾT QUẢ THỬ NGHIỆM 39

4.1 Thực trạng cần giải quyết 39

4.2 Xây dựng chương trình 39

4.2.1 Xây dựng chương trình bóc ảnh theo chuẩn XML 39

4.2.2 Xây dựng chương trình phát ảnh theo chuẩn XML 41

4.2.3 Xây dựng dịch vụ web 44

4.3 Kết luận và hướng phát triển 49

TÀI LIỆU THAM KHẢO 50

PHỤ LỤC 52

Trang 7

DANH MỤC CÁC KÝ HIÊU VIÊT TẮT

1 ITPC International

Telecommunication Press Council

Hội đồng báo chí Viễn thông Quốc

tế

2 IIM Information Interchange

Model

Trao đổi thông tin mẫu

3 NITF News Industry Text Format Chuẩn Định dạng văn bản tin tức

4 IPTC7901 1990s by IPTC Information

Interchange Model

Định dạng truyền tải văn bản

5 AP Associated Press Liên đoàn báo chí Hoa kỳ

Trang 8

DANH MỤC HÌNH VẼ ĐỒ THỊ

Hình 1.1: Mô hình nhận ảnh của Thông tấn xã Việt Nam……… ………7

Hình 1.2: Mô hình nhận ảnh AFP của Thông tấn xã Việt Nam……… 8

Hình 1.3: Mô hình nhận ảnh KYODO của Thông tấn xã Việt Nam……… 9

Hình 1.4: Mô hình nhận ảnh của thông tấn xã Việt Nam……… ……10

Hình 1.5: Quy trình Biên tập ảnh của thông tấn xã Việt Nam……… …11

Hình 2.1: Các kiểu Item NewsML-G2……… 15

Hình 2.2: Cấu trúc Item NewsML-G2……… 16

Hình 2.3: Cấu trúc NewsML-G2 text của hãng AFP……… 19

Hình 2.4: IPTC Fields………23

Hình 2.5: NewsML-G2 Picture……….26

Hình3.1: Máy khách gọi dịch vụ web ……….30

Hình 3.2: Mạng nội bộ……… 30

Hình 3.3: Các loại dịch vụ web ……….……… 31

Hình 3.4: Mô hình hoạt động của dịch vụ web ……… 33

Hình 3.5: Kiến trúc của dịch vụ web …… ………34

Hình 3.6: Cấu trúc của SOAP ……… 38

Hình 4.1: Chương trình Photo_NEWSML-G2……… 41

Hình 4.2: Thông tin ảnh theo chuẩn NEWSML G2 ……… 41

Hình 4.3: Chương trình phát ảnh Despatches NEWSML-G2……… 43

Hình 4.4: Web TTXVN_Biên tập Ảnh ……….………44

Hình 4.5: Solution dịch vụweb ……….45

Hình 4.6: Web TTXVN_Biên tập ảnh … ……… 45

Hình 4.7: Các dịch vụ web.……… ……… 46Hinh 4.8: Giao diện hộp thoại add web reference……….47

Hinh 4.9: Giao diện đăng nhập……… 47

Hình 4.10: Giao diện đăng nhập thành công ………48

Hình 4.11: Kết quả tra cứu ……… 48

Trang 9

Chương I:

HỆ THỐNG QUẢN LÝ ẢNH CỦA THÔNG TẤN XÃ VIỆT NAM

1.1 Quy trình nhận ảnh của Thông tấn xã Việt Nam

- Ảnh trong nước:Phóng viên

Đầu vào là ảnh.ipg; được chương trình Datains đọc dữ liệu metadata của ảnh, insertthông tin vào database Photostore

1.1.2 Mô tả chi tiết các luồng thông tin nhận ảnh quốc tế

a Ảnh AFP

Trang 10

Hình 1.2: Mô hình nhận ảnh AFP của Thông tấn xã Việt Nam

- Quy trình thu: Ảnh thu từ vệ tinh qua Ăngten về Máy thu tin ảnh afp Ảnh thu

về lưu tại thư mục: D:\MediaServer\MSE02416\Database\Photo\yyyy-MM-dd

(1) Ảnh AFP; AFF sẽ được ftp từ máy chủ Thu tin ảnh AFP sang F:\ImgInput\NEWAFP(máy chủ application) Tiến trình ftp ảnh tự động được bên AFP config

(2) Trên máy chủ app 172.16.60.167, chương trình datains sẽ quét ảnh trong F:\ImgInput\NEWAFP để:

 Đọc thông tin metadata ảnh, insert dữ liệu vào database Photostore

 Ftp ảnh lên thư mục F:\ImgStore\yyyy\MM\dd (server Photo)

 Đọc thông tin metadata ảnh, insert dữ liệu vào database Photostore

 Ftp ảnh lên thư mục F:\ImgStore\yyyy\MM\dd (server Photo)

c Kyodo

Trang 11

Hình 1.3: Mô hình nhận ảnh KYODO của Thông tấn xã Việt Nam

- Quy trình thu tin:

(1) Ảnh KYODO sẽ được ftp về máy chủ Application F:\ImgInput\ KYODO Tiến trình ftp ảnh tự động được bên KYODO config

(2).Trên máy chủ Application, chương trình datains sẽ quét ảnh trongthư mục F:\ImgInput\ KYODO để:

 Đọc thông tin metadata ảnh, insert dữ liệu vào database Photostore

 Ftp ảnh lên thư mục F:\ImgStore\yyyy\MM\dd (server Photo)

1.1.3 Mô tả chi tiết các luồng thông tin nhận ảnh Trong nước

Trang 12

Hình 1.4: Mô hình nhận ảnh của thông tấn xã Việt Nam

Phóng viên gửi ảnh vào hệ thống bằng 2 cách:

- Cách 1: Qua đường mail:

 Phóng viên gửi ảnh vào địa chỉ mail anhttx@vnanet.vn

 Chương trình bóc mail tự động sẽ download ảnh về máy chủ Application

 Trên máy chủ Application, chương trình datains sẽ quét ảnh trong thư mục F:\ImgInput\VNA để:

 Đọc thông tin metadata ảnh, insert dữ liệu vào database Photostore

 Ftp ảnh lên thư mục F:\ImgStore\yyyy\MM\dd (server Photo)

- Cách2: Ảnh nhập qua hệ tác nghiệp ảnh

 Phóng viên đăng nhập vào hệ thống tác nghiệp ảnhhttp://tntt.vnanet.vn

 Upload ảnh lên hệ thống tác nghiệp sharepoint Ảnh sau khi được chuẩn hóa

sẽ được lưu trữ trên máy chủ Photostore

1.2 Quy trình Biên tập ảnh của Thông tấn xã Việt Nam

- Quy trình tác nghiệp từ lúc gửi ảnh cho đến khi phát ảnh cho khách hàng thông qua phần mềm hệ tác nghiệp ảnh hoặc Biên tập ảnh Qua từng khâu trong quy trình đều được ghi lại các trạng thái liên quan đến từng mốc thay đổi và nội dung thay đổi

Trang 13

Hình 1.5: Quy trình Biên tập ảnh của thông tấn xã Việt Nam

- Hệ tác nghiệp ảnh: Xây dựng trên nền tảng web sharepoint của TTXVN (phục

vụ cho phóng viên cơ động)

- Biên tập ảnh: Xây dựng trên nền tảng visual studio 2003, ngôn ngữ VB Phục

vụ cho mạng trong

- Quy trình biên tập, duyệt ảnh trong hai hệ thống

- Quy trình Biên tập, duyệt ảnh cho khách hàng, ảnh của TTXVN thay đổi qua các trạng thái:

 Ảnh nhập: Ảnh ban đầu nhận được từ các hãng tin quốc tế, và phóng viên

Trang 14

 Biên tập: Ảnh được phóng viên biên tập, chỉnh sủa nội dung trong metadata

 Chờ Duyệt: Ảnh đã được phóng viên gửi lên để cán bộ phòng xét duyệt về nội dung metadata, chất lượng ảnh

 Duyệt: Ảnh đã sang trạng thái gửi cho các khách hàng

- Chương trình Photo Despath sẽ xem trạng thái ảnh đã duyệt trong database photostore để gửi đi cho khách hàng Ảnh gửi đi dưới dạng JPG

Trang 15

Chương 2:

CHUẨN NEWSML-G2 2.1 Các chuẩn G2 Standards IPTC

- Hội đồng báo chí Viễn thông Quốc tế(ITPC) có trụ sở tại London, Vương quốc Anh IPTC được thành lập vào năm 1965 bởi một nhóm các tổ chức tin tức Hiện nay có hơn 50 công ty và các tổ chức từ các ngành công nghiệp tin tức đều là thành viên của IPTC như Associated Press (AP), Agence France-Presse (AFP), Deutsche Presse-Agentur (DPA), BBC, Getty Images, Hiệp hội Báo chí (PA), Reuters và The New York Times

- ITPC phát triển và thiết kế các tiêu chuẩn công nghiệp cho việc quản lý và trao đổi thông tin giữa các nhà cung cấp nội dung, trung gian và người tiêu dùng IPTC cam kết các tiêu chuẩn mở và làm cho tất cả các tiêu chuẩn tự do có sẵn cho các thành viên và cộng đồng rộng lớn hơn

2.1.1 Chuẩn IIM

- IPTC và Hiệp hội Báo chí Mỹ (NAA) đã bắt đầu hợp tác cùng nhau vào năm

1990 nhằm thiết kế một mô hình khả dụng trên toàn cầu cho tất cả các loại dữ liệu Kết quả của nỗ lực này là vào năm 1991, "mô hình trao đổi thông tin - IIM" phiên bản 1 đã được chấp thuận và tiếp tục phát triển kể từ đó Sau sự ra đời của các công nghệ mới

để biểu diễn dữ liệu - chủ yếu là XML – việc phát triển IIM đã bị ngừng lại vào năm

1997, chỉ có một thay đổi nhỏ được ứng dụng trong năm 2014

- IIM là một cấu trúc tập tin và thiết lập các thuộc tính siêu dữ liệu.Trong file ảnh kỹ thuật số,các thuộc tính siêu dữ liệu của IIM đang khá nổi tiếng là "IPTC fields" trong "IPTC Header" Adobe Systems Inc đã phát minh ra cơ chế riêng để chèn cáccấu trúc siêu dữ liệu vào Photoshop, JPEG và các file TIFF songchấp nhận cấu trúc dữ liệu của IIM và một số yếu tố siêu dữ liệu của nó Cơ chế chèn siêu dữ liệu này cũng được thực hiện bởi các nhà cung cấp phần mềm khác, do đó nhiều chương trình thư viện hình ảnh có thể đọc và viết những "IPTC Header"

- Bên cạnh đó, IIM còn được thiết kế để cung cấp cho truyền thông phổ biến lưu trữ tất cả các loại dữ liệu, trong đó có văn bản, hình ảnh, đồ họa Một cơ chế được cung cấp để sử dụng các định dạng hiện có trong quá trình chuyển đổi

- IIM giả định rằng người gửi mong muốn chuyển một đối tượng dữ liệu, như một hình ảnh, văn bản hoặc có thể một sự kết hợp của nhiều loại Một phong bì được cung cấp để bọc đối tượng thông tin như loại dữ liệu và định dạng file Thông tin bổ sung, chẳng hạn như chú thích, thể loại tin tức hoặc thời hạn cũng được bao gồm Đối tượng tự nó được chuyển giao, cùng với thông tin về kích thước của dữ liệu Vì vậy bất kỳ hình thức dữ liệu máy tính có thể được chuyển giao, cùng với biên tập thích hợp

và các thông tin kỹ thuật

2.1.2 ChuẩnIPTC7901 Định dạng truyền tải văn bản

- IPTC đã đưa ra khuyến nghị 7901 để sử dụng trong việc truyền tải các tin nhắn văn bản đến các tờ báo, cơ quan thông tấn và các địa chỉ khác Phiên bản đầu tiên

Trang 16

xuất hiện trong những năm đầu thập niên 80 và được cập nhật thường xuyên, phiên bản 5 cuối cùng đã được phê duyệt vào năm 1995 Kể từ đó sự phát triển của IPTC

7901 bị ngừng lại bất chấp sự thật là nó vẫn được sử dụng rộng rãi ở nhiều nước

- Mặc dù chủ yếu được thiết kế nhằm xử lý thông tin máy tính, khuyến nghị

7901 cũng phù hợp để truyền tải tới những người nhận không được trang bị máy tính Khuyến nghị đã bị ảnh hưởng bởi "Highspeed Wire Service Transmission Guidelines" được đưa ra trong Thông cáo 1312 và sửa đổi bổ sung của Hiệp hội Báo chí Mỹ (NAA), trước đây là Hiệp hội Báo chí xuất bản Hoa Kỳ (ANPA)

2.1.3 Chuẩn Định dạng văn bản tin tức NITF

- NITF dựa trên eXtensible Markup Language(XML) để xác định nội dung và cấu trúc của các bài báo Do siêu dữ liệu được ứng dụng trong suốt nội dung tin tức, các tài liệu NITF có thể tìm kiếm và hữu ích hơn các trang HTML

- Bằng cách sử dụng NITF, các nhà xuất bản có thể đưa cái nhìn, cảm nhận và tương tác của các văn bản vào băng thông, thiết bị, và các nhu cầu cá nhân của các thuê bao của họ Những tài liệu này có thể được dịch sang HTML, WML (cho các thiết bị không dây),RTF (cho in ấn), hoặc bất kỳ định dạng nào mà nhà xuất bản mong muốn

- NITF được phát triển bởi IPTC Nó là một tiêu chuẩn mở, công khai, đã được minh chứng, sử dụng tốt, mang tính tài liệu tốt hỗ trợ tốt

2.1.4 Chuẩn NewsML 1

- NewsML 1 là một tiêu chuẩn XML,một giải pháp cho việc trao đổi thông tin

đa phương tiện được đóng gói NewsML 1 thiết kế để cung cấp một dạng phương tiện truyền thông độc lập, khung cấu trúc cho tin tức đa phương tiện Ngoài việc trao đổi các mục đơn lẻ nó cũng có thể truyền tải nhiều mục trong cùng 1 bản cấu trúc

- NewsML 1 một nhãn hiệu đăng ký của IPTC Nó cũng đã được thông qua như

là tiêu chuẩn Công nghiệp Nhật Bản (JIS) X7201: 2005 dưới tên NewsML gốc

2.1.5 Chuẩn EventsML-G2

- EventsML-G2 là một tiêu chuẩn cho việc truyền thông sự kiện trong một môi trường công nghiệp tin tức và xây dựng dựa trên XML Nó tối ưu hóa việc chia sẻ thông tin sự kiện như các buổi họp, các sự kiện thể thao, các cuộc bầu cử, thậm chí phóng tên lửa một cách để các cơ quan tin tức để chia sẻ thông tin sự kiện của riêng của họ Các sự kiện không cần phải cố định bắt đầu hoặc kết thúc ngày EventsML-G2

có thể chứa đủ metadata để mô tả hầu hết mọi hoạt động

- Đặc biệt EvensML-G2 có thể được sử dụng để:

 Nhận được tất cả sự thật về một sự kiện từ các nhà tổ chức sự kiện

 Xuất bản tất cả sự thật về một sự kiện cụ thể của một nhà cung cấp tin tức;

 Xuất bản toàn bộ hay chỉ một tập hợp con của các sự kiện của một đến nhiều

sự kiện bởi danh sách sự kiện

 Lưu trữ sự kiện về các sự kiện có kiến thức trong tài liệu lưu trữ

Trang 17

- Các tin tức chuyển tải dưới dạng văn bản, hình ảnh, đồ họa, video, âm thanh hoặc các loại phương tiện truyền thông khác, nó được dùng để xây dựng nội dung đa phương tiện

2.2 Giới thiệu Chuẩn NewsML-G2:

New Item: nơi chứa đựng

bao gồm nội dung của

vanư bản, hình ảnh, âm

thanh, video

New Item: nơi chứa đựng các nội dung tham khảo cho các mục

Knowledge Item : nơi chứa các khái niện thành một tập hợp

Planning Item: nơi chứa đựng các kế hoạch, phân phối của tin tức

Concept Item: nơi chứa đựng các thông tin về con người, địa điểm …

Cataog Item: nơi chứa đựng quản lý các tài liệu tham khảo

Hình 2.1: Các kiểu Item NewsML-G2

- Cấu trúc cơ bản của một dữ liệu NewsML-G2 Item chung cho tất cả ứng dụng.Các kiểu có sẵn của G2 Item bao gồm:

 News Item: dùng xác định mô tả, nội dung tin tức báo chí như văn bản, hình ảnh âm thanh, video trọn gói

 Package Item: thu thập, đóng gói các nội dung tin của hãng tin Một trong những ứng dụng là thường xuyên là tổng hợp cho các sản phẩm tin tức Ví dụ Tổng hợp top 10 tin mới nhất

 Concept Item: Mô tả các khái niệm, kiến thức hiểu biết về một đối tượng

Trang 18

 Knowledge Item: Mục đích là để phân loại tin tức đa dạng càng tốt và để xác định những người, tổ chức, địa điểm và các đơn vị khác trước khi gửi cho khách hàng, nhằm tăng giá trị và tính hữu dụng của nó

 Planning Item: trao đổi thông tin về phạm vi và việc thực hiện tin tức

 Catalog Item: quản lý các tham chiếu đối với các từ vựng được kiểm soát 2.2.2 Cấu trúc mục

- Các khối xây dựng lên NewsML-G2 Item bao gồm:

 Nội dung của mục

Hình 2.2: Cấu trúc Item NewsML-G2

Mỗi loại NewsML-G2 có các thẻ khác nhau cho nội dung khác nhau

Trang 19

Ví dụ: <newsItem FED”

guid=“urn:newsml:acmenews.com:20131121:US-FINANCE- Version: Phiên bản của item Phiên bản bắt đầu bằng 1 Phiên bản mới có số cao hơn phiên bản cũ

 Category sử dụng Codes như là bộ nhớ ngắn, là tính năng thiết lập trong việc trao đổi tin tức QCodes là cơ chế NewsML-G2 cho phép các đối tác trong trao đổi tin tức để đảm bảo rằng mã là duy nhất News Item <catalog> cho phép một bộ xử lý G2

để giải quyết QCodes, và đảm bảo tính độc đáo đó, bằng cách ánh xạ mã cho một URI duy nhất Đó là khuyến cáo rằng URI này nằm một nguồn tài nguyên web

 IPTC xác định ý định kinh doanh của Item Đối với một News Item, chương trình này là News Item Thiên nhiên, với một bí danh được đề nghị của "ninat" Giá trị

từ chương trình này bao gồm "ninat: Text" và "ninat: image"

Ví dụ:

d Item Metadata <itemMeta>:

Trang 20

 Item Metadata Chứa các siêu dữ liệu về các điều khoản cần tuân theo Các quy định này cho phép các nhà xuất bản để diễn tả siêu dữ liệu về các phần cụ thể của nội dung <contentMeta>, <partMeta>

 Các thuộc tính bắt buộc: <itemMeta> phần có bốn yếu tố bắt buộc, hiện theo trình tự sau:

 Item Class: mô tả các loại nội dung được truyền đạt bởi các Item Nội dung này bao gồm "ninat: hình ảnh", "ninat: video" và "ninat: âm thanh"

 Publication Status: Mỗi G2 Item phải có một công bố trạng thái; “usable”:

có thể sử dụng<pubStatus qcode=“stat:usable” /> Publication status sẽ được sử dụngbởi hầu hết cáccơ quan báo chí,bởi vìkhả năngđể thông báomột cách rõ ràngtình trạng củatin tứclà điều cần thiết Trạng thái start có các giá trị khácđược phép

 Stat:canceled.Điều này có nghĩarằngcácnội dungcủanewsItemkhông được sử dụng,bao giờ hết

 Stat:withheld nội dungkhông được sử dụngcho đến khicó thông báo mới

e Thuộc tính tùy chọn

- Các thuộc tính tùy chọn thường được sử dụng bởi các nhà cung cấp G2 như:

 First Created: chỉ ra khi phiên bản đầu tiên của Item (không phải nội dung) lần đầu tiên được tạo ra

<firstCreated>2010-10-18T13:12:21-05:00</firstCreated>

 Embargoed: Các tổ chức tin tức thường xuyên sử dụng một lệnh cấm vận để phát hành thông tin trước, trên sự hiểu biết nghiêm ngặt rằng nó có thể không được phát hành vào phạm vi công cộng cho đến sau thời gian cấm vận

f Nội dung Metadata <contentMeta>:

- Các thuộc tính nội dung cần miêu tả:

 Timestamps: Mô tả thời gian của thông tin bắt đầu diễn ra, hoặc thời gian chỉnh sửa lại thông tin

Trang 21

 Located: Nơi xảy ra thông tin

 Creator:Tác giả, nhà văn, nhà nhiếp ảnh tạo ra thông tin

 Information Source: Nguồn thông tin

 Subject: chủ đề nội dung

 Headline: Tóm tắt, tiêu đề nội dung

2.3 NewsML-G2 văn bản

- Một trong những nhu cầu cơ bản nhất của một tổ chức tin tức là để xử lý văn bản Chương này bao gồm các vấn đề cơ bản của một NewsML-G2 News Item có chứa nội dung văn bản

- Cấu trúc NewsML-G2 của hãng AFP chúng ta có thể tham khảo:

Hình 2.3: Cấu trúc NewsML-G2 text của hãng AFP

- Ví dụ về thông tin văn bản của Acme tin và Truyền thông (ANM) có nội dung:

Categories economy, finance, business, central bank, monetary policy

Headline Fed to halt QE to avert “bubble”

Byline By Meredith Jameson

Location / Date Washington

Body Text Et, sent luptat luptat, commy nim zzriureet vendreetue modo

dolenis ex euisisnosto et lan ullandit lum doloreet vulla feugiam

Trang 22

coreet, cons eleniam il ute facinveril et aliquis ad minis et lor sum del iriure dit la feugiamcommy nostrud minullapat velislduisismodip ero dipit nit utpatum sandrer cipisim nit lortis augiat nulla faccum at am, quam velenis nulput la auguerostrud magna commolore eliquatie exerate facilis modiamconsed dion henisse quipit at Ut la feu facilla feu faccumsanecte modoloreet

ad ex el utat

Ví dụ trên chứagần như tất cảcácthông tincần thiếtđể tạo ramột tài G2 hợp lệ

liệuNewsML-2.3.1 Cấu trúc tài liệu

- Các khối xây dựng của các tài liệu văn bản trên bao gồm <newsItem> yếu tố gốc, với các yếu tố bổ sung cho gói siêu dữ liệu về News Item (itemMeta), siêu dữ liệu

về các nội dung (contentMeta) và các nội dung chính nó (contentSet)

a Yếu tố cấp cao nhất (root):

 Version Created: thời gian

 Ngoài ra còn có <pubStatus> trạng thái của tin có được công bố sử dụng hay không

Trang 23

d Nội dung Metadata <contentMeta>:

- Nội dung Metadata <contentMeta> bao gồm các thông tin:

 Thời gian tạo, chỉnh sửa văn bản là

 Địa điểm tạo ra nội dung, đây la nơi câu truyện được viết chứ không phải nơi

mà chủ đề câu truỵện được diễn ra:

 Các tác giả của bài viết được thể hiện bằng cách sử dụng <creator>:

 Nguồn thông tin cho tác giả được cung cấp bởi người hay bên cung cấp thông tin <infoSource>:

 Ngôn ngữ mặc định nội dung U.S English:

 Các thuộc tính Subject sử dụng QCodes trong từ vựng có kiểm soát chủ đề

2.3.2 Nội dung văn bản

- Nội dung của tài liệu NewsML-G2 được bao bọc bởi các <contentSet> được thể hiện một trong hai cách:

 Inline XML: IPTC sử dụng NITF (News Industry Text Format) để định dạng nội dung văn bản, là một chuẩn XML, nó được chứa trong một <inlineXML> phần tử con của <contentSet>, và sử dụng thuộc tính contenttype để biểu thị các tiêu chuẩn dựa trên XML, sử dụng kiểu IANA MIME

Trang 24

 Inline data: thể hiện nội dung văn bản

- Trong này phần này là mô tả đơn giản nhưng đầy đủ cho thấy làm thế nào để thực hiện trong NewsML-G2 nhu cầu sử dụng thường xuyên của một công việc hình ảnh chuyên nghiệp

2.4.1 Siêu dữ liệu nhúng

- Những năm 1990 Siêu dữ liệu nhúng trong JPEG và các định dạng tập tin khác đã được một tiêu chuẩn facto Standard Trong thực tế,lược đồ siêu dữ liệu được hãng Adobe Systems Inc thể hiện hộp thoại "File Info" trong Photoshop được dựa trên trao đổi thông tin mẫu IPTC (IIM) Các thuộc tính nhúng IIM hình ảnh được gọi là

"IPTC Fields" hoặc "IPTC Header"

Trang 25

Hình 2.4: IPTC Fields

- Vào khoảng năm 2001, nhằm khắc phục một số hạn chế về kỹ thuật Adobe đã giới thiệu Công nghệ (Extended Metadata Platform) XMP, cho bộ phần mềm của ứng dụng bao gồm Photoshop Adobe cũng đã làm việc với các IPTC để di chuyển các thuộc tính của "IPTC Header" vào XMP.Mặc dù được phát triển bởi Adobe, XMP là một công nghệ mở nó dựa trên IIM, và đã được được thông qua bởi các nhà cung cấp phần mềm khác và các nhà sản xuất

- Hầu hết các đặc tính siêu dữ liệu IIM dựa trên nguyên bản bây giờ được chứa trong Core Schema IPTC cho XMP NewsML-G2 có sẵn trong lược đồ IPTC Extension cho XMP

- IIM được tổ chức thành Records và DataSet The DataSet được nhúng trong tập tin hình ảnh.DataSet IIM đó được áp dụng IPTC Core (XMP) Ảnh Metadata.Mỗi DataSet được hiển thị với tên IIM của nó, tương đương Name IPTC XMP Core và tương ứng G2

- Bảng map các thông tin giữa IIM và NewsML-G2

Trang 26

2.4.2 Cấu trúc

- Các khối xây dựng của các tài liệu NewsML-G2 là <newsItem> yếu tố gốc, với các yếu tố bổ sung cho gói siêu dữ liệu về News Item (itemMeta), siêu dữ liệu về các nội dung (contentMeta) và các nội dung chính nó (contentSet)

Nút gốc <newsItem> có thuộc tính:

- Item Metadata <itemMeta>

- <ItemClass> sử dụng thuộc tính Qcode để biểu thị rằng Item truyền tải một hình ảnh

Trang 27

- Content Metadata <contentMeta>: dữ liệu nhúng được vào NewsML-G2 dựa trên giản đồ IPTC Core tương đương

- IPTC Core Schema: Date Created

<contentCreated> được sử dụng đểcung cấp cho cácngày tạocủa hình ảnh:

- Các <remoteContent> tham chiếu đối tượng tồn tại độc lập với hiện tại NewsML-G2 Item

Trang 28

Hình 2.5: NewsML-G2 Picture

- Một thư viện hình ảnh được cung cấp cho khách hàng trong ba kích cỡ:

 Một hình ảnh lớn dành cho độ phân giải cao

 Một hình ảnh vừa để sử dụng web

 Một hình ảnh nhỏ để sử dụng như một hình ảnh thu nhỏ hoặc biểu tượng

- Đây là ba hình ảnh thể thay thế của các hình ảnh tương tự và có thể được chứa trong một tài liệu NewsML-G2 đơn

- Các thuộc tính tài nguyên:

+ Hyperlink (@href): để nhận dạngvàxác định vị trícácnội dung

+ Content Type:dạng tài nguyên

+ Size: Cho biết kích thướccủa tài nguyêntheo byte

+ Picture Width và Picture Height: kích thước của ảnh, mặc định cho ảnh là pixels

+ Colour Depth: là số bitđược sử dụng đểxác địnhmàu sắc của mỗiđiểm ảnh trongmột hình ảnh

2.5 NewsML-G2 Video

- Khi công nghệ phát triển, mọi người giờ xem trực tiếp trên Web Các tổ chức

về "phương tiện truyền thông" cần phải có khả năng xử lý âm thanh và video NewsML-G2 cho phép tất cả các tổ chức truyền thong truy cập và trao đổi âm thanh và video trong một quy trình làm việc chuyên nghiệp, bằng cách cung cấp các tính năng

Trang 29

và các điểm mở rộng mà cho phép các định dạng độc quyền để được "ánh xạ" để Newsml-G2 để đạt được tự do trao đổi giữa một vòng tròn của các đối tác thông tin

- Các khối xây dựng của G2 Item là <newsItem> yếu tố gốc, với các yếu tố gói cho siêu dữ liệu về News Item (itemMeta), siêu dữ liệu về các nội dung (contentMeta)

và các nội dung chính nó (contentSet)

- Nút gốc <newsItem> thuộc tính là:

- Catalog tài liệu tham khảo, thông tin về bản quyền:

- Metadata <itemMeta>: sử dụng Qcode để xác định truyền tải, <provider> nhà cung cấp và "nprov" trạng thái tin có được sử dụng không:

- Nội dung Metadata <contentMeta>: Các <icon> lấy một hình ảnh để sử dụng như là một hình ảnh mang tính biểu tượng cho các nội dung video, ví dụ như một hình ảnh vẫn được chiết xuất video.Có 2<description> với 2 role: đầu tiên một bản tóm tắt nội dung video, thứ hai mô tả chi tiết chi tiết hơn:

Ngày đăng: 23/09/2020, 21:15

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm