5 Lời nói đầu TCVN xxx : 2015 được xây dựng trên cơ sở ISO/IEC 15445:2000 Information technology -- Document description and processing languages -- HyperText Markup Language HTML Mô tả
Trang 1TCVN xxx : 2015
1
T I Ê U C H U Ẩ N Q U Ố C G I A
TCVN xxx:2015 Xuất bản lần 1
CÔNG NGHỆ THÔNG TIN – TIÊU CHUẨN KỸ THUẬT VỀ ĐỊNH DẠNG DỮ LIỆU WEB, DỮ LIỆU ĐẶC TẢ, TRAO ĐỔI
DỮ LIỆU TRÊN WEB
Information Technology – HTML – Data format, Metadata, Data exchange protocol
HÀ NỘI – 2015 TCVN
Trang 33
Mục lục
Lời nói đầu 5
1 Phạm vi áp dụng 7
2 Tài liệu viện dẫn 7
3 Thuật ngữ và định nghĩa 7
4 Định dạng dữ liệu Error! Bookmark not defined 4.1 Thông tin trường Error! Bookmark not defined 4.2 SGML các dạng cơ bản Error! Bookmark not defined 4.3 Chuỗi văn bản Error! Bookmark not defined 4.4 URIs Error! Bookmark not defined 4.5 Màu Error! Bookmark not defined 4.6 Độ dài Error! Bookmark not defined 4.7 Dạng nội dung Error! Bookmark not defined 4.8 Ngôn ngữ Error! Bookmark not defined 4.9 Mã hóa ký tự Error! Bookmark not defined 4.10 Ký tự đơn lẻ Error! Bookmark not defined 4.11 Ngày tháng và thời gian Error! Bookmark not defined 4.12 Kiểu liên kết Error! Bookmark not defined 4.13 Mô tả đa phương tiện Error! Bookmark not defined 4.14 Dữ liệu kịch bản Error! Bookmark not defined 4.15 Định dạng cột dữ liệu Error! Bookmark not defined 4.16 Tên khung mục tiêu Error! Bookmark not defined 4.17 DTDs Error! Bookmark not defined.
5 Dữ liệu đặc tả Error! Bookmark not defined 5.1 Dữ liệu đặc tả đặc biệt: Error! Bookmark not defined 5.2 Thành phần của dữ liệu đặc tả Error! Bookmark not defined
Trang 45.3 Dữ liệu đặc tả và HTTP headers Error! Bookmark not defined 5.4 Dữ liệu đặc tả và Máy tìm kiếm Error! Bookmark not defined 5.5 Dữ liệu đặc tả và PICS Error! Bookmark not defined 5.6 Dữ liệu đặc tả và thông tin mặc định Error! Bookmark not defined 5.7 Hồ sơ dữ liệu đặc tả Error! Bookmark not defined
6 HTTP Error! Bookmark not defined 6.1 Tổng quan về HTTP Error! Bookmark not defined 6.2 Mô hình HTTP Error! Bookmark not defined 6.3 Ứng dụng Error! Bookmark not defined 6.4 Phương thức trong HTTP Error! Bookmark not defined Thư mục tài liệu tham khảo Error! Bookmark not defined
Trang 55
Lời nói đầu
TCVN xxx : 2015 được xây dựng trên cơ sở
ISO/IEC 15445:2000 Information technology Document description and processing
languages HyperText Markup Language (HTML) (Mô tả tài liệu và xử lý ngôn ngữ
Ngôn ngữ đánh dấu)
TCVN xxx : 2015 do Viện Công nghệ thông tin, Đại học Quốc gia Hà nội biên soạn, Bộ
Thông tin và Truyền thông đề nghị,Tổng cục Tiêu chuẩn Đo lường Chất lượng thẩm
định, Bộ Khoa học và Công nghệ công bố
Trang 77
Công nghệ thông tin – tiêu chuẩn kỹ thuật về định dạng dữ liệu Web, dữ liệu đặc tả, trao đổi dữ liệu trên Web
Information Technology – HTML – Data format, Storage, Data exchange protocol
Phạm vi của chuẩn này là phù hợp với tiêu chuẩn ISO 8879, SGML Tiêu chuẩn này mô tả ngôn ngữ đánh dấu HTML được chỉ định theo các điều khoản trong khuyến cáo của W3C cho HTML, định dạng
dữ liệu, dữ liệu đặc tả và các phương thức trao đổi dữ liệu trên web
Các tài liệu viện dẫn sau đây là cần thiết cho việc áp dụng tiêu chuẩn Đối với các tài liệu viện dẫn ghi năm công bố thì áp dụng bản được nêu Đối với các tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất, bao gồm cả các sửa đổi
ISO/IEC 15445:2000 Information technology Document description and processing languages HyperText Markup Language (HTML) và http://www.w3.org/TR/html/
Đối với mục đích của tiêu chuẩn này, các định nghĩa được đưa ra trong ISO 8879:1986 và các định nghĩa sau đây được áp dụng:
3.1 Trình duy ệt (Browser)
Một phần mềm phía người dùng có chức năng chính là trình bày các tài liệu cho người dùng
3.2 Ký t ự (Character)
(Source: RFC1866) Một phần tử của thông tin, ví dụ như một chữ hoặc một số Các phần tử đồ họa do các đường được gắn với nhau dùng để thể hiện một ngữ nghĩa nào đó
3.3 Sơ đồ mã hóa ký tự (Character encoding scheme)
(Source: RFC1866) là một quá trình ánh xạ giữa một tập các octet có thứ tự và một tập các ký
tự trong danh mục ký tự sao cho, từ một chuỗi các octet và 1 sơ đồ mã hóa ký tự ta xác định được một chuỗi các ký tự
Trang 83.4 Danh m ục ký tự (Character repertoire)
(Source: RFC1866) Một tập hữu hạn các ký tự; ví dụ như phạm vi một tập ký tự được mã hóa
3.5 V ị trí mã hóa (Code position)
(Source: RFC1866) Một số nguyên trong tên miền của một bộ ký tự được mã hóa Các ký tự được mã hóa bản đồ vị trí mã để một nhân vật
3.6 T ập ký tự mã hóa (Coded character set)
(Source: RFC1866) Một quá trình ánh xạ giữa một vùng là một tập con các số tự nhien và một vùng là một vị trí mã hóa; nghĩa là, một số tập hợp các số nguyên (thường ở dưới dạng {0, 1, 2 , N-1}), một tập ký tự đã mã hóa và một số nguyên để xác định một ký tự Ngược lại, một ký
tự và một tập ký tự đã mã hóa để xác định vị trí của ký tự mã hóa
3.7 D ấu xuống dòng (CRLF)
(Source: RFC1521) Gồm hai ký tự CR (13) và LF (10) đi liền nhau, theo tiêu chuẩn ISO / IEC 646: 1991, biểu thị sự ngắt dòng
3.8 T ập dữ liệu thiết lập (Form data set)
(Source: RFC1866) một chuỗi các cặp tên/giá trị; tên là của một tài liệu HTML và các giá trị được đưa ra bởi người dùng
3.9 Mã xác định đoạn (Fragment identifier)
(Source: RFC1866) Các phần của một giá trị thuộc tính HREF theo sau ký tự ‘#’
3.10 Trình duy ệt HTML (HTML browser)
Một phần mềm dùng để thể hiện các tài liệu HTML
3.11 Tài li ệu HTML (HTML document)
Một tài liệu được cấu trúc tuân theo tiêu chuẩn này
3.12 Siêu liên k ết (Hyperlink)
Một mối quan hệ giữa hai mỏ neo, được gọi là nguồn và đích Liên kết đi từ nguồn tới đích Nguồn còn được coi như cái đuôi, và đích được coi như điểm đầu hoặc điểm đích
3.13 Chu ỗi nhận dạng người dùng (User Agent (in the World Wide Web))
Một phần mềm hoặc thiết bị phần cứng mà cho phép người dùng nhập và trình bày nội dung này tới cho người dùng sử dụng www
3.14 Ngôn ngữ đánh dấu siêu văn bản (HTML)
Ngôn ngữ đánh dấu siêu văn bản
3.15 HTML 4.0
Trang 99
Một khuyến nghị cho HyperText Markup Language được phát triển bởi World Wide Web Consortium
3.16 Giao th ức truyền siêu văn bản (HTTP)
Giao thức truyền siêu văn bản được ứng dụng để truyền tải tài liệu và các tệp siêu văn bản giữa máy chủ Web (Web server) và máy khách Web (Web client) thông qua một trình duyệt Web
3.17 Tiêu chu ẩn tạo ngôn ngữ đánh dấu (SGML)
Tiêu chuẩn tạo ngôn ngữ đánh dấu Được cung cấp khi sử dụng ISO 8879
3.18 URI (Uniform Resource Identifier)
Là một chuỗi ký tự được sử dụng để xác định, nhận dạng một tên hoặc một tài nguyên Việc xác định như vậy cho phép tương tác với các thể hiện tài nguyên trên mạng (thường là World Wide Web) sử dụng các giao thức cụ thể Lược đồ chỉ định một cú pháp chuẩn và các giao thức liên quan để xác định mỗi URI
3.19 URL (Uniform Resource Locator)
Viết tắt từ Uniform Resource Locator được sử dụng để tham chiếu tới tài nguyên trên mạng Internet URL tạo nên khả năng siêu liên kết cho các website
3.20 WWW
World Wide Web
3.21 T ổ chức Web toàn cầu (W3C)
Tổ chức World Wide Web Consortium, được thành lập vào năm 1994 để phát triển các tiêu chuẩn chung cho sự phát triển World Wide Web Đây là một tổ chức công nghiệp, do Phòng thí nghiệm Công nghệ Khoa học máy tính (MIT/LCS) của Viện Massachusetts – Mỹ, Viện Quốc gia Nghiên cứu Khoa học và Kiểm soát máy tính (Inria) ở Châu Âu và Đại học Keio University Shonan Fujisawa Campus ở Châu Á thành lập
3.22 Định nghĩa kiểu tài liệu (DTD - Document Type Definition)
Trong XML được viết tắt là DTD Mục đich của DTD là để xác định cấu trúc và luật lệ của một
dữ liệu XML Trong hình thức tuần tự của các tài liệu, nó thể hiện như là một chuỗi ngắn ngôn ngữ đánh dấu phù hợp với một cú pháp đặc biệt
3.23 Ngôn ng ữ đánh dấu mở rộng (XML)
Là từ viết tắt của cụm từ Extensible Markup Language, với mục đích chung do W3C đề nghị, để tạo ra các ngôn ngữ đánh dấu khác Đây là một tập con đơn giản của SGML, có khả năng mô tả nhiều loại dữ liệu khác nhau Mục đích chính của XML là đơn giản hóa việc chia sẻ dữ liệu giữa các hệ thống khác nhau, đặc biệt là các hệ thống được kết nối với Internet