7 Tiêu chuẩn kỹ thuật tạo lập chỉ mục dùng cho metadata và tài liệu toàn văn Technical standard for indexing for metadata and full text document 1 Phạm vi áp dụng Tiêu chuẩn này cu
Trang 1TCVN II.1.12-13:2015
Xuất bản lần 1
TIÊU CHUẨN KỸ THUẬT TẠO LẬP CHỈ MỤC (DÙNG CHO METADATA VÀ TÀI LIỆU TOÀN VĂN)
Technical standard for indexing (for metadata and full text document)
HÀ NỘI - 2015
TCVN
Trang 33
Lời nói đầu 5
1 Phạm vi áp dụng 7
2 Tài liệu viện dẫn 7
3 Thuật ngữ và định nghĩa 7
4 Chức năng của chỉ mục Error! Bookmark not defined
5 Phân loại chỉ mục Error! Bookmark not defined
5.1 Chỉ mục theo chủ đề Error! Bookmark not defined 5.2 Chỉ mục theo tác giả Error! Bookmark not defined 5.3 Chỉ mục theo tên Error! Bookmark not defined 5.4 Chỉ mục địa lý Error! Bookmark not defined 5.5 Chỉ mục theo nhan đề Error! Bookmark not defined 5.6 Chỉ mục theo số hiệu và mã hiệu Error! Bookmark not defined
6 Kiểm soát chất lượng Error! Bookmark not defined
6.1 Chất lượng của chỉ mục Error! Bookmark not defined 6.2 Độ dài và chi tiết của chỉ mục Error! Bookmark not defined 6.3 Tính nhất quán trong lập chỉ mục Error! Bookmark not defined
7 Nội dung và tổ chức chỉ mục Error! Bookmark not defined
7.1 Cấu trúc và nội dung tổng quát Error! Bookmark not defined 7.2 Lựa chọn các tiêu đề Error! Bookmark not defined 7.3 Tên riêng Error! Bookmark not defined 7.4 Dấu định vị Error! Bookmark not defined 7.5 Tham chiếu chéo Error! Bookmark not defined
8 Cách sắp xếp các mục từ trong chỉ mục Error! Bookmark not defined
8.1 Trật tự cơ bản của việc sắp xếp các ký tự Error! Bookmark not defined 8.2 Sắp xếp theo trật tự chữ cái theo từng từ so với từng ký tự Error! Bookmark not defined
8.3 Sắp xếp chữ và số Error! Bookmark not defined 8.4 Sắp xếp các tiêu đề chỉ mục Error! Bookmark not defined 8.5 Tiêu đề chỉ mục bắt đầu bằng cùng một thuật ngữ Error! Bookmark not defined
8.6 Sắp xếp các phụ đề Error! Bookmark not defined
8.7 Sắp xếp các mục từ chứa tham chiếu chéo Error! Bookmark not defined
9 Trình bày chỉ mục dữ liệu đặc tả Error! Bookmark not defined
9.1 Trình bày chỉ mục trình duyệt Error! Bookmark not defined
9.2 Trình bày hồ sơ tìm kiếm Error! Bookmark not defined
9.3 Từ điển dữ liệu đặc tả Error! Bookmark not defined
10 Trình bày chỉ mục tài liệu toàn văn Error! Bookmark not defined
10.1 Trình bày bản chỉ mục để xử lý cuối cùng Error! Bookmark not defined
Trang 410.2 Ghi chú dẫn nhập Error! Bookmark not defined 10.3 Trình bày chỉ mục Error! Bookmark not defined 10.4 Hỗ trợ tìm kiếm Error! Bookmark not defined Tài liệu tham khảo 30
Trang 55
Lời nói đầu
TCVN II.1.13:2015 được xây dựng trên cơ sở tham khảo các tài liệu:
TCVN 10669:2014 (ISO/IEC 5963:1985) và TCVN 10846:2015 (ISO
999:1996)
TCVN II.1.13:2015 do Viện Công nghệ thông tin Đại học Quốc gia Hà Nội
biên soạn, Bộ Thông tin và Truyền thông đề nghị, Tổng cục Tiêu chuẩn
Đo lường Chất lượng thẩm định, Bộ Khoa học và Công nghệ ban hành
Trang 77
Tiêu chuẩn kỹ thuật tạo lập chỉ mục (dùng cho metadata và tài
liệu toàn văn)
Technical standard for indexing (for metadata and full text document)
1 Phạm vi áp dụng
Tiêu chuẩn này cung cấp hướng dẫn về nội dung, tổ chức và trình bày chỉ mục sử dụng cho việc tìm kiếm tài liệu và các phần của tài liệu Nó bao gồm các định nghĩa về chỉ mục và các thành phần, thuộc tính và các khía cạnh; từ vựng thống nhất; mô tả bản chất và sự đa dạng của các chỉ mục; các khuyến nghị liên quan đến việc thiết kế, tổ chức và trình bày các chỉ mục
Tiêu chuẩn này liên quan đến việc chuẩn bị tất cả các loại chỉ mục cho tìm kiếm thông tin, bất kể chúng được tạo lập trên cơ sở phân tích bằng trí tuệ, bằng các phương pháp tự động hoặc được máy tính hỗ trợ, cho dù chúng được tìm kiếm bằng mắt thường hoặc bằng thuật toán điện tử và được biên soạn bởi một người lập chỉ mục hoặc một nhóm người lập chỉ mục
Việc lập chỉ mục cho dữ liệu đặc tả (metadata) dựa trên các thông tin tóm tắt trong các phần tử dữ liệu đặc tả như nhan đề, chủ đề, tác giả, định danh, mô tả… Tiêu chuẩn dữ liệu đặc tả theo TCVN 7980:2008 (ISO 15836:2003) và hướng dẫn tại thông tư số 24/2011/TT-BTTTT ngày 20/9/2011 của Bộ Thông tin và Truyền thông
2 Tài liệu viện dẫn
TCVN 10669:2014 (ISO 5963:1985) Thông tin và tư liệu – Phương pháp phân tích tài liệu, xác định chủ
đề và lựa chọn các thuật ngữ định chỉ mục
TCVN 10846:2015 (ISO 999:1996) Thông tin và tư liệu – Hướng dẫn về nội dung, tổ chức và trình bày các bảng chỉ mục
NISO/TR 02:1997, Guidelines for Indexes and Related Information Retrieval Devices (Hướng dẫn cho chỉ mục và các thiết bị nhận thông tin liên quan)
TCVN 7980:2008 (ISO 15836:2003) Thông tin và tài liệu – Bộ phần tử siêu dữ liệu Dublin Core
3 Thuật ngữ và định nghĩa
3.1 Chỉ mục (Index)
Một danh sách các chủ đề xếp theo thứ tự chữ cái hoặc theo một hệ thống chỉ dẫn tới vị trí của mỗi chủ đề trong một hay một tập hợp tài liệu
Xuất bản lần 1
Trang 83.2 Lập chỉ mục (indexing)
Hành động mô tả hoặc nhận dạng một tài liệu bằng các thuật ngữ về nội dung chủ đề của nó [TCVN 5453: 2009, định nghĩa 4.2.2.7.01]
3.4 Mục từ chỉ mục (entry)
Đại diện của một đơn vị tài liệu trong một chỉ mục Nó bao gồm ít nhất một tiêu đề và một dấu định vị
Có nhiều hơn một dấu định vị cho một tiêu đề trong một bảng mục từ chỉ mục, nhưng mỗi dấu định vị kết hợp với một tiêu đề đại diện cho một mục từ duy nhất
3.5 Tiêu đề chỉ mục (heading)
Điểm truy cập đầu tiên tới một mô tả trong hệ thông tìm thông tin [TCVN 5453: 2009, định nghĩa 4.2.1.3.01]
3.7 Dấu định vị (locator)
Thành phần của mục từ trong chỉ mục cho biết vị trí của đơn vị tài liệu mà mục từ đề cập Dấu định vị gồm các ghi chú ngắn gọn như số trang hoặc trích dẫn thư mục, định danh tài liệu
3.8 Thuật ngữ lập chỉ mục (term)
Từ hoặc cụm từ trong chỉ mục [TCVN 5453: 2009, định nghĩa 4.2.2.1.06]
3.9 Dữ liệu đặc tả (metadata)
Dữ liệu mô tả văn cảnh, nội dung và cấu trúc của hồ sơ và quản lý hồ sơ theo thời gian [Điều 3.1.12, TCVN 7420-1:2004]
CHÚ THÍCH Dữ liệu đặc tả là những thông tin mô tả các đặc tính của dữ liệu như nội dung, định dạng, chất lượng, điều kiện và các đặc tính khác nhằm tạo thuận lợi cho quá trình tìm kiếm, truy cập, quản lý và lưu trữ dữ liệu (Thông tư Số 24/2011/TT-BTTTT ngày 20/9/2011 của Bộ Thông tin và Truyền thông)
3.10 Dữ liệu toàn văn (full text data)
Dữ liệu nguồn bao gồm các các tài liệu hoàn chỉnh hoặc các phần cơ bản của tài liệu [TCVN 5453:
2009, định nghĩa 1.1.4.12]
3.11 Từ điển từ chuẩn (thesaurus)
Bộ từ vựng có kiểm soát chứa các thuật ngữ tương đương, mối quan hệ liên đới và các quy tắc áp dụng [TCVN 5453: 2009, định nghĩa 4.2.2.6.01]
Trang 99
3.12 Tệp chuẩn (authority file):
Danh sách hoặc tập các tiêu đề được sử dụng trong một chỉ mục, ví dụ: hình thức của tên riêng, Tiêu
đề chủ đề
3.13 Tham chiếu chéo (cross-reference)
Liên kết giữa hai hoặc nhiều hơn hai từ hoặc tiêu đề trong một chỉ mục Có ba kiểu quan hệ giữa các
từ yêu cầu tham chiếu chéo:
- Quan hệ tương đương giữa các từ hoặc tiêu đề đồng nghĩa;
- Quan hệ liên kết, cho thấy một mối quan hệ không xác định giữa các từ hoặc tiêu đề (gọi là từ hoặc tiêu đề có liên quan);
Quan hệ thứ bậc, chỉ một mối quan hệ rộng hơn/hẹp hơn giữa các từ hoặc tiêu đề
3.14 Từ điển từ chuẩn (thesaurus)
Bộ từ vựng có kiểm soát chứa các thuật ngữ tương đương, mối quan hệ liên đới và các quy tắc áp dụng [TCVN 5453: 2009, định nghĩa 4.2.2.6.01]
3.15 Tệp chuẩn (authority file):
Danh sách hoặc tập các tiêu đề được sử dụng trong một chỉ mục, ví dụ: hình thức của tên riêng, Tiêu
đề chủ đề