1. Trang chủ
  2. » Thể loại khác

CÔNG NGHỆ THÔNG TIN - MÃ HÓA ĐỐI TƯỢNG HÌNH ẢNH, ÂM THANH - PHẦN 17: TẠO DÒNG ĐỊNH DẠNG VĂN BẢN

17 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 17
Dung lượng 0,91 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Các dòng văn bản được định nghĩa là dòng byte có khả năng mang theo các khối truy cập văn bản của một định dạng cụ thể, tùy chọn xen kẽ với các dữ liệu cần thiết cho việc giải mã các dòn

Trang 1

TIÊU CHUẨN QUỐC GIA TCVN 11795-17:2017 ISO/IEC 14496-17:2006

CÔNG NGHỆ THÔNG TIN - MÃ HÓA ĐỐI TƯỢNG HÌNH ẢNH, ÂM THANH - PHẦN 17: TẠO DÒNG

ĐỊNH DẠNG VĂN BẢN

Information technology - Coding of audio-visual objects - Part 17: Streaming text format

Lời nói đầu

TCVN 11795-17:2017 hoàn toàn tương đương với ISO/IEC 14496-17:2006

TCVN 11795-17:2017 do Học viện Công nghệ Bưu chính Viễn thông, Bộ Thông tin và Truyền thông đề nghị, Tổng cục Tiêu chuẩn Đo lường Chất lượng thẩm định, Bộ Khoa học và Công nghệ công bố

CÔNG NGHỆ THÔNG TIN - MÃ HÓA ĐỐI TƯỢNG HÌNH ẢNH, ÂM THANH - PHẦN 17: TẠO DÒNG

ĐỊNH DẠNG VĂN BẢN

Information technology - Coding of audio-visual objects - Part 17: Streaming text format

1 Phạm vi áp dụng

Tiêu chuẩn này quy định việc trình bày dạng mã hóa các thông tin văn bản để hiển thị theo thời gian trên màn hình Các dữ liệu văn bản có thể được xem trực tiếp kết hợp với âm thanh và hình ảnh, đó

là trong trường hợp thông tin văn bản được hiển thị dạng phụ đề, ví dụ là bản dịch của âm thanh trong video dưới dạng một ngôn ngữ khác hoặc phụ đề trợ giúp trong trường hợp âm thanh khó nghe, một ví dụ khác là phụ đề nội dung bài hát trong một ứng dụng Karaoke Tuy nhiên, dữ liệu văn bản cũng có thể được xem trực tiếp như một ứng dụng độc lập mà không cần kết hợp bất kỳ âm thanh hay hình ảnh nào liên quan Tạo dòng định dạng văn bản được quy định theo cách thức không phụ thuộc lớp truyền tải, tức là cho phép truyền tải theo nhiều cách khác nhau, trong khi vẫn cung cấp một mức độ truy cập ngẫu nhiên hợp lý và sự kháng lỗi

Các dòng văn bản được định nghĩa là dòng byte có khả năng mang theo các khối truy cập văn bản của một định dạng cụ thể, tùy chọn xen kẽ với các dữ liệu cần thiết cho việc giải mã các dòng văn bản Định dạng của các dòng văn bản và các khối truy cập văn bản được quy định, cũng như tín hiệu

và giải mã các dòng văn bản

2 Tài liệu viện dẫn

Các tài liệu viện dẫn rất cần thiết cho việc áp dụng tiêu chuẩn Đối với các tài liệu ghi năm công bố thì

áp dụng bản được nêu Đối với các tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất, bao gồm cả các sửa đổi

ISO/IEC 14496-18:2004: Information technology - Coding of audio-visual objects - Part 18: Font

compression and streaming (Công nghệ thông tin - Mã hóa các đối tượng âm thanh-hình ảnh - Phần 18: Nén và sắp xếp font).

3GPP TS 26.245 - 2003, Timed text format, Release 6 (Định dạng văn bản định thời, phiên bản thứ 6) IETF RFC 3550, RTP, A Transport Protocol for Real Time Applications (Giao thức truyền tải cho các ứng dụng thời gian thực).

IETF RFC 3640, RTP payload for transport of generic MPEG-4 content (Tải tin RTP cho truyền tải nội dung MPEG-4).

3 Thuật ngữ và định nghĩa

3.1

Dòng văn bản (Text stream)

Dòng byte có khả năng mang các khối truy cập văn bản của một định dạng cụ thể, có thể xen kẽ với các dữ liệu cần thiết cho việc giải mã dòng văn bản đó

3.2

Khối truy cập văn bản (Text access unit)

Các phần truy cập riêng biệt của văn bản trong mỗi dòng văn bản

CHÚ THÍCH: Mỗi khối truy cập văn bản bao gồm cả hiển thị được mã hóa của dữ liệu văn bản Để hiển thị thì khối truy cập văn bản có thể kết hợp với một dấu thời gian riêng

3.3

Dòng văn bản 3GPP (3GPP text stream)

Trang 2

Dòng văn bản mang các khối truy cập văn bản 3GPP.

3.4

Khối truy cập văn bản 3GPP (3GPP text access unit)

Khối truy cập văn bản mang các dữ liệu từ các mẫu văn bản mà 3GPP quy định

3.5

Mẫu văn bản (Text sample)

Khi sử dụng một dòng văn bản 3GPP, theo quy định của 3GPP TS 26.245 một mẫu văn bản bao gồm một chuỗi văn bản, có thể có một hoặc nhiều chuỗi điều chỉnh

3.6

Chuỗi văn bản (Text string)

Khi sử dụng dòng văn bản 3GPP, dữ liệu chứa trong mẫu văn bản, là một chuỗi các ký tự được mã hóa ở định dạng UTF-8 hoặc UTF-16 như quy định trong 3GPP TS 26.245

3.7

Chuỗi điều chỉnh (text modifier)

Khi sử dụng dòng văn bản 3GPP, một hoặc nhiều chuỗi điều chỉnh được kèm theo đề xác định cách thức hiển thị chuỗi văn bản trong mẫu văn bản theo quy định trong 3GPP TS 26.245

3.8

Mô tả mẫu (sample description)

Khi sử dụng trong dòng văn bản 3GPP, các dữ liệu mô tả sẽ cung cấp các thông tin chung về một hay nhiều mẫu văn bản, ví dụ như các loại font được sử dụng hay định vị văn bản theo quy định của 3GPP TS 26.245

3.9

Khối văn bản định thời TTU (Timed Text Unit)

Cấu trúc cú pháp trong một dòng văn bản 3GPP mang các khối truy cập văn bản theo đó chỉ số j chỉ loại dữ liệu (như một phần, một khối truy cập văn bản hoàn chỉnh hay một mô tả văn bản) được mang

3.10

Tạo dòng định dạng văn bản (text stream format)

Dòng văn bản được xác định là luồng byte có khả năng chứa các khối truy cập văn bản của một định dạng cụ thể, tùy chọn xen kẽ với các dữ liệu cần thiết cho việc giải mã dòng văn bản Tạo dòng định dạng văn bản được định nghĩa một cách thuận tiện cho việc vận chuyển trong gói truyền tải và các tập tin Tuy nhiên, bản thân việc vận chuyển đó phụ thuộc vào định dạng cụ thể cho lưu trữ và truyền tải tập tin, điều đó nằm ngoài phạm vi của tiêu chuẩn này

3.11

Khung hiển thị văn bản (Text Track)

Là phần khung hình chữ nhật dưới cùng của màn hình để hiển thị văn bản trong các video, có độ rộng

và độ dài được xác định cụ thể

3.12

Hộp văn bản (Text Box)

Là phần khung hình chữ nhật được định vị trong phạm vi Text Track để hiển thị văn bản trong các video, có độ rộng và độ dài được xác định cụ thể

4 Ký hiệu

3GPP The 3rd Generation Partnership Project Dự án hợp tác thế hệ sau

HTD Hypothetical Text Decoder Bộ giải mã văn bản giả định

5 Khối truy cập văn bản

5.1 Định thời và giải mã khối truy cập văn bản

Mỗi khối truy cập văn bản có chứa dữ liệu văn bản ở một định dạng xác định, sử dụng nhãn thời gian Nhãn thời gian xác định thời gian khối truy cập văn bản được hiển thị trên màn hình Bộ thu cần các thông tin của cấu hình văn bản để giải mã một dòng văn bản Cấu hình văn bản có thể cung cấp

Trang 3

thông tin xác định định dạng dữ liệu văn bản.

5.2 Định dạng khối truy cập văn bản

5.3 Cấu hình văn bản

5.4 Ngữ nghĩa

“textFormat” - một byte báo hiệu định dạng dữ liệu văn bản Giá trị 0x01 báo hiệu rằng các dữ liệu văn

bản được định thời theo quy định của 3GPP TS 26.245 theo cách thức quy định ở điều 7

Bảng 1 - Định dạng dữ liệu văn bản trong textformat

0x01 Văn bản được xác định thời gian theo quy định của 3GPP TS 26.245

0x02- 0xEF Dự trữ

0xF0- 0xFE Định dạng riêng của người sử dụng

“textConfigLength”- số nguyên không dấu xác định số lượng byte trong “formatSpecificTextConfig ( )”

6 Cách sử dụng luồng văn bản trong ngữ cảnh hệ thống MPEG-4

6.1 Báo hiệu một dòng văn bản

Khi sử dụng hệ thống MPEG-4, một dòng văn bản phải được báo hiệu bởi một Giá trị định dạng dòng 0x0D và một Giá trị định danh loại đối tượng 0x08

6.2 Sử dụng trong việc mô tả cảnh

Khi được sử dụng trong một mô tả cảnh MPEG-4, đối tượng dòng văn bản được sử dụng như sau: Nếu đối tượng dòng văn bản được sử dụng bởi một nút “AnimationStream”, nó phải được hiển thị, bất

kể việc nút “AnimationStream” được kích hoạt hay không:

Nếu đối tượng dòng văn bản không được sử dụng bởi bất kỳ nút “AnimationStream” nào, nó sẽ không được hiển thị trong cảnh

Việc hiển thị văn bản theo không gian của dữ liệu văn bản được xác định bởi các định dạng văn bản

cơ bản Trong trường hợp mô tả ảnh có chỉ số kích thước màn hình, các kết quả sẽ không được xác định nếu việc định vị các dữ liệu văn bản ra ngoài màn hình

Tất cả các quy tắc chung liên quan đến việc điều khiển thời gian và phân đoạn dòng đều được áp dụng cho các đối tượng dòng văn bản

7 Định dạng dữ liệu văn bản cho các dòng văn bản 3GPP

7.1 Giới thiệu

Phần này xác định định dạng dữ liệu văn bản trong dòng văn bản 3GPP

7.2 Truyền tải mẫu văn bản và mô tả mẫu trong các khối truy cập văn bản 3GPP

Chuẩn 3GPP TS 26.245 định dạng dữ liệu văn bản theo thời gian bao gồm các mẫu văn bản và mô tả mẫu, mỗi mẫu văn bản bao gồm một chuỗi văn bản, được theo sau bởi một hoặc nhiều chuỗi điều chỉnh Mỗi chuỗi văn bản bao gồm các ký tự tạo thành các văn bản được hiển thị, trong khi các chuỗi điều chỉnh mang những thay đổi sẽ được áp dụng cho các chuỗi văn bản trong suốt thời gian mà văn bản đó được hiển thị trong hộp văn bản Ví dụ trong một ứng dụng Karaoke, các chuỗi điều chỉnh cho phép dòng văn bản được thay đổi màu sắc đồng bộ với bài hát

Một mô tả mẫu cung cấp thông tin tổng quát về một mẫu văn bản, ví dụ về phông chữ sẽ được sử dụng, về vị trí của văn bản khi hiển thị trong hộp văn bản, màu nền hiển thị v.v Có thể có nhiều mô

tả mẫu; một chỉ số được gán cho mỗi mô tả mẫu văn bản (SD) và mỗi mẫu văn bản được kết hợp với

Trang 4

các chỉ số của mô tả mẫu Một mô tả mẫu có thể sử dụng cho nhiều mẫu văn bản, trong khi một mẫu văn bản chỉ áp dụng duy nhất một mô tả mẫu

Mối quan hệ giữa các mô tả mẫu, các mẫu văn bản, chuỗi văn bản và các chuỗi điều chỉnh được mô

tả trong Hình 1

Hình 1- Mô tả mẫu, mẫu văn bản, chuỗi văn bản và chuỗi điều chỉnh trong các dòng văn bản

3GPP

Một khối truy cập văn bản 3GPP bao gồm các dữ liệu từ một mẫu văn bản Do đó, một khối truy cập văn bản 3GPP không cho phép bao gồm dữ liệu từ nhiều mẫu văn bản Mỗi khối truy cập văn bản 3GPP được hiển thị trong khoảng thời gian nhất định, xác định bởi các thông tin về thời gian Ngoài một mẫu văn bản, khối truy cập văn bản có thể chứa nhiều mô tả mẫu hoàn chỉnh Bằng việc cho phép xen kẽ các mẫu văn bản và các mô tả mẫu trong các khối truy cập văn bản 3GPP, các dòng văn bản 3GPP có khả năng chứa các mô tả mẫu trong băng

7.3 Truyền tải các khối truy cập văn bản 3GPP trong các TTU

Thông thường, một khối truy cập văn bản 3GPP có kích thước nhỏ, khoảng 100 - 200 byte, và thường nhỏ hơn nhiều so với kích thước của gói tin mang dữ liệu văn bản trên một mạng truyền tải Do đó hệ thống truyền tải sẽ tập hợp nhiều khối truy cập văn bản 3GPP vào một gói tin để truyền tải Tuy nhiên,

có thể đôi khi khối truy cập văn bản 3GPP có kích thước lớn, ví dụ như khi di chuyển văn bản theo hướng ngang ở phía dưới của màn hình, trong trường hợp đó cần phải phân mảnh khối truy cập văn bản 3GPP trước khi truyền tải Tóm lại, truyền tải khối truy cập văn bản 3GPP thường phải tập hợp các khối truy cập văn bản nhưng đôi khi cũng có yêu cầu phân đoạn Vì vậy, để thuận tiện cho việc tổng hợp và phân đoạn các khối truy cập văn bản theo một cách độc lập, tiêu chuẩn này quy định một cấu trúc khung linh hoạt bao gồm các khối văn bản định thời, còn được gọi là TTU

Có 5 loại TTU, một loại mang các khối truy cập văn bản 3GPP hoàn chỉnh, ba loại chứa các phân đoạn mẫu văn bản và một loại mang các mô tả mẫu hoàn chỉnh với ba loại được dự trữ để dùng trong tương lai Do các mô tả mẫu nhỏ nên không cần phương thức hỗ trợ truyền tải các phân đoạn mô tả mẫu

Cấu trúc khung linh hoạt mà TTU cung cấp cho phép tiếp cận với các lớp vận chuyển khác nhau một cách dễ dàng và thuận tiện khi thực hiện việc sắp xếp TTU cùng với các gói vận chuyển Mỗi lớp vận chuyển có thể chọn cấu trúc TTU phù hợp nhất Bằng việc sử dụng các TTU, các mẫu văn bản nhỏ có thể được tổng hợp vào một gói vận chuyển nhưng các TTU cũng có thể được sử dụng để phân đoạn các mẫu văn bản qua nhiều gói vận chuyển khi đưa ra mức độ kháng lỗi phù hợp trong trường hợp mất các gói vận chuyển hoặc các lỗi không thể phục hồi Để làm được điều đó, dữ liệu văn bản trong một khối truy cập văn bản có thể tái phân vùng thành các TTU để tiếp cận các hệ thống vận chuyển hiệu quả nhất Tiêu chuẩn này dừng lại ở mức xác định các TTU cho các dòng văn bản 3GPP

Trang 5

Hình 2- Mẫu văn bản và mô tả mẫu trong khối truy cập 3GPP và việc sử dụng các TTU để tạo

dòng văn bản 3GPP

Mỗi khối truy cập văn bản trong một dòng văn bản 3GPP được xác định bao gồm một hoặc nhiều TTU Mỗi loại TTU được xác định bởi chỉ số j của nó và được gọi là TTU[j] Có các loại TTU được xác định như sau:

TTU[0]: loại TTU được dự trữ sử dụng trong tương lai

TTU[1]: loại TTU này có khả năng mang các khối truy cập văn bản 3GPP hoàn chỉnh;

TTU[2]: loại TTU này có khả năng mang một đoạn của một chuỗi văn bản (text string) trong một mẫu văn bản;

TTU[3]: loại TTU này có khả năng mang phân đoạn đầu tiên của một chuỗi điều chỉnh từ một mẫu văn bản;

TTU[4]: loại TTU này có khả năng mang một phân đoạn của một chuỗi điều chỉnh trong một mẫu văn bản, trừ phân đoạn đầu tiên;

TTU[5]: loại TTU này có khả năng mang một mô tả mẫu hoàn chỉnh;

TTU[6] và TTU[7]: loại TTU này được dự trữ để sử dụng trong tương lai

Hình 3 mô tả các phương thức tạo ra các TTU từ các mẫu văn bản và các mô tả mẫu Một TTU[5] chứa một mô tả mẫu hoàn chỉnh Một TTU[1] chứa một mẫu văn bản không phân đoạn Khi một mẫu văn bản bị phân đoạn, các chuỗi văn bản sẽ được tách ra và được chứa trong các TTU Mỗi chuỗi văn bản được bao gồm trong một TTU[2], số lượng TTU[2] tương ứng với số phân đoạn của văn bản Tuy nhiên, đôi khi các chuỗi văn bản có thể không bị phân đoạn, trong trường hợp này chỉ có một TTU[2] chứa một chuỗi văn bản duy nhất Một TTU[3] chứa một chuỗi văn bản đầu tiên trong chuỗi điều chỉnh, vì thế TTU[3] chỉ sự bắt đầu của chuỗi điều chỉnh Mỗi một TTU[4] chứa một phân đoạn của chuỗi điều chỉnh (nếu có)

Trang 6

Hình 3- Mô tả mẫu và mẫu văn bản trong các TTU và cấu tạo các khối truy cập văn bản bằng

các TTU

Trong Hình 3 cũng mô tả các phương thức xây dựng các khối truy cập văn bản bằng các TTU Nếu một mẫu văn bản không bị phân đoạn, thì một khối truy cập văn bản bao gồm TTU[1] chứa toàn văn bản Nếu mẫu văn bản bị phân đoạn thì các khối truy cập văn bản chứa một hoặc nhiều TTU[2], tương ứng với số chuỗi văn bản Nếu mẫu văn bản chứa các chuỗi điều chỉnh thì các khối truy cập văn bản chứa một TTU[3] và phụ thuộc vào kích thước chuỗi điều chỉnh sẽ không có hoặc có nhiều TTU[4] Ngoài ra, mỗi khối truy cập văn bản chứa một hay nhiều TTU[5], mỗi TTU[5] chứa một mô tả mẫu cho một hoặc nhiều mẫu văn bản trong dòng văn bản

Một mẫu văn bản trống là một mẫu văn bản không có dữ liệu (do đó không có các chuỗi văn bản và các chuỗi điều chỉnh) có thể được sử dụng để xác định việc hiển thị một chuỗi văn bản trước khi bắt đầu hiển thị mẫu văn bản tiếp theo trong dòng văn bản Các mẫu văn bản trống này phải được chứa trong một TTU[1] như là một đơn vị truy cập riêng

Thứ tự của các TTU trong một khối truy cập văn bản là ngẫu nhiên với một số ràng buộc Khi các mẫu văn bản bị phân đoạn, nó cho phép lặp lại một phân đoạn được xem là quan trọng hơn những phân đoạn khác và ưu tiên các chuỗi điều chỉnh trước các chuỗi văn bản cho các chuỗi văn bản lớn TTU[5]

có thể xen kẽ ngẫu nhiên với các TTU khác Để sắp xếp các TTU trong một khối truy cập văn bản, chỉ

áp dụng các giới hạn sau:

Khi một mô tả mẫu được cung cấp trong băng thì một mô tả mẫu phải bao gồm trong một dòng văn bản trước bất kỳ mẫu văn bản nào sử dụng mô tả mẫu đó Điều này có nghĩa là một mô tả mẫu trong băng được chứa trong một TTU[5] phải đặt trước bất kỳ TTU[1], TTU[2], TTU[3] và TTU[4] nào liên quan đến mô tả mẫu đó Chú ý rằng các TTU[5] này có thể được chứa trong cùng một khối truy cập văn bản hoặc trong một hay nhiều khối truy cập văn bản trước đó

7.3.1 Những ràng buộc đối với việc phân đoạn

Một số ràng buộc phải được áp dụng khi phân đoạn các mẫu văn bản trong TTU[2], TTU[3] và TTU[4]

Áp dụng các hạn chế sau đây:

Mỗi chuỗi văn bản phải được phân đoạn trên giới hạn ký tự vì vậy mỗi đoạn chỉ chứa các mã ký tự hoàn chỉnh để đảm bảo rằng mỗi đoạn văn bản nhận được có thể được giải mã ngay cả trong trường hợp mất đoạn văn bản trước đó Do đó, việc phân đoạn chuỗi văn bản yêu cầu phải dựa trên định dạng UTF-8/-16 để xác định các ranh giới phân đoạn

Nếu không yêu cầu phân đoạn chuỗi điều chỉnh theo các giới hạn chuỗi điều chỉnh thì khi một phân đoạn chuỗi điều chỉnh bị mất, bộ thu sẽ không thể giải mã được các phân đoạn còn lại

7.3.2 Cấu trúc TTU

Mỗi TTU bắt đầu bằng một phần mào đầu 8 bit, phần mào đầu này chứa định dạng TTU và các ký hiệu cho biết các ký tự trong chuỗi văn bản của mẫu văn bản có được mã hóa với định dạng

UTF-8/-16 hay không đồng thời báo hiệu độ dài (kích thước) của các TTU, đơn vị tính là byte Các phần còn lại sau phần mào đầu của TTU là thông tin cụ thể về loại TTU được mô tả cụ thể trong các mục sau đây

Trang 7

7.3.2.1 Tín hiệu TTU[1]

Một TTU[1] chứa một mẫu văn bản hoàn chỉnh; phần mào đầu TTU và trường độ dài dữ liệu TTU được xác định theo các phần cung cấp các thông tin sau:

• Chỉ số mô tả mẫu;

• Độ dài của mẫu văn bản;

• Độ dài của chuỗi văn bản trong mẫu văn bản (tính theo byte) Độ dài của chuỗi văn bản không đưa

ra số đếm ký tự vì một ký tự có thể thay đổi độ dài từ 1 đến 6 byte

Không quy định chiều dài của chuỗi điều chỉnh, vì nó được giả định rằng thông tin này có nguồn gốc

từ tổng chiều dài mẫu văn bản cũng được cung cấp bởi các tiêu đề của TTU

Việc một TTU[1] chứa một mẫu văn bản trống được ký hiệu bằng sự xuất hiện của trường chiều dài

dữ liệu TTU được mã hóa với một giá trị cụ thể (xem phần 7.3.2)

CHÚ THÍCH 1: Khi chuỗi văn bản truyền tải được lưu ở file 3GP, điều đó đảm bảo rằng các giá trị của hai trường chuỗi văn bản trong một file 3GP, trường chiều dài chuỗi 16 bít và phần đánh dấu thứ tự byte được mã hóa chính xác trong các phần tương ứng của phần mào đầu TTU

CHÚ THÍCH 2: Nếu một dòng văn bản được định giờ được lưu trong một file 3GP, thì phần đánh dấu thứ tự byte và chiều dài của chuỗi văn bản cần được phục hồi từ các phần mào đầu TTU để lưu giữ dòng văn bản chính xác trong file 3GP

7.3.2.2 Báo hiệu TTU[2]

Một TTU[2] chứa một chuỗi văn bản từ một mẫu văn bản Phần mào đầu TTU và trường độ dài dữ liệu TTU xác định dựa trên:

• Tổng số phân đoạn mẫu văn bản; bao gồm phân đoạn chuỗi văn bản và một phân đoạn chuỗi điều chỉnh

• Số thứ tự của phân đoạn trong TTU[2] này; Số thứ tự của phân đoạn mẫu văn bản đầu tiên là 0 và với mỗi phân đoạn thì số thứ tự sẽ tăng lên 1 vì vậy trong trường hợp có N phân đoạn, số thứ tự của phân đoạn lớn nhất là N-1 Một mẫu văn bản có thể được phân đoạn thành nhiều nhất là 16 phân đoạn khác nhau;

• Độ dài của mẫu văn bản;

• Chỉ số của các mô tả mẫu;

• Tổng chiều dài mẫu văn bản gốc không phân đoạn; thông tin này cho phép bộ thu phân bổ không gian cho việc giải mã mẫu văn bản; Thông tin này được cung cấp cho mỗi phân đoạn của chuỗi văn bản cũng để cho phép việc phân bổ không gian bộ đệm sau khi mất một hay nhiều phân đoạn chuỗi văn bản

7.3.2.3 Báo hiệu TTU[3] và TTU[4]

Trong một TTU[3] và TTU[4] chứa tương ứng phân đoạn đầu tiên và các phân đoạn còn lại của chuỗi điều chỉnh; phần đầu TTU và độ dài dữ liệu tuân theo các yếu tố:

• Tổng số phân đoạn của mẫu văn bản;

• Số thứ tự của phân đoạn trong TTU[2];

• Độ dài của mẫu văn bản

CHÚ THÍCH: Các chỉ số của mô tả mẫu, khoảng thời gian mẫu văn bản và tổng chiều dài của các mẫu văn bản được phân đoạn không được ký hiệu nếu đã có các thông tin về các phân đoạn chuỗi điều chỉnh áp dụng cho các chuỗi văn bản

7.3.2.4 Ký hiệu TTU[5]

Một TTU[5] chứa một mô tả mẫu Trong TTU[5], phần mào đầu TTU và trường độ dài dữ liệu TTU xác định theo:

• Chỉ số của mô tả mẫu

7.3.3 Hạn chế đối với việc sử dụng các mô tả mẫu

Có 256 giá trị chỉ số có sẵn để xác định một mô tả mẫu Giá trị 255 được dự trữ Các mô tả mẫu có thể được cung cấp trong băng hoặc ngoài băng Các giá trị chỉ số trong phạm từ 0 và 127 có sẵn để

sử dụng trong băng, giá trị chỉ số từ 128 đến 254 có thể được sử dụng để cung cấp cho các mô tả mẫu ngoài băng Xem Bảng 2

Bảng 2- Giá trị chỉ số cho các mô tả mẫu

Trang 8

128 - 254 Sẵn có để sử dụng ngoài băng

Khi các mô tả mẫu được cung cấp trong băng, có thể cần thường xuyên cập nhật các mô tả mẫu Với mục đích này, một cơ chế đóng gói được xác định cho các mô tả mẫu trong băng, cho phép liên tục cập nhật các mô tả mẫu đó trong phạm vi 64 giá trị chỉ số Do đó, tại bất kỳ điểm nào, tối đa 64 mô tả mẫu trong băng có thể được sử dụng cùng một lúc Mỗi mô tả mẫu với giá trị chỉ số không trong phạm

vi hợp lệ sẽ không được sử dụng nữa Các mô tả mẫu hợp lệ có thể được truyền trong băng thường xuyên để truy cập ngẫu nhiên, mà không có bất kỳ tác động nào trên phạm vi giá trị số không hợp lệ Tuy nhiên, khi đang nhận được một mô tả mẫu với một giá trị chỉ số thuộc phạm vi không hợp lệ, khi

đó phạm vi hợp lệ được thay đổi và mô tả mẫu nhận được sẽ trở thành có hiệu lực Khi mô tả mẫu nhận được giá trị chỉ số i không thuộc phạm vi hợp lệ, thì bộ thu phải loại bỏ từng mô tả mẫu với một giá trị chỉ số trong khoảng giữa (i + 1) mod 128 và (i + 64) mod128 Ví dụ, giả định rằng phạm vi hợp

lệ là giữa 41 và 104, và do đó, các giá trị 105 -127 và 1-40 là các giá trị không hợp lệ Thời điểm đó

bộ thu nhận được mô tả mẫu với giá trị chỉ số 114, bộ thu phải làm vô hiệu giá trị chỉ số 115-127 và từ

0 đến 50, để thay đổi phạm vi hợp lệ cho các giá trị giữa 51 và 114

7.4 Cú pháp và ngữ nghĩa của các TTU

7.4.1 TextData ()

TextData () bao gồm một chuỗi các TTU mang dữ liệu từ các khối truy cập văn bản Các TTU sẽ mang các khối truy cập văn bản trong thứ tự hiển thị Các TTU cùng với dữ liệu thuộc về một khối truy cập văn bản phải không được xen kẽ với các TTU có dữ liệu của một khối truy cập văn bản khác

7.4.2 TTU [J]( )

UTF_16_flag - 1 bit xác định định dạng mã hóa các ký tự chuỗi văn bản trong TTU [1] và TTU [2], khi thiết lập về 1, thì áp dụng UTF-16 còn khi thiết lập về 0, thì áp dụng UTF-8 Đối với TTU [3], TTU[4] và TTU [5] bit này không có ý nghĩa và sẽ được bỏ qua Chuỗi văn bản được mã hóa UTF-16 sẽ được sắp xếp theo thứ tự lớn dần, còn được gọi là thứ tự byte mạng Bộ thu dòng văn bản 3GPP có thể giải mã chuỗi văn bản được mã hóa UTF-8 cũng như chuỗi văn bản được mã hóa UTF-16 theo thứ tự lớn dần Hỗ trợ nhỏ dần trong bộ thu là tùy chọn

CHÚ THÍCH: 3GPP TS 26.245 yêu cầu có một byte đánh dấu thứ tự - Byte Order Mark (BOM) ở đầu mỗi chuỗi văn bản mã hóa UTF-16 trong một mẫu văn bản Đối với bộ thu, 3GPP 26.245 có nhiệm vụ

hỗ trợ thứ tự lớn dần, trong khi UTF-16 thứ tự nhỏ dần là tùy chọn

TTU_type - 3 bit quy định loại của TTU; Loại TTU được mã hóa với một giá trị bằng với chỉ số j trong TTU[j] theo bảng sau đây:

Bảng 3- Loại TTU

1 TTU[1] Chứa khối truy cập văn bản 3GPP hoàn chỉnh

2 TTU[2] Chứa một phân đoạn văn bản trong chuỗi văn bản

3 TTU[3] Chứa phân đoạn đầu tiên trong chuỗi điều chỉnh

4 TTU[4] Chứa phân đoạn không phải đoạn đầu tiên của chuỗi điều chỉnh

Trang 9

7 TTU[7] Dự trữ

TTU_data_length - 16 bít quy định tổng số byte của phần TTU_data_length và TTU_data[j] Trong một TTU[1], việc chứa một mẫu văn bản trống được đánh dấu bởi giá trị của độ dài dữ liệu TTU là 8

7.4.3 TTU_data[0]( )

7.4.4 TTU_data [1] ( )

Sample_index - số nguyên không dấu 8 bit xác định các chỉ số của mô tả mẫu được áp dụng cho các mẫu văn bản có trong TTU này Giá trị sample_index sẽ chỉ đến một mô tả mẫu cụ thể có trong dòng văn bản trước khi sử dụng nó Các sample_index có giá trị 0 và 255 được dự trữ

Sample_duration - số nguyên không dấu 24 bit xác định khoảng thời gian hiển thị dự kiến của các mẫu văn bản trong TTU này theo đơn vị thời gian được quy định tại cấu hình văn bản; xem Mục 7.6 Sample_duration luôn xác định một giá trị thời gian Một mẫu văn bản với một sample_duration có giá trị 0 sẽ được hiển thị cho đến khi mẫu văn bản tiếp theo được hiển thị Một mẫu văn bản với

sample_duration có giá trị 0 không được là mẫu văn bản cuối cùng của một dòng văn bản 3GPP Một mẫu văn bản với một sample_duration có giá trị 0 có thể được theo sau bởi một mẫu văn bản trống; CHÚ THÍCH: nếu một dòng văn bản 3GPP được lưu trữ trong một tập tin 3GP thì đối với mỗi mẫu văn bản có sample_duration bằng 0, khoảng thời gian này phải được thay đổi bằng khoảng thời hạn hiệu lực của mẫu văn bản, giống như định dạng tập tin ISO cấm một khoảng thời gian mẫu bằng không Thời hạn hiệu lực là sự khác biệt về thời gian không xác định giữa các mẫu hiện tại với và các mẫu văn bản tiếp theo trong dòng văn bản

Text_string_length - số nguyên không dấu 16 bit quy định số byte của chuỗi văn bản trong TTU Whole_text_sample ( ) - Mẫu văn bản được xác định bởi 3GPP trong 3GPP TS 26.245 hoặc một phần

mở rộng được quy định trong cấu hình văn bản (xem mục 5.4 và 7.6)

7.4.5 TTU_data[2]()

Total_number_of_sample_fragements - một số nguyên 4 bit xác định tổng số phân đoạn của mẫu văn bản mà TTU này có chứa một phân đoạn của mẫu đó

Number_of_this_sample_fragment - một số nguyên không dấu 4 bit xác định thứ tự của các phân đoạn mẫu văn bản chứa trong TTU này Khi một mẫu văn bản được chia ra thành N phân đoạn thì số thứ tự phản ánh số thứ tự theo logic của các phân đoạn, với phân đoạn thứ nhất có số thứ tự là 0 và phân đoạn cuối có số thứ tự là N-1 trong đó mỗi phân đoạn thì số thứ tự sẽ tăng lên 1

Sample_duration - xem phần ý nghĩa của sample_duration ở mục 7.4.4

Sample_index - xem phần sample_index ở mục 7.4.4

Sample_length - một số nguyên không dấu 16 bit xác định tổng số byte trong mẫu văn bản mà TTU này có chứa một phân đoạn của mẫu văn bản đó

Trang 10

Text_string_fragment () - một phân đoạn của chuỗi văn bản từ mẫu văn bản theo quy định của 3GPP trong 3GPP TS 26.245 hoặc phần mở rộng của nó quy định trong cấu hình văn bản (xem mục 5.4 và 7.6)

7.4.6 TTU_data[3]( )

Total_number_of_sample_fragements- xem phần Total_number_of_sample_fragements ở mục 7.4.5 Number_of_this_sample_fragment-Xem phần Number_of_this_sample_fragment-ở mục 7.4.5

Sample_duration- Xem phần ý nghĩa của Sample_duration ở mục 7.4.4

First_modifier_box_fragment () - là phân đoạn chuỗi điều chỉnh đầu tiên trong mẫu văn bản được định nghĩa theo 3GPP trong 3GPP TS 26.245 hoặc phần mở rộng của nó được quy định trong cấu hình văn bản (xem mục 5.4 và 7.6)

7.4.7 TTU_data[4]()

total_number_of_sample_fragments - xem phần total_number_of_sample_fragments ở mục 7.4.5 Number_of_this_sample_fragment - Xem phần Number_of_this_sample_fragment - ở mục 7.4.5 Sample_duration- Xem phần ý nghĩa của Sample_duration ở mục 7.4.4

non_first_modifier_box_fragment - một phân đoạn (không phải là phân đoạn đầu tiên) của chuỗi văn bản bổ sung trong mẫu văn bản, theo quy định của 3GPP TS 26.245 hoặc phần mở rộng của nó được quy định trong cấu hình văn bản (xem tại mục 5.4 và 7.6)

7.4.8 TTU_data[5]( )

Sample_index - chỉ số của mô tả mẫu văn bản chứa trong TTU, Giá trị sample_index phải chỉ một mô

tả mẫu cụ thể sẽ được hiển thị trong dòng văn bản trước khi sử dụng Giá trị sample_index 0 và 255 được dự trữ Giá trị sample_index từ 128 và 254 được sắp xếp cho các mô tả mẫu ngoài băng và sẽ không được sử dụng cho các mô tả mẫu trong băng Tương tự các giá trị sample_index từ 1 đến 127 được sử dụng cho các mô tả mẫu trong băng và không được sử dụng cho các mô tả mẫu ngoài băng Thông tin sau đây sẽ được áp dụng cho các mô tả mẫu trong băng Trong những khoảng thời gian xác định, nhiều nhất 64 giá trị sample_index được sử dụng cho các mô tả mẫu trong băng tần được xác định bởi phạm vi giá trị sample_index hợp lệ Khi bộ thu bắt đầu giải mã một dòng văn bản, bộ thu không biết về phạm vi hợp lệ nhưng sau khi nhận mô tả mẫu đầu tiên, bộ thu sẽ xác định phạm vi giá

trị sample_index hợp lệ Nếu mẫu đầu tiên nhận được có Giá trị sample_index j, thì bộ thu sẽ xác định

Giá trị sample_index trong phạm vi giữa (j+1) mod128 và (j+64) mod128 là không hợp lệ và xem tất

cả các giá trị sample_index còn lại trong khoảng 1 đến 127 là hợp lệ Khi mô tả mẫu được nhận cùng với giá trị sample_index hợp lệ thì giá trị hợp lệ sẽ không bị thay đổi Tuy nhiên, khi nhận được một

mô tả mẫu có giá trị chỉ số i không hợp lệ thì bộ thu sẽ thay đổi hiệu lực giá trị sample_index trong phạm vi giữa (i+1)mod128 và (i+64)mod128 Mỗi mô tả mẫu có giá trị sample_index không hợp lệ sẽ

bị loại bỏ Xem bảng 4 Các mẫu văn bản trong dòng văn bản sẽ không liên quan đến các mô tả mẫu không hợp lệ Một mô tả mẫu sẽ hợp lệ cho các mẫu văn bản thuộc trong dòng văn bản cho đến khi bị thay đổi hiệu lực hợp lệ bởi một mô tả mẫu khác

Bảng 4 - Các mô tả mẫu không hợp lệ theo Mô tả mẫu với chỉ số giá trị i

Ngày đăng: 28/02/2022, 21:37

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w