Khảo sát âm lượng (loudness) các kênh truyền hình tại Việt Nam - Trường Đại Học Quốc Tế Hồng Bàng

Để đo loudness và chuẩn hóa loudness, chúng tôi xây dựng một công cụ trong Matlab. Thuật toán có thể đo và xử lý file audio stereo 2.0, đo loudness, LRA, true-peak và chuẩn hóa các thông[r]

Trang 1

Khảo sát âm lượng (loudness) các kênh truyền

hình tại Việt Nam

Nguyễn Hữu Phong∗, Nguyễn Đức Hoàng∗, Đỗ Thế Thiện∗, Võ Nguyễn Quốc Bảo†, và Huỳnh Hữu Tuệ‡

∗ Trung tâm Nghiên cứu Ứng dụng Khoa học Kỹ thuật Truyền hình

Email: {phongnguyen; hoangnd; dothethien}@vtv.gov.vn

†Phòng Thí Nghiệm Thông Tin Vô Tuyến

Học Viện Công Nghệ Bưu Chính Viễn Thông Cơ Sở TP Hồ Chí Minh

Email: baovnq@ptithcm.edu.vn

‡ Khoa Điện Tử - Viễn Thông, Đại Học Quốc Tế, Đại Học Quốc Gia TP.HCM

Email: hhtue@hcmiu.edu.vn

Tóm tắt nội dung—Âm lượng (loudness) của các kênh

truyền hình có thể thay đổi đột ngột giữa các thể loại

chương trình khác nhau trong cùng một kênh, hoặc khi

chuyển giữa các kênh với nhau Bài báo này nhằm khảo sát

sự thay đổi mức loudness của một số kênh chương trình

được lấy mẫu từ các phương thức phân phối quảng bá khác

nhau: mặt đất, vệ tinh và cáp tại Việt Nam Mức loudness

của cả chương trình truyền hình số và analog được lấy

mẫu và đo đạc Một công cụ đo loudness được phát triển

trong Matlab dựa trên khuyến nghị ITU-R BS.1770-2 và

khuyến nghị EBU R128 dùng để đo loudness các file audio

2 kênh Dữ liệu thu thập được sẽ tiến hành đo và phân

tích mức loudness Cuối cùng giải pháp chuẩn hóa loudness

theo EBU R128 nhằm đạt mức cân bằng loudness cho các

chương trình truyền hình tại Việt Nam được đề xuất.

Index Terms—Loudness, ITU-R BS.1770-2, EBU R128,

TV, Volume control.

I GIỚI THIỆU

Âm thanh đóng vai trò cực kỳ quan trọng trong truyền

hình Trước đây, khi truyền hình còn phát đen trắng, sóng

yếu, ở những khu vực xa khi xem tín hiệu lúc được lúc

mất, âm thanh bịnhiễu nhiều khi át cả âm thanh chính

Cùng với sự phát triển của công nghệ, ngành truyền hình

tại Việt Nam cũng đã phát triển nhanh chóng và ngày

càng mang đến cho người xem nhiều chương trình chất

lượng về nội dung bao gồm cả chất lượng hình ảnh và

âm thanh Dù đã được nâng cao về chất lượng âm thanh

thì cho đến gần đây, người xem vẫn còn nhiều điều chưa

hài lòng khi mà âm thanh quảng cáo thường đột nhiên

to hơn nhiều so với âm thanh chương trình đang xem,

hoặc khi chuyển kênh truyền hình thì phải điều chỉnh

lại âm lượng giữa các kênh Nghĩa là không có cách nào

để đo được âm lượng của âm thanh từ phía nhà cung

cấp cho tới phía người xem Việc chuẩn hóa âm thanh

theo mức đỉnh (peak normalisation) không phải là cách thức để xác định âm lượng/độ ồn (loundness) của tín hiệu âm thanh

Loudness (âm lượng) có thể hiểu đơn giản là cách

mà người nghe cảm nhận được biên độ âm thanh hay

là thuộc tính về độ nhạy cảm của tai người nghe khi chuyển từ mức im lặng đến mức ồn của âm thanh [1] Loudness đo cảm nhận của tai người nghe về âm thanh, khác với mức áp lực âm thanh (sound pressure level - SPL) chỉ mô tả cường độ âm thanh theo thang

dB Loudness chịu ảnh hưởng bởi nhiều thông số hơn so với SPL, bao gồm tần số, băng thông và độ lâu của âm thanh [2] Trong suốt quá trình xem TV (Television),

sự thay đổi loudness có thể gây khó chịu cho người xem khi họ phải thường xuyên dùng Volume control (điều khiển từ xa) để điều chỉnh lại mức loudness Ví

dụ như khi thực hiện chuyển kênh chương trình, hoặc

sự thay đổi âm lượng đột ngột giữa các chương trình tin tức và chương trình quảng cáo Nguyên nhân là do các nhà quảng bá đã không thực hiện điều chỉnh mức loudness thống nhất trước khi phát sóng, các kỹ thuật nén dải động âm thanh cũng góp phần gây ra sự nhảy mức loudness này, và phương pháp chuẩn hóa âm thanh theo mức đỉnh trước đây không giải quyết triệt để vấn

đề nhảy mức âm lượng Tiêu chuẩn ITU-R BS.645-2 khuyến nghịchuẩn hóa theo mức đỉnh – 9 dBFS (decibel

to full scale) [3] dùng máy đo PPM (Peak Programme Meter) hiện nay vẫn còn nhiều quốc gia sử dụng, trong

đó có Việt Nam

Gần đây, vấn đề nhảy âm lượng đã được giải quyết thông qua khuyến nghịEBU R128 của EBU [4] Khuyến nghịnày được xem như một chuẩn mở cho việc cân bằng

âm lượng của các chương trình audio theo như cách mà

Trang 2

người nghe/xem cảm nhận được âm lượng thực tế Việc

đưa ra khuyến cáo này đánh dấu một trong những thay

đổi cơ bản nhất trong lịch sử audio của ngành phát thanh

truyền hình vì nó đã giải quyết được sự tăng vọt âm

lượng audio trong các chương trình, giữa các chương

trình và giữa các kênh truyền hình EBU R128 được

phát triển kế thừa tiêu chuẩn ITU-R BS.1770-2: “Thuật

toán đo âm lượng chương trình và mức đỉnh thực của

tín hiệu audio” [5] Khuyến nghịITU-R BS.1770-2 phát

triển thuật toán đo âm lượng chương trình (programme

loudness) cho các file audio dạng mono, stereo và âm

thanh đa kênh 5.1 Khuyến nghịITU-R BS.1770-2 lần

đầu tiên đưa ra khái niệm mức đỉnh thực (true-peak

- TP) của tín hiệu audio Mức TP được đo với máy đo

đỉnh thực (true-peak meter hay oversampling PPM), đơn

vịđo là dBTP (dB relative to digital full scale) dBTP

được đo trong miền thời gian liên tục, tần số lấy mẫu ít

nhất gấp 4 lần tần số tín hiệu audio đầu vào Khác với

đo đỉnh mẫu dBFS sử dụng máy đo PPM hay QPPM

(Quasi-Peak Programme Meter), và đo giá trịtrong miền

rời rạc Giá trịmức đỉnh thực luôn lớn hơn giá trịđo bởi

dBFS, tiệm cận với mức đỉnh thực của tín hiệu audio vì

vậy máy đo đỉnh thực dự đoán chính xác hơn mức đỉnh

tín hiệu audio, hạn chế vấn đề méo tín hiệu (clipping)

xảy ra khi chuyển audio từ số sang tương tự (D/A)

Hình 1 minh họa so sánh giữa mức đỉnh thực dBTP

và mức đỉnh mẫu dBFS, máy đo đỉnh thực đọc tiệm

cận mức đỉnh thực của tín hiệu audio, là mức đỉnh

lớn nhất đo trong miền thời gian liên tục, còn máy đo

PPM/QPPM đọc mức đỉnh dBFS tại các vịtrí lấy mẫu

rời rạc, vì vậy dBFS có sai số lớn so với mức đỉnh của

tín hiệu audio Hiện nay phần lớn các đài phát

thanh-truyền hình tại Châu Âu đã chuyển qua sử dụng máy đo

đỉnh thực và tích hợp khuyến nghịEBU R128 vào dòng

làm việc (workflow) truyền hình

Khuyến nghịEBU R128 được nhóm EBU PLOUD

phát triển, ngoài giá trịđo âm lượng tích hợp/âm lượng

chương trình (programme loudness) dùng đo tích hợp

trong một thời gian dài hay đo toàn bộ chương trình,

với đơn vịđo là LUFS (Loudness Units Full Scale)

hay LKFS (LoudnessK-weighted Full Scale theo cách

gọi của ITU-R BS.1770), EBU R128 còn định nghĩa

thêm đo loudness theo khoảng thời gian ngắn ’S’

(short-term loudness), đo loudness tức thời ’M’ (Momentary

loudness) để thực hiện đo và giám sát loudness các

chương trình truyền hình trực tiếp Loudness ’S’ đo các

mẫu audio dùng cửa sổ trượt 3s, loudness ’M’ đo các

mẫu audio dùng cửa sổ trượt 400ms Để đo programme

loudness (hay intergrated loudness: ‘I’), EBU R128 dùng

cơ chế đo gating với mức ngưỡng -10 LU (Loudness

7KӡLJLDQ

G%73G%)6 7UXHSHDNÿӑFEӣLPi\ÿR

2YHUVDPSOLQJ730HWHU

VDPSOHSHDNÿӑFEӣLPi\

ÿR330RU4330

Hình 1 So sánh dBTP và dBFS.

Hình 2 LRA khác nhau tùy theo môi trường phát lại [6].

Unit) Cơ chế gating sẽ bỏ qua không đo những phần

âm thanh có âm lượng dưới mức ngưỡng (xem là nhiễu),

vì vậy kết quả đo âm lượng tích hợp của toàn bộ file sẽ chính xác Cơ chế gating trình bày chi tiết trong tài liệu ITU-R BS.1770-2 Mức đỉnh thực được đo theo thuật toán trình bày trong Phụ Lục 2 của ITU-R BS.1770-2 EBU R128 giới hạn mức đỉnh thực tối đa cho các tín hiệu audio là –1dBTP

Ngoài ra, EBU R128 còn định nghĩa thêm thông số dải âm lượng LRA (loudness range), đơn vịđo LU, 1LU tương ứng 1dB LRA mô tả sự phân bố của âm lượng chương trình từ mức yên lặng đến mức ồn nhất, LRA đo bằng phương pháp phân phối thống kê LRA được định nghĩa bởi sự khác nhau giữa ước lượng 10% mức thấp

và 95% mức cao của phân phối Phép đo LRA tương tự như đo IQR (Interquartile Range) trong phân phối thống

kê LRA tương tự như thông số dải động DRC (Dynamic Range Compressor) của tín hiệu audio Thông số LRA phụ thuộc vào nền tảng phân phối (ví dụ: truyền dẫn qua mạng cáp, mặt đất, vệ tinh), đối tượng người nghe (ví dụ: nhỏ tuổi, trung niên, người già) hay môi trường phát lại (ví dụ: nghe ở trong xe hơi, trong rạp hát, trong nhà) xem Hình 2

Để đạt cân bằng loudness giữa các kênh chương trình

Trang 3

truyền hình (ví dụ kênh VTV1 và VTV3), hay giữa các

nội dung chương trình (quảng cáo, tin tức, thời sự) phát

trong cùng một kênh sóng EBU R128 đưa ra khuyến

nghịchuẩn hóa âm lượng trong các khâu sản xuất, hậu

kỳ, truyền dẫn và phát sóng Cụ thể là đối với một

tín hiệu audio, các thông số sau cần phải chuẩn hóa:

Loudness “I” chuẩn hóa về mức -23 LUFS, với các

chương trình truyền hình trực tiếp thông số này có thể

chấp nhận trong giới hạn:- 23 LUFS± 1 LU Mức đỉnh

thực tín hiệu audio phải thõa mức giới hạn nhỏ hơn hoặc

bằng- 1 dBTP Thông số LRA tùy thuộc vào nền tảng

truyền dẫn và môi trường phát lại Các thông số này

được đo tham chiếu đến tín hiệu audio baseband dạng

PCM không nén Đo dùng phần mềm hay máy đo tương

thích với tiêu chuẩn EBU R128 và ITU-R BS.1770-2

Việc chuẩn hóa âm lượng theo EBU R128 sẽ thống

nhất mức âm lượng, người xem truyền hình sẽ không

còn phải dùng thiết bịđiều khiển âm lượng để điều

chỉnh lại mức âm lượng mỗi khi họ chuyển kênh TV,

hay khi xuất hiện chương trình quảng cáo có âm lượng

tăng vọt, gây khó chịu cho người xem Giải quyết được

bài toán mất cân bằng âm lượng trong truyền hình, mà

phương pháp chuẩn hóa theo mức đỉnh trước đây không

giải quyết triệt để

Hình 3 so sánh sự khác nhau giữa chuẩn hóa theo mức

đỉnh và chuẩn hóa loudness Với mức đỉnh, việc chuẩn

hóa của tín hiệu audio được dựa trên mức cho phép tối

đa (PML – Permitted Maximum Level, ví dụ là mức

-9 dBFS) vẫn là cách xử lý mức audio được chấp nhận

phổ biến nhằm thống nhất chung mức đỉnh cho phép

của các chương trình Tuy nhiên, với các mức âm lượng

thì có đặc thù là độ biến thiên lớn, và độ biến thiên này

phụ thuộc vào mức độ nén dải động của tín hiệu Việc

chuẩn hóa âm lượng nhằm đạt kết quả âm lượng trung

bình cân bằng giữa các chương trình dù mức đỉnh thay

đổi tùy theo nội dung (dựa trên các yếu tố về nghệ thuật

và kỹ thuật) Với chuẩn hóa âm lượng, khi dải âm lượng

của một chương trình nằm trong giới hạn chấp nhận của

người nghe thì người nghe có thể hài lòng với mức âm

lượng trung bình thống nhất cho tất cả các chương trình,

họ không cần phải dùng điều khiển từ xa để điều chỉnh

âm lượng nữa

Phần còn lại của bài báo được tổ chức như sau, Phần II

trình bày thuật toán đo loudness theo ITU-R BS.1770-2

Trong Phần III, chúng tôi trình bày cách thức thu thập

mẫu đo Phần IV và Phần V là kết quả đo đạc thực

tế với Phần IV là kết quả đo trước khi chuẩn hóa và

Phần V trình bày kết quả sau khi chuẩn hóa loudness

Cuối cùng, Phần VI đưa ra một số kết luận sau khi khảo

sát

Hình 3 Chuẩn hóa mức đỉnh so với chuẩn hóa âm lượng [6].

%ӝOӑF.

%ӝOӑF 0HDQ6TXDUH

0HDQ6TXDUH 0HDQ6TXDUH 0HDQ6TXDUH 0HDQ6TXDUH *>

*Z

*&

*/6

*56

 /RJ 'd/E' ӂ748Ҧ

; /

; 5

; &

; /6

; 56

< /

< 5

< &

< /6

< 56

= /

= 5

= &

= /6

= 56

Hình 4 Sơ đồ thuật toán đo audio loudness đa kênh [5].

II THUẬT TOÁN ĐO LOUDNESS THEO ITU-R

BS.1770-2 Thuật toán đo âm lượng được xây dựng tổng quát cho tín hiệu audio đa kênh (5.1 kênh) Sơ đồ khối trong Hình 4 trình bày kèm các nhãn ký hiệu theo các khối nhằm mô tả thứ tự xử lý của thuật toán Theo đó, có 5 kênh audio ở ngõ vào left (L), centre (C), right (R), left surround (LS) và right surround (RS), trường hợp chỉ gồm một kênh audio (mono) hoặc stereo thì tương ứng chỉ có ngõ vàoXL, hoặc/vàXR ở ngõ vào Kênh audio tần số thấp (Low frequency effect - LFE) được bỏ qua không đo trong giải thuật Giải thuật thực hiện qua bốn bước như sau:

Trọng số K áp dụng bộ lọc K-filter (còn gọi là pre-filter) hai tầng cho tín hiệu ngõ vào Tầng thứ nhất của bộ lọc pre-filter nâng hiệu ứng âm học vùng tần số cao Các hệ số bộ lọc dùng với tần số lấy mẫu (sampling rate) của tín hiệu audio là 48 kHz [5], với các tần số lấy mẫu khác thì các hệ số cần được tính toán và thiết kế lại Để đơn giản, tín hiệu audio lấy mẫu ở những tần số khác có thể lấy mẫu lại ở tần số 48 kHz và dùng các hệ số bộ lọc như khuyến cáo

Tầng thứ 2 của bộ lọcK-filter là bộ lọc thông cao (high-pass filter) Đường cong trọng số RLB của tầng này được xác định bởi bộ lọc bậc 2 với các

Trang 4

hệ số cho trong [5, Table 2] Tương tự, các hệ số

này cũng được sử dụng ứng với tần số lấy mẫu của

tín hiệu audio là 48 kHz, và phải tính lại các hệ số

khi sử dụng với tần số lấy mẫu khác

kênh

Năng lượng (hoặc trung bình bình phương) của tín

hiệu ở ngõ vào bộ lọc trong một khoảng thời gian

T được tính bởi công thức sau:

zi= 1 T

T

0

vớiyilà tín hiệu ngõ vào đã được lọc từ bộ lọc

pre-filter ở Bước 1 vài ∈ I với I = [L, R, C, LS, RS]

là tập các kênh audio ngõ vào

• Bước 3: Tổng trọng số các kênh

Khi tính tổng trọng số các kênh, chúng ta dùng

trọng số lớn hơn cho các kênh surround và bỏ

qua kênh LFE Loudness theo đơn vịLKFS trong

khoảng thời gian T được định nghĩa bởi

LK = −0.691 + 10log10

i

Gizi (2)

vớiGi là các hệ số trọng số cho các kênh riêng

• Bước 4: Cơ chế đo gating

Cơ chế đo gating dùng block 400ms, hệ số chồng

lấp 75% Để đo loudness dùng cơ chế đo gating,

khoảng thời gian T được chia theo các khoảng

block chồng lấp (gọi là gating block là một khoảng

thời gian chứa các mẫu audio kế tiếp nhau có giá trị

Tg = 400ms) Hệ số chồng lấp (overlap) của mỗi

gating block là 75% của khoảng thời gian gating

block Năng lượng hoặc trung bình bình phương

của gating block thứj của kênh ngõ vào thứ i trong

khoảng T được tính bởi

zij = 1

Tg

T g j(Step+1)

T g jStep

0, 1, 2, , T −T g

T g Step

gating block thứj được định nghĩa bởi

Lj = −0.691 + 10log10

i

Gizij (4)

với ngưỡng gating, Γ, sẽ có một tập các gating

block ký hiệuJg= {j : lj > Γ}, nghĩa là tập các

gating block có loudness lớn hơn giá trịngưỡng

gating Γ Số lượng các thành phần trong Jg ký

Bảng I

Kênh Trọng số G i

Kênh trái (L) 1.0 (0 dB) Kênh phải (R) 1.0 (0 dB) Kênh trung tâm (C) 1.0 (0 dB) Kênh surround trái (LS) 1.41 (1.5 dB) Kênh surround phải (RS) 1.41 (1.5 dB)

hiệu là|Jg| Giá trịgated loudness, LKG, theo đơn vịLKFS đo trong khoảng T được định nghĩa:

LKG= −0.691 + 10log10

i

Gi

⎛

⎝ 1

|Jg|

J g

zij

⎞

⎠ (5) Lúc này, một quá trình xử lý hai bước được thực hiện để đo gating dựa trên giá trịngưỡng tuyệt đối

và tương đối Ngưỡng tương đối theo đơn vịLKFS được tính toán dựa trên ngưỡng tuyệt đốiΓa= −70 LKFS theo công thức sau:

Γr= −0.691 + 10log10

i

Gi

⎛

⎝ 1

Jg.

J g

zij

⎞

⎠ − 10 (6) với Jg = {j : lj > Γa} và Γa = −70 LKFS Giá trịgated loudness,LKG theo LKFS, đo dùng ngưỡngΓr được tính như sau:

LKG= −0.691 + 10log10

⎡

i

Gi

⎛

⎝ 1

|Jg|

J g

zij

⎞

⎠

⎤

⎦ , (7) trong đóJg= {j : lj > Γr}

Ở đây, đơn vịLKFS tương đương decibel, nghĩa là mức tín hiệu gia tăng 1 dB thì loudness gia tăng tương ứng 1 LKFS Một ví dụ minh họa cho kết quả khi thực hiện giải thuật là: nếu các ngõ vào left, center, hoặc right là tín hiệu sin 0 dBFS 1 kHz thì kết quả đo loudness là -3.01 LKFS

III PHƯƠNG PHÁP THU THẬP MẪU ĐO Các mẫu đo được lấy từ các phương thức truyền dẫn khác nhau: vệ tinh, mạng cáp, truyền hình mặt đất Các kênh được lấy mẫu bao gồm các kênh truyền hình của Đài truyền hình Việt Nam (VTV), các kênh truyền hình trong nước khác như: Công ty cổ phần truyền thông

đa phương tiện (VTC), Công ty truyền hình cáp Saigon Tourist (SCTV), và các kênh truyền hình nước ngoài,

ví dụ như BBC, KBS, Arirang, Australia Lấy mẫu cho

Trang 5

cả truyền hình phát quảng bá analog và số Các mẫu

đo được thu thập và xử lý trong suốt thời gian từ tháng

04/2013-04/2014

A Cách thức lấy mẫu

1) Lấy mẫu theo thể loại chương trình phát sóng:

Các thể loại chương trình được lấy mẫu: chọn

một số chương trình điển hình sau: quảng cáo,

thời sự, phim truyện, gameshow, thể thao, ca nhạc,

thời tiết, phóng sự, tin tức và các thể loại khác

Thời lượng cho mỗi mẫu từ 2-3 phút Mỗi thể loại

chương trình lấy 4 đến 10 mẫu

2) Lấy mẫu theo kênh phát sóng: Thời lượng cho mỗi

mẫu là 3 phút Các mẫu được lấy từ các kênh ứng

với khoảng thời gian liên tiếp nhau để đánh giá

nhảy mức âm lượng khi chuyển kênh truyền hình

B Hệ thống lấy mẫu

1) Thu chương trình từ truyền hình quảng bá mặt

đất: Dùng card DVB-T Hauppauge

WinTV-HVR-1300 kết nối trực tiếp với anten truyền hình Yagi

UHF/VHF và máy vi tính thông qua cáp TV và

khe cắm Dùng phần mềm Win TV 7 để capture

chương trình từ các kênh phát sóng và ghi lại các

kênh chương trình, card có khả năng thu tín hiệu

truyền hình analog và DVB-T Mẫu được capture

là các dòng TS có định dạng MPEG-2 Sau đó

dùng phần mềm NxTSA tách dòng TS thành các

file video và audio có định dạng MPG, tiếp tục

dùng phần mềm chuyển đổi file audio định dạng

MPG thành file audio có định dạng WAV để đưa

vào xử lý (đo và chỉnh) loudness bằng phần mềm

Matlab

2) Thu chương trình từ vệ tinh: Dùng card DTA 140

để gắn vào máy tính và phần mềm DtGrabber+

để capture chương trình từ vệ tinh tại tổng khống

chế (Head-End) của VTV9 (Trung tâm truyền hình

Việt Nam tại TP Hồ Chí Minh

Dùng phần mềm NxTSA để tách luồng (Transport

Stream - TS) gồm nhiều kênh thành các dòng TS

của các kênh riêng lẻ Dùng phần mềm TOTAL

VIDEO CONVERTER chuyển đổi các file audio

có định dạng MPG của các kênh đó thành định

dạng WAV để xử lý

3) Thu chương trình từ mạng truyền hình cáp SCTV:

Dùng đầu thu Set-Top-Box (STB) A800 để thu

chương trình các kênh truyền hình trong nước

và nước ngoài từ hệ thống truyền hình cáp của

SCTV Các kênh capture là: VTV1, VTV2, VTV3,

VTV4, VTV6, Arirang, KBS World HD, BBC,

Australia Mẫu được lấy từ các kênh truyền hình

í70 í60 í50 í40 í30 í20 í10 0

VTV6í3105í0957

Thoi gian

Hình 6 Minh họa kết quả đo loudness với cửa sổ trượt 3s.

nêu trên Thời lượng mỗi mẫu từ 1 phút 30 giây đến 2 phút Thời gian lấy mẫu là ngẫu nhiên trong hai ngày (ngày 08 và 09/10/2013) Mẫu được lấy tiếp tục chuyển thành định dạng WAV để đo các thông số loudness

Để đo loudness và chuẩn hóa loudness, chúng tôi xây dựng một công cụ trong Matlab Thuật toán có thể đo và

xử lý file audio stereo 2.0, đo loudness, LRA, true-peak

và chuẩn hóa các thông số loudness và true-peak theo EBU-R 128 Để kiểm chứng sự tương thích của thuật toán, trước khi tiến hành đo các mẫu thực, chúng tôi tiến hành đo các file audio mẫu cung cấp từ trang web EBU trong [7], với sai số của các giá trịloundess, LRA

và dBTP trong giới hạn±0.1 , giới hạn chấp nhận của các máy đo tương thích với chuẩn EBU R128 Hình 5 trình bày quy trình thu thập và xử lý các mẫu đo, trước tiên dữ liệu có thể xuất phát từ: Mạng truyền hình vệ tinh, mặt đất hay truyền hình cáp Hệ thống thu thập dữ liệu bao gồm phần cứng và phần mềm để ghi lại các dòng chương trình dạng TS cho các xử lý về sau Tiếp theo dùng phần mềm chuyên dụng để tách riêng các dòng video và audio Các file audio dạng WAV sẽ được

đo và chuẩn hóa loudness riêng, sau đó ghép audio và video thành file hoàn chỉnh, lưu các file video đã chuẩn hóa các thông số loudness

IV KẾT QUẢ ĐO Trong phần này, chúng tôi sẽ trình bày các kết quả đo đạc trước khi chuẩn hóa Bắt đầu từ Hình 6, chúng tôi minh họa kết quả đo loudness của kênh VTV6, mẫu đo ngày 31/05/2013 với thời gian lấy mẫu bắt đầu lúc 9h57,

âm lượng tích hợp của file này là -14 LUFS, lớn hơn 9 LUFS so với khuyến nghịEBU R 128 là -23 LUFS Trong Hình 7, chúng tôi trình bày kết quả đo loudness trên cùng một kênh (kênh VTV3 của Đài Truyền hình

Trang 6

PһWÿҩW

FiS

7RROÿRYj

FKXҭQKyD

ORXGQHVV 3KҫQPӅP

WiFKDXGLRYj

YLGHR

7KXWKұSOѭX

WUӳYjRKӋ

WKӕQJGzQJ76

3KҫQPӅP

JKpSDXGLRYj

YLGHR

/ѭXWUӳFiF ILOHÿmFKXҭQ KyDORXGQHVV

$XGLR

9LGHR

Hình 5 Quy trình thu thập và xử lý loudness dựa trên file.

í20

í15

í10

í5

0

Mau

Hình 7 Sự biến thiên loudness của các chương trình ca nhạc trên kênh

VTV3

Việt Nam) và trên cùng một chương trình (chương trình

ca nhạc), các mẫu đo được lấy vào tháng 04/2013 qua

hệ thống truyền hình số mặt đất DVB-T, thời gian của

mỗi mẫu là 2-3 phút Kết quả cho thấy mức âm lượng

của các chương trình ca nhạc có mức biến động lớn,

chênh lệch 10 LUFS giữa mẫu đo 1 và mẫu 2

Tiếp theo, chúng tôi khảo sát trên các kênh khác nhau

trong Hình 8, minh họa kết quả đo loudness của 3 kênh

VTV1, VTV2, VTV3 được lấy mẫu vào 04/2013 vời thời

lượng 3 phút trong các khoảng thời gian liên tiếp nhau

theo thứ tự (8h10-8h13, 8h13-8h16, 8h16-8h19) Điều

này tương tự như khi người xem truyền hình đang muốn

chuyển kênh chương trình từ kênh VTV1 và VTV2 hay

VTV3 Mức âm lượng chênh lệch là 17 LUFS, với mức

này người nghe/xem sẽ cảm nhận được rất rõ sự khác

biệt của âm lượng khi chuyển kênh, âm lượng có thể tự

nhiên tăng đột ngột, gây khó chịu cho người xem và họ

phải dùng volume control điều chỉnh lại mức âm lượng

Trong Hình 9, chúng tôi khảo sát ở các kênh khác

nhau giữa hai đài khác nhau Kết quả đo các kênh từ hệ

í35 í30 í25 í20 í15 í10 í5 0

Kenh

Loudness luc chuyen kenh chuong trinh

VTV1 (í17 LUFS)

VTV2 (í31 LUFS)

VTV3:í14 LUFS

Hình 8 Sự nhảy âm lượng lúc chuyển kênh chương trình VTV1 (8h10-8h13), VTV2 (8h13-8h16), VTV3 (8h16-8h19).

í30 í25 í20 í15 í10 í5 0

Mau do

Kenh SCTV4&13 Kenh VTC1&2

Hình 9 Loudness các kênh truyền hình cáp SCTV và kỹ thuật số VTC.

thống truyền hình kỹ thuật số VTC và truyền hình cáp SCTV Các kênh lấy mẫu với thời gian 1 phút vào tháng 12/2013 Kênh SCTV (SCTV4 và SCTV13), kênh VTC (VTC1 và VTC2) có sự chênh lệch âm lượng lớn nhất

Trang 7

1 2 3 4 5 6

í35

í30

í25

í20

í15

í10

í5

Mau do

The thao

Phim

Quang cao

Thoi su

Hình 10 Sự biến thiên âm lượng kênh VTV.

í35

í30

í25

í20

í15

í10

í5

Mau do

VTV3

Arirang

KBS

BBC

Australia

Hình 11 So sánh với các kênh nước ngoài.

14 LUFS, mức âm lượng các kênh không ổn định

Hình 10 trình bày sự biến động âm lượng được lấy

mẫu theo thể loại chương trình phát sóng (tin tức, phim

thời sự, thể thao ) của VTV Kết quả cho thấy âm

lượng có độ vênh rất lớn, các mẫu có thời gian từ 2-3

phút, lấy mẫu vào tháng 04/2013, thời gian lấy mẫu là

các giờ trong ngày từ 9h-16h Các chương trình quảng

cáo có mức âm lượng rất lớn so với các chương trình

khác, cao hơn 10-15 LUFS

Hình 11 so sánh âm lượng kênh VTV3 so với các kênh

nước ngoài lấy mẫu vào tháng 10/2013 Thời gian lấy

mẫu là 1 phút 30 giây Kênh VTV3 có sự biến thiên âm

lượng rất lớn từ [-10 LUFS, -33 LUFS], kênh BBC của

Anh có mức âm lượng dao động ổn định quanh mức -18

LUFS, kênh Australia dao động khoảng [-23 LUFS, -19

LUFS], kênh Arirang (kênh ca nhạc Hàn Quốc) mức dao

động [-21 LUFS, -18 LUFS], kênh KBS HD World (Hàn

Quốc) mức dao động [-21 LUFS, -18 LUFS] Mức biến

động âm lượng của các kênh BBC là ổn định, do Anh

và phần lớn các nước Châu Âu đã chấp thuận khuyến

nghịEBU R128, với chuẩn hóa mức âm lượng mục tiêu

là -23 LUFS [8] từ 2012, và Úc chấp thuận tiêu chuẩn ITU-R BS.1770 với mức âm lượng chuẩn hóa mục tiêu

là -24 LKFS [8] từ 2012 Ở Hàn Quốc, một số giải pháp điều chỉnh loudness tự động được áp dụng để cân bằng mức loudness cho các chương trình phát sóng truyền hình, ví dụ như IPTV [9] Các giá trịđo được từ STB đặt tại Việt Nam của kênh nước ngoài có chênh lệch

từ 2-3 LUFS so với giá trịtrung bình -23 LUFS của tiêu chuẩn EBU R128, đây là kết quả đo sau khi tín hiệu truyền qua đường vệ tinh, rồi phân phối lại qua

hệ thống truyền hình cáp SCTV, và sau đó giải mã lại

từ STB nên mức tín hiệu có thay đổi, tuy nhiên mức loudness trung bình giữa các kênh ít biến động, nằm trong giới hạn cho phép, với sự thay đổi từ 2-3 LUFS người nghe khó cảm nhận được sự biến động âm lượng

V KẾT QUẢ CHUẨN HÓA ÂM LƯỢNG Việc chuẩn hóa âm lượng nhằm đưa mức âm lượng trung bình thống nhất về một mức chung, sẽ làm giảm

sự khác biệt âm lượng của các thể loại trong cùng một kênh chương trình (ví dụ chương trình quảng cáo, thời

sự, phim) hay giữa các kênh chương trình với nhau (ví dụ VTV1, VTV2, HTV7) giúp tạo ra sự hài hòa âm thanh cho người nghe/xem truyền hình Người xem không cần phải dùng thiết bịđiều khiển âm lượng (volume control) khi xem TV Chúng tôi đã thực nghiệm chuẩn hóa loudness theo các yêu cầu của khuyến nghịEBU R128, với thông số loudness đưa về mức -23 LUFS, giới hạn true-peak là nhỏ hơn hoặc bằng -1 dBTP và giá trị LRA tùy thuộc vào nền tảng phân phối và môi trường người nghe Kết quả sau khi chuẩn hóa các thông số loudness, xem Hình 12 và Bảng II, không còn sự nhảy vọt âm lượng đột ngột khi chuyển kênh chương trình, các mẫu trước và sau khi chuẩn hóa âm lượng được cho một số đối tượng nghe trong điều kiện phòng thông thường không phát hiện sự nhảy vọt âm lượng nào sau khi chuẩn hóa loudness

VI KẾT LUẬN Bài báo này đã trình bày hiện trạng âm lượng trong sản xuất, phát sóng tại VTV là đơn vịmà nhóm thực hiện có cơ hội khảo sát Các đài khác, ví dụ như VTC

và SCTV, nhóm chỉ thực hiện việc đo các chương trình thông qua thu sóng từ các hệ thống phát sóng Một số Đài truyền hình khác mà nhóm thực hiện có cơ hội tìm hiểu và có thông tin như: HTV (Đài Tp.HCM), Vĩnh Long, Trà Vinh, Sóc Trăng, và Tây Ninh, thì vấn đề kiểm soát âm lượng cũng chưa được các Đài quan tâm, điều này dẫn đến trên địa bàn Tp Hồ Chí Minh khi người dân thu sóng từ các kênh sóng của các đài khác

Định dạng
Số trang	7
Dung lượng	910,85 KB