Để đo loudness và chuẩn hóa loudness, chúng tôi xây dựng một công cụ trong Matlab. Thuật toán có thể đo và xử lý file audio stereo 2.0, đo loudness, LRA, true-peak và chuẩn hóa các thông[r]
Trang 1Khảo sát âm lượng (loudness) các kênh truyền
hình tại Việt Nam
Nguyễn Hữu Phong∗, Nguyễn Đức Hoàng∗, Đỗ Thế Thiện∗, Võ Nguyễn Quốc Bảo†, và Huỳnh Hữu Tuệ‡
∗ Trung tâm Nghiên cứu Ứng dụng Khoa học Kỹ thuật Truyền hình
Email: {phongnguyen; hoangnd; dothethien}@vtv.gov.vn
†Phòng Thí Nghiệm Thông Tin Vô Tuyến
Học Viện Công Nghệ Bưu Chính Viễn Thông Cơ Sở TP Hồ Chí Minh
Email: baovnq@ptithcm.edu.vn
‡ Khoa Điện Tử - Viễn Thông, Đại Học Quốc Tế, Đại Học Quốc Gia TP.HCM
Email: hhtue@hcmiu.edu.vn
Tóm tắt nội dung—Âm lượng (loudness) của các kênh
truyền hình có thể thay đổi đột ngột giữa các thể loại
chương trình khác nhau trong cùng một kênh, hoặc khi
chuyển giữa các kênh với nhau Bài báo này nhằm khảo sát
sự thay đổi mức loudness của một số kênh chương trình
được lấy mẫu từ các phương thức phân phối quảng bá khác
nhau: mặt đất, vệ tinh và cáp tại Việt Nam Mức loudness
của cả chương trình truyền hình số và analog được lấy
mẫu và đo đạc Một công cụ đo loudness được phát triển
trong Matlab dựa trên khuyến nghị ITU-R BS.1770-2 và
khuyến nghị EBU R128 dùng để đo loudness các file audio
2 kênh Dữ liệu thu thập được sẽ tiến hành đo và phân
tích mức loudness Cuối cùng giải pháp chuẩn hóa loudness
theo EBU R128 nhằm đạt mức cân bằng loudness cho các
chương trình truyền hình tại Việt Nam được đề xuất.
Index Terms—Loudness, ITU-R BS.1770-2, EBU R128,
TV, Volume control.
I GIỚI THIỆU
Âm thanh đóng vai trò cực kỳ quan trọng trong truyền
hình Trước đây, khi truyền hình còn phát đen trắng, sóng
yếu, ở những khu vực xa khi xem tín hiệu lúc được lúc
mất, âm thanh bịnhiễu nhiều khi át cả âm thanh chính
Cùng với sự phát triển của công nghệ, ngành truyền hình
tại Việt Nam cũng đã phát triển nhanh chóng và ngày
càng mang đến cho người xem nhiều chương trình chất
lượng về nội dung bao gồm cả chất lượng hình ảnh và
âm thanh Dù đã được nâng cao về chất lượng âm thanh
thì cho đến gần đây, người xem vẫn còn nhiều điều chưa
hài lòng khi mà âm thanh quảng cáo thường đột nhiên
to hơn nhiều so với âm thanh chương trình đang xem,
hoặc khi chuyển kênh truyền hình thì phải điều chỉnh
lại âm lượng giữa các kênh Nghĩa là không có cách nào
để đo được âm lượng của âm thanh từ phía nhà cung
cấp cho tới phía người xem Việc chuẩn hóa âm thanh
theo mức đỉnh (peak normalisation) không phải là cách thức để xác định âm lượng/độ ồn (loundness) của tín hiệu âm thanh
Loudness (âm lượng) có thể hiểu đơn giản là cách
mà người nghe cảm nhận được biên độ âm thanh hay
là thuộc tính về độ nhạy cảm của tai người nghe khi chuyển từ mức im lặng đến mức ồn của âm thanh [1] Loudness đo cảm nhận của tai người nghe về âm thanh, khác với mức áp lực âm thanh (sound pressure level - SPL) chỉ mô tả cường độ âm thanh theo thang
dB Loudness chịu ảnh hưởng bởi nhiều thông số hơn so với SPL, bao gồm tần số, băng thông và độ lâu của âm thanh [2] Trong suốt quá trình xem TV (Television),
sự thay đổi loudness có thể gây khó chịu cho người xem khi họ phải thường xuyên dùng Volume control (điều khiển từ xa) để điều chỉnh lại mức loudness Ví
dụ như khi thực hiện chuyển kênh chương trình, hoặc
sự thay đổi âm lượng đột ngột giữa các chương trình tin tức và chương trình quảng cáo Nguyên nhân là do các nhà quảng bá đã không thực hiện điều chỉnh mức loudness thống nhất trước khi phát sóng, các kỹ thuật nén dải động âm thanh cũng góp phần gây ra sự nhảy mức loudness này, và phương pháp chuẩn hóa âm thanh theo mức đỉnh trước đây không giải quyết triệt để vấn
đề nhảy mức âm lượng Tiêu chuẩn ITU-R BS.645-2 khuyến nghịchuẩn hóa theo mức đỉnh – 9 dBFS (decibel
to full scale) [3] dùng máy đo PPM (Peak Programme Meter) hiện nay vẫn còn nhiều quốc gia sử dụng, trong
đó có Việt Nam
Gần đây, vấn đề nhảy âm lượng đã được giải quyết thông qua khuyến nghịEBU R128 của EBU [4] Khuyến nghịnày được xem như một chuẩn mở cho việc cân bằng
âm lượng của các chương trình audio theo như cách mà
Trang 2người nghe/xem cảm nhận được âm lượng thực tế Việc
đưa ra khuyến cáo này đánh dấu một trong những thay
đổi cơ bản nhất trong lịch sử audio của ngành phát thanh
truyền hình vì nó đã giải quyết được sự tăng vọt âm
lượng audio trong các chương trình, giữa các chương
trình và giữa các kênh truyền hình EBU R128 được
phát triển kế thừa tiêu chuẩn ITU-R BS.1770-2: “Thuật
toán đo âm lượng chương trình và mức đỉnh thực của
tín hiệu audio” [5] Khuyến nghịITU-R BS.1770-2 phát
triển thuật toán đo âm lượng chương trình (programme
loudness) cho các file audio dạng mono, stereo và âm
thanh đa kênh 5.1 Khuyến nghịITU-R BS.1770-2 lần
đầu tiên đưa ra khái niệm mức đỉnh thực (true-peak
- TP) của tín hiệu audio Mức TP được đo với máy đo
đỉnh thực (true-peak meter hay oversampling PPM), đơn
vịđo là dBTP (dB relative to digital full scale) dBTP
được đo trong miền thời gian liên tục, tần số lấy mẫu ít
nhất gấp 4 lần tần số tín hiệu audio đầu vào Khác với
đo đỉnh mẫu dBFS sử dụng máy đo PPM hay QPPM
(Quasi-Peak Programme Meter), và đo giá trịtrong miền
rời rạc Giá trịmức đỉnh thực luôn lớn hơn giá trịđo bởi
dBFS, tiệm cận với mức đỉnh thực của tín hiệu audio vì
vậy máy đo đỉnh thực dự đoán chính xác hơn mức đỉnh
tín hiệu audio, hạn chế vấn đề méo tín hiệu (clipping)
xảy ra khi chuyển audio từ số sang tương tự (D/A)
Hình 1 minh họa so sánh giữa mức đỉnh thực dBTP
và mức đỉnh mẫu dBFS, máy đo đỉnh thực đọc tiệm
cận mức đỉnh thực của tín hiệu audio, là mức đỉnh
lớn nhất đo trong miền thời gian liên tục, còn máy đo
PPM/QPPM đọc mức đỉnh dBFS tại các vịtrí lấy mẫu
rời rạc, vì vậy dBFS có sai số lớn so với mức đỉnh của
tín hiệu audio Hiện nay phần lớn các đài phát
thanh-truyền hình tại Châu Âu đã chuyển qua sử dụng máy đo
đỉnh thực và tích hợp khuyến nghịEBU R128 vào dòng
làm việc (workflow) truyền hình
Khuyến nghịEBU R128 được nhóm EBU PLOUD
phát triển, ngoài giá trịđo âm lượng tích hợp/âm lượng
chương trình (programme loudness) dùng đo tích hợp
trong một thời gian dài hay đo toàn bộ chương trình,
với đơn vịđo là LUFS (Loudness Units Full Scale)
hay LKFS (LoudnessK-weighted Full Scale theo cách
gọi của ITU-R BS.1770), EBU R128 còn định nghĩa
thêm đo loudness theo khoảng thời gian ngắn ’S’
(short-term loudness), đo loudness tức thời ’M’ (Momentary
loudness) để thực hiện đo và giám sát loudness các
chương trình truyền hình trực tiếp Loudness ’S’ đo các
mẫu audio dùng cửa sổ trượt 3s, loudness ’M’ đo các
mẫu audio dùng cửa sổ trượt 400ms Để đo programme
loudness (hay intergrated loudness: ‘I’), EBU R128 dùng
cơ chế đo gating với mức ngưỡng -10 LU (Loudness
7KӡLJLDQ
G%73G%)6 7UXHSHDNÿӑFEӣLPi\ÿR
2YHUVDPSOLQJ730HWHU
VDPSOHSHDNÿӑFEӣLPi\
ÿR330RU4330
Hình 1 So sánh dBTP và dBFS.
Hình 2 LRA khác nhau tùy theo môi trường phát lại [6].
Unit) Cơ chế gating sẽ bỏ qua không đo những phần
âm thanh có âm lượng dưới mức ngưỡng (xem là nhiễu),
vì vậy kết quả đo âm lượng tích hợp của toàn bộ file sẽ chính xác Cơ chế gating trình bày chi tiết trong tài liệu ITU-R BS.1770-2 Mức đỉnh thực được đo theo thuật toán trình bày trong Phụ Lục 2 của ITU-R BS.1770-2 EBU R128 giới hạn mức đỉnh thực tối đa cho các tín hiệu audio là –1dBTP
Ngoài ra, EBU R128 còn định nghĩa thêm thông số dải âm lượng LRA (loudness range), đơn vịđo LU, 1LU tương ứng 1dB LRA mô tả sự phân bố của âm lượng chương trình từ mức yên lặng đến mức ồn nhất, LRA đo bằng phương pháp phân phối thống kê LRA được định nghĩa bởi sự khác nhau giữa ước lượng 10% mức thấp
và 95% mức cao của phân phối Phép đo LRA tương tự như đo IQR (Interquartile Range) trong phân phối thống
kê LRA tương tự như thông số dải động DRC (Dynamic Range Compressor) của tín hiệu audio Thông số LRA phụ thuộc vào nền tảng phân phối (ví dụ: truyền dẫn qua mạng cáp, mặt đất, vệ tinh), đối tượng người nghe (ví dụ: nhỏ tuổi, trung niên, người già) hay môi trường phát lại (ví dụ: nghe ở trong xe hơi, trong rạp hát, trong nhà) xem Hình 2
Để đạt cân bằng loudness giữa các kênh chương trình
Trang 3truyền hình (ví dụ kênh VTV1 và VTV3), hay giữa các
nội dung chương trình (quảng cáo, tin tức, thời sự) phát
trong cùng một kênh sóng EBU R128 đưa ra khuyến
nghịchuẩn hóa âm lượng trong các khâu sản xuất, hậu
kỳ, truyền dẫn và phát sóng Cụ thể là đối với một
tín hiệu audio, các thông số sau cần phải chuẩn hóa:
Loudness “I” chuẩn hóa về mức -23 LUFS, với các
chương trình truyền hình trực tiếp thông số này có thể
chấp nhận trong giới hạn:- 23 LUFS± 1 LU Mức đỉnh
thực tín hiệu audio phải thõa mức giới hạn nhỏ hơn hoặc
bằng- 1 dBTP Thông số LRA tùy thuộc vào nền tảng
truyền dẫn và môi trường phát lại Các thông số này
được đo tham chiếu đến tín hiệu audio baseband dạng
PCM không nén Đo dùng phần mềm hay máy đo tương
thích với tiêu chuẩn EBU R128 và ITU-R BS.1770-2
Việc chuẩn hóa âm lượng theo EBU R128 sẽ thống
nhất mức âm lượng, người xem truyền hình sẽ không
còn phải dùng thiết bịđiều khiển âm lượng để điều
chỉnh lại mức âm lượng mỗi khi họ chuyển kênh TV,
hay khi xuất hiện chương trình quảng cáo có âm lượng
tăng vọt, gây khó chịu cho người xem Giải quyết được
bài toán mất cân bằng âm lượng trong truyền hình, mà
phương pháp chuẩn hóa theo mức đỉnh trước đây không
giải quyết triệt để
Hình 3 so sánh sự khác nhau giữa chuẩn hóa theo mức
đỉnh và chuẩn hóa loudness Với mức đỉnh, việc chuẩn
hóa của tín hiệu audio được dựa trên mức cho phép tối
đa (PML – Permitted Maximum Level, ví dụ là mức
-9 dBFS) vẫn là cách xử lý mức audio được chấp nhận
phổ biến nhằm thống nhất chung mức đỉnh cho phép
của các chương trình Tuy nhiên, với các mức âm lượng
thì có đặc thù là độ biến thiên lớn, và độ biến thiên này
phụ thuộc vào mức độ nén dải động của tín hiệu Việc
chuẩn hóa âm lượng nhằm đạt kết quả âm lượng trung
bình cân bằng giữa các chương trình dù mức đỉnh thay
đổi tùy theo nội dung (dựa trên các yếu tố về nghệ thuật
và kỹ thuật) Với chuẩn hóa âm lượng, khi dải âm lượng
của một chương trình nằm trong giới hạn chấp nhận của
người nghe thì người nghe có thể hài lòng với mức âm
lượng trung bình thống nhất cho tất cả các chương trình,
họ không cần phải dùng điều khiển từ xa để điều chỉnh
âm lượng nữa
Phần còn lại của bài báo được tổ chức như sau, Phần II
trình bày thuật toán đo loudness theo ITU-R BS.1770-2
Trong Phần III, chúng tôi trình bày cách thức thu thập
mẫu đo Phần IV và Phần V là kết quả đo đạc thực
tế với Phần IV là kết quả đo trước khi chuẩn hóa và
Phần V trình bày kết quả sau khi chuẩn hóa loudness
Cuối cùng, Phần VI đưa ra một số kết luận sau khi khảo
sát
Hình 3 Chuẩn hóa mức đỉnh so với chuẩn hóa âm lượng [6].
%ӝOӑF.
%ӝOӑF.
%ӝOӑF.
%ӝOӑF.
%ӝOӑF 0HDQ6TXDUH
0HDQ6TXDUH 0HDQ6TXDUH 0HDQ6TXDUH 0HDQ6TXDUH *>
*Z
*&
*/6
*56
/RJ 'd/E' ӂ748Ҧ
; /
; 5
; &
; /6
; 56
< /
< 5
< &
< /6
< 56
= /
= 5
= &
= /6
= 56
Hình 4 Sơ đồ thuật toán đo audio loudness đa kênh [5].
II THUẬT TOÁN ĐO LOUDNESS THEO ITU-R
BS.1770-2 Thuật toán đo âm lượng được xây dựng tổng quát cho tín hiệu audio đa kênh (5.1 kênh) Sơ đồ khối trong Hình 4 trình bày kèm các nhãn ký hiệu theo các khối nhằm mô tả thứ tự xử lý của thuật toán Theo đó, có 5 kênh audio ở ngõ vào left (L), centre (C), right (R), left surround (LS) và right surround (RS), trường hợp chỉ gồm một kênh audio (mono) hoặc stereo thì tương ứng chỉ có ngõ vàoXL, hoặc/vàXR ở ngõ vào Kênh audio tần số thấp (Low frequency effect - LFE) được bỏ qua không đo trong giải thuật Giải thuật thực hiện qua bốn bước như sau:
Trọng số K áp dụng bộ lọc K-filter (còn gọi là pre-filter) hai tầng cho tín hiệu ngõ vào Tầng thứ nhất của bộ lọc pre-filter nâng hiệu ứng âm học vùng tần số cao Các hệ số bộ lọc dùng với tần số lấy mẫu (sampling rate) của tín hiệu audio là 48 kHz [5], với các tần số lấy mẫu khác thì các hệ số cần được tính toán và thiết kế lại Để đơn giản, tín hiệu audio lấy mẫu ở những tần số khác có thể lấy mẫu lại ở tần số 48 kHz và dùng các hệ số bộ lọc như khuyến cáo
Tầng thứ 2 của bộ lọcK-filter là bộ lọc thông cao (high-pass filter) Đường cong trọng số RLB của tầng này được xác định bởi bộ lọc bậc 2 với các
Trang 4hệ số cho trong [5, Table 2] Tương tự, các hệ số
này cũng được sử dụng ứng với tần số lấy mẫu của
tín hiệu audio là 48 kHz, và phải tính lại các hệ số
khi sử dụng với tần số lấy mẫu khác
kênh
Năng lượng (hoặc trung bình bình phương) của tín
hiệu ở ngõ vào bộ lọc trong một khoảng thời gian
T được tính bởi công thức sau:
zi= 1 T
T
0
vớiyilà tín hiệu ngõ vào đã được lọc từ bộ lọc
pre-filter ở Bước 1 vài ∈ I với I = [L, R, C, LS, RS]
là tập các kênh audio ngõ vào
• Bước 3: Tổng trọng số các kênh
Khi tính tổng trọng số các kênh, chúng ta dùng
trọng số lớn hơn cho các kênh surround và bỏ
qua kênh LFE Loudness theo đơn vịLKFS trong
khoảng thời gian T được định nghĩa bởi
LK = −0.691 + 10log10
i
Gizi (2)
vớiGi là các hệ số trọng số cho các kênh riêng
• Bước 4: Cơ chế đo gating
Cơ chế đo gating dùng block 400ms, hệ số chồng
lấp 75% Để đo loudness dùng cơ chế đo gating,
khoảng thời gian T được chia theo các khoảng
block chồng lấp (gọi là gating block là một khoảng
thời gian chứa các mẫu audio kế tiếp nhau có giá trị
Tg = 400ms) Hệ số chồng lấp (overlap) của mỗi
gating block là 75% của khoảng thời gian gating
block Năng lượng hoặc trung bình bình phương
của gating block thứj của kênh ngõ vào thứ i trong
khoảng T được tính bởi
zij = 1
Tg
T g j(Step+1)
T g jStep
0, 1, 2, , T −T g
T g Step
gating block thứj được định nghĩa bởi
Lj = −0.691 + 10log10
i
Gizij (4)
với ngưỡng gating, Γ, sẽ có một tập các gating
block ký hiệuJg= {j : lj > Γ}, nghĩa là tập các
gating block có loudness lớn hơn giá trịngưỡng
gating Γ Số lượng các thành phần trong Jg ký
Bảng I
Kênh Trọng số G i
Kênh trái (L) 1.0 (0 dB) Kênh phải (R) 1.0 (0 dB) Kênh trung tâm (C) 1.0 (0 dB) Kênh surround trái (LS) 1.41 (1.5 dB) Kênh surround phải (RS) 1.41 (1.5 dB)
hiệu là|Jg| Giá trịgated loudness, LKG, theo đơn vịLKFS đo trong khoảng T được định nghĩa:
LKG= −0.691 + 10log10
i
Gi
⎛
⎝ 1
|Jg|
J g
zij
⎞
⎠ (5) Lúc này, một quá trình xử lý hai bước được thực hiện để đo gating dựa trên giá trịngưỡng tuyệt đối
và tương đối Ngưỡng tương đối theo đơn vịLKFS được tính toán dựa trên ngưỡng tuyệt đốiΓa= −70 LKFS theo công thức sau:
Γr= −0.691 + 10log10
i
Gi
⎛
⎝ 1
Jg.
J g
zij
⎞
⎠ − 10 (6) với Jg = {j : lj > Γa} và Γa = −70 LKFS Giá trịgated loudness,LKG theo LKFS, đo dùng ngưỡngΓr được tính như sau:
LKG= −0.691 + 10log10
⎡
i
Gi
⎛
⎝ 1
|Jg|
J g
zij
⎞
⎠
⎤
⎦ , (7) trong đóJg= {j : lj > Γr}
Ở đây, đơn vịLKFS tương đương decibel, nghĩa là mức tín hiệu gia tăng 1 dB thì loudness gia tăng tương ứng 1 LKFS Một ví dụ minh họa cho kết quả khi thực hiện giải thuật là: nếu các ngõ vào left, center, hoặc right là tín hiệu sin 0 dBFS 1 kHz thì kết quả đo loudness là -3.01 LKFS
III PHƯƠNG PHÁP THU THẬP MẪU ĐO Các mẫu đo được lấy từ các phương thức truyền dẫn khác nhau: vệ tinh, mạng cáp, truyền hình mặt đất Các kênh được lấy mẫu bao gồm các kênh truyền hình của Đài truyền hình Việt Nam (VTV), các kênh truyền hình trong nước khác như: Công ty cổ phần truyền thông
đa phương tiện (VTC), Công ty truyền hình cáp Saigon Tourist (SCTV), và các kênh truyền hình nước ngoài,
ví dụ như BBC, KBS, Arirang, Australia Lấy mẫu cho
Trang 5cả truyền hình phát quảng bá analog và số Các mẫu
đo được thu thập và xử lý trong suốt thời gian từ tháng
04/2013-04/2014
A Cách thức lấy mẫu
1) Lấy mẫu theo thể loại chương trình phát sóng:
Các thể loại chương trình được lấy mẫu: chọn
một số chương trình điển hình sau: quảng cáo,
thời sự, phim truyện, gameshow, thể thao, ca nhạc,
thời tiết, phóng sự, tin tức và các thể loại khác
Thời lượng cho mỗi mẫu từ 2-3 phút Mỗi thể loại
chương trình lấy 4 đến 10 mẫu
2) Lấy mẫu theo kênh phát sóng: Thời lượng cho mỗi
mẫu là 3 phút Các mẫu được lấy từ các kênh ứng
với khoảng thời gian liên tiếp nhau để đánh giá
nhảy mức âm lượng khi chuyển kênh truyền hình
B Hệ thống lấy mẫu
1) Thu chương trình từ truyền hình quảng bá mặt
đất: Dùng card DVB-T Hauppauge
WinTV-HVR-1300 kết nối trực tiếp với anten truyền hình Yagi
UHF/VHF và máy vi tính thông qua cáp TV và
khe cắm Dùng phần mềm Win TV 7 để capture
chương trình từ các kênh phát sóng và ghi lại các
kênh chương trình, card có khả năng thu tín hiệu
truyền hình analog và DVB-T Mẫu được capture
là các dòng TS có định dạng MPEG-2 Sau đó
dùng phần mềm NxTSA tách dòng TS thành các
file video và audio có định dạng MPG, tiếp tục
dùng phần mềm chuyển đổi file audio định dạng
MPG thành file audio có định dạng WAV để đưa
vào xử lý (đo và chỉnh) loudness bằng phần mềm
Matlab
2) Thu chương trình từ vệ tinh: Dùng card DTA 140
để gắn vào máy tính và phần mềm DtGrabber+
để capture chương trình từ vệ tinh tại tổng khống
chế (Head-End) của VTV9 (Trung tâm truyền hình
Việt Nam tại TP Hồ Chí Minh
Dùng phần mềm NxTSA để tách luồng (Transport
Stream - TS) gồm nhiều kênh thành các dòng TS
của các kênh riêng lẻ Dùng phần mềm TOTAL
VIDEO CONVERTER chuyển đổi các file audio
có định dạng MPG của các kênh đó thành định
dạng WAV để xử lý
3) Thu chương trình từ mạng truyền hình cáp SCTV:
Dùng đầu thu Set-Top-Box (STB) A800 để thu
chương trình các kênh truyền hình trong nước
và nước ngoài từ hệ thống truyền hình cáp của
SCTV Các kênh capture là: VTV1, VTV2, VTV3,
VTV4, VTV6, Arirang, KBS World HD, BBC,
Australia Mẫu được lấy từ các kênh truyền hình
í70 í60 í50 í40 í30 í20 í10 0
VTV6í3105í0957
Thoi gian
Hình 6 Minh họa kết quả đo loudness với cửa sổ trượt 3s.
nêu trên Thời lượng mỗi mẫu từ 1 phút 30 giây đến 2 phút Thời gian lấy mẫu là ngẫu nhiên trong hai ngày (ngày 08 và 09/10/2013) Mẫu được lấy tiếp tục chuyển thành định dạng WAV để đo các thông số loudness
Để đo loudness và chuẩn hóa loudness, chúng tôi xây dựng một công cụ trong Matlab Thuật toán có thể đo và
xử lý file audio stereo 2.0, đo loudness, LRA, true-peak
và chuẩn hóa các thông số loudness và true-peak theo EBU-R 128 Để kiểm chứng sự tương thích của thuật toán, trước khi tiến hành đo các mẫu thực, chúng tôi tiến hành đo các file audio mẫu cung cấp từ trang web EBU trong [7], với sai số của các giá trịloundess, LRA
và dBTP trong giới hạn±0.1 , giới hạn chấp nhận của các máy đo tương thích với chuẩn EBU R128 Hình 5 trình bày quy trình thu thập và xử lý các mẫu đo, trước tiên dữ liệu có thể xuất phát từ: Mạng truyền hình vệ tinh, mặt đất hay truyền hình cáp Hệ thống thu thập dữ liệu bao gồm phần cứng và phần mềm để ghi lại các dòng chương trình dạng TS cho các xử lý về sau Tiếp theo dùng phần mềm chuyên dụng để tách riêng các dòng video và audio Các file audio dạng WAV sẽ được
đo và chuẩn hóa loudness riêng, sau đó ghép audio và video thành file hoàn chỉnh, lưu các file video đã chuẩn hóa các thông số loudness
IV KẾT QUẢ ĐO Trong phần này, chúng tôi sẽ trình bày các kết quả đo đạc trước khi chuẩn hóa Bắt đầu từ Hình 6, chúng tôi minh họa kết quả đo loudness của kênh VTV6, mẫu đo ngày 31/05/2013 với thời gian lấy mẫu bắt đầu lúc 9h57,
âm lượng tích hợp của file này là -14 LUFS, lớn hơn 9 LUFS so với khuyến nghịEBU R 128 là -23 LUFS Trong Hình 7, chúng tôi trình bày kết quả đo loudness trên cùng một kênh (kênh VTV3 của Đài Truyền hình
Trang 6PһWÿҩW
FiS
7RROÿRYj
FKXҭQKyD
ORXGQHVV 3KҫQPӅP
WiFKDXGLRYj
YLGHR
7KXWKұSOѭX
WUӳYjRKӋ
WKӕQJGzQJ76
3KҫQPӅP
JKpSDXGLRYj
YLGHR
/ѭXWUӳFiF ILOHÿmFKXҭQ KyDORXGQHVV
$XGLR
9LGHR
Hình 5 Quy trình thu thập và xử lý loudness dựa trên file.
í20
í15
í10
í5
0
Mau
Hình 7 Sự biến thiên loudness của các chương trình ca nhạc trên kênh
VTV3
Việt Nam) và trên cùng một chương trình (chương trình
ca nhạc), các mẫu đo được lấy vào tháng 04/2013 qua
hệ thống truyền hình số mặt đất DVB-T, thời gian của
mỗi mẫu là 2-3 phút Kết quả cho thấy mức âm lượng
của các chương trình ca nhạc có mức biến động lớn,
chênh lệch 10 LUFS giữa mẫu đo 1 và mẫu 2
Tiếp theo, chúng tôi khảo sát trên các kênh khác nhau
trong Hình 8, minh họa kết quả đo loudness của 3 kênh
VTV1, VTV2, VTV3 được lấy mẫu vào 04/2013 vời thời
lượng 3 phút trong các khoảng thời gian liên tiếp nhau
theo thứ tự (8h10-8h13, 8h13-8h16, 8h16-8h19) Điều
này tương tự như khi người xem truyền hình đang muốn
chuyển kênh chương trình từ kênh VTV1 và VTV2 hay
VTV3 Mức âm lượng chênh lệch là 17 LUFS, với mức
này người nghe/xem sẽ cảm nhận được rất rõ sự khác
biệt của âm lượng khi chuyển kênh, âm lượng có thể tự
nhiên tăng đột ngột, gây khó chịu cho người xem và họ
phải dùng volume control điều chỉnh lại mức âm lượng
Trong Hình 9, chúng tôi khảo sát ở các kênh khác
nhau giữa hai đài khác nhau Kết quả đo các kênh từ hệ
í35 í30 í25 í20 í15 í10 í5 0
Kenh
Loudness luc chuyen kenh chuong trinh
VTV1 (í17 LUFS)
VTV2 (í31 LUFS)
VTV3:í14 LUFS
Hình 8 Sự nhảy âm lượng lúc chuyển kênh chương trình VTV1 (8h10-8h13), VTV2 (8h13-8h16), VTV3 (8h16-8h19).
í30 í25 í20 í15 í10 í5 0
Mau do
Kenh SCTV4&13 Kenh VTC1&2
Hình 9 Loudness các kênh truyền hình cáp SCTV và kỹ thuật số VTC.
thống truyền hình kỹ thuật số VTC và truyền hình cáp SCTV Các kênh lấy mẫu với thời gian 1 phút vào tháng 12/2013 Kênh SCTV (SCTV4 và SCTV13), kênh VTC (VTC1 và VTC2) có sự chênh lệch âm lượng lớn nhất
Trang 71 2 3 4 5 6
í35
í30
í25
í20
í15
í10
í5
Mau do
The thao
Phim
Quang cao
Thoi su
Hình 10 Sự biến thiên âm lượng kênh VTV.
í35
í30
í25
í20
í15
í10
í5
Mau do
VTV3
Arirang
KBS
BBC
Australia
Hình 11 So sánh với các kênh nước ngoài.
14 LUFS, mức âm lượng các kênh không ổn định
Hình 10 trình bày sự biến động âm lượng được lấy
mẫu theo thể loại chương trình phát sóng (tin tức, phim
thời sự, thể thao ) của VTV Kết quả cho thấy âm
lượng có độ vênh rất lớn, các mẫu có thời gian từ 2-3
phút, lấy mẫu vào tháng 04/2013, thời gian lấy mẫu là
các giờ trong ngày từ 9h-16h Các chương trình quảng
cáo có mức âm lượng rất lớn so với các chương trình
khác, cao hơn 10-15 LUFS
Hình 11 so sánh âm lượng kênh VTV3 so với các kênh
nước ngoài lấy mẫu vào tháng 10/2013 Thời gian lấy
mẫu là 1 phút 30 giây Kênh VTV3 có sự biến thiên âm
lượng rất lớn từ [-10 LUFS, -33 LUFS], kênh BBC của
Anh có mức âm lượng dao động ổn định quanh mức -18
LUFS, kênh Australia dao động khoảng [-23 LUFS, -19
LUFS], kênh Arirang (kênh ca nhạc Hàn Quốc) mức dao
động [-21 LUFS, -18 LUFS], kênh KBS HD World (Hàn
Quốc) mức dao động [-21 LUFS, -18 LUFS] Mức biến
động âm lượng của các kênh BBC là ổn định, do Anh
và phần lớn các nước Châu Âu đã chấp thuận khuyến
nghịEBU R128, với chuẩn hóa mức âm lượng mục tiêu
là -23 LUFS [8] từ 2012, và Úc chấp thuận tiêu chuẩn ITU-R BS.1770 với mức âm lượng chuẩn hóa mục tiêu
là -24 LKFS [8] từ 2012 Ở Hàn Quốc, một số giải pháp điều chỉnh loudness tự động được áp dụng để cân bằng mức loudness cho các chương trình phát sóng truyền hình, ví dụ như IPTV [9] Các giá trịđo được từ STB đặt tại Việt Nam của kênh nước ngoài có chênh lệch
từ 2-3 LUFS so với giá trịtrung bình -23 LUFS của tiêu chuẩn EBU R128, đây là kết quả đo sau khi tín hiệu truyền qua đường vệ tinh, rồi phân phối lại qua
hệ thống truyền hình cáp SCTV, và sau đó giải mã lại
từ STB nên mức tín hiệu có thay đổi, tuy nhiên mức loudness trung bình giữa các kênh ít biến động, nằm trong giới hạn cho phép, với sự thay đổi từ 2-3 LUFS người nghe khó cảm nhận được sự biến động âm lượng
V KẾT QUẢ CHUẨN HÓA ÂM LƯỢNG Việc chuẩn hóa âm lượng nhằm đưa mức âm lượng trung bình thống nhất về một mức chung, sẽ làm giảm
sự khác biệt âm lượng của các thể loại trong cùng một kênh chương trình (ví dụ chương trình quảng cáo, thời
sự, phim) hay giữa các kênh chương trình với nhau (ví dụ VTV1, VTV2, HTV7) giúp tạo ra sự hài hòa âm thanh cho người nghe/xem truyền hình Người xem không cần phải dùng thiết bịđiều khiển âm lượng (volume control) khi xem TV Chúng tôi đã thực nghiệm chuẩn hóa loudness theo các yêu cầu của khuyến nghịEBU R128, với thông số loudness đưa về mức -23 LUFS, giới hạn true-peak là nhỏ hơn hoặc bằng -1 dBTP và giá trị LRA tùy thuộc vào nền tảng phân phối và môi trường người nghe Kết quả sau khi chuẩn hóa các thông số loudness, xem Hình 12 và Bảng II, không còn sự nhảy vọt âm lượng đột ngột khi chuyển kênh chương trình, các mẫu trước và sau khi chuẩn hóa âm lượng được cho một số đối tượng nghe trong điều kiện phòng thông thường không phát hiện sự nhảy vọt âm lượng nào sau khi chuẩn hóa loudness
VI KẾT LUẬN Bài báo này đã trình bày hiện trạng âm lượng trong sản xuất, phát sóng tại VTV là đơn vịmà nhóm thực hiện có cơ hội khảo sát Các đài khác, ví dụ như VTC
và SCTV, nhóm chỉ thực hiện việc đo các chương trình thông qua thu sóng từ các hệ thống phát sóng Một số Đài truyền hình khác mà nhóm thực hiện có cơ hội tìm hiểu và có thông tin như: HTV (Đài Tp.HCM), Vĩnh Long, Trà Vinh, Sóc Trăng, và Tây Ninh, thì vấn đề kiểm soát âm lượng cũng chưa được các Đài quan tâm, điều này dẫn đến trên địa bàn Tp Hồ Chí Minh khi người dân thu sóng từ các kênh sóng của các đài khác