Úgy tűnik, a nézők a képminőséggel szemben sokkal elnézőbbek. Üvölt a reklám, nem érthető a filmben a párbeszéd, a csatornák között nagy a hangerőkülönbség. Ezek a legjellemzőbb panaszok, de mi lehet a megoldás...
A megoldást pedig sokáig szinte kizárólag az állandó hangerő állítgatás jelentette. (Szerencsére, a tévékészülékhez már évtizedek óta távvezérlő is tartozik.) A hangerőszabályzó gombok a távvezérlő leggyakrabban használt gombjai. Nem meglepő, hogy ezeknek a gomboknak a felirata kopik le először, illetve hogy a távvezérlők cseréje is legtöbbször e nyomógombok meghibásodása miatt válik szükségessé. A hangosságszabályzás bevezetése a problémák jelentős csökkenését eredményezte, jóllehet teljes megszűnésüktől még messze vagyunk.
Hangosságugrások
A hangosság hibák csatornán belüli, és csatornák közti problémákra oszthatók.
A csatornán belüli hangosságugrások elsődleges forrása az agyonkomprimált reklámok és műsor-előzetesek. A figyelemfelkeltés módszere a reklámok és promók esetében is azonos; hangosan –, hogy mindenki odafigyeljen, – és jól érthetően igyekeznek felhívni a nézők figyelmét. Elmondható, hogy az elmúlt évtizedekben a spotok több, mint 99 százalékban agyon voltak komprimálva, csúcs-hangosság viszonyuk minimális volt. Az évtizedeken keresztül alkalmazott analóg vagy digitális csúcsnormalizált munkafolyamat következtében, az igen kicsi csúcs-hangosság viszonyú spotok hangossága zavaró módon kiugrott az őket közrefogó, normális dinamikai arányokkal rendelkező műsorrészek közül (1. ábra).
A reklámok, műsor-előzetesek hangossága sok esetben egyszerű szabályokkal, illetve odafigyeléssel csúcsmérő műszerek használata esetén is korrigálható lenne. Ugyanis az igen szűk dinamika miatt a spot effektív és csúcsszintje szorosan összekapcsolódik. Emiatt a csúcsszint megfelelő csökkentésével, jó közelítéssel helyére kerül a hangosság. Ezt a gyakorlatot rögzítette az Angliában már sok éve bevezetett BCAP code, mely előírta, hogy a reklámok QPPM szintje 6 dB-vel kisebb legyen a műsorjel maximumánál (0 dB QPPM). A problémát az jelenti, hogy a műsor lebonyolítás egyre automatizáltabb módon történik, és emiatt nincs, aki folyamatosan felügyelné az adóvonalakra kerülő jelfolyamokat. Hangosságra történő normalizálás esetén a nem megfelelő hangosságú spot-ok belesimulnak a műsorfolyamba, jóllehet a szűk dinamika, és az ehhez tartozó tranziensek hiánya miatt laposan fognak szólni.
1. ábra Az eltérő csúcs-hangosság viszonyú blokkok határán analóg (a) és digitális (b) csúcsméréssel történő szintezés esetén is hangosság ugrás keletkezik. Fülre történő keverés, vagy hangosságmérő műszer használata mellett a hangosság hibák minimalizálhatók (c)
Meglepő, mégis úgy tűnik, hogy a reklámok megrendelői nem néznek tévét. Ha néznének, akkor tisztában lennének azzal, hogy az üvöltő hirdetések kontraproduktívak, nem fejtik ki hatásukat. Megfeledkeznek arról, hogy a hangerőszabályzás a néző kezében van: amint jön a reklám szignál, a néző nyúl a távvezérlőért, lehalkítja, némítja a készüléket, vagy csatornát vált. Évtizedeken keresztül idegesítették a hirdetők a nézőket a tolakodó reklámokkal, míg néhány éve valaki rá jött, hogy egy normál hangosságú, vagy szándékosan halk reklám sokkal hatékonyabb lehet, hiszen nem ösztönöz némításra, csatornaváltásra. „Mi történt? Miért hallgatott el? ” A halk reklámra felkapja fejét a néző, odafordul a készülék felé, ha addig csak hallgatta a műsort.
A csatornán belüli hangosság ugrások azonban nem kizárólag a spotok miatt keletkeznek. Csúcsnormalizálás esetén a hosszabb műsorelemeknél is gyakran tapasztalhatók a hangosság különbségek, hiszen az egymást követő műsorok csúcs-hangosság viszonya – a műfajtól, művészeti koncepciótól függően – jelentősen különbözhet.
A televíziózás másik hangosságproblémája a csatornák közti hangosságkülönbségekből származik. Az eltérő szintezési ajánlások és különböző típusú kivezérlésmérők használatának következtében, a csatornák programhangossága között gyakran nagy, akár 10-15 dB-es különbségek is tapasztalhatók (2. ábra). Az ekkora eltérések már önmagukban is igen zavaróak. Figyelembe kell azonban venni, hogy normális dinamika esetén a műsorok rövididejű hangossága jelentősen eltérhet a programhangosságtól. Emiatt a csatornaváltáskor a programhangosság különbségnél lényegesen nagyobb hangosságugrások is előfordulhatnak. Egységes hangosság célérték bevezetésével a csatornaváltáskor fellépő hangosságugrások teljesen megszűnni nem fognak, várható viszont, hogy mértékük jelentős mértékben csökken.
2. ábra Tévéadások digitális (piros) és analóg (sárga) csúcs-, illetve hangosságszintjei (kék)
Televíziós hangosság célértékek
Az európai országokban bevezetett szabályzások jellemzően az EBU R128 számú ajánláson alapulnak, mely a műsorkészítésre és a sugárzásra is egységesen -23 LUFS hangosság célértéket ír elő. Rögzített műsorok esetében –, melyeknél van mód utólagos hangosságkorrekcióra – a megengedett tűrés ±0,5 LU. Az élő közvetítések esetében – tekintettel az előre nem látható történésekre – a tűrés ±1 LU. Az ajánlás a hangosság célértéken túl rögzíti a megengedett legnagyobb valódi csúcsértéket is, mely lineáris PCM rendszer esetén -1 dBTP, veszteséges hangtömörítő algoritmus használata mellett -3 dBTP. A műsorgyártással, műsorterjesztéssel kapcsolatos részletes információk a 3341, 3342, 3343, 3344 számú EBU Tech útmutatókban, illetve az R128S1 dokumentumban találhatók.
Az amerikai ATSC A/85-ös előírás által definiált célérték -24 LUFS ±2 LU. Ausztráliában szintén -24 LUFS a célérték, de a tűrés csak ±1 LU. (Hasonlóan az R128-hoz, ez utóbbi ajánlások is az ITU-R BS. 1770-es ajánláson alapulnak.)
Fizikai normalizálás vagy meta-adatok?
Normalizálni fizikailag és meta-adatok segítségével is lehet. Az előbbi esetben effektíve módosításra kerülnek a hangminták, míg az utóbbinál szintleíró információt kell az érintetlenül hagyott hangjelhez mellékelni, a szintezést pedig a meta-adatok felhasználásával a lejátszó-eszköz végzi majd el. Az EBU a fizikai normalizálást részesíti előnyben, mivel az biztonságosabb. Ha a műsorjel hangossága már a jelút elején megfelel a célértéknek, akkor az erősítést nem tartalmazó lánc végén is annyi lesz. A meta-adattal történő normalizálás rugalmasabb, ugyanakkor fennáll annak veszélye, hogy a meta-adatok a lánc valamely pontján elvesznek, vagy hibásan értelmeződnek, és emiatt a hangosság nem lesz megfelelő.
A meta-adattal történő szabályzást alkalmazó rendszerek tipikus példája a Dolby Digital (AC-3), melynél a DialNorm paraméter írja le a hangosság értékét. A DialNorm eredetileg dialógushangosságot ad meg, de az átlag tévéműsorok esetében, melyeknél a beszédhangosság a programhangossággal azonos érékű, jól használható a programhangosság megadására. A célértéktől eltérő hangosságú műsorjel esetén a Dolby dekódoló a célérték és a Dialnorm érték különbségének megfelelő szintkorrekcióval dekódolja a jelet, ami így már helyes hangossággal fog megszólalni. (A korszerű adatredukciós algoritmusok – AAC, AC-4, stb. – mindegyike lehetővé teszi a meta-adatok történő normalizálás alkalmazását.)
Beszédérthetőség és a komfortzóna
Televíziózásnál a beszédérthetőség meghatározó. A néző igyekszik olyan hangerőt beállítani, mely mellett a halkabb dialógus részletek jól érthetőek, de a műsor hangosabb részei sem zavaróak. Kísérleti tapasztalatok szerint egy televízió program hangossága akkor megfelelő, ha a rövididejű hangosság (SL) a programhangossághoz viszonyított +3LU és -5…-6LU szélességű tartományban mozog (3. ábra). A két határértékből adódó kb. 8-9LU hangosságátfogáson (LRA) belül változó hangosság esetén a nézők általában nem akarják változtatni a hangerőt. A dialógus hangosságátfogása jellemzően szűkebb a komfortzónánál.
3. ábra Optimális esetben a televízió-műsorok rövididejű hangossága a célhangosság közrefogó komfortzónában mozog
Eredmények és problémák
A hangosságszabályzás bevezetése óta a televízió műsorok hangossága terén jelentős javulás tapasztalható. A szubjektív hangosság kiegyenlítettebb, egy-egy csatornát hosszabb idei nézve, a nézőnek viszonylag ritkán kell a hangerőt módosítania.
Csatornák közti hangosságkülönbségek azonban hangosságnormalizált adáslebonyolítás esetén is felléphetnek. Tapasztalatok szerint forgalomban vannak olyan, – nem megfelelően tervezett – vevőkészülékek, melyek a különböző kódolású (AC-3, AAC, MPEG L2) audió jelfolyamokat akár több dB-lel eltérő kimeneti jelszinttel dekódolják. További hibalehetőség, ha a jelfolyammal továbbított meta-adat (pl. AC-3 DialNorm érték) nem felel meg a műsorjel hangosságának, esetleg a dekóder figyelmen kívül hagyja a műsorszolgáltató által továbbított meta-adatot.
Mozifilmek és showműsorok problémái
A nagydinamikájú mozifilmek televízióban történő sugárzása több szempontból is kritikus.
Míg a tévés produkciók esetében a programhangosság és a dialógushangosság általában jó közelítéssel megegyezik, addig a mozifilmeknél a dialógushangosság jellemzően több dB-vel az átlaghangosság alatt van. A néző a hangerőt mindig a beszédérthetőségnek megfelelően állítja be. Emiatt a mozifilmeket megszakító, hangosságnormalizált reklámok túl hangosnak fognak hatni, jóllehet, korrektül vannak szintezve (4. ábra). Hasonló probléma jelentkezhet showműsorok közvetítése esetében is. A dialógusszint, közönséghangosság, effekthangosság tévécsatornánként más és más. Ez azt jelenti, hogy a dialógushangosság és programhangosság ennél a műsortípusnál sem azonos, tehát két showműsor közti átkapcsoláskor – nagy valószínűséggel – korrigálni kell a hangerőt.
A mozifilmekkel kapcsolatos másik nehézség a sourround-sztereó downmixelésből adódik. Egy hangosságnormalizált 5.1 vagy 7.1-es filmből készült sztereó változat hangossága akár 4,5 dB-lel is eltérhet a térhang változat hangosságától. Sztereósításkor a középső és hátsó csatornák jelét szintmódosítást követően a bal és jobb csatornákéhoz adják. (Bizonyos rendszerekben fázismódosítás is történik.) A sztereó végtermék kialakuló hangossága a térhang felvétel csatornahasználatától, a sztereósításkor alkalmazott szintezési együtthatóktól, és az összegzési módszertől függ. A downmixelésből származó szinteltolódás valósidejű sztereósítást végző kábeltévé, és műhold szolgáltatóknál fordul elő.
4. ábra. Ha a film dialógus és integrált hangossága (DL, ill. PL) eltérő, a reklámoké viszont azonos, programhangosság szerint történő normalizálás esetén hangosságugrás keletkezik
Nagydinamikájú filmek televíziós sugárzásra való alkalmassá tétele gyakran komoly hangmérnöki kihívást jelent, ugyanis a surround filmhang dinamikáját úgy kell sztereósítani, illetve tévés dinamikára szűkíteni, hogy az effektek hatása és a beszédérthetőség is megmaradjon. Ezt különösen nehéz a nagy beszéddinamikájú filmek, mint pl. a Titanic, esetében megvalósítani.
Az intelligens downmixelésre több módszert is kidolgoztak. Példaként a HIPFLix Clarity algoritmust, illetve a 2015-ös IBC újítási díjával jutalmazott Dynapt eljárást említjük.
Hazai szabályzás
2012. óta a televízióknak idehaza is hangosságnormalizálva kell műsoraikat a nézőkhöz eljuttaniuk. Az NMHH szúrópróbaszerűen ellenőrzi, hogy az egyes szolgáltatók műsorfolyamai megfelelnek-e a hazai előírásnak, mely szerint az egymást követő műsorrészek (filmrészlet, reklámblokk, műsorelőzetes, stb.) átlagos hangossága legfeljebb 3 dB-vel térhet el egymástól. A szabályt megsértők pénzbírságra számíthatnak. A Médiatörvényhez kapcsolódó előírás az EBU előírásnál lazább, pl. nem rögzíti a hangosság abszolút szintjét. Emiatt az egyes csatornák között jelentős hangosságkülönbségek lehetnek. Szerencsére a televízió társaságok igyekszenek az EBU előírás szerinti -23 LUFS szinten sugározni.
(folytatjuk)