High Five Mastering

Masteringové štúdio

Čo je to Dithering?

Dithering je úmyselné pridanie špeciálneho audio šumu do zvuku aby sa minimalizovali chyby pri bitovom downgradingu. Resp. aby sme pri konverzii neprišli o informácie ktoré by sa inak mohli stratiť.

Čo to znamená? Povedzme že ste nahrali a zmixovali kapelu pri rozlíšení 44.1kHz/24bitov. Na to aby ste danú nahrávku mohli napáliť na audio CD potrebujete rozlíšenie 44.1kHz/16bitov. Čiže 8 bitov sa musíte vzdať. No a ak neviete prečo nenahrať kapelu rovno v 16bitoch, tak v skratke: čím väčšie rozlíšenie, tým lepší zvuk. Čo sa bitov týka, tak čím viac bitov, tým viac „headroomu“, alebo inak povedané aj dynamiky. V dnešnej dobe sa nahrávajú kapely aj na 192kHz/32bit – ale na to treba samozrejme veľmi drahé vybavenie, ktoré je málokedy po ruke.

Na to aby sme mohli lepšie pochopiť tento proces musíme pochopiť základy. Za prvé, v digitálnom audiu sa všetko prerátava na čísla, ktoré potom predstavujú digitálny obraz toho elektrického – analógového signálu. Vývoj toho ako zachytiť v digitálnej sfére audio signál je samozrejme pridlhý na to aby som sa tu o ňom teraz rozpisoval. Čo je pre nás ale dôležité je, že v určitom momente vývoja vznikla takzvaná Nyquistova veta (občas nazývaná ako teória Nyquist-Shannona). Táto hovorí, že na to aby ste mohli perfektne zachytiť a zreprodukovať audio signál v digitálnej doméne, potrebujete ho nasamplovat minimálne dvojnásobnou hodnotou aká je jeho najvyššia frekvencia. No a keďže ľudské ucho počuje (v teórii) od 20Hz do 20kHz, kde 20Hz je najhlbší tón čo ako ľudia počujeme, a 20kHz ten najvyšší, sampling musí prebiehať v minimálnom rozlíšení 40 000Hz, alebo inak 40kHz. Prečo je dnes ale dané, že Audio CD formát je 44.1kHz je ozaj na dlhé vysvetľovanie. V skratke snáď len toľko že za to nesie „vinu“ firma Sony, ktorá ešte v začiatkoch CDčok používala video mašiny na nahrávanie digitálneho audia, a ktorých technológia vyhrala nad technológiou Philips, ktorý navrhovali používať skôr 44kHz. Ak vás daná problematika zaujíma, Google vám isto odhalí viac. Vráťme sa radšej k nášmu problému.

Takže na to aby sme sa vzdali 8 bitov a zredukovali našu nahrávku z 24 bitov na 16, môžeme použiť dva spôsoby. Buď excesívne bity jednoducho vymažeme (čomu sa v angličtine hovorí Truncation), alebo môžme excesívne bity zaokrúhliť k najbližšej hodnote. Obe tieto metódy žiaľ ale majú na svedomí to, že ich použitím prichádza k vytvoreniu chýb, čo spôsobuje zkreslenie, ktoré je samozrejme počuť. Aby som sa vyhol grafickej názornosti pokúsim sa to vysvetliť na nasledujúcom príklade:

Povedzme že náš audio signál (napr. sínusová vlna generovaná oscilátorom) sa skladá z týchto hodnôt:

1         2         3         4         5         6         7         8         9

Ak by som chcel signál zmenšiť o 33.3% (čo zodpovedá cca tretine keďže chcem ísť z 24 na 16bitov)

Toto sú moje nové hodnoty:

0.67   1.33     2      2.67     3.34      4      4.67    5.34      6

Keby som z nich vymazal nadbitocne bity boli by moje hodnoty:

0          1        2        2          3         4         4        5         6

A zaokrúhlené by boli moje hodnoty zas nasledovné:

1          1        2        3          3         4         5        5         6

Z tohto jednoduchého príkladu je jasné, že tieto hodnoty sú dosť odlišné, a teda zvuk takéhoto audio signálu bude v každom príprade tiež iný. Na to aby sa toto nedialo žiaľ nefunguje žiadny algoritmus, ktorý by mohol dané hodnoty rozumne zaokrúhľovať – niektoré čísla nebudú nikdy sedieť a chyby sa budú opakovať, čo bude samozrejme počuť. A preto je tu dither. Dither je v podstate audio signál, ktorý náhodne generuje rôzne typy šumov a pridáva ich k audio signálu a tým tie chyby minimalizuje. Pozor ale, ani dither úplne neodstraňuje chyby! Ich výskyt ale už nie je predpovedateľný, čo znie ľudskému uchu lahodnejšie a počet chýb je omnoho menší.

V masteringu sa používajú rôzne typy Ditherov. Trojuholníkový, štvorcový, alebo napr. Tri rôzne POW-r módy. Trojuholníkový vzor pridáva najmenej šumu, a je považovaný za „najbezpečnejší“. Štvorcový užíva najmenej šumu, ale zas „pustí“ viac chýb. No a POW-r znejú väčšinou najlepšie, lebo používajú šumu viac – čím sa občas stáva že ten šum môže byť vo veľmi tichých častiach nahrávky počuť – ale vzhľadom na „loudness war“, je toto dnes ale málokedy problém. Pravidlom ale je, že na všetko funguje vždy najlepšie niečo iné.