Zapas dynamiki w cyfrowym świecie
Zapas dynamiki w cyfrowym świecie

Większość z nas chce, by jego utwory brzmiały głośno, ale co się stanie, jeśli sygnał będzie zbyt duży? W artykule wyjaśniamy pojęcie cyfrowego zapasu dynamiki (digital headroom).

Technologia
2012-02-04

Idea cyfrowego zapasu dynamiki istnieje w świadomości współczesnych producentów muzycznych. Większość z nas z grubsza wie, że chodzi tu o zostawienie przestrzeni na dźwięki o większym poziomie głośności, a nie o zwiększanie poziomu średniego za wszelka cenę. Ale wciąż pozostaje sporo niejasności. Czy wskazania poziomu maksymalnego (peak) rzeczywiście mają jakieś znaczenie? Czy można dopuścić do wystąpienia przesterowania w kanałach? Jak należy ustawić poziom sygnału na wyjściu? W tym artykule przyjrzymy się bliżej tej problematyce.

Mówiąc o zapasie dynamiki w świecie cyfrowego dźwięku musimy brać pod uwagę dwa jego aspekty: nagrywanie i miksowanie. Rejestracja jest stosunkowo prosta - chodzi o przeniesienie analogowych sygnałów do cyfrowej domeny oprogramowania DAW w postaci plików. Miks natomiast nie jest jedynie zmieszaniem ze sobą zarejestrowanych sygnałów. Wielu producentów muzyki ogólnie nazywanej elektroniczną traktuje miks, jako odrębną fazę pracy nad utworem, używając wieloetapowego sumowania grup sygnałów i aplikując różnego typu efekty. Wszystko to wiąże się ze stosowaniem szeregu technik, w przypadku których musimy wciąż pamiętać o zachowaniu optymalnego zapasu dynamiki, który z kolei ma niebagatelny wpływ na finalny efekt naszej pracy. Zobaczmy więc, co się dzieje z dźwiękiem od chwili pojawienia się poszczególnych elementów składowych w naszym oprogramowaniu DAW i jak zapas dynamiki oddziałuje na całą produkcję.

Rejestracja

Zapas dynamiki ma znaczenie już od momentu dokonania pierwszych nagrań w ramach każdej nowej sesji. Aby zrozumieć, co się kryje za pojęciem cyfrowego zapasu dynamiki, musimy jednak wrócić do czasów zapisu analogowego. Choć obecnie zdecydowana większość nagrań odbywa się z wykorzystaniem rejestracji cyfrowej, to wciąż wiele reguł obowiązujących w czasach analogowych znajduje praktyczne zastosowanie. Podczas zapisu na taśmę bardzo ważne było ustawienie optymalnej czułości toru sygnałowego, które miało bezpośrednie przełożenie na zwiększenie odstępu sygnału użytecznego od szumów. Jeśli ścieżka została nagrana zbyt cicho, konieczne było zwiększenie jej głośności na etapie miksu całościowego materiału. Dokonując tego zwiększało się nie tylko poziom sygnału użytecznego, ale także poziom szumów nośnika, w tym przypadku taśmy analogowej. W nagraniach wielośladowych skumulowany poziom szumów z poszczególnych ścieżek wpływał negatywnie na ogólny odstęp zmiksowanego materiału od szumów.

Zobaczmy teraz, jakie to ma przełożenie na nagrania w domenie cyfrowej. Ogólnie rzecz biorąc kluczowymi czynnikami, które należy brać pod uwagę przy nagraniach cyfrowych są: uzyskanie jak największego odstępu między sygnałem szumów i sygnałem użytecznym, jak najmniejszej liczby błędów kwantyzacji i jak najwierniejszego odwzorowania kształtu oryginalnego przebiegu analogowego. O ile zapis analogowy na taśmie magnetycznej dzięki swoistej kompresji toru sygnałowego i nośnika dopuszcza chwilowe przekroczenia poziomu nominalnego, o tyle zapis w domenie cyfrowej nie pozwala na jakikolwiek margines, jeśli chodzi o przekroczenie określonych poziomów. Każdemu zwiększeniu poziomu sygnału na wejściu przetwornika analogowo-cyfrowego powyżej poziomu nominalnego towarzyszy wystąpienie bardzo niekorzystnie brzmiącego przesterowania cyfrowego. Ponieważ maksymalny poziom cyfrowej fali zawsze wynosi 1, każdy sygnał, którego poziom będzie większy zostanie ograniczony (obcięty) do poziomu 1. Fala zostaje silnie zniekształcona i w zależności od czasu wystąpienia zbyt wysokiego poziomu usłyszymy krótki trzask lub nieprzyjemny zgrzyt towarzyszący przesterowaniu cyfrowemu.

W tym miejscu pojawia się istotna przewaga nagrań dokonywanych cyfrowo z 24-bitową rozdzielczością nad nagraniami 16-bitowymi, który to format został zdefiniowany standardem Red Book używanym przy tworzeniu płyt CD audio. Choć pliki nagrane 24-bitowo mają większy rozmiar niż pliki 16-bitowe, pozwalają uzyskać lepszą jakość dzięki uniknięciu problemu przesterowania w domenie cyfrowej. Zapisując dźwięk w formacie 24 bitów możemy bez problemu uzyskać zakres dynamiki i dokładność zapisu 16-bitowego, a jednocześnie utrzymać na tyle niski poziom sygnału, by zabezpieczyć się przed występowaniem przesterowań. Mówiąc ogólnie, utrzymanie poziomu średniego rzędu -18 dBFS przy poziomie szczytowym nie większym niż -6 dBFS jest najbardziej optymalnym ustawieniem czułości w przypadku nagrań 24-bitowych. Oczywiście, w niektórych przypadkach ograniczeniem może być dynamika przedwzmacniaczy lub zakres dynamiki samego źródła sygnału, ale w takich sytuacjach dość szybko dojdziesz do optymalnych rezultatów metodą prób i błędów, pamiętając o przytoczonej wyżej regule.

Miksowanie

Wśród wielu pytań związanych z dynamiką i zapasem dynamiki jedno powtarza się najczęściej: „czy wskazania poziomu szczytowego w programach DAW mają znaczenie i czy są one miarodajne?”. Pytanie może wyglądać na banalne, ale odpowiedź już taka nie jest. W rzeczywistości można podać wiele różnych odpowiedzi i każda będzie prawdziwa w zależności od tego, z jakimi wskaźnikami mamy do czynienia. Na wstępie musimy podzielić ścieżkę sygnałową w naszym DAW na trzy części. Załóżmy, że źródłem sygnału będzie sygnał audio lub wirtualny instrument. Większość programów DAW przetwarza sygnał audio za pośrednictwem bloków o podobnej strukturze. Na początku znajdują się efekty w każdym torze wejściowym włączone w trybie insertowym (efekty w trybie wysyłkowym działają na podobnej zasadzie, ale tor przesyłania sygnału jest nieco bardziej złożony). Następnie sygnał wyjściowy z każdego kanału trafia na pojedyncze wyjście monofoniczne, stereofoniczne lub wielokanałowe (np. w trybie surround). Na samym końcu przez tłumik Master sygnał kierowany jest na wyjście, którym jest przetwornik cyfrowo-analogowy lub plik audio (w zależności od tego, czy odtwarzamy zmiksowany materiał czy zgrywamy go do postaci finalnej). Przyjrzyjmy się teraz tym trzem różnym etapom przetwarzania i zastanówmy się, w jaki sposób każdy z nich oddziałuje na poziom sygnału i brzmienie.

Łamanie reguł

Zapewne pierwsze pytanie, jakie przyjdzie Ci do głowy podczas rozpatrywania pryncypiów czystego miksu i cyfrowego zapasu dynamiki to: „a co się stanie, jeśli złamię reguły?”. Jeśli przeczytałeś ten artykuł to wiesz, że przesterowanie na drodze cyfrowej w oprogramowaniu DAW możesz otrzymać na wejściu lub na wyjściu.

Zazwyczaj cyfrowe przesterowanie nie jest zbyt ciekawe brzmieniowo i jeśli chcesz go użyć, musisz to zrobić z dużym wyczuciem. Jednak zastosowane z umiarem w którejś części utworu lub jako efekt może zabrzmieć naprawdę sugestywnie. Oczywiście, możesz też uznać, że trzeba iść na całość i zdecydowanie przesterować sygnał na wyjściu, ale nie ponosimy żadnej odpowiedzialności za to, jak zareagują na taki trik Twoi słuchacze...

Wprawdzie skupiamy się tu głównie na oprogramowaniu audio, ale te same zasady odnoszą się też do świata cyfrowego sprzętu. Większość urządzeń działa jednak w oparciu o stałoprzecinkowe obliczenia wewnętrzne, zatem przesterowania w poszczególnych sekcjach toru przetwarzania mogą się zdarzyć. I tu ciekawostka - niektóre z najbardziej efektownych brzmień, które można usłyszeć w nagraniach z gatunków industrial i techno wzięły się z przesterowania cyfrowych urządzeń na wejściach i wyjściach! Aby zachować lepszą kontrole nad cyfrowymi zniekształceniami warto wziąć pod uwagę użycie specjalistycznego narzędzia, takiego jak wtyczka Bitcrusher pochodząca z sekwencera Apple Logic. Ten niedoceniony mały efekt oferuje znakomicie brzmiące cyfrowe przesterowania, które uzyskuje się dzięki zastosowaniu niezależnej od siebie redukcji bitowej i redukcji częstotliwości próbkowania. Trzy tryby pracy modułu kształtowania przebiegu pozwalają w specyficzny sposób deformować go, co pozwala otrzymać bardzo ciekawe efekty o różnej intensywności, z możliwością ich odstrojenia oraz automatyzacji wybranych parametrów.

Decybele w zapasie

Najlepszym rozwiązaniem jest myślenie o poziomach na wszystkich trzech wspomnianych etapach w kolejności odwrotnej, głównie dlatego, że w przypadku toru wyjściowego nie można pozwolić na przekroczenie poziomu maksymalnego. Załóżmy, że zgrywamy całość do postaci pliku WAV. Bez względu na przyjętą finalną rozdzielczość bitową poziom sygnału wyjściowego nie może być większy, niż 0 dBFS. Każdy sygnał powyżej tego poziomu spowoduje obcięcie szczytów i wystąpienie cyfrowego przesterowania. Podobnie jest w przypadku wyjścia z interfejsu audio, w którym poziom wyjściowy nie będzie nigdy większy niż 0 dBFS. Każdy sygnał przekraczający ten próg zostanie obcięty. Choć z początku może nie być to aż takie oczywiste, ale jeśli pojawi się sygnał większy od 0 dBFS bardzo szybko stanie się dla Ciebie jasne, dlaczego jest to tak istotne.

Zobacz także test wideo:
Modal SKULPTsynth SE - 4-głosowy syntezator cyfrowy
Modal SKULPTsynth SE - 4-głosowy syntezator cyfrowy
Modal SKULPTsynth SE to niedrogi, funkcjonalny i oryginalnie brzmiący syntezator należący do grupy budżetowych mini-instrumentów, doskonale sprawdzających się w warunkach studyjnych i koncertowych.

Niektórzy producenci decydują się na włączenie na wyjściu toru sygnałowego master ogranicznika (limitera) działającego w trybie brickwall i ustawionego na poziom ograniczania 0 dB. Chcą się tą metodą zabezpieczyć przed wystąpieniem problemów ze zbyt dużym sygnałem. Naszym zdaniem lepszą metodą jest zostawienie kilku decybeli zapasu, co pozwoli na efektywniejsze wykorzystanie limitera na etapie masteringu materiału. Wprawdzie limiter na wyjściu sprawia, że sygnał nie ulegnie przesterowaniu, ale jednocześnie wpływa na brzmienie lub powoduje spłaszczenie dynamiki Twoich ścieżek. Jedynym wyjątkiem jest w tym przypadku gra na żywo. Skuteczny, szybko działający i neutralnie brzmiący limiter na wyjściu w takich właśnie sytuacjach sprawdza się doskonale.

Sumowanie

Etap sumowania sygnałów w Twoim programie DAW jest tym miejscem, gdzie odbywa się szereg złożonych procesów i dlatego większość współczesnych programów tego typu bazuje na 32-bitowych wewnętrznych obliczeniach zmiennoprzecinkowych. Nie mamy zbyt wiele miejsca, by omówić szczegółowo, na czym polegają działania zmiennoprzecinkowe, ale wystarczy zapamiętać, że ich dokładność i rozdzielczość w przypadku przetwarzania sygnałów cyfrowych jest znacząco większa niż w starszych standardach całkowitych 16- lub 24-bitowych. Zastosowanie 32-bitowych obliczeń zmiennoprzecinkowych oznacza, że nie ma czegoś takiego jak maksymalny poziom sygnału. W czasach, kiedy do sumowania sygnałów z wielu źródeł powszechnie stosowano miksery analogowe, sporadyczne świecenie się sygnalizatorów przesterowania było rzeczą normalną i w pełni akceptowalną. Był to znak, że dalsze zwiększanie poziomu może doprowadzić do wystąpienia słyszalnego przesterowania. Z kolei w 24-bitowych systemach całkowitych nie ma niczego takiego jak poziom sygnału wyższy niż maksymalny, a jego wystąpienie wiąże się z przesterowaniem. Przetwarzanie zmiennoprzecinkowe pozwoliło całkowicie wyeliminować ten problem. Nie ma przesterowań, ponieważ nie ma poziomu maksymalnego - cyfrowa wartość może reprezentować poziomy sygnału od minus nieskończoności do nieskończoności. Przetwarzanie zmiennoprzecinkowe ma też tę zaletę, że dokładność przetwarzania bardzo małych sygnałów, w okolicach poziomu zerowego, jest znacząco lepsza niż w systemach stałoprzecinkowych. Zakres dynamiki w praktyce jest nieskończony, zatem sygnały mogą być tłumione aż do momentu, kiedy przestaną być słyszalne, a następnie wzmacniane do oryginalnego poziomu bez straty jakości.

Należy też zaznaczyć, że ściągnięcie w dół tłumików sumy daje taki sam efekt jak przesunięcie w dół wszystkich tłumików w poszczególnych kanałach (zakładając oczywiście, że na sumie nie mamy włączonych żadnych wtyczek). Z tego wniosek, że zapas dynamiki na etapie miksowania nie jest źródłem problemów. Czy to oznacza, że możesz ustawić najmocniejszy możliwy sygnał, a następnie skompensować to zmniejszeniem poziomu za pomocą tłumików na sumie? No cóż, i tak, i nie... Jednym z potencjalnych problemów przy mocnym wysterowaniu sygnałów na etapie miksowania są wspomniane wcześniej wtyczki na sumie. Kłopot polega na tym, że nie wszystkie wtyczki tworzone są w ten sam sposób. Kiedy jedne mogą pracować z sygnałem o poziomie do +20 dBFS i przetwarzać go identycznie jak sygnał o poziomie -10 dBFS, to inne mogą już zachować się zupełnie inaczej. W praktyce znacznie łatwiej będzie nam uniknąć kłopotów z zapasem dynamiki wtedy, gdy utrzymamy stosunkowo niski poziom sygnału.

Nagrywanie

Najwięcej uwagi na uzyskanie optymalnego zapasu dynamiki należy poświęcić na etapie nagrywania. Przy zbyt małym sygnale stracisz na jego dynamice. Przy zbyt dużym mogą pojawić się różne niepożądane dźwięki ze zniekształceniami włącznie. Jak już wspomniano, najlepszym rozwiązaniem będzie utrzymanie poziomu średniego ok. -18 dBFS i poziomu szczytowego nie większego niż -6 dBFS (przy rejestracji 24-bitowej). Wtedy masz pewność, że pozbędziesz się kłopotów przy dalszej obróbce sygnału. Generalnie rzecz ujmując, tak długo jak unikasz przesterowania wejścia lub wyjścia, tak długo możesz być spokojny o jakość. Jest oczywiście kilka wyjątków od tej reguły, ale to, o czym napisaliśmy wyżej odnosi się do wszystkich sytuacji. W niektórych (dość rzadkich) przypadkach wtyczki nie używają obróbki zmiennoprzecinkowej, i wtedy będziesz musiał pracować z niskimi poziomami. Wejścia i wyjścia dla wysyłek i powrotów efektów powinny być traktowane jak główne wyjścia stereo i wejścia mikrofonowe, a przetwarzany za ich pomocą sygnał nie może przekroczyć poziomu 0 dBFS.

Star icon
Produkty miesiąca
Antelope Zen Go Synergy Core - interfejs audio
DNA PODCAST 700 – zestaw z mikrofonem pojemnościowym USB
MIPRO MI 58 — cyfrowy system bezprzewodowy IEM
Close icon
Poczekaj, czy zapisałeś się na nasz newsletter?
Zapisując się na nasz newsletter możesz otrzymać GRATIS wybrane e-wydanie jednego z naszych magazynó
Copyright © AVT 2020 Sklep AVT