De-essery trzy

O de-esserach pisałem już sporo, chociażby w zbiorczym wpisie ze stycznia 2020 roku czy kontynuacji z roku 2022. Testowałem ich naprawdę sporo, w zbiorach mam pewnie tego typu wtyczek kilkanaście. Nie przeszkadza mi to zdobywać nowych i sprawdzać, czy może któraś będzie wybitnie skuteczna.

Dzisiaj zapraszam na przegląd trzech de-esserów, dwóch w miarę nowych i trzeciego starszego, ale że od niedawna mam jego pełną wersję, mogłem go przetestować nieco dogłębniej.

Po co de-esser?

De-esser to wtyczka (lub urządzenie), mająca za zadanie złagodzenie brzmienia głosek syczących, tzw. sybilantów. Chodzi o głoski "s", "sz", "c", "cz", "z", "ż", "ź", a czasem także "k" i "t", które również potrafią brzmieć "ostro" (choć de facto sybilantami nie są). W większości wypadków de-essery są specjalnymi kompresorami, działającymi na dość wąskich pasmach częstotliwości - właśnie tych, gdzie wspomniane głoski mają największą energię. Teoretycznie (i praktycznie) można je zastąpić zatem albo korektorem dynamicznym albo kompresorem wielopasmowym. Poniżej możecie zobaczyć np. korektor ToneBoosters Equalizer Pro, który ma zdefiniowane aż trzy pasma w granicach 3000-9000Hz, osobno dla poszczególnych grup głosek (bo zwykle np. głoska "c" wypada w trochę innym miejscu niż "sz" lub "cz").

Po co więc stosować de-essery? Można z kaprysu, ale nie da się ukryć, że wyspecjalizowane wtyczki tego typu albo są bardzo proste w użyciu, ukrywając większość parametrów przed użytkownikiem, albo też mają specjalne algorytmy dopasowane do usuwania i łagodzenia tych szczególnych częstotliwości, dając do tego jeszcze większą kontrolę nad procesem redukcji.

Antares Vocal De-esser

To zdecydowanie najprostszy de-esser z omawianych, jeśli mowa o obsłudze. Pojawił się stosunkowo niedawno, bo latem 2024 roku i zawiera popularne "mechanizmy AI", czyli generalnie mamy niewielki wpływ na to, co wtyczka właściwie robi. Plusem jest podział usuwanych głosek na dwie grupy - sybilanty i głoski typu "t", "k", "ch", które - jeśli zechcemy - możemy redukować niezależnie od siebie. Natomiast jedynym parametrem poza siłą redukcji jest tak naprawdę próg, który te wyszukiwane i redukowane głoski muszą przekraczać, by wtyczka je usuwała.

Obsługa Vocal De-essera wygląda zatem tak, że znajdujemy w naszym nagraniu miejsce o dużym zagęszczeniu sybilantów, włączamy funkcję Assist we wtyczce i dajemy jej posłuchać sygnału przez pięć sekund. Po tym czasie wtyczka zaproponuje wartość progu zadziałania (który możemy zaakceptować) i nam pozostanie ustawienie stopnia redukcji.

Muszę, niestety, wytknąć wtyczce trzy wady. Po pierwsze, ustawianie progu działa bardzo często zbyt agresywnie i redukowane jest zbyt dużo sygnału. Po drugie, nie ma żadnej możliwości dopasowania tego, co wtyczka uznaje za sybilanty - w każdym głosie mogą one być przesunięte, mniej lub bardziej wyraźne itp. Rozumiem, że tutaj działa AI, ale w praktyce okazuje się, że np. dobrze usuwa "s", ale nie radzi sobie z "gwiżdżącymi" głoskami "sz" lub bardzo wysoko występującymi "c". I nic z tym nie zrobimy, bo żadnej regulacji tu nie ma poza siłą redukcji.

Trzeci zarzut jest bardziej techniczny. Firma Antares ma dość zawiły mechanizm sprawdzania licencji - nie dość, że jest od tego specjalna aplikacja, to jeszcze w tle z każdym startem systemu operacyjnego uruchamia się jakiś dziwaczny serwis CmContainer, który jest niezbędny, żeby wtyczka wykryła zarejestrowaną licencję i który w dodatku uruchamia jakąś webową usługę licencyjną (można na nią wejść przez przeglądarkę internetową - u mnie siedzi np. pod adresem http://localhost:22352/container.html). Bez tego serwisu wtyczka pokazuje okienko o tym, że licencji brakuje i nie można korzystać z de-essera. Przyznam, że jest to dość irytujące i mocno awaryjne.

apulSoft SplitS

SplitS to - podobnie jak Vocal De-esser - wtyczka nowa, a na dodatek przechwalająca się tym, że nie działa tak, jak reszta de-esserów, czyli sybilanty nie są tutaj kompresowane. Sam producent wręcz pisze, że SplitS to nie jest de-esser, z czym pozwolę sobie się nie zgodzić, bo dla mnie de-esserem jest wszystko, co tłumi sybilanty.

ApulSoft wymyślił, że będzie dzielił sygnał audio na "sybilantowy" i "niesybilantowy", po czym ściszał ten "sybilantowy" i wtapiał go w resztę sygnału za pomocą tzw. crossfade'ów. Innymi słowy, wtyczka działa tak, jak byśmy w programie do montażu pocięli nagranie w miejscach przed i po "eskach", ściszyli te "eski" i połączyli z resztą nagrania łagodnymi przejściami.

Wtyczka do podziału pasma na "sybilantowe" i "niesybilantowe" używa trzech progów, nazwanych tutaj Brightness detection, Level detection i Tone/noise detection. Każdym z tych suwaków możemy określić, jak brzmią sybilanty w naszym nagraniu - czy są jasne? czy rezonują? czy są głośne? Dodatkowo parametrem Window możemy zdefiniować minialną długość rozpoznawanych sybilantów - jeśli coś będzie rozpoznane jako sybilant, ale będzie zbyt krótkie, zostanie zignorowane.

Istotnym parametrem jest Crossfade, który - jak łatwo się domyślić - odpowiada za "długość wtopienia" zredukowanych sybilantów, czyli jak łagodnie przebiegnie granica między pasmem "sybilantowym" a "niesybilantowym".

Na końcu trzeba jeszcze ustawić głośności obu pasm - niebieskiego bez sybilantów (można zostawić nietknięte) i pomarańczowego z sybilantami (tu zapewne damy redukcję o kilka decybeli).

Czy to działa? Działa, ale na pewno nie jest banalne w ustawianiu, szczególnie na początku (spróbujcie stłumić jednocześnie "sz", "s" i "c"). Obwiniam za to interfejs wtyczki, bo wcale nie jest takie oczywiste, co robią poszczególne suwaki i naprawdę warto przytrzymać kursor nad nimi, żeby poczytać podpowiedzi - albo najlepiej, przeczytać zwyczajnie instrukcję. Czy ściszanie zamiast kompresowania daje jakieś słyszalne efekty? Ja tego jakoś wyraźnie nie słyszę, dla mnie liczy się to, że "eski" przestają kłuć w uszy i tyle.

Softube Weiss Deess

W odróżnieniu od poprzedników, to już jest dość wiekowa wtyczka, w dodatku będąca uproszczoną, częściową wersją potężnej wtyczki Weiss DS1-MK3 (nie pytajcie o cenę). Za to jest to jeden z tych de-esserów, które potrafią operować na dwóch zakresach częstotliwości, czyli redukować osobno głoski niskoczęstotliwościowe, jak "sz", "cz" i głoski wysokoczęstotliwościowe, jak "s" i "c". Z mojego punktu widzenia to jest bardzo istotna cecha, bo moje nagrania akurat mają dość mocny rozdźwięk między tymi głoskami, więc wolę operować na dwóch wąskich zakresach niż jednym, bardzo szerokim.

Weiss Deess jest pozornie wtyczką dość prostą i staroświecką - ot, mamy wykres częstotliwości, dwa zakresy (nie trzeba zawsze korzystać z obu), ustawienie A i B do porównań, przycisk ominięcia Bypass i tyle.

Kiedy zaczniemy się jednak zagłębiać w to, na co wtyczka pozwala, bardzo szybko okaże się, że można tu zrobić naprawdę wiele. Choćby to, że przy sygnale stereo każdy z kanałów może być obrabiany niezależnie od drugiego (to samo w przypadku obróbki mid-side).

Jeśli komuś mało komplikacji, może użyć niewidocznego na pierwszy rzut oka przycisku z podwójną strzałeczką. Pokaże się wówczas panel regulacyjny dla obu zakresów:

Można tam ustawić m. in. twardość kolana kompresji, czasy ataku i uwolnienia, stopień kompresji ratio czy kompensację głośności - wszystko to niezależnie dla obu zakresów.

Przyznam bez bicia, że naprawdę lubię ten de-esser. Przez długi czas go nie kupowałem, bo normalnie jest bardzo, bardzo drogi (199 dolarów), ale jakoś w tym roku firma Softube zaczęła go wrzucać w promocje i dzięki temu udało mi się go kupić za 50 dolarów, co uważam za cenę okazyjną. Nie ma tu wprawdzie sztucznej inteligencji, zaawansowanych algorytmów wykrywających i tego typu rozwiązań, ale szczerze mówiąc, wcale mi to nie przeszkadza. Za to wiem dokładnie, co wtyczka robi z moim sygnałem i dlaczego.

Podsumowanie

Rzecz jasna, to nie są jedyne wtyczki redukujące sybilanty w nagraniach. We wspomnianych we wstępie przeglądach znajdziecie ich dużo więcej, dorzuciłbym do nich smart:deess od Sonible czy ToneBoosters Sibalance 4.

Najgorsze z punktu widzenia recenzenta i testera jest to, że trudno znaleźć wtyczkę, która jednakowo będzie pasowała każdemu - bardzo dużo zależy tu od obrabianego głosu, od obróbki sygnału przed "de-essowaniem", przyzwyczajeniem danej osoby i tak dalej, i tak dalej. Ja osobiście lubię mieć dużą kontrolę nad tym, co się dzieje, stąd lubię wtyczki o dużej liczbie parametrów.

Niemniej, dobrze wiedzieć, że w tej dziedzinie sporo się dzieje i powstają nowe rozwiązania - pewnie przyjdzie w końcu taki dzień, gdy de-essery będą tak intuicyjne, efektywne i przezroczyste brzmieniowo, że przestaniemy się nimi przejmować.

Komentarze