[K] Sonible smart:gate

No i stało się, smart:gate ujrzało światło dzienne! Od razu zabrałem się do testów, bo - jak może wiecie albo i nie - od dłuższego już czasu zarzuciłem wykorzystanie odszumiaczy i do wyciszania szumu w nagraniu używam po prostu porządnego ekspandera/bramki, czyli zazwyczaj SIR StandardGATE. To świetne narzędzie, które bardzo naturalnie pozwala wyciszyć irytujący szum czy ściszyć oddechy. Powstało zatem pytanie, czy "sprytna" bramka od Sonible ma szansę wprowadzić tutaj coś naprawdę rewolucyjnego, co będzie uzasadniać reklamowane użycie sztucznej inteligencji (tak, tak, to kolejna wtyczka z enigmatyczną "sztuczną inteligencją")? Byłem tego bardzo ciekaw, więc jak tylko pojawiła się wersja testowa, pobrałem i zainstalowałem.

Główny problem z obróbką głosu

Z moich doświadczeń wynika, że największym problemem podczas obróbki głosu bramką szumów, np. nagrania do podcastu, są... oddechy. Zwykłe bramki szumów bazują wyłącznie na mierzeniu poziomu głośności dźwięku i jeśli spada on poniżej pewnej wartości progowej, sygnał jest tłumiony (w większym lub mniejszym stopniu, zależy czy korzystamy z narzędzia jako z bramki, czy z ekspandera). Rzecz w tym, że czasem oddechy bywają bardzo głośne i wpływają na pracę bramki szumów, przy czym najczęściej wygląda to tak, że dostajemy "rwany" oddech, który jest nieco stłumiony, ale głośniejsza jego część - nie jest, bo akurat "wystawała" ponad ustawiony próg. Jeśli zwiększymy próg, może się okazać, że z kolei będą wyciszane początki lub końcówki słów.

W StandardGATE radzę sobie z tym problemem za pomocą odpowiednio dobranych czasów ataku i powrotu, łagodnego kolana i niezbyt agresywnego tłumienia, co pozwala zauważalnie ściszyć szumy czy zakłócenia, a jednocześnie zachować słyszalne, choć także ściszone oddechy. Nie lubię sygnału, gdzie oddechów nie ma w ogóle, więc jest to dla mnie dość istotne.

Tak ustawiony proces najczęściej się sprawdza, ale przy dużych zakłóceniach między słowami - nie zawsze. Wtedy trzeba zazwyczaj popracować ręcznie i pościszać niesforne fragmenty, żeby nie psuły roboty bramce...

Czym się różni smart:gate od reszty bramek?

Sonible zadało sobie pytanie: dlaczego zwykłe bramki są czasem nieskuteczne? Bo bazują tylko na progu głośności. A gdyby tak bramka... potrafiła rozpoznawać, jaki dźwięk przetwarza?

I tak to właśnie rozwiązano w smart:gate. Z rozwijalnej listy wybieramy, czy obrabiamy głos mówiony, śpiewany, gitarę, perkusję itp., po czym (jak to w serii smart) odtwarzamy kawałek sygnału audio, wtyczka ten sygnał analizuje i po chwili już "wie", co jest sygnałem użytecznym, a co zakłóceniem.

Rozpoznany (czy inaczej: kwalifikowany) sygnał staje się w tym momencie "funkcją aktywacyjną" i to do niej odnoszą się ustawienia bramki. Dość czytelnie pokazano to na interfejsie użytkownika - szarym kolorem narysowany jest rzeczywisty przebieg sygnału, natomiast tylko niektóre fragmenty tego sygnału mają odpowiednio dużą wartość wspomnianej "funkcji aktywacyjnej" - oczywiście, chodzi o fragmenty zgodne z wybranym typem, np. mowa, werbel, gitara itp. Nawet jeśli w rzeczywistym sygnale istnieją fragmenty równie głośne, ale rozpoznane jako "niepasujące" do wybranego typu, nie wzbudzą one działania bramki.

Jako pierwsze do testów rzuciłem tradycyjnie nagranie, które dawno temu zrobiłem mikrofonem Lewitt LCT040. Jest dość mocno zaszumione i ma nagrane dość głośne oddechy. Wtyczka "posłuchała" i praktycznie kompletnie wycięła wszystko poza samymi słowami. Nie zauważyłem, żeby gdzieś przycięła końcówki czy początki, chyba faktycznie rozpoznawane są granice słów.

Oczywiście, tak wyczyszczone nagranie mnie nie zadowoliło, na szczęście mamy do regulacji parametr Impact, który odpowiada za siłę tłumienia, więc spokojnie możemy częściowo przywrócić np. oddechy, zamieniając bramkę w ekspander. To, gdzie tkwi przewaga smart:gate nad tradycyjnymi bramkami, to sposób odróżniania sygnału użytecznego od nieużytecznego. I to tutaj działa reklamowana sztuczna inteligencja - a że działa całkiem skutecznie, nie będę się spierał o nazewnictwo i to, czy faktycznie jakieś sieci neuronowe czy uczenie maszynowe są zaangażowane w cały proces.

Smart:gate to nie tylko rozpoznawanie typu sygnału i regulacja siły działania. Mamy tu do czynienia także ze zwykłą, dość rozbudowaną bramką szumów, z możliwością regulacji czasów (ataku, powrotu, podtrzymania), regulacją wartości progowej (wraz z tolerancją) oraz - co okazuje się czasem bardzo istotne - możliwością sterowania działaniem bramki dla trzech różnych zakresów częstotliwości:

Dzięki temu możemy np. osłabić wysokoczęstotliwościowy szum, pozostawiając inne zakłócenia w dolnych pasmach, na których nam na przykład zależy z jakiegoś powodu.

To oczywiście nadal nie jest koniec, bo mamy także możliwość odsłuchu różnicowego (czy możemy posłuchać, co właściwie bramka tłumi), możemy także skorzystać z funkcji side-chain i zmienić tryb pracy wtyczki z tłumienia na ducking, podczas którego niejako odwraca się działanie wtyczki w oparciu o sygnał dostarczany z zewnątrz.

Próbowałem wykorzystać smart:gate do redukcji przegłosów, ale wyniki nie były oczywiste - czasem działało to nieźle, jeśli zakłócenia były na tyle "rozmyte", by algorytm nie rozpoznawał w nich głosu, ale jeśli przesłuchy były dość mocne i czytelne, to bramka uznawała także je za (użyteczną) mowę i traktowała jak główny głos. Stąd wniosek, że raczej nie jest dla niej istotne brzmienie głosu, tylko samo sklasyfikowanie sygnału jako głos ludzki (piszę cały czas w kontekście obróbki nagrań np. podcastowych).

Osoby miksujące lub tworzące muzykę mogą obejrzeć bardzo inspirujący filmik Marlona z White Noise Studio:

Można tu zobaczyć (i posłuchać), jak smart:gate radzi sobie np. z bramkowaniem dźwięków perkusyjnych, co jest bardzo powszechnym zastosowaniem dla bramek szumu. Dzięki smart:gate można dość precyzyjnie "odfiltrować" z sygnału, np. perkusyjnej pętli, dźwięki określonego typu.

Podsumowanie

Spoglądam na ten produkt z punktu widzenia osoby obrabiającej głównie głos. Czy smart:gate jest w tym ujęciu narzędziem rewolucyjnym? Niespecjalnie. Czy podobny efekt da się uzyskać, korzystając ze standardowej bramki? Przy odrobinie wprawy i dobrze nagranym materiale - raczej tak. Niemniej, jeśli jesteśmy bardzo czuli na głośne oddechy i dostajemy drgawek podczas ich ściszania, na pewno warto wypróbować, czy smart:gate nie ułatwi tego zadania - ta wtyczka całkiem nieźle potrafi rozdzielić głos od oddechu, więc nie bazujemy tylko na poziomie głośności. Czyżby właśnie pojawił się dobry reduktor oddechów?

Zdecydowanie więcej korzyści odniosą z zakupu smart:gate muzycy - szczególnie przy bramkowaniu ścieżek perkusyjnych dostaną oni rewelacyjnie działające narzędzie, które naprawdę może oszczędzić masę pracy. Czasem, co pokazują już teraz różne filmiki testowe na YouTube, można osiągnąć rzeczy bardzo trudne do zrobienia w zwykłej bramce, gdy w jakiejś partii perkusyjnej mamy instrumenty nagrane z równą głośnością (np. stopę i werbel). W takich wypadkach smart:gate jest w stanie pokazać prawdziwe cuda, separując jedno brzmienie od drugiego (i od razu odpowiem: tak, podobne "czary" robi także Steinberg SpectraLayers, ale to wielokrotnie droższe narzędzie).

Czy zatem warto kupić smart:gate? Moim zdaniem, warto zacząć od przetestowania wersji próbnej. I to w zasadzie dostarczy od razu odpowiedzi, czy pracuje się nam szybciej i skuteczniej, czy niespecjalnie. A wtedy odpowiedź na pytanie o opłacalność stanie się od razu jasna.

Cari Blog Ini

GadeSound