[N] Przesłuchy w nagraniach rozmów

Z przesłuchami spotkał się chyba każdy, kto rejestrował rozmowę przynajmniej dwóch osób, nagrywaną osobnymi mikrofonami w jednym pomieszczeniu. Chodzi o to, że w sygnale z jednego mikrofonu pojawia się głos drugiego rozmówcy, nagrany ciszej niż głos rozmówcy pierwszego, ale nieco utrudniający obróbkę i powodujący, że zwiększa się wrażenie pogłosu pomieszczenia. Chciałbym zatem skupić się dzisiaj na tym, jak się tego efektu pozbyć, a przynajmniej go zminimalizować.

Przed nagraniem

Pierwszą rzeczą, którą należy zrobić, jest odpowiednie ustawienie rozmówców względem siebie i dobór właściwych mikrofonów jeszcze przed zarejestrowaniem rozmowy. Rozmówcy powinni siedzieć w miarę możliwości naprzeciwko siebie i mówić do mikrofonów kierunkowych, np. kardioidalnych. Nagrywają one bardzo mało sygnału z tyłu, więc poziom głosu drugiej osoby będzie minimalny. Oczywiście, adaptacja akustyczna lub odpowiedni dobór otoczenia (miękkie sofy, zasłony, regały wypełnione książkami) pomagają, bo tworzy się mniej odbić, które mogą trafić do mikrofonów z innej strony niż z tyłu.

Można także ustawić między mikrofonami jakiś panel akustyczny, jednak nie zawsze się to sprawdza w praktyce, bo w końcu zazwyczaj chcemy widzieć rozmówcę.

Po nagraniu

Nawet jeśli dołożyliśmy starań podczas samego nagrania, przesłuchy i tak będą istnieć - tyle, że słabsze. Przed rozpoczęciem obróbki warto więc "na słuch" ocenić, na ile wpływają one na jakość, bo jeśli są dostatecznie niewielkie, być może nie trzeba nic z nimi robić, zwłaszcza jeśli planujemy użycie ekspandera czy bramki szumów, które takie ciche sygnały po prostu zniwelują.

Jeśli przesłuchy są wyraźne i słyszalne, należy się nimi zająć. Tak brzmi suma sygnałów z przesłuchami:

POBIERZ

Tak natomiast brzmi pojedynczy sygnał:

POBIERZ

Po usunięciu przesłuchu suma brzmi już dużo lepiej:

POBIERZ

I do takiego mniej więcej stanu warto doprowadzić nasze nagranie.

Dodatkowym plusem ściszania śladów, na których nikt akurat nie mówi jest ogólna poprawa jakości materiału - z takiego ściszonego fragmentu nie przedostaną się do nagrania inne zakłócenia, np. potrącenia mikrofonu, oddechy, szum.

Sposób ręczny

Tradycyjnie już ręczna obróbka dostarczy nam najlepszych efektów, bo będziemy mogli precyzyjnie dopieścić każdy szczegół. Tradycyjnie też ręczna obróbka potrwa najdłużej, zwłaszcza jeśli rozmówcy często wymieniają uwagi i praktycznie co kilkanaście sekund mówi ktoś inny.

Ręczna obróbka sprowadza się do przejścia przez cały materiał i naprzemiennym ściszaniu (lub cięciu i usuwaniu) klipów - tam, gdzie mówi jedna osoba, zostawiamy jej sygnał, a ściszamy lub usuwamy wszystkie pozostałe.

Ekspander lub bramka szumów

Drugim rozwiązaniem, skutecznym gdy przesłuchy nie są zbyt wyraźne, jest zastosowanie ekspandera czy bramki szumów (różnią się one stopniem ściszania sygnału - bramka ścisza zupełnie, ekspander w pewnym stopniu). Po prostu ustalamy, poniżej jakiego poziomu znajdują się przesłuchy i w ekspanderze/bramce stanie się to wartością progu zadziałania - jeśli teraz sygnał spadnie poniżej wartości progowej, ekspander/bramka uzna, że trzeba go ściszyć i to zrobi z zadaną mocą.

Trzeba tu zachować dużą ostrożność, bowiem ekspander/bramka działa także na sygnał użyteczny, zatem ściszy oddechy czy ciszej wypowiedziane fragmenty głównego głosu. Jak każdy automat, także ten wymaga kontroli.

Narzędzia specjalne - Audacity i AutoDuck

Darmowe narzędzie Audacity posiada funkcję AutoDuck, która teoretycznie powinna rozprawić się z przesłuchami. Potrzebne są obie ścieżki - górna (ściszana) i dolna (ściszająca), zaznaczamy tę górną, wybieramy AutoDuck, dobieramy odpowiednio progi i wartości, po czym górna ścieżka zostaje przetworzona w oparciu o dane z dolnej ścieżki. Kłopot w tym, że trudno jest to narzędzie skonfigurować, w czym nie pomaga ogólna konstrukcja Audacity. Na przykład, nie da się zmienić zaznaczenia, żeby przesłuchać działania funkcji na innym fragmencie. Trzeba zatem uruchamiać funkcję, dobierać parametry trochę na wyczucie, uruchamiać przetwarzanie, posłuchać, jak wyszło i ewentualnie wycofywać zmiany, po czym powtarzać całą sekwencję...

Funkcja zatem istnieje i dla osób biegłych w obsłudze Audacity oraz przyzwyczajonych do jego niezbyt wygodnego workflow, może to być jakieś wyjście z sytuacji.

Narzędzia specjalne - Hindenburg Pro

Przyznam, że rozwiązanie z Hindenburga Pro, nazywane tutaj Magic Levels, spodobało mi się na tyle, że wykupiłem subskrypcję na ten program, żeby obrobić kilka godzin rozmów. Działa to następująco: wczytujemy na osobne ślady głosy prowadzące rozmowę. Zaznaczamy klipy i uruchamiamy funkcję Magic Levels, która zaczyna analizować oba klipy i tworzy dla nich obwiednie głośności, ściszając o zadaną liczbę decybeli ten z klipów, który w danej chwili jest cichszy od innych. Po kilkunastu sekundach (dla ponad godzinnych nagrań!) dostajemy przygotowane klipy, które automatycznie się wyciszają tam, gdzie nie pojawia się na nich głos.

To, co jest bardzo fajne w omawianej funkcji, to właśnie sposób realizacji. Po zakończeniu pracy algorytmu mamy bowiem nie zmodyfikowane pliki dźwiękowe, ale obwiednie głośności, więc nic nie stoi na przeszkodzie, by przy dalszej pracy poprawić to i owo. Wiadomo, automat nie zawsze wszystko zrobi stuprocentowo dobrze - ale tu nie musimy wycofywać wszystkich zmian, zmieniać parametrów i próbować wiele razy. Po prostu w miejscu, które tego wymaga, zmieniamy obwiednię i już wszystko brzmi jak należy. Genialne, ale jakoś nigdzie poza Hindenburgiem nie spotkałem się z taką możliwością. Polecam wypróbować wersję testową!

Narzędzia specjalne - RX oraz SpectraLayers

W obu edytorach, i w SpectraLayers Pro i RX Audio Editor Standard, istnieje specjalna funkcja De-bleed, służąca właśnie do likwidacji przesłuchów. Wprawdzie była ona projektowana przede wszystkim do pracy ze ścieżkami perkusyjnymi, ale można ją wykorzystać także do usuwania przesłuchów z nagrań wokalnych, z czego wiele razy korzystałem. Obróbkę trzeba przeprowadzić dwuetapowo, to znaczy musimy najpierw usunąć przesłuchy z jednej ścieżki posiłkując się drugą, a potem odwrotnie, z tej drugiej usuwamy przesłuchy, korzystając z danych z pierwszej ścieżki.

O ile do jakości nie mam dużych zastrzeżeń, to jednak całość zabiera masę czasu - na moim komputerze usunięcie przesłuchów z jednej godzinnej ścieżki trwało blisko pół godziny, potem jeszcze trzeba rzecz powtórzyć dla drugiej ścieżki (przy dwóch rozmówcach). Dodatkowo są to zmiany w warstwie audio, więc jeśli odkryjemy jakieś problemy, że coś się źle ściszyło, to musimy wycofać całą operację i po zmianie parametrów ponowić ją (i znów odczekać swoje).

Narzędzia specjalne - WTAutoMixer (VST)

Narzędzie niemal równie genialne w swojej prostocie, co rozwiązanie z Hindenburga, ale do wykorzystania tylko w programach, które umożliwiają użycie wtyczek VST przypiętych do poszczególnych ścieżek. Wrzucamy na ścieżkę każdego głosu osobną wtyczkę WTAutoMixer i... tyle. Przy odtwarzaniu wszystkie "egzemplarze" (instancje) wtyczki będą się ze sobą komunikować i wyciszać te ślady, które są cichsze od aktualnie najgłośniejszej. Możemy wyregulować, o ile cichsze, jaki jest próg zadziałania, chwilowo wyłączyć cały mechanizm itp.

Wtyczka działa naprawdę bardzo sprawnie i szczerze mówiąc podoba mi się najbardziej ze wszystkich opisanych rozwiązań, bo jest najbardziej uniwersalna. Można jej użyć w dowolnym programie DAW, można też zapisać jej automatykę, żeby ją ręcznie móc modyfikować itp. Zniechęca tylko cena, sięgająca (w przeliczeniu) ok. 800zł. Jeśli ktoś jednak zarabia na życie obróbką wywiadów i rozmów, to wtyczka ta może oszczędzić mu mnóstwa pracy, więc warto rozważyć jej zakup, ewentualnie wpisać ją na listę do sprawdzenia w gorącym czasie "czarnego piątku" - może trafi się jakaś wyprzedaż?

Narzędzia inne

Z pewnością znajdzie się też sporo innych narzędzi, których można użyć, jak choćby specjalna wtyczka do programu Reaper o nazwie AutoMixer - i chociaż z tej ostatniej korzystałem, to jednak wymaga ona przejścia przez specjalną procedurę instalacyjną, nie jest też specjalnie intuicyjna w obsłudze, z tego powodu zatem darowałem sobie jej bardziej szczegółowy opis. Chętni jednak mogą ją wypróbować, bo jest darmowa, a daje niezłe rezultaty.

Podsumowanie

Jeśli ktoś zajmuje się obróbką tego typu materiałów audio, jak rozmowy i wywiady, z pewnością doceni możliwość przyspieszenia pracy. Szczególnie kusząco wypada sposób proponowany przez Hindenburg Pro, jako najmniej inwazyjny i umożliwiający późniejszą korektę w miarę postępujących prac nad materiałem. Niestety, wymaga to nabycia licencji na osobne narzędzie, choć 50zł miesięcznie, zwłaszcza w zastosowaniach komercyjnych, to nie jest jakiś szalony koszt.

Bardzo solidnie prezentuje się także wtyczka WTAutoMixer, a jej zaletą jest możliwość korzystania w dowolnym programie, potrafiącym wykorzystać wtyczki VST, czyli bez problemu skorzystamy z niej w Reaperze na przykład. To jednak większa inwestycja, więc trzeba dokładnie policzyć, czy na pewno będzie ona opłacalna.

SpectraLayers Pro oraz iZotope RX Standard to już w ogóle spore inwestycje, więc warto użycie tych programów rozpatrzyć wówczas, gdy po prostu już je mamy, tylko nie znaliśmy funkcji De-bleed. W tym wypadku jednak czas obróbki jest już spory.

Dla oszczędnych pozostaje skorzystanie z bramki szumów lub ręczna edycja materiału - chyba, że ktoś opanuje tajniki AutoDuck z Audacity.

Tak czy owak, o niwelowanie przesłuchów warto zadbać, bo nagrania mocno wtedy zyskują na jakości - przynajmniej takie jest moje zdanie.

Cari Blog Ini

GadeSound