[K] Sonible prime:vocal

Bardzo lubię wtyczki od firmy sonible i niecierpliwością czekałem na 17 grudnia 2024, kiedy to miała mieć miejsce premiera nowego produktu, czyli prime:vocal. Na podstawie dosłownie kilkunastu sekund z filmiku promocyjnego można było wywnioskować, że będzie to narzędzie do poprawiania ludzkiego głosu, tzn. usuwania zakłóceń, pogłosu, wyrównywania głośności itp. Niepoprawni optymiści marzyli także o usuwaniu mlasków i ograniczaniu oddechów, ale gdzieś tam z tyłu głowy świtała myśl, że aż tak dobrze nie będzie. 17 grudnia nadszedł, dorwałem w swoje ręce wersję testową i krzyknąłem: sprawdzam!

Wersja beta

Pierwsze wrażenia nie były, niestety, budujące. Prime:vocal to aplikacja zbudowana podobnie do NoiseWorks DynAssista i w zasadzie częściowo ich funkcjonalności się pokrywają. Obie aplikacje mają część standalone, czyli prosty edytor audio, do którego wczytujemy plik do obróbki, mają też moduł ARA, do wykorzystania wewnątrz innej aplikacji, np. Reapera. Prime:vocal nie jest zatem po prostu wtyczką VST, która podobnie jak np. smart:comp czy smart:gate analizuje fragment sygnału i na tej podstawie się wstępnie konfiguruje. Tutaj analizowana jest całość nagrania, co... rodzi spore problemy.

Zacznę od tego, że część ARA, czyli przeznaczona do pracy we wnętrzu innych aplikacji, naprawdę jest jeszcze w wersji beta, o czym mówi wprost oficjalny podręcznik. Podczas sprawdzania przydatności prime:vocala zająłem się zatem głównie wersją standalone. Uruchomiłem ją i wrzuciłem tam ostatnio nagranego audiobooka, 26 minut mono. I od razu się zjeżyłem, bo prime:vocal rozpoczął analizę, przewidując jej zakończenie za godzinę i kwadrans...

Nie dla mnie

Oczywiście, wyłączyłem tę analizę i uruchomiłem program ponownie, tym razem wrzucając krótką, kilkunastosekundową próbkę, której analiza i tak trwała dobre półtorej minuty. W międzyczasie przeglądałem wspomnianą instrukcję i tam znalazłem dość ciekawą informację, że twórcy sami ostrzegają, że ich "bardzo złożony model AI" potrzebuje sporo mocy obliczeniowej - średnio analiza trwa tyle, co sam materiał. W moim przypadku okazało się, że jest to ponad dwa razy więcej, co od razu nasuwa mi wspomnienia z testów SpectraLayers 10. Oznacza to ni mniej, ni więcej, że sonible w żaden sposób nie korzysta ze sprzętowego wsparcia karty graficznej, całość przetwarzania powierzając głównemu procesorowi.

Interfejs rodem z sonible, ergonomia również, ale wydajność - fatalna...

Już to automatycznie sprawiło, że moje zainteresowanie prime:vocal gwałtownie zmalało, ale przyjrzałem się jeszcze głównym modułom i posłuchałem, jak dają sobie radę z sygnałem. I sprawiedliwie muszę przyznać, że owszem, im gorzej nagrany sygnał, z większym pogłosem i zakłóceniami, tym lepsze wrażenie się odnosi z pracy aplikacji. Niemniej, jeśli - jak jest to wspomniane w filmiku promocyjnym - prime:vocal ma służyć do przygotowywania głosu na poziomie studyjnym, to moim zdaniem bez wątpienia brakuje w nim usuwania mlasków i osłabiania oddechów. To są rzeczy, z którymi od lat walczą na przykład podcasterzy lub początkujący lektorzy, i nadal poza iZotope Mouth De-clickiem i Waves Debreathem bardzo mało jest kompetentnych wtyczek, radzących sobie z tymi popularnymi przecież zakłóceniami. Prime:vocal jakoś tam zwalczy popy i eski, ale oddechy i mlaski to już dla niego zbyt wiele.

A co mamy? Mamy usuwanie zakłóceń z nagrania, czyli jakichś szurnięć, szumów i buczenia w tle, mamy też minimalizację pogłosu. Obie te funkcje - odszumianie i odpogłosowianie - można skonfigurować dla poszczególnych zakresów częstotliwości, co pozwoli zachować wyższą jakość w przypadku szczególnie mocno "zanieczyszczonych" nagrań. Niestety, moim zdaniem obie te funkcje działają co najwyżej przyzwoicie.

Prime:vocal potrafi także minimalizować popy i łagodzić sybilanty, choć już tutaj do regulowania mamy tylko kilka pozycji w rodzaju "mocno", "lekko", zatem musimy polegać na tym, że algorytm dobrze wykryje, co jest danym zakłóceniem. Przy moich testach wypadało to wcale nieźle, chociaż nie idealnie.

Spectral Balance z kolei umożliwia usunięcie różnego rodzaju rezonansów i zakłóceń spektralnych, co powinno poskutkować uzyskaniem dobrze zbalansowanego głosu, bez zakolorowań, dudnienia czy nosowości. Ostatnia modyfikacja, jaką możemy wprowadzić, to kontrola dynamiki, przeprowadzana tu w dwóch krokach. Możemy wyrównać głośność (stosując efekt typu vocal rider) oraz poddać sygnał kompresji (automatycznej, bo do ustawienia są tylko trzy progi: Soft, Medium i Strong).

Pewną ciekawostką jest możliwość rozrysowania automatyzacji dla poszczególnych "efektów", dzięki czemu możemy dla niektórych fragmentów nagrania osłabić lub wzmocnić ich działanie. A skoro mamy automatyzację, to warto byłoby ją jakoś zapisać i owszem, prime:vocal ma mechanizm zapisywania stanu jako tak zwaną sesję. Tym samym prime:vocal staje się programem podobnym np. do SpectraLayers od Steinberga, tyle że jeszcze o wiele, wiele zbyt ubogim...

Bez GPU nie ma szans

W mojej opinii, obecna wersja nie nadaje się do poważniejszych zadań. Nie wątpię, że współczesne procesory poradzą sobie z przetwarzaniem lepiej niż mój stary i7 Intela, ale skoro sami twórcy mówią o proporcji 1:1, to analiza godzinnego audiobooka i tak potrwa godzinę. Godzina czekania, żeby w ogóle usłyszeć, co wtyczka jest w stanie zrobić z nagraniem. Potem dobieranie parametrów, odsłuchy różnych fragmentów, a jeśli coś się stanie i prime:vocal się "wysypie" (u mnie się raz wyłączył, kiedy zmieniałem parametry usuwania pogłosu na mojej 18 sekundowej próbce), to analiza będzie musiała być zrobiona od nowa. Dlatego warto od razu zapisać sobie sesję i warto też tę sesję nadpisywać w miarę postępów prac.

Zachodzę w głowę, dlaczego sonible uparło się na konieczność analizy całości materiału? Do tej pory wtyczki tej firmy odsłuchiwały fragment nagrania i już, co najwyżej można było sobie w opcjach zwiększyć długość fragmentu, żeby dostać "pewniejsze" wyniki. Być może chodzi o to, że prime:vocal robi sobie jakąś "mapę" całości nagrania i dynamicznie dostosowuje parametry obróbki (np. eski w jednym fragmencie są tłumione mocniej, w innym - słabiej, bo są różnej głośności). Nie mam pojęcia, za to wiem, że dopóki całość nie zacznie wykorzystywać wsparcia karty graficznej albo nie zacznie pracować jak "stare" wtyczki sonible, to prime:vocal jest mi na nic.

Zachęcam jednak do sprawdzenia miesięcznej wersji testowej, bo jeśli ktoś chciałby wykorzystać prime:vocal np. do obróbki piosenek, to może i warto - piosenki są krótkie, więc i element analizy nie będzie aż tak dokuczliwy. Jeśli w dodatku ma się już jakieś wtyczki sonible, to i cena prime:vocal jest odpowiednio niższa - 89 dolarów, po okresie promocyjnym ma wynosić 179 dolarów. Chociaż - szczerze mówiąc - w obecnej postaci nie wróżę prime:vocal jakiejś błyskotliwej kariery na rynku. Sonible lepiej zrobiłoby chyba, dając użytkownikom po prostu świetnie działającą wtyczkę do usuwania zakłóceń i pogłosu, czyli odpowiednik SuperTone Clear...

Cari Blog Ini

GadeSound