реклама
Бургер менюБургер меню

Артем Новицкий – Нейросети для монтажа подкастов чистка звука и сведение (страница 3)

18

Конечно, алгоритмы развиваются. Уже есть инструменты, которые анализируют речь и пытаются понять эмоциональную окраску. Но до настоящего, живого понимания им как до Луны пешком. Так что пока человек в студии – главный режиссёр, а нейросеть – его очень шустрый и послушный ассистент.

Так что же на самом деле?

Правда, как обычно, посередине, и она гораздо интереснее мифов. ИИ не заменяет нас, а меняет наши рабочие процессы. Помните, в начале книги мы говорили про эволюцию от ручек к алгоритмам? Вот она, в действии.

Звукорежиссёр будущего – это не человек с мышкой, который 40 часов в неделю режет дорожки. Это человек, который управляет умными машинами. Это скорее дирижёр, чем музыкант в оркестровой яме. У нас появляется возможность делать работу быстрее, качественнее и, что самое главное, браться за задачи, на которые раньше не хватало времени. Например, доводить до идеала старые записи, которые пылятся на полке, или экспериментировать со звуком, не боясь, что эксперимент затянется на неделю.

Мифы об ИИ часто рождаются из страха перед неизвестностью. Но если присмотреться, это просто очень мощный инструмент, который оказался у нас в руках. Как когда-то появление многодорожечной записи не убило музыку, а сделало её богаче.

Поэтому в следующий раз, когда услышите очередную страшилку про то, как нейросеть уволила звукорежиссёра Иваныча, просто вспомните, что Иваныч теперь не чистит шумы вручную, а сидит в удобном кресле, пьёт кофе и придумывает, как сделать звук своего подкаста уникальным. И это, согласитесь, звучит гораздо лучше, чем паника.

Как подготовить рабочее место и мозг к работе с новыми инструментами

Представь, что ты хирург, которому вместо старого доброго скальпеля дали лазерный. Скальпель ты знаешь как свои пять пальцев, чувствуешь его вес, знаешь, под каким углом резать, а под каким лучше не надо. А тут тебе в руки кладут что-то новое,, и говорят: «Это быстрее, точнее и почти не оставляет шрамов». Первая реакция? Либо дикий восторг, либо легкая паника. В работе с ИИ в аудио происходит примерно то же самое. Поэтому, прежде чем мы нырнем в мир умных алгоритмов, которые будут чистить ваш звук, давайте подготовимся. И речь не только про железки.

Аудит вашей текущей студии

Первым делом нужно понять, с чем мы имеем дело. ИИ-инструменты – они, конечно, всеядны, но, как и любой хороший инструмент, любят, когда им подают материал опрятно. Не нужно сразу бежать и скупать самое дорогое оборудование. Сядьте и посмотрите на свою текущую студийную ферму. Какой у вас компьютер? Если ваш процессор еще помнит времена, когда «Вконтакте» был только для избранных, возможно, стоит задуматься о его пенсии. Нейросети любят кушать ресурсы, особенно оперативную память и видеокарту.

Вспомните историю одного звукорежиссера, который купил суперсовременный плагин на базе ИИ, а его старый ноутбук начал задыхаться и хрипеть сильнее, чем запись с улицы в ветреную погоду. Пришлось ему возвращать плагин обратно в магазин. Не будьте как тот звукорежиссер. Проверьте системные требования. Возможно, вашему компьютеру просто нужна небольшая модернизация: добавить планку оперативной памяти или присмотреть внешний SSD, куда можно будет скидывать тяжелые аудиофайлы для обработки. Это не потребует миллионов, но сбережет миллионы нервных клеток.

Помните, что ваш старый микшерный пульт или аудиоинтерфейс никуда не денутся. ИИ работает на уровне программного обеспечения, ему все равно, откуда пришел сигнал. Главное, чтобы «цифра» была качественной. Так что подготовка студии – это скорее про дружбу железа и софта.

Настройка цифрового пространства

Теперь, когда с «железом» разобрались, заглянем в монитор. Ваша DAW – это ваш второй дом. И перед тем, как звать гостей (в лице ИИ-помощников), в доме нужно прибраться. Посмотрите на свои папки с проектами. Если у вас там каша из файлов с названиями «трек_окончательный_версия_3_самый_последний_точная_копия.wav», то ИИ вам вряд ли поможет. Он, конечно, сможет почистить этот файл, но не наведет порядок в вашей голове.

Создайте четкую структуру папок. Например: папка «Проекты», внутри – папка «Подкаст_Название», а внутри уже «Сырые_файлы», «Монтаж», «Обработка_ИИ», «Финальный_мастеринг». Поверьте, когда вы начнете пользоваться автоматическими инструментами, которые в два счета обрабатывают дорожки, вы будете генерировать тонны промежуточных версий. И если у вас не будет системы, вы просто утонете в этом цифровом потопе.

Это как готовка на чистой кухне. Когда все ингредиенты разложены по баночкам, ножи наточены, а разделочные доски ждут своего часа, процесс идет быстрее и приятнее. Точно так же и в звуке. Уберите с рабочего стола ярлыки, почистите корзину, закройте браузер с мемами. Дайте своему компьютеру возможность дышать, а себе – сосредоточиться.

Мозговой штурм с самим собой

А теперь самое сложное. Подготовка мозга. Мы, звукорежиссеры, народ консервативный. Мы привыкли доверять своим ушам и рукам. А тут приходит какой-то алгоритм и говорит: «Я тут сам все выровняю, шум уберу, компрессию поставлю». И хочется ему ответить: «Сам ты алгоритм, я тут 10 лет ручки кручу!». Знакомо?

Но давайте честно. Сколько раз вы тратили часы на то, чтобы вырезать «ыканье» или кашель в подкасте? Сколько раз вы боролись с фоновым шумом кондиционера, который звукорежиссер звукорежиссера не заметил при записи? ИИ берет на себя именно эту рутину. Он не претендует на ваше творческое чутье, он просто хочет освободить вам время для настоящего творчества.

Поэтому подготовка мозга – это про принятие. Примите тот факт, что вы не становитесь хуже как специалист, покупая ИИ-помощника. Вы становитесь умнее как управленец. Вы делегируете скучную работу своему цифровому ассистенту, а сами занимаетесь тем, за что люди и платят деньги – создаете настроение, атмосферу, эмоцию.

Попробуйте вспомнить свое первое знакомство с каким-нибудь сложным плагином или новым типом микрофона. Поначалу было страшно и непонятно, а потом – бац! – и ты уже не представляешь без него свою жизнь. С ИИ будет так же. Дайте себе время. Включите режим исследователя, а не критика. Потыкайте кнопочки, послушайте, что получается. Экспериментируйте.

Дружеский разговор по душам

И последнее. Подготовьтесь к тому, что ИИ может ошибаться. Да, он умный, но он не человек. Он может убрать не только шум, но и часть полезного сигнала, сделав голос неестественным. Он может неправильно определить паузу и склеить фрагменты так, что получится «каша». И в этот момент очень важно не впадать в детство и не кричать: «Проклятые роботы захватывают мир!». Просто воспринимайте это как рабочий момент. Вы же главный. Вы – капитан корабля. ИИ – это просто очень шустрый матрос, который иногда может перепутать швабру с веслом.

Поэтому ваш мозг должен быть гибким. Готовым к тому, что придется подкрутить настройки, откатить действие или вовсе сделать что-то вручную. И это нормально. Идеального инструмента не существует. Но есть инструмент, который кратно ускоряет вашу работу, если знать его слабые и сильные стороны.

В общем, подготовка к работе с ИИ в аудио – это на 10% апгрейд компьютера, на 20% порядок в файлах и на 70% правильный настрой. Это как перед долгим путешествием проверить машину, загрузить навигатор и, самое главное, налить себе термос с любимым кофе и настроиться на приключение. Приключение начинается прямо сейчас.

Часть 2. Первые шаги: очистка голоса от шума

Исходник – всему голова: правила качественной записи для нейросети

Представь, что ты шеф-повар. Ты можешь быть гением кулинарии, у тебя могут быть самые дорогие кастрюли и плита, но если продукты, которые тебе принесли, – тухлые и гнилые, ты ничего путного не приготовишь. С аудио точно так же. Мы с тобой уже знаем, что такое шум и как с ним бороться, и даже немного приоткрыли завесу тайны над автоматическим шумоподавлением. Но сейчас я хочу поговорить о том, что происходит ДО того, как мы включаем эти волшебные алгоритмы.

В мире ИИ есть одна важная истина, которую нужно усвоить раз и навсегда: нейросеть – это не волшебная палочка, которая вылечит любую запись. Она скорее похожа на опытного реставратора. Реставратор может почистить старую картину, убрать пыль и грязь, но если холст изначально был плохим или красок нанесли слишком много – чуда не произойдёт. Точно так же ИИ работает с тем, что мы ему даём. И от того, насколько качественным будет исходник, напрямую зависит, насколько крутым будет финал.

Что нейросеть ждет от тебя на самом деле

Давай на секунду представим разговор двух подкастеров. Первый говорит: “Да ладно, наговорю в диктофон, а потом нейросетка всё почистит, уберет шум от кондиционера, уберет эхо, сделает громкость, как надо”. Второй же, более опытный, потратил полчаса на то, чтобы найти в комнате самое тихое место, проверил, не гудит ли компьютер, и выключил все лишние приборы. У кого из них в итоге получится подкаст, который будет звучать профессионально и дорого? Ответ, я думаю, очевиден.

ИИ-помощники, о которых мы будем говорить дальше, невероятно умны. Но их ум заключается в распознавании закономерностей. Они обучены на миллионах часов чистой, качественной речи. И когда они получают грязный сигнал, они пытаются привести его к тому самому идеалу, который у них “в голове”. Но если сигнал слишком плох, нейросеть начинает додумывать. Она убирает шум, но вместе с ним может съесть и часть твоего голоса, сделать его неестественным, “пластиковым”, добавить странные артефакты, похожие на бульканье под водой.