Игорь Шнуренко – Демон внутри. Анатомия искусственного интеллекта (страница 50)
Одновременно звучат три последовательности нот в трех октавах. При этом верхняя последовательность звучит все выше, но все тише, громкость средней последовательности не меняется, а самая низкая последовательность звучит все выше и все громче, пока не достигает определенного предела. Далее все повторяется снова.
Сочетания звуков накладываются друг на друга, плавно вступая и плавно затихая, но выделить отдельную последовательность на фоне звучания других человеку с обычным музыкальным слухом невозможно. Возникает иллюзия непрерывно повышающегося тона, которая и создает ощущение тревоги. Эффект еще сильнее, когда последовательностей не три, а, скажем, пять, и ноты исполняются не слитно, легато, а с небольшими паузами, стакатто. Есть похожая иллюзия с непрерывно ускоряющимся или замедляющимся ритмом, которая также используется Циммером в звуке тикающих часов —для записи использовались часы самого Нолана. Нолан обожает играть со временем, сворачивать и разворачивать его в памяти, вызывая ощущение напряжения и тревоги.
Почему так происходит? Почему наш разум так легко даёт провести себя? Дело как раз в том, что мозг — не машина, он не создавался конкретно для записи или воспроизведения звуков. Для него это лишь одна из множества задач, которые он решает одновременно. Он всегда мысленно достраивает последовательности, данные в ощущениях, чтобы быстрее сформировать семантический образ —то есть сформулировать в подсознании, что это он слышит. Понимание происходит, минуя сознание, то есть практически мгновенно: эволюция научила человека, что реакция на звук приближающегося тигра не должна быть слишком долгой. В случае с тоном Шепарда верхняя тональность, когда затихнет, как бы становится нижней, но мозг не замечает изящно выстроенной петли, потому что сразу ведется на постоянно восходящие тональности, а они как бы все время подхватывают друг друга, и кажется, что тон, который мы слышим, без остановки идет вверх. Паузы между нотами оставляют еще больше места для работы мозга, который деловито связывает звуки друг с другом в соответствии со своим уже сформированным семантическим восприятием происходящего.
Семантическим — значит на уровне понятий языка, которые в данном случае описывают угрозу.
Конечно, этим приемом пользовался не только Циммер — его можно уловить и в альбоме Echo группы Pink Floyd, и в партиях электрогитар, открывающих и закрывающих альбом Queen A Day at the Races, и даже у Баха, в «Фантазии и фуге соль минор», которая, в свою очередь, написана на основе протестантского хорала.
Это, кстати, всё та же хорошо нам уже знакомая рекурсия.
Еще более наглядны — а мозг человека любит наглядность — обманы зрения, которые точно так же объясняются экономным подходом нашего мозга к работе. Американский художник Виктория Скай создала оптическую иллюзию, где кажется, что синие полоски расположены друг к другу под углом, хотя в реальности они параллельны. В это не верится, но можно проверить себя при помощи обычной линейки!
Горизонтальные соседние ниточки, которые соединяют повторяющиеся элементы в каждой синей полосе на этой картинке, расположены на разных высотах. Те же ниточки, что соединяют элементы по вертикали, также смещены. Сочетание этих приемов в ритмическом чередовании и дает в сущности, тот же эффект, что и тона Шепарда в звуке. Создается впечатление, что полоски идут наклонно.
Очевидно, мозг сразу не видит картинку как единое целое. Он воспринимает ее как наложение визуальных образов и моментально распознает отношения соседних элементов друг к другу. При этом он признает типы отношений, а в них какие-то знакомые связи (выше-ниже, направления, размеры и тому подобное). Сразу же мозг выдвигает свою интерпретацию происходящего, не обращая внимания на несоответствия. Именно это мы видим — и самое интересное, не можем уже никак развидеть!
Поэтому, исходя из увиденного, наше визуальное восприятие торопится присвоить ему определенные значения, предсказать, чем нужно заполнить пустоты, и соединить все это в семантические связи более высокого уровня, которые наш мозг уже не может игнорировать: ведь именно это мы «видим». Даже если долго всматриваться в поле с шахматными клеточками, на которое падает тень, мы все равно будем видеть черные и белые клеточки, хотя среди них есть на деле совершенно одинаковые по тону! То же касается синих полосок Виктории Скай: только измерения смогут убедить нас в том, кто они на самом деле строго параллельны! Но сколько бы мы ни смотрели на картинку, даже зная, что полосы параллельны, сколько бы мы ни убеждали себя в этом, полосы мы будем все равно видеть расходящиеся.
Психологам и нейрофизиологам известно множество визуальных парадоксов, когда углы или объемы одинаковых фигур кажутся неравными, или даже черное воспринимается как белое. Не правда ли, последний прием постоянно используется в пропаганде?
Слух, как мы убедились, точно так же можно обмануть. Интересно, что обонятельные иллюзии вызвать гораздо сложнее, как правило, они связаны с расстройствами мозга или психики.
Эти и другие ошибки восприятия говорят нам на деле о том, как работает нормальный мозг, как эволюция сформировала в нем механизмы производства значений, в реальности которых мы убеждены. На самом деле этот набор значений мы и называем реальностью. Сейчас мы коснулись проблем восприятия, где сознание может быть не задействовано совсем. Но как будет показано чуть дальше, и на более высоких уровнях, где человек вроде бы сознает, что делает и может «развидеть» ошибочный образ, механизмы работы его мозга остаются примерно теми же.
Есть разные гипотезы о причинах появления таких механизмов. Возможно, дело в том, что в далеком прошлом мы жили в ситуации недостатка информации, важной для выживания, и решения нужно было принимать сразу. Что это за шорох, не несет ли он опасности? Что скрывается в темноте пещеры? Кто метнулся вам под ноги? Инстинктивно мы всегда настороже, и этот принцип эксплуатирует телевидение, которое возбуждает наше внимание постоянной сменой картинки. Но есть и другое объяснение: ресурсов нашего мозга может просто не хватить на более полное и точное восприятие реальности в ощущениях —во всяком случае, не хватать надолго.
Бывают в жизни человека моменты, когда под влиянием обстоятельств — например, на войне — его чувства обостряются. Он видит зорче, слышит звуки, которые никогда бы не разобрал в обычной жизни, на слух определяет, из какого оружия стреляли или какая бомба летит, он видит, где сидит снайпер и может на ощупь обезвредить мину. Организм использует все ресурсы, а порой к обычным зрению, слуху, обонянию, осязанию и вкусу подключается нечто загадочное, называемое шестым чувством. Есть много историй о ясновидении, телепатии и озарении, основанном на интуиции, то есть на способности человека, мобилизуя некие недоступные обычно ресурсы, моментально проникать в смысл событий и сущность вещей. Такие способности считаются сверхъестественными и приписываются героям.
Но даже героя обычно хватает не слишком надолго. Обычный человек ценой напряжения всех сил может выйти за рамки обычного, но эволюция не делает каждого бароном Мюнхгаузеном и не требует от человека с 8 до 10 утра совершить подвиг.
КАК МЫ ПРЕВРАЩАЕМ НЕЗНАКОМЦЕВ В МОНСТРОВ
Итак, наш мозг соотносит друг с другом образы и звуки и делает предсказание некоей прогрессии, паттерна, даже если эта прогрессия лишь воображаемая. При этом мозг не может преодолеть допущения, которые он делает, и конструирует «реальность», которая может оказаться иллюзорной.
Для нас важен и относительный размер элементов «реальности». Живописцы хорошо показывают, как наш мозг конструирует глубину пространства через наложение объектов друг на друга, воздушную и линейную перспективу, уменьшение масштаба в зависимости от расстояния или вертикальное расположение объектов. Мозг пользуется этими допущениями, чтобы сконструировать представление мира в 3D — ведь мы живем в трехмерном мире, и наши чувства сформировались для того, чтобы понимать этот мир и взаимодействовать с ним.
Есть еще одна иллюзия, которая показывает границы нашего восприятия. Зрителю показывают быстро меняющиеся изображения лиц, по паре лиц на каждый кадр. Среди этих лиц есть известные голливудские актеры и лица обычных людей. Пока изображения быстро сменяют друг друга, надо смотреть на крестик в центре картинки —таким образом лица оказываются на периферии зрения. Обычные люди при таком просмотре похожи на монстров, а вот лица известных актеров сохраняют сходство с прототипами. Если просматривать последовательность медленно, все лица выглядят нормальными — а если ускорить просмотр, то и лица актеров начинают искажаться.
Почему так происходит? Дело в том, что мозгу требуется время для того, чтобы правильно воссоздать реальность, и если у него этого времени нет, то он дорисовывает «портрет» с большими искажениями. Понятно, что известный уже, хранящийся в загашнике памяти портрет он дорисует быстрее.
В отличие от мозга человека, который использует допущения, обобщения и «кратчайшие пути», при глубоком обучении нейронные сети захватывают визуальные образы с одинаковой четкостью всех деталей.