Эдуард Сероусов – Слепое пятно вида (страница 7)

Шрифт

Но числа складывались. Числа всегда складывались – в этом была их жестокость и их красота. Дата. Возраст. Пол. Место. Паттерн. Ретикулярное ядро таламуса, кричащее на всех частотах одновременно: фильтр перегружен, фильтр не справляется, входящий сигнал превышает пропускную способность.

Её таламус пытался отфильтровать то же самое, что и у семерых.

Её мозг боролся с тем же, с чем и их мозги.

Она не была больна.

Мысль пришла – не как вывод, не как гипотеза, а как удар, физический, в солнечное сплетение, – и Рэй согнулся, упёрся ладонью в стену рядом с дверью, и стоял так, и дышал, и считал вдохи, потому что счёт был конкретным действием.

Он не знал наверняка. Но числа складывались. И он – нейровизуализатор, человек, всю жизнь читавший мозги как тексты, – впервые за двадцать один месяц не мог отвести взгляд от текста, который писала его мёртвая дочь.

Глава 3: Семнадцать минут

Проблема не в том, что мы не нашли сигнал. Проблема в том, что мы искали неправильно. Нет – проблема в том, что мы не могли искать правильно, потому что «правильно» означало бы смотреть на данные так, как не умеет ни один человеческий мозг, а мы – люди, и значит, каждый инструмент, который мы создаём, каждый алгоритм, который мы обучаем, каждый фильтр, каждый порог отсечения, каждое чёртово решение о том, что является шумом, а что – сигналом, – всё это проходит через нашу перцепцию, как вода через фильтр, и на выходе остаётся только то, что мы способны распознать.

Лина Шарма стояла перед четырнадцатью мониторами в серверной бывшего промышленного склада на окраине Хадживади, в девяти километрах от основной площадки GMRT, и думала эту мысль – не впервые; она думала её последние одиннадцать месяцев, прокручивая, переформулируя, сжимая до одного предложения и снова разворачивая, как человек, который нащупал нитку в свитере и теперь тянет, потому что понимает: за ниткой – всё.

Жара снаружи – сорок один по Цельсию, октябрь, пост-муссон, воздух как горячий сироп. Внутри – девятнадцать, кондиционеры на полную, и контраст между двумя мирами был настолько резким, что каждый раз, открывая дверь серверной, Лина ощущала его физически – как шаг из одного агрегатного состояния в другое. Снаружи – пыль, свет, бесконечное поле, на горизонте – тридцать параболических антенн GMRT, каждая сорок пять метров в диаметре, расставленные по Y-образной конфигурации на площади в двадцать пять километров. Самый большой метроволновый радиотелескоп в мире. Шестьдесят лет слушания космоса. Шестьдесят лет тишины.

Не тишины. Шума.

В этом вся суть – и до неё не мог додуматься никто, потому что мысль требовала допущения, на которое учёные не идут: что инструмент, с помощью которого ты ищешь, встроенным образом неспособен найти то, что ты ищешь. Не сломан, не неточен – неспособен по архитектуре. Как если бы ты искал ультрафиолетовое излучение человеческим глазом: глаз работает прекрасно, зрение безупречно, но ультрафиолета ты не увидишь, потому что рецепторов нет. И сколько бы ты ни совершенствовал глаз – увеличивал разрешение, расширял поле зрения, добавлял контраст – ультрафиолет останется невидимым, потому что проблема не в качестве зрения, а в его природе.

Лина села в кресло – жёсткое, офисное, одно из двенадцати одинаковых, закупленных в IKEA в Мумбаи, когда проект получил финансирование, – и открыла терминал. Четыре тридцать утра. Она не спала двадцать два часа, но это было нормально; у Лины не существовало понятия «нормальный режим сна». Существовало состояние думания и состояние недуманья, и второе наступало только тогда, когда первое исчерпывало нейромедиаторы, как двигатель исчерпывает топливо – не по расписанию, а по факту. Она забыла поужинать. И пообедать. На столе стояла чашка с остатками кофе, покрытыми радужной плёнкой – кофе был заварен вчера утром.

Проект назывался SETI-Next. Официально – «Autonomous Signal Detection in Low-Frequency Radio Data Using Self-Supervised Neural Architectures». Финансирование – грант Индийского департамента науки и технологий, дополненный частным пожертвованием от технологического фонда из Бангалора, основатель которого в юности мечтал стать астрофизиком, а стал миллиардером, что, по мнению Лины, было менее интересно, но более полезно.

Суть проекта: обучить нейросеть на необработанных данных GMRT – не на человеческих категориях «сигнал» и «шум», а на самих данных, – и посмотреть, что она найдёт. Идея казалась банальной, и в этом была проблема: каждый, кому Лина её излагала, кивал, говорил «очевидно», и не понимал, в чём новизна. Новизна была не в идее. Новизна была в одном конкретном решении, которое никто до неё не принял, потому что оно требовало отказа от базового принципа научной верификации.

Она убрала человека из петли.

Не из обучения – это делали и до неё. Self-supervised learning, unsupervised clustering, anomaly detection без размеченных данных – стандартный инструментарий с середины 2010-х. Каждый проект SETI последних двадцати лет использовал автономные алгоритмы в той или иной форме. Breakthrough Listen. PANOSETI. LaserSETI. Все – с автономным обучением.

Но все – с человеческой верификацией.

Это был шаг, который казался естественным и неизбежным, как последняя проверка перед публикацией: алгоритм обучается сам, находит аномалии, генерирует список кандидатов – и человек-оператор просматривает результаты. Оценивает. Решает: сигнал или шум. Это называлось human-in-the-loop, и это считалось не ограничением, а гарантией качества, потому что – и здесь Лина двигалась по логической цепочке, которую она выстраивала одиннадцать месяцев, звено за звеном, с жёсткостью, пугавшей её коллег, – потому что все предполагали, что человек способен отличить сигнал от шума. Что если сигнал существует, человеческий мозг его распознает. Что конечная инстанция проверки – человеческое восприятие – надёжна.

А что, если нет?

Лина задала этот вопрос Виктору Маалуфу, руководителю Breakthrough Listen, на конференции IAU в Бусане – восемнадцать месяцев назад, за ужином, между вторым бокалом вина и десертом. Маалуф – седой, насмешливый ливанец с Оксфордским PhD и привычкой говорить афоризмами – посмотрел на неё поверх очков и сказал: «Лина, если человек не может верифицировать результат, то результат не существует. Это не методология. Это эпистемология. Наука – то, что воспроизводимо человеком».

– А если объект исследования – за пределами человеческого восприятия? – спросила Лина.

– Тогда мы строим инструменты. Телескопы. Детекторы. Ускорители.

– Все инструменты спроектированы людьми. Все результаты интерпретируются людьми. Человек – не на входе, так на выходе. Мы не убрали бутылочное горлышко, мы переместили его.

Маалуф улыбнулся. Налил ей ещё вина. «Вы описываете философскую проблему, не научную. SETI – наука. Мы ищем радиосигналы, лазерные импульсы, спектральные аномалии. Конкретные, измеримые, воспроизводимые. Если сигнал не может быть распознан человеком – он не сигнал».

Лина допила вино, поблагодарила и ушла к себе в номер. Не потому, что обиделась – ей было скучно. Маалуф был умным человеком, говорящим банальности, и банальности были правильными в рамках парадигмы, которую Лина собиралась разрушить, но объяснять это за десертом не имело смысла. Объяснять вообще не имело смысла. Нужно было показать.

Она вернулась в Пуну и начала строить.

Одиннадцать месяцев. Команда из семи человек – трое аспирантов, два постдока, системный инженер, она. Джамал Аль-Рашид – постдок из Аммана, двадцать девять лет, специалист по обучению без учителя, – работал больше всех, не считая её. Он приходил в лабораторию к семи, уходил в одиннадцать, и в промежутке между этими часами генерировал код с плотностью и точностью, которые Лина видела у одного, может быть двух человек за всю карьеру. Его жена, Самира, микробиолог по образованию, приезжала в Пуну ради него, оставив позицию в институте в Аммане. Лина видела её дважды: один раз – на вечеринке лаборатории в честь нового гранта (Самира стояла у стены, улыбалась, не знала никого); второй – когда Самира принесла Джамалу обед, потому что он забыл, как забывал каждый день. Лина подумала тогда: она бросила карьеру, чтобы кормить его обедами. Мысль была несправедливой – Самира бросила карьеру ради совместной жизни, обеды были следствием, не причиной, – но Лина не умела думать справедливо о вещах, которые не относились к данным.

Архитектура алгоритма: свёрточная нейросеть, обученная на необработанных спектрограммах GMRT. Обучающая выборка – двадцать терабайт архивных данных за последние три года. Никакой разметки, никакой категоризации, никаких лейблов «сигнал» и «шум». Сеть обучалась на статистической структуре самих данных – искала паттерны, регулярности, аномалии, не зная, что именно ищет. Обучение заняло шесть недель на кластере из восьмидесяти GPU, арендованных у облачного провайдера в Хайдарабаде.

Результат первого этапа: сеть нашла всё, что должна была найти. Пульсары, квазары, солнечные вспышки, наземные помехи, спутниковые отражения, грозовые разряды в ионосфере. Каждый известный источник сигнала в архиве GMRT – обнаружен и каталогизирован. Точность – 99,2%. Лина проверила результаты, и результаты были безупречны, и она была разочарована, потому что безупречность означала, что сеть научилась видеть ровно то, что видели люди. Быстрее, точнее – но то же самое.

6 7 8 9 Вперед