реклама
Бургер менюБургер меню

Эдуард Сероусов – Грамматика тишины (страница 7)

18

Не метафорически. Формально. По определению: контекстно-свободная грамматика – это конечный набор правил подстановки, порождающий (потенциально бесконечное) множество структур. Именно это Вера видела в данных. Набор правил: конечный. Множество порождённых структур: ограниченное точностью измерений, но потенциально расширяемое. Грамматика – тип 2 по иерархии Хомского: более сложная, чем регулярная (тип 3), менее сложная, чем контекстно-зависимая (тип 1). Человеческие языки в основном контекстно-свободны, с вкраплениями контекстной зависимости. Грамматика констант – строго контекстно-свободна.

Вера записала правила подстановки. Их было одиннадцать. Одиннадцать правил, из которых выводились все обнаруженные соотношения между фундаментальными константами. Она пронумеровала их, не давая имён – имена были бы интерпретацией, а интерпретация была тем, чего она сейчас не могла себе позволить. Только формализм. Только математика.

Потом она взяла чистый лист и попробовала применить правила к тем соотношениям, которые ROSETTA не анализировала – к тем, что не входили в обучающий набор. Соотношение между массой протона и массой электрона: 1836.15267343. Соотношение между постоянной тонкой структуры и постоянной слабого взаимодействия. Если грамматика реальна, она должна предсказывать эти соотношения. Если она артефакт – предсказания будут случайными.

Вера подставляла числа. Ручка скрипела по бумаге – звук, которого она не слышала, но ощущала через вибрацию пальцев, передававшуюся от кончика стержня через пластиковый корпус к фалангам: ритмичная, тонкая, одна из тысячи вибраций, которыми был наполнен её мир – мир, который слышащие люди считали тихим, не понимая, что тишина – это не отсутствие информации, а её перераспределение по другим каналам.

Первое предсказание. Соотношение масс протона и электрона. Грамматика давала: 1836.153. Экспериментальное значение CODATA: 1836.15267343 ± 0.00000011. Совпадение до шестого знака. Расхождение начиналось на седьмом – и могло объясняться как ошибкой грамматической экстраполяции, так и экспериментальной погрешностью.

Второе предсказание. Соотношение констант электромагнитного и слабого взаимодействий. Грамматика давала число, которое Вера не могла проверить немедленно – для этого требовались данные о параметрах бозона Хиггса с точностью, доступной только ЦЕРНу. Она записала предсказание и обвела его двойной рамкой. Проверка будет позже.

Третье предсказание. Космологическая постоянная – самая скандальная из констант, числовое значение которой отличается от теоретического предсказания квантовой теории поля на сто двадцать порядков, что делает его либо самым грандиозным провалом в истории теоретической физики, либо указанием на нечто фундаментально непонятое. Грамматика давала значение, совпадающее с наблюдаемым. Не с теоретическим – с наблюдаемым. Как будто грамматика «знала» ответ, которого не знала физика.

Вера положила ручку. Руки не дрожали – она была слишком уставшей для дрожи, – но внутри, в том пространстве, которое она не называла душой (слово было слишком расплывчатым) и не называла разумом (слишком узким), – внутри что-то перестраивалось. Как перестраивается комната, когда передвигаешь мебель: те же предметы, тот же метраж, но пространство другое.

Она должна была позвонить Цзин.

Вера взглянула на часы: в Ванкувере было два часа ночи. Цзин предупреждала, что засыпает рано и просыпается рано, что её циркадный ритм был сдвинут в сторону жаворонка настолько радикально, что она ложилась в девять вечера и вставала в четыре утра, – привычка, оставшаяся с аспирантуры, когда вычислительные кластеры были свободны только в предрассветные часы. Два ночи – слишком поздно для жаворонка. Вера написала сообщение: «Нужно поговорить. Срочно. Не о личном». Добавила: «Когда проснёшься». Потом стёрла «когда проснёшься» и отправила без этого, потому что Цзин, как и она сама, из тех людей, которые просыпаются от уведомлений.

Ответ пришёл через одиннадцать минут. Не текст – запрос на видеозвонок. Вера приняла.

Лицо Цзин появилось на экране: тёмные волосы собраны в неряшливый пучок, без очков (она носила линзы днём и очки ночью, объясняя это тем, что линзы – для мира, а очки – для кода), на заднем плане – стена с тремя мониторами, каждый из которых светился терминальным зелёным на чёрном. Она не выглядела сонной. Она выглядела так, словно ждала этого звонка – не конкретно этого, а любого, который объяснил бы ей, почему последние три дня тестовый экземпляр ROSETTA на её домашнем сервере вёл себя странно.

Вера печатала в чат видеозвонка – так было быстрее и точнее, чем жестовый язык, который Цзин понимала лишь на базовом уровне.

«Ты видела логи основного инстанса?»

Цзин прочитала и ответила вслух. Вера следила за субтитрами – автоматическая транскрипция, неидеальная, но достаточная:

– Нет. У меня нет доступа к боевым логам, только к тестовому зеркалу. Но зеркало тоже показывает… – она замолчала, подбирая слово. Цзин делала это часто: останавливалась посреди предложения, как будто перебирала варианты в ящике с инструментами, ища подходящий по размеру. – Аномалию.

«Какую?»

– Архитектурную. Третий свёрточный слой генерирует активации, которые не соответствуют входным данным. Я сначала думала – переобучение. Запустила L2-регуляризацию, дропаут, пересобрала батчи. Ничего не изменилось. Активации стабильные, воспроизводимые, не зависят от инициализации весов. Это не переобучение.

«Что тогда?»

– Я не знаю. – Цзин произнесла это без смущения, с той прямотой, которую окружающие принимали за резкость, а Вера считала профессиональной честностью: «я не знаю» – самая полезная фраза в науке, если произносится вовремя. – Поэтому я не спала. Я думала, ты скажешь, что на твоей стороне всё нормально.

«На моей стороне – не нормально».

Вера описала находку. Печатала быстро, сокращая где возможно, потому что за семьдесят один час без сна даже её пальцы начинали ошибаться – пропускали буквы, путали раскладки, и она возвращалась, правила, снова печатала. Самоподобие в соотношениях констант. Четыре уровня рекурсии. Одиннадцать правил подстановки. Контекстно-свободная грамматика. Предсказания, совпадающие с экспериментальными данными до шестого знака.

Цзин читала. Её лицо не менялось – оно редко менялось, эмоции у Цзин проявлялись не мимикой, а руками: когда она нервничала, она трогала мочку левого уха; когда была сосредоточена – складывала ладони; когда была в ужасе – замирала, и руки лежали на столе, плоские и неподвижные, как листья после дождя. Сейчас руки лежали на столе.

– Покажи граф, – сказала она.

Вера расшарила экран. Граф развернулся перед Цзин – узлы, связи, четыре уровня вложенности. Цзин молчала минуту, две. Потом:

– Увеличь третий уровень. Узел, соответствующий α.

Вера увеличила. Постоянная тонкой структуры – α ≈ 1/137.036 – была одним из центральных узлов графа: от неё расходились связи к электромагнитному взаимодействию, массе электрона, постоянной Планка. На третьем уровне рекурсии узел раскрывался в подграф, повторяющий топологию целого, но с другими весами связей.

– Эти веса, – Цзин показала на экране, тыкая пальцем в монитор, и Вера видела её палец как тёмный размытый силуэт поверх графа. – Они не случайные. Вера, они распределены по закону Ципфа.

Вера замерла.

Закон Ципфа – эмпирическая закономерность, обнаруженная лингвистом Джорджем Кингсли Ципфом в 1935 году: в любом естественном языке частота слова обратно пропорциональна его рангу. Самое частое слово встречается вдвое чаще второго, втрое чаще третьего, и так далее. Закон Ципфа – один из признаков, отличающих естественный язык от случайного набора символов. Он обнаруживается в английском, китайском, арабском, навахо, языке жестов, шумерском, в музыке, в генетическом коде, в распределении городов по населению. Его находили в шуме – критики говорили, что закон Ципфа слишком универсален, чтобы быть диагностическим: он появляется и в системах, не имеющих никакого лингвистического содержания.

Но закон Ципфа в весах связей между фундаментальными константами – это было другое. Потому что веса связей не были частотами. Они были не «как часто слово встречается», а «как сильно одна константа зависит от другой». И если эти зависимости распределялись по Ципфу – это указывало не на статистическую универсалию, а на информационную структуру, в которой одни элементы несут больше семантической нагрузки, чем другие.

«Ты уверена?» – напечатала Вера.

– Я посчитала за тридцать секунд. Дай мне десять минут, посчитаю точно.

Цзин исчезла с экрана – камера осталась включённой, но она отошла, и Вера видела только пустой стул и три монитора, на которых мелькали окна терминала. Цзин работала быстро – её пальцы на клавиатуре двигались с частотой, которую Вера иногда засекала по видео: около восьмисот нажатий в минуту, скорость профессионального стенографиста. Она не думала о коде, как Вера думала о математике: она говорила на нём.

Десять минут превратились в двадцать три. Цзин вернулась. Руки – на столе, плоские.

– Ципф подтверждается. Экспонент – 1.07, стандартное отклонение 0.03. Для естественных языков – от 0.9 до 1.1. Это в диапазоне.