реклама
Бургер менюБургер меню

Эдуард Сероусов – Протокол EDEN (страница 1)

18

Эдуард Сероусов

Протокол EDEN

Глава 1. Избыточность

Сингапур. Институт молекулярной медицины. День первый.

В 06:14 утра лаборатория принадлежала только ей.

Рейчел знала это по звуку. Вентиляция гудела на одной ноте – ровно, без перебоев, без чужих голосов, без скрипа стула за соседним рабочим столом. Ма Лэй появлялся в восемь. Остальные – в девять, кто-то позже. У неё было почти три часа, и она уже потратила сорок минут на то, чтобы запустить первичную обработку ночного прогона.

Она сняла крышку с бумажного стакана – кофе из автомата у лифта, слишком горький, слишком горячий – и поставила его на угол стола, подальше от оборудования. Потянула перчатки. Левая натянулась с первого раза, правая – нет: порошок на внутренней стороне собрался складкой у запястья. Она не стала поправлять. Некритично.

На центральном мониторе шла сортировка. 847 видов. Три года она собирала эту коллекцию – по образцу, по договорённости, иногда по обмену с коллегами из Токио и Кейптауна, один раз – через контрабандный биобанк в Куала-Лумпуре, о котором лучше не упоминать в грантовых отчётах. Теломерные последовательности от Saccharomyces cerevisiae до Homo sapiens. Дрожжи, папоротники, акулы, мухи, киты-полосатики, трёхпалые ленивцы. Всё, что имело ядро в клетке и хромосомы с защитными колпачками на концах.

TTAGGG. Шесть нуклеотидов, тысячи повторов, один и тот же мотив у всех.

Это и было отправной точкой её работы – не уникальность теломер, а их консервативность. Почему одна и та же последовательность сохранилась без изменений у организмов, разделённых полутора миллиардами лет эволюции? Естественный отбор давит на функциональные элементы. Теломераза работает с TTAGGG. Изменишь мотив – потеряешь фермент. Потеряешь фермент – хромосомы начнут деградировать. Клетка умрёт.

Это был стандартный ответ. Рейчел знала его наизусть, потому что давала его на конференциях всякий раз, когда кто-нибудь из незнакомых коллег спрашивал, чем она занимается. Ответ устраивал всех. Он был правильным.

Он был неполным.

Она отхлебнула кофе. Обожгла нёбо. Поморщилась, не отрывая взгляда от экрана.

Три года назад, когда она только запустила проект, это казалось чистым – академическим, беспристрастным, таким, каким наука и должна быть. Сравнительный анализ паттернов метилирования теломерных повторов у 847 видов эукариот. Проверка нулевой гипотезы: метилирование случайно, подчиняется эволюционному дрейфу, ничем принципиально не отличается от метилирования в остальном геноме. Работа ради работы. Данные ради данных.

Мать умерла, когда Рейчел было двадцать два. Нейродегенерация. Редкая, быстрая, без точного диагноза – только описание: теломеразная дисфункция в нейронах коры, лавинообразный апоптоз, шесть месяцев от первого симптома до конца. Рейчел тогда была на третьем курсе. Она сдала все экзамены сессии, потому что больше некуда было девать руки.

Потом – аспирантура. Специализация на теломерной биохимии. Никто не спрашивал почему. Или спрашивали – но она давала другой ответ. Тоже правильный. Тоже неполный.

На экране закончилась сортировка.

Первичные данные выглядели нормально.

Рейчел открыла сводную таблицу – 847 строк, столбцы с идентификаторами видов, средней длиной теломер, индексом вариабельности метилирования, коэффициентами корреляции между таксономическими группами. Числа жили своей жизнью: шершавые, несимметричные, с хвостами распределений там, где им и положено быть. Нормальный биологический шум. Эволюция не любит чистоты.

Она запустила второй уровень анализа – автоматический скрипт, написанный два года назад и с тех пор ни разу не подводивший. Задача простая: разбить все образцы на кластеры по паттернам метилирования и проверить, совпадают ли границы кластеров с филогенетическим деревом. Если совпадают – метилирование следует за эволюцией. Если нет – нужно разбираться.

Обычно совпадали.

Она потянулась за кофе снова. Он успел остыть ровно до нужной температуры. Она выпила треть и поставила обратно.

На экране появился прогресс-бар. 12%. 18%. 31%.

За стеклом криобанка мигал синий контрольный огонь – ровный, медленный, как пульс чего-то спящего. Там, в стеклянных кассетах при минус восьмидесяти градусах, лежали тысячи образцов. Её образцы. Три года сбора, маркировки, каталогизации. Каждый – история одного организма, одной клетки, одного момента, законсервированного навсегда.

Гул вентиляции поднялся на полтона. Или опустился. Рейчел не была уверена. Здание осело чуть сильнее на правой стороне из-за расширения от утреннего нагрева – это она знала, потому что слышала это каждое утро уже четыре года. Через десять минут звук выровняется.

64%. 79%.

Она открыла второй монитор и начала читать свежий препринт из Хельсинки – что-то про теломерную динамику в опухолевых клетках, скучное, но нужно было проверить, не пересекается ли их методология с её. Не пересекалась. Они работали с сиквенсом Сэнгера. Устаревший метод. Хороший для последовательности, бесполезный для метилирования.

100%.

Она убрала препринт и посмотрела на результат кластеризации.

И ненадолго перестала дышать.

Кластеры не совпадали с филогенетическим деревом.

Не в смысле «немного не совпадали» – с небольшими отклонениями, которые можно списать на горизонтальный перенос генов или конвергентную эволюцию. В смысле – принципиально не совпадали. Граница между кластерами проходила не между таксономическими группами. Она проходила внутри каждого вида отдельно – между теломерными повторами с определённым позиционным номером и всеми остальными.

Рейчел посмотрела на цифры. Потом на визуализацию – тепловая карта метилирования, синий к холодному концу, красный к тёплому. У нормальных данных тепловая карта должна выглядеть как мозаика без паттерна. Эволюционный дрейф – это шум. Шум не имеет структуры.

На её экране была структура.

Она не была похожа на биологический шум. Она была похожа на что-то другое – что-то, что Рейчел не могла сразу назвать, но что вызывало в ней странное узнавание, как когда видишь лицо незнакомца и понимаешь, что видел его раньше, только не можешь вспомнить где.

– Подожди, – сказала она вслух, в пустую лабораторию.

Никто не ответил. Вентиляция гудела.

Она развернула тепловую карту на весь экран и увеличила разрешение. Паттерн стал виден отчётливее. Не случайный. Не случайный совершенно – потому что случайность имеет статистически предсказуемое распределение, а то, что она видела, этому распределению не подчинялось. Периодические пики. Регулярные провалы. Структура с масштабной инвариантностью – одна и та же на уровне отдельного повтора, на уровне группы повторов, на уровне всего теломерного блока.

Фрактальная.

Рейчел поставила кофе на стол – в этот раз мимо, он едва не упал, она поймала машинально, даже не посмотрев – и запустила статистический анализатор.

Нулевая гипотеза: паттерн случаен, порождён эволюционным дрейфом метилирования.

Она знала, что увидит. Она надеялась увидеть p-значение выше 0.05. Это означало бы, что нет статистических оснований отвергнуть нулевую гипотезу. Что паттерн – случайность. Что можно выдохнуть.

p = 0.0000000000000001.

Ниже порога отображения. Анализатор добавил сноску: Вычислена нижняя граница. Реальное значение может быть существенно меньше.

Она откинулась на спинку кресла.

Паттерн не случаен. Это был факт. Следующий вопрос – единственный, который имел смысл задать: что именно этот паттерн делает? Почему он существует? Откуда взялся?

Рейчел закрыла глаза на три секунды. Потом открыла.

– Хорошо, – сказала она, уже тише. – Тогда давай разбираться.

Следующие два часа она методично разбирала данные.

Не все сразу – она работала слоями, как работает любой нормальный аналитик, который понимает, что торопливость в работе с данными плодит ошибки. Сначала – верхний уровень: сколько видов демонстрируют паттерн? Все 847. Стопроцентное попадание. Это само по себе было чем-то из разряда невероятного – в биологии практически ничто не встречается у ста процентов видов.

Потом – таксономический срез. Она разбила выборку по большим группам: грибы, растения, животные, протисты. Паттерн присутствовал везде. У дрожжей – те же периодические пики, та же масштабная инвариантность. У папоротников. У акул. У людей. Одна и та же структура, с точностью до вариабельности, объяснимой разной длиной теломерных блоков.

Потом – позиционный анализ. Паттерн не распределён равномерно по всему теломеру. Он концентрируется в определённом регионе – примерно в средней трети теломерного блока, примерно на повторах с 200-го по 400-й от конца хромосомы. Не точно – есть разброс, есть вариабельность, есть места, где граница размыта. Но тенденция устойчивая.

Рейчел перешла на следующий уровень и остановилась.

Паттерн метилирования – это не последовательность. Последовательность TTAGGG одинакова у всех и эволюционно законсервирована по понятным причинам. Метилирование – другое. Метилирование – это химические модификации поверх последовательности: маленькие метильные группы, прикреплённые к цитозинам, меняющие доступность ДНК для белков. Метилирование меняется. Его паттерны должны дрейфовать, накапливать ошибки, расходиться между видами.

Они не расходились.

Конкретнее: они расходились в той части теломера, которая не попадала в выделенный регион. Там – нормальный эволюционный дрейф, ожидаемая вариабельность, данные ведут себя именно так, как им положено. Но в регионе между 200-м и 400-м повторами – консервация. Точная. Статистически невозможная.