Станислас Деан – Прямо сейчас ваш мозг совершает подвиг. Как человек научился читать и превращать слова на бумаге в миры и смыслы (страница 5)
Поиск инвариантов
КЛИТАНДР. Так ты умеешь читать?
ЛЮБЕН. Да, по печатному, а вот по писаному никак не могу научиться.
Чтение ставит перед нами сложную перцептивную[29] задачу. Мы должны идентифицировать слова независимо от их длины и того, какими буквами они написаны – печатными или рукописными, строчными или заглавными. Психологи называют это
Если перцептивная инвариантность представляет собой проблему, то это потому, что слова не всегда располагаются в одном и том же месте и не всегда напечатаны одним и тем же шрифтом одинакового размера. Будь оно так, для декодирования было бы достаточно лишь перечислить активные и неактивные клетки на сетчатке. Именно так поступает компьютер: любое черно-белое изображение определяется списком составляющих его пикселей. Однако в реальности одному и тому же слову могут соответствовать сотни различных изображений на сетчатке. Все зависит от того, как именно оно написано (рис. 1.2). Следовательно, одна из первоочередных задач при чтении – компенсировать огромное разнообразие этих поверхностных форм.
Рис 1.2. Зрительная инвариантность – одно из важнейших свойств человеческой системы чтения. Наше устройство распознавания слов удовлетворяет двум, казалось бы, противоречивым требованиям: оно пренебрегает несущественными вариациями в форме знаков, даже если они огромные, но усиливает релевантные различия, даже если они совсем крошечные. Без нашего ведома зрительная система автоматически компенсирует бесчисленные вариации в размере и шрифте. Вместе с тем она замечает малейшие изменения формы. Превращая букву «s» в букву «е» и, следовательно, «
Сразу несколько признаков указывают на то, что наш мозг эффективно решает проблему перцептивной инвариантности. Держа газету на некотором расстоянии от глаз, мы можем прочесть и заголовки, и рекламные объявления. Хотя одни слова могут быть меньше других в 50 раз, это не оказывает особого влияния на скорость чтения. Эта задача не сильно отличается от задачи распознавания лица или объекта с расстояния одного метра или 30 – наша зрительная система терпимо относится к изменениям масштаба.
Вторая форма инвариантности позволяет нам игнорировать расположение слов на странице. Когда наш взгляд сканирует текст, центр сетчатки приходится не на середину слова, а чуть левее. Разумеется, наша меткость далека от совершенства, а потому глаза периодически останавливаются на первой или последней букве. Как ни странно, это вовсе не мешает нам распознавать слова. Мы даже можем читать их на периферии зрительного поля при условии, что крупный размер букв компенсирует снижение разрешающей способности сетчатки. Таким образом, стабильность размеров идет рука об руку с нормализацией пространственного расположения.
Наконец, распознавание слов практически не зависит от формы знаков. Сегодня программные средства обработки текстов присутствуют везде. Технология, которой раньше пользовались только лучшие типографы, стала общедоступной. Всем известно, что существует множество наборов знаков, называемых шрифтами (этот термин остался с тех времен, когда каждый знак приходилось отливать в свинце на шрифтолитейном заводе). Каждый шрифт содержит два типа знаков, или «регистров»: верхний и нижний (первоначально свинцовые отливки, или литеры, хранили в специальных ящиках с множеством отсеков – так называемых наборных кассах; в верхних ящиках обычно лежали литеры заглавных букв, а в нижних – все остальные). Наконец, мы можем выбрать «вес», или насыщенность, шрифта (обычный или жирный), наклон (
В свете всех этих вариаций остается загадкой, как именно наша зрительная система учится классифицировать формы букв. Частично проблему инвариантности можно решить относительно простыми способами. Возьмем, например, букву «о». Благодаря уникальной замкнутой форме эта гласная легко распознается независимо от размера, регистра или шрифта. Иначе говоря, создать зрительный детектор «o» не так уж и трудно. С другими буквами ситуация обстоит сложнее. Рассмотрим букву «б». Хотя нам кажется очевидным, что знаки б, Б, б и
Экспериментальные исследования подтверждают: внешний облик слова не играет в процессе чтения никакой роли. Если мы можем мгновенно распознать, что «слово», «СЛОВО» и «СлОвО» означает одно и то же, то это потому, что наша зрительная система не обращает внимания ни на размер, ни на регистр, которым напечатаны слова. Ее интересуют только буквы, которые их составляют. Несомненно, наша способность определять слова не зависит от анализа их общей формы.
Усиление различий
Хотя наша зрительная система успешно отфильтровывает визуальные различия, незначительные для чтения (например, между «Б» и «б»), не стоит думать, будто она всегда отбрасывает информацию и упрощает формы. Во многих случаях она, наоборот, сохраняет и даже усиливает (амплифицирует) мельчайшие детали, позволяющие отличить два очень похожих слова друг от друга. Рассмотрим слова «зрение» и «трение»[32]. Хотя разница составляет всего несколько пикселей, мы мгновенно получаем доступ к их соответствующим значениям и произношениям. Наша зрительная система чрезвычайно чувствительна к крошечным различиям между «зрением» и «трением». Усилив их, она посылает сигнал в разные семантические зоны мозга. В то же время она уделяет очень мало внимания другим, гораздо более выраженным различиям – например, между словами «зрение» и «ЗРЕНИЕ».
Как и в случае с регистром, способность обращать пристальное внимание на значимые детали является результатом многолетней тренировки. Читатель, который мгновенно замечает разницу между буквами «е» и «о» и ее отсутствие между «а» и «
Каждое слово – это дерево
Наша зрительная система решает проблему инвариантного распознавания слов с помощью хорошо организованной схемы обработки сигналов. Как мы увидим в главе 2, поток нейронной активности, поступающий в зрительную кору, постепенно рассортировывается на значимые категории. Слова, кажущиеся похожими (например, «зрение» и «трение»), просеиваются через ряд мельчайших фильтров, которые отделяют их друг от друга и относят к разным статьям в ментальном лексиконе – нашем внутреннем словаре всех слов, с которыми мы сталкивались в жизни. И наоборот, такие слова, как «зрение» и «ЗРЕНИЕ», изначально кодируются разными нейронами в первичной зрительной области, но постепенно перекодируются, пока не становятся практически неразличимыми. Детекторы элементарных признаков распознают сходство букв «р» и «Р». Другие, более абстрактные, детекторы классифицируют «e» и «E» как две формы одной и той же буквы. Несмотря на первоначальные различия, зрительная система в конечном счете кодирует сам смысл буквенных цепочек «зрение» и «ЗРЕНИЕ» и приписывает им один и тот же ментальный адрес – абстрактный код, ориентирующий остальную часть мозга на соответствующее произношение и значение.
Как выглядит этот адрес? Согласно некоторым моделям, он представляет собой своего рода неструктурированный список, фиксирующий последовательность букв З-Р-Е-Н-И-Е. Другие модели предполагают, что мозг опирается на абстрактный и условный код, похожий на случайный шифр: скажем, [1296] – это слово «зрение», а [3452] – это «трение». Однако современные исследования говорят в пользу другой гипотезы. Каждое написанное слово, по всей вероятности, кодируется иерархическим деревом. В нем буквы объединены в более крупные единицы, которые, в свою очередь, сгруппированы в слоги и слова. Точно так же человеческое тело можно представить в виде совокупности ног, рук, туловища и головы, состоящих из более простых частей. В мозге человека каждое написанное слово кодируется иерархическим деревом, в котором буквы объединены в более крупные единицы, а те, в свою очередь, сгруппированы в слоги и слова.