реклама
Бургер менюБургер меню

Андрей Молчанов – Теория и практика распознавания инженерных сооружений, промышленных предприятий и объектов железнодорожного транспорта при дешифрировании аэроснимков (страница 6)

18

ek(x,y) = ƒ L(x,y,λk(λ),

eз(x,y) = ƒ L(x,y,λз(λ), (1.1)

ec(x,y) = ƒ L(x,y,λc(λ),

где L(x,y,λ) – распределение яркости (светового потока) по координатам x,y и длин волн света εk(λ),εз(λ),εc(λ) – спектральные чувствительности «красных», «зеленых» и «синих» колбочек, ek(x,y),eз(x,y),ec(x,y) – сигналы с «красных», «зеленых» и «синих» фоторецепторов (колбочек).

Рисунок 1.1 – Кривые спектральных чувствительностей колбочек

В сетчатке глаза происходит первичная обработка изображения, в результате которой формируется ахроматическая (черно-белая) и цветностные составляющие изображения, причем, последние не зависят от яркости наблюдаемого изображения. Сформированные таким образом составляющие изображения фильтруются сетчаткой. При фильтрации ахроматической (яркостной) составляющей имеет место ослабление нижних пространственных частот (ПЧ) за счет латерального торможения. Степень ослабления определяется условиями наблюдения. Если яркость изображения не меняется во времени, то это ослабление максимально. В случае наблюдения мелькающих изображений ослабление нижних ПЧ оказывается тем меньше, чем выше частота мелькания, а при частотах мелькания f ≥ 6 Гц ослабление вообще отсутствует.

Верхние ПЧ как ахроматической, так и цветностных составляющих изображений ослабляются в процессе фильтрации глазом. Процесс ослабления формализуется экспериментальными графиками передаточных функций, представляемых обычно в виде зависимостей контрастной чувствительности зрительной системы в децибелах от пространственной частоты пространственно-гармонического сигнала.

Таким образом, в процессе описанного преобразования оптического изображения в нейронное уменьшается зависимость зрительного ощущения от освещенности сцены, «срезаются» пространственные частоты, сужается спектр, что приводит к сокращению количества информации, поступающей в зрительный нерв за счет устранения всего несущественного. Это сокращение потока информации можно оценить, если учесть, что число колбочек равно 6,5–7 млн, а число волокон зрительного нерва 0,8–1 млн, т. е. оно составляет 6,5–8,75 раз.

Полная функциональная модель зрительной системы на уровне сетчатки, в которой были бы отражены все известные в настоящее время ее характеристики, хотя и может быть построена, но она оказывается слишком сложной и представляет скорее теоретический интерес. При построении модели, пригодной для практического использования, делается ряд упрощающих допущений. Основными из них являются допущения об инвариантности к сдвигу и повороту, а также допущение относительно непрерывности мозаики сетчатки.

При описании модели ахроматического зрения было сделано предположение, что нелинейная реакция глаза на изменение интенсивности имеет логарифмический характер. Нелинейное преобразование осуществляется после проецирования изображения на сетчатку.

Преобразованию подвергаются сигналы рецепторов (палочек и колбочек) до того, как они вступают во взаимодействие друг с другом. На рисунке 1.2 приведена простейшая логарифмическая модель глаза для одноцветного зрения. Эта модель позволяет удовлетворительно предсказать реакцию зрительной системы в широком диапазоне интенсивностей.

Рисунок 1.2 – Логарифмическая модель одноцветного зрения

Однако на высоких и очень низких ПЧ или очень высоких интенсивностях наблюдаемая реакция отличается от предсказанной на основе модели, изображенной на рисунке 2. Для того чтобы получить более точную модель, необходимо детально рассмотреть процессы в зрительной системе.

Нелинейная реакция палочек и колбочек на изменение интенсивности все еще служит предметом активных исследований. Были выдвинуты гипотезы о том, что механизм этой нелинейности объясняется химической активностью, электрическими эффектами и нервной обратной связью. Если входной и выходной сигналы обозначить как Iвх(x,y),Iвых(x,y), соответственно, то основная логарифмическая модель предполагает, что:

Iвых(x,y) = K1log[K2 + K3Iвх(x,y)], (1.2)

где K1,K2,K3 – постоянные.

В другой модели предполагается следующая зависимость выходного сигнала от входного:

Iвых(x,y) = [K1Iвх(x,y)]/[K2 + Iвх(x,y)], (1.3)

В настоящее время используется также степенная функция, когда:

Iвых(x,y) = [Iвх(x,y)]s, (1.4)

где S – постоянная величина, обеспечивающая хорошее согласие между вычисленной вероятностью и субъективной оценкой качества изображения. Подбором постоянных коэффициентов, входящих в выражения (1.2) – (1.4), соответствующие кривые могут быть хорошо сближены в диапазоне средних интенсивностей.

На рисунке 1.3 приведена функциональная модель зрительной системы (глаза). В этой модели колбочки трех типов создают сигналы изображения, определяемые соотношениями (1.2).

Рисунок 1.3 – Функциональная модель зрительной системы (глаза)

Далее эти изображения преобразуются тремя фильтрами – оптическими передаточными функциями оптической системы глаза в этих световых диапазонах. Затем они подвергаются логарифмическому преобразованию и комбинируются, образуя цветоразностные Uk-3(x,y),Uk-c(x,y) и ахроматические Ua(x,y) сигналы (изображения) в соответствии с формулами

где α = 0,612, β = 0,396, γ = 0,019, а коэффициенты a,b1,b2 подобраны так, чтобы пороговые различия при восприятии света или цвета представлялись сферой единичного радиуса в пространстве сигналов (изображений) Ua(x,y),Uk-з(x,y),Uk-c(x,y). Ахроматический и цветностные сигналы (изображения) Ua(x,y),Uk-з(x,y),Uk-c(x,y) поступают на вход фильтров с оптическими передаточными функциями (ОПФ) Wн1(ωx,ωy), Wн2(ωx,ωy), Wн3’(ωx,ωy),ωx = 2πNx, ωy = 2πNy, ωм = 2πfм; Nx,Ny – ПЧ, лин/мм, fм – частота мелькания изображения, Гц. После фильтрации изображения через зрительный нерв поступают в высшие отделы зрительной системы.

Изменение яркости изображения без изменения его спектрального состава вызывает изменение компоненты Ua(x,y), в то время как компоненты Uk-з(x,y),Uk-c(x,y)остаются без изменения, что согласуется с опытом.

В соответствии с теорией линейных систем функция передачи модуляции (ФПМ) зрительного анализатора можно получить из ОПФ по следующей формуле:

где T(2πθx,0) = T(2πN)– одномерная ОПФ, вычисляемая по ФРЛ h(x)

Это выражение в грубом приближении есть зависимость контраста от ПЧ. Так как контраст не может быть равным единице, поэтому можно выполнить нормирование на T(0,0).

ФПМ зрительного анализатора учитывает передаточные свойства как оптической системы глаза, так и передаточные свойства, обусловленные нервными процессами в сетчатке, дифракцией на входном зрачке, аберрацией хрусталика, конечных размеров фоточувствительных рецепторов и др. Однако ФПМ зрительного анализатора не учитывает пространственный шум, фоновую освещенность, положение оператора относительно монитора и времени экспонирования. Тем не менее, каждый из этих параметров влияет на качество восприятия изображения, поэтому эмпирические зависимости, характеризующие ФПМ зрительного анализатора, являются лишь аппроксимацией реальной ФПМ. Преобразование сигналов в сетчатке связано с процессом их «усиления» за счет биологической энергии. При этом коэффициент «усиления» принимается kзр = 2.

Эквивалентную модель зрительного анализатора как канала передачи информации можно представить в виде, приведенном на рисунке 1.4, где WОПТ.ЗР(θ) – ФПМ оптической системы глаза, WСЕТ(θ) – эквивалентная ФПМ сетчатки, полученная путем деления WЗР(θ) на WОПТ.ЗР(θ); Gш.зр(θ) – спектральная плотность дисперсии эквивалентного шума зрительного анализатора. Взаимодействие этих двух фильтров и определяет общую ФПМ зрительного анализатора. Энергия шумов зрительной системы распределена неравномерно в диапазоне пространственных частот.

Рисунок 1.4 – Эквивалентная модель зрительного анализатора как канала передачи информации

Зрительный анализатор представлен в виде эквивалентного фильтра низких ПЧ, состоящего из двух звеньев, и источника помех. Сетчатка обладает свойствами эквивалентными фильтру высоких пространственных частот и имеет характеристики, близкие к характеристикам пространственного дифференцирующего звена.

Зрительный анализатор обладает врожденной и приобретенной способностью специальной организации рецепторов. Поля фоторецепторов подсознательно изменяются в зависимости от яркости изображений. В этом заложена потенциальная возможность зрения изменять свою ФПМ в зависимости от формы рассматриваемых деталей изображения и условий наблюдения.

В работе Шадэ проведены исследования реакции глаза на тест-объект с синусоидальным изменением яркости по пространственной координате и приведена зависимость контрастной чувствительности глаза (звена формирования изображения) от пространственной частоты наблюдаемых объектов, полученная при условии порогового восприятия. В качестве наблюдаемых объектов использовались пространственные синусоидальные миры, что наиболее понятных и хорошо исследованных характеристик, используемых в физиологии зрительного восприятия. Для анализа желательно рассматривать процесс зрения как линейный, чтобы можно было использовать аппарат линейной фильтрации. Однако зрительные процессы не всегда линейны, как, например, в случае эффекта Маха, когда наблюдаются верхний и нижний выбросы в восприятии резкого края детали высокого контраста при переходе от светлого к темному. В тех случаях, когда глаз наблюдает достаточно резкий переход яркости от светлого поля к темному, на границе изменения градиента на темном фоне субъективно появляется еще более темная линия, а на светлом – более светлая линия. При низких контрастах зрительные процессы обычно приближенно считают линейными. В этом случае ФПМ определялась как обратная величина порогового контраста для каждой пространственной частоты миры, приведенной в плоскость сетчатки. Полученные результаты нормировались относительно минимального контраста. Характеристики свидетельствуют об увеличении порогового контраста не только при увеличении ПЧ решетки, но и при ее уменьшении.