Введение

При разработке систем технического зрения в рамках проектов по созданию искусственного интеллекта большое значение имеет бионический подход с ориентацией на зрительные системы различных организмов, созданные в процессе их естественной эволюции. Важным свойством зрения является цветоразличение. Если для таких направлений техники, как цветовос­произведение и колориметрия может быть достаточным представление о цвете как чувстве яркости (количественная характеристика) и цветности (качествен­ная характеристика), то для инженерии искусственного интеллекта и физио­логии этого явно недостаточно. Здесь необходимо комплексное представление о зрении, как таковом, и цвете, как его свойстве.

Зрение помогает нам создавать в сознании образ (модель) окружающего мира. Зрение не единственное наше чувство (модальность), а одно из многих, и образ мира в сознании человека многомодален. Каждый из известных органов чувств обладает своими рецепторами (датчиками-преобразователями физических сигналов). Преобразованные сигналы передаются в мозг для формирования динамичного образа мира. Этот образ помогает субъекту

 

(носителю сознания) реализовать свои цели на осно­вании собственного опыта, планируя буду­щее. Физическим сигналом воздействия на глаз является свет – небольшой участок электромагнитного спектра волн, характе­ризуемый яркостью, угловым распреде­лением яркости и формой спектра. Свет в диапазоне длин волн 400…760 нм считается видимым. Если изменение яркости по полю зрения обычно не превышает двух порядков при изменении коэффициентов отражения объектов наблюдения, то яркость видимого излучения может изме­няться в гигантском диапазоне, прибли­зительно от 10–7 до 10+8 кд/м2, как показано на рисунке 1. Здесь можно видеть под­диапазоны работы различных фоторецеп­торов сетчатки глаза: палочек, работаю­щих при низких освещённостях, и колбо­чек – при высоких. И те, и другие способны к адаптации в очень широких диапазонах яркости. Адаптация фоторецепторов обеспечивается в основном биохимическим механизмом фототрансдукции [1].

Скорость адаптации высока. Оценить эту скорость можно по скорости исчезновения изображения, предъявляемого глазу, при искусственной стаби­лизации изображения на сетчатке. Уже через 1 – 2 секунды изображение исче­зает даже при стопроцентном контрасте исходного изображения. При этом человек начинает видит сплошное серое, так называемое, «пустое поле» [2].

 

Препятствуют исчезновению изображения микродвижения глаз, среди которых: микросаккады, дрейф и тремор. Запись микродвижений глаз приведена на рисунке 2. Высоко частотный тремор, (круговое движение ~ 90 Гц) накладывается на медленные дрейфы (изогнутые траектории). Микросаккады – быстрые (~ 25 мс) скачкообразные движения, обычно возвращают образ к центру визуализации (прямые линии). Диаметр части центральной ямки поля зрения, показанной здесь, составляет 0,05 мм (~ 10 угл. мин.).

 

Другие движения глаз – скачки (саккады) необходимой амплитуды используются для направления взора на объекты внимания субъекта. Запись таких движений глаз приведена на рисунке 3. Для слежения за движу­щимися объектами используются прослеживающие движения глаз (динамическая фиксация) [3]. Запись движения глаз осуществляется с помощью особой техники [2].

Движения глаз имеют опреде­ляющее значение не только для пере­численных целей, но и для:

субдискретизации изображения с целью повышения разрешающей способности зрения;

распространения синего цвета на область ясного зрения.

Далее рассмотрим достижение этих двух целей с учётом феномена пространственной константности зрения [4].

 

Форма спектра света, отражён­ного от объекта, зависит как от спектра освещения, так и от спектральных характеристик отражения объекта. На рисунке 4 показан спектр источника освещения – Солнца в единицах Вт/м2 мкм. Заметим, что цветовая температура излучения Солнца обычно не совпадает с температурой идеального теплового излучателя – 5900 К, спектр которого приведён на рисунке, поскольку зависит от фильтрующих свойств атмосферы и положения солнца на небосклоне. На рисунке 5 показаны спектральные коэффициенты отражения контроль­ных образцов международной комис­сии по освещению (МКО). Суще­ствуют различные способы оценки формы спектра отражённого излу­чения. Например, в технике суще­ствует направление разработки, так называемых, спектрозональных спе­циальных телевизионных систем, где количество зон или «цветов», по существу, не ограничено. Различать цвета можно по соотношению долей полной световой энергии, прошедших через зональные светофильтры.

 

В отличии от зрения собак, кошек или кроликов, зрение большинства приматов и человека обладает цветоразличением. У человека обнаружены четыре типа фоторецепторов, с различными спектральными характеристиками – относительными спектральными чувствительностями. На рисунке 6 приведены эти характеристики (сплошные кривые, вместе с пятой (пунктир), так называемой кривой видности, производной от характеристик колбочек. Характеристики колбочек: коротко- (S, синия), средне- (M, зелёная) и длинноволновой (L, красная), – перекрываются (см. рисунок 6). Оставляя в стороне вопрос о работе палочек и взаимодействии палочек и колбочек, отметим только эффект Пуркинье – смещение кривой вид­ности влево до слияния с характе­ристикой палочек при снижении освещённости. Далее здесь рассмат­риваем работу колбочек в условиях фотопического зрения. Абсолютная спектральная чувствительность кол­бочек не может быть определена из-за упомянутой выше адаптации колбочек в очень большом световом диапазоне. Однако относительная спектральная чувствительность в сравнительно узком диапазоне яркостей может быть определена. Методом уравнивания посто­янной энергетической яркости различных по длине волны монохроматических излучений основными излучениями трёхцветного визуального колориметра получают так называемые кривые сложения трихромата (человека с нор­мальным цветовым зрением), характерные для данного колориметра. Далее, исследуя на этом же колориметре особенности цветовосприятия дихроматов (красно-, зелёно- или даже очень редких сине-слепых), по всем полученным данным определяют кривые относительной спектральной чувствительности [5].

Заметим, что в литературе по колориметрии можно видеть различные кривые сложения с отрицательными значениями цвета, которые соответ­ствуют проекции некоторых из основных цветов колориметра на поле измеряемого цвета, а не на поле слагаемых цветов. Форма кривых сложения зависит также от выбранной цветовой модели: XYZ, RGB и др. Кривые относительной спектральной чувствительности фоторецепторов глаза всегда находятся в области положительных значений чувствительности и не зависят от типа колориметра и модели.

Кривые колбочковых спектральных чувствительностей обычно нормируют по площадям под ними домножением на соответствующие коэффициенты и тогда, при вычислении реакции колбочек на излучение с равномерным энергетическим спектром, эти реакции равны для всех типов колбочек. Одинаковые реакции разнородных колбочек на такой спектр освещения порождают ощущение белого (серого) цвета. Ощущение белого можно также вызвать сочетанием всего трёх первичных цветов колориметра или цветного монитора с характерным для каждого из них отношением яркости этих цветов. Отношения задаются с помощью так называемых яркостных коэффициентов цветов.

 

При изучении зрительной системы мы сталкиваемся с кажущимся противоречием. С одной стороны, мы видим полноцветную раскраску окружающих нас объектов, а с другой стороны по зрительному нерву в мозг с сетчатки глаза поступает лишь контурное их изображение, из-за оппо­нентной организации зрительных полей ганглиозных нейронов сетчатки [6]. Зрительный нерв содержит более одного миллиона волокон, которые являются аксонами (выходами) ганглиозных нейронов. По каждому волокну передаются сигналы с небольшой, приблизительно круглой области, локализации фоторецепторов сетчатки, причём ганглиозный нейрон суммирует сигналы рецепторов центра круга и вычитает из этой суммы сумму сигналов рецепторов периферии круга. Такая оппонентная структура описывается, например, двумерным оператором Марра [7], с учётом весовой функции суммирования. Вид весовой функции приведён на рисунке 7. Обнаружены [6] рецептивные поля с различным сочетанием трёх видов колбочек. Их обозна­чения представлены на рисунок 8. Здесь, кроме обозначений круглых рецептивных полей, приведены обозначения соответствующих масок (крестообразные фигуры) для оппонентно-цветового кодирования тестовых изображений при компьютерном моделировании естественного зрения.

 

Рисунок 8 демонстрирует номенклатуру оппонентно-цветовых рецеп­тивных полей, отличающихся не только сочетанием цветов, но и знаков (+) и (–), которые соответствуют сигналам возбуждения или торможения при активации рецепторов. Здесь красный цвет означает преимущественное действие в данной зоне рецептивного поля L-колбочек, зелёный – M-колбочек, синий – S-колбочек, жёлтый – как L, так и M-колбочек, белый – всех L, M, и S-колбочек.

 Рецептивное поле любого нейрона зрительного пути можно опре­делить, измеряя его сигнал при последовательном освещении рецепторов небольшими пятнами света различного цвета и диаметра круглой или кольце­образной формы. Такое тонкое иссле­дование с освещением колбочек сет­чатки глаза, проводилось на обезьянах [6]. Реакции нейронов при различных воздействиях на их рецептивные поля показана на рисунке 9. Здесь слева обозначены реакции нейрона (осцилло­граммы потенциалов действия – спайков), который возбуждается при включении («on») света в центре его рецептивного поля, а справа реакции нейрона с другим типом рецептивного поля, возбужда­ющимся при выключении («off») света в центре. Реакции нейронов при анало­гичном воздействии на периферию рецептивных полей соответствуют их торможению. Величина реакции про­порциональна частоте спайков справа от изображений рецептивных полей. Положение, размер и форма зоны освещения (жёлтой) изменяется по строкам изображения. Временной масштаб в правом нижнем углу позволяет сделать вывод о длительностях светового импульса и реакции нейрона. Можно видеть, что длительность реакции порядка одной секунды хорошо коррелирует со временем появления вышеописанного «пустого поля».

Обратное преобразование контурного изображения в изображение полноцветной раскраски возможно при наличии в зрительном тракте механизма восстановления изображения по его контурной версии и известным значениям яркости на его границах, что соответствует решению математи­ческой задачи Дирихле [8]. В пользу такого преобразования свидетельствует наличие особого оптического механизма равномерного освещения периферии сетчатки, открытого А. Л. Ярбусом [9].

Особым свойством зрительной системы человека является свойство цветовой константности, когда изменения спектра освещения не влечёт за собой существенного изменения цветности объектов наблюдения, что кажется парадоксальным, учитывая вышесказанное о форме спектра отражённого света. Далее рассмотрим возможный механизм обеспечения цветовой константности с учётом технологии восстановления контурного изображения.

Кажется парадоксальным тот факт, что в центральной (фовеальной) области сетчатки глаза, соответствующей области ясного зрения, отсутствуют коротковолновые (S) колбочки, а присутствуют только средне- (M) и длинно- (L) волновые, и при этом мы ясно видим синие оттенки цвета. На рисунке 10 приведена мозаичная модель участка сетчатки глаза [10], которая показывает не только отсутствие синих элементов в центре рисунка, но и наличие довольно больших локальных скоплений здесь однородных по цвету элементов (особенно красных). Далее рассмотрим возможный механизм воспри­ятия цвета с учётом движения глаз, устраняющий кажущийся парадокс.

Объясняя ранее отмеченные свойства зрительной системы, будем иметь в виду, что предложенные здесь их модели в техни­ческой области при создании искусствен­ного интеллекта требуют разработки соот­ветствующей элементной базы и необходи­мого программного обеспечения. В области физиологии зрения эти модели могут при­ниматься как гипотезы для обоснования про­ведения соответствующих исследований.