Как человеческий глаз способен распознавать перекрученные и деформированные буквы вроде тех, которые вводятся в специальную форму при входе на веб-сайт и позволяют отличить реального пользователя от робота?
Для человека такая задача не составляет большого труда. Однако, видимая простота в данном случае – только иллюзия. Подобные действия, на самом деле, чрезвычайно сложны, и ни одна компьютерная программа не способна распознавать деформированные буквы и символы так же успешно, как человеческий глаз. Именно поэтому они широко и эффективно используются на веб-сайтах.
Команда ученых из Института биологических наук имени Солка взяла на себя задачу решить вопрос о том, как же мозг справляется с подобными действиями. Две статьи, опубликованные по результатам исследований, показали, насколько сложным для глаза и мозга является распознавание букв на «каптче» и подобных ей изображений, составленных из отдельных элементов.
Первая из двух статей опубликована 19 июня в журнале «Нейрон», вторая – 24 июня в Бюллетене Национальной академии наук США (PNAS). Они представляют собой два важнейших шага к пониманию наших зрительных функций, а также позволяют переосмыслить те ранее полученные результаты, которые до сих пор казались абсолютной истиной. Результаты новых исследований показывают, что зрительное восприятие сложных объектов устроено значительно сложнее, чем нам казалось ранее.
Кроме того, проведенное исследование, глубокое и детальное, включающее записи активности многих сотен отдельных нейронов, может иметь высокую практическую значимость – в частности, в клинической практике. Соавторы исследования Татьяна Шарпи и Джон Рейнолдс так говорят о своей работе: «Понимание того, как наш мозг формирует зрительный образ, может помочь людям с теми или иными нарушениями работы мозга. Например, тем, кто потерял зрение. Одним из путей решения этой проблемы является выяснение того, каким образом происходит переработка информации в коре головного мозга. Расшифровав этот «код», можно затем попытаться напрямую стимулировать соответствующие нейроны и вновь вернуть людям способность к зрению».
По мнению Рейнолдса, косвенным следствием понимания работы мозга может стать и построение искусственных нейронных систем и моделей, которые будут действовать и видеть как человек: «Причина того, что искусственные системы и машины весьма ограничены в своих способностях, заключается в том, что мы до конца не понимаем, как нашему мозгу удается проделывать все его фокусы».
Ученые подчеркивают, что это, безусловно, долгосрочные цели, а непосредственная задача, которую они ставили перед собой в проведенном исследовании, несколько другая.
В своей работе нейробиологи хотели выяснить, как область зрительной коры головного мозга, называемая зоной V4, способна различать те или иные зрительные стимулы и отслеживать их, даже если они перемещаются. Считается, что зона V4 отвечает за промежуточный этап переработки информации о зрительных объектах.
«Нейроны зрительной коры чувствительны к определенным областям пространства и появляющимся в них объектам. Они будто маленькие окна в большой мир», - говорит Рейнолдс. – «На ранних этапах зрительной обработки эти окна – рецептивные поля – очень малы. Они передают нейронам информацию от весьма ограниченных участков зрительного поля. Каждый из этих нейронов затем посылает сигналы в мозг, отвечая на небольшие зрительные стимулы, например, на контур объекта, определенным образом ориентированный в пространстве, или на пятно определенного цвета».
Нейроны в области V4 обладают несколько более широкими рецептивными полями и также могут перерабатывать информацию о форме объектов, их контурах. Это достигается благодаря интеграции сигналов от многих нейронов предыдущих уровней.
Оба новых исследования нацелены на изучение свойства инвариантности – то есть, способности нейрона распознавать один и тот же стимул, попадающий в его рецептивное поле, независимо от его расположения в пространстве. В частности, статья в журнале «Нейрон» сфокусирована на описании результатов анализа активности 93 нейронов из зоны V4 в ответ на предъявление прямых и изогнутых линий, а статья в PNAS – на описании ответов нейронов на естественные сцены, содержащие множество сложных контуров и объектов.
Ранее догмой и доказанным фактом считалось, что все нейроны V4 обладают свойством инвариантности. По словам Шарпи, «Общепринятое понимание работы этой зоны предполагает то, что каждый нейрон в ней настроен на распознавание одного и того же стимула, независимо от того, в каком месте рецептивного поля он появляется».
Например, нейрон отвечает активностью на полукруглый элемент в составе цифры 5, даже если эта цифра искажена, как в «каптче». Исследователи полагали, что степень инвариантности возрастает с повышением уровня переработки информации в коре мозга.
Однако, Шарпи добавляет: оба новых исследования позволили увидеть, что на этом особенности переработки не заканчиваются. «В зрительной системе существует обратная взаимосвязь между сложностью стимула и степенью, до которой каждый нейрон настроен на переработку именно его при движении».
В дальнейшем ученых ждет решение еще более сложных вопросов. Так, исследователи обнаружили, что те нейроны, которые отвечали на более сложные изображения – например, на контур цифры «5» - демонстрировали понижение инвариантности. «Чтобы сложный объект был распознан этим нейроном, необходимо уменьшение его вариативности. Тем клеткам, которые отвечают на восприятие сложных форм, не хватает возможностей для распознавания их в любом виде и в любой точке пространства».
С другой стороны, нейроны зоны V4, которые настроены на восприятие более простых форм, например, прямых линий, обладают повышенной инвариантностью. «Им неважно, где расположен стимул в пределах рецептивного поля».
«Ранее исследования распознавания объектов показали, что нейронный ответ на более поздних стадиях переработки информации не меняет своей формы и свойств при трансформации стимула. Наши работы подчеркивают, что это правило может иметь исключения. Они позволяют предположить наличие более простых механизмов чувствительности к зрительным стимулам», - утверждает Джуд Митчелл, один из команды ученых.
«Очень важно то, что результаты обоих исследований взаимосвязаны и согласуются друг с другом. То, что мы обнаружили, изучая восприятие простых линий, подтвердилось и в исследовании восприятия сложных объектов реального мира», - говорит Шарпи.
Полученные данные говорят о том, что перед учеными все еще стоит более сложная задача. До сих пор не ясно окончательно, за счет чего достигается свойство инвариантности.
Литература:
-
T. O. Sharpee, M. Kouh, J. H. Reynolds. Trade-off between curvature tuning and position invariance in visual area V4. Proceedings of the National Academy of Sciences, 2013; DOI: 10.1073/pnas.1217479110
-
Anirvan S. Nandy, Tatyana O. Sharpee, John H. Reynolds, Jude F. Mitchell. The Fine Structure of Shape Tuning in Area V4. Neuron, 2013; 78 (6): 1102 DOI: 10.1016/j.neuron.2013.04.016
-