Это эмоции и отношения, важные элементы для определения выражения лица. Исследование объясняет, почему.
«Искусственные нейронные сети неточно отражают процессы человеческого мозга при распознавании движущихся лиц». Об этом говорится в исследовании, опубликованном в журнале Pnas, проведенном исследователями из университетов Болоньи, Принстона, Калифорнии и Дартмутского колледжа в Ганновере. Действительно, хотя ИИ превзошел человеческие возможности в распознавании лиц, ему не хватает способности улавливать эмоциональную информацию и отношения, важные компоненты распознавания выражений движущихся лиц. Вот почему, сравнив функционирование искусственного интеллекта с человеческими возможностями, исследователи исследования продемонстрировали, что ИИ не является точной моделью для понимания того, как человеческий мозг анализирует движущиеся лица, поскольку он гораздо менее эффективен.
В настоящее время программное обеспечение для распознавания лиц достигло или даже превзошло человеческие возможности и все чаще используется в различных приложениях, от процедур безопасности в аэропортах до систем разблокировки смартфонов и ноутбуков. Сверточные нейронные сети (Dcnn — Deep convolutional нейронные сети) составляют центральные элементы этих технологий. Вдохновленные человеческим мозгом, DCN имитируют нашу зрительную нервную систему и состоят из нескольких уровней возрастающей сложности.
Однако, несмотря на эти сходства, результаты исследования показывают, что распознавание лиц с помощью нейронных сетей не может быть использовано для лучшего понимания процессов обработки человеческого лица, которые кажутся гораздо более сложными, чем считалось ранее. Фактически, хотя ИИ ограничиваются распознаванием личности человека, люди автоматически получают ряд другой информации о своем отношении и эмоциональном состоянии — аспектах, которые системы автоматического распознавания в настоящее время полностью игнорируют. Мария Ида Гоббини, профессор кафедры медицинских и хирургических наук Болонского университета, один из авторов исследования, пояснила, что «результаты исследования показывают, что ИИ неточно представляет ни когнитивные механизмы распознавания лиц, ни нейронные механизмы их идентификации».
Эксперимент
Чтобы оценить эффективность нейронных сетей распознавания лиц при анализе человеческих лиц, исследователи использовали большой набор из более чем 700 коротких видеороликов с лицами людей, различающихся по полу, возрасту, этнической принадлежности, ориентации головы и выражению эмоций. Это самый большой набор естественных динамических лицевых стимулов, когда-либо использовавшихся в исследованиях нейровизуализации человека. Эти видео были подвергнуты как системам автоматического распознавания, так и взрослым добровольцам, за их поведением следили с помощью функциональной магнитно-резонансной томографии (фМРТ) для записи активности мозга.
«Несмотря на сходство в процессе представления лиц на уровне мозга и в искусственных нейронных кодах, используемых разными системами DCNN среди участвовавших добровольцев, — подчеркивает исследователь, — корреляции между ИИ и участниками-людьми были слабыми, что позволяет предположить, что нынешние нейронные сети действительно не предлагают адекватную модель когнитивных функций человека при анализе лиц в динамическом контексте». По сути, подтверждает Мария Ида Гоббини, «в то время как для нейронных сетей распознавание личности является концом процесса, для человека оно представляет собой лишь начало ряда других психических процессов, на которые ИИ на данный момент еще не способен подражать».
Конечно, с точки зрения простого поиска, сравнения, распознавания лица, сегодня доступны различные ПО, в том числе в виде приложения, как например: глаз+бога+бот+.
Люди, как и искусственный интеллект, способны распознавать лицо за несколько миллисекунд, но биологический мозг обрабатывает дополнительные детали, чтобы лучше понять социальный контекст посредством мимики, движений глаз, языка тела и многого другого. Однако существует возможность, заключает исследование, что в будущем искусственные нейронные сети можно будет обучать с более широкими целями, например, в области взаимодействия человека и машины, интегрируя более сложное распознавание динамических и социальных характеристик на лицах людей.
|