Пятница, 26 апреля 2024 года

Российский алгоритм распознавания эмоций признан лучшим в мире‍

Победителем первого в мире чемпионата по распознаванию человеческих эмоций при помощи компьютерного алгоритма стала российская компания NtechLab, разработчик популярного сервиса распознавания лиц FindFace. Чемпионат EmotionNet Challenge, в ходе которого предстояло определить лучший визуальный алгоритм автоматического анализа большого массива изображений, организовал Университет штата Огайо.

Отечественный стартап NtechLab, разработавший уникальный сервис FindFace, позволяющий находить человека в соцсетях по фотографии, победил в чемпионате EmotionNet Challenge.

В чемпионате EmotionNet Challenge участвовали около четырех десятков команд из разных стран мира, однако большая их часть не смогла преодолеть предварительные этапы.

Участникам предстояло проанализировать эмоции на миллионе изображений, полученных в естественных условиях. 950 тысяч из них использовались для «обучения» программы, 25 тысяч — для проверки точности алгоритма, а еще 25 тысяч — для сравнения эффективности алгоритмов.

Сложность распознавания эмоций людей, запечатленных на фотографиях, заключается в нескольких принципиальных моментах. Например, лица на фотографиях не всегда смотрят на камеру. Плюс, определенные трудности вносит неравномерное освещение. А также тот факт, что люди по-разному проявляют одни и те же базовые эмоции.

Участникам чемпионата предстояло распознать 16 основных эмоций. Это более чем вдвое больше, чем требовалось в ходе прежних экспериментов в этой области.

Теперь уже речь шла не только о простых эмоциях («счастливый», «печальный», рассерженный»), но и о сложных, составных («рассержен и удивлен» и т. п.). Каждая эмоция определятся по уникальной вариации сокращения лицевых мышц.

Если действие одних мышц хорошо видно, то других — едва заметно даже для человека. При этом организаторы соревнования снижали качество изображения, уменьшая четкость и закрывая небольшую часть фотографии. В итоге алгоритм NtechLab оказался точнее, чем у конкурентов из Университета Джонса Хопкинса.

«Распознавание эмоций — это зарождающаяся отрасль, в которой нет хороших бенчмарков. Конкурс, проводимый университетом Огайо — один из кандидатов на эту роль. Мы решили поучаствовать в нем, чтобы понять, где находимся относительно наших конкурентов и какие наработки в этой области существуют во всем мире. Мы рады результатам, ведь это не финальная версия нашего алгоритма. Алгоритм проходит бета-тестирование и мы продолжаем работать над улучшением его свойств. В ближайшее время мы планируем выпустить готовое решение для бизнеса», — отметил сооснователь NtechLab Артем Кухаренко.

Он также подчеркнул, что определение эмоций — крайне перспективное направление, которое может быть использовано в очень широком спектре коммерческих решений: от оценки эффективности рекламных и маркетинговых кампаний в ритейле до области безопасности, где распознавание эмоций позволит компьютерным системам автоматически реагировать на людей с подозрительным выражением лица.

«Российские программисты одни из самых лучших в мире — они традиционно показывают сильные результаты в международных конкурсах. В 2000 году Россия впервые выиграла Assoсiation for Computing Machinary International Collegiate Programming, самый престижный и известный мировой конкурс по программированию, и с тех пор команды из РФ несколько раз оказывались на первом месте. Профессиональные конкурсы, в которых участвуют не студенты, а уже работающие на рынке компании, как правило, менее широко освещаются, но в них также достаточно часто выигрывают команды из России, как, к примеру, в случае с The MegaFace Benchmark, где компания NtechLab одержала победу», — прокомментировал результаты россиян гендиректор российской инвестиционной интернет-платформы StartTrack Константин Шабалин.


Выбор редакции


Еда