«Улыбочку»: можно ли научить камеру распознавать эмоции
Искусственный интеллект Искусственный интеллект

«Улыбочку»: можно ли научить камеру распознавать эмоции


Заур Абуталимов, директор по продуктам Ivideon.

Управляющие крупных торговых сетей и владельцы маленьких кофеен наверняка хотят знать, о чем думают их гости. Довольны ли обслуживанием? Понравилась ли им еда? Какие эмоции они испытывают и заглянут ли снова? Залезть в голову к каждому посетителю, конечно, невозможно. Однако спрогнозировать его потребительское поведение сегодня вполне реально, благодаря искусственном интеллекту.

В нашу эпоху компьютерное зрение позволяет автоматически фиксировать и обрабатывать изображения статичных и движущихся объектов. Оно умеет не только считать посетителей торговых точек, но и сканировать их эмоции. Подобные решения сегодня широко применяются в ритейле и ресторанном бизнесе, а также в автомобилестроении, пищевой промышленности, фармацевтике и других отраслях. 

Рынок систем компьютерного зрения продолжается совершенствоваться и расти. По оценкам аналитиков Grand View Research, к 2027 году его объем может достигнуть $19 млрд. В России, по итогам 2018 года объем этого рынка составил 8 млрд рублей, а к концу 2023 года он может увеличиться в 4,8 раза до 38 млрд рублей.

Интересоваться темой детекции и распознавания лиц общественность начала еще во второй половине 2000-х и начале 2010-х годов. Тогда же компании начали активно создавать программы и приложения, основанные на face и emotion recognition. Так, например, в 2015 году техгигант Microsoft в рамках платформы Project Oxford разработал сервис по распознаванию человеческих эмоций. Работал он следующим образом: пользователь загружал туда фотографию, а программа пыталась определить эмоцию по микроэкспрессиям лица. При этом алгоритм производил анализ восьми базовых состояний — презрения, злости, отвращения, страха, счастья, грусти, удивления или спокойствия — и распределял условные баллы между каждым из них.

Сервис довольно быстро стал популярным развлечением пользователей сети, которые «скармливали» ему не только собственные фотографии, но и снимки знаменитостей и даже кадры из фильмов. Впрочем, тогда проект был экспериментальным и алгоритмы частенько ошибались. К слову, это происходит и сейчас. Даже алгоритмы face recognition не настолько совершенны: многие программы видят лица с точностью до 99%. А когда вы пытаетесь научить компьютер распознавать еще и эмоции, то точность результата, конечно, снижается. 

Определить эмоции программе значительно сложнее, чем просто лицо. Алгоритму нужно сначала распознать лицо, а затем приступить к его анализу. Сначала тех участках, где проявляются определенные мимические признаки, он захватывает точки. Потом алгоритм их анализирует, после чего отправляется в фотобазу, чтобы достать снимки, на которых эмоция уже определена. Алгоритм сравнивает с этими фотографиями неопределенный снимок и выдает свое решение.

Несмотря на то, что такие решения еще не достигли совершенства, они достаточно востребованы у бизнеса. К примеру, в некоторых магазинах уже можно расплачиваться улыбкой, выявить недовольных клиентов и даже таргетировать рекламу в торговом зале - в зависимости от пола, возраста и настроения человека. Конечно, пока это единичные проекты, однако в течение пяти-десяти лет, думаю, их станет гораздо больше. 

Надо сказать, что что в ряде стран, например, в Китае, оплата улыбкой уже не является чем-то сверхъестественным. Китайцы одними из первых стали применять биометрические решения в платежах. Еще в 2017 году Alipay запустила сервис smile-to-pay в одном из ресторанов быстрого питания KFC. Другая платежная система WeChat Pay вскоре тоже предложила своим клиентам оплачивать покупки, просто улыбнувшись в камеру у кассы. 

А вот американская компания WalMart обучила алгоритмы распознавать покупателей с грустным выражением лица. Если система фиксировала таких, она немедленно оповещала об этом сотрудников магазина. Если “грустный” покупатель не возвращался за покупками или возвращался, но тратил в магазине меньше обычного денег, — менеджеры предпринимали определенные усилия, чтобы вернуть и осчастливить его. 

В 2018 году счастье клиентов принялась измерять и «Додо пицца» — с помощью все того же искусственного интеллекта. Компания совместно VisionSystems провела эксперимент по оценке эмоционального состояния обслуженных гостей. Такое решение позволило компании оценивать качество работы сотрудников и узнать, какая пиццерия «собирает» больше улыбок.

Все это дает основания предполагать, что в ближайшие пару лет мы будем наблюдать всплеск так называемых погонь за улыбками. Распознавание лиц при этом станет массовой технологией. Она встроится не только в смартфоны, но и другие «умные» гаджеты. Вход в офис, регистрация в аэропорту, доступ к онлайн-сервисами с помощью лица — все это вскоре станет простым и повсеместным. И теперь мы подошли к этому достаточно близко.

 

Не менее интересные публикации