Как роботов учат считывать эмоции людей

4 часа назад 8

Роботы и цифровые ассистенты все чаще становятся участниками социального взаимодействия с человеком — от службы поддержки до медицинской помощи. Однако без навыка распознавать эмоции такие взаимодействия остаются ограниченными и неестественными. «‎Рамблер» рассмотрит технологии, лежащие в основе распознавания эмоций.

На первый взгляд, способность робота различать эмоции может показаться излишеством. Однако в контексте медицины, ухода за пожилыми людьми, образования и сервисных профессий она становится все большей необходимостью. Робот, способный понять, что пользователь расстроен или раздражен, сможет адаптировать свое поведение, снизив уровень стресса, предложить помощь — и в целом действовать более эффективно в социальном взаимодействии.

Существует несколько каналов, через которые можно оценить эмоциональное состояние человека. Большинство современных систем объединяют эти источники в мультимодальные модели.

Анализ мимики — один из старейших и наиболее развитых методов. Системы компьютерного зрения, обученные на базах данных вроде AffectNet и FER2013, способны с высокой точностью определять эмоции по выражению лица.

Можно ли создать цифровую копию человека

Темп речи, интонация, частотный диапазон — все это несет эмоциональную нагрузку. Например, исследование Technical University of Munich показало, что алгоритмы машинного обучения могут достигать более 80 процентов точности в классификации эмоций по аудиосигналу.

Частота сердцебиения, кожно-гальваническая реакция и даже температура кожи используются в проектах вроде EmotionSense, чтобы распознавать внутреннее состояние человека. Обзор методов распознавания эмоций с использованием физиологических сигналов представлен в статье PudMed Central.

Обработка естественного языка (NLP) позволяет анализировать эмоциональную окраску текста. Например, трансформер-модели типа BERT и RoBERTa активно применяются в задачах эмоционального анализа сообщений и диалогов. Пример использования RoBERTa для анализа тональности представлен в проекте Twitter Sentiment Analysis with BERT vs RoBERTa.

Наиболее перспективный подход — глубокое обучение. Сети, обучающиеся на больших массивах эмоционально размеченных данных, могут выявлять сложные закономерности, неочевидные для традиционной статистики.

Одним из примеров является EmoReact — мультимодальная система, которая объединяет видео, аудио и текстовые данные для прогнозирования эмоциональной реакции. Еще один — OpenFace — открытая система анализа мимики, основанная на алгоритмах глубокого обучения.

Роботы также обучаются через обратную связь от человека (human-in-the-loop learning), когда система адаптирует свое поведение на основе оценки пользователем. Это особенно эффективно в социальных роботах, применяемых в школах, музеях и банках.

Важно подчеркнуть, что система получает «‎награды» за успешное эмоциональное взаимодействие. Например, за правильно интерпретированную фрустрацию у пациента. Это помогает закрепить информацию.

Несмотря на успехи, перед исследователями стоят серьезные вызовы:

Таким образом, понимание эмоций больше не эксклюзивное свойство человека. Сегодня ведущие исследовательские центры работают над созданием эмпатичных ИИ — систем, способных не просто распознавать эмоции, но и на них реагировать. Возможно, именно такие машины станут ключевыми партнерами в образовании, медицине и уходе за людьми.

Ранее мы писали, как гаджеты влияют на восприятие времени, внимание и память у молодых людей.