Abstract:Emotion recognition from spontaneous facial expression with a new percentage feature.Extraction and selection of spectral power and spectral power difference features for EEG.A multi-modal emotion recognition for valence and arousal classes.A comparison of multi-modal emotion recognition to human performance for emotion recognition and analysis. Display Omitted Automatic analysis of human spontaneous behavior has attracted increasing attention in recent years from researchers in computer vision. This paper proposes an approach for multi-modal video-induced emotion recognition, based on facial expression and electroencephalogram (EEG) technologies. Spontaneous facial expression is utilized as an external channel. A new feature, formed by percentage of nine facial expressions, is proposed for analyzing the valence and arousal classes. Furthermore, EEG is used as an internal channel supplementing facial expressions for more reliable emotion recognition. Discriminative spectral power and spectral power difference features are exploited for EEG analysis. Finally, these two channels are fused on feature-level and decision-level for multi-modal emotion recognition. Experiments are conducted on MAHNOB-HCI database, including 522 spontaneous facial expression videos and EEG signals from 27 participants. Moreover, human perception in emotion recognition compared to the proposed approach is tested with 10 volunteers. The experimental results and comparisons with the average human performance show the effectiveness of the proposed multi-modal approach.

Audio-Visual Based Emotion Recognition Using Tripled Hidden Markov Model

Audio-visual Based Emotion Recognition-a New Approach

Exploring Spatio-Temporal Representations by Integrating Attention-based Bidirectional-LSTM-RNNs and FCNs for Speech Emotion Recognition

A robust multimodal approach for emotion recognition

Visual-Audio Emotion Recognition Based on Multi-Task and Ensemble Learning with Multiple Features

Multi-modal emotion analysis from facial expressions and electroencephalogram.

Speech Emotion Recognition from Variable-Length Inputs with Triplet Loss Function

Audio-video Emotion Recognition in the Wild using Deep Hybrid Networks

Investigating Multisensory Integration in Emotion Recognition Through Bio-Inspired Computational Models

Multimodal Emotion Recognition by Combining Physiological Signals and Facial Expressions: a Preliminary Study.

Exploiting EEG signals and audiovisual feature fusion for video emotion recognition

Multi-Microphone and Multi-Modal Emotion Recognition in Reverberant Environment

Multimodal Utterance-level Affect Analysis using Visual, Audio and Text Features

Learning Affective Features with a Hybrid Deep Model for Audio–Visual Emotion Recognition

An Efficient Approach for Audio-Visual Emotion Recognition with Missing Labels and Missing Modalities

Multimodal emotion recognition from audio and video

Multitask Learning and Multistage Fusion for Dimensional Audiovisual Emotion Recognition

Audio-Visual Emotion Recognition Based on Facial Expression and Affective Speech

Multimodal Deep Convolutional Neural Network for Audio-Visual Emotion Recognition.

Audio-Visual Fusion Network Based on Conformer for Multimodal Emotion Recognition

Multimodal Emotion Recognition by Extracting Common and Modality-Specific Information.