Abstract:Emotion recognition in conversation (ERC) is a widely used technology in both affective dialogue bots and dialogue recommendation scenarios, where motivating a system to correctly recognize human emotions is crucial. Uncovering as much contextual information as possible with a limited amount of dialogue information is essential for eventually identifying the correct emotion of each sentence. The integration of contextual information using the existing approaches often results in inadequate access to information or information redundancy. Deeply integrating the different knowledge behind utterances is also difficult. Therefore, to address these problems, we propose a dynamic complementary graph convolutional network (DCGCN) for conversational emotion recognition. Our approach uses commonsense knowledge to complement the contextual information contained in utterances and enrich the extracted conversation information. We creatively propose the concept of utterance density to prevent redundancy and the loss of utterance information in context-dependent contextual information modeling cases. An utterance dependency structure is dynamically determined by the utterance density, and the contextual information is fully integrated into each sentence representation. We evaluate our proposed model in extensive experiments conducted on four public benchmark datasets that are commonly used for ERC. The results demonstrate the effectiveness of the DCGCN, which achieves competitive results in terms of well-known evaluation metrics. Our code is available at https://github.com/Tars-is-a-robot/Conversational-emotion-recognition.git.

SpikEmo: Enhancing Emotion Recognition With Spiking Temporal Dynamics in Conversations

Exploring Spatio-Temporal Representations by Integrating Attention-based Bidirectional-LSTM-RNNs and FCNs for Speech Emotion Recognition

Deep Spectrum Feature Representations for Speech Emotion Recognition

Adapted Dynamic Memory Network for Emotion Recognition in Conversation

EmotionIC: emotional inertia and contagion-driven dependency modeling for emotion recognition in conversation

Speech Emotion Recognition with Early Visual Cross-modal Enhancement Using Spiking Neural Networks.

RL-EMO: A Reinforcement Learning Framework for Multimodal Emotion Recognition.

MultiEMO: an Attention-Based Correlation-Aware Multimodal Fusion Framework for Emotion Recognition in Conversations.

Conversational emotion recognition studies based on graph convolutional neural networks and a dependent syntactic analysis

SI-LSTM: Speaker Hybrid Long-short Term Memory and Cross Modal Attention for Emotion Recognition in Conversation

Knowledge-Interactive Network with Sentiment Polarity Intensity-Aware Multi-Task Learning for Emotion Recognition in Conversations

A Contextual Attention Network for Multimodal Emotion Recognition in Conversation

Temporal Modeling Matters: A Novel Temporal Emotional Modeling Approach for Speech Emotion Recognition

Multi-Scale Receptive Field Graph Model for Emotion Recognition in Conversations

Emotion Recognition in Conversation Based on a Dynamic Complementary Graph Convolutional Network

Emotional Cues Extraction and Fusion for Multi-modal Emotion Prediction and Recognition in Conversation

EmoCaps: Emotion Capsule Based Model for Conversational Emotion Recognition

EmoEM: Emotional Expression in a Multi-turn Dialogue Model.

A multi-message passing framework based on heterogeneous graphs in conversational emotion recognition

Mamba-Enhanced Text-Audio-Video Alignment Network for Emotion Recognition in Conversations

Cluster-Level Contrastive Learning for Emotion Recognition in Conversations