Abstract:Interfaces based on surface electromyography (sEMG) and inertial measurement units (IMUs) enable users to interact with computers in a natural and intuitive way through hand gestures. sEMG or IMU sensor-based approaches can provide muscle electrical activity or motion information to recognize gestures. However, the existing methods recognize static and dynamic gestures separately and hierarchically. In addition, the variability in sEMG data among different subjects limits the performance of sensor-based human–computer interfaces. To address these limitations, this article proposes a multistream convolutional neural network (CNN) architecture with a fine-tuning transfer strategy. The multistream architecture explores the complementary nature of sEMG and IMU signals and achieves real-time recognition of dynamic and static gestures in a nonhierarchical way. In addition, a new dataset including seven static gestures and six dynamic gestures is designed for evaluation. The proposed method is verified by experiments on six subjects and is compared with previous methods on the same dataset. Experimental results reveal that the transfer strategy significantly improves recognition accuracy from 89.99% to 98.49%. Meanwhile, by learning the fusion features of sEMG and IMU signals, the recognition accuracy is enhanced from 49.54% (sEMG) and 59.91% (IMU) to 89.99%. In addition, the accuracy and latency of this method for real-time recognition are 98.12% and 103 ms, respectively. These results demonstrate that the proposed multistream CNN model accurately recognizes these static and dynamic gestures online in a nonhierarchical way and can effectively utilize the complementarity between sEMG and IMU signals.

Multimodal Gesture Recognition Using Multi-stream Recurrent Neural Network

Multimode Gesture Recognition Algorithm Based on Convolutional Long Short-Term Memory Network

Deep Dynamic Neural Networks for Multimodal Gesture Segmentation and Recognition

Multimodal Spatiotemporal Feature Map for Dynamic Gesture Recognition

Surface Electromyography-based Gesture Recognition by Multi-view Deep Learning.

Multi-modal fusion for robust hand gesture recognition based on heterogeneous networks

Multi-Task and Multi-Modal Learning for RGB Dynamic Gesture Recognition

Multi-Scale Attention 3D Convolutional Network for Multimodal Gesture Recognition

Multimodal Gesture Recognition Based on Attention Slow-Fast Fusion Networks

Searching Multi-Rate and Multi-Modal Temporal Enhanced Networks for Gesture Recognition

Study on Gesture Recognition Method with Two-Stream Residual Network Fusing sEMG Signals and Acceleration Signals

Multi-Sensor Guided Hand Gesture Recognition for a Teleoperated Robot Using a Recurrent Neural Network

MVHANet: Multi-view Hierarchical Aggregation Network for Skeleton-Based Hand Gesture Recognition

A multi-stream convolutional neural network for sEMG-based gesture recognition in muscle-computer interface

CMCI: A Robust Multimodal Fusion Method for Spiking Neural Networks

Multimodal Gesture Recognition Based On Choquet Integral

Multistage Spatial Attention-Based Neural Network for Hand Gesture Recognition

A Gesture Recognition Method Based On Spiking Neural Networks For Cognition Development

A Multimodal Dynamic Hand Gesture Recognition Based on Radar–Vision Fusion

A Multimodal Multilevel Converged Attention Network for Hand Gesture Recognition With Hybrid sEMG and A-Mode Ultrasound Sensing

sEMG and IMU Data-Based Hand Gesture Recognition Method Using Multistream CNN With a Fine-Tuning Transfer Framework