Abstract:With the rapid growth of modern technology, many biomedical studies are being conducted to collect massive datasets with volumes of multi‐modality imaging, genetic, neurocognitive and clinical information from increasingly large cohorts. Simultaneously extracting and integrating rich and diverse heterogeneous information in neuroimaging and/or genomics from these big datasets could transform our understanding of how genetic variants impact brain structure and function, cognitive function and brain‐related disease risk across the lifespan. Such understanding is critical for diagnosis, prevention and treatment of numerous complex brain‐related disorders (e.g., schizophrenia and Alzheimer's disease). However, the development of analytical methods for the joint analysis of both high‐dimensional imaging phenotypes and high‐dimensional genetic data, a big data squared (BD2) problem, presents major computational and theoretical challenges for existing analytical methods. Besides the high‐dimensional nature of BD2, various neuroimaging measures often exhibit strong spatial smoothness and dependence and genetic markers may have a natural dependence structure arising from linkage disequilibrium. We review some recent developments of various statistical techniques for imaging genetics, including massive univariate and voxel‐wise approaches, reduced rank regression, mixture models and group sparse multi‐task regression. By doing so, we hope that this review may encourage others in the statistical community to enter into this new and exciting field of research. The Canadian Journal of Statistics 47: 108–131; 2019 © 2019 Statistical Society of CanadaAvec l'évolution rapide de la technologie, de nombreuses études biomédicales collectent des jeux de données massifs comportant un volume d'images multi‐modales et des informations cliniques, génétiques et neurocognitives sur des cohortes de plus en plus grandes. Réussir à en extraire puis à intégrer simultanément des informations riches et hétérogènes en génomique ou en imagerie cérébrale pourrait transformer notre compréhension des conséquences de la génétique sur les structures du cerveau et ses fonctions, cognitives ou autres, ainsi que sur les maladies cérébrales affectant les individus au cours de leur vie. Cette compréhension est cruciale pour le diagnostic, la prévention et le traitement de nombreux troubles cérébraux complexes (comme la schizophrénie et la maladie d'Alzheimer). L'analyse conjointe de phénotypes mesurés par l'imagerie en haute dimension avec des données génétiques également en haute dimension mène à un problème de mégadonnées au carré (MD2), présentant des défis computationnels et théoriques. Au‐delà de la haute dimension de données MD2, les mesures d'imagerie médicale comportent souvent une dépendance spatiale et une apparence lisse, puis les marqueurs génétiques peuvent posséder une structure de dépendance naturelle émergeant du déséquilibre des liens. Les auteurs décrivent le développement récent de plusieurs techniques statistiques pour l'imagerie en génétique, notamment les approches univariée massive et par voxel, la régression de rang réduit, les modèles de mélange, et la régression multi‐tâches pour groupes épars. Ils souhaitent ainsi encourager d'autres membres de la communauté statistique à contribuer à cet excitant nouveau champ de recherche. La revue canadienne de statistique 47: 108–131; 2019 © 2019 Société statistique du Canada

Dimensionality Reduction Methods for Brain Imaging Data Analysis

Exploiting Dimensionality Reduction and Neural Network Techniques for the Development of Expert Brain-Computer Interfaces

A Hybrid Autoencoder Framework of Dimensionality Reduction for Brain-Computer Interface Decoding

Supervised dimensionality reduction for big data

Dimensionality Reduction and Data Visualisation

Distributed Dimensionality Reconstruction Algorithm for High Dimensional Data in Internet of Brain Things

Deep Learning in Neuroimaging: Promises and challenges

Deep Factor Learning for Accurate Brain Neuroimaging Data Analysis on Discrimination for Structural MRI and Functional MRI

A Robust Multi-Subject Fmri Analysis Method Using Dimensional Optimization

Functional connectomics from a "big data" perspective.

Analysis of Dynamic Brain Imaging Data

Multilevel Functional Principal Component Analysis for High-Dimensional Data

Simultaneous Dimensionality Reduction for Extracting Useful Representations of Large Empirical Multimodal Datasets

An efficient functional magnetic resonance imaging data reduction strategy using neighborhood preserving embedding algorithm

Model Order Reduction in Neuroscience

Unsupervised Non Linear Dimensionality Reduction Machine Learning methods applied to Multiparametric MRI in cerebral ischemia: Preliminary Results

Multimodal Magnetic Resonance Imaging for Brain Disorders: Advances and Perspectives

A Variational Bayesian Approach to Identifying Whole-Brain Directed Networks with Fmri Data

A review of statistical methods in imaging genetics

Dimensionality Reduction Hybrid U-Net for Brain Extraction in Magnetic Resonance Imaging

A Brief Survey of Dimension Reduction