Robust causal inference for point exposures with missing confounders
Alexander W. Levis,Rajarshi Mukherjee,Rui Wang,Sebastien Haneuse
DOI: https://doi.org/10.1002/cjs.11832
2024-09-21
Canadian Journal of Statistics
Abstract:Large observational databases are often subject to missing data. As such, methods for causal inference must simultaneously handle confounding and missingness; surprisingly little work has been done at this intersection. Motivated by this, we propose an efficient and robust estimator of the causal average treatment effect from cohort studies when confounders are missing at random. The approach is based on a novel factorization of the likelihood that, unlike alternative methods, facilitates flexible modelling of nuisance functions (e.g., with state‐of‐the‐art machine learning methods) while maintaining nominal convergence rates of the final estimators. Simulated data, derived from an electronic health record‐based study of the long‐term effects of bariatric surgery on weight outcomes, verify the robustness properties of the proposed estimators in finite samples. Our approach may serve as a theoretical benchmark against which ad hoc methods may be assessed. Résumé Les grandes bases de données observationnelles sont souvent confrontées au problème des données manquantes. De ce fait, les méthodes d'inférence causale doivent gérer à la fois les facteurs de confusion et les données manquantes, un domaine étonnamment peu exploré. Pour répondre à ce défi, les auteurs de cet article proposent un estimateur efficace et robuste de l'effet causal moyen du traitement. Cet estimateur est spécialement conçu pour les études de cohortes où les facteurs de confusion sont manquants de manière aléatoire. L'approche proposée s'appuie sur une nouvelle factorisation de la vraisemblance. Contrairement à d'autres méthodes, celle‐ci permet de modéliser les fonctions de nuisance de manière flexible, notamment grâce à des techniques avancées d'apprentissage automatique, et ce tout en maintenant les taux de convergence attendus des estimateurs finaux. Des simulations basées sur des dossiers médicaux électroniques concernant les effets à long terme de la chirurgie bariatrique sur le poids confirment la robustesse des estimateurs dans des échantillons finis. Cette approche pourrait servir de référence théorique pour évaluer d'autres méthodes ad‐hoc.
statistics & probability