Censored autoregressive regression models with Student‐t innovations

Katherine A. L. Valeriano,Fernanda L. Schumacher,Christian E. Galarza,Larissa A. Matos
DOI: https://doi.org/10.1002/cjs.11804
2024-02-22
Canadian Journal of Statistics
Abstract:Data collected over time are common in applications and may contain censored or missing observations, making it difficult to use standard statistical procedures. This article proposes an algorithm to estimate the parameters of a censored linear regression model with errors serially correlated and innovations following a Student‐t distribution. This distribution is widely used in the statistical modelling of data containing outliers because its longer‐than‐normal tails provide a robust approach to handling such data. The maximum likelihood estimates of the proposed model are obtained through a stochastic approximation of the EM algorithm. The methods are applied to an environmental dataset regarding ammonia‐nitrogen concentration, which is subject to a limit of detection (left censoring) and contains missing observations. Additionally, two simulation studies are conducted to examine the asymptotic properties of the estimates and the robustness of the model. The proposed algorithm and methods are implemented in the R package ARCensReg. Résumé La collecte de données temporelles, fréquente dans de nombreuses applications, présente souvent des observations censurées ou manquantes, posant ainsi un défi à l'utilisation des procédures statistiques standard. Dans cet article, les auteurs proposent un algorithme qui permet d'estimer les paramètres d'un modèle de régression linéaire censuré caractérisé par des erreurs corrélées en série et des innovations qui suivent une loi de Student‐t. Cette loi, privilégiée dans la modélisation statistique de données comportant des valeurs aberrantes, se distingue par ses queues plus lourdes que la normale, offrant ainsi une méthode plus robuste pour gérer ces données. Les auteurs parviennent à obtenir les estimations du maximum de vraisemblance pour le modèle suggéré via une approximation stochastique de l'algorithme EM. Ces méthodes ont été appliquées à un jeu de données environnementales relatif à la concentration d'ammoniac‐azote, sujet à une limite de détection (censure à gauche) et incluant des observations manquantes. De plus, deux études de simulation ont été réalisées pour étudier les propriétés asymptotiques des estimations et la robustesse du modèle. L'algorithme proposé, de même que les méthodes développées, sont intégrés dans le package R, ARCensReg.
statistics & probability
What problem does this paper attempt to address?