Regression trees for interval‐censored failure time data based on censoring unbiased transformations and pseudo‐observations

Ce Yang,Xianwei Li,Liqun Diao,Richard J. Cook
DOI: https://doi.org/10.1002/cjs.11807
2024-06-22
Canadian Journal of Statistics
Abstract:Interval‐censored data arise when a failure process is under intermittent observation and failure status is only known at assessment times. We consider the development of predictive algorithms when training samples involve interval censoring. Using censoring unbiased transformations and pseudo‐observations, we define observed data loss functions, which are unbiased estimates of the corresponding complete data loss functions. We show that regression trees based on these loss functions can recover the tree structure and yield good predictive accuracy. An application is given to a study involving individuals with psoriatic arthritis where the aim is to identify genetic markers useful for the prediction of axial disease within 10 years of a baseline assessment. Résumé Les données censurées par intervalle surviennent lorsqu'un processus de défaillance est observé de manière intermittente et que l'état de défaillance n'est connu qu'aux temps d'évaluation. Les auteurs de ce travail étudient le développement d'algorithmes prédictifs lorsque les échantillons d'entraînement impliquent une censure par intervalle. En utilisant des transformations sans biais de censure et des pseudo‐observations, ils définissent des fonctions de perte de données observées, qui sont des estimations sans biais des fonctions de perte des données complètes correspondantes. Ils démontrent que les arbres de régression construits à partir de ces fonctions de substitution permettent de retrouver la structure réelle sous‐jacente tout en assurant de bonnes performances prédictives. Cette méthodologie est appliquée à une étude clinique sur l'arthrite psoriasique, visant à identifier des marqueurs génétiques prédictifs de l'apparition d'une forme axiale de la pathologie dans les 10 ans suivant une évaluation initiale.
statistics & probability
What problem does this paper attempt to address?