Clustering spatial functional data using a geographically weighted Dirichlet process

Tianyu Pan,Weining Shen,Guanyu Hu
DOI: https://doi.org/10.1002/cjs.11803
2024-01-07
Canadian Journal of Statistics
Abstract:We propose a Bayesian nonparametric clustering approach to study the spatial heterogeneity effect for functional data observed at spatially correlated locations. We consider a geographically weighted Chinese restaurant process equipped with a conditional autoregressive prior to capture fully the spatial correlation of function curves. To sample efficiently from our model, we customize a prior called Quadratic Gamma, which ensures conjugacy. We design a Markov chain Monte Carlo algorithm to infer simultaneously the posterior distributions of the number of groups and the grouping configurations. The superior numerical performance of the proposed method over competing methods is demonstrated using simulated examples and a U.S. annual precipitation study. Résumé Dans ce travail, les auteurs présentent une approche de regroupement non paramétrique bayésienne pour examiner l'hétérogénéité spatiale dans des données fonctionnelles observées à des sites corrélés. Leur méthode s'appuie sur un processus du restaurant chinois pondéré géographiquement, complété par un a priori autorégressif conditionnel, pour capturer la corrélation spatiale des courbes fonctionnelles. Afin d'échantillonner efficacement dans ce cadre, ils introduisent un a priori Gamma quadratique qui garantit la propriété de conjugaison. Ils proposent également un algorithme de Monte‐Carlo par chaînes de Markov pour estimer les lois a posteriori du nombre de groupes et de leurs configurations. À travers des simulations et une étude sur les précipitations annuelles aux États‐Unis, ils démontrent que la performance de leur méthode est souvent supérieure à celle d'approches alternatives.
statistics & probability
What problem does this paper attempt to address?