ENphylo: A new method to model the distribution of extremely rare species
Alessandro Mondanaro,Mirko Di Febbraro,Silvia Castiglione,Marina Melchionna,Carmela Serio,Giorgia Girardi,Arianna Morena Belfiore,Pasquale Raia
DOI: https://doi.org/10.1111/2041-210X.14066
2023-01-31
Methods in Ecology and Evolution
Abstract:Species distribution models (SDMs) are a useful mean to understand how environmental variation influences species geographical distribution. SDMs are implemented by several different algorithms. Unfortunately, these algorithms consistently lose accuracy exactly when they are needed the most, that is with rare species, originating the so‐called rare‐species modelling paradox. Although approaches exist to tackle this problem, most notably by performing and then averaging a number of bivariate models, they are usually computationally intensive and were never shown to apply successfully to the rarest species (i.e. with less than 20 geographical occurrences). Here, we present a new algorithm, ENphylo, embedded in the readily‐available R package RRdtn, which couples Environmental Niche Factor Analysis (ENFA) and phylogenetic imputation to model the distribution of rare species. Using the fossil record of 31 species of large mammals that lived during the late Pleistocene as the source data to sample from, we demonstrate ENphylo provides good SDM evaluation scores, with area under the curve and Sørensen Index both consistently above 0.75, True Skills Statistics above 0.4 and Boyce Index above 0.5 in most cases, when just 10 fossil occurrences are randomly drawn from their respective fossil records. ENphylo proved significantly more accurate than ENFA and the ensemble of bivariate models using Maxent, Generalized Linear Model and Random Forest algorithms. Intriguingly, we found that randomly drawing as little as 10 occurrence data points per species allows ENphylo to perform equally well as Maxent run using the entire fossil record of these same species and data. ENphylo provides a fast and accurate solution to perform species distribution modelling with rare species, which will help predicting their distribution in the light of climate change, and to delineate how rare extinct species reacted to past climatic variation. Riepilogo I modelli di distribuzione delle specie (SDM) servono a capire come la variazione ambientale influenzi la distribuzione geografica delle specie. Gli SDM sono implementati da diversi algoritmi. Sfortunatamente, questi algoritmi perdono accuratezza proprio quando la loro applicazione diventa più importante, ovvero con le specie rare, originando il cosiddetto paradosso della modellazione delle specie rare. Sebbene esistano approcci per affrontare questo problema, ad esempio implementando contemporaneamente diversi modelli bivariati, queste alternative sono computazionalmente impegnative e non è mai stato dimostrato che si applichino con successo alle specie più rare (con meno di 20 occorrenze geografiche). Presentiano qui un nuovo algoritmo, ENphylo, facente parte del pacchetto R RRdtn, che accoppia l'analisi fattoriale di nicchia ecologica e l'imputazione filogenetica per modellizzare la distribuzione delle specie rare. Utilizzando la documentazione fossile di 31 specie di grandi mammiferi Pleistocenici, abbiamo dimostrato come ENphylo fornisca buoni punteggi di valutazione SDM, con Area Under the Curve e Sørensen Index entrambi costantemente superiori a 0,75, True Skills Statistics superiori a 0,4 e indice di Boyce superiore a 0,5 nella maggior parte dei casi, quando anche solo 10 occorrenze fossili vengono estratte casualmente dai rispettivi record delle specie. ENphylo si è dimostrato significativamente più accurato di ENFA e dell'insieme di modelli bivariati utilizzando gli algoritmi Maxent, Generalized Linear Model e Random Forest. E' interessante notare come utilizzando appena 10 occorrenze per specie ENphylo funzioni almeno altrettanto bene che Maxent implementato utilizzando l'intera documentazione fossile di queste stesse specie. ENphylo fornisce una soluzione rapida ed accurata per la modellizzazione della distribuzione delle specie rare, che aiuterà a prevedere la loro distribuzione alla luce del cambiamento climatico e a delineare come le specie estinte abbiano reagito alle variazioni climatiche del passato
ecology