Connectivity conservation planning through deep reinforcement learning

Julián Equihua,Michael Beckmann,Ralf Seppelt
DOI: https://doi.org/10.1111/2041-210x.14300
2024-02-24
Methods in Ecology and Evolution
Abstract:The United Nations has declared 2021–2030 the decade on ecosystem restoration with the aim of preventing, stopping and reversing the degradation of the ecosystems of the world, often caused by the fragmentation of natural landscapes. Human activities separate and surround habitats, making them too small to sustain viable animal populations or too far apart to enable foraging and gene flow. Despite the need for strategies to solve fragmentation, it remains unclear how to efficiently reconnect nature. In this paper, we illustrate the potential of deep reinforcement learning (DRL) to tackle the spatial optimisation aspect of connectivity conservation planning. The propensity of spatial optimisation problems to explode in complexity depending on the number of input variables and their states is and will continue to be one of its most serious obstacles. DRL is an emerging class of methods focused on training deep neural networks to solve decision‐making tasks and has been used to learn good heuristics for complex optimisation problems. While the potential of DRL to optimise conservation decisions seems huge, only few examples of its application exist. We applied DRL to two real‐world raster datasets in a connectivity planning setting, targeting graph‐based connectivity indices for optimisation. We show that DRL converges to the known optimums in a small example where the objective is the overall improvement of the Integral Index of Connectivity and the only constraint is the budget. We also show that DRL approximates high‐quality solutions on a large example with additional cost and spatial configuration constraints where the more complex Probability of Connectivity Index is targeted. To the best of our knowledge, there is no software that can target this index for optimisation on raster data of this size. DRL can be used to approximate good solutions in complex spatial optimisation problems even when the conservation feature is non‐linear like graph‐based indices. Furthermore, our methodology decouples the optimisation process and the index calculation, so it can potentially target any other conservation feature implemented in current or future software. Resumen Las Naciones Unidas han declarado 2021–2030 la década para la restauración ecológica, con el objetivo de prevenir, detener e incluso revertir la degradación de los ecosistemas del mundo. Esta alteración es causada a menudo por la fragmentación de los paisajes naturales. Las actividades humanas dividen y aíslan los hábitats, haciéndolos demasiado pequeños para sustentar poblaciones animales viables o demasiado separados para permitir el forrajeo y el flujo genético. A pesar de la necesidad de estrategias para resolver la fragmentación, sigue sin ser claro cómo reconectar eficazmente a la naturaleza. En este artículo, ilustramos el potencial del Aprendizaje Profundo por Refuerzo (APR) para abordar el aspecto de optimización espacial en la planificación de la conservación de la conectividad. La propensión de los problemas de optimización espacial a crecer exponencialmente en complejidad en función del número de variables y sus estados es, y seguirá siendo, uno de sus obstáculos más serios. El APR es una clase de métodos para el entrenamiento de redes neuronales profundas con el fin de resolver tareas de toma de decisiones y se ha utilizado para diseñar buenas heurísticas para problemas de optimización complejos. Si bien el potencial de el APR para optimizar las decisiones de conservación parece enorme, actualmente sólo existen unos pocos ejemplos de su aplicación. En este estudio, aplicamos APR a dos rásteres de cobertura del suelo del mundo real en un entorno de planificación de conectividad, apuntando a la optimización de índices de conectividad basados en grafos. Mostramos que APR converge a los óptimos conocidos en un ejemplo pequeño donde el objetivo es la mejora del Índice Integral de Conectividad y la única restricción es el presupuesto. También, mostramos que APR se aproxima a soluciones de alta calidad en un ejemplo mayor, con restricciones adicionales de costos y de configuración espacial y donde el objetivo es la mejora del Índice de Probabilidad de Conectividad. Hasta donde sabemos, no existe ningún software que pueda optimizar este índice sobre datos ráster del tamaño que nosotros procesamos. El APR puede utilizarse para aproximar buenas soluciones en problemas complejos de optimización espacial, incluso cuando el objetivo de conservación es no lineal, como lo son los índices basados en grafos. Además, nuestra metodología desvincula el proceso de optimización y el cálculo del índice, por lo que potencialmente puede incorporar cualquier otro objetivo de conservación implementado en el software actual o futuro.
ecology
What problem does this paper attempt to address?