Seed classification with random forest models

Josephine Elena Reek,Janneke Hille Ris Lambers,Eléonore Perret,Alana R. O. Chin
DOI: https://doi.org/10.1002/aps3.11596
2024-06-07
Applications in Plant Sciences
Abstract:Premise To improve forest conservation monitoring, we developed a protocol to automatically count and identify the seeds of plant species with minimal resource requirements, making the process more efficient and less dependent on human operators. Methods and Results Seeds from six North American conifer tree species were separated from leaf litter and imaged on a flatbed scanner. In the most successful species‐classification approach, an ImageJ macro automatically extracted measurements for random forest classification in the software R. The method allows for good classification accuracy, and the same process can be used to train the model on other species. Conclusions This protocol is an adaptable tool for efficient and consistent identification of seed species or potentially other objects. Automated seed classification is efficient and inexpensive, making it a practical solution that enhances the feasibility of large‐scale monitoring projects in conservation biology. Abstrakt Prämisse Um Schutz und Monitoring von Wäldern zu unterstützen, haben wir ein Protokoll für automatisches Zählen und Identifizieren von Pflanzensamen entwickelt. Es erfordert minimale Ressourcen und bietet Zeit‐Effizienz wie auch geringe Abhängigkeit vom Anwender. Methoden und Resultate Samen von sechs Nordamerikanischen Koniferen‐ Arten wurden von Laubstreu getrennt und auf einem Flachbettscanner gescannt. Die erfolgreichste Klassifikationsmethode benutzt ein ImageJ macro um Messwerte automatisch zu extrahieren; diese werden zur Klassifikation durch ein Random Forest Modell in der Software R verwendet. Die Methode bietet gute Klassifikationsgenauigkeit und derselbe Prozess kann benutzt werden, um das Modell auf andere Arten zu trainieren. Schlussfolgerung Das Protokoll ist ein anpassungsfähiges Mittel um Samenarten oder potentiell andere Objekte effizient und einheitlich zu identifizieren. Automatische Samenklassifikation ist effizient und kostengünstig und somit eine praktikable Möglichkeit für grosse Monitoring Projekte im Naturschutz. Abstrait Résumé Afin d'améliorer la surveillance des écosystèmes forestiers, nous avons développés une nouvelle méthode pour le comptage et l'identification des graines de plantes en fonction des espèces. En utilisant des ressources minimales, ce protocole permet de gagner du temps et de réduire la nécessité d'intervention humaine constante. Méthodes et Résultats Après avoir été séparées de la litière de feuilles, les graines de six espèces de conifères d'Amérique du Nord ont été photographiées sur un scanner. Lors de l'approche de classification des espèces la plus réussie, une macro ImageJ extrait des mesures pour la classification par forêt aléatoire dans le logiciel R. La méthode présente une précision élevée de classification et le processus peut être adapté pour entraîner le modèle sur d'autres espèces. Conclusion Ce protocol est un outil extrêmement polyvalent pour une identification efficace et cohérente des espèces de semences, ou potentiellement d'autres objets. La classification automatisée des graines est à la fois efficace et peu coûteuse, ce qui en fait une solution pratique pour améliorer la réalisation de projets à grande échelle dans le domaine de la biologie de la conservation.
plant sciences
What problem does this paper attempt to address?