Harnessing large language models for coding, teaching and inclusion to empower research in ecology and evolution

Natalie Cooper,Adam T. Clark,Nicolas Lecomte,Huijie Qiao,Aaron M. Ellison
DOI: https://doi.org/10.1111/2041-210x.14325
2024-05-04
Methods in Ecology and Evolution
Abstract:Large language models (LLMs) are a type of artificial intelligence (AI) that can perform various natural language processing tasks. The adoption of LLMs has become increasingly prominent in scientific writing and analyses because of the availability of free applications such as ChatGPT. This increased use of LLMs not only raises concerns about academic integrity but also presents opportunities for the research community. Here we focus on the opportunities for using LLMs for coding in ecology and evolution. We discuss how LLMs can be used to generate, explain, comment, translate, debug, optimise and test code. We also highlight the importance of writing effective prompts and carefully evaluating the outputs of LLMs. In addition, we draft a possible road map for using such models inclusively and with integrity. LLMs can accelerate the coding process, especially for unfamiliar tasks, and free up time for higher level tasks and creative thinking while increasing efficiency and creative output. LLMs also enhance inclusion by accommodating individuals without coding skills, with limited access to education in coding, or for whom English is not their primary written or spoken language. However, code generated by LLMs is of variable quality and has issues related to mathematics, logic, non‐reproducibility and intellectual property; it can also include mistakes and approximations, especially in novel methods. We highlight the benefits of using LLMs to teach and learn coding, and advocate for guiding students in the appropriate use of AI tools for coding. Despite the ability to assign many coding tasks to LLMs, we also reaffirm the continued importance of teaching coding skills for interpreting LLM‐generated code and to develop critical thinking skills. As editors of MEE, we support—to a limited extent—the transparent, accountable and acknowledged use of LLMs and other AI tools in publications. If LLMs or comparable AI tools (excluding commonly used aids like spell‐checkers, Grammarly and Writefull) are used to produce the work described in a manuscript, there must be a clear statement to that effect in its Methods section, and the corresponding or senior author must take responsibility for any code (or text) generated by the AI platform. Résumé Les grands modèles de langages (LLM) sont un type d'intelligence artificielle (IA) capable d'effectuer diverses tâches de traitement du langage naturel. L'adoption des LLM est devenue de plus en plus importante dans l'écriture et l'analyse scientifiques en raison de la disponibilité d'applications gratuites telles que ChatGPT. Cette utilisation accrue des LLM soulève des préoccupations en matière d'intégrité académique, mais présente également des opportunités pour la communauté de recherche. Ici, nous nous concentrons sur les opportunités d'utilisation des LLM pour le codage en écologie et en évolution. Nous discutons de la manière dont les LLM peuvent être utilisés pour générer, expliquer, commenter, traduire, corriger, optimiser et tester du code. Nous soulignons également l'importance de rédiger des requêtes efficaces et d'évaluer attentivement les sorties des LLM. De plus, nous élaborons une feuille de route possible vers l'utilisation inclusive et intègre de tels modèles. Les LLM peuvent accélérer le processus de codage, notamment dans le cas de tâches peu familières, libérant ainsi du temps pour des tâches de niveau supérieur comme la créativité tout en augmentant l'efficacité et la production de nouvelles idées. Les LLM renforcent également l'inclusion en permettant la participation active des individus qui ne savent peu ou pas coder et/ou qui ont un accès limité à l'éducation en codage. Cependant, le code généré par les LLM est de qualité variable et présente des problèmes liés aux mathématiques et à la logique, tout en créant des solutions peu ou pas reproduisables et pouvant infriger des droits de propriété intellectuelle; il peut aussi contenir des erreurs et des approximations, notamment lorsque cela touche à de nouvelles méthodes, ce qui est surtout le cas en recherche. Nous mettons en avant les avantages de l'utilisation des LLM afin d'enseigner et d'apprendre le codage, et plaidons en faveur de l'orientation des étudiants et des étudiantes dans l'utilisation appropriée des outils d'IA pour le codage. Bien que les LLM soient capables de gérer de nombreuses requettes de codage, nous réaffirmons également l'importance centrale de l'enseignement en techniques et création de codes afin d'interpréter ceux générés par les LLM et de développer des compétences en pensée critique. En tant qu'éditeurs de MEE, nous soutenons, dans une certaine mesure, l'utilisation transparente, responsable et reconnue des LLM et d'autres outils d'IA dans les publications. Si des LLM ou des outils d'IA comparables (à l'exclusion des aides couramment utilisées telles que les correcteurs orthographiques) sont utilisés pour produi -Abstract Truncated-
ecology
What problem does this paper attempt to address?