Vers une démarche ontologique pour la gestion des bases de données en agroforesterie

par Raphaël Conde Salazar

Projet de thèse en Informatique

Sous la direction de Isabelle Mougenot et de Alexia Stokes.

Thèses en préparation à Montpellier , dans le cadre de I2S - Information, Structures, Systèmes , en partenariat avec AMAP - botAnique et Modélisation de l'Architecture des Plantes et des végétations (laboratoire) depuis le 01-09-2017 .


  • Résumé

    Dans un contexte général de développement durable, les recherches menées autour de l'agroforesterie prennent tout leur sens en rendant intelligibles les interactions plante-plante dans un environnement pouvant être dégradés. Depuis plusieurs années maintenant, des données issues d'observations sur le terrain sont acquises en partenariat avec plusieurs catégories d'acteurs (forestiers, agriculteurs, éleveurs...).Le premier objectif est maintenant d'ouvrir ces données et de les rendre disponibles sur le web à destination d'autres communautés. De plus, les études menées en agroforesterie nécessitent des approches systémiques pour par exemple mieux comprendre les mécanismes de résilience des plantes face aux changements climatiques ou encore face à la pollution des sols. Un deuxième objectif est donc de rendre les données liables à d'autres jeux de données relatifs au climat et aux territoires. Le double enjeu de partage et d'interconnexion des données en agroforesterie nous rapproche de ce qu'il se pratique aujourd'hui au sein du web sémantique avec différents outils et méthodes à même de promouvoir la mutualisation de sources de données ouvertes et liées [Heath, 2011]. Le web sémantique est la vision du World Wide Web Consortium's (W3C) d'un web global ou toutes les données seraient liées entre elles. Les technologies du web sémantique fournissent les procedures standard pour décrire et acceder aux ressources présentes sur le Web. Les données ainsi liées sont exploitées et enrichies par des technologies comme RDF, SPARQL, OWL and SKOS (Garnier et al., 2017). Le travail de thèse s'inscrit dans ce cadre, nous aurons à charge de réutiliser les formats standards du web sémantique [Cuenca, 2008]) et d'exploiter un éventail d'ontologies terminologiques afin de proposer un modèle de connaissances ouvert et flexible à même de rendre compte de la complexité des données déjà collectées en agroforesterie. L'importance est donnée à la fois à la publication de données parfaitement décrites en privilégiant la réutilisation d'ontologies déjà existantes et à la mise en capacité de lier ces données à des données déjà disponibles sur le web (données climatiques, profils pédologiques, données sur le fonctionnement de communautés végétales, etc.). Nous devons également si nécessaire construire une ontologie terminologique (Laporte et al., 2014 ; Garnier et al., 2017) dédiée à l'agroforesterie. Cette ontologie se consacrera à la qualification linguistique des concepts clés partagés par toute la communauté et sera rendue publique sur le portail AgroPortal (http://agroportal.lirmm.fr/). Les derniers volets du travail de thèse se concentreront sur l'interprétation des résultats dégagés sur la base de l'interconnexion des données. A cet effet, une ontologie formalisée en OWL 2 sera construite de manière à pouvoir raisonner sur l'ensemble des données intégrées. Une ontologie en informatique est un modèle de connaissances portant sur un domaine d'intérêt et rendu exploitable par des agents logiciels. L'objectif est donc de faire ressortir des tendances relatives aux associations entre arbres et plantes cultivées dans l'exploitation des terres par mise en application de mécanismes inférentiels sur l'ontologie. Références : Cuenca, B., Horrocks, I., Motik, B., Parsia, B., Patel-Schneider, P. & Sattler, U. (2008). OWL 2: The next step for OWL. Web Semantics, 6, 309--322. Garnier, E., Stahl, U., Laporte, M.-A., Kattge, J., Mougenot, I., Kühn, I., Laporte, B., Amiaud, B., Ahrestani, F. S., Bönisch, G., Bunker, D. E., Cornelissen, J. H. C., Díaz, S., Enquist, B. J., Gachet, S., Jaureguiberry, P., Kleyer, M., Lavorel, S., Maicher, L., Pérez-Harguindeguy, N., Poorter, H., Schildhauer, M., Shipley, B., Violle, C., Weiher, E., Wirth, C., Wright, I. J. and Klotz, S. Towards a thesaurus of plant characteristics: an ecological contribution (2017) Journal of Ecology 105:298–309 Heath, T. & Bizer, C. (2011) Linked Data: Evolving the Web into a Global Data Space. Synthesis Lectures on The Semantic Web, Morgan & Claypool Publishers Laporte MA, Mougenot I, Garnier E, Stahl U, Maicher L, Kattge J (2014) A Semantic Web Faceted Search System for Facilitating Building of Biodiversity and Ecosystems Services. DILS 2014: 50-57

  • Titre traduit

    Towards an ontological approach for the management of agroforestry databases


  • Résumé

    In a general context of sustainable development, research on agroforestry makes sense by making plant-plant interactions intelligible in an environment that can be degraded. For several years now, data from field observations have been acquired in partnership with several categories of actors (foresters, farmers, livestock breeders, etc.). The first objective is now to open these data and make them available On the web to other communities. In addition, agroforestry studies require systemic approaches to better understand the mechanisms of plant resilience to climate change and soil pollution. A second objective is to link the data to other climate and territorial datasets. The twofold challenge of sharing and interconnecting data in agroforestry brings us closer to what is being practiced today within the semantic web with different tools and methods to promote the pooling of open and linked data sources [Heath , 2011]. The semantic web is the vision of the World Wide Web Consortium's (W3C) of a global web or all the data would be related to each other. Semantic web technologies provide standard procedures for describing and accessing resources on the Web. The data thus linked are exploited and enriched by technologies such as RDF, SPARQL, OWL and SKOS (Garnier et al., 2017). In this framework, we will reuse the standard formats of the semantic web [Cuenca, 2008] and exploit a range of terminological ontologies in order to propose an open and flexible knowledge To account for the complexity of data already collected in agroforestry. The importance is given both to the publication of perfectly described data by privileging the reuse of already existing ontologies and to the capacity to link these data with data already available on the web (climatic data, soil profiles, data On the functioning of plant communities, etc.). We also need to build a terminology ontology (Laporte et al., 2014, Garnier et al., 2017) dedicated to agroforestry. This ontology will focus on the linguistic qualification of key concepts shared by the entire community and will be made public on the AgroPortal portal (http://agroportal.lirmm.fr/). The final components of the thesis work will focus on the interpretation of the results obtained on the basis of interconnection of the data. To this end, an ontology formalized in OWL 2 will be constructed so as to be able to reason on all the integrated data. An ontology in computer science is a model of knowledge relating to an area of ​​interest and made useable by software agents. The aim is to highlight trends in associations between trees and plants grown in land use by applying inferential ontology mechanisms. Références : Cuenca, B., Horrocks, I., Motik, B., Parsia, B., Patel-Schneider, P. & Sattler, U. (2008). OWL 2: The next step for OWL. Web Semantics, 6, 309--322. Garnier, E., Stahl, U., Laporte, M.-A., Kattge, J., Mougenot, I., Kühn, I., Laporte, B., Amiaud, B., Ahrestani, F. S., Bönisch, G., Bunker, D. E., Cornelissen, J. H. C., Díaz, S., Enquist, B. J., Gachet, S., Jaureguiberry, P., Kleyer, M., Lavorel, S., Maicher, L., Pérez-Harguindeguy, N., Poorter, H., Schildhauer, M., Shipley, B., Violle, C., Weiher, E., Wirth, C., Wright, I. J. and Klotz, S. Towards a thesaurus of plant characteristics: an ecological contribution (2017) Journal of Ecology 105:298–309 Heath, T. & Bizer, C. (2011) Linked Data: Evolving the Web into a Global Data Space. Synthesis Lectures on The Semantic Web, Morgan & Claypool Publishers Laporte MA, Mougenot I, Garnier E, Stahl U, Maicher L, Kattge J (2014) A Semantic Web Faceted Search System for Facilitating Building of Biodiversity and Ecosystems Services. DILS 2014: 50-57