Les ontologies sont des systèmes d’organisation des connaissances permettant de modéliser les concepts d’un domaine et leurs relations (Gruber, 1995; Zacklad, 2010). Récemment, celles-ci ont été proposées pour assister la conduite des revues de la littérature scientifique, puisqu’elles offrent des mécanismes de structuration de l’information d’intérêt pour leur réalisation (Mitchell et Mavergames, 2019 ; Jiomekong et al., 2024). Comme l’implémentation des ontologies repose fréquemment sur les formalismes du Web sémantique (RDF, SKOS, OWL), celles-ci offriraient également un moyen concret d’arrimer les principes de données FAIR aux revues de la littérature.
Parallèlement, considérant l’accroissement rapide de la production savante, automatiser certaines étapes liées à la conduite des revues de la littérature s’avère indispensable. Combiner les avancées de la fouille de textes aux mécanismes de représentation des connaissances qu’offrent les ontologies pour soutenir la conduite des revues de la littérature présente donc une perspective de recherche prometteuse.
Cette communication proposera un devis de recherche en fouille de textes qui sera orienté vers la population automatique d’ontologies pour automatiser l’étape d’extraction des données des revues de la littérature. La présentation mettra en lumière les défis de la recherche actuelle et décrira les étapes du devis proposé. Celui-ci impliquera la constitution d’un corpus de publications scientifiques, son nettoyage et sa transformation de manière à entraîner des modèles d’apprentissage automatique à extraire les principales composantes méthodologiques au sein du texte des publications, et ce afin de populer un modèle ontologique à partir de ces composantes.
• Cette conférence est offerte dans le cadre du Colloque des BES