Techniques d'alignement d'ontologies basées sur la structure d'une ressource complémentaire (original) (raw)

Alignement d'ontologies basé sur des ressources complémentaires Illustration sur le système TaxoMap

TSI, 2009

Pour identifier des mappings entre les concepts de deux ontologies, de nombreux travaux récents portent sur l'utilisation de connaissances complémentaires dites de "background" ou de support, représentées sous la forme d'une 3 ème ontologie. Leur objectif commun est de compléter les techniques classiques d'appariement qui exploitent la structure ou la richesse du langage de représentation des ontologies, et qui ne s'appliquent plus quand les ontologies à apparier sont faiblement structurées ou se limitent à de simples taxonomies. Cet article comporte deux parties. La première présente une étude de différents travaux utilisant des connaissances de support, en commençant par leur schéma général commun, suivi par une analyse des travaux en fonction du type de connaissance de support utilisée. Une seconde partie est consacrée au système d'alignement TaxoMap. Nous présentons le système et son contexte d'utilisation. Nous décrivons ensuite l'utilisation de WordNet comme connaissance de support ainsi que les résultats d'expérimentation obtenus. ABSTRACT. A lot of alignment systems providing mappings between the concepts of two ontologies rely on the use of background knowledge, represented most of the time by a third ontology. The common objective is to complement current matching techniques which exploit structure or features represented in ontology representation languages and which fail when ontologies are only hierarchies or weakly structured models. This paper has two parts. First, we present a state-of-the-art of research work using background knowledge. A common general scheme is first introduced followed by an analysis of works that differ by the kind of background knowledge they use. The second part is dedicated to TaxoMap. We present the use context and the general architecture of the system. Then, we describe the way WordNet is exploited in TaxoMap as support knowledge together with experimental results.

Correction d'ontologies construites à partir de la structure de documents

Les logiciels de construction d'ontologies à partir de textes réalisent une interprétation fixée a priori du contenu des textes, qu'un expert du domaine ou une ontologie doit vérifier. Or une étude précise des limites des techniques d'analyse des textes permet de guider la correction de l'ontologie apprise en définissant des règles d'aide à la correction. Ces règles attirent l'attention de l'ontographe sur des parties d'ontologie contenant des « anomalies » et tiennent compte du texte d'origine et de l'analyse réalisée pour proposer des corrections. Dans cet article, nous illustrons la notion de règle de correction dans le cas où les connaissances apprises viennent de l'exploitation de structures énumératives parallèles présentes en corpus.

Construction et enrichissement automatique d'ontologie à partir de ressources externes

Computing Research Repository, 2010

La construction automatique d'ontologies à partir de textes est généralement basée sur le texte proprement dit, et le domaine décrit est circonscrit au contenu du texte. Afin de concevoir des ontologies sémantiquement plus riches, nous proposons d'étendre les méthodes classiques en matière de construction d'ontologie (1) en prenant en compte le texte du point de vue de sa structure et de son contenu pour construire un premier noyau d'ontologie, et (2) en enrichissant l'ontologie obtenue en exploitant des ressources externes (textes grand public et vocabulaires contrôlés du même domaine). Ce papier décrit comment ces différentes ressources sont analysées et exploitées. Nous avons appliqué cette méthode sur des textes géographiques et avons évalué le bénéfice induit par une ontologie plus riche (par rapport à une première taxonomie du domaine) dans le contexte du typage des entités nommées spatiales. Les résultats ont été améliorés de façon significative.

Construction automatique d'ontologie et enrichissement à partir de ressources externes

2010

La construction automatique d'ontologies à partir de textes est généralement basée sur le texte proprement dit, et le domaine décrit est circonscrit au contenu du texte. Afin de concevoir des ontologies sémantiquement plus riches, nous proposons d'étendre les méthodes classiques en matière de construction d'ontologie (1) en prenant en compte le texte du point de vue de sa structure et de son contenu pour construire un premier noyau d'ontologie, et (2) en enrichissant l'ontologie obtenue en exploitant des ressources externes (textes grand public et vocabulaires contrôlés du même domaine). Ce papier décrit comment ces différentes ressources sont analysées et exploitées. Nous avons appliqué cette méthode sur des textes géographiques et avons évalué le bénéfice induit par une ontologie plus riche (par rapport à une première taxonomie du domaine) dans le contexte du typage des entités nommées spatiales. Les résultats ont été améliorés de façon significative.

Partitionnement d'ontologies pour le passage à l'échelle des techniques d'alignement

L'alignement d'ontologies est une tâche importante dans les systèmes d'intégration puisqu'elle autorise la prise en compte conjointe de ressources décrites par des ontologies différentes, en identifiant des appariements entre concepts. Avec l'apparition de très grandes ontologies dans des domaines comme la médecine ou l'agronomie, les techniques d'alignement, qui mettent souvent en oeuvre des calculs complexes, se trouvent face à un défi : passer à l'échelle. Pour relever ce défi, nous proposons dans cet article deux méthodes de partitionnement, conçues pour prendre en compte, le plus tôt possible, l'objectif d'alignement. Ces méthodes permettent de décomposer les deux ontologies à aligner en deux ensembles de blocs de taille limitée et tels que les éléments susceptibles d'être appariés se retrouvent concentrés dans un ensemble minimal de blocs qui seront effectivement comparés. Les résultats des tests effectuées avec nos deux méthodes sur différents couples d'ontologies montrent leur efficacité.

EDOLA : Une nouvelle méthode d'alignement d'ontologies OWL-Lite

Conference en Recherche d'Infomations et Applications, 2007

L'alignement d'ontologies revêt toute son importance dans des applications nécessitant la prise en compte d'une interopérabilité sémantique. Plusieurs approches d'alignement d'ontologies existent dans la littérature. Elles sont basées sur les mesures de similarités. Dans ce papier, une nouvelle méthode d'alignement d'ontologies OWL-Lite est décrite. Le module d'alignement implémente une nouvelle approche d'alignement d'ontologies qui définit un modèle global de calcul de similarité, tout en remédiant au problème de l'intervention de l'utilisateur dans le processus d'alignement. Les tests expérimentaux réalisés sur les ontologies de benchmark montrent une nette amélioration des métriques de rappel et de précision. ABSTRACT. Ontologies have been established for knowledge sharing and are of extensive use as a means for conceptually structuring domains of interest. Thus, in order to guarantee a fluent global communication and knowledge exchange between local knowledge sketched by ontologies, the alignment of ontologies has emerged as a compelling topic to address. In this paper, we introduce a new approach for aligning OWL-Lite ontologies. The main originality of the alignment method stands in the fact that it palliates the main drawbacks appearing in the literature approaches, i.e., problem of user-parameter settings. Carried out experimental results pointed out a sharp improvement in the precision and recall evaluation metrics. MOTS-CLÉS : Ontologie, Alignement d'ontologies, mesures de similarité, OWL-Lite.

Utiliser des résultats d'alignement pour enrichir une ontologie

2011

, http://www.lri.fr/˜hamdi Résumé. En établissant des relations entre des concepts issus de deux ontologies distinctes, les outils d'alignement peuvent être utilisés pour enrichir une des deux ontologies avec les concepts de l'autre. A partir d'une expérience menée dans le cadre du projet ANR GeOnto 1 dans le domaine de la topographie, cet article identifie des traitements complémentaires à l'alignement pour l'enrichissement et montre leur mise en oeuvre dans TaxoMap Framework. 1. Ce travail est financé par l'Agence Nationale de la Recherche (ANR) au travers du projet ANR-07-MDCO-005 pour la création, la comparaison et l'exploitation d'ontologies géographiques hétérogènes (http://geonto.lri.fr/).

Une approche combinée pour l'enrichissement d'ontologie à partir de textes et de données du LOD

2016

Résumé. Cet article porte sur l’étiquetage automatique de documents décrivant des produits, avec des concepts très spécifiques traduisant des besoins précis d’utilisateurs. La particularité du contexte est qu’il se confronte à une triple difficulté : 1) les concepts utilisés pour l’étiquetage n’ont pas de réalisations terminologiques directes dans les documents, 2) leurs définitions formelles ne sont pas connues au départ, 3) toutes les informations nécessaires ne sont pas forcément présentes dans les documents mêmes. Pour résoudre ce problème, nous proposons un processus d’annotation en deux étapes, guidé par une ontologie. La première consiste à peupler l’ontologie avec les données extraites des documents, complétées par d’autres issues de ressources externes. La deuxième est une étape de raisonnement sur les données extraites qui recouvre soit une phase d’apprentissage de définitions de concepts, soit une phase d’application des définitions apprises. L’approche SAUPODOC est ainsi...

Vers un outil de co-construction d'ontologies à partir de textes à l'aide d'un système multi-agent adaptatif

2009

Manual ontology engineering and maintenance is a di‐cult task that requires signiflcant efiort from the ontologist to identify and structure domain knowledge. Automatic ontology learning makes this task easier, especially through the use of text and natural language processing tools. In this paper, we present DYNAMO, a tool based on an Adaptive Multi-Agent System (AMAS), which aims at assisting ontologists during ontology design and evolution. This work is carried out in the context of the ANR DYNAMO (Dynamic Ontology for Information Retrieval) project. DYNAMO is based on text extracted terms, lexical relations and provides an AMAS based module to support ontology co-construction. The ontologist interacts with the tool by modifying the ontology (move, add, change concepts, terms and/or relationships). Then Dynamo adapts to these changes and proposes new evolutions to improve the ontology. After describing the context of this work and the principles of DYNAMO, we report an experiment...