Vers un outil de co-construction d'ontologies à partir de textes à l'aide d'un système multi-agent adaptatif (original) (raw)
Related papers
Construction d’ontologies à partir de textes
2003
Cet article constitue le support dun cours présenté lors de la conférence TALN 2003. Il défend la place du Traitement Automatique des Langues comme discipline clé pour le développement de ressources termino-ontologiques à partir de textes. Les contraintes et enjeux de ce processus sont identifiés, en soulignant limportance de considérer cette tâche comme un processus supervisé par un analyste. Sont présentés un certain nombre doutils logiciels et méthodologiques venant de plusieurs disciplines comme le TAL et lingénierie des connaissances qui peuvent aider lanalyste dans sa tâche. Divers retours dexpérience sont présentés.
Construction et enrichissement automatique d'ontologie à partir de ressources externes
Computing Research Repository, 2010
La construction automatique d'ontologies à partir de textes est généralement basée sur le texte proprement dit, et le domaine décrit est circonscrit au contenu du texte. Afin de concevoir des ontologies sémantiquement plus riches, nous proposons d'étendre les méthodes classiques en matière de construction d'ontologie (1) en prenant en compte le texte du point de vue de sa structure et de son contenu pour construire un premier noyau d'ontologie, et (2) en enrichissant l'ontologie obtenue en exploitant des ressources externes (textes grand public et vocabulaires contrôlés du même domaine). Ce papier décrit comment ces différentes ressources sont analysées et exploitées. Nous avons appliqué cette méthode sur des textes géographiques et avons évalué le bénéfice induit par une ontologie plus riche (par rapport à une première taxonomie du domaine) dans le contexte du typage des entités nommées spatiales. Les résultats ont été améliorés de façon significative.
Un système multi-agents d'aide à la décision clinique fondé sur des ontologies
2012
Les systèmes d'aide à la décision cliniques combinent des connaissances et des données provenant de sources diverses, représentées à l'aide de modèles quantitatifs fondés sur des méthodes stochastiques, ou qualitatifs reposant plutôt sur les heuristiques d'experts et le raisonnement déductif. Parallèlement, le raisonnement à partir de cas (RàPC) mémorise et restitue l'expérience de résolution de problèmes similaires. La coopération de bases de connaissances cliniques hétérogènes (objets connaissances, distances sémantiques, fonctions d'évaluation, règles logiques, bases de données...) repose sur les ontologies médicales. Un système multi-agents d'aide à la décision (SMAAD) permet l'intégration et la coopération des agents spécialisés dans différents domaines de connaissances (sémiologie, pharmacologie, cas cliniques, etc.). Chaque agent spécialisé exploite une base de connaissances définissant les conduites à tenir conformes à l'état de l'art associé à une base ontologique qui exprime les relations sémantiques entre les termes du domaine considéré. Notre approche repose sur la spécialisation d'agents adaptés aux modèles de connaissances utilisés lors des étapes de la démarche clinique et les ontologies. Cette approche modulaire est adaptée à la réalisation de SMAAD dans de nombreux domaines.
Cet article présente une méthode d'extraction de relations sémantiques pour la construction d'ontologies à partir de corpus de textes. Notre objectif est de proposer une méthode générique, qui soit indépendante du domaine et de la langue. Elle repose sur une analyse distributionnelle des unités sémantiques du corpus pour faire émerger des relations sémantiques candidates. Cette méthode ne fait aucune hypothèse sur les types de relations recherchées ni sur leur forme linguistique. Il s'agit de regrouper les associations de termes dans des classes qui représentent des relations sémantiques candidates. L'hypothèse sous-jacente est que les occurrences de ces associations réunies sur la base des éléments de contexte qu'elles partagent ont des chances de relever d'une même relation sémantique et que les relations candidates ainsi proposées peuvent aider le travail de conceptualisation de l'ontologue.
Construction automatique d'ontologie et enrichissement à partir de ressources externes
2010
La construction automatique d'ontologies à partir de textes est généralement basée sur le texte proprement dit, et le domaine décrit est circonscrit au contenu du texte. Afin de concevoir des ontologies sémantiquement plus riches, nous proposons d'étendre les méthodes classiques en matière de construction d'ontologie (1) en prenant en compte le texte du point de vue de sa structure et de son contenu pour construire un premier noyau d'ontologie, et (2) en enrichissant l'ontologie obtenue en exploitant des ressources externes (textes grand public et vocabulaires contrôlés du même domaine). Ce papier décrit comment ces différentes ressources sont analysées et exploitées. Nous avons appliqué cette méthode sur des textes géographiques et avons évalué le bénéfice induit par une ontologie plus riche (par rapport à une première taxonomie du domaine) dans le contexte du typage des entités nommées spatiales. Les résultats ont été améliorés de façon significative.
Une approche combinée pour l'enrichissement d'ontologie à partir de textes et de données du LOD
2016
Résumé. Cet article porte sur l’étiquetage automatique de documents décrivant des produits, avec des concepts très spécifiques traduisant des besoins précis d’utilisateurs. La particularité du contexte est qu’il se confronte à une triple difficulté : 1) les concepts utilisés pour l’étiquetage n’ont pas de réalisations terminologiques directes dans les documents, 2) leurs définitions formelles ne sont pas connues au départ, 3) toutes les informations nécessaires ne sont pas forcément présentes dans les documents mêmes. Pour résoudre ce problème, nous proposons un processus d’annotation en deux étapes, guidé par une ontologie. La première consiste à peupler l’ontologie avec les données extraites des documents, complétées par d’autres issues de ressources externes. La deuxième est une étape de raisonnement sur les données extraites qui recouvre soit une phase d’apprentissage de définitions de concepts, soit une phase d’application des définitions apprises. L’approche SAUPODOC est ainsi...
Technique Et Science Informatiques, 2009
Le travail décrit dans ce papier porte sur l'intégration de sources d'informations hétérogènes XML au sein d'un serveur d'information selon une approche mixte combinant médiation et entrepôt de données. Ce serveur dispose d'un schéma, ou ontologie, utilisé pour l'accès tant aux sources externes qu'aux données locales. La méthode que nous proposons est une méthode unifiée qui s'appuie sur l'ontologie et permet de réaliser à la fois l'intégration de sources et de données. Notre contribution est double. Elle porte d'une part sur la génération automatisée de mises en correspondance, ou mappings, entre l'ontologie et une nouvelle source à intégrer, d'autre part sur la construction automatique d'adaptateurs (wrappers en anglais) allant de la description du contenu abstrait de cette nouvelle source jusqu'à l'extraction des données. Des expérimentations ont été réalisées sur des données réelles dans le domaine du tourisme. ABSTRACT. This paper deals with integration of XML heterogeneous information sources into an information server according to an approach combining mediation and data warehousing. A schema, or ontology, is used to access to the external sources and also to the local data. We propose a unified method based on such an ontology able to achieve the two kinds of integration. Our contribution is twofold. First, we propose techniques to automate the generation of mappings between the ontology and a new source. Second, we present an approach to automate the construction of wrappers starting from the description of the abstract content of a source and ending by data extraction. Experiments on real data in the tourism domain have been achieved. Analysis and comments of the results are given.
Agent ontologique pour la veille des écosystèmes d'information
2010
Face a la complexite croissante de l'information disponibles sur Internet, cet article presente des hypotheses de design d'information pour rendre plus accessible la veille collaborative du systeme d'information Internet, pense en terme d'ecosysteme. Ces hypotheses s'appuient sur des principes ontologiques faisant reference a la philosophie de Spinoza interpretee par G. Deleuze, aux matrices ontologiques de l'anthropologue P. Descola et aux conceptions d'ingenierie des connaissances de B. Bachimond. Dans ce cadre de references, nous elaborons les propositions pour le developpement d'un outil de gestion des connaissances, compose d'agents autonomes modelises par une ontologie et manipulables par une representation graphique generique. Concue comme un diagramme, cette representation prend la forme d'un module generique permettant de manipuler tout type d'information et de connaissances suivant des points de vue differents. Nous proposerons p...