Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition. Volume 4 : Démonstrations... (original) (raw)
Related papers
Didactique des langues et apports des sciences neurocognitives et de l’approche neurolinguistique, 2024
Cette journée d’étude, qui se veut inlassablement en continuité avec les activités scientifiques de l’AIRDL-Tunisie autour du statut de la recherche en didactique du français en Tunisie et ailleurs et de l’évolution des pratiques d’enseignement et de formation en didactique du français, envisage de creuser davantage le champ des neurosciences et d’investir ses acquis théoriques et ses apports didactiques et pédagogiques dans plusieurs contextes de didactique de français (FLM. FLS et FLE), mais aussi de didactique d’autres langues entrant en contact avec le français (ex. l’arabe FLM et l’anglais LE pour le contexte linguistique tunisien), ou encore d’autres didactiques des disciplines. L’objectif commun de ces travaux consiste à trouver des pistes de réflexion pour optimiser et faciliter l’apprentissage linguistique et le rendre plus adapté aux mêmes processus cognitifs et mentaux mis en oeuvre par l’apprenant lors de son apprentissage.
2017
La détection automatique du langage figuratif dans les réseaux sociaux est un sujet de recherche extrêmement actif principalement en raison de son importance pour améliorer les performances des systèmes d'analyse d'opinions. Pour la première fois, l'édition 2017 du Défi Fouille de Texte (DEFT) s'intéresse à l'influence du langage figuratif (en particulier l'ironie, le sarcasme et l'humour) dans l'analyse d'opinions à partir de tweets en français. Trois tâches de niveaux de complexité croissants ont été proposées aux participants : (T1) déterminer la polarité globale des tweets non figuratifs, (T2) déterminer si un tweet contient ou non du langage figuratif, et (T3) déterminer la polarité globale des tweets figuratifs et non figuratifs. Douze équipes ont participé à ce défi. Les meilleurs résultats, en macro f-mesure, sont de 0,650 pour (T1), 0,783 pour (T2) et 0,594 pour (T3). Ces résultats montrent clairement que l'usage du langage figuratif complique considérablement l'analyse d'opinions.
In this paper we present a strategy for textual analysis. We show differents steps as: a) text preliminary normalization, b) finding of polyforms useful to identify the principal lexias and to disambiguate some simple words, c) comparison with frequency dictionaries to find out the peculiarities of corpus vocabulary; d) lexicalization of frozen expressions and lemmatization of principal verbs; e) analysis of latent syntagms by means of some typical lexico-textual units of corpus. The integrated use of software TALTAC and INTEX realize this strategy. Un example from a study of political discourse is illustrated. Résumé Dans cette communication on esquisse une stratégie statistique pour l'analyse textuelle, en montrant les apports: a) de la normalisation préliminaire du corpus; b) de l'identification des polyformes pour une reconnaissance correcte de certaines lexies et la désambigüisation de certaines formes simples; c) de la comparaison avec les dictionnaires de fréquence po...
22 ème Traitement Automatique des Langues Naturelles
2015
La période « préclassique » du français s'étend sur tout le XVIe siècle et la première moitié du XVIIe siècle. Cet état de langue écrite, qui accompagne les débuts de l'imprimerie, est relativement proche du français moderne, mais se caractérise par une grande variabilité graphique. Il s'agit de l'un des moins bien dotés en termes de ressources. Nous présentons ici la construction d'un lexique, d'un corpus d'apprentissage et d'un modèle de langage pour la période préclassique, à partir de ressources du français moderne. Abstract. Treatments for Preclassic French parsing The "Preclassical" French language period extends throughout the sixteenth century and the first half of the seventeenth century. This state of the written French language, which accompanies the beginnings of printing, is relatively close to the modern French, but is characterized by a large graphic variability. It is one of the most underresourced state of the French languag...
2006
New text analysis softwares issued from fields of research such as Machine Learning and Natural Languages Processing prove to be relevant tools for the language sciences. Littératron is a new data-processing tool for the automatic extraction of syntactic patterns, designed at LIP6 by Jean-Gabriel Ganascia. Associated with a linear text analyser, it reveals the stylistic peculiarities of a text. We will see that Littératron carries out a linguistic diagnosis of learners if used in language sciences, especially in the field of acquisition of written French as a foreign language. The learner can be from a heterogeneous group (various language levels and various mother tongues) or from a homogeneous group (only one language level and one mother tongue, here, Arabic). The interest of this approach is related to three fields : first, language didactics, on a purely educational basis ; next, computational linguistics ; finally, computer-assisted learning.