Régis Gras | Université de Nantes (original) (raw)

Papers by Régis Gras

Research paper thumbnail of Fractalité du rythme du temps sur l'arbre de vie

Le texte que nous présentons ci-dessous se charpente selon plusieurs facettes renvoyant toutes à ... more Le texte que nous présentons ci-dessous se charpente selon plusieurs facettes renvoyant toutes à la notion de fractalité, concept mathématique géométrique imaginé par Mandelbrot. Nous partons d'une question vive qui perturbe chacun d'entre nous et de façon accentuée au fil de la vie, à savoir la différence numérique entre le temps réel, c'est-à-dire celui de l'horloge et le temps perçu par un sujet existant. Moyennant deux hypothèses plausibles sur la relation entre ces deux mesures, l'une physique, l'autre psychologique, nous modélisons une formule générique reliant ces deux notions. Celles-ci constituent une distorsion, autrement dit un biais cognitif. Nous montrons qu'il s'agit d'un phénomène fractal plongé dans l'espace-temps de la relativité restreinte. En effet, il apparaît que la représentation graphique logarithmique des covariations de ces deux notions est linéaire. Nous savons que cette dernière propriété, comme nous l'avons observé par ailleurs avec les images graphiques de l'A.S.I., est caractéristique d'un phénomène fractal

Research paper thumbnail of Contribution a l'etude de la hierarchie implicative : application a l'analyse de la gestion didactique des phenomenes d'ostension et de contradictions

Http Www Theses Fr, 1992

Ce travail est centre sur deux objets apparemment differents mais etroitement dependants. D'u... more Ce travail est centre sur deux objets apparemment differents mais etroitement dependants. D'une part, une etude mathematique dote de trois fonctions l'analyse implicative : reperage des niveaux significatifs de l'arbre des classes d'implications, determination de la contribution de chaque individu a l'elaboration d'une classe d'implications, caracterisation des contributions des categories a priori d'individus. Elles sont egalement informatisees. D'autre part, une approche didactique faisant suite a la problematique de notre these de 1981 propose un nouveau concept: macle de contradictions, et developpe la notion d'ostension introduite lors de notre dea. Ceux-ci ont permis une analyse explicative des phenomenes d'obsolescence qui apparaissent lors des reproductions des situations didactiques. Ces phenomenes ont ete reveles par l'analyse de l'arbre de cohesions implicatives facilitee et enrichie par le reperage des niveaux significatifs et par la caracterisation des contributions des categories. Le concept de macle de contradictions explique pourquoi l'ostension est si resistante. En outre, une deuxieme composante, qui expliquerait l'utilisation sans parcimonie de l'ostension, serait la conception que se fait l'enseignant de l'auto-organisation des eleves

Research paper thumbnail of On the discovery of significant temporal rules

2007 IEEE International Conference on Systems, Man and Cybernetics, 2007

The assessment of the interestingness of sequential rules (generally temporal rules) is a crucial... more The assessment of the interestingness of sequential rules (generally temporal rules) is a crucial problem in sequence analysis. Due to their unsupervised nature, frequent pattern mining algorithms commonly generate a huge number of rules. However, while association rule interestingness has been widely studied in the literature, there are few measures dedicated to sequential rules. In this article, we propose an original statistical measure for assessing sequential rule interestingness. This measure named Sequential Implication Intensity (SII) evaluates the statistical significance of the rules in comparison with a probabilistic model. Numerical simulations show that SII has unique features for a sequential rule interestingness measure.

Research paper thumbnail of Typicalité et contribution des sujets et des variables supplémentaires en Analyse Statistique Implicative

L'analyse statistique implicative traite des tableaux sujets x variables afin d'extraire règles e... more L'analyse statistique implicative traite des tableaux sujets x variables afin d'extraire règles et métarègles statistiques entre les variables. L'article interroge les structures obtenues représentées par graphe et hiérarchie orientés afin de dégager la responsabilité des sujets ou des groupes de sujets (variables supplémentaires) dans la constitution des chemins du graphe ou des classes de la hiérarchie. On distingue les concepts de typicalité pour signifier la proximité des sujets avec le comportement moyen de la population envers les règles statistiques extraites, puis de contribution pour quantifier le rôle qu'auraient les sujets par rapport aux règles strictes associées. Un exemple de données réelles, traité à l'aide du logiciel CHIC, illustre et montre l'intérêt de ces deux concepts.-359-RNTI-E-6 Typicalité et contribution des sujets et variables supplémentaires en A.S.I. l'intensité d'implication, notée ϕ , qui prend ses valeurs dans [0,1], construite selon un modèle probabiliste sur la base du nombre de contre-exemples à la règle et des occurrences en jeu 3 (Gras, 1979 et al. 1996b), ou, dans le cas des tableaux de grande taille, l'intensité d'implication-inclusion, notée ψ , à valeurs également dans [0,1], qui intègre en outre la qualité de la contraposée de la règle et l'entropie des expériences associées (Gras, 2000), (Gras et al. 2001), (Blanchard et al., 2003). Cette version de l'intensité d'implication permet de mieux cerner la notion et la recherche de causalité entre variables. En fait, deux structures de V, résumant l'ensemble des règles d'association, sont obtenues à partir de ces règles et conduisent à deux types de représentation : un graphe dit implicatif, orienté, sans cycle, pondéré par une mesure de qualité des règles ; les noeuds sont les variables ; un arc du graphe représente une règle, par exemple, a ⇒ b. Il est fermé transitivement dès lors que la mesure de l'intensité entre deux noeuds quelconques d'un de ses chemins est au moins égale à 0,5 (FIG.1). Dans ce premier exemple, (M ⇒ F ⇒ OP5 ⇒ OP4 ⇒ OP6) est un chemin, une hiérarchie, dite cohésitive, orientée, représentant une classe de règles dites généralisées, La hiérarchie est indicée par une ultramétrique (Gras et al, 2005), mesure de qualité de classe de règles, dénommée cohésion (FIG.2). Dans ce second exemple, sur les mêmes données, (OP2 ⇒ (OP5 ⇒ OP4)) ⇒ OP6 est une classe orientée, encore notée (OP2,(OP5,OP4)),OP6), voire plus simplement (OP2, OP5, OP4, OP6) si la hiérarchie est connue.(On remarquera la différence informative et structurelle entre ces deux images). Algorithmes et représentations, à un seuil choisi par le chercheur, sont implémentés dans le logiciel de traitement de données appelé CHIC (Couturier, 2000) .(cf. FIG 1 et FIG. 2). Nous introduisons la notion de variable supplémentaire en A.S.I. à l'instar de la même notion définie en analyse factorielle (Benzecri, 1973). Il s'agit d'une variable extrinsèque, un descripteur par exemple, n'intervenant pas directement dans les liaisons exprimées par la classification entre les variables dites principales de V. Elle n'intervient donc pas dans la représentation de la structure de cet ensemble, qu'il s'agisse du graphe ou de la hiérarchie. Par exemple, une variable supplémentaire pourra représenter une catégorie de sujets (âge, sexe, attitude, catégorie socio-professionnelle, etc.). Au cours de l'analyse, à un niveau quelconque de la hiérarchie se forme une classe C de cohésion non nulle. Notre objectif, particulièrement dans le cas d'un noeud significatif de la hiérarchie, est de définir un critère permettant d'identifier un ou des sujets, puis la catégorie de sujets, ou tout autre variable supplémentaire, 3 La règle a ⇒ b est dite admissible au niveau de confiance 1-α si la probabilité que le nombre de contre-exemples dans les observations soit supérieur au nombre de contre-exemples attendus sous l'hypothèse H0 d'indépendance entre a et b est faible, c'est-à-dire si Prob (Q(a,b) ≤ n a∧¬b) ≤ α où Q(a,b) est le nombre aléatoire de contre-exemples à l'implication (cf. l'algorithme de la vraisemblance du lien de I.C. Lerman (Lerman, 1981a). Ce critère d'admissibilité est comparable à celui du philosophe des sciences H. Atlan dans « A tort et à raison. Intercritique de la science et du mythe », Seuil, 1986. Il écrit : « … [en accord avec Jung] si la fréquence des coïncidences n'excède pas de façon significative la probabilité qu'on peut leur calculer en les attribuant au seul hasard à l'exclusion de relations causales cachées, nous n'avons certes aucune raison de supposer l'existence de telles relations ».. La distribution de la variable aléatoire Q(a,b) dépend des hypothèses de tirage : par exemple, une loi hypergéométrique ou une loi binomiale, ou une loi de Poisson (Lerman et al., 1981b)

Research paper thumbnail of Using Information-Theoretic Measures to Assess Association Rule Interestingness

Fifth IEEE International Conference on Data Mining (ICDM'05)

Research paper thumbnail of Statistical Implicative Analysis. From the exact sciences to human and social sciences

Research paper thumbnail of A Graph-based Clustering Approach to Evaluate Interestingness Measures: A Tool and a Comparative Study

Studies in Computational Intelligence, 2007

Research paper thumbnail of Spécificités de l'Analyse Statistique Implicative (ASI) par rapport à d'autres mesures de qualité de règles d'association

Research paper thumbnail of Analyse statistique implicative entre variables vectorielles

Research paper thumbnail of IPEE: Indice Probabiliste d'Ecart à l'Equilibre pour l'évaluation de la qualité des règles

La mesure de la qualité des connaissances est uneétape clef d'un processus de découverte de règle... more La mesure de la qualité des connaissances est uneétape clef d'un processus de découverte de règles d'association. Dans cet article, nous présentons IPEE, un indice de qualité de règle qui a la particularité unique d'associer les deux caractéristiques suivantes : d'une part, il est fondé sur un modèle probabiliste, et d'autre part, il mesure unécartà l'équilibre (incertitude maximum de la conclusion sachant la prémisse vraie).

Research paper thumbnail of Assessing rule interestingness with a probabilistic measure of deviation from equilibrium

Research paper thumbnail of Analyse Implicative Séquentielle

Research paper thumbnail of Réduction des colonnes d’un tableau de données par quasi-équivalence entre variables

Research paper thumbnail of Les Fondements De L'Analyse Statistique Implicative et Quelques Prolongements Pour La Fouille De Données

RÉSUMÉ — L'analyse statistique implicative d'une part permet de déceler les règles pert... more RÉSUMÉ — L'analyse statistique implicative d'une part permet de déceler les règles pertinentes à partir d'un test d'hypothèse sur des données variées, d'autre part offre, selon une démarche calquée sur la classification hiérarchique classique, une représentation hiérarchique des méta-règles et une analyse des contributions des attributs et individus aux différentes associations. De plus, une nouvelle mesure permet d'intégrer à la fois la notion d'entropie et l'intensité d'implication, adaptée au traitement de données volumineuses telles qu'elles apparaissent en Extraction de Connaissances dans les Données. MOTS-CLÉS — Règles, Méta-règles, Quasi-implication, Intensité d'implication, Hiérarchie implicative, Contributions, Entropie. SUMMARY — Foundations of the implicative statistical analysis and their extensions for data mining Implicative statistical analysis allows the discovery of relevant rules from a hypothesis test on vario...

Research paper thumbnail of Discovering r-rules with a directed hierarchy

Soft Computing-A Fusion of Foundations, …, 2006

In this paper, we extend the classical notion of quasi-implication ("when a i is present then usu... more In this paper, we extend the classical notion of quasi-implication ("when a i is present then usually a j is also present") to R-rules (rules of rules), the premisses and the conclusions of which can be rules themselves. A new statistical measure, based on the implicative intensity defined by Gras for quasi-implications, is defined to assess the significance of R-rules on a data set. We show how to organize R-rules in a new combinatorial structure, the directed hierarchy, which is inspired by the classical hierarchical classification. An incremental algorithm is developed to find the most significant R-rule "amalgamation". An illustration is presented on a real data set stemming from a recent survey of the French Public Education Mathematical Teacher Society on the level in mathematics of pupils in the final year of secondary education and the perception of this subject.

Research paper thumbnail of Can we “trace” the phenomenon of compartmentalization by using the implicative statistical method of analysis? An application for the concept of function

… Quaderni di Ricerca In Didattica of …, 2005

L'objectif de cette recherche est d' identifier les difficultés qui concernent la conversion d'un... more L'objectif de cette recherche est d' identifier les difficultés qui concernent la conversion d'un mode de représentation d'une fonction à un autre mode(p.e. graphique, symbolique, verbal) et d'examiner le phénomène de compartimentation, c'est-à-dire l'incapacité à coordonner au moins deux modes de représentation du concept. Nous avons proposé deux tests à 183 élèves de quatrième (élèves de 14-15 ans) et à 404 élèves de seconde (élèves de 16-17 ans). Les deux tests concernent les mêmes relations algébriques mais ils proposent différentes conversions et en particulier la représentation-source de conversions. L'emploi de l'analyse statistique implicative sur les tableaux de données montre une absence de ressemblance et d'implication entre les tâches des deux tests pour les deux groupes d'âge. Ces résultats montrent ainsi que les différents types de conversion entre représentations du même contenu mathématique sont traités de manière distincte soulignant l'existence du phénomène de compartimentation.

Research paper thumbnail of Using the Statistical Implicative Analysis for Elaborating Behavioral Referentials

Various informatic assessment tools have been created to help human resources managers in evaluat... more Various informatic assessment tools have been created to help human resources managers in evaluating the behavioral profile of a person. The psychological basis of those tools have all been validated, but very few of them have follow a deep statistical analysis. The PerformanSe Echo assessment tool is one of them. It gives the behavioral profile of a person along 10

Research paper thumbnail of An interactive, asymmetric and extensional method for matching conceptual hierarchies

Our work deals with schema or ontology matching and is driven by the following statements: (1) Mo... more Our work deals with schema or ontology matching and is driven by the following statements: (1) Most of works only consider intensional description of schemas; (2) They mostly use symmetric similarity measures (and then they match similarity relations betwen concepts); (3) Few prototypes allow an interactive and visual match process. Therefore, we suggest an extensional and asymmetric matching method based on the discovery of significant implication rules between concepts described in textual documents. Our approach relies on the association rules paradigm and use a probabilistic model of deviation from independence, named implication intensity. Our matching method is divided into two consecutive stages: (1) the extraction in documents of relevant terms for each concept; (2) the discovery of significant implications between the concepts. And finally, we enclose this matching approach into an interactive visualization tool in order to facilitate the analyse, the validation and the editing of a mapping set for the knowledge engineer.

Research paper thumbnail of Mesurer l'écart entre une analyse a priori et la contingence en didactique

Revue des Nouvelles Technologies de l'Information, 2009

Research paper thumbnail of Réduction des colonnes d'un tableau de données par quasi-équivalence entre variables

Extraction et Gestion des Connaissances, 2002

Research paper thumbnail of Fractalité du rythme du temps sur l'arbre de vie

Le texte que nous présentons ci-dessous se charpente selon plusieurs facettes renvoyant toutes à ... more Le texte que nous présentons ci-dessous se charpente selon plusieurs facettes renvoyant toutes à la notion de fractalité, concept mathématique géométrique imaginé par Mandelbrot. Nous partons d'une question vive qui perturbe chacun d'entre nous et de façon accentuée au fil de la vie, à savoir la différence numérique entre le temps réel, c'est-à-dire celui de l'horloge et le temps perçu par un sujet existant. Moyennant deux hypothèses plausibles sur la relation entre ces deux mesures, l'une physique, l'autre psychologique, nous modélisons une formule générique reliant ces deux notions. Celles-ci constituent une distorsion, autrement dit un biais cognitif. Nous montrons qu'il s'agit d'un phénomène fractal plongé dans l'espace-temps de la relativité restreinte. En effet, il apparaît que la représentation graphique logarithmique des covariations de ces deux notions est linéaire. Nous savons que cette dernière propriété, comme nous l'avons observé par ailleurs avec les images graphiques de l'A.S.I., est caractéristique d'un phénomène fractal

Research paper thumbnail of Contribution a l'etude de la hierarchie implicative : application a l'analyse de la gestion didactique des phenomenes d'ostension et de contradictions

Http Www Theses Fr, 1992

Ce travail est centre sur deux objets apparemment differents mais etroitement dependants. D'u... more Ce travail est centre sur deux objets apparemment differents mais etroitement dependants. D'une part, une etude mathematique dote de trois fonctions l'analyse implicative : reperage des niveaux significatifs de l'arbre des classes d'implications, determination de la contribution de chaque individu a l'elaboration d'une classe d'implications, caracterisation des contributions des categories a priori d'individus. Elles sont egalement informatisees. D'autre part, une approche didactique faisant suite a la problematique de notre these de 1981 propose un nouveau concept: macle de contradictions, et developpe la notion d'ostension introduite lors de notre dea. Ceux-ci ont permis une analyse explicative des phenomenes d'obsolescence qui apparaissent lors des reproductions des situations didactiques. Ces phenomenes ont ete reveles par l'analyse de l'arbre de cohesions implicatives facilitee et enrichie par le reperage des niveaux significatifs et par la caracterisation des contributions des categories. Le concept de macle de contradictions explique pourquoi l'ostension est si resistante. En outre, une deuxieme composante, qui expliquerait l'utilisation sans parcimonie de l'ostension, serait la conception que se fait l'enseignant de l'auto-organisation des eleves

Research paper thumbnail of On the discovery of significant temporal rules

2007 IEEE International Conference on Systems, Man and Cybernetics, 2007

The assessment of the interestingness of sequential rules (generally temporal rules) is a crucial... more The assessment of the interestingness of sequential rules (generally temporal rules) is a crucial problem in sequence analysis. Due to their unsupervised nature, frequent pattern mining algorithms commonly generate a huge number of rules. However, while association rule interestingness has been widely studied in the literature, there are few measures dedicated to sequential rules. In this article, we propose an original statistical measure for assessing sequential rule interestingness. This measure named Sequential Implication Intensity (SII) evaluates the statistical significance of the rules in comparison with a probabilistic model. Numerical simulations show that SII has unique features for a sequential rule interestingness measure.

Research paper thumbnail of Typicalité et contribution des sujets et des variables supplémentaires en Analyse Statistique Implicative

L'analyse statistique implicative traite des tableaux sujets x variables afin d'extraire règles e... more L'analyse statistique implicative traite des tableaux sujets x variables afin d'extraire règles et métarègles statistiques entre les variables. L'article interroge les structures obtenues représentées par graphe et hiérarchie orientés afin de dégager la responsabilité des sujets ou des groupes de sujets (variables supplémentaires) dans la constitution des chemins du graphe ou des classes de la hiérarchie. On distingue les concepts de typicalité pour signifier la proximité des sujets avec le comportement moyen de la population envers les règles statistiques extraites, puis de contribution pour quantifier le rôle qu'auraient les sujets par rapport aux règles strictes associées. Un exemple de données réelles, traité à l'aide du logiciel CHIC, illustre et montre l'intérêt de ces deux concepts.-359-RNTI-E-6 Typicalité et contribution des sujets et variables supplémentaires en A.S.I. l'intensité d'implication, notée ϕ , qui prend ses valeurs dans [0,1], construite selon un modèle probabiliste sur la base du nombre de contre-exemples à la règle et des occurrences en jeu 3 (Gras, 1979 et al. 1996b), ou, dans le cas des tableaux de grande taille, l'intensité d'implication-inclusion, notée ψ , à valeurs également dans [0,1], qui intègre en outre la qualité de la contraposée de la règle et l'entropie des expériences associées (Gras, 2000), (Gras et al. 2001), (Blanchard et al., 2003). Cette version de l'intensité d'implication permet de mieux cerner la notion et la recherche de causalité entre variables. En fait, deux structures de V, résumant l'ensemble des règles d'association, sont obtenues à partir de ces règles et conduisent à deux types de représentation : un graphe dit implicatif, orienté, sans cycle, pondéré par une mesure de qualité des règles ; les noeuds sont les variables ; un arc du graphe représente une règle, par exemple, a ⇒ b. Il est fermé transitivement dès lors que la mesure de l'intensité entre deux noeuds quelconques d'un de ses chemins est au moins égale à 0,5 (FIG.1). Dans ce premier exemple, (M ⇒ F ⇒ OP5 ⇒ OP4 ⇒ OP6) est un chemin, une hiérarchie, dite cohésitive, orientée, représentant une classe de règles dites généralisées, La hiérarchie est indicée par une ultramétrique (Gras et al, 2005), mesure de qualité de classe de règles, dénommée cohésion (FIG.2). Dans ce second exemple, sur les mêmes données, (OP2 ⇒ (OP5 ⇒ OP4)) ⇒ OP6 est une classe orientée, encore notée (OP2,(OP5,OP4)),OP6), voire plus simplement (OP2, OP5, OP4, OP6) si la hiérarchie est connue.(On remarquera la différence informative et structurelle entre ces deux images). Algorithmes et représentations, à un seuil choisi par le chercheur, sont implémentés dans le logiciel de traitement de données appelé CHIC (Couturier, 2000) .(cf. FIG 1 et FIG. 2). Nous introduisons la notion de variable supplémentaire en A.S.I. à l'instar de la même notion définie en analyse factorielle (Benzecri, 1973). Il s'agit d'une variable extrinsèque, un descripteur par exemple, n'intervenant pas directement dans les liaisons exprimées par la classification entre les variables dites principales de V. Elle n'intervient donc pas dans la représentation de la structure de cet ensemble, qu'il s'agisse du graphe ou de la hiérarchie. Par exemple, une variable supplémentaire pourra représenter une catégorie de sujets (âge, sexe, attitude, catégorie socio-professionnelle, etc.). Au cours de l'analyse, à un niveau quelconque de la hiérarchie se forme une classe C de cohésion non nulle. Notre objectif, particulièrement dans le cas d'un noeud significatif de la hiérarchie, est de définir un critère permettant d'identifier un ou des sujets, puis la catégorie de sujets, ou tout autre variable supplémentaire, 3 La règle a ⇒ b est dite admissible au niveau de confiance 1-α si la probabilité que le nombre de contre-exemples dans les observations soit supérieur au nombre de contre-exemples attendus sous l'hypothèse H0 d'indépendance entre a et b est faible, c'est-à-dire si Prob (Q(a,b) ≤ n a∧¬b) ≤ α où Q(a,b) est le nombre aléatoire de contre-exemples à l'implication (cf. l'algorithme de la vraisemblance du lien de I.C. Lerman (Lerman, 1981a). Ce critère d'admissibilité est comparable à celui du philosophe des sciences H. Atlan dans « A tort et à raison. Intercritique de la science et du mythe », Seuil, 1986. Il écrit : « … [en accord avec Jung] si la fréquence des coïncidences n'excède pas de façon significative la probabilité qu'on peut leur calculer en les attribuant au seul hasard à l'exclusion de relations causales cachées, nous n'avons certes aucune raison de supposer l'existence de telles relations ».. La distribution de la variable aléatoire Q(a,b) dépend des hypothèses de tirage : par exemple, une loi hypergéométrique ou une loi binomiale, ou une loi de Poisson (Lerman et al., 1981b)

Research paper thumbnail of Using Information-Theoretic Measures to Assess Association Rule Interestingness

Fifth IEEE International Conference on Data Mining (ICDM'05)

Research paper thumbnail of Statistical Implicative Analysis. From the exact sciences to human and social sciences

Research paper thumbnail of A Graph-based Clustering Approach to Evaluate Interestingness Measures: A Tool and a Comparative Study

Studies in Computational Intelligence, 2007

Research paper thumbnail of Spécificités de l'Analyse Statistique Implicative (ASI) par rapport à d'autres mesures de qualité de règles d'association

Research paper thumbnail of Analyse statistique implicative entre variables vectorielles

Research paper thumbnail of IPEE: Indice Probabiliste d'Ecart à l'Equilibre pour l'évaluation de la qualité des règles

La mesure de la qualité des connaissances est uneétape clef d'un processus de découverte de règle... more La mesure de la qualité des connaissances est uneétape clef d'un processus de découverte de règles d'association. Dans cet article, nous présentons IPEE, un indice de qualité de règle qui a la particularité unique d'associer les deux caractéristiques suivantes : d'une part, il est fondé sur un modèle probabiliste, et d'autre part, il mesure unécartà l'équilibre (incertitude maximum de la conclusion sachant la prémisse vraie).

Research paper thumbnail of Assessing rule interestingness with a probabilistic measure of deviation from equilibrium

Research paper thumbnail of Analyse Implicative Séquentielle

Research paper thumbnail of Réduction des colonnes d’un tableau de données par quasi-équivalence entre variables

Research paper thumbnail of Les Fondements De L'Analyse Statistique Implicative et Quelques Prolongements Pour La Fouille De Données

RÉSUMÉ — L'analyse statistique implicative d'une part permet de déceler les règles pert... more RÉSUMÉ — L'analyse statistique implicative d'une part permet de déceler les règles pertinentes à partir d'un test d'hypothèse sur des données variées, d'autre part offre, selon une démarche calquée sur la classification hiérarchique classique, une représentation hiérarchique des méta-règles et une analyse des contributions des attributs et individus aux différentes associations. De plus, une nouvelle mesure permet d'intégrer à la fois la notion d'entropie et l'intensité d'implication, adaptée au traitement de données volumineuses telles qu'elles apparaissent en Extraction de Connaissances dans les Données. MOTS-CLÉS — Règles, Méta-règles, Quasi-implication, Intensité d'implication, Hiérarchie implicative, Contributions, Entropie. SUMMARY — Foundations of the implicative statistical analysis and their extensions for data mining Implicative statistical analysis allows the discovery of relevant rules from a hypothesis test on vario...

Research paper thumbnail of Discovering r-rules with a directed hierarchy

Soft Computing-A Fusion of Foundations, …, 2006

In this paper, we extend the classical notion of quasi-implication ("when a i is present then usu... more In this paper, we extend the classical notion of quasi-implication ("when a i is present then usually a j is also present") to R-rules (rules of rules), the premisses and the conclusions of which can be rules themselves. A new statistical measure, based on the implicative intensity defined by Gras for quasi-implications, is defined to assess the significance of R-rules on a data set. We show how to organize R-rules in a new combinatorial structure, the directed hierarchy, which is inspired by the classical hierarchical classification. An incremental algorithm is developed to find the most significant R-rule "amalgamation". An illustration is presented on a real data set stemming from a recent survey of the French Public Education Mathematical Teacher Society on the level in mathematics of pupils in the final year of secondary education and the perception of this subject.

Research paper thumbnail of Can we “trace” the phenomenon of compartmentalization by using the implicative statistical method of analysis? An application for the concept of function

… Quaderni di Ricerca In Didattica of …, 2005

L'objectif de cette recherche est d' identifier les difficultés qui concernent la conversion d'un... more L'objectif de cette recherche est d' identifier les difficultés qui concernent la conversion d'un mode de représentation d'une fonction à un autre mode(p.e. graphique, symbolique, verbal) et d'examiner le phénomène de compartimentation, c'est-à-dire l'incapacité à coordonner au moins deux modes de représentation du concept. Nous avons proposé deux tests à 183 élèves de quatrième (élèves de 14-15 ans) et à 404 élèves de seconde (élèves de 16-17 ans). Les deux tests concernent les mêmes relations algébriques mais ils proposent différentes conversions et en particulier la représentation-source de conversions. L'emploi de l'analyse statistique implicative sur les tableaux de données montre une absence de ressemblance et d'implication entre les tâches des deux tests pour les deux groupes d'âge. Ces résultats montrent ainsi que les différents types de conversion entre représentations du même contenu mathématique sont traités de manière distincte soulignant l'existence du phénomène de compartimentation.

Research paper thumbnail of Using the Statistical Implicative Analysis for Elaborating Behavioral Referentials

Various informatic assessment tools have been created to help human resources managers in evaluat... more Various informatic assessment tools have been created to help human resources managers in evaluating the behavioral profile of a person. The psychological basis of those tools have all been validated, but very few of them have follow a deep statistical analysis. The PerformanSe Echo assessment tool is one of them. It gives the behavioral profile of a person along 10

Research paper thumbnail of An interactive, asymmetric and extensional method for matching conceptual hierarchies

Our work deals with schema or ontology matching and is driven by the following statements: (1) Mo... more Our work deals with schema or ontology matching and is driven by the following statements: (1) Most of works only consider intensional description of schemas; (2) They mostly use symmetric similarity measures (and then they match similarity relations betwen concepts); (3) Few prototypes allow an interactive and visual match process. Therefore, we suggest an extensional and asymmetric matching method based on the discovery of significant implication rules between concepts described in textual documents. Our approach relies on the association rules paradigm and use a probabilistic model of deviation from independence, named implication intensity. Our matching method is divided into two consecutive stages: (1) the extraction in documents of relevant terms for each concept; (2) the discovery of significant implications between the concepts. And finally, we enclose this matching approach into an interactive visualization tool in order to facilitate the analyse, the validation and the editing of a mapping set for the knowledge engineer.

Research paper thumbnail of Mesurer l'écart entre une analyse a priori et la contingence en didactique

Revue des Nouvelles Technologies de l'Information, 2009

Research paper thumbnail of Réduction des colonnes d'un tableau de données par quasi-équivalence entre variables

Extraction et Gestion des Connaissances, 2002