Régis Gras - Academia.edu (original) (raw)
Papers by Régis Gras
Studies in Classification, Data Analysis, and Knowledge Organization, 2007
Quasi-implications, also called association rules in data mining, have become the major concept t... more Quasi-implications, also called association rules in data mining, have become the major concept to represent implicative trends between itemset patterns. To make their interpretation easier, two problems have become crucial: filtering the most interestingness rules and structuring them to highlight their relationships. In this paper, we put ourselves in the Statistical Implicative Analysis framework, and we propose a new methodology for reducing rule sets by detecting redundant rules. We define two new measures based on the Shannon's entropy and the Gini's coefficient.
In the context of the theory of implicative statistical analysis, a user repeating some experimen... more In the context of the theory of implicative statistical analysis, a user repeating some experimentation in a specific domain is faced with the issue of the robustness of the metric appraising the quality of the implicative index. In this paper, we address this problem through a differential analysis instead of bootstrapping. We study each individual parameter involved in the implicative index equation. And we compare their variations with those of other indices from the data-mining literature. Furthermore, we study the structure of the vector field they span by focusing on the notion of implicative gradient. From there, a geometrical representation is used to illustrate the index equilibrium problematic through a series of figures of equipotential surfaces.
Cette partie vise a exposer en 9 chapitres, la theorie de l'Analyse Statistique implicative (... more Cette partie vise a exposer en 9 chapitres, la theorie de l'Analyse Statistique implicative (ASI). Nous cherchons a y definir le plus precisement possible les concepts et les theoremes de cette theorie ainsi que leurs fondements epistemologiques et methodologiques. Parmi ceux-ci, citons : relation de quasi-implication, coefficient et indice d'implication, de propension, graphe implicatif, classification hierarchique orientee, etc. De plus, chaque concept est illustre par un exemple.
2007 IEEE International Conference on Systems, Man and Cybernetics, 2007
The assessment of the interestingness of sequential rules (generally temporal rules) is a crucial... more The assessment of the interestingness of sequential rules (generally temporal rules) is a crucial problem in sequence analysis. Due to their unsupervised nature, frequent pattern mining algorithms commonly generate a huge number of rules. However, while association rule interestingness has been widely studied in the literature, there are few measures dedicated to sequential rules. In this article, we propose an original statistical measure for assessing sequential rule interestingness. This measure named Sequential Implication Intensity (SII) evaluates the statistical significance of the rules in comparison with a probabilistic model. Numerical simulations show that SII has unique features for a sequential rule interestingness measure.
HAL is a multidisciplinary open access archive for the deposit and dissemination of scientific re... more HAL is a multidisciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L'archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d'enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Intelligent Learning Environments: The Case of Geometry, 1996
Proof in geometry problems is an essential feature of secondary school mathematical teaching. Thi... more Proof in geometry problems is an essential feature of secondary school mathematical teaching. This presents difficulties that many may pupils fail to overcome. Experiments with ‘intelligent’ logicials for pupil-aid in geometry, are described here. They are based on research into mathematical teaching and pupil learning patterns, and provide information on pupil spontaneous reasoning applied to geometry.
En relation avec des approches classiques de l'incertain, l'analyse statistique implicative (A.S.... more En relation avec des approches classiques de l'incertain, l'analyse statistique implicative (A.S.I.) peut apparaître innovante, particulièrement pour l'opérateur d'implication. L'article montre en effet que la notion de variables à valeurs intervalles et celle de variables-intervalles sont efficaces dans la détermination de leur distribution et dans la recherche de règles entre variables floues. De plus, elles apportent de riches informations sur la qualité de ces règles, tout en permettant d'étudier le rôle des variables supplémentaires dans l'existence de ces règles. Cette nouvelle perspective épistémologique de l'incertain ouvre d'intéressantes perspectives d'application.
A.S.I.-Analyse statistique implicative : une fois encore, de quoi s'agit-il ? Il nous semble, com... more A.S.I.-Analyse statistique implicative : une fois encore, de quoi s'agit-il ? Il nous semble, comme nous avons eu l'occasion de dire et écrire à maintes reprises, qu'une manière simplifiée de situer l'objet de l'Analyse Statistique Implicative, est de la comprendre comme « … un champ théorique centré sur le concept d'implication statistique ou plus précisément sur le concept de quasi-implication pour le distinguer de celui d'implication logique des domaines de la logique et des mathématiques. L'étude de ce concept de quasi-implication en tant qu'objet mathématique, dans les champs des probabilités et de la statistique, a permis de construire des outils théoriques qui instrumentent une méthode d'analyse de données. » 4 (Gras, Régnier, 2009 p.12). Le présent ouvrage est constitué des articles issus d'un appel à contributions lancé dans le cadre du sixième colloque sur l'Analyse Statistique Implicative-ASI6 organisé à Caen en novembre 2012. Ces articles ont été soumis à la lecture critique 5 des membres du comité international scientifique qui en ont assuré la qualité scientifique. Nous rapportons ici la liste en leur adressant nos remerciements les plus chaleureux pour leur diligence.
Fifth IEEE International Conference on Data Mining (ICDM'05)
Assessing rules with interestingness measures is the cornerstone of successful applications of as... more Assessing rules with interestingness measures is the cornerstone of successful applications of association rule discovery. However, there exists no information-theoretic measure which is adapted to the semantics of association rules. In this article, we present the Directed Information Ratio (DIR), a new rule interestingness measure which is based on information theory. DIR is specially designed for association rules, and in particular it differentiates two opposite rules a → b and a → b. Moreover, to our knowledge, DIR is the only rule interestingness measure which rejects both independence and (what we call) equilibrium, i.e. it discards both the rules whose antecedent and consequent are negatively correlated, and the rules which have more counterexamples than examples. Experimental studies show that DIR is a very filtering measure, which is useful for association rule post-processing.
Educação Matemática Pesquisa, V. 16, n° 3 201
Si le probleme de la concomitance de deux variables a et b trouve une partie de sa reponse dans l... more Si le probleme de la concomitance de deux variables a et b trouve une partie de sa reponse dans l'etude symetrique de la correlation ou dans celle de la similarite, celui de l'implication (si a alors b) passe, en revanche, par l'examen d'une relation dissymetrique. Il s'agit ici d'etendre l'etude de l'implication statistique (ou quasi-implication) a des types de variables non-binaires et, surtout, a des classes de telles variables
National audienceno abstrac
Http Www Theses Fr, 1992
Ce travail est centre sur deux objets apparemment differents mais etroitement dependants. D'u... more Ce travail est centre sur deux objets apparemment differents mais etroitement dependants. D'une part, une etude mathematique dote de trois fonctions l'analyse implicative : reperage des niveaux significatifs de l'arbre des classes d'implications, determination de la contribution de chaque individu a l'elaboration d'une classe d'implications, caracterisation des contributions des categories a priori d'individus. Elles sont egalement informatisees. D'autre part, une approche didactique faisant suite a la problematique de notre these de 1981 propose un nouveau concept: macle de contradictions, et developpe la notion d'ostension introduite lors de notre dea. Ceux-ci ont permis une analyse explicative des phenomenes d'obsolescence qui apparaissent lors des reproductions des situations didactiques. Ces phenomenes ont ete reveles par l'analyse de l'arbre de cohesions implicatives facilitee et enrichie par le reperage des niveaux significatifs et par la caracterisation des contributions des categories. Le concept de macle de contradictions explique pourquoi l'ostension est si resistante. En outre, une deuxieme composante, qui expliquerait l'utilisation sans parcimonie de l'ostension, serait la conception que se fait l'enseignant de l'auto-organisation des eleves
http://www.apec.fr Résumé. A partir d'un échantillon de 2788 cadres en recherche d'emploi ayant p... more http://www.apec.fr Résumé. A partir d'un échantillon de 2788 cadres en recherche d'emploi ayant passé un test de personnalité (PerformanSe-ECHO), l'Association Pour l'Emploi des Cadres (APEC), détentrice des données souhaite élaborer des référentiels comportementaux destinés à faciliter leur réinsertion à travers un système d'aide à la décision destiné aux consultants en charge de l'accompagnement au repositionnement professionnel. Par l'utilisation conjointe de la statistique classique et de l'analyse implicative, à travers le logiciel CHIC, il s'agit de mettre en évidence les conjonctions significatives de traits comportementaux et, en relation avec le psychologue, de définir la sémantique des associations découvertes pour finalement construire le système d'aide à la décision du consultant dans un langage aussi proche que possible du langage naturel.
World Conference on the Fundamentals of Artificial Intelligence, 1995
Extraction et Gestion des Connaissances, 2003
Differents types de connaissances peuvent etre extraits des donnees issues d'un questionnaire... more Differents types de connaissances peuvent etre extraits des donnees issues d'un questionnaire. Elles dependent du questionnement de l'analyste mais aussi des methodes de traitement des donnees qui sont utilisees. C'est ainsi que l'on peut obtenir le rejet d'une hypothese nulle, mais aussi une typologie des items du questionnaire, des sujets qui y ont repandu, mais encore une structure graphique de filiation inferentielle, une hierarchie de regles comportementales, etc. Dans cet article, nous presentons plusieurs approches de traitement possibles d'un questionnaire visant a structurer des traits de personnalite degages de comportements de reponse au questionnaire.
Notre ambition est de construire, autour des problématiques majeures de tout l’enseignement des m... more Notre ambition est de construire, autour des problématiques majeures de tout l’enseignement des mathématiques du secondaire, un système cohérent qui, en faisant plus de place à la formation scientifique qu’à la culture mathématique sans la reléguer, coordonne trois composantes indissociables : des situations où l’activité de l’élève trouve sa place, situations suffisamment significatives pour que l’élève s’approprie le problème posé, pour qu’il y engage un coût cognitif ni trop élevé, ni dérisoire, des démarches, des attitudes scientifiques attendues de lui, satisfaisant les objectifs généraux et spécifiques des mathématiques, des savoirs visés à organiser en fonction de l’approfondissement défini par le niveau de la classe, le rythme adopté par certains élèves, etc. Par suite, un même contenu pourra être enseigné ou "visité" plusieurs fois mais à des niveaux ou dans des cadres différents.
Studies in Classification, Data Analysis, and Knowledge Organization, 2007
Quasi-implications, also called association rules in data mining, have become the major concept t... more Quasi-implications, also called association rules in data mining, have become the major concept to represent implicative trends between itemset patterns. To make their interpretation easier, two problems have become crucial: filtering the most interestingness rules and structuring them to highlight their relationships. In this paper, we put ourselves in the Statistical Implicative Analysis framework, and we propose a new methodology for reducing rule sets by detecting redundant rules. We define two new measures based on the Shannon's entropy and the Gini's coefficient.
In the context of the theory of implicative statistical analysis, a user repeating some experimen... more In the context of the theory of implicative statistical analysis, a user repeating some experimentation in a specific domain is faced with the issue of the robustness of the metric appraising the quality of the implicative index. In this paper, we address this problem through a differential analysis instead of bootstrapping. We study each individual parameter involved in the implicative index equation. And we compare their variations with those of other indices from the data-mining literature. Furthermore, we study the structure of the vector field they span by focusing on the notion of implicative gradient. From there, a geometrical representation is used to illustrate the index equilibrium problematic through a series of figures of equipotential surfaces.
Cette partie vise a exposer en 9 chapitres, la theorie de l'Analyse Statistique implicative (... more Cette partie vise a exposer en 9 chapitres, la theorie de l'Analyse Statistique implicative (ASI). Nous cherchons a y definir le plus precisement possible les concepts et les theoremes de cette theorie ainsi que leurs fondements epistemologiques et methodologiques. Parmi ceux-ci, citons : relation de quasi-implication, coefficient et indice d'implication, de propension, graphe implicatif, classification hierarchique orientee, etc. De plus, chaque concept est illustre par un exemple.
2007 IEEE International Conference on Systems, Man and Cybernetics, 2007
The assessment of the interestingness of sequential rules (generally temporal rules) is a crucial... more The assessment of the interestingness of sequential rules (generally temporal rules) is a crucial problem in sequence analysis. Due to their unsupervised nature, frequent pattern mining algorithms commonly generate a huge number of rules. However, while association rule interestingness has been widely studied in the literature, there are few measures dedicated to sequential rules. In this article, we propose an original statistical measure for assessing sequential rule interestingness. This measure named Sequential Implication Intensity (SII) evaluates the statistical significance of the rules in comparison with a probabilistic model. Numerical simulations show that SII has unique features for a sequential rule interestingness measure.
HAL is a multidisciplinary open access archive for the deposit and dissemination of scientific re... more HAL is a multidisciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L'archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d'enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Intelligent Learning Environments: The Case of Geometry, 1996
Proof in geometry problems is an essential feature of secondary school mathematical teaching. Thi... more Proof in geometry problems is an essential feature of secondary school mathematical teaching. This presents difficulties that many may pupils fail to overcome. Experiments with ‘intelligent’ logicials for pupil-aid in geometry, are described here. They are based on research into mathematical teaching and pupil learning patterns, and provide information on pupil spontaneous reasoning applied to geometry.
En relation avec des approches classiques de l'incertain, l'analyse statistique implicative (A.S.... more En relation avec des approches classiques de l'incertain, l'analyse statistique implicative (A.S.I.) peut apparaître innovante, particulièrement pour l'opérateur d'implication. L'article montre en effet que la notion de variables à valeurs intervalles et celle de variables-intervalles sont efficaces dans la détermination de leur distribution et dans la recherche de règles entre variables floues. De plus, elles apportent de riches informations sur la qualité de ces règles, tout en permettant d'étudier le rôle des variables supplémentaires dans l'existence de ces règles. Cette nouvelle perspective épistémologique de l'incertain ouvre d'intéressantes perspectives d'application.
A.S.I.-Analyse statistique implicative : une fois encore, de quoi s'agit-il ? Il nous semble, com... more A.S.I.-Analyse statistique implicative : une fois encore, de quoi s'agit-il ? Il nous semble, comme nous avons eu l'occasion de dire et écrire à maintes reprises, qu'une manière simplifiée de situer l'objet de l'Analyse Statistique Implicative, est de la comprendre comme « … un champ théorique centré sur le concept d'implication statistique ou plus précisément sur le concept de quasi-implication pour le distinguer de celui d'implication logique des domaines de la logique et des mathématiques. L'étude de ce concept de quasi-implication en tant qu'objet mathématique, dans les champs des probabilités et de la statistique, a permis de construire des outils théoriques qui instrumentent une méthode d'analyse de données. » 4 (Gras, Régnier, 2009 p.12). Le présent ouvrage est constitué des articles issus d'un appel à contributions lancé dans le cadre du sixième colloque sur l'Analyse Statistique Implicative-ASI6 organisé à Caen en novembre 2012. Ces articles ont été soumis à la lecture critique 5 des membres du comité international scientifique qui en ont assuré la qualité scientifique. Nous rapportons ici la liste en leur adressant nos remerciements les plus chaleureux pour leur diligence.
Fifth IEEE International Conference on Data Mining (ICDM'05)
Assessing rules with interestingness measures is the cornerstone of successful applications of as... more Assessing rules with interestingness measures is the cornerstone of successful applications of association rule discovery. However, there exists no information-theoretic measure which is adapted to the semantics of association rules. In this article, we present the Directed Information Ratio (DIR), a new rule interestingness measure which is based on information theory. DIR is specially designed for association rules, and in particular it differentiates two opposite rules a → b and a → b. Moreover, to our knowledge, DIR is the only rule interestingness measure which rejects both independence and (what we call) equilibrium, i.e. it discards both the rules whose antecedent and consequent are negatively correlated, and the rules which have more counterexamples than examples. Experimental studies show that DIR is a very filtering measure, which is useful for association rule post-processing.
Educação Matemática Pesquisa, V. 16, n° 3 201
Si le probleme de la concomitance de deux variables a et b trouve une partie de sa reponse dans l... more Si le probleme de la concomitance de deux variables a et b trouve une partie de sa reponse dans l'etude symetrique de la correlation ou dans celle de la similarite, celui de l'implication (si a alors b) passe, en revanche, par l'examen d'une relation dissymetrique. Il s'agit ici d'etendre l'etude de l'implication statistique (ou quasi-implication) a des types de variables non-binaires et, surtout, a des classes de telles variables
National audienceno abstrac
Http Www Theses Fr, 1992
Ce travail est centre sur deux objets apparemment differents mais etroitement dependants. D'u... more Ce travail est centre sur deux objets apparemment differents mais etroitement dependants. D'une part, une etude mathematique dote de trois fonctions l'analyse implicative : reperage des niveaux significatifs de l'arbre des classes d'implications, determination de la contribution de chaque individu a l'elaboration d'une classe d'implications, caracterisation des contributions des categories a priori d'individus. Elles sont egalement informatisees. D'autre part, une approche didactique faisant suite a la problematique de notre these de 1981 propose un nouveau concept: macle de contradictions, et developpe la notion d'ostension introduite lors de notre dea. Ceux-ci ont permis une analyse explicative des phenomenes d'obsolescence qui apparaissent lors des reproductions des situations didactiques. Ces phenomenes ont ete reveles par l'analyse de l'arbre de cohesions implicatives facilitee et enrichie par le reperage des niveaux significatifs et par la caracterisation des contributions des categories. Le concept de macle de contradictions explique pourquoi l'ostension est si resistante. En outre, une deuxieme composante, qui expliquerait l'utilisation sans parcimonie de l'ostension, serait la conception que se fait l'enseignant de l'auto-organisation des eleves
http://www.apec.fr Résumé. A partir d'un échantillon de 2788 cadres en recherche d'emploi ayant p... more http://www.apec.fr Résumé. A partir d'un échantillon de 2788 cadres en recherche d'emploi ayant passé un test de personnalité (PerformanSe-ECHO), l'Association Pour l'Emploi des Cadres (APEC), détentrice des données souhaite élaborer des référentiels comportementaux destinés à faciliter leur réinsertion à travers un système d'aide à la décision destiné aux consultants en charge de l'accompagnement au repositionnement professionnel. Par l'utilisation conjointe de la statistique classique et de l'analyse implicative, à travers le logiciel CHIC, il s'agit de mettre en évidence les conjonctions significatives de traits comportementaux et, en relation avec le psychologue, de définir la sémantique des associations découvertes pour finalement construire le système d'aide à la décision du consultant dans un langage aussi proche que possible du langage naturel.
World Conference on the Fundamentals of Artificial Intelligence, 1995
Extraction et Gestion des Connaissances, 2003
Differents types de connaissances peuvent etre extraits des donnees issues d'un questionnaire... more Differents types de connaissances peuvent etre extraits des donnees issues d'un questionnaire. Elles dependent du questionnement de l'analyste mais aussi des methodes de traitement des donnees qui sont utilisees. C'est ainsi que l'on peut obtenir le rejet d'une hypothese nulle, mais aussi une typologie des items du questionnaire, des sujets qui y ont repandu, mais encore une structure graphique de filiation inferentielle, une hierarchie de regles comportementales, etc. Dans cet article, nous presentons plusieurs approches de traitement possibles d'un questionnaire visant a structurer des traits de personnalite degages de comportements de reponse au questionnaire.
Notre ambition est de construire, autour des problématiques majeures de tout l’enseignement des m... more Notre ambition est de construire, autour des problématiques majeures de tout l’enseignement des mathématiques du secondaire, un système cohérent qui, en faisant plus de place à la formation scientifique qu’à la culture mathématique sans la reléguer, coordonne trois composantes indissociables : des situations où l’activité de l’élève trouve sa place, situations suffisamment significatives pour que l’élève s’approprie le problème posé, pour qu’il y engage un coût cognitif ni trop élevé, ni dérisoire, des démarches, des attitudes scientifiques attendues de lui, satisfaisant les objectifs généraux et spécifiques des mathématiques, des savoirs visés à organiser en fonction de l’approfondissement défini par le niveau de la classe, le rythme adopté par certains élèves, etc. Par suite, un même contenu pourra être enseigné ou "visité" plusieurs fois mais à des niveaux ou dans des cadres différents.