Amine Chaibi - Academia.edu (original) (raw)
Papers by Amine Chaibi
Résumé. Dans cet article, nous proposons une nouvelle approche permettant à la fois le bi-partiti... more Résumé. Dans cet article, nous proposons une nouvelle approche permettant à la fois le bi-partitionnement topologique (bi-clustering) et la pondération de blocs variables. Le modèle que nous proposons FBR-BiTM (Feature Block Relevance using BiTM) permet de découvrir un espace topologique d’un ensemble d’observations et de variables en associant un nouveau score de pondération à chaque sous ensemble de variables. L’estimation des coefficients de pondération est réalisée dans le même processus d’apprentissage que le bi-partitionnement. Ces pondérations sont locales et associées à chaque prototype. Elles reflètent l’importance locale de chaque bloc de variables pour le bi-partitionnement. L’évaluation montre que l’approche proposée, comparée à d’autres méthodes de bipartitionnement, obtient des résultats performants. Mots clés : bi-partitionnement, pondérations de blocs variables, cartes topologiques.
Résumé. Dans cet article, nous introduisons une nouvelle mesure pour qualifier “l’outlier-ness“ d... more Résumé. Dans cet article, nous introduisons une nouvelle mesure pour qualifier “l’outlier-ness“ de chaque groupe/cluster. Cette mesure, nommée GOF, est intégrée et estimée dans un processus d’apprentissage non supervisé en utilisant les cartes topologiques. Ceci permet d’apprendre la structure des données tout en fournissant un nouveau score (GOF). Ce paramètre est basé sur la densité et quantifie ainsi la particularité de chaque groupe (cluster) : plus la valeur est grande, plus le groupe est susceptible d’être un ”groupe-outlier“. GOF est utilisé par la suite comme classifieur pour le problème de détection de nouveautés.
We propose in this paper a new measure called GOF (Group Outlier Factor) to detect groups outlier... more We propose in this paper a new measure called GOF (Group Outlier Factor) to detect groups outliers. To validate this measure we inte- grated it in a clustering process using Self-organizing Map. The proposed approach is based on relative density of each group of data and simultane- ously provides a partitioning of data and a quantitative indicator (GOF). The obtained results are very encouraging to continue in this direction.
7030 99, av. J-B Clément-F-93430 Villetaneuse * * Anticipeo 4 bis, impasse Courteline 94800 Ville... more 7030 99, av. J-B Clément-F-93430 Villetaneuse * * Anticipeo 4 bis, impasse Courteline 94800 Villejuif, France Résumé. Dans ce papier, nous proposons une nouvelle approche topologique de bi-partitionnement (bi-clustering) appelée BiTM en utilisant les cartes autoorganisatrices. L'idée principale de l'approche est d'utiliser une seule carte pour le partitionnement simultané des lignes (observations) et des colonnes (variables). Contrairement aux approches utilisant les cartes topologiques, notre modèle ne nécessite pas de pré-traitement de la base de données. Ainsi, une nouvelle fonction de coût est proposée. De plus, BiTM fournit une visualisation topologique des blocs ou bi-clusters facilement interprétable. Les résultats obtenus sont très encourageants et prometteurs pour continuer dans cette optique.
Lecture Notes in Computer Science, 2012
ABSTRACT We present in this paper a new measure named GOF (Group Outlier Factor) for cluster outl... more ABSTRACT We present in this paper a new measure named GOF (Group Outlier Factor) for cluster outliers and novelty detection. The main difference between GOF and existing methods is that being an outlier is not associated to a single pattern but to a cluster. GOF is based on relative density of each group of data and provides a quantitative indicator of outlier-ness which enables to detect automatically "cluster outliers". To learn GOF measure, we integrate it in a clustering process using Self-organizing Map. Experimental results and comparison studies show that the use of GOF sensibly improves the results in term of cluster-outlier detection and novelty detection.
The 2013 International Joint Conference on Neural Networks (IJCNN), 2013
ABSTRACT In this paper, we propose a new bi-clustering algorithm based on self-organizing maps ti... more ABSTRACT In this paper, we propose a new bi-clustering algorithm based on self-organizing maps titled BiTM (Bi-clustering using Topological Map). BiTM provides a simultaneous clustering of rows and columns of the data matrix in order to increase the homogeneity of bi-clusters by respecting neighborhood relationship and using a single map. BiTM maps provide a new topological visualization of the bi-clusters. Experimental results and comparison studies show that BiTM improves the results in term of bi-clustering and visualization.
Lecture Notes in Computer Science, 2014
This paper proposes a new method to weight feature groups for biclustering. In this method, the o... more This paper proposes a new method to weight feature groups for biclustering. In this method, the observations and features are divided into biclusters, based on their characteristics. The weights are introduced to the biclustering process to simultaneously identify the relevance of feature groups in each bicluster. A new biclustering algorithm wBiTM (Weighted Biclustering Topological Map) is proposed. The new method is an extension to self-organizing map algorithm by adding the weight parameter and a new prototype for bicluster. Experimental results on synthetic data show the properties of the weights in wBiTM.
2013 17th International Conference on Information Visualisation, 2013
ABSTRACT This paper presents a new method for computing a quantitative score which can help in de... more ABSTRACT This paper presents a new method for computing a quantitative score which can help in detecting cluster outliers using visualisation task. Self-organising map is incorporated in the proposed approach. The proposed method is evaluated on a number of datasets from UCI. Visualizations and experimental results show that GOF sensibly improves the results in term of cluster-outlier detection. The development of the SOM based visualization tool intends to provide additional exploratory data analysis techniques by offering a tool that allows effective extraction and exploration of patterns.
International Journal of Computational Intelligence and Applications, 2013
This paper describe a new concept of "cluster outlier-ness". In order to quantify it, w... more This paper describe a new concept of "cluster outlier-ness". In order to quantify it, we propose a relative isolation score named group outlier factor (GOF). GOF is a score, which is computed during a clustering process using self-organizing maps. The main difference between GOF and existing methods is that, being an outlier is not associated to a single pattern but to a cluster. Thus, an outlier factor (OF) with respect to each cluster is computed for each new sample and compared to the GOF score associated for each cluster. OF is used as a novelty detection classifier. This approach allows to identify meaningful outlier-clusters and detects novel patterns that previous approaches could not find. Experimental results and comparison studies show that the use of GOF sensibly improves the results in term of cluster-outlier and novelty detection.
Nous proposons dans ce papier une nouvelle méthode de détection de groupes outliers. Notre mesure... more Nous proposons dans ce papier une nouvelle méthode de détection de groupes outliers. Notre mesure nommée GOF (Group Outlier Factor) est estimée par l'apprentissage non-supervisé. Nous l'avons intégré dans l'apprentissage des cartes topologiques. Notre approche est basée sur la densité relative de chaque groupe de données, et fournit simultanément un partitionnement des données et un indicateur quantitatif (GOF) sur "la particularité" de chaque cluster ou groupe. Les résultats obtenus sont très encourageants et prometteurs pour continuer dans cette optique.
Résumé. Dans cet article, nous proposons une nouvelle approche permettant à la fois le bi-partiti... more Résumé. Dans cet article, nous proposons une nouvelle approche permettant à la fois le bi-partitionnement topologique (bi-clustering) et la pondération de blocs variables. Le modèle que nous proposons FBR-BiTM (Feature Block Relevance using BiTM) permet de découvrir un espace topologique d’un ensemble d’observations et de variables en associant un nouveau score de pondération à chaque sous ensemble de variables. L’estimation des coefficients de pondération est réalisée dans le même processus d’apprentissage que le bi-partitionnement. Ces pondérations sont locales et associées à chaque prototype. Elles reflètent l’importance locale de chaque bloc de variables pour le bi-partitionnement. L’évaluation montre que l’approche proposée, comparée à d’autres méthodes de bipartitionnement, obtient des résultats performants. Mots clés : bi-partitionnement, pondérations de blocs variables, cartes topologiques.
Résumé. Dans cet article, nous introduisons une nouvelle mesure pour qualifier “l’outlier-ness“ d... more Résumé. Dans cet article, nous introduisons une nouvelle mesure pour qualifier “l’outlier-ness“ de chaque groupe/cluster. Cette mesure, nommée GOF, est intégrée et estimée dans un processus d’apprentissage non supervisé en utilisant les cartes topologiques. Ceci permet d’apprendre la structure des données tout en fournissant un nouveau score (GOF). Ce paramètre est basé sur la densité et quantifie ainsi la particularité de chaque groupe (cluster) : plus la valeur est grande, plus le groupe est susceptible d’être un ”groupe-outlier“. GOF est utilisé par la suite comme classifieur pour le problème de détection de nouveautés.
We propose in this paper a new measure called GOF (Group Outlier Factor) to detect groups outlier... more We propose in this paper a new measure called GOF (Group Outlier Factor) to detect groups outliers. To validate this measure we inte- grated it in a clustering process using Self-organizing Map. The proposed approach is based on relative density of each group of data and simultane- ously provides a partitioning of data and a quantitative indicator (GOF). The obtained results are very encouraging to continue in this direction.
7030 99, av. J-B Clément-F-93430 Villetaneuse * * Anticipeo 4 bis, impasse Courteline 94800 Ville... more 7030 99, av. J-B Clément-F-93430 Villetaneuse * * Anticipeo 4 bis, impasse Courteline 94800 Villejuif, France Résumé. Dans ce papier, nous proposons une nouvelle approche topologique de bi-partitionnement (bi-clustering) appelée BiTM en utilisant les cartes autoorganisatrices. L'idée principale de l'approche est d'utiliser une seule carte pour le partitionnement simultané des lignes (observations) et des colonnes (variables). Contrairement aux approches utilisant les cartes topologiques, notre modèle ne nécessite pas de pré-traitement de la base de données. Ainsi, une nouvelle fonction de coût est proposée. De plus, BiTM fournit une visualisation topologique des blocs ou bi-clusters facilement interprétable. Les résultats obtenus sont très encourageants et prometteurs pour continuer dans cette optique.
Lecture Notes in Computer Science, 2012
ABSTRACT We present in this paper a new measure named GOF (Group Outlier Factor) for cluster outl... more ABSTRACT We present in this paper a new measure named GOF (Group Outlier Factor) for cluster outliers and novelty detection. The main difference between GOF and existing methods is that being an outlier is not associated to a single pattern but to a cluster. GOF is based on relative density of each group of data and provides a quantitative indicator of outlier-ness which enables to detect automatically "cluster outliers". To learn GOF measure, we integrate it in a clustering process using Self-organizing Map. Experimental results and comparison studies show that the use of GOF sensibly improves the results in term of cluster-outlier detection and novelty detection.
The 2013 International Joint Conference on Neural Networks (IJCNN), 2013
ABSTRACT In this paper, we propose a new bi-clustering algorithm based on self-organizing maps ti... more ABSTRACT In this paper, we propose a new bi-clustering algorithm based on self-organizing maps titled BiTM (Bi-clustering using Topological Map). BiTM provides a simultaneous clustering of rows and columns of the data matrix in order to increase the homogeneity of bi-clusters by respecting neighborhood relationship and using a single map. BiTM maps provide a new topological visualization of the bi-clusters. Experimental results and comparison studies show that BiTM improves the results in term of bi-clustering and visualization.
Lecture Notes in Computer Science, 2014
This paper proposes a new method to weight feature groups for biclustering. In this method, the o... more This paper proposes a new method to weight feature groups for biclustering. In this method, the observations and features are divided into biclusters, based on their characteristics. The weights are introduced to the biclustering process to simultaneously identify the relevance of feature groups in each bicluster. A new biclustering algorithm wBiTM (Weighted Biclustering Topological Map) is proposed. The new method is an extension to self-organizing map algorithm by adding the weight parameter and a new prototype for bicluster. Experimental results on synthetic data show the properties of the weights in wBiTM.
2013 17th International Conference on Information Visualisation, 2013
ABSTRACT This paper presents a new method for computing a quantitative score which can help in de... more ABSTRACT This paper presents a new method for computing a quantitative score which can help in detecting cluster outliers using visualisation task. Self-organising map is incorporated in the proposed approach. The proposed method is evaluated on a number of datasets from UCI. Visualizations and experimental results show that GOF sensibly improves the results in term of cluster-outlier detection. The development of the SOM based visualization tool intends to provide additional exploratory data analysis techniques by offering a tool that allows effective extraction and exploration of patterns.
International Journal of Computational Intelligence and Applications, 2013
This paper describe a new concept of "cluster outlier-ness". In order to quantify it, w... more This paper describe a new concept of "cluster outlier-ness". In order to quantify it, we propose a relative isolation score named group outlier factor (GOF). GOF is a score, which is computed during a clustering process using self-organizing maps. The main difference between GOF and existing methods is that, being an outlier is not associated to a single pattern but to a cluster. Thus, an outlier factor (OF) with respect to each cluster is computed for each new sample and compared to the GOF score associated for each cluster. OF is used as a novelty detection classifier. This approach allows to identify meaningful outlier-clusters and detects novel patterns that previous approaches could not find. Experimental results and comparison studies show that the use of GOF sensibly improves the results in term of cluster-outlier and novelty detection.
Nous proposons dans ce papier une nouvelle méthode de détection de groupes outliers. Notre mesure... more Nous proposons dans ce papier une nouvelle méthode de détection de groupes outliers. Notre mesure nommée GOF (Group Outlier Factor) est estimée par l'apprentissage non-supervisé. Nous l'avons intégré dans l'apprentissage des cartes topologiques. Notre approche est basée sur la densité relative de chaque groupe de données, et fournit simultanément un partitionnement des données et un indicateur quantitatif (GOF) sur "la particularité" de chaque cluster ou groupe. Les résultats obtenus sont très encourageants et prometteurs pour continuer dans cette optique.