Trimming method pour la classification des données aberrantes appliquée sur les dimensions des billets de monnaie (original) (raw)

Nouvelle méthode de détection de dérive basée sur la distance entre les erreurs de classification

La classification dynamique s'intéresse au traitement des données non-stationnaires issues des environnements évolutifs dans le temps. Ces données peuvent présenter des dérives, qui affectent la performance du modèle d'apprentissage initialement construit. Aujourd'hui, beaucoup d'intérêts sont portés sur la surveillance, la mise à jour et le diagnostic de ces dérives afin d'améliorer la performance du modèle d'apprentissage. Dans ce contexte, une nouvelle méthode de détection de dérive basée sur la distance entre les erreurs de classification est présentée. Cette méthode, nommée EDIST, surveille la distribution des distances des erreurs de classification entre deux fenêtres de données afin de détecter une différence à travers un test d'hypothèse statistique. EDIST a été testée à travers des bases de données artificielles et réelles. Des résultats encourageants ont été trouvés par rapport à des méthodes similaires. EDIST a pu trouver les meilleurs taux d&#...

Conception d'un outil numérique de dimensionnement mécanique d'aubage basé sur le calcul isogéométrique

Isogeometric analysis performances, 2022

The purpose of this paper is the investigation of the actual capabilities of the isogeometric analysis in an industrial context. This takes place during my master internship in the company Safran Aircraft Engines which is an aircraft turbojet manufacturer. It is part of the SAFRAN Group that works on various science domains such as optical systems, electronic devices, planes and helicopter motorization. My mission during this internship was to develop a new software of calculation of stress and deformations using a new method : the isogeometric analysis.

Méthodes nouvelles en classification automatique de données taxinomiques nombreuses

1977

The aim of cluster analysis is to structure a large number of entities which are characterized by values of several variables, so that the entities are hierarchically classified. A number of the usual hierarchical algorithms are quite hopeless to apply to more than a comparâtively small number of objects. If the sample size is too small, the clusters observed may hâve little meaning and cluster analysis methods should be able to handle a large multivariate data set. The graph theoretical clustering methods based on the concept of "space-contraction", whichare presented, are optimal methods for the known sorting stratégies : single linkage, complète linkage, mean linkage, variance... The computational performance of thèse methods is such that they are applicable to a wide class of practical problems involving large sample size and high dimensionality.