Contribution à la classification de données binaires et qualitatives / Franck Marchetti ; sous la direction de Gérard Govaert
Type de document : ThèseLangue : français.Pays: France.Éditeur : [S.l.] : [s.n.], 1989Description : 1 vol. (213 p.) ; 30 cmISBN: 2726106404.Bibliographie : Bibliogr. p. 209-213.Sujet MSC : 62H17, Statistics - Multivariate analysis, Contingency tables68P25, Computer science - Theory of data, Data encryption
68P05, Computer science - Theory of data, Data structures
97-02, Research exposition (monographs, survey articles) pertaining to mathematics educationNote de thèse: Thèse de doctorat, informatique, 1989, université de Metz Item type:

Current library | Call number | Status | Date due | Barcode |
---|---|---|---|---|
CMI Salle S | Thèses MAR (Browse shelf(Opens below)) | Available | 10470-01 |
Bibliogr. p. 209-213
Thèse de doctorat informatique 1989 université de Metz
Dans ce travail, nous étudions des méthodes de classification automatique spécifiques aux données binaires et qualitatives nominales et ordinales. A chaque fois, nous essayons de rester proche de la forme et de la structure initiale des données. Ces méthodes fournissent des partitions optimisant un critère défini à partir de la distance en valeurs absolues ou distance L1. Cette approche permet d'aboutir à des résultats facilement interprétables par rapport aux données initiales. Nous définissons ensuite une inertie sur l'espace binaire muni de la distance L1. Cette inertie binaire se comporte comme l'inertie habituelle : une relation de type Huyghens et une relation de décomposition de l'inertie sont démontrées. La méthode de classification et la méthode de classification croisée pour tableaux de variables binaires peuvent ainsi être replacées dans un contexte plus habituel. Elles optimisent respectivement un critère d'inertie intraclasse et une mesure d'information. Une extension à la classification ascendante hiérarchique est également envisagée. Ensuite, toujours en restant proche des données initiales, une analyse en composantes principales pour données binaires est construite. Celle-ci recherche un ensemble d'axes factoriels binaires et permet de mettre en évidence des sous-tableaux homogènes. Enfin, un bilan des méthodes pour tableaux binaires est effectué. Toutes les méthodes proposées ici ont été programmées et intégrées au logiciel d'analyse de données SICLA (système interactif et classification automatique, INRIA)
There are no comments on this title.