Cubes émergents pour l'analyse des renversements de tendances dans les bases de données multidimensionnelles / Sébastien Nedjar ; sous la direction de Lofti Lakhal et Alain Casali

Auteur principal : Nedjar, Sébastien, 1982-, AuteurAuteur secondaire : Lakhal, Lofti, Directeur de thèse • Casali, Alain, 1977-, Directeur de thèseAuteur secondaire collectivité : Université d'Aix-Marseille, Faculté des sciences, Etablissement de soutenanceType de document : ThèseLangue : français.Pays: France.Éditeur : [S.l.] : [s.n.], 2009Description : 1 vol. (224 p.) ; 30 cmISBN: s.n..Bibliographie : Bibliogr. p. 214-224.Sujet MSC : 68P15, Computer science - Theory of data, Database theory
68W05, Algorithms in computer science, Nonnumerical algorithms
68P20, Computer science - Theory of data, Information storage and retrieval of data
68U10, Computer science, Computing methodologies for image processing
97-02, Research exposition (monographs, survey articles) pertaining to mathematics education
Note de thèse: Informatique, 23 novembre 2009, Université de la Méditerranée, Thèse de doctoratEn-ligne : tel
Tags from this library: No tags from this library for this title. Log in to add tags.
Holdings
Item type Current library Call number Status Date due Barcode
Thèse Thèse CMI
Réserve
Thèses NED (Browse shelf(Opens below)) Available 06644-01

Bibliogr. p. 214-224

Informatique 23 novembre 2009 Université de la Méditerranée Thèse de doctorat

Découvrir des renversements de tendances entre deux cubes de données offre aux utilisateurs une connaissance nouvelle et intéressante lors des fluctuations de l'univers réel modélisé : quelles sont les nouveautés ? Quelle tendance apparaît ou disparaît ? Nous introduisons le nouveau concept de Cube Émergent. Il capture les renversements de tendances en mettant en œuvre une contrainte d'émergence (conjonction de contrainte monotones et antimonotones). Les bordures, classiques en fouille de données, sont reprises pour le Cube Émergent. Dans un second temps, nous proposons un nouveau couple de bordures pour optimiser à la fois l'espace de stockage et le temps de calcul. Cette nouvelle représentation fournit une caractérisation simple de la taille du Cube Émergent aussi bien que des outils de classification et de navigation dans les cubes. La connexion entre les bordures classiques et celles proposées est formellement établie en utilisant le concept de cube transversal. Connaître la taille du Cube Émergent est d'un grand intérêt, en particulier pour ajuster au mieux la contrainte d'émergence sous-jacente. Cette problématique est traitée en étudiant une borne supérieure et en caractérisant la taille exacte du Cube Émergent. Deux stratégies sont proposées pour estimer rapidement cette taille : la première est basée sur une estimation analytique, sans accès à la base de données, la seconde s'appuie sur un comptage probabiliste utilisant les bordures proposées comme entrée de l'algorithme proche de l'optimal HYPERLOGLOG. Grâce à la particulière efficacité de cet algorithme, plusieurs itérations peuvent être réalisées pour calibrer au mieux la contrainte d'émergence. De plus, des nouvelles représentations réduites et sans perte d'information du Cube Émergent sont proposées en utilisant le concept de fermeture cubique.

There are no comments on this title.

to post a comment.