Eléments pour un système de reconnaissance automatique de la parole continue en français / par Stéphane Igounet ; sous la direction de Marc El-Bèze
Type de document : ThèseLangue : français.Pays: France.Éditeur : [S.l.] : [s.n.], 1998Description : 1 vol. (151 f.) : fig. ; 30 cmBibliographie : Bibliogr.Sujet MSC : 68T10, Computer science - Artificial intelligence, Pattern recognition, speech recognition94B35, Information and communication theory, circuits - Theory of error-correcting codes and error-detecting codes, Decoding
97-02, Research exposition (monographs, survey articles) pertaining to mathematics educationNote de thèse: Thèse de doctorat, informatique, 1998, Avignon Item type:

Current library | Call number | Status | Date due | Barcode |
---|---|---|---|---|
CMI Salle S | Thèses IGO (Browse shelf(Opens below)) | Available | 00207-01 |
Bibliogr
Thèse de doctorat informatique 1998 Avignon
Cette thèse porte sur la Reconnaissance Automatique de la Parole (RAP). Dans une première partie, nous définissons les bases théoriques de la RAP. Nous insistons notamment sur les méthodes probabilistes utilisées dans ce travail de recherche et sur les raisons qui poussent à mettre en œuvre des stratégies dites multi-passes. Nous terminons par un tour d'horizon de Systèmes de Reconnaissance Automatique de la Parole Continue (SRAPC) afin de faire le point sur les différentes stratégies employées actuellement. La seconde partie est consacrée à la réalisation d'un système de Décodage Acoustico-Phonétique (DAP) fondé sur la modélisation markovienne. D'une manière générale, la problématique traitée recouvre l'ensemble des problèmes rencontrés lors de l'automatisation des processus de construction d'un moteur de RAP. En ce qui concerne le DAP, nous étudions particulièrement la phonétisation et l'impact de l'alignement des données acoustiques et phonétiques sur l'initialisation des modèles acoustiques. Dans la troisième partie, nous étudions l'accès lexical et la modélisation du langage. Tout d'abord, nous présentons un SRAPC de référence. Puis, nous proposons deux stratégies de reconnaissance alternatives. La première est une stratégie multi-passes fondée sur une simplification du lexique et un processus de filtrage acoustico-linguistique. La seconde stratégie proposée vise à inclure des ressources linguistiques directement dans un processus de décodage dérivé de l'algorithme A*. Enfin, dans la quatrième et dernière partie, nous nous intéressons à la fabrication de Modèles de Langage (ML) probabilistes. Nous proposons une méthode qui permet de faciliter la mise au point de ML grâce à un processus d'extraction de Sous-Modèles de Langage (SML) à partir d'un ML calculé au préalable
There are no comments on this title.