Normal view MARC view ISBD view

Eléments pour un système de reconnaissance automatique de la parole continue en français / par Stéphane Igounet ; sous la direction de Marc El-Bèze

Auteur principal : Igounet, Stéphane, AuteurAuteur secondaire : El-Bèze, Marc, Directeur de thèseAuteur secondaire collectivité : Université d'Avignon, Editeur scientifiqueType de document : ThèseLangue : français.Pays : France.Éditeur : [S.l.] : [s.n.], 1998Description : 1 vol. (151 f.) : fig. ; 30 cmBibliographie : Bibliogr.Sujet MSC : 68T10, Pattern recognition, speech recognition, Computer science -- Artificial intelligence
94B35, Decoding, Information and communication, circuits -- Theory of error-correcting codes and error-detecting codes
97A70, Theses and postdoctoral theses, Mathematics education - General, mathematics and education
Note de thèse: Thèse de doctorat, informatique, 1998, Avignon
Tags from this library: No tags from this library for this title. Log in to add tags.
Current location Call number Status Date due Barcode
CMI
Salle S
Thèses IGO (Browse shelf) Available 00207-01

Bibliogr

Thèse de doctorat informatique 1998 Avignon

Cette thèse porte sur la Reconnaissance Automatique de la Parole (RAP). Dans une première partie, nous définissons les bases théoriques de la RAP. Nous insistons notamment sur les méthodes probabilistes utilisées dans ce travail de recherche et sur les raisons qui poussent à mettre en œuvre des stratégies dites multi-passes. Nous terminons par un tour d'horizon de Systèmes de Reconnaissance Automatique de la Parole Continue (SRAPC) afin de faire le point sur les différentes stratégies employées actuellement. La seconde partie est consacrée à la réalisation d'un système de Décodage Acoustico-Phonétique (DAP) fondé sur la modélisation markovienne. D'une manière générale, la problématique traitée recouvre l'ensemble des problèmes rencontrés lors de l'automatisation des processus de construction d'un moteur de RAP. En ce qui concerne le DAP, nous étudions particulièrement la phonétisation et l'impact de l'alignement des données acoustiques et phonétiques sur l'initialisation des modèles acoustiques. Dans la troisième partie, nous étudions l'accès lexical et la modélisation du langage. Tout d'abord, nous présentons un SRAPC de référence. Puis, nous proposons deux stratégies de reconnaissance alternatives. La première est une stratégie multi-passes fondée sur une simplification du lexique et un processus de filtrage acoustico-linguistique. La seconde stratégie proposée vise à inclure des ressources linguistiques directement dans un processus de décodage dérivé de l'algorithme A*. Enfin, dans la quatrième et dernière partie, nous nous intéressons à la fabrication de Modèles de Langage (ML) probabilistes. Nous proposons une méthode qui permet de faciliter la mise au point de ML grâce à un processus d'extraction de Sous-Modèles de Langage (SML) à partir d'un ML calculé au préalable

There are no comments for this item.

Log in to your account to post a comment.