Concepion d'un système de reconnaissance des chiffres arabes isolés et connectés à base des HMMs continus
Type doc. :
Langue :
Auteur(s) :
Année de soutenance:
Afficher le Résumé
Nous avons décrit dans ce mémoire, les modèles statistiques les plus utilisées en reconnaissance de la parole: les HMMs. Ces modèles sont à la base de presque la totalité des ûutils de recolUlaissa1lce de la parole . Ils bénéficient d'algorithmes d'entraînement et de décodage perfoffilants. Néanrnoms, les hypothèse nécessaires à la mise en reuvre des ces algorithmes peuvent pénaliser les perfoffilances de ces modèles. Les principales hypothèses les plus contraignantes sont : .Entraînement non discriminant (maximisation dc la vraisemblance au lieu des probabilités à posteriori). FOffil~ d~~ d~n~ité~ d~ probabilit~ fix~~ (multi gaussi~nn~).Les composantes de vecteurs acou.')tiques sont supposées non corrélées. La séquence d'états est un processus de Markov de premier ordre. Aucune corrélation entre les vecteurs acoustiques n'est directement modélisable.,La teclmologie mise en reuvre, en vue d'wle reconnaissance de chiffres isolés ou de séquences de chiffres connectés basées sur les modèles statistiques (HMMs)est satisfaisante. Des taux de recû1Ulaissance de l'ûrdre de 99 ~.o ont été observé pour des lûcuteurs n'ayant pas participé à l'entraînement pour la reconnaissance de chiffres isolés. Nous avons utilisé l'algorithme de construction de niveaux pour la reconnaissance des chiffres connectés. Nous avons atteint un taux de reconnaissance de 90.36% avec la base d'apprentissage BDC 1, et un taux de 89.88 % avec la base BDC2, dont les locutcurs de cette base ne figurent pas dans la base BDC 1. Aussi nous avons appliqué l'algoritlune d'wle passe pour la reconnaissance de chiffres enchaînés et nous avons atteint un taux de 93.55% avec la base BAC3. Comme perspective à ce travail nous proposons : 1 r~largir la basa da donnca. 2 Travailler sur Wl environnement non sévère. 3 Utiliser UJle combinée IIMM et RN ~ où le RN est utilisé pour l'estimation de la probabilité d'émission. 4 Donner plus d'importance au concept contextuel. 5 Faire une étude comparative entre L'algorifume de construction de niveau at L'algorillmle d'une passe pour la reconnaissance des mots enchaînés arabes. G lIlcoq)Orer la durée contدIlue dans l'algorill1l11e de constI-uction de niveaux. 7 Utiliser U1le combinée I-IMM et QV (quaIltification vectorielle).
| N° Bulletin | Date / Année de parution | Titre N° Spécial | Sommaire |
|---|
| Cote | Localisation | Type de Support | Type de Prêt | Statut | Date de Restitution Prévue | Réservation |
|---|---|---|---|---|---|---|
| 621.381 ATO TH 2 | BIB-Centrale / Thèses | interne | disponible |