Page de Garde

Contribution à la reconnaissance des mots arabes manuscrits par le classifieur génétique K-ppv Flou

Type doc. :

Thèses / mémoires

Langue :

Français

Année de soutenance:

2009
Voir Plus

Afficher le Résumé

L'objectif de ce travail est de développer un système de reconnaissance des montants littéraux arabes. Ces dernières années, un certain nombre de documents, qui analysent le travail de reconnaissance fait sur les caractères arabes / mots, ont fait leur apparition. La reconnaissance manuscrite des mots est parmi les domaines les plus étudiés. De nombreux systèmes automatiques ont été élaborés et mis en œuvre, de nombreuses architectures ont été utilisées avec une bonne solution en terme de taux de reconnaissance. Les approches hybrides ont attiré une attention considérable des chercheurs dans la reconnaissance des formes, l'une des approches les plus populaires est l'hybridation entre la logique floue et les algorithmes génétiques (AG) qui mène à des systèmes génétiques flous (GFSs). GFSs est essentiellement un système flou augmenté par un processus d'apprentissage basé sur la (AG). Pour reconnaître un mot, un système génétique flou est mis en œuvre pour la reconnaissance des montants littéraux arabes manuscrits. Le système proposé que nous traitons se compose de cinq parties: l'acquisition de données, le prétraitement, les fonctionnalités d'extraction, la reconnaissance et la post-classification. Dans une acquisition, les données des montants littéraux manuscrits sont capturées par un scanner, après quoi des techniques de prétraitement sont utilisées pour préparer l'image des mots afin d'extraire les caractéristiques les plus pertinentes. Le stade de prétraitement commence en divisant le montant littéral arabe en mots, en se fondant sur l'analyse verticale de l'histogramme ainsi qu'un réseau de neurones qui nous permet de reconnaître si l'espace obtenu est un espace entre les mots ou entre les sous mots. Ensuite, une binarisation est effectuée sur les mots obtenus, ce qui consiste à avoir une image bimodale en niveaux de gris, puis un lissage est utilisé pour filtrer les bruits. La troisième partie de notre système est l'extraction des caractéristiques, cette partie est utilisée pour réduire le vecteur d'entrée en mesurant l'image (l'expression), en utilisant certaines propriétés ou caractéristiques de l'image (du mot). Les caractéristiques utilisées par notre système sont holistiques, qui sont ascendants, descendants, boucles, points,…etc. Ces caractéristiques sont quantitativement extraites de l'image à reconnaître. Pour la reconnaissance et le classement des mots nous utilisons le classifieur génétique K-ppv flou. L'algorithme génétique utilisé ici a deux tâches, qui sont la détermination de la forme de la fonction d'appartenance ainsi que l'idéal K pour le K-ppv. Après extraction des caractéristiques, nous utilisons le vecteur obtenu afin de le comparer à un ensemble de vecteurs de notre base de données. Le classifieur tente de correspondre ces caractéristiques à une des 48 classes. Le classifieur peut générer une liste de mots candidats, qui seront présentés à un analyseur syntaxique afin de prendre des décisions sur le mot qui satisfait aux règles grammaticales conçues pour ce problème. Idéalement, les mots utilisant les caractéristiques structurelles doivent être bien classés. Mais ce n'est pas le cas en raison des mauvaises extractions des caractéristiques et de la variabilité du scripte. Il y a toujours un certain degré de chevauchement entre les classes en fonction de l'espace Le système que nous avons utilisé est constitué d'un classifieur génétique K-ppv flou et d'un analyseur syntaxique qui à donner un excellent résultat avec un taux de reconnaissance de 95,70% L'objectif de ce travail est de développer un système de reconnaissance des montants littéraux arabes. Ces dernières années, un certain nombre de documents, qui analysent le travail de reconnaissance fait sur les caractères arabes / mots, ont fait leur apparition. La reconnaissance manuscrite des mots est parmi les domaines les plus étudiés. De nombreux systèmes automatiques ont été élaborés et mis en œuvre, de nombreuses architectures ont été utilisées avec une bonne solution en terme de taux de reconnaissance. Les approches hybrides ont attiré une attention considérable des hercheurs dans la reconnaissance des formes, l'une des approches les plus populaires est l'hybridation entre la logique floue et les algorithmes génétiques (AG) qui mène à des systèmes génétiques flous (GFSs). GFSs est essentiellement un système flou augmenté par un processus d'apprentissage basé sur la (AG). Pour reconnaître un mot, un système génétique flou est mis en œuvre pour la reconnaissance des montants littéraux arabes manuscrits. Le système proposé que nous traitons se compose de cinq parties: l'acquisition de données, le prétraitement, les fonctionnalités d'extraction, la reconnaissance et la post-classification. Dans une acquisition, les données des montants littéraux manuscrits sont capturées par un scanner, après quoi des techniques de prétraitement sont utilisées pour prépar



N° Bulletin Date / Année de parution Titre N° Spécial Sommaire
Cote Localisation Type de Support Type de Prêt Statut Date de Restitution Prévue Réservation
621.381 FAR TH C1 BIB-Centrale / Thèses interne disponible
Farah, L. & Djemil, M. (2009). Contribution à la reconnaissance des mots arabes manuscrits par le classifieur génétique K-ppv Flou (Doctorat) . Annaba.