Page de Garde

Concurrence entre recherche approximative et classification pour la recherche d'images de documents arabes dégradés

Type doc. :

Thèses / mémoires

Langue :

Français

Année de soutenance:

2010
Voir Plus

Afficher le Résumé

Dimportants fonds documentaires existent actuellement dans les bibliotheques, musees et autres institutions a caracteres pedagogiques ou sociopolitiques. Les documents historiques des civilisations anciennes et les archives nationales sont l.exemple typique de telles richesses qui representent le patrimoine, l.histoire et la dignite des nations. La conservation de ces documents et leur acces a un grand nombre est constituee aujourd.hui un besoin incontournable. Une methode de conservation consiste a les numeriser et les stocker sous format image, mais seule, la simple numerisation n.est pas suffisante pour les rendre accessibles a grand public. En effet, l.acces a ces collections necessite des strategies d.indexation et de recherche efficaces. Dans la plupart du temps, les index sont crees manuellement. Si cette approche est possible pour un petit nombre de documents, son cout et effort deviennent tres eleves pour des larges collections. L.OCR peut etre une alternative pour les documents imprimes ou les documents manuscrits avec un lexique limite. Des que les documents soient degrades et avec un lexique plus large, l.OCR devient inefficace, surtout dans le cas des documents arabes qui presentent d.autres difficultes relatives essentiellement aux traitements de l.ecriture arabe. Le travail presente dans ce memoire s.integre dans la demarche de sauvegarde et de valorisation de documents patrimoniaux dont la communaute internationale a pris conscience de l.interet. Bien que nous nous interessons aux images d.anciens documents arabes textuels, nous proposons un systeme permettant la recherche de ces documents par des requetes textuelles, sans recourir a une reconnaissance du contenu afin d.eviter le cout eleve et l.effort ardu de l.OCR. Afin d.atteindre les objectifs vises, le systeme propose regroupe plusieurs traitements issus principalement du domaine de l.analyse de documents : binarisation, segmentation, extraction de caracteristiques, codage,?¦etc. et du domaine de la recherche d.information, notamment les techniques d.arbres de suffixes et la recherche approximative.



N° Bulletin Date / Année de parution Titre N° Spécial Sommaire
Cote Localisation Type de Support Type de Prêt Statut Date de Restitution Prévue Réservation
004 KEF TH C1 BIB-Centrale / Thèses interne disponible
Kefali, A. & Sellami, M. (2010). Concurrence entre recherche approximative et classification pour la recherche d'images de documents arabes dégradés (Magister) . Annaba.