OPAC

Concurrence entre recherche approximative et classification pour la recherche d'images de documents arabes dégradés

Type doc. :

Thèses / mémoires

Langue :

Français

Auteur(s) :

Kefali; Abderrahmane
Sellami, Mokhtar

Année de soutenance:

2010

Sujet(s):

Analyse de document
recherche de document
reconnaissance de l'écriture arabe
documents arabes anciens
recherche approximative

Voir Plus

Afficher le Résumé

Dimportants fonds documentaires existent actuellement dans les bibliotheques, musees et autres institutions a caracteres pedagogiques ou sociopolitiques. Les documents historiques des civilisations anciennes et les archives nationales sont l.exemple typique de telles richesses qui representent le patrimoine, l.histoire et la dignite des nations. La conservation de ces documents et leur acces a un grand nombre est constituee aujourd.hui un besoin incontournable. Une methode de conservation consiste a les numeriser et les stocker sous format image, mais seule, la simple numerisation n.est pas suffisante pour les rendre accessibles a grand public. En effet, l.acces a ces collections necessite des strategies d.indexation et de recherche efficaces. Dans la plupart du temps, les index sont crees manuellement. Si cette approche est possible pour un petit nombre de documents, son cout et effort deviennent tres eleves pour des larges collections. L.OCR peut etre une alternative pour les documents imprimes ou les documents manuscrits avec un lexique limite. Des que les documents soient degrades et avec un lexique plus large, l.OCR devient inefficace, surtout dans le cas des documents arabes qui presentent d.autres difficultes relatives essentiellement aux traitements de l.ecriture arabe. Le travail presente dans ce memoire s.integre dans la demarche de sauvegarde et de valorisation de documents patrimoniaux dont la communaute internationale a pris conscience de l.interet. Bien que nous nous interessons aux images d.anciens documents arabes textuels, nous proposons un systeme permettant la recherche de ces documents par des requetes textuelles, sans recourir a une reconnaissance du contenu afin d.eviter le cout eleve et l.effort ardu de l.OCR. Afin d.atteindre les objectifs vises, le systeme propose regroupe plusieurs traitements issus principalement du domaine de l.analyse de documents : binarisation, segmentation, extraction de caracteristiques, codage,?¦etc. et du domaine de la recherche d.information, notamment les techniques d.arbres de suffixes et la recherche approximative.

Exemplaire(s)
Citation APA

N° Bulletin	Date / Année de parution	Titre N° Spécial	Sommaire

Cote	Localisation	Type de Support	Type de Prêt	Statut	Date de Restitution Prévue	Réservation
004 KEF TH C1	BIB-Centrale / Thèses		interne	disponible

Kefali, A. & Sellami, M. (2010). Concurrence entre recherche approximative et classification pour la recherche d'images de documents arabes dégradés (Magister) . Annaba.

Détails Document

Concurrence entre recherche approximative et classification pour la recherche d'images de documents arabes dégradés

BIB-Centrale