« Numérisation et valorisation de deux millions de coupures de la presse égyptienne » (archives du CEDEJ) sur 40 ans (1970-2010).

  Hala BAYOUMI, CNRS/ CEDEJ, Egypt

Il s’agit avec la Bibliotheca Alexandrina de numériser, d’océriser (reconnaissance optique des caractères) et d’indexer 2 millions de coupures de presse issues des journaux quotidiens et hebdomadaires égyptiens dont al-Wafd, Rose al-Youssef, al-Hayat, al-Ahram, al-Masry, al-youm, et al-arabi, pour l’essentiel en arabe. Cette archive a été constituée, pendant 40 ans de 1970 à 2010, par une équipe de documentalistes du CEDEJ selon 20 domaines subdivisés en thèmes et sous-thèmes : économie ; histoire ; enseignement ; finance ; géographie ; démographie ; politique interne ; commerce ; culture ; religion ; agriculture ; politique externe ; personnalités politiques ; santé ; énergie et industrie ; travail ; loi et justice ; société ; documents généraux ; service. Elle est une source inestimable d’information sur l’Égypte. Une base de données massive (Big data) a été créée à partir de ce fonds incluant les documents numérisés, la version océrisée ainsi que les métadonnées pour décrire chaque coupure de presse (titre, auteur, thème, objet, mots clés, journal...etc.). Un outil de recherche documentaire trilingue (français, anglais, arabe) a été créé avec la plateforme http://cedej.bibalex.org/. Ce portail permet aux chercheurs comme au grand public de suivre l’évolution de la société égyptienne. L’atout principal, par rapport aux travaux similaires (Historical American Newspapers - Library of congress, Burney Newspapers Collection, Britch newspaper archive ou encore Historical Jews Pres, …etc.), est la conversion des caractères d'images (arabes) en numéros et en mots.  Pour cela, on a défini les coordonnées de chaque mot sur l'image ce qui permet aux utilisateurs une exploration dans le corps même du texte, avec la possibilité de retrouver un mot et ses dérivés et d’extraire le texte sou un format « texte ». Un deuxième atout est l’accès totalement libre au grand public.
 
Dans un souci de communication sur cette action de recherche, j’ai entrepris la réalisation en 2016 d’un film documentaire intitulé Brèves d’Égypte (20 minutes), qui retrace l’histoire des archives de presse du CEDEJ, de la constitution des coupures à l’élaboration d’un outil de recherche documentaire en passant par le transfert matériel des cartons d’archives lors des déménagements ou des turbulences politiques (2011). Ce film a fait le tour du monde dans plusieurs continents. Outre le film documentaire, une série d’expositions a permis de sensibiliser le grand public à ce genre d’outils.