LA BIBLIOTHEQUE ELECTRONIQUE DE LISIEUX

leaf.gif

une bibliothèque virtuelle, francophone et normande
un petit atelier de copiste plus soucieux d'humanité que de technicité

leaf.gif

Olivier Bogros
Médiathèque André Malraux

(fiche mise en ligne le 25.09.2005, revue le 13.07.2006)



A. OUVERTURE

Le site existe depuis juillet 1996

1.- Un réservoir numérique (« repository ») de textes du domaine public francophone élaboré principalement à partir des collections anciennes conservées par la Médiathèque André Malraux de Lisieux.

2.- C'est la partie d'un ensemble toujours à venir : site Web complet de la Médiathèque (même adresse, même serveur, même titre ???) dont on peut déjà trouver quelques éléments :

•    x Informations générales sur l'établissement
•    x Histoire du bâtiment
•    x Catalogue en ligne [http://lisieux.c3rb.fr] avec liens entre notices et textes en ligne
•    Ressources électroniques en lignes proposées aux abonnés
•    x Collections virtuelles librement accessibles
•    Expositions virtuelles
•    Service de questions réponses
•    Forums et autres blogs
    ....

B. NAISSANCE DU PROJET

1.- Prolégomènes :

•    Découverte de l'informatique en 1993
•    Informatisation de l'établissement en 1994
•    Première connexion sur des BBS et l'Internet en 1994
•    Création d'un bulletin électronique local sur disquette
•    Projet de création d'un serveur de textes et de logiciels éducatifs
•    Découverte des projets Gutenberg et ABU
•    Début de la saisie de nouvelles normandes de Maupassant et Mirbeau, Lorrain…
•    Rencontre avec Hervé Le Crosnier, bibliothécaire-enseignant créateur de la liste de diffusion Biblio-FR.

2.- Objectifs :

•    Participer à la mise à disposition sans condition de textes littéraires et documentaires du domaine public
•    Valoriser les fonds anciens et normands de la Médiathèque
•    Participer à l'enrichissement d'un Internet francophone et solidaire

C. MISE EN PRODUCTION

Les choix techniques de la bibliothèque en matière de numérisation de documents imprimés témoignent de la modestie du projet initial (ambition, moyens et financement). Toutes les étapes de l'élaboration du site sont réalisées en interne.

1.- Moyens matériels et humains :

•    Personnel : 3 personnes pour 60 heures par mois pour le choix des textes la saisie, la relecture, l’encodage et la mise en ligne.
•    Moyens informatiques (matériel et logiciels) : 2 micro-ordinateurs, 1 scanner à plat, 1 éditeur de texte, 1 logiciel de reconnaissance de caractères (Omnipage Pro 11.0), 1 logiciel de traitement d’images (IrfanView 3.97), 1 éditeur html (N|Vu 1.0)
•    Coût annuel et financement : hors heures de travail (2,5 % du total mensuel des heures de travail de l’établissement), achat du nom domaine (25 €) et location d’un espace disque sur un serveur mutualisé chez un prestataire privé (416 €).
•    Evolution 1996-2005 : évolution du matériel et des logiciels, la moitié des textes sont aujourd’hui pris en charge par l’OCR, départ à la retraite de la relectrice qui assure aujourd’hui bénévolement cette mission.

2.- Traitement des textes :

Les textes sont saisis au clavier dans un traitement de texte, ou "scannés" et "reconnus", directement à partir de l'exemplaire conservé dans les magasins ou de sa copie papier. Après vérification à l'aide d'un correcteur orthographique, et relecture ligne à ligne, les textes sont encodés en html et chargés sur le serveur qui héberge le site. Quelques règles sont appliquées pour la publication des textes numérisés :

•    La pagination de l'édition suivie n'est pas maintenue.
•    Les illustrations non reproduites dans les premières années du site, le sont maintenant presque systématiquement.
•    L'orthographe et la graphie sont conservées.
•    Les fautes typographiques et les coquilles ne sont pas modifiées.
•    Pour les textes plus anciens sont restitués les i/j, u/v, les "s" longs et résolues les abréviations.
•    Le texte est présenté, sauf rares exceptions, sur une seule page.
•    Les caractères accentués qui n’étaient pas rendus sous forme d'entités html (les navigateurs étant aujourd'hui assez permissifs sur ce point) par le premier éditeur html utilisé (HomeSite) le sont maintenant.
•    Aucune police de caractères n'est imposée, le texte se présente dans le navigateur de l'usager avec la police par défaut.
•    Les paragraphes sont justifiés (ce qui n’est pas forcément un bonne chose sachant que les navigateurs gèrent mal les espaces mous et les espaces durs) et afin de réduire la longueur de la ligne affichée qui croît à mesure de l'augmentation des résolutions d'écran, le texte est encadré par une balise tableau qui restitue, à gauche et à droite, des marges plus confortables à l'œil, mais sans doute encore insuffisantes.
•    Chaque texte est précédé d'une étiquette catalographique (étiquette reprise sous forme de métadonnées dans l'en tête du fichier html) qui dispense quelques informations sur l'œuvre numérisée, son auteur, l'édition utilisée ; le nom du copiste, celui du relecteur, la date de saisie...

D. CONTENU ET ORGANISATION

•    Au 31/12 - 2005 le site comprendra 819 textes complets de 345 auteurs identifiés ou anonymes différents et 17 albums d'images. [30.06.2006 : 887 textes et 20 albums]
•    Au 31/12 - 2005 le site est composé de 2797 fichiers dont 1640 pages html et 1157 fichiers images gif et jpeg répartis en 9 répertoires principaux et occupant 177,8 Mo sur un espace disque loué de 350 Mo.

1.- Choix des textes :

Les collections patrimoniales de la Médiathèque André Malraux de Lisieux ne sont ni importantes, ni prestigieuses : c'est le fonds moyen, d'une bibliothèque moyenne, d'une ville moyenne. Elles reflètent les goûts de lecture dans une sous-préfecture de province dans la seconde moitié du XIXe siècle. Le projet de la Bibliothèque électronique de Lisieux est de présenter un choix représentatif de la variété de ces collections, avec toutefois la liberté et le plaisir de privilégier des auteurs oubliés ou les œuvres mineures de grands écrivains.

Des contraintes externes ont conditionné le choix des œuvres :

•    Le mode de numérisation des textes en interne (saisie au clavier ou reconnaissance optique de caractères), le personnel réduit et le nombre d’heures consacrées à cette tâche, a conduit à ne sélectionner que des textes courts permettant une saisie et une mise en ligne rapide : nouvelles, brochures, tirés à part de revues, documents assez répandus dans des collections constituées principalement au XIXe siècle.
•    La disponibilité des œuvres au regard de la législation sur la durée de protection des œuvres, articles  L 123-1 nouveau, 123-8, 123-9 et 123-10 du Code de la propriété intellectuelle, ne sont retenus que des auteurs décédés depuis plus de 70 ans.
•    Éviter autant que possible de mettre en ligne des titres déjà disponibles sur d'autres serveurs, sauf si l'édition retenue est différente ou si la version existante est en mode image.

La numérisation peut permettre de remettre à la disposition et à la connaissance de tous les publics possibles des œuvres oubliées, d’auteurs laissés pour compte par les éditeurs, et pour lesquelles la numérisation sera sans doute la dernière chance d’être remis au jour plutôt que de rester ignorées, malgré un signalement au catalogue, sur les rayons des réserves de la bibliothèque. On peut affirmer, ici, avec beaucoup de provocation, que tout document qui ne serait pas jugé digne d’être numérisé ne le serait pas non plus d’être conservé en magasin.

Un des atouts de la numérisation est bien cette chance donnée à des œuvres mineures de pouvoir être mises en contexte avec les grands monuments de littérature. Voilà peut-être ce qui peut tenir lieu de charte documentaire pour la Bibliothèque électronique de Lisieux.

Le corpus de textes en ligne fait une très large place aux auteurs du XIXe siècle, une des orientations actuelles est de l'ouvrir à des œuvres des siècles antérieurs, mais aussi de donner quelques places aux œuvres rédigées dans des langues dites minoritaires (normand, wallon,…). La fiction domine aussi sur le théâtre et la poésie. La partie documentaire privilégie notamment pour le fonds local des communications issues des bulletins de sociétés savantes. Quelques textes inédits sont aussi proposés.

2.- Classement :

Le site est très schématiquement organisé en cinq grands rayons et complété par un index général des auteurs et une liste de liens vers d'autres collections numériques. Les mises à jour mensuelles (six ou huit textes) essaient de respecter un équilibre entre documents d'intérêt régional et littérature générale :

•    La sélection mensuelle (et ses archives) veut mettre en valeur un texte précis parmi les derniers numérisés. On aura donc la possibilité de lire ou de relire ou de découvrir des nouvelles de Léon Cladel, Alphonse Karr, Charles Van Lerberghe, Jean-François Renkin (choix de nouvelles présentées en version bilingue, wallonne et française), Marc de Montifaud... Cette sélection est enrichie depuis plusieurs mois d’une sous rubrique dénommée alternativement l’article ou le nanar du mois et qui sans la moindre honte redonne un peu de notoriété au fond du panier littéraire français qu’il s’agisse de Paul Liorel (« J’ai épousé ma marraine »), Georges de Porto-Riche, Ange Bénigne, Jean-Auguste Jullien dit Desboulmiers… Dernier complément récent, depuis le mois de juin 2005, [rubrique irrégulière], prenant la forme d’une mise en bouche au menu des nouveautés mensuelles, de courts textes quelquefois anonymes comme La hiérarchie des casquettes ou de la Nécessité de publier une monographie des casquettes administratives et toujours essentiels comme la chanson : C’est Tulipatan.

•    Le rayon littéraire présente pour sa part quelques écrivains à travers un ensemble de textes. On y trouvera Alphonse Allais, Charles Baudelaire, Jules Barbey d'Aurevilly, Jean Lorrain, mais aussi des auteurs plus discrets comme Jules Tellier, ou Albert Glatigny. C'est aussi dans ce rayon que sont mis en ligne quelques bibliographies et des travaux réalisés par des classes du Lycée-collège Marcel Gambier de Lisieux dans le cadre de P.A.E. et de Travaux croisés (Dumas, Zola, nouvelles sur la vie des ouvriers à Lisieux au XIXe siècle). Ce rayon n’est plus alimenté depuis plusieurs années, faute de temps.

•    Le rayon documentaire est un pot-pourri de brochures sur des sujets très divers, où quelques grands noms côtoient tous les oubliés et les égarés de l’édition: de l’Amour des livres (1866) de Jules Janin à l’Advertissement a la Royne mere du Roy. Touchant les miseres du Royaume au temps present, et de la conspiration des ennemis de sa Majeste (1562), de l’Histoire du théâtre érotique de la rue de la Santé par l'illustre Brisacier [Poulet-Malassis] (1864) au Secret de triompher des femmes et de les fixer, suivi des signes qui annoncent le penchant à l'amour (1825) par Louis de Saint-Ange.

•    Le rayon normand présente des brochures d'intérêt local (entendu au sens des deux Normandie) concernant l’agriculture, l’industrie, la culture ou l'histoire comme le Petit traité de prosodie normande (1826) d’Eustache La Quérière, ou bien une Notice historique sur la Chapelle Notre-Dame-de-Grâce de Honfleur (1865) par Claudius Lavergne, complétée par la réimpression d’une rarissime brochure sur Les effets merveilleux de Notre-Dame-de-Grâce (1615), mais aussi un Hymne à la cloche (1832) d’Eugène-Hyacinthe Langlois. C’est dans ce rayon qu’on trouvera aussi quelques littérateurs normands dont la notoriété n’a jamais dépassé les frontières de la province : Georges Dubosc (1854-1927), Louis Gouget (1817-1915), ou encore Charles Lemaître (1854-1928), employé d’octroi et chansonnier patoisant.

•   Une galerie d’images a été ouverte en novembre 2004. C’est un pêle-mêle d'images des collections iconographiques de la Médiathèque, la mise à jour en est épisodique. Des albums d’images à feuilleter : on peut y voir là, la partie « récréative » du site par ailleurs plutôt austère dans sa mise en page qui rappelle les meilleurs moments du style « hard-discount d'Europe de l'Est ». Là encore l’accent est mis sur des images futiles et anodines et non sur les « trésors » de l’établissement (il est vrai qu’il y en a peu !).

E. ASPECT SCIENTIFIQUE

La Bibliothèque électronique de Lisieux n'a d'autre ambition que d'être un simple réservoir d'œuvres littéraires et documentaires du domaine public français dans lequel chacun viendra faire son miel. Il s'agit d'une approche très minimaliste des bibliothèques numériques : les textes numérisés sont d'abord des supports de substitution permettant de faire connaître et de diffuser une partie des collections de l'établissement. Il n'y a dans ce projet, local, aucune ambition d'édition scientifique : pas d'encodage enrichi du texte (xml, sgml), juste un balisage de structure (chapitre, paragraphe) et de forme (gras, italique) et non un balisage de sens (thèmes, arguments). C'est dire que la valeur ajoutée des textes numériques produits à Lisieux est réduite au minimum au regard de la linguistique statistique, de l'analyse sémantique, de l'analyse morpho-syntaxique.

D'un point de vue bibliothéconomique des métadonnées sommaires mais qui respectent le schéma Dublin Core ont été inscrites dans l'en-tête de chaque texte en ligne depuis l'année 2001. Il conviendrait maintenant de s'incrire dans le protocole OAI permettant l'échange des métadonnées afin de donner plus de visibilité aux collections en ligne à Lisieux.

Par ailleurs le site ne comprend aucun des attributs généralement décrits dans les discours prescripteurs sur ce que devraient être les collections numériques en bibliothèque : moteur de recherche interne, notes hypertextuelles reliant les textes, lexique, chronologie, parcours pédagogiques... Pour dire les choses de manière savante il n'y a pas là de « recontextualisation, historique et polyphonique des textes qui tient compte des conditions de production propres à une époque donnée ».

Un site n'est jamais isolé sur le réseau. Depuis septembre 2000, les textes disponibles en lecture sur la Bibliothèque électronique de Lisieux sont interrogeables en simultané dans les bases Lexotor (textes lexoviens indexés à l'Université de Toronto) à l'initiative de Russon Wooldridge, et de la même manière des requêtes peuvent être faites à partir d’un formulaire Google accessible sur la page d’accueil du site. Ces connexions internet et intertextuelles, issues d'un travail collaboratif (Lexotor) ou simplement fortuites (Google), comme aussi bien les textes empruntés anonymement, le plus souvent, et réincorporés dans des corpus thématiques sur d'autres sites, enrichissent le travail de base effectué à Lisieux. La question qui se pose aujourd'hui pour la Bibliothèque électronique de Lisieux, après bientôt dix années d'existence, est la suivante : comment faire réseau sur le réseau, quels partenariats envisager ? Une première réponse est donnée avec la création en septembre 2004 de Normannia, une bibliothèque numérique normande, par le Centre Régional des Lettres de Basse-Normandie en collaboration avec les bibliothèques publiques et universitaires de la région.

F. FREQUENTATION ET USAGES

1.- Quelques données statistiques : [voir en annexe des données plus récentes]

En valeurs moyennes mensuelles la fréquentation du site en 2005 est la suivante :

•    Visiteurs : 79.968
•    Pages vues : 173.307
•    Pages vues par visiteur : 2,17
•    Durée des visites : 196 s.
•    Transfert de données : 10 Go

Ces données brutes mériteraient d’être analysées plus finement. Nous avons essayé de conduire ce travail en 2003 dans un numéro du Bulletin des Bibliothèques de France consacré aux Services à distance (BBF 2003 - T. 48, n°4) et dans une communication faite au colloque « Mesure de l’Internet » (Nice, mai 2003). En privilégiant notamment l’indicateur durée des visites nous arrivions alors à la conclusion que le site était fréquenté mensuellement par environ 12.000 internautes pertinents sur les 61.947 totalisés au cours du mois d’avril 2003. Tout laisse présager de la persistance et de la pertinence de cette analyse déjà ancienne.

2.- Usages :

Sur les usages de la Bibliothèque électronique de Lisieux il convient de rester modeste. On devine que les usages des bibliothèques numériques peuvent être multiples : de l’amateur curieux se promenant dans les rayons virtuels de la bibliothèque à l’internaute pressé qui procède via les moteurs à une exploitation ciblée de l’information.

Pensons plutôt comme à un usage rêvé à la lecture tout simplement, la lecture plaisir et curieuse qui naît de la découverte de textes oubliés et rares. Ce que nous voulons affirmer c’est que les bibliothèques même sur l'Internet restent des pourvoyeuses de textes

On peut voir la Bibliothèque électronique de Lisieux comme une échoppe de bouquiniste où l’on trouve des textes que l'on ne chercherait peut-être pas mais que l'on regretterait de ne pas connaitre. Il faut de la place sur le web à la fois pour le chercheur et pour le curieux. Le premier sait ce qu'il cherche, le second ne sait pas ce qu'il va trouver. Préserver cette dualité paraît important... En ce sens, la Bibliothèque électronique de Lisieux se veut un excitant : elle aiguillonne les curiosités et elle amène à voir ce que beaucoup ne voient pas en temps normal : les auteurs « oubliés et égarés », les anonymes, les brochures défraîchies sur des sujets invraisemblables.

Dans ce moment où beaucoup d’usagers font de l’Internet le lieu unique de leur recherche d’informations, la mise en ligne de documents patrimoniaux peut être le moyen d’une redécouverte et d’un retour vers les bibliothèques et leurs richesses.

G. RIDEAU

L'objectif avoué était de participer à l'animation du web littéraire et documentaire francophone : il s'agit moins ici de construire une bibliothèque numérique pour demain, que de rendre disponible maintenant et pour les internautes d'aujourd'hui un ensemble cohérent et thématique de textes, correctement établis, du domaine public, avec quelque prétention à faire en mode mineur des propositions de lecture.

Le site témoigne aussi de ce qui peut être proposé en matière de diffusion libre du patrimoine écrit par de petits établissements. Il ne s’agit pas d’un modèle mais d’une alternative tout au plus, qui montre que c’est aussi par le détour qu’on parvient à l’accès. Un petit atelier de copiste plus soucieux d'humanité que de technicité.



ANNEXE
(mise à jour le 15.VI.2006)


STATISTIQUES BMLISIEUX.COM
Période :   01/05/2005 - 31/05/2006
(logiciel Urchin 5)


Résumé :

Total de visiteurs                1.613.942
Total d'accès pages            3.560.442
Nombre moyen de visiteurs par jour        4.075,61
Nombre moyen d'accès pages par jour    8.991,02
Nombre moyen d'accès pages par visiteur    2,21
Durée moyenne des visites                           4’24

Durée des visites :

0-10  sec                    1.324.254
11-30 sec                   48.724
31-60 sec                   34.385
1-3   min                     52.878
3-10  min                    58.241
10-30 min                   67.476
30+   min                    27.984

Profondeur des visites :

1 pages                      1.300.625
2 pages                      170.391
3 pages                      48.634
4 pages                      25.407
5 pages                      13.301
6 pages                      9.670
7 pages                      6.448
8 pages                      5.173
9 pages                      3.632
10 pages                    3.201
11 pages                    2.496
12 pages                    2.224
13 pages                    1.816
14 pages                    2.147
15 pages                    2.237
16 pages                    1.665
17 pages                    1.224
18 pages                    1.109
19 pages                    959
20 pages et +             11.583


retour
table des auteurs et des anonymes