De l'autre côté du miroir : usages de Translatio.

 

par Émilie Lamy


Sommaire

Introduction


1. Production et diffusion de ressources "littéraires" en ligne à l'École normale supérieure (Paris)

2. Usages de Translatio vus à travers ses access_log (octobre 2001-avril 2002)

Conclusion

Notes

Annexe : Contenu des répertoires cités :

Annexe : Ressources textuelles du site de Russon Wooldridge consacré aux dictionnaires anciens

Liste des tableaux et carte

 

 


 


 

Introduction :
l'imprimé ne connaît pas son lectorat. L'Internet nous offre les moyens, uniques, grâce à la mémoire des serveurs, d'appréhender de manière stable certaines modalités matérielles
(lieu, temps, action) de la réception des contenus en ligne.


Malgré l'existence de plusieurs rapports consacrés aux pratiques et à la diffusion des technologies d'information et de communication dans l'enseignement supérieur, chez les étudiants, chercheurs ou documentalistes [*] , on peut déplorer l'absence d'études plus importantes consacrées à ces usages, incluant notamment les activités de publication en ligne, de diffusion de ressources ou de travaux universitaires. Si ces rapports insistent de fait sur des usages de consultation plutôt que de production, c'est bel et bien parce que ceux-ci apparaissent minoritaires par rapport à ceux-là.
Il m'a semblé utile dans cette perspective générale, de proposer une contribution qui tâche de rendre compte conjointement de ces deux aspects : celui de la publication à travers le site miroir Translatio, et, à travers les statistiques d'accès à Translatio, celui de la consultation de ce site. Ce dernier aspect sera ici encore le mieux développé : nous avons une chance unique en effet, en tant que gestionnaires ou créateurs de sites, d'avoir accès de manière plus ou moins médiate, à notre lectorat. Une fois levés un certain nombre de problèmes méthodologiques liés à l'analyse des access_log, il nous est donné de voir, et peut-être jusqu'à un certain point de comprendre --enfin !-- les intérêts et pratiques de nos lecteurs. De comprendre, enfin, qui nous lit, fût-ce dans l'anonymat --ô combien précieux-- des traces laissées par des machines.

 

1. Production et diffusion de ressources "littéraires" en ligne à l'École normale supérieure (Paris)

J'avais dans l'idée de proposer un panorama des ressources en ligne émanant des départements littéraires de l'ENS, destiné à mieux comprendre le contexte de publication de Translatio dans ce cadre institutionnel. Ce panorama sera nécessairement bref au vu de la relative pauvreté desdites ressources. Pauvreté sur laquelle il serait inutile de s'apesantir dans la perspective de ce colloque. Je parlerai donc des ressources existantes et non des éventuels projets institutionnels ou individuels de publication en ligne -- qui à ma connaissance sont peu nombreux [1] . Je parlerai donc essentiellement du site Translatio.

1.1 Panorama des politiques et pratiques des TIC dans les départements littéraires de l'ENS

1.1.1 Absence d'intérêt des départements littéraires pour la diffusion de ressources en ligne : des plaquettes.

Les sites Web des départements littéraires de l'ENS constituent pour la plupart des plaquettes et comportent par là-même assez peu de pages. Cette conception de la publication en ligne peut être comparée à celle qu'illustrent aussi la plupart des sites universitaires. Leur relative pauvreté documentaire a déjà été soulignée par divers rapports consacrés aux usages des NTIC dans l'enseignement supérieur [2] .

1.1.2 Les ressources effectivement en ligne [2]

Deux sites "littéraires" diffusent des ressources électroniques à proprement parler : Clio, site consacré à l'histoire sociale, et Translatio, miroir de trois sites consacrés à la langue et à la littérature françaises. Tous deux font partie du serveur Barthes de l'Informatique littéraire, reconvertie en équipe Réseaux, Savoirs et Territoires. Clio bénéficie depuis un an du soutien du Ministère de la Recherche. Il s'agit d'une revue complète comprenant sources primaires et secondaires, comptes rendus d'ouvrages, de séminaires, bases de données bibliographiques etc. Barthes même propose quelques logiciels d'analyse textuelle et statistique, des ressources cartographiques et des sources secondaires parmi lesquelles communications, index d'ouvrages, résumés ou rapports d'études. Translatio sera évoqué par la suite.

1.1.3. Production et consultation de ressources en ligne à l'ENS : deux types d'usages à distinguer

D'un point de vue institutionnel, interne à l'ENS, la production et la diffusion de ressources documentaires en ligne sont donc loin d'être développées, ni même systématiquement encouragées.
Ce n'est pas à dire, pourtant, que les usages des technologies d'information et de communication dans leur ensemble ne soient pas répandus chez les littéraires de l'ENS. Il convient en effet d'insister sur ce point : les usages réels des normaliens, enseignants-chercheurs et élèves, demeurent difficiles à percevoir. Il n'est pas dit qu'ils se confondent avec des pratiques institutionnelles. il n'est pas dit non plus qu'ils doivent être mesurés en termes de production plutôt qu'en termes de "consommation". L'équipement informatique mis à la disposition des normaliens est du reste largement favorable au développement des pratiques, pour le moins de consultation du Web. En outre, contrairement à la réalité de bon nombre d'universités françaises, les étudiants peuvent bénéficier d'enseignements techniques de base, liés à la recherche documentaire (dans le cadre de la bibliothèque) ou au maniement de logiciels, parfois plus avancés (informatique littéraire, cartographie etc.).

1.2 Caractéristiques du site miroir Translatio.

1.2.1 Présentation

Je ne reviendrai pas sur l'historique du site, dont on pourra retrouver les principaux traits en ligne.
Créé en septembre 2001, Translatio est le miroir de trois sites principaux consacrés à la langue et à la littérature françaises : les deux sites torontois de Russon Wooldridge (Net des Études françaises et son site hébergé à l'Université de Toronto) et le site clermonto-torontois de Jacques-Philippe Saint-Gérand (Langue du XIXe siècle). Ces trois sites eux-mêmes sont le fruit de collaborations éditoriales multiples dont la principale est certainement assurée par Olivier Bogros et la Bibliothèque électronique de Lisieux. On pourrait encore citer les liens qui unissent le NEF et le site français Epistémon, anciennement poitevin et aujourd'hui tourangeau, publié sous la responsabilité de Marie-Luce Demonet.
Translatio ne fait donc que matérialiser (ou dématérialiser) un réseau de collaborations : non pas sous la forme d'un cercle clos, mais comme un espace de partage résolument ouvert.

1.2.2 Des objectifs de diffusion et de valorisation

Translatio en tant que miroir relève plus d'une politique de diffusion que de production à proprement parler, puisqu'hormis une page d'accueil proposant un index analytique des contenus mirorisés, la production des ressources s'est faite et se fait majoritairement de l'autre côté du miroir (de l'Atlantique ou du périphérique).

Les objectifs de cette mirorisation peuvent être rappelés, qui consistaient à :

Concernant les deux derniers points, les attentes consistaient à toucher un public globalement universitaire, mais aussi les acteurs de l'enseignement secondaire (NEF), et un public majoritairement européen : les Canadiens n'avaient pas de raison de consulter le miroir outre-Atlantique plus que l'original à Toronto. En revanche, certains pays européens pourraient bénéficier de la proximité du miroir, en termes de vitesse de connexion.

Un premier bilan peut aujourd'hui être tenté quant à la réalisation de ces objectifs, grâce à une analyse des statistiques d'accès au serveur. Ce sont les résultats de cette analyse que je souhaiterais présenter. Ce faisant, certains usages de consultation mériteront d'être soulignés.

 

2. Usages de Translatio vus à travers ses access_log (octobre 2001-avril 2002) [3]


2.1 Analyses globales des consultations

2.1.1 Quelques problèmes méthodologiques

Sans prétendre développer complètement ce point, il convient de rappeler certaines des précautions nécessaires à une bonne lecture des statistiques d'accès. Que l'on choisisse en effet d'avoir recours à un outil d'analyse, comme Webalizer ou d'autres, ou d'analyser directement les fichiers d'accès à l'aide de programmes ad hoc, il demeure impossible d'avoir une vision exhaustive et totalement transparente de ces données censées refléter "la" réalité des usages.

Quelques exemples suffiront à illustrer ce point :

2.1.2 Statistiques globales sur sept mois (octobre 2001-avril 2002) : des usagers et des moteurs.

2.1.2.1 Statistiques brutes (Webalizer)
Elles tiennent compte à la fois des moteurs de recherche, des fichiers images, et ne prennent pas en compte le phénomène des caches. Les données sont présentées dans le tableau 1 :


Mois
Sites Nb-accès Visites Nb-fichiers
consultés
Octobre 885 71117 1835 40769
Novembre 1554 79966 2663 34450
Décembre 2757 93409 4388 65582
Janvier 4296 83876 6550 63752
Février 3332 31185 4430 24637
Mars 4360 41362 6635 35452
Avril 5103 53790 7202 41728
TOTAL 22287 454705 33703 306370
MOY/mois 3184 64958 4815 43767

Tableau 1. Statistiques brutes par mois.

Pour information, les "visites" correspondent à des plages horaires de 20 minutes par numéro IP. Pour un même numéro IP, tous les accès compris dans ces 20 minutes font partie de la même visite. Si la machine se reconnecte passé ce délai, cette connexion sera comptabilisée au titre d'une nouvelle visite effectuée par elle. Les autres critères ne posent pas de difficulté.
Les données du tableau 1 indiquent, telles quelles, une chute importante du nombre d'accès à partir du mois de janvier. Les statistiques raisonnées que nous présentons ci-dessous tendent à en remettre en cause la pertinence des mesures intégrant les moteurs de recherche (et les fichiers images).

2.1.2.2 Statistiques raisonnées
On a évacué les fichiers images ainsi que, dans la mesure du possible, les accès dus aux moteurs de recherche. On obtient dès lors de tout autres résultats, présentés dans le tableau 2. Pour plus de commodité, on se limitera aux seuls accès par mois :

Mois
Nb-accès avec moteurs Nb-accès sans moteurs
ni fichiers images
Octobre 71117 9421
Novembre 79966 7473
Decembre 93409 10526
Janvier 83876 18882
Fevrier 31185 12560
Mars 41362 16725
Avril 53790 17041
Totaux 454705 92628

Tableau 2. Comparaison des statistiques brutes et des statistiques épurées
.

Sans grande surprise, le nombre d'accès est presque cinq fois moins important lorqu'on élimine les moteurs de recherche et les fichiers images.
Reste qu'ainsi, l'analyse peut se situer de manière plus assurée du côté des utilisateurs réels, au lieu de noyer ces derniers dans une masse d'accès mécaniques.

Si l'on considère plus attentivement l'évolution des accès par mois, on verra qu'elle diffère des statistiques brutes analysées par Webalizer. Le biais engendré par la prise en compte des moteurs de recherche apparaît très clairement. On s'aperçoit en effet que les accès augmentent jusqu'en décembre dans un cas, alors que les statistiques épurées indiquent une diminution en novembre : tendance inverse donc.
Inversement, la proportion d'accès bruts décroît à partir de décembre, alors qu'elle augmente nettement du côté des utilisateurs réels (le nombre d'accès passe grosso modo de 10 000 à 20 000). Enfin, hormis la décrue du mois de février (mois court et mois de vacances !), le nombre d'accès hors moteurs et images affiche une tendance relativement stable, et même en hausse.

Avec une moyenne minimale (n'oublions pas les caches) de 13 233 accès "réels" par mois (soit environ 450 par jour et 160 000 par an), Translatio est donc en bonne place par rapport à la moyenne des sites d'érudition universitaire français (à titre d'exemple, Clio, le "grand frère" de Translatio, créé en 1997, compte deux fois moins d'accès moteurs intégrés). En outre, l'augmentation du nombre d'accès est de bon augure.
Enfin, il semble qu'on puisse d'ores et déjà caractériser leur évolution au fil des mois en fonction des périodes académiques françaises : décrue en novembre (vacances de la Toussaint), décrue en février (vacances d'hiver). Seule la croissance du mois d'avril (vacances de Pâques) fait exception à cette règle, bien que l'on puisse toujours gager qu'elle aurait été encore plus forte en une période sans congés ! J'aurai à revenir sur ces usages universitaires.

2.1.3 Localisation des consultations

L'analyse des access_log nous permet de mettre à l'épreuve notre objectif de diffusion en Europe, en France notamment. Au-delà des difficultés méthodologiques de localisation évoquées précédemment, on peut analyser les données "explicites" de manière relativement fiable (toujours à partir des statistiques hors moteurs de recherche).

Le tableau 3 indique le nombre d'accès pour les 20 premiers "pays" connus :

20 premiers "pays" Nb-ccès hors moteurs
France 45321
Autriche 24673
.com 9868
.net 7437
Canada 3387
Japon 1988
Belgique 1296
Suisse 579
Espagne 479
Italie 303
Allemagne 262
.org 249
.edu 238
Danemark 176
Royaume-Uni 147
Pays-Bas 146
Brésil 137
Russie 124
Hongrie 107
Portugal 106

Tableau 3. Nombre d'accès (hors moteurs) pour les vingt premiers "pays".

Le Canada apparaît en bonne place, ainsi que les .com ou .net, difficiles à localiser.

Cela étant, si l'on prend en compte la totalité des accès localisables (toujours hors moteurs) et non plus seulement les 20 premiers rangs, la proportion des pays européens s'élève à 59%, celle de l'Asie et de l'Amérique, à 5%.

On pourra visualiser la répartition des accès en Europe et dans le Bassin Méditerranéen sur la carte suivante : [4]

De manière intéressante, les pays francophones sont bien représentés, mais n'ont pas l'exclusivité des accès. Dans la mesure où le lectorat est censé compter une majorité de spécialistes universitaires, ce fait n'est pas pour nous étonner outre mesure. Le cas le plus frappant est néanmoins celui de l'Autriche, à près de 25 000 accès en sept mois (3572 par mois). L'analyse des machines autrichiennes connectées fait apparaître l'importance d'un fournisseur d'accès local et donc, d'une consultation à domicile.
Si l'on rapporte ces données au nombre d'habitants par pays, comme l'indiquent les couleurs de la carte, ce phénomène apparaît encore plus évident. La présence de la francophonie est plus marquée encore. Enfin, un pays comme la Hongrie apparaît extrêmement représenté.

Pour conclure sur le bilan des localisations, on peut donc dire que l'objectif européen du miroir Translatio a été atteint. Bien plus, la localisation des accès européens fait apparaître une forme de "poussée vers l'Est" relativement inattendue, de la France vers la Hongrie. [5]

2.1.4 Consultations universitaires

En matière de consultation universitaire, il m'a semblé intéressant d'aller voir ce qui se passait pour la France, dans la perspective qui est la mienne ici : à savoir celle d'un éclairage particulier sur les usages des TIC dans l'enseignement supérieur.

Les universités françaises représentent 1511 accès àTranslatio. Par rapport au nombre d'accès en France (45 321 hors moteurs), cela représente une proportion de 3,3%. Ce qui peut sembler faible. Cela étant, ce constat doit, semble-t-il, être nuancé par l'impressionnante proportion de consultations à domicile (environ 76%), relevant de fournisseurs d'accès locaux (comme on l'a déjà vu dans le cas de l'Autriche). On peut aisément penser qu'un bon nombre d'étudiants, enseignants, chercheurs, documentalistes, sont responsables de ces accès.
Le tableau 4 comprend les principaux fournisseurs d'accès français (.net compris) :

Nb-accès Fournisseur
29779 wanadoo.fr
1072 club-internet.fr
1053 noos.net
778 libertysurf.net
443 noos.fr
318 9tel.net
282 tiscali.fr
233 free.fr
209 worldonline.fr
171 oleane.net
120 oleane.fr
107 easynet.fr
84 libertysurf.fr
55 freesurf.fr
34704 TOTAL

Tableau 4. Principaux fournisseurs français responsables des accès de
Translatio.

Ces résultats nous amènent à souligner une nouvelle fois le problème posé par les caches de la plupart des fournisseurs d'accès : les fichiers étant stockés dans une mémoire locale de leur serveur, c'est donc ce serveur qui sera sollicité à chaque fois qu'une machine du réseau local demandera les mêmes fichiers. Du côté de Translatio donc, ce phénomène voudrait que toutes les statistiques soient revues à la hausse, dans la mesure où nous ne pouvons avoir de traces des consultations occultées par les caches, qui sont potentiellement très nombreuses comme on l'a déjà suggéré.

Le cas de l'École normale supérieure (Paris). Précisons une fois encore que dans ces statistiques comme dans l'ensemble des décomptes "raisonnés" précédents, les accès provenant du serveur barthes.ens.fr n'ont pas été comptabilisés.
Or, malgré cette précaution méthodologique propre à faire drastiquement baisser le nombre d'accès, l'ENS apparaît en quinzième position dans le classement général des noms de domaines ayant accédé à Translatio ; en cinquième position parmi les noms de domaine spécifiquement français. Avec 997 accès, l'ENS représente à elle seule 2,2% des accès français contre une proportion de 3,3% pour l'ensemble des universités françaises.
On peut donc reprendre notre remarque précédente concernant la distinction entre production en ligne et consultation : les statistiques d'accès à Translatio l'illustrent de manière éloquente. Alors que personne à l'ENS n'a jamais fait ouvertement preuve à ses responsables (Éric Guichard et moi-même) d'un quelconque intérêt pour ce site, tout concourt à prouver qu'ils ne le consultaient pas moins, dans l'intimité de leur recherche.

Au sein de l'ENS, tout se passe donc, finalement, comme si la publication de Translatio était un succès, en cela qu'elle répondrait à un véritable besoin. Nous sommes bien sûr heureux de le constater après bientôt huit mois de silence institutionnel...

2.2 Contenu des consultations (hors moteurs de recherche et fichiers images)

Pour essayer de donner un aperçu plus concret encore des usages de Translatio, on pourra analyser les statistiques d'accès en fonction du contenu des trois sites mirorisés. Non pas dans le but, pour leurs auteurs, de mieux cibler ou "accrocher" leur clientèle, selon l'usage traditionnel que les sites commerciaux font de telles analyses, mais avec pour visée, plus immatérielle, de mieux comprendre les pratiques de consultation et de documentation de leurs lecteurs.

2.2.1 Statistiques globales pour les trois sites mirorisés

Le tableau 5 indique le nombre total d'accès pour chacune des parties de Translatio (hors moteurs de recherche et fichiers images non pris en compte) :

Site
nb-accès tx-accès
Index Translatio 4512 5%
NEF 11492 12%
R. Wooldridge 54948 59%
Langue XIX 21676 23%
TOTAL 92628 100%

Tableau 5. Nombre d'accès pour les trois sites mirorisés.

Ces proportions correspondent grosso modo à la "taille" respective de chaque site en nombre d'octets (fichiers images exclus), bien que quelques écarts doivent être soulignés.

Seul le site Langue du XIXe siècle présente une rigoureuse uniformité : 23% de Translatio, 23% d'accès à Translatio.

2.2.2 Proportion des répertoires dans les consultations

Plus instructive encore peut-être dans la perpective d'un étude du contenu : l'analyse des consultations par répertoire constitutif de chaque site. Dans les tableaux suivants, la proportion des accès est comparée à celle de la taille des répertoires (en nombre de fichiers, hors fichiers images, et toujours hors moteurs de recherche).

2.2.2.1 Langue du XIXe siècle

C'est la partie du miroir la plus difficile à analyser, en ce que l'architecture hypertextuelle complexe du site de Jacques-Philippe Saint-Gérand, envisagée sous la forme d'un fichier informatique de base, se présente comme un liste non hiérarchisée de répertoires (85 en tout), rendant tout regroupement délicat. On présentera donc ici tout d'abord les plus consultés de ces répertoires (sur 7 mois) (tableau 6), dont le contenu est détaillé en annexe :

Répertoires nb-accès tx-accès
gdu 2645 12%
dg 1779 8%
hlfXIX 1314 6%
nodier 1245 6%
numlarou 702 3%
racine du site 612 3%
gramacor 582 3%
musique 581 3%
rhet 537 2%
chervel 520 2%
lexotor 492 2%
corinne 475 2%
igstyl 450 2%
rep_bib 434 2%
boiste 385 2%
littre 372 2%
urbana 367 2%
peignot 350 2%
... ... ...
TOTAL 21676 100%

Tableau 6. Répertoires les plus consultés du site
Langue du XIXe siècle.

Je ne me risquerai pas à un commentaire qui reviendrait de droit à Jacques-Philippe Saint-Gérand, et me contenterai de quelques remarques : les dictionnaires sont à l'évidence bien placés (bien que l'on puisse a priori s'étonner de l'absence du Godefroy). Cela étant, au vu du nombre de répertoires à prendre en compte dans les statistiques, les taux d'accès s'avèrent rapidement insignifiants. J'ai donc pris le parti de proposer un indicateur qui puisse rendre compte des caractéristiques des consultations de manière plus adaptée : il prend en compte la taille des répertoires en nombre de fichiers. Je propose de l'appeler indicateur de pleine lecture (on verra pourquoi par la suite). Confronté au nombre d'accès, il donne un aperçu semble-t-il plus juste des répertoires les plus consultés (Tableau 7) :

Répertoires consultés pleinement
Répertoire
nb-accès tx-accès tx-fichiers nb-fichiers IPL
peignot 350 2% 0% 1 9,04
gen_pals 283 1% 0% 1 7,31
lacurne 199 1% 0% 1 5,14
onomastique 196 1% 0% 1 5,06
turgot_ety 166 1% 0% 1 4,29
landais 271 1% 0% 2 3,50
mercier 123 1% 0% 1 3,18
lafaye 122 1% 0% 1 3,15
godefroy 236 1% 0% 2 3,05
firmin 114 1% 0% 1 2,95
dalembert 99 0% 0% 1 2,56
besch 98 0% 0% 1 2,53
littre 372 2% 1% 4 2,40
guerin 91 0% 0% 1 2,35
dg 1779 8% 4% 20 2,30
mesanger 86 0% 0% 1 2,22
rhet 537 2% 1% 7 1,98
Racine du site 612 3% 1% 8 1,98
Répertoires non consultés pleinement
(parmi les plus consultés en nombre brut d'accès).
Répertoire
nb-accès tx-accès tx-fichiers nb-fichiers IPL
urbana 367 2% 1% 8 1,19
igstyl 450 2% 2% 10 1,16
numlarou 702 3% 3% 16 1,13
hlfXIX 1314 6% 7% 38 0,89
nodier 1245 6% 7% 37 0,87
chervel 520 2% 3% 16 0,84
gramacor 582 3% 3% 18 0,84
corinne 475 2% 3% 16 0,77
boiste 385 2% 2% 13 0,77
lexotor 492 2% 3% 18 0,71
rep_bib 434 2% 3% 16 0,70
gdu 2645 12% 22% 123 0,56
musique 581 3% 6% 31 0,48


Tableau 7. Répertoires très consultés et répertoires moins consultés du site
Langue du XIXe siècle.


Hormis le répertoire dg (qui correspond essentiellement au Traité de la formation de la langue inclus dans le Dictionnaire général ), les dictionnaires apparaissent relativement moins consultés. En revanche, notre indicateur de pleine lecture a permis de faire apparaître le Godefroy qui, bien que ne représentant que deux fichiers, est responsable d'un nombre d'accès relativement élevé.

De façon plus fine, on pourra proposer d'effectuer des regroupements de répertoires : ainsi, il paraît instructif de considérer les sources primaires et les sources secondaires :

Sources
nb-accès tx-accès tx-fichiers fichiers IPL
total-primaires 15232 70% 76% 424 0,92
total-articles 6444 30% 24% 136 1,25
TOTAL Langue XIX 21676 100% 100% 560  

Tableau 8. Sources primaires et sources secondaires dans
Langue du XIXe siècle.

On remarque de fait peu de différences entre les deux types de sources distingués lorsqu'on tient compte de l'indicateur de pleine lecture. Les articles semblent un peu plus pleinement consultés que les sources primaires. De façon générale, on retrouve dans ces résultats l'équilibre remarqué précédemment à propos du site Langue du XIXe siècle (peu de différences entre la proportion des accès et la taille des répertoires).

2.2.2.2 Le site T. Russon Wooldridge

Ressources consultées : essai de classement
Le tableau suivant indique les répertoires les plus consultés du site de Russon Wooldridge consacré à la lexicographie :

Répertoires
nb-accès tx-accès
academie 12647 23%
articles 8657 16%
naf 6462 12%
edicta 6133 11%
rentexte 6088 11%
siehlda 3131 6%
vitruve 2963 5%
tiden 2521 5%
nicot 2158 4%
vegetaux 1396 3%
articles2 952 2%
marine 1193 2%
rendicotexte 100 0%
interdico 175 0%
TOTAL-RW(hors index) 54576 100%

Tableau 9. Accès aux différents répertoires du site de
Russon Wooldridge.

S'il n'est pas étonnant de constater le succès des bases dictionnairique et textuelles, on pourra remarquer l'importance de la consultation des articles consacrés aux dictionnaires. En cela, Translatio diffère de son "grand frère" Clio, où les sources secondaires apparaissent moins consultées que les sources primaires et les ressources bibliographiques. Néanmoins, ces résultats peuvent et doivent être pondérés (tableau 10) :

Répertoires
nb-accès tx-accès tx-fichiers nb-fichiers IPL
interdico 175 0% 0% 1 9,26
tiden 2521 5% 1% 27 4,94
vegetaux 1396 3% 1% 15 4,92
rendicotexte 100 0% 0% 2 2,65
marine 1193 2% 1% 29 2,18
rentexte 6088 11% 5% 152 2,12
vitruve 2963 5% 3% 100 1,57
articles 8657 16% 12% 341 1,34
nicot 2158 4% 3% 96 1,19
edicta 6133 11% 11% 307 1,06
siehlda 3131 6% 7% 199 0,83
articles2 952 2% 2% 61 0,83
academie 12647 23% 30% 867 0,77
naf 6462 12% 24% 691 0,49
TOTAL-RW(hors index) 54576 100% 100% 2888

Tableau 10. Consultations des ressources du site de Russon Wooldridge relativement à leur taille.

On ne sera pas surpris de constater que les bases dictionnairiques les plus importantes en nombre de fichiers ne sont que dans une certaine mesure consultées proportionnellement à cette taille (Dictionnaires de l'Académie, Base Nicot-Académie-Féraud). En outre, il semble que ce soit le propre des dictionnaires que de ne pas être lus in extenso. La notion de consultation prend donc ici tout son sens.

Ici encore, on pourra proposer de regrouper sources primaires et sources secondaires, tout en sachant que cette répartition a ses limites : chaque répertoire comprend la plupart du temps les deux types de sources (sauf à considérer les répertoires strictement consacrés aux articles ou aux monographies : articles/, articles2/, edicta/).

Ressources
nb-accès tx-accès tx-fichiers nb-fichiers IPL
total-lexicologie 2589 5% 2% 44 2,50
total-textes 9101 16% 8% 253 2,00
total-secondaires 19048 35% 32% 909 1,09
total-dictionnaires 23838 44% 58% 1682 0,76
TOTAL 54576 100% 100% 2888  

Tableau 11. Sources primaires et sources secondaires dans le site de Russon Wooldridge consacré aux dictionnaires anciens.

Le constat concernant le mode de consultation partielle des dictionnaires est toujours de mise quand bien même, rappelons-le, les répertoires ici regroupés incluent systématiquement des études et commentaires métalexicographiques. Une étude encore plus fine, qui prendrait en compte les fichiers consultés et non plus seulement les répertoires, serait à même de préciser cette répartition. J'ai choisi d'effectuer ce type d'analyse concernant les seules ressources textuelles.

Textes lus, recherches dans les textes
A travers l'analyse plus détaillée des fichiers consultés, les textes ou les auteurs "à succès" peuvent être repérés, de même que peuvent être globalement estimées les pratiques de lecture correspondantes. C'est ce dernier point qui nous importera ici.

Types de ressources
Vitruve
Amyot
Du Fouilloux
Vigenère
Triomphe de Henry
nb-accès tx-accès nb-accès tx-accès nb-accès tx-accès nb-accès tx-accès nb-accès tx-accès
Texte-lecture 902 30% 408 21% 921 59% 358 25% 167 18,25%
Interrogation TACT 56 2% 55 3% 34 2% 91 6% 41 4,5%
Apparat critique 2005 68% 1454 76% 606 39% 990 69% 707 77,25%
totaux 2963 100% 1917 100% 1561 100% 1439 100% 915 100%

Tableau 12. Quels besoins documentaires dans la consultation de ressources textuelles ?

On remarquera l'extrême importance de ce qui constitue l'apparat critique des textes consultables (listes alphabétiques, listes de fréquences, mais aussi études historiques, philologiques) ; bref, l'importance de l'aide à la consultation et des repères scientifiques. Pourtant, l'utilisation d'un outil d'interrogation comme les bases de données TACTweb apparaît étonnamment faible. Même si ces bases ne sont pas mirorisées, les traces des requêtes sont censées apparaître dans les access_log dans la mesure où le formulaire fait quant à lui partie des fichiers mirorisés. Tout se passe donc comme si les utilisateurs préféraient consulter des listes déjà faites (fussent-elles le résultat d'une interrogation sous TACTweb !) plutôt que d'avoir recours à l'interactivité du formulaire.

Une comparaison avec les dictionnaires mériterait d'être systématiquement menée et nous apprendrait probablement d'autres choses concernant les pratiques de consultation des ressources en ligne. Cette étude déborde le cadre de l'esquisse que j'ébauche aujourd'hui.

2.2.2.3 Net des études françaises

Reprenant le principe adopté pour les deux autres sites, je livre ici le tableau relatif au nombre d'accès en fonction des principaux répertoires du NEF : [6]

Répertoires nb-accès tx-accès
nefbase 3371 33%
entretiens 3322 32%
acre 1973 19%
colloque 980 10%
portrait 630 6%
TOTAL 10276 100%

Tableau 13. Répertoires les plus consultés du
NEF.

 

Répertoires nb-accès tx-accès tx-fichiers nb-fichiers IPL
acre 1973 19% 8% 23 2,47
nefbase 3371 33% 15% 45 2,16
colloque 980 10% 7% 20 1,41
entretiens 3322 32% 42% 125 0,77
portrait 630 6% 28% 83 0,22
TOTAL 10276 100% 100% 296  

Tableau 14. Rubriques les plus consultées en fonction de l'indicateur de pleine lecture.

Je proposerai quelques remarques qui nous permettront de rapporter ces résultats aux précédents concernant les deux autres sites. Ils tendent à les rejoindre pour partie seulement :

Appendice : Auteurs et rubriques "à succès" dans la Nefbase (octobre 2001-avril 2002)

Le théâtre des XVIIe-XVIIIe siècles est de loin l'objet du plus grand nombre d'interrogations (1791), suivi de Maupassant (600), du corpus Epistémon (343) et de Daniel d'Augé (363). Les autres bases mentionnées dans l'index, comme Lexotor et le Grand Dictionnaire Universel de Larousse renvoient à des URL extérieures au NEF.
Parmi les auteurs de la base Théâtre, le palmarès est le suivant (en nombre d'accès décroissant) : Molière, Corneille, Marivaux, Racine, Beaumarchais.
Pour Maupassant, ce sont les contes, suivis des romans qui font recette.

Utiliser l'indicateur de pleine lecture ici n'apparaît pas pertinent dans la mesure où le nombre de fichiers ne représente en rien la taille des différentes bases TACTweb. Ici, c'est bel et bien le nombre d'accès au formulaire de requête qui est fiable.


3. Conclusion

Ces coups d'oeil de l'autre côté du miroir auront été jetés tous azimuts, et peut-être de manière trop brève du goût des uns, trop appuyée selon les autres. Une telle présentation aura néanmoins permis, je l'espère, de cerner un peu mieux, ou de façon neuve, quelques-unes des pratiques de consultation des littéraires sur le Web.

Quant aux objectifs liés à la publication de Translatio, on a vu que les plus importants avaient été atteints, au bout de sept mois seulement de présence sur le Web :

Reste, pour conclure, à revenir sur le dernier objectif auquel devait répondre Translatio : celui de nourrir le site pour en faire un miroir à deux faces, en quelque sorte. Cet objectif, clairement, n'a pas été atteint.

Tout se passe comme si, décidément, les usages "littéraires" des technologies d'information et de communication se cantonnaient à des pratiques de consultation, entendue de manière large, c'est à dire distinguée de la production de ressources. Peut-être faut-il d'ailleurs, concernant les modalités de cette consultation, mettre cette tendance en rapport avec quelques-unes des observations qui précèdent : le lecteur préfèrerait les apparats critiques aux sources elles-mêmes, priserait, enfin, la consultation "passive" à l'interaction, lorsque le choix lui en est donné. A moins que la consultation des apparats ne soit que l'effet d'un retour de l'internaute sur le site, alors qu'une seule visite suffit généralement pour télécharger l'intégralité d'un texte en mode lecture.
Ces analyses peuvent être faites à partir des access_log. Elles mériteraient de l'être, et pourraient apporter beaucoup à la connaissance des pratiques de lecture des internautes, comme à l'étude des contraintes liées au médium "réticulé". Il est souhaitable que tout cela soit poursuivi à l'avenir, et débattu.


Notes

* On trouvera une liste de ces rapports sur le site du ministère de l'Éducation nationale : http://www.educnet.education.fr/documentation/etudes.htm. Voir notamment (6) Jean-Michel Salaün, Les usages et les besoins des documents numériques dans l'enseignement supérieur et la recherche - 1999, et (5) Étude des sites web des Universités - juin 2000. [Retour]

1. La bibliothèque des Lettres n'a pas encore achevé l'informatisation de ses catalogues, qui à elle seule mobilise entièrement les effectifs. Les seules ressources électroniques accessibles (outre le catalogue inachevé) sont les CD-ROM, consultables sur les postes en interne, comme dans toute bibliothèque universitaire. A ce jour, la numérisation des fonds anciens ou rares n'est pas prévue. La diffusion en ligne de travaux d'élèves ou d'anciens élèves non plus. Les Presses de l'ENS ne proposent pas de ressources sur leur site, à l'exception de leur catalogue. Pourtant, la diffusion de revues savantes est envisagée depuis peu et devrait commencer à se mettre en place en collaboration, notamment, avec l'équipe du site Clio (histoire sociale). [Retour]

2. Voir note [*] . Quelques initiatives méritent toutefois d'être soulignées :

Enfin, bien sûr, il arrive que des élèves ou d'anciens élèves littéraires participent à des revues électroniques. Ces activités sortent du cadre institutionnel ici considéré. [Retour]

3. Je tiens à remercier vivement Éric Guichard (Équipe Réseaux, Savoirs et Territoires, ENS) de m'avoir communiqué les access_log de Translatio dont il assure la responsabilité technique, et de m'avoir prodigué tous les conseils statistiques et cartographiques destinés à réduire, si faire se pouvait, ma faible compétence dans ces deux domaines. [Retour]

4. Cette carte a été réalisée grâce au logiciel Eratosthène, conçu et réalisé par Éric Guichard (ENS). [Retour]

5. Ce point mériterait d'être précisé, en mettant l'accent sur les problèmes de connexion liés à l'infrastructure moins développée de certains pays européens, à l'Est notamment. Le miroir, ici, joue aussi un rôle de diffusion "politique". Pour plus de détails, on pourra consulter Éric Guichard, La diffusion d'Internet dans les pays de la zone RIPE entre 1992 et 2000, http://barthes.ens.fr/atelier/cartes/
[Retour]

6. Certains répertoires propres à la vie du département des études françaises de l'Université de Toronto ont été soustraits aux calculs. [Retour]


Liste des tableaux et cartes

Tableau 1. Statistiques brutes par mois.
Tableau 2. Comparaison des statistiques brutes et des statistiques épurées.
Tableau 3. Nombre d'accès (hors moteurs) pour les vingt premiers "pays".
Tableau 4. Principaux fournisseurs français responsables des accès de Translatio.
Tableau 5. Nombre d'accès pour les trois sites mirorisés.
Tableau 6. Répertoires les plus consultés du site Langue du XIXe siècle.
Tableau 7. Répertoires très consultés et répertoires moins consultés du site Langue du XIXe siècle.
Tableau 8. Sources primaires et sources secondaires dans Langue du XIXe siècle.
Tableau 9. Accès aux différents répertoires du site de Russon Wooldridge.
Tableau 10. Consultations des ressources du site de Russon Wooldridge relativement à leur taille.
Tableau 11. Sources primaires et sources secondaires dans le site de Russon Wooldridge consacré aux dictionnaires anciens.
Tableau 12. Quels besoins documentaires dans la consultation de ressources textuelles ?
Tableau 13. Répertoires les plus consultés du NEF.
Tableau 14. Rubriques les plus consultées en fonction de l'indicateur de pleine lecture.

Carte des accès européens à Translatio.


Annexe : Contenu des répertoires cités

Langue du XIXe siècle
NB. Les dexcriptifs qui suivent sont issus de l'index du site de Jacques-Philippe Saint-Gérand.

Site de Russon Wooldridge consacré aux dictionnaires anciens

Site Net des études françaises

Ressources textuelles du site de Russon Wooldridge consacré aux dictionnaires anciens


E. Lamy,
Paris, 24 mai 2002


Retour au programme