La chaîne de production de Persée 1/2

La chaîne de production de Persée 1/2

La chaîne de production de Persée 1/2

Nous avons vu dans un autre billet la chaîne de documentation de Persée. Revenons cette fois-ci à l’origine avec une petite présentation de la chaîne de production.

La chaîne de production numérise, traite ou insère autour de 500 000 pages chaque année. Ces dernières sont vérifiées, améliorées, parfois retouchées pour être ensuite disponibles à la documentation avant leur mise en ligne.

Elle est constituée de deux parties bien distinctes :

L’acquisition des images via des scanners

A 90% c’est une chaîne dite de numérisation destructive. Cela signifie que les ouvrages sont massicotés (coupés) afin d’être numérisés sur des scanners très véloces appelés scanner de production (fig 1). Ceux-ci sont capables de numériser les pages recto-verso en une seule passe.

Fig 1 Cette machine qui ressemble à un petit photocopieur est capable de numériser 160 pages par minutes en 400 DPI au format A3 maximum.

Lorsque cela est nécessaire, nous utilisons un scanner de plan jusqu’au format A0 pour des planches fragiles ou de grandes tailles (fig 2).

Fig 2 Le scanner de planches A0

Et si les ouvrages ne sont pas massicotables pour des raisons de rareté ou d’ancienneté, un scanner de livres (fig 3) est alors utilisé. C’est une acquisition récente rendue possible par un financement de la région Auvergne-Rhône-Alpes (que nous remercions).

Fig 3 Le scanner de livres I2S CopiBook Open System de dernière génération – Plus lent que les autres scanners, il permet de numériser les livres rares ou en mauvais états, sans les massicoter.

Persée dispose en tout de 8 scanners opérationnels dont 5 sont en production à l’heure actuelle.

Pour piloter ces scanners, nous privilégions l’utilisation du logiciel professionnel DPUScan, mais passons également par NextImage et Limb.

A noter que la chaîne Persée autorise également l’insertion d’images produites par des tiers (prestataires de numérisation par exemple), et même une voie de traitement alternatif pour les PDF nativement électronique.

(à suivre…)