[Infrastructures] L’archivage numérique pérenne : accessibilité et lisibité sans limitation de durée

La progression exponentielle du numérique dans tous les domaines a récemment imposé aux administrations et entreprises de se soucier de la conservation à long terme de l’information numérique. Parmi les nombreux projets, publics ou privé, d’échelle nationale, européenne et mondiale, dédiés à la conservation de l’information électronique, le Centre Informatique National de l’Enseignement Supérieur (CINES) offre à l’enseignement supérieur et la recherche française un véritable service d’archivage à long terme des données numériques. Depuis 2006, ce service d’archives est ouvert à tout organisme, produisant ou collectant en grande quantité des documents électroniques de valeur patrimoniale pour la communauté.

L’offre CINES se doit de conserver le document et l’information qu’il contient dans son contenu intellectuel comme dans son aspect physique, mais aussi de le rendre accessible et compréhensible sans limitation de durée ; c’est-à-dire de conjurer les effets de différents facteurs inéluctables tels que la connaissance perdue du contenu des fichiers, l’obsolescence des formats, la détérioration des supports physiques ou encore la disparition des logiciels ou matériels de lecture. Pour garantir une bonne conservation, des procédures de contrôle de la qualité de l’objet numérique lui-même et des services associés ont été adoptées. La certification de l’activité (agrément du Service Interministériel des Archives de France, accréditation CoreTrust seal) permet d’instaurer des relations de confiance avec les communautés d’utilisateurs.

Un service d’archive en constante expansion

Dix ans après le lancement de la première plateforme d’archivage pérenne, le CINES accueille une vingtaine de projets d’archives dont la conservation des thèses électroniques, collectées et versées par l’Agence Bibliographique de l’Enseignement Supérieur, ou la préservation de documents issus de la numérisation de revues ou de manuscrits, comme le programme Persée en Sciences Humaines et Sociales, des bibliothèques universitaires comme Cujas et Sainte-Geneviève, ou encore l’archivage de documents de chercheurs scientifiques déposés dans l’outil HAL. Pour Geosud, ce sont les images de couverture nationale Spot et RapidEye, acquises et retraitées dans le cadre du projet, qui sont confiées au CINES. Bientôt le partenariat avec le Muséum national d’Histoire naturelle permettra la conservation d’herbiers numérisés représentant près de 400 To de données ! Dans chaque projet, la plateforme d’archivage est interfacée avec les systèmes d’information des services versants pour un traitement entièrement automatisé. Près de 900 000 objets sont actuellement stockés, pour une volumétrie de plus de 50 To.

Répondant à la stratégie de préservation du patrimoine scientifique et la promotion de la Science Ouverte prônée par les tutelles, le CINES travaille enfin à élargir l’archivage à de nouveaux types de données, comme les données de simulation ou celles d’appareils de mesure (données in situ, etc.). Une collaboration avec, entre autres, l’IR Système Terre si elle trouve un appui financier auprès de la Commission européenne pourrait notamment aboutir très prochainement. 

Olivier ROUCHON (CINES) 

www.cines.fr

Lire le nouveau Bulletin :

>>> Télécharger en pdf  version impression (1,6 Mo) ou version allégée (1012 Ko) 

>>> Retrouver les numéros précédents.

>>> Lire le numéro sur Calameo : Bulletin Theia 10 Fr

Plus d'actualités

La production THEIA à l’arrêt suite à l’évolution des infrastructures et des données CAMS de l’ECMWF

La production de THEIA s’adapte à l’évolution des données de l’ECMWF.

Hydroweb : Les mesures SWOT Nadir permettent l’ajout de 4750 stations sur les rivières du monde

La base de données hydroweb intègre maintenant des données SWOT pour élargir sa couverture des rivières du monde.

Rechercher