Le portail commun de données in situ Theia-OZCAR
Le volet « données in situ » du pôle Theia vise à mettre à disposition des utilisateurs un portail unique d’accès aux données d’observation des surfaces continentales, de manière transparente, c’est-à-dire quel que soit le site d’hébergement de ces données (centre de données), en coordination avec le portail existant pour les données de télédétection. C’est l’Observatoire des Sciences de l’Univers de Grenoble (OSUG), qui héberge le Système d’Information des données in situ du pôle Theia.
La mise en place du Système d’Information (SI) in situ se fait en commun avec l’Infrastructure de Recherche (IR) OZCAR (Observatoires de la Zone Critique Applications et Recherches). Cette IR regroupe des observatoires labellisés qui documentent la zone critique sur le long terme, avec un panel de variables produites riches et variées couvrant différents compartiments de la zone critique (air, sol, eau, biosphère, land use).
Il a été mis en avant que l’élément d’intérêt est la variable. L’ensemble des variables mesurées par les 21 observatoires labellisés d’OZCAR a été recensé et mis en correspondance avec le vocabulaire hiérarchisé des sciences de la terre GCMD[1]. Le recensement a identifié près de 300 variables mesurées in situ, dont la moitié sont des mesures chimiques. Un observatoire peut mesurer entre 3 et 150 variables, avec une médiane de 36. Chaque variable a été documentée par des liens vers des thésaurus internationaux du domaine publiés sur le web (AGROVOC, EARTh Thesaurus, GACS Core Beta 3.1, NAL Thesaurus, UNESCO Thesaurus, LC Subject Headings, ANAEE).
Architecture et mise en place du SI OZCAR|Theia
Le SI Theia|OZCAR a été conçu pour collecter des données venant d’observatoires différents ayant des moyens de gestions des données différents. Pour ce faire, un flux d’information est organisé entre les Systèmes d’Informations (SI) des producteurs de données et le SI Theia|OZCAR qui propose des services de découverte des données (portail web) et des services d’interopérabilité standardisés. Les fonctionnalités du système et l’interface web répond aux besoins des utilisateurs recueillis via des rencontres spécifiques ou des ateliers participatifs. La philosophie du SI et les choix techniques réalisés sont publiés dans Braud et aL., (2020)[2]
Le flux d’information continu est organisé selon un modèle de données pivot qui spécifie l’ensemble des métadonnées nécessaires pour répondre à différents types de besoins identifiés (i) requêtes formulées par les utilisateurs, (ii) standards d’interopérabilité (Inspire, ISO 19115, etc.) et (iii) déclaration de DOI.
Le projet ANR FairTOIS finance la mise en place des services d’interopérabilité (service de catalogage déjà opérationnel) et les services de téléchargement des données. Nous visons la fin du projet en décembre 2022 pour leur mise en place, et pour l’implémentation du format pivot par tous les observatoires. Actuellement 8 des 21 observatoires ont mis en place un flux et leurs données sont visibles sur le portail Theia|OZCAR.
[1] GCMD : Global Change Master Directory. Ce vocabulaire hiérarchisé est régulièrement mis à jour par sa communauté. https://earthdata.nasa.gov/about/gcmd/global-change-master-directory-gcmd-keywords
[2] Braud, I., Chaffard, V., Coussot, C., Galle, S., Juen, P., Alexandre, H., Baillion, P., Battais, A., Boudevillain, B., Branger, F., Brissebrat, G., Cailletaud, R., Cochonneau, G., Decoupes, R., Desconnets, J.-C., Dubreuil, A., Fabre, J., Gabillard, S., Gérard, M.-F., Grellet, S., Herrmann, A., Laarman, O., Lajeunesse, E., Le Hénaff, G., Lobry, O., Mauclerc, A., Paroissien, J.-B., Pierret, M.-C., Silvera, N., Squividant, H., 2020. Building the information system of the French Critical Zone Observatories network: Theia/OZCAR-IS. Hydrological Sciences Journal 1–19. https://doi.org/10.1080/02626667.2020.1764568, disponible sur https://hal.archives-ouvertes.fr/insu-02917629v1