École thématique DATA STUE
14 octobre @ 8h00 – 18 octobre @ 17h00
DATA STUE est une école thématique organisée par l’INSU autour de la gestion des données en Sciences du Système Terre et de l’Environnement.
Le premier objectif scientifique de l’école est de favoriser la levée des verrous de la logistique et de l’opérationnel des données pour pouvoir répondre aux nouveaux défis scientifiques émergents. Il est nécessaire de renforcer et accélérer la mutation numérique des pratiques des chercheurs (au sens large) en STUE pour favoriser l’interopérabilité des données.
L’interopérabilité des données va permettre par exemple de :
- Comparer les données hétérogènes (ex.: INSU / INEE) afin de mettre en perspective le changement climatique et les impacts sur le vivant,
- Permettre les inversions conjointes pour créer des modèles plus exhaustifs, véritables répliques numériques d’objets, de processus ou de systèmes (jumeaux numériques – digital twins), ou
- Favoriser l’usage des chaînes de traitement de données exploitant les technologies de type HPDA/GPU (INS2I) en particulier vers l’exploration et l’analyse de larges volumes de données (BigData).
Les stagiaires seront sensibilisés aux différentes étapes du cycle de vie des données, de l’acquisition/production jusqu’à leur valorisation :
- collecter des données et les mettre sous des formats standards, ouverts et libres, recommandés par les pôles de données,
- décrire les données par le biais de métadonnées standardisées et interopérables utilisant des thésaurus (vocabulaires contrôlés) généralistes ou thématiques,
- déposer les données dans des entrepôts thématiques ad-hoc, certifiés et/ou répondant aux principes TRUST, afin de permettre leur accès et réutilisation,
- référencer les données avec des identifiants pérennes (ex. : DOI),
- sensibiliser à l’impact environnemental de la donnée,
- valoriser le travail accompli par le biais de data paper, et
- utiliser en conditions réelles des Applications au travers de Computational Notebooks ou Environnements Virtuels de Recherche (VRE- Virtual Research Environments).
Le cycle de vie des données sera documenté à chaque étape et le lien fait avec les documents de référence à rédiger, tant pour les projets que pour les entrepôts, tels que les descriptions fonctionnelles des workflows sous-jacents, les plans de conservation et les plans de gestion de données (PGD).
Le second objectif scientifique est de clarifier le paysage national, notamment des services procurés par l’IR Data Terra, et de guider les participants dans la multitude d’offres, émanant des organismes, universités ou services thématiques, d’ores et déjà utilisées par la communauté scientifique Sciences de la Terre et Environnement.