Faire en sorte que nos pipelines de traitement et nos produits soient nativement compatibles avec les outils d’analyse massive de données
Ingénieure de Recherche CNRS, Experte en calcul scientifique pour les services aux données du pôle THEIA
Quel parcours vous a amenée à travailler aujourd’hui pour le pôle THEIA ?
Aline Déprez : Diplômée ingénieure de l’EOST (École et Observatoire des Sciences de la Terre) de Strasbourg, j’ai poursuivi mon parcours par une thèse de doctorat en Géophysique à l’Université de Strasbourg. Mes recherches ont porté sur la dynamique de rifting au niveau de la Corne de l’Afrique, une expérience qui m’a fortement impliquée dans des missions de terrain et m’a également permis d’acquérir des compétences solides en traitement de données et des capacités d’analyses rigoureuses.
Aujourd’hui, en tant qu’ Ingénieure de Recherche au CNRS, j’occupe un poste d’experte en calcul scientifique pour les services aux données du pôle THEIA, au sein de l’infrastructure de recherche Data Terra. Mon travail quotidien au sein du pôle THEIA se décline sur toute la chaîne de valeur de la donnée : du développement de services de calcul à l’accompagnement à la FAIRisation (création de métadonnées, de DOI et des pages de description associées). J’assure également la modération sur l’entrepôt EasyData et la maintenance opérationnelle des outils indispensables au pôle, tels que la plateforme de services et le méta-catalogue THEIA, afin de garantir que les produits soient labélisés, accessibles et réellement réutilisables par tous.
Qu’est-ce qui motive votre implication dans THEIA ?
Aline Déprez : Etre impliquée dans une infrastructure qui contribue à une meilleure compréhension des surfaces continentales (et de manière plus générale, du Système Terre et Environnement) me motive beaucoup. Un des objectifs centraux de mon travail est de participer à la construction d’un socle de ressources communes pour mieux décrypter la complexité des surfaces continentales. Pour y parvenir, je suis convaincue que la science ouverte ne doit pas rester seulement un concept, mais doit se concrétiser dans un ensemble d’éléments humains et techniques à construire et à mettre en place. Ce qui m’intéresse, c’est de créer des passerelles : entre les laboratoires de recherche et les infrastructures de données, mais aussi entre les différents acteurs nationaux, d’établir et de maintenir des liens indispensables entre la technique et la science ainsi qu’entre les différentes thématiques de recherche. C’est pour moi extrêmement gratifiant de voir que certains de mes travaux se concrétisent dans des outils, des services qui simplifient le travail des chercheurs ou rendent possibles de nouvelles collaborations
Aujourd’hui, THEIA joue un rôle fédérateur. C’est un écosystème qui permet de mutualiser des expertises pointues. Mon rôle est d’assurer que les services numériques (catalogues de diffusion, services de calcul, etc.) ne soient pas des éléments isolés, mais les composants d’une offre globale et cohérente. THEIA est le garant de la qualité et de la labellisation : le pôle assure aux scientifiques que les données qu’ils produisent et utilisent respectent les standards officiels (qualité, formats, richesse des métadonnées). C’est aussi un espace de dialogue essentiel. Mon intégration au sein de THEIA me permet d’interagir plus facilement avec l’ensemble des acteurs sur l’ensemble du territoire national (au sein des différents CDS, ce qui est crucial pour adopter des pratiques harmonisées et veiller à un alignement avec les besoins réels de la communauté scientifique.
Quel est le principal défi à venir pour le pôle en lien avec votre activité ?
Aline Déprez : Le défi majeur est sans doute le passage à l’échelle à travers les services qui seront développés sur l’infrastructure distribuée de Data Terra, tout en conservant une grande proximité avec les thématiques scientifiques. Pour mon activité, cela signifie relever le défi de l’interopérabilité technique et sémantique : il s’agit de faire en sorte que nos pipelines de traitement et nos produits soient nativement compatibles avec les outils d’analyse massive de données. Il faudra montrer une capacité à adapter certains aspects de nos méthodes de travail pour gérer des données de plus en plus massives et diverses, tout en continuant à accompagner les chercheurs dans leurs besoins et leurs usages du quotidien.


