Nos missions

Les approches scientifiques dans une thématique, ou sur un compartiment spécifique du système Terre, nécessitent de plus en plus d’intégrer des données et des informations multi-source, multi-échelles et multi-type, ainsi que de quantifier et d’intégrer leurs incertitudes. La production de nouveaux jeux de données de taille sans précédent doivent être intégrer et qualifier pour les approches scientifiques. Enfin, les modèles et simulations numériques génèrent une quantité importante de données dont il est indispensable de promouvoir au sein de cycles d’inférence le croisement avec les observations.

Le projet GAIA Data a pour ambition de répondre à ces nouveaux enjeux en développant et opérant une infrastructure distribuée et intégrée de données et de services pour l’observation et la modélisation du système Terre, de la biodiversité et de l’Environnement. Ce projet est construit sur les dispositifs existants développés et exploités par les trois IR, Data Terra, CLIMERI-France et PNDB, organisées autour de pôles de données (Atmosphère, Océan, Surfaces continentales, Terre Solide) et de bases de données et de simulations climatiques et de biodiversité, rassemblant au total une trentaine de Centres de Données et Services (CDS), de capacités variables et répartis nationalement.

Les principales missions du projet GAIA Data

Lancement du projet GAIA Data le 12 avril 2022

  • Développer une plateforme de services – ouverts et interopérables – déployés et supportés au travers des Centre de Données et de Services (CDS) et des infrastructures nationales et régionales, facilitant et accélérant un accès transparent et continu à l’ensemble de ces données multi-source, leur extraction et leur croisement.
  • Co-concevoir et mettre en œuvre des méthodes innovantes pour accéder de manière simultanée à des ensembles cohérents de données multi-sources, multi-domaines et multi-échelles et de confronter observations et simulations de référence, par exemple pour l’étude du climat et de son impact sur l’environnement et les populations.
  • Relever les défis Big Data associés à l’exploitation scientifique pluridisciplinaire du déluge et de la diversité de données en sciences de l’environnement

Cela implique de relever des défis technologiques et méthodologiques :

1) FAIRisation de données multi-domaines, multi-source et multi-résolution,

2) croisement de données spatiales, aéroportées, et in-situ (terre, merre),

3) croisement de données d’observation multi-source et multi-resolution avec des données issues de modélisation numérique dans des cycles d’inférence e plus en plus complexes,

4) chaines de traitement, d’analyse et de modélisation de gros volume et de flux de données multi-source (Big Data) pour extraire et distiller de nouvelles connaissances

5) exploitation d’un continuum de ressources centralisées (HPC, Cloud) et décentralisées (Grilles de calcul et de données), permettant d’accélérer les chaines de traitement, d’analyse, et de modélisation, et la logistique et la réduction des données au travers de ces chaines articulant HPC et HPDA

TROIS E-INFRASTRUCTURES DE RECHERCHE DU DOMAINE SYSTÈME TERRE ET ENVIRONNEMENT :

DATA TERRA organise l’accès et les traitements intégrés de données d’observation, des produits et services couvrant les différents compartiments du système Terre et leurs interactions

CLIMERI-France produit des simulations numériques internationales pour le Programme Mondial de Recherche pour le Climat et met leurs résultats à la disposition de divers utilisateurs en France et à l’étranger.

PNDB propose des outils & services pour accompagner et faciliter la compréhension, le partage et l’utilisation des données de biodiversité produites pour et par les communautés de recherche.

21 PARTENAIRES DU PROJET

CNRS, CNES, IRD, INRAE, MNHN, IFREMER, BRGM, SORBONNE UNIVERSITÉ, MÉTÉO FRANCE, IGN, CEA, IPGP, CINES, UNIVERSITÉ GRENOBLE-ALPES, UNIVERSITÉ DE LILLE, UNIVERSITÉ TOULOUSE-III-PAUL- SABATIER, UNIVERSITÉ DE STRASBOURG, SHOM, OCA, FRB, CERFACS.