Les brèves de GAIA Data
Le projet GAIA Data développe une infrastructure nationale distribuée pour le stockage, le traitement et la gestion de données FAIR multi-domaines, issues des systèmes d’observation (spatial, in-situ) et de modélisation. Il s’appuie sur 8 centres de données nationaux, régionaux et d’organismes en réseau pour proposer des services répartis intelligemment de découverte, d’accès, d’analyse croisée et de visualisation répondant aux enjeux scientifiques et sociétaux (changements climatiques et environnementaux et impacts).
Les investissements réalisés depuis 2022 ont renforcé les capacités de calcul et de stockage des sites et permis de déployer des interconnexions très haut débit sécurisés. Plusieurs dispositifs sont déjà opérationnels : Geodes (CNES, spatial), DatarMor (Ifremer, océan), IPSL/IDRIS/CNRS (simulations climatiques).
Des services FAIR multi-domaines se développent, tels qu’EasyData (entrepôt, RDG, lancé fin 2023), une fédération d’identités pour sécuriser les accès et des Environnements Virtuels de Recherche pour pour les communautés de recherche. Le développement (marché) du « portail de la découverte » est lancé ainsi que d’autres briques transversales (vocabulaires, MTEP…).
Un pilote de LLM adapté à l’aide à la découverte de données océaniques est mis en place sur le HPC Adastra CINES avec des résultats convaincants, Il sera généralisé aux autres données du système Terre.
La grille de données se déploie sur plusieurs sites dans le cadre du Cloud pour l’ESR, avec le soutien du MESR/DGRI
En 2024, à noter l’arrivée d’un nouveau partenaire (Mésocentre Occitanie) et de la prolongation de deux ans de la phase de développement adopté par l’AG et l’ANR.
Enfin, le lancement des PEPR (One Water, Bridges, Fair-Carbon, Numpex, Traccx…) a permis de mutualiser les infrastructures, renforcer les partenariats et valoriser l’offre GAIA Data. Ces avancées ont contribué à l’acceptation de l’IR Data Terra, en février 2025, comme nœud national et thématique de l’EOSC Federation.