Atelier technique #2

  • 05-06 juillet 2022
  • PARIS, FRANCE
ATELIER GAIA DATA
Atelier Gaia Data juillet 2022
Une partie des collaborateurs GAIA DATA lors de l’atelier des 5 et 6 juillet 2022 à Paris ©Marina Ripon, AERIS, DATA TERRA
GAIA DATA A ÉTÉ RETENU SUITE A L’APPEL D’OFFRE D’EQUIPEX+/PIA DANS LES PROJETS D’EQUIPEMENTS STRUCTURANTS POUR LA RECHERCHE.

Initié en décembre 2021 et porté par trois infrastructures de recherche : DATA TERRACLIMERI-FRANCE et le PNDB (Pôle National de Données de biodiversité), GAIA DATA a pour ambition de développer et mettre en oeuvre une infrastructure intégrée de données FAIR et de services distribués pour l’observation, la modélisation et la compréhension du Système Terre, de la Biodiversité et de l’Environnement.

LE DEUXIÈME ATELIER DU PROJET GAIA DATA, A LIEU LES 5 ET 6 JUILLET A PARIS, EN PRÉSENTIEL ET EN DISTANCIEL.

L’atelier a pour objectif de préciser les concepts techniques centraux qui seront implémentés dans GAIA DATA pour permettre le déploiement de cette infrastructure distribuée qui intervient sur l’ensemble du cycle de la donnée.

PROGRAMME ATELIER TECHNIQUE GAIA DATA

MARDI 5 JUILLET

14h30 – 15h15 | Grilles de données (45min)

  • Objectif général d’une grille de données (K. Ramage) (10′)
  • Solutions de grilles de données : iRODS / RUCIO
    – Comparatif iRODs vs RUCIO (Jérôme Pansanel – France Grilles) (15′)
    – REX PHIDIAS sur iRODS (si non redondant Interpole) (AD Icare, IFREMER, CINES) (15′)

15h15 – 16h30 | Interopérabilité calcul / données (1h15)

16h30 – 16h45 | Pause café

16h45 – 17h15 | Sécurité (30′)

  • Présentation des règles sécurités GDH => Charlie Pasquet (CNES)
  • Spécifications de sécurité pour chaque site (tour de table, avec planches possibles)
  • Contraintes à considérer pour l’interopérabilité des sites

17h15 – 18h00 | Authentification – Keycloak (45 min)

  • Présentation des Organisations Virtuelles EGI (J. Pansanel) (10′)
  • Gestion des Autorisations
    – suite des discussions du hackathon interpole

MERCREDI 6 JUILLET

9h – 9h30 | Modèle pivot de métadonnées (complément % Interpole)

  • Plus en détail % Interpole
  • Comment s’en servir et le faire évoluer dans le cadre de GAIA DATA : phase d’appropriation
    – Discussions : granularité

9h30 – 10h30 | Découverte – JC Desconnets

  • Présentation des activités menées à présent :
    – PoC réalisé dans le cadre PHIDIAS : portail connaissance et catalogue
  • Échanges pour analyser dans quelle direction continuer les travaux
    – Proposition pour le futur
    – 2 step search
    – Appel à une société experte en sémantique

10h30 – 10h45 | Pause Café

10h45 – 12h00 | Accès aux données | Une fois qu’on a découvert les données comment y accéder ?

10h45 – 11h00 | Présentation EODag et/ou METIS (X Pothrat CSgroup 15′)

  • Présentation Hysope2 et GeoDataHub (F. Gouillon & F. Jocteur – CNES) (30′)
  • STAC/Intake – en faisant abstraction de la façon dont sont stockées les données
    – Présentation IFREMER et/ou CLIMERI (G. Levavasseur) (15′)
  • Accès distant aux données – Exports S3 / API spécifiques / OpenDAP
    – Présentation API DAALIA (N. Pascal – ICARE) (10′)

12h00 – 13h30 | Repas sur site (1h30) – Brasserie L’Ardoise (Sorbonne Université)

13h30 – 14h30 | VRE (1h)

  • PANGEO : présentation AI4GEO ou Datalabs CNES ou Pangeo IFREMER, … (15′)
  • Galaxy-E : présentation Galaxy-E : nouveautés (Y. Le Bras – PNDB) (10′)
  • WPS de CLIMERI présenté en Interpole

14h30 – 15h00 | Outils de collaboration (30′)

15h – 16h30 | Discussion ouverte sur l’organisation du projet

(Si le planning dérive, cette session « organisation »  sera remontée dans l’ODJ.)

  • Établissement d’un plan de travail
  • Ressources RH / RF
  • Use cases / implication utilisateurs