Appel à manifestations d’intérêt équipements structurants pour la recherche – ESR / EquipEx+

Le projet GAIA Data a été soumis à cet appel à manifestation d’intérêt les 19 juin et 3 juillet 2020. Il a pour objectif de développer une « Infrastructure distribuée de données et services pour l’observation, la modélisation et la compréhension du système Terre, de la biodiversité et de l’environnement”.

Il est porté par les trois Infrastructures de recherche numérique (E-Infrastructures) : Data Terra (coordination), CLIMERI-France, PNDB du domaine Système Terre et environnement de la feuille de route nationale des IR/TGIR du MESRI. Il regroupe et fédère 21 institutions : CNRS (coordination), CNES, IFREMER, INRAE, IRD, Météo-France, IGN, MNHN, CEA, IPGP, BRGM, SHOM, CINES, OCA, Sorbonne Université, Universités de Lille, Toulouse Paul Sabatier, Grenoble Alpes et Strasbourg, CERFACS et FRB. Le budget total, coûts complets, représente 65,6 M€ dont 46 M€ d’apport en RH pour une demande de subvention au PIA3/ANR EQUIPEX+ de 19,6 M€.

LE PROJET GAIA DATA

La Terre est un système complexe composé de sous-systèmes impliquant les milieux physiques, chimiques et biologiques, caractérisés par des processus en interaction sur un large continuum d’échelles de temps et d’espace. Observer, comprendre et modéliser de manière intégrée l’histoire, le fonctionnement et prévoir l’évolution du système Terre soumis aux changements globaux est un enjeu fondamental de recherche et une nécessité pour de nombreuses applications environnementales et socio-économiques en lien avec la mise en œuvre des objectifs du développement durable. Accéder à l’ensemble des données des différents sous-systèmes et milieux est indispensable pour aborder les enjeux de société, qu’ils concernent les risques naturels, l’anthropisation des milieux, le changement climatique, les ressources ou les questions de biodiversité et leurs impacts sur la santé. 

Différents systèmes d’information existent, ont été mis en place et rendus facilement accessibles interopérables et réutilisables par l’intermédiaire des pôles nationaux de données d’observation de l’atmosphère, des océans, des surfaces continentales et de la terre solide (IR Data Terra), de biodiversité (IR PNDB) et de simulations climatiques (IR CLIMERI-France). Cependant, le paysage reste fragmenté par domaine, voire par source de données, avec des standards différents et une large gamme de volumes de données pouvant atteindre plusieurs Pétaoctets.Accéder de manière transparente et dynamique à un continuum d’infrastructures interopérables de données et de services distribuées permettant l’extraction, le croisement, l’analyse, la diffusion et l’usage des données et produits dérivés est devenu un enjeu critique pour les sciences du système Terre, de la biodiversité et de l’environnement.

Le projet GAIA Data est porté par les trois Infrastructures de Recherche numérique, inscrites sur la feuille de route nationale. Il a pour ambition de développer et mettre en œuvre une infrastructure intégrée et distribuée de données et de services pour l’observation, la modélisation et la compréhension du système Terre, de la biodiversité et de l’Environnement. Ce dispositif, basé sur des centres de données et services, interconnectés et pilotés par la science, permettra d’accéder aux différentes sources de données et de disposer d’un continuum de services distribués de stockage (adaptés aux gros volumes de données pour le spatial et la modélisation notamment), de traitements (incluant l’utilisation des moyens de calculs et d’IA), de croisement de données, d’analyse et de visualisation. Des services, adaptés aux besoins des communautés scientifiques, seront proposés sur l’ensemble du cycle de la donnée, de son acquisition jusqu’à ses usages multiples.

L’infrastructure distribuée sera dimensionnée et structurée pour fournir des services thématiques répondant aux besoins des communautés scientifiques s’appuyant sur l’observation, l’expérimentation et la modélisation du système Terre, de la biodiversité et de l’environnement.

Faciliter l’accès à ces données multi-sources, développer des produits et services de qualité et répondant aux critères « FAIR » pour l’ensemble des compartiments du système Terre et leurs interactions, du noyau terrestre jusqu’aux limites de l’atmosphère, en intégrant pleinement la biosphère, est un défi capital. Y répondre nécessite des plateformes de services interopérables permettant le stockage, l’extraction, l’analyse, la diffusion et des usages intelligents de données différentes. Destinés à la communauté scientifique ainsi qu’aux acteurs publics et socio-économiques, ces services seront accessibles via des portails permettant des recherches interdisciplinaires. Ils reposent sur des données acquises par satellites, navires, avions, drones, submersibles, ballons, dispositifs in situ, inventaires, observatoires et expérimentation, ainsi que, sur des données issues de simulations de référence.

Pour une description plus détaillée du projet et plus d’informations, merci d’écrire à l’adresse suivante : contact@dataterra.org