FRA

GAIA Data. Des enjeux scientifiques et une approche multidisciplinaire

FAIR Data et expertise Inter-pôles Observation Système Terre
Data terra

GAIA Data améliorera considérablement le leadership scientifique français et intégrera les différents systèmes de gestion des données de manière totalement inédite à l’échelle mondiale.

Ce projet dotera la France d’une capacité inédite qui confortera ainsi son positionnement européen et international.

Financé par Equipex/PIA 3, le projet GAIA Data réunit 21 partenaires de l’informatique et des sciences de la Terre autour de 3 infrastructures de recherche dédiées à l’observation de la planète. CLIMERI-France,  DATA TERRA, PNDB se sont donnés pour mission d’établir un écosystème de données et de services permettant une flexibilité totale pour les utilisateurs. Avec un budget de 65 millions d’euros, les équipes ont 8 ans pour mettre en place une plateforme intégrée et distribuée de données et de services pour l’observation et la compréhension du système Terre, de la biodiversité et de l’environnement. GAIA Data vise à développer un modèle numérique de très haute précision de la Terre (un « jumeau numérique ») pour surveiller et prévoir les changements environnementaux et l’impact humain. 

Lorsqu’il s’agit d’observation terrestre, il n’est pas possible de se contenter de données approximatives. Les résultats sont fiables à condition d’utiliser les bonnes données car les erreurs d’interprétation peuvent être tragiques. Un séisme mal évalué ou une mauvaise prévision météorologique peut conduire des populations entières à en faire les frais avec des dégâts évalués à plusieurs milliards d’euros, des dizaines de milliers de personnes se retrouvant sans foyer, etc. Il est donc indispensable de concevoir des protocoles permettant aux scientifiques d’effectuer des traitements flexibles et rapides des données qu’ils ont à leur disposition tout en garantissant la fiabilité des données. Les données d’observation de la Terre et les services créés pour les traiter et les analyser par la suite sont essentiels pour comprendre, modéliser et prédire les processus naturels, ainsi que l’état et la dynamique actuels et futurs du système Terre et de l’impact des activités humaines.

Des données in situ et spatiales sont régulièrement collectées et procurent des sources d’informations cruciales pour la mise à jour des connaissances sur des processus bio-chimiques et physiques pour une meilleure compréhension du système Terre. Bien que les avancées technologiques nous ont permis d’accéder à un grand nombre de données, générer des analyses pour améliorer nos connaissances sur les schémas spatio-temporels des activités humaines ou des processus naturels reste un défi majeur à travers le monde. L’hétérogénéité et la multiplication des sources est une grande richesse mais favorise une complexité dans la traduction de ces données en information à valeur ajoutée.   Elles ne peuvent souvent pas être directement traduites en information car elles nécessitent une certaine interprétation, dans un environnement informatique de plus en plus complexe. Non seulement la variété des sources de données disponibles augmente, mais les applications accédant à plusieurs sources de données augmentent également. GAIA Data a pour ambition de simplifier l’interprétation des données en simplifiant l’accès à celles-ci.

Aujourd’hui, la tendance mondiale dans l’observation de la planète correspond à 80% de temps à fouiller les données et 20% à les exploiter. Les chercheurs, les experts analystes et les scientifiques du monde entier travaillent à inverser cette tendance. Les mégadonnées dans les sciences de la Terre sont principalement constituées de données avec une grande diversité de format. Ces données incluent des séries temporelles, des images de télédétection, des données géologiques, atmosphériques, océaniques, météorologiques, biologiques, etc. L’analyse de ces données nécessite donc un traitement d’une telle complexité que cela nécessite des projets ambitieux tel que GAIA  DATA.

En savoir plus sur : www.gaia-data.org