Les données résultant de travaux de recherche financés par des fonds publics doivent être aussi ouvertes que possible, aussi fermées que nécessaire

Recommandation européenne en faveur de la structuration et de l’ouverture des données de la recherche

La création de l’entrepôt de données de l’Infrastructure de recherche Data Terra s’inscrit dans une démarche de science ouverte et en conformité avec les principes FAIR

La science ouverte est la diffusion sans entrave des résultats, des méthodes et des produits de la recherche scientifique. Les principes FAIR permettent de trouver Facilement, d’Accéder, de rendre Interopérables et Réutilisables les données de la recherche.

Initié en 2018 par la ministre de l’Enseignement supérieur, de la Recherche et de l’Innovation, le Plan national pour la science ouverte vise à structurer les actions en faveur de l’ouverture et du partage des données, des publications et des codes source. Ce plan rend obligatoire la diffusion large de données issues de projets financés sur fonds publics.

Une plateforme nationale fédérée des données de la recherche va être créée courant 2022. Elle intégrera un entrepôt national pour accueillir les données de la recherche n’ayant pas de solution thématique ou institutionnelle, et un catalogue permettant de rendre visibles les données des entrepôts de confiance existants dans le paysage national.

Dans ce contexte, l’entrepôt Data Terra a vocation à devenir l’entrepôt thématique national des données du système terre et de l’environnement. Les données stockées dans l’entrepôt Data Terra seront visibles dans le catalogue de la plateforme nationale.

Data Terra Repository : l’Entrepôt de données de l’IR Data Terra

L’entrepôt Data Terra Repository offre aux communautés scientifiques des domaines Système Terre et Environnement un service de confiance adapté aux spécificités des données géo-référencées.  Les données de recherche liées à des projets et les données de longue traîne peuvent y être déposées simplement, dans le respect des principes FAIR, et bénéficier d’un DOI pour chaque jeu de données. Une équipe de référents thématiques distribués accompagne et conseille les utilisateurs tout au long du processus.

Cet entrepôt de données thématique est porté par l’ensemble des partenaires de l’IR Data Terra et des pôles de données (CNRS, CNES, IRD, INRAE, Météo-France, Ifremer, IGN, BRGM, …). Une équipe dédiée associant des experts du BRGM et de Data Terra coordonne sa mise en œuvre. L’entrepôt est hébergé au BRGM.

Les fonctionnalités de l’entrepôt Data Terra

Le volume maximal autorisé est de 5 Go par fichier de données, et de 100 Go pour la totalité du dépôt. Pour des volumes plus importants, des solutions spécifiques sont proposées après échange avec les référents thématiques.

Les métadonnées respectent les standards et directives du domaine (ISO 19115-3, INSPIRE). Elles sont compatibles et exportables vers d’autres formats et schémas de Métadonnées (GeoDCAT-AP, DataCite, ..). Elles sont accessibles via des API standardisées dans différents formats (JSON, XML, RDF).

Une « landing page » est associée à chaque jeu de données déposé dans l’entrepôt. Sur cette page web, le DOI associé et une citation sont inclus.

Les données déposées dans l’entrepôt Data Terra sont par défaut en accès libre. Un embargo est possible sous la responsabilité du déposant (maximum 2 ans). Les métadonnées restent disponibles.

La licence d’utilisation par défaut de l’entrepôt est la licence Creative Common CC-BY 4.0. Il est possible de choisir d’autres licences (Etalab, autres licences CC).

L’entrepôt permet de faire le lien entre les données déposées et différentes ressources externes :  profil du chercheur (e.g. ORCID), publication (e.g. publiée dans Hal), code source (e.g. archivé dans Software Heritage), projet associé (e.g. projet H2020, Horizon Europe, ANR, …), etc.

Il est fortement recommandé de choisir un format non propriétaire pour les données déposées dans l’entrepôt Data Terra. La liste des formats préconisés est disponible sur le site du Cines.

L’entrepôt de données peut être moissonné via des protocoles normalisés (OAI-PMH, CSW, OpenSearch). Les métadonnées de l’entrepôt seront visibles dans les catalogues de données et des services de l’IR Data Terra et dans le catalogue de la plate-forme nationale fédérée de la recherche.

L’entrepôt Data Terra dispose d’une interface de recherche permettant de découvrir l’ensemble des données qui y sont publiées, d’y accéder et de les réutiliser (en fonction des contraintes d’accès).

L’ensemble des fonctionnalités de l’entrepôt Data Terra sont listées dans le tableau suivant :

Comment publier ses données sur l’entrepôt de données ?

Responsabilité juridique de l’entrepôt de données Data Terra

L’entrepôt diffuse les données entrant dans son périmètre telles qu’elles sont déposées. Data Terra effectue un contrôle technique sur les dépôts mais n’a pas la responsabilité de la qualité scientifique des données. Le déposant est responsable du contenu déposé et du respect de la réglementation (RGPD – données sensibles, accord des auteurs…).

Data Terra se réserve le droit de refuser un dépôt qui ne lui semble pas correspondre au périmètre de l’entrepôt (données scientifiques des domaines Système Terre et Environnement).

Les données mises à disposition via cet entrepôt sont protégées par des droits de propriété intellectuelle. L’utilisateur doit respecter la licence choisie et ses contraintes d’utilisation. Data Terra ne garantit pas l’exactitude, la précision ou l’exhaustivité des informations fournies sur le site.

L’entrepôt de données Data Terra sera ouvert aux dépôts début 2022

Pour contacter l’équipe projet : entrepot@data-terra.org

Abonnez-vous à la liste de diffusion pour suivre l’actualité du projet : https://groupes.renater.fr/sympa/subscribe/entrepot_dataterra