© Nikhomkhai - Pexels

L’entrepôt de données de Data Terra

Les données résultant de travaux de recherche financés par des fonds publics doivent être aussi ouvertes que possible, aussi fermées que nécessaire. Recommandation européenne en faveur de la structuration et de l’ouverture des données de la recherche

La création de l’entrepôt de données de l’Infrastructure de recherche Data Terra s’inscrit dans une démarche de science ouverte et en conformité avec les principes FAIR  (Findable, Accessible, Interoperable, Reusable). Ces principes décrivent comment les données de recherche doivent être organisées pour être plus facilement accessibles, comprises, interopérables et réutilisables.

Initié en 2018 par la ministre de l’Enseignement supérieur, de la Recherche et de l’Innovation, le Plan national pour la science ouverte vise à structurer les actions en faveur de l’ouverture et du partage des données, des publications et des codes source. Ce plan rend obligatoire la diffusion large de données issues de projets financés sur fonds publics. Une plateforme nationale fédérée des données de la recherche va être créée courant 2022. Elle intégrera un entrepôt national pour accueillir les données de la recherche n’ayant pas de solution thématique ou institutionnelle, et un catalogue permettant de rendre visibles les données des entrepôts de confiance existants dans le paysage national.

Dans ce contexte, l’entrepôt Data Terra a vocation à devenir l’entrepôt thématique national des données du système terre et de l’environnement. Les données stockées dans l’entrepôt Data Terra seront visibles dans le catalogue de la plateforme nationale.

Data Terra Repository

L’entrepôt Data Terra Repository offre aux communautés scientifiques des domaines système Terre et Environnement un service de confiance adapté aux spécificités des données géo-référencées.  Les données de recherche liées à des projets et les données de longue traîne peuvent y être déposées simplement, dans le respect des principes FAIR, et bénéficier d’un DOI pour chaque jeu de données. Une équipe de référents thématiques accompagne et conseille les utilisateurs tout au long du processus.

Cet entrepôt de données thématique est porté par l’ensemble des partenaires de l’IR Data Terra et des pôles de données (CNRS, CNES, IRD, INRAE, Météo-France, Ifremer, IGN, BRGM, …). Une équipe dédiée associant des experts du BRGM et de Data Terra coordonne sa mise en œuvre. L’entrepôt est hébergé au BRGM.

Détails des fonctionnalités

Le volume maximal autorisé est de 5 Go par fichier de données, et de 100 Go pour la totalité du dépôt. Pour des volumes plus importants, des solutions spécifiques sont proposées après échange avec les référents thématiques. Les métadonnées respectent les standards et directives du domaine (ISO 19115-3, INSPIRE). Elles sont compatibles et exportables vers d’autres formats/schémas de métadonnées (GeoDCAT-AP, DataCite, ..). Elles sont également accessibles via des API standardisées dans différents formats (JSON, XML, RDF).

Une « landing page » est associée à chaque jeu de données déposé dans l’entrepôt. Sur cette page web, le DOI associé et une citation sont inclus.

Les données déposées dans cet entrepôt sont par défaut en accès libre. Un embargo est possible sous la responsabilité du déposant (maximum 2 ans). Les métadonnées restent disponibles. La licence d’utilisation par défaut de l’entrepôt est la licence Creative Common CC-BY 4.0. Il est possible de choisir d’autres licences (Etalab, autres licences CC). Il est fortement recommandé de choisir un format non propriétaire pour les données déposées dans l’entrepôt Data Terra. La liste des formats préconisés est disponible sur le site du Cines.

L’entrepôt permet de faire le lien entre les données déposées et différentes ressources externes :  profil du chercheur (e.g. ORCID), publication (e.g. publiée dans Hal), code source (e.g. archivé dans Software Heritage), projet associé (e.g. projet H2020, Horizon Europe, ANR, …), etc.

L’entrepôt de données peut être moissonné via des protocoles normalisés (OAI-PMH, CSW, OpenSearch). Les métadonnées de l’entrepôt seront visibles dans les catalogues de données et services de l’IR Data Terra et dans le catalogue de la plateforme nationale fédérée de la recherche.

Data Terra Repository dispose d’une interface de recherche permettant de découvrir l’ensemble des données qui y sont publiées, d’y accéder et de les réutiliser (en fonction des contraintes d’accès).


Comment publier ses données sur l’entrepôt ?

Des guides utilisateurs seront prochainement à votre disposition pour vous accompagner dans le dépôt de vos données.

Responsabilité juridique

L’entrepôt Data Terra Repository diffuse les données entrant dans son périmètre telles qu’elles sont déposées. Data Terra effectue un contrôle technique sur les dépôts mais n’a pas la responsabilité de la qualité scientifique des données. Le déposant est responsable du contenu déposé et du respect de la réglementation (RGPD – données sensibles, accord des auteurs…). L’IR Data Terra se réserve le droit de refuser un dépôt qui ne lui semble pas correspondre au périmètre de l’entrepôt (données scientifiques des domaines système Terre et Environnement).

Les données mises à disposition via cet entrepôt sont protégées par des droits de propriété intellectuelle. L’utilisateur doit respecter la licence choisie et ses contraintes d’utilisation. Data Terra ne garantit pas l’exactitude, la précision ou l’exhaustivité des informations fournies sur le site.

➡️ Pour contacter l’équipe projet : entrepot@data-terra.org

➡️ Abonnez-vous à la liste de diffusion pour suivre l’actualité du projet