Stage EarthPortal 2024-2025
Capturer et exploiter la relation entre les ressources sémantiques et les projets au sein de l’EarthPortal
Stage de développement web orienté web sémantique
Informations
Localisation: UAR DataTerra, Montpellier, France
Contexte: Projets EarthPortal (https://earthportal.eu) & OntoPortal Alliance (https://ontoportal.org/)
Période: Année scolaire 2024-2025
Candidature et info
Pour plus d’informations sur les sujets de stage veuillez contacter :
- Christelle Pierkot : christelle.pierkot(at)cnrs.fr)
- Guillaume Alviset : guillaume.alviset(at)data-terra.org
Pour postuler, veuillez envoyer un email contenant les liens (NE PAS INCLURE DOCUMENTS EN PIÈCE JOINTE) vers :
– Un bref CV décrivant votre expérience et les correspondances / affinités avec le profil attendu ;
– Une lettre de motivation décrivant une explication de VOTRE intérêt pour le stage ;
– Derniers relevés de notes ;
– Noms et coordonnées de référents.
Nous contacterons les étudiants par email pour organiser un entretien si le profil correspond et si la candidature nous semble pertinente.
Les stages sont rémunérés à la gratification en vigueur (environ 500€/mois). Vous travaillerez avec quelques personnes de l’UAR Data Terra et de l’Ontoportal Alliance, dans un contexte national et international. Une présence sur site est obligatoire. Certains stages peuvent déboucher sur une embauche en CDD.
Mots clés et technologies
Développement Web et full stack, Ruby/Rails, technologies Web (HTML5/CSS3, Bootstrap, JavaScript/JQuery, Framework JS), collaboration (GitHub), ressources sémantiques (ontologies, vocabulaires, thésaurus, terminologies), Technologies du web sémantique (RDFS, OWL, SKOS), Linked data, API REST
Description
Le Web sémantique aide à transformer les big data en connaissances exploitables grâce à des vocabulaires et ontologies standards, permettant aux ordinateurs d’indexer, rechercher et raisonner sur les données. Les ressources sémantiques , représentant formellement les concepts, relations et règles d’un domaine, structurent les données et les rendent FAIR. Des langages comme RDFS, SKOS, OWL encodent ces ressources sémantiques (ontologies et vocabulaires). Dans les différents domaines de recherche du Système Terre (e.g. océanographie, étude de l’atmosphère ou des sols, …), les experts thématiques développent ces ressources sémantiques pour faciliter l’intégration et l’interopérabilité de leurs données et permettre une extraction et exploitation des connaissances.
Face à l’augmentation du nombre de ressources sémantiques, des portails ouverts permettant d’héberger et de servir celles-ci pour les communautés scientifiques, ont été implémentés. L’EarthPortal (http://earthportal.eu), est le portail web dédié aux ressources sémantiques en Sciences de la Terre et de l’Environnement. Basé sur un modèle de métadonnées normalisées, le portail offre des fonctionnalités d’hébergement, de gestion des versions, de recherche, de visualisation, de commentaire, d’annotation et de recommandation. Aujourd’hui l’EarthPortal héberge environ 50 ressources sémantiques. Le code de l’EarthPortal (et des outils associés) est ouvert et disponible sur GitHub (https://github.com/EarthPortal).
Ces ressources sémantiques sont le plus souvent le fruit d’un travail complexe entre experts thématiques impliqués dans des projets nationaux ou internationaux. La gouvernance de ces artefacts sémantiques est importante pour identifier les auteurs et le contexte dans lequel ils ont été créés. L’EarthPortal dispose d’une fonctionnalité permettant de recenser et de lier les projets qui utilisent ou qui ont produit des artefacts sémantiques. Cette relation est formellement représentée et peut être utilisée afin de filtrer et classer les ressources sémantiques, permettant de faire des analyses sur leur utilisation.
L’objectif de ce stage est d’améliorer cette fonctionnalité Projets. Cela consistera à enrichir la composante Projet et à harmoniser l’interface correspondante avec le design général du portail. Il faudra en particulier ajouter des éléments de métadonnées permettant de compléter les informations à diffuser au sujet des projets. Ces métadonnées pourront être complétées automatiquement grâce à la création d’un connecteur avec des bases de données externes telle que la base des projets Européens Cordis ou celle de projets Francais : l’ANR. Un exemple de projet dans la base de données CORDIS où certains éléments réutilisables par l’EarhtPortal est disponible ici: https://cordis.europa.eu/project/id/101058785/en). Cela permettra de créer un lien direct entre les ressources sémantiques et les projets, avec une garantie de mise à jour automatique de l’EarthPortal grâce aux informations provenant des bases de données..
Objectifs détaillés du stage
- Améliorer le composant projet grâce à l’ajout de nouvelles métadonnées pour une meilleure description des projets.
- Modifier le modèle sous-jacent pour compléter la description des Projets
- Requêter les bases de données des organismes de financement pour extraire les informations automatiquement
- Créer un connecteur générique à des bases de données externe pour faciliter l’import de Projets
- Harmoniser l’interface graphique de la fonctionnalité Projets avec le design actuel
- Modifier les interfaces de navigation des vocabulaires pour les relier aux projets/bases de données externes
- Ajouter un filtre à l’interface pour sélectionner rapidement les ressources sémantiques en fonction des projets
- Ajouter des statistiques d’utilisation des ressources sémantiques par les projets.
- Écrire la documentation technique et utilisateur
Profil et compétences souhaitées
Étudiant.e en master en informatique, école d’ingénieur, avec un profil orienté web et une connaissance des technologies du web sémantique. La réalisation des missions du stage nécessitera une motivation pour apprendre les concepts du Web sémantique (ontologies et métadonnées) et le framework Ruby on Rails. Le stage peut donner l’opportunité de continuer en CDD ou en thèse sur un sujet proche. Un intérêt pour le domaine du Système Terre sera un atout pour le recrutement.