Lancement d’une nouvelle version du catalogue cat.InDoRES

Institutionnel

Le catalogue des jeux de données sur la biodiversité porté par l’UAR BBEES1 fait peau neuve . Cette nouvelle version, mise en ligne le 21 février 2024, regroupe les informations produites par l’ensemble des acteurs de la recherche collectées grâce au projet InDoRES (Inventaire des Données de Recherche en Environnement et Sociétés) et dans le cadre des réseaux des Zones Ateliers et des Observatoires Hommes-Milieux. C’est un outil sécurisé, répondant aux standards européens, porté par le CNRS et le Muséum national d’Histoire naturelle (MNHN) qui compte aujourd’hui 2 500 fiches de métadonnées descriptives sur des projets de recherche.

  • 1Bases de données sur la Biodiversité , Ecologie, Environnement et Sociétés, UAR 3468 CNRS-MNHN

Entretien avec Cécile Callou, directrice de l’unité d’appui et de recherche « Bases de données sur la biodiversité, l’écologie, l’environnement et sociétés » (BBEES – CNRS/MNHN) et Amandine Hénon, ingénieure d’étude dans la même unité, en charge du projet InDoRES.

Quelle est l’histoire de ce catalogue et dans quel contexte a-t-il été créé ?

Cécile Callou. Un premier travail de collecte de l’information avait été réalisé dès 2012 avec le portail bdd-inee. Mais c’est en 2018, en plein essor des initiatives autour de la Science Ouverte, que la première version InDoRES a été lancée. Cette année-là, le Ministère de l’Enseignement supérieur et de la Recherche a proposé son premier Plan national sur la Science ouverte (augmenté dans sa version de 2021), qui a souligné l’importance d’ouvrir les données de la recherche pour faciliter leur diffusion. Ce mouvement ne s’est en effet pas limité aux publications, il s’est étendu à leur « parent pauvre », les jeux de données. Cela a surtout amené à développer et proposer des outils pour rendre accessible ce bien partagé, de plus en plus convoité ! Aujourd’hui, les données, comme d’ailleurs les algorithmes et codes sources peuvent être valorisés dans des projets de recherche, notamment auprès de l’Agence nationale de la recherche pour les demandes de financement. Il n’est donc pas question de les diffuser n’importe comment.

Très concrètement, à quoi ressemble ce catalogue et pourquoi une nouvelle version ?

Amandine Hénon. Pour commencer, il faut bien distinguer catalogue et entrepôt de données, souvent confondus. Le catalogue référence les projets de recherche dans lesquels sont produits des bases ou jeux de données, et les données à proprement parler peuvent être stockées dans un ou plusieurs entrepôts en fonction de leur thématique (data.InDoRES par exemple pour les données de Biodiversité). L’intérêt du catalogue est donc vraiment de centraliser l’ensemble des informations qui permettent de contextualiser la production des données (qui, quand, où, pourquoi etc.). Il s’agit d’un annuaire en quelque sorte, mais qui s’appuie sur des standards et des référentiels en facilitant le partage.

La dernière version du catalogue cat.InDoRES a permis la mutualisation des référentiels utilisés par les Zones Ateliers et les Observatoires Hommes-Milieux et offre surtout un catalogue unique, avec des entrées spécifiques à chacun des réseaux. Elle regroupe aujourd’hui plus de 2 500 fiches de métadonnées, faisant gagner en visibilité les projets portés dans le domaine de l’écologie.

A qui s’adresse le catalogue cat.InDoRES ?

Amandine Hénon. Le catalogue s’adresse à l’ensemble des scientifiques du CNRS et du Muséum qui travaillent dans le domaine de la biodiversité. Il est aussi ouvert aux collaborations avec le CNRS ou le MNHN sur cette thématique. C’est un champ assez vaste puisqu’il s’agit de la biodiversité naturelle et culturelle, actuelle et passée.

Pourquoi préférer cat.InDoRES à d’autres catalogues ?

Cécile Callou. Il s’agit en premier lieu d’un outil porté et soutenu par le CNRS Ecologie & Environnement et le Muséum qui, grâce à un partenariat établi avec l’UAR BBEES, bénéficie pour son hébergement des compétences du centre de calcul de CNRS Nucléaire & Particules (IN2P3), garantissant ainsi sécurité et conditions de conservation. Ensuite, parce qu’il respecte les principes FAIR sur les données (faciles à trouver, accessibles, interopérables et réutilisables), ce qui permet de les faire vivre dans l’écosystème du domaine. Enfin, les mots-clés sont adaptés à la thématique et les métadonnées sont toujours vérifiées avant publication. Le catalogue, comme d’ailleurs l’entrepôt, est développé en cohérence avec l’initiative Recherche.Data.Gouv.fr.

Comment procéder si je souhaite ajouter mes données au catalogue cat.InDoRES ?

Amandine Hénon. La procédure est expliquée en détail sur le site web InDoRES, à la fois pour la description des projets et le dépôt de données. Il faut bien sûr que les données que l’on souhaite y faire apparaitre soient abouties et que l’on en soit propriétaire. Si vous avez des questions, vous pouvez nous écrire via le formulaire de contact ou à contact@indores.fr. Sachez que nous pouvons également avoir un rôle de conseil et vous rediriger vers d’autres catalogues ou entrepôts si nécessaire, en fonction de vos thématiques de recherche. Enfin, si le sujet de la Science ouverte vous intéresse, vous pouvez solliciter ou même rejoindre le réseau OpenDoRES, qui est composé des référents par unité. Dans ce cadre, des formations de prise en main de l’outil sont actuellement mises en place.