La validation des données

La validation, un gage de crédibilité et de transparence du SINP

Une multitude de jeux de données naturalistes est produite chaque année à La Réunion par de nombreux acteurs professionnels ou bénévoles. Ces données sont collectées selon des méthodes et protocoles différents et pour des objectifs variés : contribution aux diagnostics écologiques de zones d’études, appui aux actions de conservation ou de recherche, information des citoyens, publication d’indicateurs… Elles concernent des périmètres taxonomiques et géographiques divers, et les compétences et moyens des observateurs sont hétérogènes.

Dans le cadre du SINP, quelle que soit leur utilisation future, il est indispensable de garantir la fiabilité des données entrant dans le dispositif et de diffuser le niveau de confiance qui leur est associé. Cette exigence est un gage de crédibilité et de robustesse de l’ensemble de la démarche. Il s’agit aussi d’un retour d’information utile au producteur de données lui permettant de s’améliorer le cas échéant.

Les différentes étapes de la validation

La validation des données dans le cadre du SINP repose sur différentes étapes appliquées successivement lors de l'intégration de tout nouveau jeu de données dans Borbonica :

  1. l'identification des doublons, au sein du jeu de données d'une part, et entre celui-ci et les données déjà intégrées à Borbonica d'autre part ;
  2. le contrôle de la conformité, c'est-à-dire du respect du format standard de données ;
  3. le contrôle de la cohérence, c'est-à-dire de la logique des différents champs pour une même observation (par exemple une observation de gecko vert des Hauts en pleine mer sera a priori suspecte) ;
  4. la validation sur le fond ou validation scientifique, liée à la probabilité de la présence de tel taxon à tel endroit à tel moment.

Ces différents contrôles sont appliqués automatiquement par l'équipe projet Borbonica, puis affinés manuellement par les têtes de réseau. Ils aboutissent à l’attribution d’un niveau de validité (de “certain” à “invalide”), indice de la fiabilité associé à une donnée. Le grand public accède uniquement aux données les plus fiables (certaines ou probables), qui représentent 92% des observations au 31/12/2019. Les professionnels, réputés experts, accèdent quant à eux à l’ensemble des données indépendamment de leur niveau de validité, selon les conditions fixées par la charte régionale du SINP .

graphe_niveau_validite.png

Le protocole régional de validation

Un protocole de validation a été publié en septembre 2018 afin de formaliser les règles de validation des observations naturalistes intégrées au SINP de La Réunion. Issu d'un travail collaboratif entre les têtes de réseau du SINP, le Parc national et la DEAL, il constitue la déclinaison régionale du cadre méthodologique national publié par le MNHN en mars 2016.

Ce protocole tient compte de la connaissance disponible pour chaque espèce comme les aires de répartitions connues, les habitats préférentiels ou les gammes altitudinales d'occurrence. Il évolue régulièrement pour intégrer les nouvelles connaissances et fait l'objet d'examens réguliers par le Conseil scientifique régional du patrimoine naturel (CSRPN). Chaque évolution est versionnée et publiée sur internet par souci de transparence (voir ci-dessous).

Dans la version actuelle (v. 1.2 du 11/05/2020) , la validation scientifique concerne les reptiles (terrestres et marins), les amphibiens, les oiseaux, les mammifères (terrestres et marins), ainsi que les poissons et macro-crustacés d’eau douce. Les autres groupes ont vocation à être traités lors de mises à jour ultérieures.

Le protocole ne concerne que la validation au niveau de la plate-forme régionale SINP Borbonica, d’autres procédures de vérification pouvant avoir lieu en amont (validation par le producteur) ou en aval (validation par la plate-forme nationale SINP).


En savoir plus :

Télécharger le protocole de validation - volet occurrences de taxons (version 1.2 du 11/05/2020)