Certaines planches d’herbiers présentent des spécimens de plantes protégées, très rares, et l’étiquette présente souvent le détail du lieu de récolte. La publication au grand public de ces scans serait alors un risque supplémentaire pour ces plantes.

Nous avons réalisé l’analyse des besoins et organisé les différentes étapes d’études et validations. Nous avons expérimenté différentes méthodes pour produire une image de la planche publiable sans risque. La plus efficace a été sans conteste l’apprentissage d’un réseau de neurones convolutionnel, de type SSD, qui donne des résultats extrêmement proche d’un opérateur humain.
Pour le MNHN, en partenariat avec le CNAM

Un exemple de zones repérées, avec leur probabilité d’être une étiquette

Faire connaître cet article