Accès directs

Enrichir les publications scientifiques : un article et un poster pour RAPIDO

Enrichir les publications scientifiques : un article et un poster pour RAPIDO

Enrichir les publications scientifiques : un article et un poster pour RAPIDO

Dans le cadre du projet RAPIDO, Persée et l’Inist-CNRS ont co-signé un article et un poster, présentés lors de la conférence CORIA-TALN 2025 (Marseille, 30 juin au 4 juillet 2025).

Un article scientifique…

Rédigé par Lucas Anki, Pascal Cuxac, Justine Revol (Inist-CNRS) et Agnieszka Halczuk (Persée), ce travail présente une méthode pour identifier automatiquement des entités géographiques (toponymes) dans des articles scientifiques et les aligner avec des référentiels d’autorité IdRef. L’objectif : renforcer les liens entre publications et données de recherche validées.

…et un poster

Ces travaux ont également fait l’objet d’un poster présenté lors de la conférence. Intitulé « Rapido, interopérabilité et fouille de textes : vers un alignement des publications scientifiques en archéologie », il expose la chaîne de traitement mise en œuvre, les résultats obtenus ainsi que les perspectives d’évolution.

Une méthode et des premiers résultats

La méthode développée repose sur :

  • un corpus annoté issu du Bulletin de Correspondance Hellénique (15 volumes, 10 000 pages analysées), présent sur le portail Persée
  • une technique pour la reconnaissance d’entités nommées (NER), combinant annotation manuelle et apprentissage automatique (Flair, BERT)
  • une évaluation fine des résultats, avec une F-mesure de 85 % pour l’extraction des toponymes
  • une stratégie d’alignement automatique, avec une précision de 73 %, même en présence d’ambiguïtés

Les résultats obtenus montrent la robustesse du modèle, y compris sur des textes OCRisés, et ouvrent des perspectives d’amélioration (classification multi-labels, élargissement du périmètre géographique, navigation enrichie sur la plateforme Persée…).

Le projet RAPIDO associe également les Écoles françaises de Rome et d’Athènes, ainsi que l’Abes.

Lire l’article complet [PDF]

Voir le poster sur HAL