Fouille de données

Cumulés, les contenus numériques produits par Persée – qu’ils alimentent le portail Persée  ou les Perséides – constituent une masse critique de données structurées. Au-delà de la simple consultation par le biais de sites web, ces données constituent un corpus à part entière pouvant faire l’objet d’exploitations transversales : visualiser des tendances, observer l’évolution de certains concepts, termes ou métaphores d’un point de vue diachronique, mesurer des occurrences, évaluer l’influence d’un auteur ou d’un texte au regard d’un contexte.


Vous pouvez accéder et utiliser ces données dans le respect du droit des tiers :


Data Persée  réunit les données décrivant l’ensemble des ressources produites par Persée, en RDF. Vous pouvez téléchargez un jeu de données, cela peut être une partie thématique ou l’intégralité du graphe, que vous pourrez étudier, manipuler, réutiliser sur votre ordinateur. Vous avez également la possibilité de rechercher directement dans le triplestore en utilisant le Sparql Endpoint ou le logiciel Sparklis qui permet de faire des requêtes en langage naturel.


L’entrepôt OAI-PMH permet de moissonner les métadonnées du portail Persée. Vous pouvez accéder aux métadonnées des documents (métadonnées bibliographiques en DC, MODS et marcXML) et à l’ensemble des informations permettant de représenter une collection (périodes et changement de titre, liste des numéros, publications parallèles) et un numéro (table des matières). L’accès au texte intégral des documents est réservé et soumis à certaines conditions.


● Le web service « Autorités » facilite le signalement des ressources liées aux autorités du portail Persée, dans d’autres interfaces et sites tiers. Vous pouvez récupérer la liste des identifiants des différentes autorités gérées par Persée (auteur, taxons ou encore monuments du Caire), connaître les rôles de chaque autorité personne ou encore disposer de l’ensemble des ressources documentaires associées à une autorité.

→ Vous êtes chercheur et les contenus produits par Persée sont pertinents dans le cadre d’un projet de fouille de textes et de données, ">contactez-nous.