Le triplestore Data Persée réunit les données décrivant l’ensemble des ressources produites par Persée, qu’elles soient issues du portail Persée ou des Perséides, de manière structurée selon les principes du web sémantique.
Différents vocabulaires sont utilisés afin d’exprimer en RDF toute la diversité des types de données :
- DCMI (Dublin Core Metadata Initiative) pour décrire les documents
- FRBR (Functional Requirements for Bibliographic Records) pour distinguer les manifestations imprimées originales des manifestations électroniques produites par Persée à l’issue de la numérisation
- FOAF (Friend Of A Friend) pour décrire les personnes et les relations qui peuvent les lier
- CITO (Citation Typing Ontology) pour décrire les liens entre documents que ce soit sous la forme de citations, de compte-rendu ou de réponse
- BIBO (Bibliographic Ontology) pour décrire les différents types de documents
- SKOS (Simple Knowledge Organisation System) pour exprimer les concepts qui sont présents dans les documents. Lorsque ces concepts sont décrits par ailleurs, les modélisations proposées par les spécialistes du domaine ont été réutilisées et des alignements ont été établis entre les contenus de Persée et les référentiels en vigueur dans chaque communauté, afin de permettre aux utilisateurs de Data Persée de rebondir vers d’autres sources d’information suivant une logique de décloisonnement (idRef, DBpedia, GBIF, data.bnf.fr, le Cairo Gazetteer notamment).
Data Persée permet d’élargir les possibilités d’exploitation et de construire des requêtes complexes sur différents jeux de données. Disposer de tous les documents partageant certaines propriétés, connaître toutes les collaborations scientifiques d’un auteur, visualiser des tendances, mesurer l’influence d’une publication ou télécharger un jeu de données sont quelques exemples d’utilisation du triplestore de Persée.
Plusieurs modes d’explorations sont disponibles : le sparql endpoint pour les initiés et l’outil Sparklis qui permettra au plus grand nombre de formuler ses requêtes en langage naturel, sans connaissance a priori des contenus et de leurs modèles. Différents outils de visualisation permettent d’afficher les données et jeux de données sous une forme graphique. Enfin, une gamme de services est également proposée pour aider à s’approprier data.persee.fr et à en exploiter toute la richesse : un ensemble de tutoriels afin de prendre en main les interfaces de recherche, un espace d’échanges avec la communauté utilisatrice et de l’aide pour formuler des requêtes.