La BnF et SPARQL. Partie 2 : Œuvre, Expression, Manifestation

Publiée en 2011 par la Bibliothèque nationale de France (BnF), la base sémantique data.bnf.fr (Data) rassemble les données en provenance de trois autres bases : le Catalogue général, la base Archives et manuscrits, la bibliothèque numérique Gallica. Elle fournit des informations sur une variété d’objets physiquement présents en différentes salles et lieux de la BnF. Parmi ceux-ci, des livres, des périodiques, des partitions, des documents audios, des films, des jeux vidéo, des iconographies, des signalements de spectacles et d’expositions, des cartes et mappemondes, des documents d’archives, des pièces de musée, etc.

L’organisation des données dans Data se montre fortement influencée par une série de modèles conceptuels mis au point dans les années 1990, 2000 et 2010. Discuté à l’IFLA à partir de 1991 (International Federation of Library Associations and Institutions), le modèle FRBR (Functional Requirements for Bibliographic Records / Spécifications fonctionnelles des notices bibliographiques) propose d’organiser l’information bibliographique en quatre entités. Ce premier modèle est suivi en 2009 de FRAD (Functionnal Requirements of Authority Data), puis en 2011 de FRSAD (Functional Requirements for Subject Authority Data). Les trois documents deviennent intégrés en 2017, sous l’appellation “Library Reference Model / Modèle de Référence pour les Bibliothèques de l’IFLA”, encore appelé IFLA-LRM.

Ces modèles proposent tous d’organiser l’information bibliographique en quatre entités nommées Œuvre, Expression, Manifestation et Item. Œuvre rassemble les informations sur l’œuvre originale, telle que produite par le créateur, indépendamment du processus éditorial ou du support du document. La forme de l’œuvre (texte, musique, mixte) se montre importante. L’entité Expression renseigne sur les personnes et organismes qui jouent un rôle lors du processus de publication d’un texte en une langue, lors de la réalisation d’un spectacle ou du jeu d’une musique. Le niveau Manifestation contient les informations fournies par l’éditeur commercial, comme le titre propre, le lieu et la date de publication, l’ISBN pour un livre, le type de support, le nombre de pages, etc. L’entité Item renseigne sur l’exemplaire physiquement possédé par la bibliothèque, sa localisation dans les rayons, son intégrité.

Ce dernier niveau le plus concret, sur lequel le catalogage est effectué, se montre absent de Data. Plusieurs autres types de données sont présents dans Data. Certaines notices concernent les individus, les familles, les collectivités. D’autres concernent des thèmes répertoriés dans le thésaurus RAMEAU. Ces entités se montrent liées et apportent les renseignements nécessaires sur une variété de choses en relation avec les objets culturels des bibliothèques, des musées et des archives.

Dans ce billet, un bref historique des modèles théoriques est tout d’abord proposé. Les ontologies, classes, propriétés et dictionnaires de valeurs choisis pour donner corps à la théorie dans Data sont ensuite examinés. La documentation de la BnF, de même que plusieurs exemples servent à explorer la base et ses contenus à l’aide de l’interface standard.

Des requêtes SPARQL sont ensuite posées. Ce langage de requête, conseillé par le W3C dans sa version finale 1.1 depuis 2013 se montre bien adapté pour interroger finement Data. D’autres applications concernent l’extraction de lots de données, la réalisation d’études bibliométriques.

Des exemples variés sont finalement choisis sur le thème du roman pour la jeunesse “The Hobbit”, écrit par J.R.R Tolkien. Des œuvres diverses, traductions, adaptation en film ou jeu vidéo, font suite à la publication originale par “Allen & Unwin” de l’emblématique et étonnante œuvre originale, datée de 1937.

  1. Du modèle FRBR, à la transition bibliographique
    • 1.1 Les modèles FRBR, FRAD et FRSAD, le catalogage en RDA
    • 1.2 Le modèle LRM, la transition bibliographique, RDA-FR
    • 1.3 Le Modèle de Référence IFLA-LRM
  2. Le Modèle de Référence dans Data
    • 2.1 Entité Œuvre
    • 2.2 Entité Expression
    • 2.3 Entité Manifestation
  3. Le Hobbit, par Tolkien et d’autres
    • 3.1 The Hobbit, par John Ronald Reuel Tolkien
    • 3.2 J. R. R. Tolkien. Bilbo le Hobbit ou Histoire d’un aller et retour. Traduit de l’anglais par Francis Ledoux
    • 3.3 The Hobbit (film), réalisé par Peter Jackson
    • 3.4 Requêtes sur Tolkien et le Hobbit

Requêtes SPARQL :

  • Q1.1 Compter le nombre d’entités de type Concept, Œuvre, Expression, Manifestation dans Data ? Lien
  • Q2.1 Niveau Œuvre : Quels sont les effectifs par genre créatif (rdagroup1elements) présents dans Data ? : Lien
  • Q2.2 Niveau Œuvre : Répartition par année de première édition des œuvres originales (rdagroup1elements) ? : Lien
  • Q2.3 Niveau Œuvre : Quels sont les effectifs par sujet (bnf-onto) des œuvres originales ? : Lien
  • Q2.4 Niveau Œuvre : Quels sont les effectifs par sujet (dcterms) des œuvres originales ? : Lien
  • Q2.5 Niveau Œuvre : Quels sont les créateurs dont les œuvres sont le plus souvent publiées : Lien
  • Q2.6 Niveau Œuvre : Compter les œuvres originales agrégées et agrégeantes : Lien 1, Lien 2
  • Q2.7 Niveau Œuvre : Compter le nombre de périodiques : Lien
  • Q2.8 Niveau Œuvre : Compter le nombre de spectacles : Lien
  • Q3.1 Niveau Expression : Quels sont les effectifs des divers types d’expressions : Lien
  • Q3.2 Niveau Expression : Quelles sont les sujets (dcterms) et effectifs des expressions ? : Lien
  • Q3.3 Niveau Expression : Quelles sont les langues (dcterms) et effectifs des entités expression ? : Lien
  • Q3.4 Niveau Expression : Quelles sont les les effectifs de personnes jouant des rôles particuliers ? : Lien
  • Q4.1 Niveau Manifestation : quels sont les éditeurs (rdagroup1elements) les plus présents dans Data ? : Lien
  • Q4.2 Niveau Manifestation : quels sont les effectifs par années (dcterms) de publication ? : Lien
  • Q4.3 Niveau Manifestation : quels sont les effectifs par lieu de publication (rdagroup1elements) ? : Lien
  • Q4.4 Niveau Manifestation : quels sont les genres littéraires pour la jeunesse les plus référencés : Lien
  • Q5.1 Lister les œuvres originales de J.R.R. Tolkien présentes dans Data : Lien
  • Q5.2 Lister les œuvres originales de J.R.R. Tolkien référencées dans Data, ainsi que les diverses éditions en résultant : Lien
  • Q5.3 Lister l’ensemble des éditions auxquelles J.R.R. Tolkien a participé de manière directe ou indirecte : Lien
  • Q5.4 Lister les éditions dérivées de l’œuvre originale “The Hobbit” de J.R.R. Tolkien : Lien
  • Q5.5 Lister les œuvres originales dont le titre contient le mot “Hobbit” : Lien

1. Du modèle FRBR, à la transition bibliographique

Jusqu’à la fin des années 1990, tout document d’une bibliothèque était décrit dans le catalogue informatisé sous forme d’une notice bibliographique simple. Appliquée partout, la règle consistait en  « 1 item = 1 notice ». Avec le développement des supports numériques (CD, DVD, jeux vidéos, logiciels, ebooks, etc.) et la mise au point du web, en particulier du web sémantique dans les années 2000 à 2010 environ, la nécessité d’améliorer cette logique en l’élargissant est apparue.

Des réflexions furent alors régulièrement menées au niveau international par l’IFLA (International Federation of Library Associations and Institutions / Fédération Internationale des Associations de bibliothécaires et des Institutions), dans l’objectif de spécifier un modèle de données dédié au catalogage et à l’exposition sur le web qui fasse l’unanimité.

17 éditions en divers formats de la même œuvre originale de Dickens (A Christmas Carol / Un chant de Noël) : Lien

1.1 Les modèles FRBR, FRAD et FRSAD, le catalogage en RDA

Mis au point en plusieurs versions à partir de 1991, et approuvé par l’IFLA en 1997, le modèle conceptuel FRBR (Functional Requirements for Bibliographic Records / Fonctionnalités requises des notices bibliographiques) est publié en version finale en 2009.

Il apporte une réflexion sur l’organisation théorique à mettre en place pour que les bibliothèques puissent cataloguer de manière plus intégrée et liée des items de différentes natures, tels que des livres, des disques, des cartes, des journaux, des œuvres isolées et agrégées sous forme de séries, dans leurs versions papier et électronique.

FRBR devient à partir de 2009 complété par le modèle FRAD (Functionnal Requirements of Authority Data), dédié à la modélisation des données d’autorité. Les réflexions incluent les formes retenues et rejetées d’un nom de personne, de collectivité (organisme, institution, entreprise), d’un titre de document, d’un concept, d’un lieu. Puis en 2011, le modèle FRSAD (Functional Requirements for Subject Authority Data) précise les fonctions nécessaires à l’attribution de codes de classement et de sujets à une œuvre.

À partir de 2010, trois organismes anglo-saxons, l’ALA (American Library Association), le CFLA (Canadian Federation of Library Associations), et le CILIP (Chartered Institute of Library and Information Professionals) au Royaume-Uni, élaborent de nouvelles règles de catalogage conformes à ces divers modèles. Les règles de catalogage, de même que l’ontologie qui en résulte sont nommées RDA (Resource Description and Access). L’ALA, le CFLA et le CILIP sont détenteurs des droits de copie. Une internationalisation de l’initiative débute en 2015.

L’Allemagne et l’Australie se joignent au mouvement. RDA est conçu pour être utilisé en ligne, par le biais d’un portail nommé “RDA Toolkit”, accessible sur abonnement depuis 2010. Le code de catalogage RDA est actuellement adopté en Europe par des pays comme l’Allemagne, l’Espagne, la Lettonie, la Belgique. Réalisée conjointement par le Québec et la France, une traduction en français des règles est disponible depuis 2013. L’accès en reste réservé.

Disponible en accès libre, l’ontologie RDA traduite en 17 langues fin 2022, est accessible sur le site “RDA Registry”. Les classes et propriétés sont documentées et gérées sous github par le “RDA Steering Committee” (RSC), composé des membres des organismes fondateurs élargis de certains membres de RDA Europe. Héloïse Lecomte pour l’ABES et Emmanuel Jaslier pour la BnF représentent actuellement la France dans le RSC.

La version actuelle de Data tire certaines de ses propriétés de versions maintenant déclassées de l’ontologie RDA, telle qu’elle existait en 2010.

  • Différentes versions du modèle FRBR, dans l’entrepôt de l’IFLA : Lien
  • Functional Requirements for Authority Data (2009) : Lien
  • Functional Requirements for Subject Authority Data (FRSAD): Final Report : Lien
  • FRAD – Functional Requirements for Authority Data (2009), dans l’entrepôt de l’IFLA : Lien
  • FRSAD – Functional Requirements for Subject Authority Data : Lien
  • RDA Toolkit : Lien
  • RDA en français, RDA Toolkit, en accès réservé : Lien
  • RDA Steering Committee (RSC) : Lien
  • RDA Registry, en accès libre : Lien

1.2 Le modèle LRM, la transition bibliographique, RDA-FR

Cependant, toujours menés par l’IFLA, les travaux sur la modélisation de données se poursuivent en parallèle. Publié en 2017, le modèle entité-relation IFLA LRM (Library Reference Model) unifie dans sa présentation les trois modèles FRBR, FRD et FRSAD.

Le Modèle de Référence se place dans la continuité de FRBR, en amont de toute règle de catalogage, de toute ontologie ou de tout système intégré de gestion de bibliothèque (SIGB). L’ontologie qui résulte de LRM est finalement publiée en accès libre sous le nom de LRMer à partir de 2020 en anglais uniquement. Une traduction en dix langues du modèle LRM est proposée en 2022.

Les modèles FRBR, FRAD, FRSAD ou bien le modèle de référence unifié LRM ne fournissent aucune précision sur les règles de catalogage à adopter, pas plus que sur les aspects informatiques d’une application conçue pour le catalogage ou la diffusion des données. Les formats de catalogage UNIMARC, INTERMARC et Marc21 ne sont pas cités, pas plus que ne le sont les ontologies, bien que la démarche s’inscrive clairement dans l’optique du web de données.

En 2018, le “RDA Steering Committee” fait évoluer de manière significative le “RDA Registry” pour tenir compte des apports du modèle LRM. Des pays francophones comme la Belgique et la Suisse, le Québec adoptent RDA. Soutenu par l’Europe, une association Belge RDA Europe est fondée. La France, sous la voix de la BnF, adopte vis à vis de RDA une position qui lui est propre : « les consignes internationales sont reprises – lorsque c’est possible, et adaptées au contexte français – chaque fois que nécessaire ».

À partir de 2015, le passage progressif des anciennes aux nouvelles règles de catalogage devient formalisé sous le nom de « transition bibliographique ». Le catalogage devient plus complexe. Un code de catalogage, intitulé RDA-FR est écrit et appelé à remplacer progressivement les règles nationales précédentes, normalisées AFNOR. L’essentiel de ces nouvelles règles devrait être disponible en 2023. Des formations sont mises en place, de nouveaux logiciels dédiés au catalogage en FRBR sont mis au point.

Secondées par un prestataire, la BnF et l’ABES (Agence Bibliographique de l’Enseignement Supérieur) épaulées des ministères de la Culture et de l’Enseignement supérieur gèrent l’initiative. Une évolution des formats de catalogage UNIMARC (pratiqué à la BnF) et INTERMARC (pratiqué par l’ABES) s’avère nécessaire. Menée en parallèle, la publication d’une ontologie nommée RDA-FR, dédiée à la description des ressources et à leur exposition, est envisagée début 2023.

La démarche française s’inscrit dans le cadre de l’ouverture des données produites par les administrations et la recherche. Lancé en 2017, un projet de Fichier national d’entités (FNE), toujours en cours de développement, doit servir de preuve de concept de la démarche française et pourrait sortir dans les années qui viennent.

  • IFLA Library Reference Model: A Conceptual Model for Bibliographic Information; Riva, Pat; Le Boeuf, Patrick, Žumer, Maja, 2018 : Lien
  • IFLA LRM: Un modèle conceptuel pour l’information bibliographique, traduction française par Pat Riva, Patrick Le Bœuf et Maja Žumer et Al., 2021 : Lien
  • LRM Entity-Relationship Model Elements (LRMer), 2020 : Lien
  • RDA Euope, 2017 : Lien
  • Rapport d’évaluation de RDA révisé (2019) par le groupe Normalisation de la Transition bibliographique, 2021 : Lien
  • La Transition bibliographique en France, 2022, enjeux, position française, RDA, Transition bibliographique : Lien
  • Lancement de l’élaboration de l’ontologie RDA-FR, Transition bibliographique, 2022 : Lien
  • Code RDA-FR, Transition bibliographique : Lien
  • Texte des éléments RDA-FR publiés, Transition bibliographique : Lien
  • Ontologie RDA-FR : Lien
  • Le projet Fichier national d’entités, Transition bibliographique, 2022 : Lien
  • Historique des travaux français sur RDA, Transition bibliographique, 2022 : Lien
  • Un avant-goût du RDA Toolkit officiel, RDA Toolkit, 2022 : Lien

1.3 Le Modèle de Référence IFLA-LRM

Le Modèle de Référence LRM de l’IFLA est un document d’une centaine de pages dont les indications marquantes sont ici résumées. Le modèle définit ce que doit décrire au minimum un système de bibliothèque visant à cataloguer et fournir des informations au public. Onze entités formant une hiérarchie de classes et de sous-classes sont définies. Les entités de même que le vocabulaire défini par FRBR, FRAD et FRSAD sont la plupart du temps repris et normalisés.

En particulier, les quatre entités définies initialement par le modèle FRBR : Œuvre, Expression, Manifestation et Item, sont conservés. On utilise souvent l’acronyme WEMI, ou bien en français OEMI pour mémoriser cette série qui repose sur une logique créative temporelle : une œuvre est créée tout d’abord indépendamment de l’éditeur (Œuvre), plusieurs personnes prennent part à l’édition en une langue donnée (Expression), l’éditeur publie (Manifestation), la bibliothèque achète et diffuse auprès de son public (Item).

  • LRM-E1 Res : Signifie “chose” en latin. Toute entité présente dans l’univers du discours
    • LRM-E2 Œuvre : Le contenu intellectuel ou artistique d’une création distincte, qui implique une démarche intellectuelle ou artistique particulière. Dans le cas des œuvres agrégatives et des œuvres périodiques, l’essence
      de l’œuvre est le concept ou le plan de sélection, de regroupement et d’ordonnancement d’expressions d’œuvres.
    • LRM-E3 Expression : Une combinaison particulière de signes qui véhicule un contenu intellectuel ou artistique
    • LRM-E4 Manifestation : Une manifestation résulte de la fixation d’une ou plusieurs expressions sur un ou plusieurs supports.
    • LRM-E5 Item : Dans bien des cas, un item est un objet matériel unique.
    • LRM-E6 Agent : Une entité à même d’agir de son propre chef, de se voir accorder des droits et d’être tenue pour responsable de ses actions
      • LRM-E7 Personne : Un être humain en particulier
      • LRM-E8 Agent Collectif : Groupement ou association de personnes portant un nom particulier et disposant de la faculté d’agir collectivement
    • LRM-E9 Nomen : Signifie “nom” en latin. Une association entre une entité et une désignation qui y réfère.
    • LRM-E10 Lieu : Une étendue spatiale donnée
    • LRM-E11 Laps de Temps : Plage temporelle ayant un début, une fin et une durée

Le Modèle de Référence définit pour chaque entité des attributs possibles et pertinents, mais non obligatoires. Les entités filles héritent des entités parentes la possibilité d’utiliser les attributs, lorsque cela est pertinent.

  • LRM-E1 Res : LRM-E1-A1 Catégorie, LRM-E1-A2 Note
    • LRM-E2 Œuvre : LRM-E2-A1 Catégorie, LRM-E2-A2 Attribut d’expression représentative
    • LRM-E3 Expression : LRM-E3-A1 Catégorie, LRM-E3-A2 Taille, LRM-E3-A3 Public destinataire, LRM-E3-A4 Droits d’utilisation, LRM-E3-A5 Échelle cartographique, LRM-E3-A6 Langue, LRM-E3-A7 Tonalité, LRM-E3-A8 Distribution d’exécution
    • LRM-E4 Manifestation : LRM-E4-A1 Catégorie de support matériel, LRM-E4-A2 Importance matérielle, LRM-E4-A3 Public destinataire, LRM-E4-A4 Mention de manifestation, LRM-E4-A5 Conditions d’accès, LRM-E4-A6 Droits d’utilisation
    • LRM-E5 Item : LRM-E5-A1 Localisation, LRM-E5-A2 Droits d’utilisation
    • LRM-E6 Agent : LRM-E6-A1 Coordonnées, LRM-E6-A2 Domaine d’activité, LRM-E6-A3 Langue
      • LRM-E7 Personne : LRM-E7-A1 Profession / Occupation
      • LRM-E8 Agent Collectif :
    • LRM-E9 Nomen : LRM-E9-A1 Catégorie, LRM-E9-A2 Chaîne du nomen, LRM-E9-A3 Schéma d’encodage, LRM-E9-A4 Public destinataire, LRM-E9-A5 Contexte d’utilisation, LRM-E9-A6 Source de référence, LRM-E9-A7 Langue, LRM-E9-A8 Écriture, LRM-E9-A9 Conversion d’écriture
    • LRM-E10 Lieu : LRM-E10-A1 Catégorie, LRM-E10-A2 Localisation
    • LRM-E11 Laps de Temps : LRM-E11-A1 Début, LRM-E11-A2 Fin

De plus, au nombre de 36, des relations lient les entités entre elles. Celles-ci sont ici listées sous forme de tableau simplifié, et représentées ensuite sous forme de graphe :

RelationDomaineNomNom inverseCo-domaine
LRM-R1Resest associée àest associée àRes
LRM-R2Œuvreest réalisée à traversréaliseExpression
LRM-R3Expressionest matérialisée dansmatérialiseManifestation
LRM-R4Manifestationest exemplifiée parexemplifieItem
LRM-R5Œuvrea été créée para crééAgent
LRM-R6Expressiona été créée para crééAgent
LRM-R7Manifestationa été créée para crééAgent
LRM-R8Manifestationa été fabriquée para fabriquéAgent
LRM-R9Manifestationest distribuée pardistribueAgent
LRM-R10Itemest possédé parpossèdeAgent
LRM-R11Itema été modifié para modifiéAgent
LRM-R12Œuvrea pour sujetest le sujet deRes
LRM-R13Resa pour appellationest une appellation deNomen
LRM-R14Agenta attribuéa été attribué parNomen
LRM-R15Nomenest l’équivalent deest l’équivalent deNomen
LRM-R16Nomena pour partiefait partie deNomen
LRM-R17Nomenest dérivé dea pour dérivationNomen
LRM-R18Œuvrea pour partiefait partie deŒuvre
LRM-R19ŒuvreprécèdesuccèdeŒuvre
LRM-R20Œuvreaccompagne / complèteest accompagnée par / est complétée parŒuvre
LRM-R21Œuvreest source d’inspiration pourinspirée deŒuvre
LRM-R22Œuvreest une transformation dea été transformée enŒuvre
LRM-R23 Expressiona pour partiefait partie deExpression
LRM-R24 Expressionest dérivée dea pour dérivationExpression
LRM-R25 Expressiona été agrégée paragrègeExpression
LRM-R26 Manifestationa pour partiefait partie deManifestation
LRM-R27Manifestationa pour reproductionreproduitManifestation
LRM-R28Itema pour reproductionreproduitManifestation
LRM-R29Manifestationa pour présentation alternativea pour présentation alternativeManifestation
LRM-R30Agentest membre dea pour membreAgent Collectif
LRM-R31Agent Collectifa pour partiefait partie deAgent collectif
LRM-R32 Agent collectifprécèdesuccède àAgent collectif
LRM-R33Resa pour lieu associéest associé àLieu
LRM-R34Lieua pour partiefait partie deLieu
LRM-R35Resa pour laps de temps associéest associé àLaps de temps
LRM-R36Laps de tempsa pour partiefait partie deLaps de temps

Plusieurs instances de l’entité Œuvre peuvent apparaitre liées entre elles par des relations comme “a pour partie, précède, complète, est une inspiration pour, est une transformation de”. Une œuvre peut se présenter sous la forme d’un texte, d’une musique, d’un objet.

L’entité Expression se montre relative à la langue d’édition, à l’éventuel traducteur pour un texte, à une tonalité pour une musique. Des aspects intellectuels, les rôles joués par des personnes et des organismes responsables de la création d’un livre ou de l’exécution d’une musique, sont renseignés à ce niveau.

L’entité Manifestation concerne des aspects matériels fournis par l’éditeur. Les informations concermant la création, la fabrication, la distribution des multiples items sont introduites à ce niveau.

Item spécifie des attributs et relations qualifiant un exemplaire particulier de livre, de disque, susceptible d’être reproduit sous forme d’une autre Manifestation, sur lequel des droits de propriété peuvent être exercés. Le document officiel fournit de nombreux exemples qui permettent de préciser la portée des choses définies et de lever les ambiguïtés.

Les 11 entités du Modèle de Référence IFLA-LRM, ainsi que quelques unes des relations
Une référence bibliographique structurée selon le Modèle FRBR (formation RERO des bibliothécaires suisses) : Lien
  • IFLA LRM, Un modèle conceptuel pour l’information bibliographique, 2017, PDF : Lien

2. Le Modèle de Référence dans Data

Le modèle IFLA-LRM se veut théorique et la base Data n’en implémente qu’une partie. L’entité Item se montre en effet absente. L’information bibliographique correspondante se montre cependant partiellement accessible : au niveau Manifestation, des liens renvoient de Data vers le Catalogue, Gallica et la base Archives et manuscrits.

Non spécifiés dans le modèle LRM, des liens de Data vers des référentiels externes ont été référencés. Parmi ceux-ci, il est possible de noter Wikipédia en français, VIAF (Virtual International Authority File, le fichier d’autorité de l’OCLC), IdRef (le fichier d’autorité de l’ABES), Wikidata (la base sémantique de Wikipédia), DBpedia (une autre base sémantique issue de Wikipédia), etc.

Des informations comme le titre original, le nom du ou des créateurs, la forme de l’œuvre (texte, musique, œuvre mixte, film, périodique, événement, etc…) sont spécifiés dans l’entité Œuvre. Lorsqu’une œuvre originale change de forme (est adaptée), on considère qu’il s’agit d’une nouvelle œuvre originale. Les œuvres agrégatives rassemblent des groupes de documents, d’objets, de morceaux de musiques ou de films, dont chaque partie peut être distinguée. Les revues et journaux sont considérés comme des sortes d’œuvres périodiques et agrégées, qui présentent des propriétés particulières, comme la fréquence de diffusion par exemple.

Les contributeurs à une édition – personnes et organismes – sont référencés au niveau Expression. Des choses comme le titre propre, le nom de l’éditeur, l’année d’édition, le lieu d’édition concernent l’entité Manifestation. Les liens vers le catalogue ou des versions numériques sur Gallica concernent ce niveau. Plusieurs dictionnaires comme le thésaurus RAMEAU (thèmes, lieux), le dictionnaire des rôles joués par les agents, le dictionnaire des genres créatifs, le dictionnaire des langues, servent à renseigner les contenus. Un schéma général abrégé fournit des indications sur les entités, relations, et attributs.

L’entité Concept se montre centrale dans Data. Elle regroupe dans ses fonctionnalités les entités Res et Nomen du Modèle LRM. Les propriétés de Concept permettent de nommer de manière préférentielle et alternative tout concept en différentes langues. Des liens vers des référentiels externes sont renseignés lorsque le Concept se montre relatif à une Œuvre ou à un auteur.

Au niveau informatique, des pages HTML sont générées à l’aide de l’application open-source CubicWeb de la société Logilab. Une base orientée graphe contient l’information bibliographique au format RDF. Le modèle FRBR est implémenté à l’aide de plusieurs ontologies, parmi lesquelles Dublin Core, FOAF, bibo, rdaregistry. L’interrogation à l’aide de SPARQL est possible. L’interface Yasgui de la société Triply a été implémentée et elle apporte une aide bienvenue à la formulation de requêtes.

  • Data BnF, Web sémantique et modèle de données, PDF : Lien
  • CubicWeb – The Semantic Web is a construction game!, Logilab, documentation : Lien
  • Yasgui, par Triply : Lien
  • Data BnF, Logilab : Lien
  • Data, Interface d’interrogation SPARQL : Lien

Un deuxième schéma fournit des indications plus précises sur l’implémentation de FRBR dans Data. On remarque l’usage des ontologies rdfs, skos, dcterms, foaf, bibo, rdarelatioships, rdagroup1elements, bnf-onto essentiellement. On distingue conformément à LRM les relations entre entités internes et externes, marquées par des flèches. Les attributs des diverses entités sont indiqués sous forme de pavés listant les ontologies et propriétés, avec un lien vers “Littéraux”.

Modèle de donnée des éditions (Expression, Manifestation) et œuvres originales (Œuvre) dans Data

Quelques requêtes SPARQL permettent l’exploration statistique de Data. Les résultats mentionnés sont en date de fin 2022.

Q1.1 Compter le nombre d’entités de type Concept, Œuvre, Expression, Manifestation, Année ? Lien

# Effectif des entités de type Œuvre, Expression, Manifestation, Instant (année)
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX owl-time:<http://www.w3.org/TR/owl-time/>
SELECT 
#  (COUNT (?workUri) AS ?workNb)
#  (COUNT (?expressionUri) AS ?expressionNb)
#  (COUNT (?manifestationUri) AS ?manifestationNb)
  (COUNT (?annee) AS ?anneeNb)
WHERE {
#  ?workUri a frbr-rda:Work.
#  ?expressionUri a frbr-rda:Expression.
#  ?manifestationUri a frbr-rda:Manifestation.
  ?annee a owl-time:Instant.
}
Type des entitésEffectifPage HTML liée
Concept19 454 701dans Data : 1 571 606
Œuvre1 779 702dans Data : 61 423
Expression12 627 236dans Data : 0
Manifestation12 627 236dans Data : 0, dans Gallica : 1 298 424
Effectif de diverses entités, fin 2022

Dans Data, la règle “une manifestation = une expression” est observée. On remarque que les entités sont toujours visibles en RDF XML. Elles peuvent être interrogées avec SPARQL, mais ne disposent pas toujours d’une page HTML dédiée.

2.1 Entité Œuvre

Les informations bibliographique de niveau Œuvre sont réparties en deux parties différentes. 1/ l’entité Concept est identifiée par son IRI simple. Elle contient essentiellement le libellé préférentiel (skos:prefLabel) de l’œuvre originale, des libellés alternatifs (skos:altLabel), des liens vers des référentiels externes (skos:exactMatch), le lien vers le Catalogue (rdfs:seeAlso) et vers d’autres référentiels. 2/ l’entité Œuvre de la notice est identifiée par l’IRI du Concept suffixé du fragment “#about”. Elle contient les nombreuses propriétés descriptives de l’œuvre originale.

Une publication originale peut se montrer absente des rayons, et identifiée par le travail des catalogueuses et catalogueurs. De plus, un processus semi-automatique de génération des notices de niveau Œuvre est utilisé dans Data. Les triplets sont fabriqués de manière programmée à partir des informations récupérées du catalogue. Pour chaque créateur, les titres de ses publications sont extraites, et regroupées par similarité de manière automatique. Les informations sont ensuite traitées et entrées dans Data. Les fichiers RDF des œuvres originales sont ensuite calculés et les pages HTML sont générées utomatiquement.

Une requête SPARQL montre que Data référence 1 779 702 œuvres originales fin 2022. Une œuvre originale se montre également définie par sa forme. A chaque œuvre originale, une forme particulière est attribuée (texte, musique, mixte, audio et vidéo, etc). Un dictionnaire des formes d’œuvres référence les possibilités. Un code alphabétique sur 2 à 5 caractères référence la liste des genres. Un premier niveau est constitué de 15 formes créatives principales. Des sous-catégories complètent les possibilités. Les “Œuvres textuelles” constituent l’essentiel des effectifs.

  • Liste des vocabulaires employés dans Data, et à la BnF : Lien
  • Dictionnaire des genres ou formes d’œuvres originales dans Data : Lien
genre ou forme de création principalescodeeffectif via HTML
Manuscrits et archivesmarch130 542
Non définindef2 447
Objetsob147
Œuvres audiovisuelles (y compris radio)au31 810
Œuvres cartographiquesca22
Œuvres chorégraphiquesch1 264
Œuvres de mise en scènems17
Œuvres des beaux-arts et des arts décoratifsba2 167
Œuvres iconographiquesic44 322
Œuvres logicielles ou multimédialomu10 297
Œuvres mixtesmi166 700
Œuvres musicalestum183 590
Œuvres numismatiquesnu3 834
Œuvres textuelleste1 271 304
Spectaclesspe61 423

Systématiquement associés à l’entité Œuvre, on peut ensuite avec SPARQL compter les genres créatifs présents dans Data. On se sert d’une agrégation sur la variable ?forme pour explorer de manière précise les contenus. La base contient en 2022 386 genres créatifs distincts. Les effectifs fournis par les pages HTML associées à la forme créative se montrent supérieurs à ceux trouvés à l’aide de SPARQL. Non négligeable pour les œuvres textuelles, la cause de cette différence est à rechercher.

Q2.1 Niveau Œuvre : Quelles sont les diverses formes d’œuvres (rdagroup1elements) et leur nombre ? : Lien

# Effectif des "formes d'œuvres" dans Data
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
SELECT ?forme (COUNT (?forme) AS ?formeNb)
WHERE {
  ?workUri a frbr-rda:Work.
  ?workUri rdagroup1elements:formOfWork ?forme.
}
GROUP BY ?forme ?formeNb
ORDER BY DESC(?formeNb)
formeEffectif calculé avec SPARQLEffectif HTML
1<http://data.bnf.fr/vocabulary/work-form/te>“937242”^^<http://www.w3.org/2001/XMLSchema#integer>1 271 304
2<http://data.bnf.fr/vocabulary/work-form/tum>“183535”^^<http://www.w3.org/2001/XMLSchema#integer>183 590
3<http://data.bnf.fr/vocabulary/work-form/mi>“141743”^^<http://www.w3.org/2001/XMLSchema#integer>166 700
Les 3 premières de 386 formes d’œuvres (te:texte, tum:musique, mi:mixte)

L’année de création d’une œuvre est renseignée dans le champ “rdagroup1elements:dateOfWork”. Les effectifs par année de publication peuvent être calculés.

Q2.2 Niveau Œuvre : Répartition par année de première édition des œuvres originales (rdagroup1elements) ? : Lien

# Année de première édition des entités de type Œuvre
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
SELECT ?annee (COUNT (?annee) AS ?anneeNb)
WHERE {
  ?workUri a frbr-rda:Work.
  ?workUri rdagroup1elements:dateOfWork ?annee
}
GROUP BY ?annee ?anneeNb
ORDER BY DESC(?annee)
anneeanneeNb
1<http://data.bnf.fr/date/2022/>“119”^^<http://www.w3.org/2001/XMLSchema#integer>
2<http://data.bnf.fr/date/2021/>“723”^^<http://www.w3.org/2001/XMLSchema#integer>
3<http://data.bnf.fr/date/2020/>“9569”^^<http://www.w3.org/2001/XMLSchema#integer>
4<http://data.bnf.fr/date/2019/>“23585”^^<http://www.w3.org/2001/XMLSchema#integer>

Le sujet de l’œuvre est également donné en valeur de la propriété “bnf-onto:subject”. Ce champ admet 62 valeurs; il se montre toutefois rarement renseigné.

Q2.3 Niveau Œuvre : Quels sont les effectifs par sujet (bnf-onto) des œuvres originales ? : Lien

# Sujets Bnf des entités de type Œuvre
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX bnf-onto: <http://data.bnf.fr/ontology/bnf-onto/>
SELECT ?sujetBnf (COUNT (?sujetBnf) AS ?sujetBnfNb)
WHERE {
  ?workUri a frbr-rda:Work.
  ?workUri bnf-onto:subject ?sujetBnf
}
GROUP BY ?sujetBnf
ORDER BY DESC(?sujetBnfNb)
sujetBnfsujetBnfNb
1Arts graphiques“42882”^^<http://www.w3.org/2001/XMLSchema#integer>
2Audiovisuel“29578”^^<http://www.w3.org/2001/XMLSchema#integer>
3Informatique“10020”^^<http://www.w3.org/2001/XMLSchema#integer>
4Littératures“9848”^^<http://www.w3.org/2001/XMLSchema#integer>
4 de 62 sujets des entités Œuvre

Q2.4 Niveau Œuvre : Quels sont les effectifs par sujet (dcterms) des œuvres originales ? : Lien

On trouve au total 36 930 sujets différents. Il peut s’agir d’un code de classement Dewey (61 valeurs possibles), d’une personne (1529 valeurs), d’une organisation (879 valeurs), de concepts divers, parmi lesquels d’autres œuvres originales (33862 valeurs).

# Sujets dcterms des entités de type Œuvre
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
SELECT ?sujet ?sujetNomFamille ?sujetNom ?sujetLabel ?sujetTitre (COUNT (?sujet) AS ?sujetNb)
WHERE {
  ?workUri a frbr-rda:Work.
  ?workUri dcterms:subject ?sujet.
#  ?sujet a foaf:Person.
  OPTIONAL {?sujet foaf:familyName ?sujetNomFamille}
  OPTIONAL {?sujet foaf:name ?sujetNom}
  OPTIONAL {?sujet skos:prefLabel ?sujetLabel}
  OPTIONAL {?sujet dcterms:title ?sujetTitre}
}
GROUP BY ?sujet ?sujetNomFamille ?sujetNom ?sujetLabel ?sujetTitre
ORDER BY DESC(?sujetNb)

Nous pouvons finalement calculer les auteurs dont les œuvres sont les plus fréquemment exprimées. Des compositeurs de musique sont essentiellement trouvés.

Q2.5 Niveau Œuvre : Quels sont les créateurs dont les œuvres sont le plus souvent publiées : Lien

# Fréquence des créateurs pour les entités de type Œuvre
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?createur ?nom (COUNT (?createur) AS ?createurNb)
WHERE {
  ?workUri a frbr-rda:Work.
  OPTIONAL {
    ?workUri dcterms:creator ?createur.
    ?createur foaf:name ?nom.
  }
}
GROUP BY ?createur ?nom ?createurNb
ORDER BY DESC(?createurNb)
LIMIT 30
createurnomcreateurNb
1<http://data.bnf.fr/ark:/12148/cb118897907#about>Johann Sebastian Bach“778”^^<http://www.w3.org/2001/XMLSchema#integer>
2<http://data.bnf.fr/ark:/12148/cb14027233b#about>Wolfgang Amadeus Mozart“615”^^<http://www.w3.org/2001/XMLSchema#integer>
3<http://data.bnf.fr/ark:/12148/cb13899553z#about>Franz Schubert“578”^^<http://www.w3.org/2001/XMLSchema#integer>
4<http://data.bnf.fr/ark:/12148/cb12340814p#about>Roland de Lassus“558”^^<http://www.w3.org/2001/XMLSchema#integer>
5<http://data.bnf.fr/ark:/12148/cb138994541#about>Domenico Scarlatti“531”^^<http://www.w3.org/2001/XMLSchema#integer>
Les 5 créateurs dont les œuvres sont le plus souvent publiées, d’après Data

Q2.6 Niveau Œuvre : Compter les œuvres originales agrégées et “agrégeantes” : Lien 1, Lien 2

Le nombre de 67 184 œuvres sont agrégées par 36 417 œuvres “agrégeantes”. Data utilise deux propriétés de valeur inverse “ore:aggregates” et “ore:isAggregatedBy”. Le terme de “Notice de regroupement” est fréquemment employé pour désigner ces notices bibliographiques spéciales.

# Œuvres agrégeantes
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX ore: <http://www.openarchives.org/ore/terms/>
SELECT (COUNT (DISTINCT ?workUri) AS ?workUriNb)
WHERE {
  ?workUri a frbr-rda:Work.
  ?workUri ore:aggregates ?workUriAggregated.
}

Q2.7 Niveau Œuvre : Compter le nombre de périodiques : Lien

Data référence 364 069 périodiques, sous forme d’une double appartenance aux classes “frbr-rda:Work” et “bibo:Periodical”. Des listes de périodiques répondant à divers critères thématiques, de fréquence de parution, de date de publication peuvent être élaborés.

# Œuvres périodiques
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX bibo: <http://purl.org/ontology/bibo/>
SELECT (COUNT (DISTINCT ?workUri) AS ?workUriNb)
WHERE {
  ?workUri a frbr-rda:Work.
  ?workUri a bibo:Periodical.
}

Q2.8 Niveau Œuvre : Compter le nombre de spectacles : Lien

La BnF recense 61 699 spectacles du genre théatral ou chorégraphique essentiellement. Les notices sont caractérisés par leur double appartenance aux classes “frbr-rda:Work” et “dcmitype:Event”.

# Spectacles et autres événements
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX dcmitype: <http://purl.org/dc/dcmitype/>
SELECT (COUNT (DISTINCT ?workUri) AS ?workUriNb)
WHERE {
  ?workUri a frbr-rda:Work.
  ?workUri a dcmitype:Event.
}

2.2 Entité Expression

Plus de douze millions d’expressions doublées de manifestations sont référencées dans Data. L’information bibliographique est contenue dans les trois entités Concept, Expression et Manifestation. Ces trois entités apparaissent liées par la structure de leur URI. Concept est identifié par son URI simple. Le niveau Expression est identifié par l’URI du Concept suffixé de “#Expression”. Le niveau Manifestation est accessible via l’URI suffixé de “#about”.

A la différence de la notice Concept de niveau Œuvre, la notice Concept de niveau Expression et Manifestation contient un faible nombre d’informations, essentiellement la date de création de la notice. Les niveaux Expression et Manifestation (les éditions) ne génèrent aucune page HTML dans Data. Seul un fichier au format RDF est fourni en réponse à une requête SPARQL. Des liens vers les pages des bases constitutives (Catalogue, Archives et manuscrits, Gallica) constituent le mode d’accès privilégié pour consulter aisément la notice.

Q3.1 Niveau Expression : Quels sont les effectifs des divers types d’expressions : Lien

Parmi les propriétés au niveau Expression, on remarque à l’aide du schéma et de l’examen d’un fichier RDF, que DCMI Type de Dublin Core est bien renseigné. La propriété “dcterms:type” peut avoir pour valeur “Text”, “StillImage”, “Sound”, etc, ou bien admettre un concept du dictionnaire RAMEAU. L’examen de la liste complète des “types” montre que diverses choses sont ainsi fréquemment notées. Des précisions temporelles comme : “18e siècle”, “19e siècle”, “2000-….”, etc. Des précisions sur la nature d’un document : “Actes de congrès”, “Catalogues d’exposition”, “Biographie”, “Guides pratiques”, “Partitions”, “Correspondance”, “Dictionnaire”, “Encyclopédie”, “Manuels d’enseignement supérieur”, etc. Des genres musicaux : “Chansons françaises”, “Opéras-comiques”, “Valses (piano)”.

# Effectif des valeurs de la propriété Dublin Core "type" des entités "Expression"
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
SELECT ?typeDc ?typeDcNom (COUNT(?typeDc) AS ?typeDcNb)
WHERE {
  ?expressionUri a frbr-rda:Expression.
  ?expressionUri dcterms:type ?typeDc.
  OPTIONAL {?typeDc skos:prefLabel ?typeDcNom.}
}
GROUP BY ?typeDc ?typeDcNb ?typeDcNom
ORDER BY DESC (?typeDcNb)
LIMIT 10
typeDctypeDcNomtypeDcNb
1<http://purl.org/dc/dcmitype/Text>“10173819”^^<http://www.w3.org/2001/XMLSchema#integer>
2<http://purl.org/dc/dcmitype/StillImage>“887936”^^<http://www.w3.org/2001/XMLSchema#integer>
3<http://purl.org/dc/dcmitype/Sound>“663400”^^<http://www.w3.org/2001/XMLSchema#integer>
4<http://purl.org/dc/dcmitype/Image>“360492”^^<http://www.w3.org/2001/XMLSchema#integer>
5<http://purl.org/dc/dcmitype/MovingImage>“255018”^^<http://www.w3.org/2001/XMLSchema#integer>
6<http://purl.org/dc/dcmitype/PhysicalObject>“158843”^^<http://www.w3.org/2001/XMLSchema#integer>
7<http://purl.org/dc/dcmitype/InteractiveResource>“127728”^^<http://www.w3.org/2001/XMLSchema#integer>
8<http://data.bnf.fr/ark:/12148/cb120611486>“Actes de congrès”@fr“125243”^^<http://www.w3.org/2001/XMLSchema#integer>
9<http://data.bnf.fr/ark:/12148/cb11975999w>“19e siècle”@fr“114838”^^<http://www.w3.org/2001/XMLSchema#integer>
10<http://data.bnf.fr/ark:/12148/cb11975995h>“20e siècle”@fr“94287”^^<http://www.w3.org/2001/XMLSchema#integer>
10 valeurs les plus fréquentes de “dcterms:type” pour les entités Expression

Les sujets des œuvres éditées se montrent renseignés au niveau Expression et il est possible de chercher les sujets les plus souvent renseignés dans Data.

Q3.2 Niveau Expression : Quelles sont les sujets (dcterms) et effectifs des éditions ? : Lien

# Sujets Dublin Core des entités de type Expression
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
SELECT ?sujetDc (COUNT (?sujetDc) AS ?sujetDcNb)
WHERE {
  ?expressionUri a frbr-rda:Expression.
  ?expressionUri dcterms:subject/skos:prefLabel ?sujetDc.
}
GROUP BY ?sujetDc ?sujetDcNb
ORDER BY DESC(?sujetDcNb)
LIMIT 20
1“France”@fr“409343”^^<http://www.w3.org/2001/XMLSchema#integer>
2“Histoire”@fr“169488”^^<http://www.w3.org/2001/XMLSchema#integer>
3“Portraits”@fr“103196”^^<http://www.w3.org/2001/XMLSchema#integer>
4“Critique et interprétation”@fr“86825”^^<http://www.w3.org/2001/XMLSchema#integer>
5“20e siècle”@fr“81187”^^<http://www.w3.org/2001/XMLSchema#integer>
Les cinq sujets les plus populaires dans Data

Une requête similaire peut être lancée sur les langues, pour lesquelles la norme 639-2 est appliquée :

Q3.3 Niveau Expression : Quelles sont les langues (dcterms) et effectifs des éditions ? : Lien

# Effectif des langues dans les entités "Expression"
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
SELECT ?langue (COUNT(?langue) AS ?langueNb)
WHERE {
  ?expressionUri a frbr-rda:Expression.
  ?expressionUri dcterms:language ?langue.
}
GROUP BY ?langue ?langueNb
ORDER BY DESC (?langueNb)
LIMIT 10
  • Liste des codes de langues (iso 639-2), code sur trois lettres, à la BnF : Lien
  • Liste des codes de langues (iso 639-2), code sur trois lettres, à la LoC : Lien
languelangueNb
1<http://id.loc.gov/vocabulary/iso639-2/fre>“6916627”^^<http://www.w3.org/2001/XMLSchema#integer>
2<http://id.loc.gov/vocabulary/iso639-2/eng>“1580823”^^<http://www.w3.org/2001/XMLSchema#integer>
3<http://id.loc.gov/vocabulary/iso639-2/ger>“801805”^^<http://www.w3.org/2001/XMLSchema#integer>
Les trois langues les plus fréquentes

Q3.4 Niveau Expression : Quelles sont les les effectifs de personnes jouant des rôles particuliers ? : Lien

Au-delà du rôle d’auteur, les rôles joués par diverses personnes lors du processus éditorial sont précisés. Parmi les rôles, celui de traducteur, d’illustrateur, de préfacier, d’auteur adapté, de réalisateur, etc. Les rôles joués sont précisés à l’aide de codes référencés dans deux dictionnaires différents. Le premier est celui de la BnF qui contient 525 rôles possibles. Le dictionnaire de la Bibliothèque du Congrès contient 271 rôles. Nous nous intéressons ici à la liste de la Bnf et quelques effectifs peuvent être calculés. La requête suivante se montre assez longue et dure environ 30 secondes. Le nombre de 2 878 898 auteurs distinct est calculé.

  • Liste des rôles dans Data d’après la BnF (Vocabulary) : Lien
  • Rôles dans Data, d’après la Bibliothèque du Congrès (Relators) : Lien
# Effectif de divers rôles joués
PREFIX bnfroles: <http://data.bnf.fr/vocabulary/roles/>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>

SELECT 
	(COUNT(DISTINCT ?r70) AS ?auteurs)
	(COUNT(DISTINCT ?r72) AS ?auteursAdaptes)
	(COUNT(DISTINCT ?r110) AS ?epistoliers)
	(COUNT(DISTINCT ?r150) AS ?cartographes)
	(COUNT(DISTINCT ?r360) AS ?editeursSientifiques)
	(COUNT(DISTINCT ?r610) AS ?realisateurs)
	(COUNT(DISTINCT ?r680) AS ?traducteurs)
WHERE {
  ?expressionUri a frbr-rda:Expression.
  OPTIONAL{?expressionUri bnfroles:r70 ?r70.} #Auteur
  OPTIONAL{?expressionUri bnfroles:r72 ?r72.} #Auteur adapté
  OPTIONAL{?expressionUri bnfroles:r110 ?r110.} #Auteur de lettres
  OPTIONAL{?expressionUri bnfroles:r150 ?r150.} #Auteur de cartes
  OPTIONAL{?expressionUri bnfroles:r360 ?r360.} #Editeur scientifique
  OPTIONAL{?expressionUri bnfroles:r610 ?r610.} #Réalisateur
  OPTIONAL{?expressionUri bnfroles:r680 ?r680.} #Traducteur
}
auteursauteursAdaptesepistolierscartographesediteursSientifiquesrealisateurstraducteurs
1“2878898”^^<http://www.w3.org/2001/XMLSchema#integer>“14817”^^<http://www.w3.org/2001/XMLSchema#integer>“35475”^^<http://www.w3.org/2001/XMLSchema#integer>“12404”^^<http://www.w3.org/2001/XMLSchema#integer>“615142”^^<http://www.w3.org/2001/XMLSchema#integer>“58020”^^<http://www.w3.org/2001/XMLSchema#integer>“136988”^^<http://www.w3.org/2001/XMLSchema#integer>

2.3 Entité Manifestation

Nous trouvons au niveau Manifestation les nombreuses informations en provenance de l’éditeur. Sont notamment présents et décrits avec l’ontologie Dublin Core le titre propre (dcterms:title), l’année de publication (dcterms:date), la description physique du livre (dcterms:description) ou du disque, le sujet (dcterms:subject), le nom de l’éditeur (dcterms:publisher).

Les contenus de “dcterms:publisher” résultent de l’assemblage du lieu de publication, du nom de l’organisme et de l’année de publication. Par exemple : “Paris : Stock , 1969”. Les éléments individuels de ce champ composite sont accessibles respectivement sous “rdagroup1elements:placeOfPublication”, “rdagroup1elements:publishersName”, “dcterms:date”.

A noter également le lien vers le Catalogue et vers les bases constitutives référencé avec “rdfs:seeAlso”. Pour la Littérature Jeunesse, un code de genre peut être spécifié dans “schema:genre”.

Q4.1 Niveau Manifestation : quels sont les éditeurs (rdagroup1elements) les plus présents dans Data ? : Lien

# Lister les éditeurs au niveau Manifestation et les compter
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
SELECT ?editeur (COUNT (?editeur) AS ?editeurNb)
WHERE {
  ?manifUri a frbr-rda:Manifestation.
  ?manifUri rdagroup1elements:publishersName ?editeur.
}
GROUP BY ?editeur ?editeurNb
ORDER BY DESC(?editeurNb)
LIMIT 20
editeurediteurNb
1[s.n.]“370203”^^<http://www.w3.org/2001/XMLSchema#integer>
2Hachette“55325”^^<http://www.w3.org/2001/XMLSchema#integer>
3s.n.“53424”^^<http://www.w3.org/2001/XMLSchema#integer>
4Springer“50281”^^<http://www.w3.org/2001/XMLSchema#integer>
5l’Harmattan“49081”^^<http://www.w3.org/2001/XMLSchema#integer>
Les 5 éditeurs les plus prolixes dans Data

Q4.2 Niveau Manifestation : quels sont les effectifs par année d’édition (dcterms) ? : Lien

# Lister les dates au niveau Manifestation et les compter
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX dcterms: <http://purl.org/dc/terms/>
SELECT ?date (COUNT (?date) AS ?dateNb)
WHERE {
  ?manifUri a frbr-rda:Manifestation.
  ?manifUri dcterms:date ?date.
}
GROUP BY ?date ?dateNb
ORDER BY DESC(?dateNb)
LIMIT 20
datedateNb
12012“163963”^^<http://www.w3.org/2001/XMLSchema#integer>
22013“162388”^^<http://www.w3.org/2001/XMLSchema#integer>
32014“157640”^^<http://www.w3.org/2001/XMLSchema#integer>

Il est possible de noter que ce champ admet des valeurs fort variables, parmi lesquelles des dates écrites en chinois (文政7 [1824]) et autres graphies, des durées (1968-201​7), etc.

Q4.3 Niveau Manifestation : quels sont les effectifs par lieu de publication (rdagroup1elements) ? : Lien

# Lister les lieux de publication
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
SELECT ?lieuPubli (COUNT (?lieuPubli) AS ?lieuPubliNb)
WHERE {
  ?manifUri a frbr-rda:Manifestation.
  ?manifUri  rdagroup1elements:placeOfPublication ?lieuPubli.
}
GROUP BY ?lieuPubli ?lieuPubliNb
ORDER BY DESC(?lieuPubliNb)
LIMIT 20
1Paris“3308949”^^<http://www.w3.org/2001/XMLSchema#integer>
2[Paris]“497522”^^<http://www.w3.org/2001/XMLSchema#integer>
3[S.l.]“394350”^^<http://www.w3.org/2001/XMLSchema#integer>
4London“163291”^^<http://www.w3.org/2001/XMLSchema#integer>
5New York“96022”^^<http://www.w3.org/2001/XMLSchema#integer>
Les lieux de publication les plus fréquents

Q4.4 Niveau Manifestation : quels sont les genres littéraires (schemaorg) pour la jeunesse les plus référencés : Lien

# Lister les genres litt. jeunesse au niveau Manifestation et les compter
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX schemaorg: <http://schema.org/>
SELECT ?genre (COUNT (?genre) AS ?genreNb)
WHERE {
  ?manifUri a frbr-rda:Manifestation.
  ?manifUri schemaorg:genre ?genre.
}
GROUP BY ?genre ?genreNb
ORDER BY DESC(?genreNb)
LIMIT 20
genregenreNb
1<http://data.bnf.fr/vocabulary/genre-jn/JnAlbum>“58005”^^<http://www.w3.org/2001/XMLSchema#integer>
2<http://data.bnf.fr/vocabulary/genre-jn/JnRoman>“47936”^^<http://www.w3.org/2001/XMLSchema#integer>
3<http://data.bnf.fr/vocabulary/genre-jn/JnBDessi>“34265”^^<http://www.w3.org/2001/XMLSchema#integer>
  • Liste des genres pour les ouvrages jeunesse : Lien
  • Liste des genres musicaux : Lien
  • Liste des codes de pays, code sur deux lettres : Lien

Question sur les sujets, les pays d’édition.

Question sur les documents numérisés.

3. Le Hobbit, par Tolkien et d’autres

Indépendamment de SPARQL, un jeu complexe d’URL permet la navigation dans Data. Proposé par les étudiants d’Aix-Marseille Université, le schéma suivant fournit plusieurs exemples significatifs sur les entités et relations que FRBR et le Modèle de Référence introduisent. Le thème qu’ils choisissent et que nous allons garder, si vous le voulez bien, est celui du roman de Tolkien : “The Hobbit, or There and Back Again”. La description de trois contenus apparentés sont examinés : l’œuvre originale, la première édition du texte en français, et la trilogie cinématographique de Peter Jackson.

Un texte original de classe Œuvre (indiqué en rouge) est écrit en anglais par Tolkien, et publié la première fois par Allen & Unwin en 1937. Il donne lieu à des adaptations également du type Œuvre, mais de la forme film ou dessin animé (en rose), dont les dates varient de 1966 à 2014. Diverses traductions et éditions sont signalés sous la forme de couples d’entités Expression et Manifestation (en vert et jaune). Divers traducteurs contribuent conjointement avec les éditeurs, aux Expressions (en anglais, en allemand, en français, en breton) et Manifestations. Les rôles joués par les intervenants (créateur, traducteur, réalisateur) sont spécifiés entre parenthèses.

FRBR, la transition bibliographique et Tolkien. Schéma des étudiants du Master mention “Histoire et humanités”: Lien

3.1 The Hobbit, par John Ronald Reuel Tolkien, 1937, texte en anglais, Œuvre

Le roman original de Tolkien se montre absent des rayons de la BnF et donc du Catalogue. Fruit d’une reconstruction, la notice du roman original se trouve cependant présente dans Data au format HTML. Diverses pages liées apportent divers renseignements. Les triplets de niveau Concept précisent le libellé préférentiel du titre original (“The Hobbit”@en) et le libellé alternatif en français (“Bilbo le Hobbit”@fr). Les informations de niveau Œuvre concernent l’édition originale, et donnent des liens vers les publications dérivées du texte original. La page HTML de l’auteur renseigne sur ses autres œuvres, et sur les éditions qui en découlent.

Pages HTML de Tolkien :

3.2 J. R. R. Tolkien. Bilbo le Hobbit ou Histoire d’un aller et retour. Traduit de l’anglais par Francis Ledoux, 1969, texte en français, Expression et Manifestation

Francis Ledoux traduit en français le texte de Tolkien en 1969, pour les éditions Stock. Les renseignements relatifs à une édition donnent lieu à trois sous-entités différentes, de classe respectivement Concept (URI simple), Expression (URI suffixé du hashtag “#Expression”) et Manifestation (URI suffixé de “#about”). La notice Concept d’une manifestation ne contient qu’une date de création. Les renseignements sur le titre, la traduction, l’édition et l’éditeur sont renseignés en RDF au niveau Expression et Manifestation. La relation de l’expression vers l’oeuvre originale est donnée par “rdarelationships:expressionOfWork”, celle de la manifestation par “rdarelationships:workManifested”. Il faut quitter Data et se rendre dans le Catalogue, pour disposer d’une page HTML aisément lisible.

Le traducteur Francis Ledoux, dispose quant à lui d’une page HTML bien renseignée. avec les rôles qu’il a pu jouer en tant que traducteur, ou éditeur scientifique par exemple :

3.3 The Hobbit (film)

Adapté du texte de Tolkien, le premier film de Peter Jackson est considéré dans Data comme une œuvre originale. La forme créative “http://data.bnf.fr/vocabulary/work-form/au” (forme audiovisuelle) est spécifiée. Le premier film est tourné en 2011 et sort en salle en France en 2012. Une page HTML de type œuvre existe pour la trilogie (œuvre agrégative), de même que pour chacun des films constitutifs.

3.3.1 The Hobbit (film ; série), réalisé par Peter Jackson, 2012, film, Œuvre

La note d’application précise : “À n’utiliser que pour les documents traitant des trois films”. La propriété “ore:aggregates” permet de signaler en RDF XML et SPARQL l’URI des œuvres agrégées. Des figurines et un livre de croquis préalables à la réalisation sont décrits comme édition dérivée.

3.3.2 An unexpected journey, réalisé par Peter Jackson, 2012, film, Œuvre

Notice du premier film de la trilogie.

3.3.3 Pages HTML de Peter Jackson

3.4 Requêtes sur Tolkien et le Hobbit

SPARQL permet d’interroger Data et de configurer à la demande la structure des tableaux affichés en retour d’une requête.

Q5.1 Lister les œuvres originales de J.R.R. Tolkien présentes dans Data : Lien

Cette requête est formulée de manière générique, si bien qu’elle peut être aisément adaptée à n’importe quel auteur (personne ou collectivité) en modifiant le premier motif de triplet dans la partie WHERE, dans lequel il est demandé de trouver les URI “des oeuvres dont l’auteur est nommé” : “John Ronald Reuel Tolkien”. Les autres motifs, souhaités optionnels, permettent l’affichage d’autres champs de la notice de niveau Œuvre.

# Tolkien dans Data, ses oeuvres originales
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
PREFIX bnf-onto: <http://data.bnf.fr/ontology/bnf-onto/>
SELECT *
WHERE {
  ?workUri dcterms:creator/foaf:name "John Ronald Reuel Tolkien".
  OPTIONAL {?workUri dcterms:title ?titre.}
  OPTIONAL {?workUri dcterms:date ?date.}
  OPTIONAL {?workUri dcterms:description ?description.}
  OPTIONAL {?workUri bnf-onto:subject ?sujetBnf.}
}
ORDER BY ?date
workUrititredatedescription
1<http://data.bnf.fr/ark:/12148/cb144469423#about>“The history of Middle-earth”@fr“Oeuvre fantastique en douze tomes”@fr
2<http://data.bnf.fr/ark:/12148/cb12545196g#about>“The Hobbit”@en1937
3<http://data.bnf.fr/ark:/12148/cb167043914#about>“On fairy-stories”@en1939“Texte d’une conférence tenue en 1939, remanié et publié en 1947 dans le volume “Essays presented to Charles Williams” puis en 1964 dans “Tree and leaf””@fr
4<http://data.bnf.fr/ark:/12148/cb11939715m#about>“The Lord of the rings”@en1954“Épopée mythologique en trois parties : The fellowship of the ring, The two towers, The return of the king”@fr
5<http://data.bnf.fr/ark:/12148/cb11957451k#about>“The silmarillion”@en1977“Récit utopique publié de manière posthume”@fr
5 œuvres originales de Tolkien référencées dans Data

Q5.2 Lister les œuvres originales de J.R.R. Tolkien référencées dans Data, ainsi que les diverses éditions en résultant : Lien

Les propriétés de l’ontologie “rdarelationships” permettent d’aisément naviguer entre les niveaux Œuvre, Expression et Manifestation pour y récupérer les informations qui nous intéressent. Les renseignements sur les éditions sont présentes au niveau Manifestion, auquel on se rend avec “rdarelationships:workManifested”. Parmi les résultats d’une liste de 94 textes, un texte non traduit et non publié en France; celui sur la conférence donnée en 1939 sur les histoires de fées.

# Tolkien dans Data, œuvres originales, œuvres publiées
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
PREFIX bnf-onto: <http://data.bnf.fr/ontology/bnf-onto/>
PREFIX rdarelationships: <http://rdvocab.info/RDARelationshipsWEMI/>
PREFIX schemaorg: <http://schema.org/>
SELECT *
WHERE {
  ?workUri dcterms:creator/foaf:name "John Ronald Reuel Tolkien".
  OPTIONAL {?workUri dcterms:title ?titreOrig.}
  OPTIONAL {?workUri dcterms:date ?dateOrig.}
  OPTIONAL {?workUri dcterms:description ?descriptionOrig.}
  OPTIONAL {?workUri bnf-onto:subject ?sujetBnf.}
  OPTIONAL {
    ?manifestationUri rdarelationships:workManifested ?workUri.
    ?manifestationUri dcterms:title ?titreEdition.
  	?manifestationUri dcterms:date ?dateEdition.
    ?manifestationUri rdagroup1elements:publishersName ?editeur.
    OPTIONAL {?manifestationUri schemaorg:genre ?genreEdition.}
  }
}
ORDER BY ?dateOrig ?dateEdition

Q5.3 Lister l’ensemble des éditions auxquelles J.R.R. Tolkien a participé de manière directe ou indirecte : Lien

On recherche dans cette requête les éditions auxquelles Tolkien a contribué. On attaque la base au niveau Expression, dans lequel les rôles joués sont recherchés. Puis on accède successivement au niveau Manifestation à l’aide de “rdarelationships:expressionManifested”, et au niveau Œuvre avec “rdarelationships:expressionOfWork”. Les métadonnées pertinentes sont extraites à chacun de ces niveaux. Le total de 353 éditions est obtenu. Les dates des oeuvres originales s’échelonnent de 1350 à 2004.

En effet, Tolkien écrit une introduction, des notes et un glossaire sur l’édition de 1936 d’un roman écrit en anglais moyen daté de 1350 : Sir Gawain and the Green Knight / Sire Gauvain et le Chevalier vert. Il participe aussi en tant qu’éditeur scientifique (<http://data.bnf.fr/vocabulary/roles/r360>) à la collection “Oxford English monographs” publiée à partir de 1940. Ses rôles sont ceux d’auteur (<http://data.bnf.fr/vocabulary/roles/r70>), et d’auteur adapté (<http://data.bnf.fr/vocabulary/roles/r72>) pout tout un ensemble d’items.

# Tolkien dans Data, diverses éditions
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX rdarelationships: <http://rdvocab.info/RDARelationshipsWEMI/>
SELECT *
WHERE {
  ?expressionUri dcterms:contributor/foaf:name "John Ronald Reuel Tolkien".
  ?manifestationUri rdarelationships:expressionManifested ?expressionUri.
  OPTIONAL {?manifestationUri dcterms:title ?titre.}
  OPTIONAL {?manifestationUri dcterms:date ?date.}
  OPTIONAL {?manifestationUri dcterms:description ?description.}
  OPTIONAL {
    ?workUri rdarelationships:expressionOfWork ?expressionUri.
    ?workUri dcterms:title ?titreOrig.
    OPTIONAL {?workUri dcterms:date ?dateOrig.}
    OPTIONAL {?workUri dcterms:creator/foaf:name ?auteurOrig.}
  }
}
ORDER BY ?date

Q5.4 Lister les éditions dérivées de l’œuvre originale “The Hobbit” de J.R.R. Tolkien : Lien

Nous pouvons rechercher les diverses éditions tirées du roman original “The Hobbit”. Dans cette requête, également facile à modifier pour être adaptée, les deux premiers motifs de triplets servent à récupérer l’URI de l’œuvre originale à partir de son libellé préférentiel en anglais. Nous passons successivement du niveau concept, au niveau œuvre et au niveau manifestation. On obtient au final 33 éditions, parmi lesquelles un spectacle en date de 2004. On remarque que dans le cas des spectacles, la date, le mois et le jour de la création sont pris en compte.

# Manifestations de "The Hobbit" dans Data
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX rdarelationships: <http://rdvocab.info/RDARelationshipsWEMI/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX dcterms: <http://purl.org/dc/terms/>
SELECT ?titre ?date ?description ?editeur ?manifestationUri
WHERE {
  ?workUriConcept skos:prefLabel "The Hobbit"@en.
  ?workUriConcept foaf:focus ?workUri.
  ?manifestationUri rdarelationships:workManifested ?workUri.
  OPTIONAL {?manifestationUri dcterms:title ?titre.}
  OPTIONAL {?manifestationUri dcterms:date ?date.}
  OPTIONAL {?manifestationUri dcterms:description ?description.}
  OPTIONAL {?manifestationUri dcterms:publisher ?editeur.}
}
ORDER BY ?date
31Bilbo le Hobbit20141 vol. (503 p.)Paris : Hachette , DL 2014<http://data.bnf.fr/ark:/12148/cb44226371k#about>
32Bilbon lo Hòbbit20181 vol. (215 p.)Cressé : Éditions des Régionalismes , impr. 2018<http://data.bnf.fr/ark:/12148/cb45632596j#about>
33“Bilbo le hobbit / adaptation et mise en scène de Francine Llouc”@fr“2004-01-14”^^<http://www.w3.org/2001/XMLSchema#date>“Paris (France) : Espace Paris-Plaine – 14-01-2004”@fr<http://data.bnf.fr/ark:/12148/cb39501667n#about>
3 parmi 33 éditions de “The Hobbit”, édition en breton et spectacle de 2014

Q5.5 Lister les œuvres originales dont le titre contient le mot “Hobbit” : Lien

La requête suivante se montre d’exécution relativement lente (7 secondes). La clause FILTER est appliquée à l’ensemble des titres de la base pour rechercher dans le champ “dcterms:title” le motif “Hobbit”. 9 résultats sont trouvés, parmi lesquels des oeuvres dont le sujet est “The Hobbit”, les films de Peter Jackson, un jeu vidéo, une revue sur les jeux de rôles “Le Hobbit fataliste”.

PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
SELECT *
WHERE {
  ?workUri a frbr-rda:Work.
  ?workUri dcterms:title ?titre.
  OPTIONAL {?workUri dcterms:creator/foaf:name ?auteur.}
  OPTIONAL {?workUri dcterms:subject/skos:prefLabel ?sujet.}
  OPTIONAL {?workUri rdagroup1elements:dateOfWork/rdfs:label ?date.}
  FILTER(CONTAINS(?titre, "Hobbit")).
}
LIMIT 10
workUrititreauteursujetdate
1<http://data.bnf.fr/temp-work/c532b0f929e67cebb490913e98061c52/#about>“La quête du sens dans “Bilbo le Hobbit” de J. R. R. Tolkien”@frAlain Tesnière“The Hobbit”@en“2007”^^<http://www.w3.org/2001/XMLSchema#integer>
2<http://data.bnf.fr/temp-work/676aa080be8bf2812d4f48f0375aeb3a/#about>“Promenades au pays des Hobbits, itinéraires à travers la Comté de J.R.R. Tolkien”@frJean-Rodolphe Turlin“The Hobbit”@en“2012”^^<http://www.w3.org/2001/XMLSchema#integer>
3<http://data.bnf.fr/ark:/12148/cb12545196g#about>“The Hobbit”@enJohn Ronald Reuel Tolkien“1937”^^<http://www.w3.org/2001/XMLSchema#integer>
4<http://data.bnf.fr/ark:/12148/cb169690499#about>“Lego the Hobbit (jeu vidéo)”@en“2014”^^<http://www.w3.org/2001/XMLSchema#integer>

Les fans de Tolkien pourront parcourir les pages de l’exposition : “Tolkien, voyage en Terre du Milieu”, organisée entre octobre 2019 et février 2020 par la BnF.

  • Tolkien, voyage en Terre du Milieu, 2019-2020, BnF : Lien
  • Fiche iconographique “Tolkien. Voyage en Terre du Milieu”, 2019-2020, BnF, PDF : Lien

Articles sur SPARQL et Data

Plusieurs billets de ce blog explorent divers aspects de Data, et de son interrogation à l’aide de SPARQL.

  • La BnF et SPARQL. Partie 1 : les bases constitutives de Data : Lien
  • La BnF et SPARQL. Partie 2 : Œuvre, Expression, Manifestation : Lien
  • La BnF et SPARQL. Partie 3 : [À suivre]
1 Star2 Stars3 Stars4 Stars5 Stars (Pas encore noté)
Loading...

Laisser un commentaire