data.bnf.fr et SPARQL. Partie 2 : des notices d’œuvres et d’éditions, avec le Hobbit de Tolkien

8 345 mots, temps de lecture 44 minutes

Mise en ligne en 2011, la base sémantique data.bnf.fr (Data) de la BnF propose une interface unique, qui rend possible l’interrogation simultanée du catalogue général catalogue.bnf.fr, de la base Archives et manuscrits archivesetmanuscrits.bnf.fr, et de Gallica gallica.bnf.fr. La recherche d’une variété d’objets physiquement présents dans les rayons de la BnF devient ainsi possible. On trouve dans Data les signalements de livres, de périodiques, de partitions, de documents audios, de films, de jeux vidéo, d’images et de gravures, de cartes. Des pièces d’archives relatives au théâtre et à l’opéra de même que des pièces de musées sont également référencées et visibles pour certaines au format numérique.

Pour comprendre l’organisation des données dans Data, nous devons rendre compte des travaux menés précédemment par l’IFLA (Fédération internationale des associations et institutions de bibliothèques). La structure des données se montre en effet fortement influencée par une série de modèles entité-association. Mis au point entre 1998 et 2016, FRBR (Functional Requirements for Bibliographic Records / Fonctionnalités requises des notices bibliographiques) propose de scinder l’information bibliographique en une suite de quatre entités liées entre elles et nommées Œuvre, Expression, Manifestation, Item. Publié en plusieurs versions de 2010 à 2013, Le modèle FRAD (Functional Requirements for Authority Data) permet la description des auteurs et contributeurs des objets produits. Publié entre 2011 et 2018, FRSAD (Functional Requirements for Subject Authority Data) modélise la descriptions des thèmes et sujets des œuvres.

En première approche, les contenus de Data peuvent être aisément explorés à l’aide du moteur de recherche principal de l’interface, sans connaissance particulière de la structure des données. De moteurs thématiques viennent en effet compléter les capacités du moteur principal. On trouve ainsi dans Data en 2023 : 2 505 283 Auteurs, 1 360 150 Œuvres, 197 494 Thèmes, 119 824 Lieux, 5 385 Dates, 61 818 Spectacles, 367 814 Périodiques. Comparé aux moteurs standards, l’interrogation à l’aide de SPARQL (SPARQL Protocol and RDF Query Language) vient apporter des possibilités supplémentaires. Elle permet l’exploration fine des contenus, l’éventuelle extraction personnalisée des données, l’élaboration de statistiques.

Dans Data, deux types de notices existe :

1/ La notices du type Œuvre. L’œuvre originale est décrite, que celle-ci soit un livre, un périodique, un disque, un spectacle, indépendamment de l’édition. Par exemple, dans « The Hobbit », par J.R.R Tolkien, la version originale textuelle en anglais date de 1937. De multiples sous-notices relient l’œuvre originale aux diverses éditions, en différentes langues. La notice d’œuvre présente dans le Catalogue peut être vue dans Data en HTML ou en RDF / XML. Dans le Catalogue, on accède aux diverses notices liées à l’œuvre en cliquant en bas à droite sur auteur, titre ou sujet. La même notice peut ainsi être visualisée de différentes manières :

On remarque au passage la structure des URL, significative de l’affichage.

2/ Les notices d’édition. Celle-ci sont constituées d’un fragment Expression et d’un fragment Manifestation. Un exemple de notice est celle du roman pour la jeunesse « Bilbo le Hobbit ou Histoire d’un aller et retour », traduction par Francis Ledoux, paru en 1969 chez Stock. La notice de cette édition en français peut être vue dans le Catalogue et aussi dans Data, mais alors uniquement en RDF, non en HTML.

Les successives éditions exemplifient la première édition, considérée comme œuvre originale. La notice d’œuvre permet de formellement lier l’original à la série des éditions parues en diverses langues, supports, formats, adaptations. Un lien relie également l’édition à l’œuvre originale. Mais comment interroger tout cela ?

Dans ce deuxième billet sur Data, les possibilités des moteurs standards sont tout d’abord explorées. Les principales classes et propriétés en relation avec les contenus sont recherchés. Puis de simples comptages sont tout d’abord effectués avec SPARQL. Le modèle de données retenu pour Data est présenté dans son ensemble, puis détaillé en ce qui concerne les descriptions bibliographiques. Le roman « The Hobbit, or There and Back Again » de J.R.R Tolkien sert de fil rouge à ce deuxième tutoriel sur Data.

Plan

  1. Recherches standards
    • 1.1 Le moteur standard
    • 1.2 L’index « Œuvres« 
    • 1.3 Autres moteurs
  2. L’entité Concept et le modèle FRBR dans Data, étude quantitative
    • 2.1 De FRBR à IFLA-LRM
    • 2.2 Le modèle de données de Data
      • 2.2.1 Notices du type Œuvre
      • 2.2.2 Notices des éditions
      • 2.2.3 Aspects informatiques
    • 2.3 Niveau Œuvre
    • 2.4 Niveau Expression
    • 2.5 Niveau Manifestation
  3. Le Hobbit, par Tolkien et par d’autres
    • 3.1 Entité Œuvre : « The Hobbit, par John Ronald Reuel Tolkien »
    • 3.2 Entités Expression et Manifestation : « J. R. R. Tolkien. Bilbo le Hobbit ou Histoire d’un aller et retour. Traduit de l’anglais par Francis Ledoux »
    • 3.3 Entités Œuvre : « The Hobbit (film), réalisé par Peter Jackson »
    • 3.4 Requêtes sur Tolkien et le Hobbit

Le numéro de requête indique la localisation dans le plan :

  • Q22.1 Compter le nombre d’entités de type Concept, Œuvre, Expression, Manifestation dans Data : Lien
  • Q23.1 Niveau Œuvre : Quels sont les effectifs par genre créatif (rdagroup1elements) présents dans Data ? : Lien
  • Q23.2 Niveau Œuvre : Répartition par année de première édition des œuvres originales (rdagroup1elements) ? : Lien
  • Q23.3 Niveau Œuvre : Quels sont les effectifs par sujet (bnf-onto) des œuvres originales ? : Lien
  • Q23.4 Niveau Œuvre : Quels sont les effectifs par sujet (dcterms) des œuvres originales ? : Lien
  • Q23.5 Niveau Œuvre : Quels sont les créateurs dont les œuvres sont le plus souvent publiées : Lien
  • Q23.6 Niveau Œuvre : Compter les œuvres originales agrégées et agrégeantes : Lien 1, Lien 2
  • Q23.7 Niveau Œuvre : Compter le nombre de périodiques : Lien
  • Q23.8 Niveau Œuvre : Compter le nombre de spectacles : Lien
  • Q24.1 Niveau Expression : Quels sont les effectifs des divers types d’expressions : Lien
  • Q24.2 Niveau Expression : Quelles sont les sujets (dcterms) et effectifs des expressions ? : Lien
  • Q24.3 Niveau Expression : Quelles sont les langues (dcterms) et effectifs des entités expression ? : Lien
  • Q24.4 Niveau Expression : Quelles sont les les effectifs de personnes jouant des rôles particuliers ? : Lien
  • Q25.1 Niveau Manifestation : quels sont les éditeurs (rdagroup1elements) les plus présents dans Data ? : Lien
  • Q25.2 Niveau Manifestation : quels sont les effectifs par années (dcterms) de publication ? : Lien
  • Q25.3 Niveau Manifestation : quels sont les effectifs par lieu de publication (rdagroup1elements) ? : Lien
  • Q25.4 Niveau Manifestation : quels sont les genres littéraires pour la jeunesse les plus référencés : Lien
  • Q34.1 Lister les œuvres originales de J.R.R. Tolkien présentes dans Data : Lien
  • Q34.2 Lister les œuvres originales de J.R.R. Tolkien référencées dans Data, ainsi que les diverses éditions en résultant : Lien
  • Q34.3 Lister l’ensemble des éditions auxquelles J.R.R. Tolkien a participé de manière directe ou indirecte : Lien
  • Q34.4 Lister les éditions dérivées de l’œuvre originale « The Hobbit » de J.R.R. Tolkien : Lien
  • Q34.5 Lister les œuvres originales dont le titre contient le mot « hobbit » : Lien

1. Recherches standards

Tout le monde a en tête cette histoire pour la jeunesse imaginée par J.R.R Tolkien (1892-1973), spécialiste par ailleurs des écrits nordiques danois et britanniques datés des années 1000 environ. En plus d’être romancier à succès, Tolkien fut un grand connaisseur des langues primitives anglaises. Lors de sa carrière universitaire, il a eu l’occasion d’étudier un poème en vers anonyme écrit en vieil anglais, dont la seule copie originale restante est datée du Xe siècle. La légende de Beowulf se trouve localisée à la British Library. En 1936, il donne à la British Academy une désormais fameuse conférence « Beowolf The Monsters and The Critics », éditée maintes fois, rééditée, critiquée.

Apparemment éloigné des préoccupations académiques de l’auteur, écrit pour ses propres enfants d’abord et pour la jeunesse ensuite, le livre The Hobbit, or There and Back Again parait en 1937. Publié chez un éditeur britannique alors peu connu, il rencontre dès le début un vif succès. Il est adapté dès l’année suivante en une version américaine, publiée à New York et illustrée de dessins de l’auteur. Le roman raconte le voyage du « hobbit » Bilbo, entraîné par le magicien Gandalf, dans une quête menée en compagnie de treize nains, en vue de se réapproprier un trésor jalousement gardé par un dragon nommé Smaug. Des trolls, orques, elfes et autres créatures légendaires peuplent le récit.

Depuis lors, l’ouvrage est devenu, considéré comme emblématique d’un genre littéraire nouveau, le Fantasy, dans lequel, se trouvent associés, dans une ambiance médiévale fantastique, des quêtes, des mythes et des phénomènes surnaturels. Quelles traces du « Hobbit » pouvons nous trouver dans les bases de la BnF ? Partons, si vous le voulez bien, à la recherche de la notice originale de l’œuvre de Tolkien, dans le catalogue général et dans Data.

Une rue de Bristol, hommage municipal au sous-titre du Hobbit ? (Allée « Ici et de retour Ici ») : Lien

1.1 Le moteur standard

La recherche de « hobbit » dans Data fournit des résultats dont le titre et la classe sont affichés. Un code couleur permet de distinguer parmi les 14 résultats en suggestion des notices de catégorie Spectacle (1), Œuvre (9), Périodique (2), Thème (1) et Auteur (1). Lorsque la requête est lancée, les ressources sont affichées en survol : Lien

Recherche de « hobbit » depuis le moteur standard et affichage : Lien

La notice de l’œuvre originale « The Hobbit » peut être également plus ou moins facile à trouver à l’aide d’un moteur de recherche du web et d’une requête adaptée.

1.2 Le moteur « Œuvres« 

Le terme « hobbit » peut aussi être cherché dans « Œuvres« . Les résultats sont présentés sous forme d’un ensemble de notices liées, sur lequel des filtres localisés à gauche peuvent être utilisés. Neuf œuvres originales, adaptées ou traduites de celle de Tolkien, sont ainsi trouvées : Lien

Recherche de « hobbit » à partir du moteur des œuvres : Lien

On peut ensuite accéder à la notice œuvre originale « The Hobbit (1937) » par « John Ronald Reuel Tolkien ». Des informations plus larges sous « Éditions de The Hobbit », de niveau Expression et Manifestation, deviennent ainsi accessibles. Les diverses éditions en français, en anglais, en provençal et breton sont référencées et fournissent un lien vers le Catalogue. On trouve dans « Documents sur » 15 livres dont le sujet est soit le roman original et son écriture, soit son adaptation au cinéma. Les contributeurs aux diverses publications (illustrateur, traducteur, éditeur scientifique) sont mentionnés dans « Auteurs liés ».

Page de l’œuvre originale de Tolkien : Lien

1.3 Autres moteurs

Les autres moteurs peuvent être essayés. « Spectacle » permet de retrouver Bilbo le hobbit, un spectacle de marionnettes joué en 2004 à l’Espace Paris-Plaine, avec Francine Llounc en marionettiste, monté par la Compagnie Griffoul.

« Thèmes » se montre aussi pertinent. On obtient ainsi l’entrée du thésaurus RAMEAU « Hobbits (personnages fictifs) ». RAMEAU est un répertoire de concepts, élaboré conjointement par les bibliothèques grand public et de recherche, sous la supervision de la BnF et de l’ABES.

Localisé à Tolbiac, un ouvrage inattendu est découvert : « La sagesse de la Comté [Texte imprimé] : un petit guide pour mener une vie longue et heureuse / The wisdom of the Shire : a short guide to a long and happy life, auteur Noble Smith ; traduit de l’anglais (États-Unis) par Erwann Perchoc », Pocket, 2014. Il y est question de philosophie dans la littérature, de réalisation de soi en quelque sorte.

  • Spectacle: Bilbo le hobbit : dans le Catalogue, dans Data en HTML, en RDF
  • Hobbits (personnages fictifs), dans Data : Lien
  • La sagesse de la Comté : un petit guide pour mener une vie longue et heureuse, Noble Smith, Erwann Perchoc : dans le Catalogue, dans Data en RDF uniquement (notice d’une édition)

I’am in fact a Hobbit (in all but size). I like garden, trees and unmechanized farmlands; I smoke a pipe, and like good plain food (not French), ornamental waistcoats, and mushrooms. I go to bed late and get up late (when possible).
En fait, je suis un Hobbit (en toutes qualités excepté la taille). J’aime les jardins, les arbres et les fermes sans tracteur; je fume la pipe, et j’aime la nourriture simple et saine (pas la nourriture française), les gilets ornementés, et les champignons. Je vais me coucher tard et je me lève tard (lorsque c’est possible).

extrait de The Letters of J.R.R. Tolkien, de Tolkien à Deborah Webster,1958, #213

2. L’entité Concept et le modèle FRBR dans Data

Le modèle de données employé par Data s’inspire en grande partie d’un modèle entité-relation proposé par l’IFLA (Fédération internationale des associations et institutions de bibliothèques).

2.2 Le modèle de données de Data

Le modèle de données de Data montre une parenté certaine avec FRBR, mais aussi d’importantes différences.

Le modèle FRBR original (Œuvre, Expression, Manifestation, Item) se montre partiellement implémenté dans Data. La base sémantique rassemble les données de trois bases distinctes (Catalogue général, Gallica, Archives et manuscrits), nativement structurées à l’aide de modèles distincts (Unimarc, EAC-EAD, Dublin Core). Les informations de niveau Item (localisation dans les rayons, cartons et sur le web, informations sur un exemplaire donné, catalogage des parties composantes des périodiques) sont renseignées au niveau des bases originales uniquement. Les liens vers ces bases (en jaune à droite) sont indiqués en RDF au niveau Manifestation à l’aide des propriétés « rdarelationships:electronicReproduction », de même qu’à l’aide la propriété « rdfs:seeAlso ».

Trônant au centre du schéma, l’entité Concept concerne plusieurs catégories d’objets. Les propriétés de Concept permettent de nommer de manière préférentielle (skos:prefLabel) et alternative (skos:altLabel) les concepts (Personne, Organisation, Œuvre, Manifestation, Spectacle, Périodique, Thème). La flèche réflexive indique qu’un Concept peut se montrer générique. Un concept peut être relié à d’autres concepts à l’aide de relations comme « skos:narrower », « skos:broader », « skos:related ».

2.2.1 Notices du type Œuvre

Les notices Œuvre se montrent constituées dans Data de deux parties identifiées par des fragments différents. Identifiée par un IRI simple, la première rassemble les données du type Concept. L’œuvre originale se trouve ainsi nommée de manière unique dans sa langue originale, à l’aide de « skos:prefLabel ».

Les noms alternatifs éventuellement en plusieurs langues sont référencés, avec « skos:altLabel ». La seconde sous-notice du type Œuvre proprement dit, contient des informations comme le titre original de nouveau, le nom du ou des créateurs, la forme de l’œuvre (texte, musique, œuvre mixte, film, périodique, événement, etc…). Les Œuvres disposent toutes de leur page HTML dans Data.

Une bonne manière de se rendre compte des contenus d’une notice est d’accéder à celle-ci en la visionnant en RDF XML. On remarque le caractère redondant de certaines informations.

Sous-notice Concept du Hobbit, identifiée par son IRI simple (en valeur de « <rdf:Description rdf:about> » : https://data.bnf.fr/ark:/12148/cb12545196g)
Sous-notice Œuvre du Hobbit, identifiée par son IRI suffixé « https://data.bnf.fr/ark:/12148/cb12545196g#about »

En matière de catalogage, lorsqu’une œuvre originale change de forme (est adaptée en film par exemple), on considère qu’il s’agit d’une nouvelle œuvre originale. Comme précisé dans IFLA-LRM, des œuvres agrégatives rassemblent des groupes de documents, d’objets, de morceaux de musiques ou de films, dont chaque partie peut être distinguée et est elle-même une œuvre. On remarque ainsi que la trilogie cinématographique de Peter Jackson dispose d’une entrée distincte, à laquelle sont liés les produits dérivés de la série.

Les revues et journaux sont considérés comme des sortes d’œuvres périodiques, qui présentent des propriétés particulières, comme la fréquence de diffusion par exemple. Mentionnant volumes et numéros, le catalogage des parties composantes des périodiques (volume, numéro) n’est renseignée de manière détaillée que pour les journaux numérisés. Depuis Gallica, l’accès aux numéros d’un périodique numérisé se fait à l’aide d’un calendrier signalant les dates de parution.

Un autre graphique plus détaillé permet de résumer les propriétés utilisées par les entités (Œuvre, Expression, Manifestation) de Data. Les entités principales (cercles verts ou rouge), leur classe (en valeur de « rdf:type »), leur IRI (avec et sans suffixe), les relations entre entités (flèche et nom de propriété) et les propriétés admettant des valeurs (pavé carré avec nom abrégé de l’ontologie et non de la propriété) sont affichés.

Au niveau Concept en haut à gauche, sont indiqués à l’aide de flèches en vert sombre, propriété « skos:exactMatch ». Parmi ceux-ci, on note Wikidata (la base sémantique de Wikipédia), DBpedia (une autre base sémantique issue de Wikipédia), VIAF (Virtual International Authority File, le fichier d’autorité international de l’OCLC), IdRef (le fichier d’autorité de l’ABES), etc. Un lien vers Wikipédia en français peut être également présent.

Modèle de donnée œuvres originales (Œuvre) et des éditions (Expression, Manifestation) dans Data, documentation 2022

2.2.2 Notices des éditions

La notice d’une édition particulière d’une œuvre originale se montre constituée de trois sous-notices. La première contient les informations de niveau Expression qui référence essentiellement les contributeurs à une édition – personne ou organisation – de même que les rôles joués dans le processus éditorial. La seconde sous-notice de niveau Manifestation contient des choses comme le titre propre (titre en une langue donnée), le nom de l’éditeur, l’année d’édition, le lieu d’édition. Les liens vers le catalogue ou bien vers des versions numériques présentes sur Gallica sont renseignés à ce niveau. La notice de niveau concept contient simplement la date de création de la notice de l’édition.

Globalement, les ontologies rdfs, skos, dcterms, foaf, frbr-rda, bibo, rdarelatioships, rdagroup1elements, bnf-onto sont essentiellement utilisée. Conformément au modèle théorique, on distingue les relations entre entités internes à Data (flèche bleue), interne à la BnF (flèche jaune) et externes (flèche verte). Les attributs des diverses entités sont indiqués sous forme de pavés listant les ontologies et propriétés. Ceux-ci sont renseignés sous forme de données alphanumériques standards.

2.2.3 Aspects informatiques

A la BnF, le modèle de donnée de Data est implémenté avec l’application open-source CubicWeb, mise au point par la société Logilab. Une base orientée graphe contient l’information bibliographique au format RDF. L’application (parfois lente pour certaines entrées trop fortement liées, soyez patients !) génère dynamiquement les pages web.

L’interrogation à l’aide de SPARQL est possible et se montre réactive et fiable. L’interface Yasgui de la société Triply est proposée en interface d’interrogation. Une aide bienvenue à la formulation de requêtes est présente. Des exemples de requêtes sont proposés. La base Data se montre asynchrone et est régulièrement générée à partir des données extraites des bases constitutives. Des données globales ou typées sont finalement disponibles en téléchargement.

  • Data BnF, Web sémantique et modèle de données, PDF : Lien
  • Qu’est-ce que le modèle IFLA LRM ? Transition bibliographique, 2023 : Lien
  • CubicWeb – The Semantic Web is a construction game!, Logilab, documentation : Lien
  • Yasgui, par Triply : Lien
  • Data BnF, Logilab : Lien
  • Data, Interface d’interrogation SPARQL : Lien
  • Dumps de data.bnf.fr : Lien

De premières requêtes SPARQL sont proposées. Elles permettent de quantifier les données présentes fin 2022 dans Data. Ces chiffres sont amenés à évoluer et les requêtes permettent, si souhaité, de faire une mise à jour.

Q22.1 Compter le nombre d’entités de type Concept, Œuvre, Expression, Manifestation, Année ? Lien

# Effectif des entités de type Œuvre, Expression, Manifestation, Instant (année)
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX owl-time:<http://www.w3.org/TR/owl-time/>
SELECT 
#  (COUNT (?workUri) AS ?workNb)
#  (COUNT (?expressionUri) AS ?expressionNb)
#  (COUNT (?manifestationUri) AS ?manifestationNb)
  (COUNT (?annee) AS ?anneeNb)
WHERE {
#  ?workUri a frbr-rda:Work.
#  ?expressionUri a frbr-rda:Expression.
#  ?manifestationUri a frbr-rda:Manifestation.
  ?annee a owl-time:Instant.
}
Type des entitésEffectifPage web liée dans Data
Concept19 454 7011 571 606
Œuvre1 779 70261 423
Expression12 627 2360
Manifestation12 627 2360
Effectif de diverses entités, fin 2022

Dans Data, la règle « une manifestation = une expression » est observée. On remarque que les entités sont toujours visibles en RDF XML. Seuls les entités de type Concept et de type Œuvre peuvent être visualisées sous forme de page web dans Data. Les entités de type Expression et Manifestation sont visualisées en HTML dans le Catalogue général uniquement.

The Works of Geoffrey Chaucer (Les Œuvres de Geoffroy Chaucer) now newly imprinted (The Kelmscott Chaucer), imprimée de nouvelle manière aux éditions Kelmscott Press, par William Morris, 1896. Source d’inspiration pour JRR Tolkien ? : Lien

2.3 Niveau Œuvre

Une publication originale peut se montrer absente des rayons, et cependant identifiée par le travail des catalogueuses et catalogueurs. De plus, un processus semi-automatique de génération des notices de niveau Œuvre est utilisé dans Data. Les triplets sont fabriqués de manière programmée à partir des informations récupérées du catalogue. Pour chaque créateur, les titres de ses publications sont extraites, et regroupées par similarité de manière automatique. Les informations sont ensuite traitées et entrées dans Data. Les fichiers RDF des œuvres originales sont ensuite calculés et les pages HTML générées automatiquement. Les temps de réponse en 2022 se montrent dans certains cas importants et le passage par les moteurs du Catalogue offre alors un recours.

Une requête SPARQL montre que Data référence 1 779 702 œuvres originales en 2023. Une œuvre originale se montre également définie par sa forme. A chaque œuvre originale, une forme particulière est attribuée (texte, musique, mixte, audio et vidéo, etc). Un dictionnaire des formes d’œuvres référence les possibilités. Un code alphabétique sur 2 à 5 caractères référence la liste des genres. Un premier niveau est constitué de 15 formes créatives principales. Des sous-catégories complètent les possibilités. Les « Œuvres textuelles » constituent l’essentiel des effectifs.

  • Liste des vocabulaires employés dans Data, et à la BnF : Lien
  • Dictionnaire des genres ou formes d’œuvres originales dans Data : Lien
genre ou forme de création principalescodeeffectif via page Dataeffectif via SPARQL
Manuscrits et archivesmarch130 542
Non définindef2 447
Objetsob147
Œuvres audiovisuelles (y compris radio)au31 810
Œuvres cartographiquesca22
Œuvres chorégraphiquesch1 264
Œuvres de mise en scènems17
Œuvres des beaux-arts et des arts décoratifsba2 167
Œuvres iconographiquesic44 322
Œuvres logicielles ou multimédialomu10 297
Œuvres mixtesmi166 700141 743
Œuvres musicalestum183 590183 535
Œuvres numismatiquesnu3 834
Œuvres textuelleste1 271 304937 242
Spectaclesspe61 423
Liste des forme d’œuvres

Avec SPARQL, il est possible de compter les genres créatifs présents dans Data. On se sert d’une agrégation sur la variable ?forme pour explorer de manière précise les contenus. La base contient en 2022 386 genres créatifs distincts. Les effectifs fournis par les pages HTML associées à la forme créative se montrent supérieurs à ceux trouvés à l’aide de SPARQL. Non négligeable pour les œuvres textuelles, la cause de cette différence serait à élucider…

Q23.1 Niveau Œuvre : Quelles sont les diverses formes d’œuvres (rdagroup1elements) et leur nombre ? : Lien

# Effectif des "formes d'œuvres" dans Data
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
SELECT ?forme (COUNT (?forme) AS ?formeNb)
WHERE {
  ?workUri a frbr-rda:Work.
  ?workUri rdagroup1elements:formOfWork ?forme.
}
GROUP BY ?forme ?formeNb
ORDER BY DESC(?formeNb)
formeEffectif calculé avec SPARQL
1<http://data.bnf.fr/vocabulary/work-form/te>« 937242 »^^<http://www.w3.org/2001/XMLSchema#integer>
2<http://data.bnf.fr/vocabulary/work-form/tum>« 183535 »^^<http://www.w3.org/2001/XMLSchema#integer>
3<http://data.bnf.fr/vocabulary/work-form/mi>« 141743 »^^<http://www.w3.org/2001/XMLSchema#integer>
Les 3 premières des 386 formes d’œuvres (te:texte, tum:musique, mi:mixte) retrouvées avec SPARQL

L’année de création d’une œuvre est renseignée dans le champ « rdagroup1elements:dateOfWork ». Les effectifs par année de publication peuvent être calculés.

Q23.2 Niveau Œuvre : Répartition par année de première édition des œuvres originales (rdagroup1elements) ? : Lien

# Année de première édition des entités de type Œuvre
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
SELECT ?annee (COUNT (?annee) AS ?anneeNb)
WHERE {
  ?workUri a frbr-rda:Work.
  ?workUri rdagroup1elements:dateOfWork ?annee
}
GROUP BY ?annee ?anneeNb
ORDER BY DESC(?annee)
anneeanneeNb
1<http://data.bnf.fr/date/2022/>« 119 »^^<http://www.w3.org/2001/XMLSchema#integer>
2<http://data.bnf.fr/date/2021/>« 723 »^^<http://www.w3.org/2001/XMLSchema#integer>
3<http://data.bnf.fr/date/2020/>« 9569 »^^<http://www.w3.org/2001/XMLSchema#integer>
4<http://data.bnf.fr/date/2019/>« 23585 »^^<http://www.w3.org/2001/XMLSchema#integer>

Le sujet de l’œuvre est également donné en valeur de la propriété « bnf-onto:subject ». Ce champ admet 62 valeurs différentes; il se montre toutefois rarement renseigné.

Q23.3 Niveau Œuvre : Quels sont les effectifs par sujet (bnf-onto) des œuvres originales ? : Lien

# Sujets Bnf des entités de type Œuvre
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX bnf-onto: <http://data.bnf.fr/ontology/bnf-onto/>
SELECT ?sujetBnf (COUNT (?sujetBnf) AS ?sujetBnfNb)
WHERE {
  ?workUri a frbr-rda:Work.
  ?workUri bnf-onto:subject ?sujetBnf
}
GROUP BY ?sujetBnf
ORDER BY DESC(?sujetBnfNb)
sujetBnfsujetBnfNb
1Arts graphiques« 42882 »^^<http://www.w3.org/2001/XMLSchema#integer>
2Audiovisuel« 29578 »^^<http://www.w3.org/2001/XMLSchema#integer>
3Informatique« 10020 »^^<http://www.w3.org/2001/XMLSchema#integer>
4Littératures« 9848 »^^<http://www.w3.org/2001/XMLSchema#integer>
4 de 62 sujets des entités Œuvre

Q23.4 Niveau Œuvre : Quels sont les effectifs par sujet (dcterms) des œuvres originales ? : Lien

On trouve au total 36 930 sujets d’oeuvres différents. Il peut s’agir d’un code de classement Dewey (61 valeurs possibles), d’une personne (1529 valeurs), d’une organisation (879 valeurs), de concepts divers, parmi lesquels d’autres œuvres originales (33862 valeurs).

# Sujets dcterms des entités de type Œuvre
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
SELECT ?sujet ?sujetNomFamille ?sujetNom ?sujetLabel ?sujetTitre (COUNT (?sujet) AS ?sujetNb)
WHERE {
  ?workUri a frbr-rda:Work.
  ?workUri dcterms:subject ?sujet.
#  ?sujet a foaf:Person.
  OPTIONAL {?sujet foaf:familyName ?sujetNomFamille}
  OPTIONAL {?sujet foaf:name ?sujetNom}
  OPTIONAL {?sujet skos:prefLabel ?sujetLabel}
  OPTIONAL {?sujet dcterms:title ?sujetTitre}
}
GROUP BY ?sujet ?sujetNomFamille ?sujetNom ?sujetLabel ?sujetTitre
ORDER BY DESC(?sujetNb)

Nous pouvons finalement calculer les auteurs dont les œuvres sont les plus fréquemment exprimées. Des compositeurs de musique sont essentiellement trouvés.

Q23.5 Niveau Œuvre : Quels sont les créateurs dont les œuvres sont le plus souvent publiées : Lien

# Fréquence des créateurs pour les entités de type Œuvre
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?createur ?nom (COUNT (?createur) AS ?createurNb)
WHERE {
  ?workUri a frbr-rda:Work.
  OPTIONAL {
    ?workUri dcterms:creator ?createur.
    ?createur foaf:name ?nom.
  }
}
GROUP BY ?createur ?nom ?createurNb
ORDER BY DESC(?createurNb)
LIMIT 30
createurnomcreateurNb
1<http://data.bnf.fr/ark:/12148/cb118897907#about>Johann Sebastian Bach« 778 »^^<http://www.w3.org/2001/XMLSchema#integer>
2<http://data.bnf.fr/ark:/12148/cb14027233b#about>Wolfgang Amadeus Mozart« 615 »^^<http://www.w3.org/2001/XMLSchema#integer>
3<http://data.bnf.fr/ark:/12148/cb13899553z#about>Franz Schubert« 578 »^^<http://www.w3.org/2001/XMLSchema#integer>
4<http://data.bnf.fr/ark:/12148/cb12340814p#about>Roland de Lassus« 558 »^^<http://www.w3.org/2001/XMLSchema#integer>
5<http://data.bnf.fr/ark:/12148/cb138994541#about>Domenico Scarlatti« 531 »^^<http://www.w3.org/2001/XMLSchema#integer>
Les 5 créateurs dont les œuvres sont le plus souvent publiées, d’après Data

Q23.6 Niveau Œuvre : Compter les œuvres originales agrégées et « agrégeantes » : Lien 1, Lien 2

Le nombre de 67 184 œuvres sont « agrégées » par 36 417 œuvres « agrégeantes ». Data utilise deux propriétés de valeur inverse « ore:aggregates » et « ore:isAggregatedBy », définis par l’ontologie ORE Open Repository Exchange (2008). Le terme de « Notice de regroupement » est fréquemment employé pour désigner ces notices bibliographiques spéciales. Le principe constitue l’un des fondements de la transition bibliographique, en matière de pratique de catalogage.

# Œuvres agrégeantes
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX ore: <http://www.openarchives.org/ore/terms/>
SELECT (COUNT (DISTINCT ?workUri) AS ?workUriNb)
WHERE {
  ?workUri a frbr-rda:Work.
  ?workUri ore:aggregates ?workUriAggregated.
}

Q23.7 Niveau Œuvre : Compter le nombre de périodiques : Lien

Data référence 364 069 périodiques, caractérisés de manière structurelle par leur double appartenance aux classes « frbr-rda:Work » et « bibo:Periodical ». Des listes de périodiques répondant à divers critères thématiques, de fréquence de parution, de date de publication peuvent être calculées avec SPARQL.

# Œuvres périodiques
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX bibo: <http://purl.org/ontology/bibo/>
SELECT (COUNT (DISTINCT ?workUri) AS ?workUriNb)
WHERE {
  ?workUri a frbr-rda:Work.
  ?workUri a bibo:Periodical.
}

Q23.8 Niveau Œuvre : Compter le nombre de spectacles : Lien

La BnF recense également en 2022 61 699 spectacles, du genre théâtral ou chorégraphique essentiellement. Les notices sont caractérisées par leur double appartenance aux classes « frbr-rda:Work » et « dcmitype:Event ».

# Spectacles et autres événements
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX dcmitype: <http://purl.org/dc/dcmitype/>
SELECT (COUNT (DISTINCT ?workUri) AS ?workUriNb)
WHERE {
  ?workUri a frbr-rda:Work.
  ?workUri a dcmitype:Event.
}

2.4 Niveau Expression

Plus de douze millions d’expressions (doublées de manifestations) sont référencées dans Data. L’information éditoriale est contenue dans les trois entités Concept, Expression et Manifestation. Ces trois entités apparaissent liées par la structure de leur IRI. Concept est identifié par son IRI simple sans fragment. Le niveau Expression est identifié par l’IRI du Concept suffixé de « #Expression ». Le niveau Manifestation est accessible via l’IRI suffixé du fragment « #about ».

A la différence de la notice Concept de niveau Œuvre, la notice Concept de niveau Expression et Manifestation contient un faible nombre d’informations, essentiellement la date de création de la notice. Les niveaux Expression et Manifestation (les éditions) ne génèrent aucune page HTML dans Data. Seul un fichier au format RDF est fourni en réponse à une requête SPARQL. Des liens vers les pages des bases constitutives (Catalogue, Archives et manuscrits, Gallica) constituent le mode d’accès privilégié pour consulter aisément la notice.

Q24.1 Niveau Expression : Quels sont les effectifs des divers types d’expressions : Lien

Parmi les propriétés au niveau Expression, on remarque à l’aide du schéma et de l’examen d’un fichier RDF, que DCMI Type de Dublin Core est bien renseigné. La propriété « dcterms:type » peut avoir pour valeur « Text », « StillImage », « Sound », etc, ou bien admettre un concept du dictionnaire RAMEAU. L’examen de la liste complète des « types » montre que diverses choses sont ainsi fréquemment notées. Des précisions temporelles comme : « 18e siècle », « 19e siècle », « 2000-…. », etc. Des précisions sur la nature d’un document : « Actes de congrès », « Catalogues d’exposition », « Biographie », « Guides pratiques », « Partitions », « Correspondance », « Dictionnaire », « Encyclopédie », « Manuels d’enseignement supérieur », etc. Des genres musicaux : « Chansons françaises », « Opéras-comiques », « Valses (piano) ».

# Effectif des valeurs de la propriété Dublin Core "type" des entités "Expression"
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
SELECT ?typeDc ?typeDcNom (COUNT(?typeDc) AS ?typeDcNb)
WHERE {
  ?expressionUri a frbr-rda:Expression.
  ?expressionUri dcterms:type ?typeDc.
  OPTIONAL {?typeDc skos:prefLabel ?typeDcNom.}
}
GROUP BY ?typeDc ?typeDcNb ?typeDcNom
ORDER BY DESC (?typeDcNb)
LIMIT 10
typeDctypeDcNomtypeDcNb
1<http://purl.org/dc/dcmitype/Text>« 10 173 819 »^^<http://www.w3.org/2001/XMLSchema#integer>
2<http://purl.org/dc/dcmitype/StillImage>« 887 936 »^^<http://www.w3.org/2001/XMLSchema#integer>
3<http://purl.org/dc/dcmitype/Sound>« 663 400 »^^<http://www.w3.org/2001/XMLSchema#integer>
4<http://purl.org/dc/dcmitype/Image>« 360 492 »^^<http://www.w3.org/2001/XMLSchema#integer>
5<http://purl.org/dc/dcmitype/MovingImage>« 255 018 »^^<http://www.w3.org/2001/XMLSchema#integer>
6<http://purl.org/dc/dcmitype/PhysicalObject>« 158 843 »^^<http://www.w3.org/2001/XMLSchema#integer>
7<http://purl.org/dc/dcmitype/InteractiveResource>« 127 728 »^^<http://www.w3.org/2001/XMLSchema#integer>
8<http://data.bnf.fr/ark:/12148/cb120611486>« Actes de congrès »@fr« 125 243 »^^<http://www.w3.org/2001/XMLSchema#integer>
9<http://data.bnf.fr/ark:/12148/cb11975999w>« 19e siècle »@fr« 114 838 »^^<http://www.w3.org/2001/XMLSchema#integer>
10<http://data.bnf.fr/ark:/12148/cb11975995h>« 20e siècle »@fr« 94 287 »^^<http://www.w3.org/2001/XMLSchema#integer>
10 valeurs les plus fréquentes de « dcterms:type » pour les entités Expression

Les sujets des œuvres éditées se montrent renseignés au niveau Expression et il est possible de chercher les sujets les plus souvent renseignés dans Data.

Q24.2 Niveau Expression : Quelles sont les sujets (dcterms) et effectifs des éditions ? : Lien

# Sujets Dublin Core des entités de type Expression
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
SELECT ?sujetDc (COUNT (?sujetDc) AS ?sujetDcNb)
WHERE {
  ?expressionUri a frbr-rda:Expression.
  ?expressionUri dcterms:subject/skos:prefLabel ?sujetDc.
}
GROUP BY ?sujetDc ?sujetDcNb
ORDER BY DESC(?sujetDcNb)
LIMIT 20
1« France »@fr« 409 343 »^^<http://www.w3.org/2001/XMLSchema#integer>
2« Histoire »@fr« 169 488 »^^<http://www.w3.org/2001/XMLSchema#integer>
3« Portraits »@fr« 103 196 »^^<http://www.w3.org/2001/XMLSchema#integer>
4« Critique et interprétation »@fr« 86 825 »^^<http://www.w3.org/2001/XMLSchema#integer>
5« 20e siècle »@fr« 81 187 »^^<http://www.w3.org/2001/XMLSchema#integer>
Les cinq sujets les plus populaires dans Data

Une requête similaire peut être lancée sur les langues, pour lesquelles la norme 639-2 est appliquée :

Q24.3 Niveau Expression : Quelles sont les langues (dcterms) et effectifs des éditions ? : Lien

# Effectif des langues dans les entités "Expression"
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
SELECT ?langue (COUNT(?langue) AS ?langueNb)
WHERE {
  ?expressionUri a frbr-rda:Expression.
  ?expressionUri dcterms:language ?langue.
}
GROUP BY ?langue ?langueNb
ORDER BY DESC (?langueNb)
LIMIT 10
  • Liste des codes de langues (iso 639-2), code sur trois lettres, à la BnF : Lien
  • Liste des codes de langues (iso 639-2), code sur trois lettres, à la LoC : Lien
languelangueNb
1<http://id.loc.gov/vocabulary/iso639-2/fre>« 6 916 627 »^^<http://www.w3.org/2001/XMLSchema#integer>
2<http://id.loc.gov/vocabulary/iso639-2/eng>« 1 580 823 »^^<http://www.w3.org/2001/XMLSchema#integer>
3<http://id.loc.gov/vocabulary/iso639-2/ger>« 801 805 »^^<http://www.w3.org/2001/XMLSchema#integer>
Les trois langues les plus fréquentes

Q24.4 Niveau Expression : Quelles sont les les effectifs de personnes jouant des rôles particuliers ? : Lien

Au-delà du rôle d’auteur, les rôles joués par diverses personnes lors du processus éditorial sont précisés. Parmi les rôles, celui de traducteur, d’illustrateur, de préfacier, d’auteur adapté, de réalisateur, etc. Les rôles joués sont précisés à l’aide de codes référencés dans deux dictionnaires différents. Le premier est celui de la BnF qui contient 525 rôles possibles. Le dictionnaire de la Bibliothèque du Congrès contient 271 rôles. Nous nous intéressons ici à la liste de la Bnf et quelques effectifs peuvent être calculés. La requête suivante se montre assez longue et dure environ 30 secondes. Le nombre de 2 878 898 auteurs distinct est calculé. Comparé à Dublin Core et ses trois simples propriétés « auteur », « contributeur », « éditeur » ces dictionnaires ajoutent d’importantes précisions, de réemploi conseillé lors de la mise au point de bases sémantiques en relation avec les bibliothèques.

  • Liste des rôles dans Data d’après la BnF (Dictionnaire Vocabulary) : Lien
  • Rôles dans Data, d’après la Bibliothèque du Congrès (Dictionnaire Relators) : Lien
# Effectif de divers rôles joués
PREFIX bnfroles: <http://data.bnf.fr/vocabulary/roles/>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>

SELECT 
	(COUNT(DISTINCT ?r70) AS ?auteurs)
	(COUNT(DISTINCT ?r72) AS ?auteursAdaptes)
	(COUNT(DISTINCT ?r110) AS ?epistoliers)
	(COUNT(DISTINCT ?r150) AS ?cartographes)
	(COUNT(DISTINCT ?r360) AS ?editeursSientifiques)
	(COUNT(DISTINCT ?r610) AS ?realisateurs)
	(COUNT(DISTINCT ?r680) AS ?traducteurs)
WHERE {
  ?expressionUri a frbr-rda:Expression.
  OPTIONAL{?expressionUri bnfroles:r70 ?r70.} #Auteur
  OPTIONAL{?expressionUri bnfroles:r72 ?r72.} #Auteur adapté
  OPTIONAL{?expressionUri bnfroles:r110 ?r110.} #Auteur de lettres
  OPTIONAL{?expressionUri bnfroles:r150 ?r150.} #Auteur de cartes
  OPTIONAL{?expressionUri bnfroles:r360 ?r360.} #Editeur scientifique
  OPTIONAL{?expressionUri bnfroles:r610 ?r610.} #Réalisateur
  OPTIONAL{?expressionUri bnfroles:r680 ?r680.} #Traducteur
}
auteursauteursAdaptesepistolierscartographesediteursSientifiquesrealisateurstraducteurs
12 878 89814 81735 47512 404615 14258 020136 988

2.5 Niveau Manifestation

Nous trouvons au niveau Manifestation les nombreuses informations en provenance de l’éditeur. Sont notamment présents et décrits avec Dublin Core le titre propre (dcterms:title), l’année de publication (dcterms:date), la description physique du livre (dcterms:description) ou du disque, le sujet (dcterms:subject), le nom de l’éditeur (dcterms:publisher).

Les contenus de « dcterms:publisher » résultent de l’assemblage du lieu de publication, du nom de l’organisme et de l’année de publication. Par exemple : « Paris : Stock , 1969 ». Les éléments individuels de ce champ composite sont accessibles respectivement sous « rdagroup1elements:placeOfPublication », « rdagroup1elements:publishersName », « dcterms:date ».

A noter également le lien vers le Catalogue et vers les bases constitutives référencé avec « rdfs:seeAlso ». Pour la Littérature Jeunesse, un code de genre peut être spécifié dans « schema:genre ».

Q25.1 Niveau Manifestation : quels sont les éditeurs (rdagroup1elements) les plus présents dans Data ? : Lien

# Lister les éditeurs au niveau Manifestation et les compter
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
SELECT ?editeur (COUNT (?editeur) AS ?editeurNb)
WHERE {
  ?manifUri a frbr-rda:Manifestation.
  ?manifUri rdagroup1elements:publishersName ?editeur.
}
GROUP BY ?editeur ?editeurNb
ORDER BY DESC(?editeurNb)
LIMIT 20
editeurediteurNb
1[s.n.]370 203
2Hachette55 325
3s.n.53 424
4Springer50 281
5l’Harmattan49 081
Les 5 éditeurs les plus prolixes dans Data

Q25.2 Niveau Manifestation : quels sont les effectifs par année d’édition (dcterms) ? : Lien

# Lister les dates au niveau Manifestation et les compter
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX dcterms: <http://purl.org/dc/terms/>
SELECT ?date (COUNT (?date) AS ?dateNb)
WHERE {
  ?manifUri a frbr-rda:Manifestation.
  ?manifUri dcterms:date ?date.
}
GROUP BY ?date ?dateNb
ORDER BY DESC(?dateNb)
LIMIT 20
datedateNb
12012163 963
22013162 388
32014157 640

Il est possible de noter que ce champ admet des valeurs fort variables, parmi lesquelles des dates écrites en chinois (文政7 [1824]) et autres graphies, des durées (1968-201​7), etc.

Q25.3 Niveau Manifestation : quels sont les effectifs par lieu de publication (rdagroup1elements) ? : Lien

# Lister les lieux de publication
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
SELECT ?lieuPubli (COUNT (?lieuPubli) AS ?lieuPubliNb)
WHERE {
  ?manifUri a frbr-rda:Manifestation.
  ?manifUri  rdagroup1elements:placeOfPublication ?lieuPubli.
}
GROUP BY ?lieuPubli ?lieuPubliNb
ORDER BY DESC(?lieuPubliNb)
LIMIT 20
1Paris3308949
2[Paris]497 522
3[S.l.]394 350
4London163 291
5New York96 022
Les lieux de publication les plus fréquents

Q25.4 Niveau Manifestation : quels sont les genres littéraires (schemaorg) pour la jeunesse les plus référencés : Lien

# Lister les genres litt. jeunesse au niveau Manifestation et les compter
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX schemaorg: <http://schema.org/>
SELECT ?genre (COUNT (?genre) AS ?genreNb)
WHERE {
  ?manifUri a frbr-rda:Manifestation.
  ?manifUri schemaorg:genre ?genre.
}
GROUP BY ?genre ?genreNb
ORDER BY DESC(?genreNb)
LIMIT 20
genregenreNb
1<http://data.bnf.fr/vocabulary/genre-jn/JnAlbum>58 005
2<http://data.bnf.fr/vocabulary/genre-jn/JnRoman>47 936
3<http://data.bnf.fr/vocabulary/genre-jn/JnBDessi>34 265
  • Liste des genres pour les ouvrages jeunesse : Lien
  • Liste des genres musicaux : Lien
  • Liste des codes de pays, code sur deux lettres : Lien
Décors du tournage du Hobbit (Nouvelle-Zélande), architecture imaginaire librement inspirée des habitats vikings aux toit de gazon : Lien

3. Le Hobbit, par Tolkien et d’autres

Proposé par les étudiants d’Aix-Marseille Université, le schéma suivant propose un récapitulatif de FRBR, appliqué précisément au cas du Hobbit. Un code couleur vient expliciter la nature des différentes notices. En rouge, l’oeuvre originale et première de 1937. En rose les adaptations, considérées comme oeuvres originales également, du fait du changement de la forme de l’oeuvre. En vert et jaune, les éditions en différentes langues, dans lesquelles Expression et Manifestation sont distingués. Les rôles joués par les intervenants (créateur, traducteur, réalisateur) sont indiqués entre parenthèses, en bleu à côté des flèches. Dans les films, Tolkien joue le rôle d’auteur adapté et autorise le lien entre Œuvre originale et Œuvre adaptée (marqué en flèche noire). Simple, n’est-ce pas ?

FRBR, la transition bibliographique et « The Hobbit ». Schéma des étudiants du Master mention « Histoire et humanités »: Lien

3.1 Entité Œuvre : « The Hobbit, par John Ronald Reuel Tolkien, 1937, texte en anglais »

Le roman original de Tolkien en anglais se montre physiquement absent des rayons de la BnF. Fruit d’une reconstruction, la notice du roman original est cependant référencée dans Data et dans le Catalogue au format HTML et RDF. Un jeu d’URLs générées automatiquement par l’application permet d’accéder à une variété d’informations, présentées en divers formats :

Une page web sur Tolkien, l’auteur :

Le fichier RDF rend bien visible les ontologies et propriétés utilisées. Ces informations se montrent nécessaires à la formulation des requêtes SPARQL. Pour lire plus facilement un fichier RDF, il est possible d’installer l’extension de navigateur « OpenLink Structured Data Sniffer ».

  • OpenLink Structured Data Sniffer : Lien

3.2 Entités Expression et Manifestation : « J. R. R. Tolkien. Bilbo le Hobbit ou Histoire d’un aller et retour. Traduit de l’anglais par Francis Ledoux, 1969, texte en français »

Francis Ledoux effectue en 1969 la première traduction du roman. Les renseignements relatifs à une édition particulière donnent lieu à trois sous-entités différentes, de classe respectivement Concept (IRI simple), Expression (IRI suffixé du fragment « #Expression ») et Manifestation (IRI suffixé de « #about »).

La notice Concept d’une édition ne contient que sa date de création. Les renseignements sur le titre, la traduction, l’édition et l’éditeur sont renseignés au niveau Expression et Manifestation. La relation de l’expression vers l’oeuvre originale est donnée par « rdarelationships:expressionOfWork », celle de la manifestation par « rdarelationships:workManifested ». Il faut quitter Data et se rendre dans le Catalogue, pour disposer d’une page web lisible.

Le premier traducteur Francis Ledoux (1906-1990), dispose quant à lui d’une page HTML bien renseignée. Les divers rôles joués (traducteur, éditeur scientifique) sont indiquées :

De nombreuses notices éditoriales n’ont pas encore leur équivalent au niveau Œuvre. Ainsi actuellement, le livre Les Aventures de Tom Bombadil, publié en français en 1975 dans une traduction de Jack-Alain Léger (pseudonyme), ne dispose pas de sa notice Œuvre : The Adventures of Tom Bombadil.

3.3 Entités Œuvre : « The Hobbit (film) »

Affiche américaine du film Le Hobbit, par Peter Jackson : La Désolation de Smaug

Adapté du texte, le premier film de Peter Jackson est considéré dans Data comme une œuvre originale. La notice RDF précise la forme créative « http://data.bnf.fr/vocabulary/work-form/au » (forme audiovisuelle). Le premier film est tourné en 2011 et sort en salle en France en 2012. Dans Data, une page HTML de type œuvre existe pour la trilogie (œuvre agrégative), de même que pour chacun des films constitutifs.

3.3.1 The Hobbit (film ; série), réalisé par Peter Jackson, 2012, film, Œuvre

La note d’application précise : « À n’utiliser que pour les documents traitant des trois films ». La propriété « ore:aggregates » permet de signaler en RDF XML et SPARQL l’IRI des œuvres agrégées. Des figurines et un livre de croquis préalables à la réalisation sont décrits comme édition dérivée.

3.3.2 An unexpected journey, réalisé par Peter Jackson, 2012, film, Œuvre

Notice du premier film de la trilogie.

3.3.3 Pages HTML du réalisateur Peter Jackson

3.4 Requêtes sur Tolkien et le Hobbit

SPARQL permet d’interroger Data et de configurer à la demande la structure des tableaux affichés en retour d’une requête.

Q34.1 Lister les œuvres originales de J.R.R. Tolkien présentes dans Data : Lien

Cette requête est formulée de manière générique, si bien qu’elle peut être aisément adaptée à n’importe quel auteur (personne ou collectivité) en modifiant le premier motif de triplet dans la partie WHERE, dans lequel il est demandé de trouver les IRI « des oeuvres dont l’auteur est nommé » : « John Ronald Reuel Tolkien », sans spécification de langue. Les autres motifs, souhaités optionnels, permettent l’affichage d’autres champs de la notice de niveau Œuvre.

# Tolkien dans Data, ses oeuvres originales
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
PREFIX bnf-onto: <http://data.bnf.fr/ontology/bnf-onto/>
SELECT *
WHERE {
  ?workUri dcterms:creator/foaf:name "John Ronald Reuel Tolkien".
  OPTIONAL {?workUri dcterms:title ?titre.}
  OPTIONAL {?workUri dcterms:date ?date.}
  OPTIONAL {?workUri dcterms:description ?description.}
  OPTIONAL {?workUri bnf-onto:subject ?sujetBnf.}
}
ORDER BY ?date
workUrititredatedescription
1<http://data.bnf.fr/ark:/12148/cb144469423#about>« The history of Middle-earth »@fr« Oeuvre fantastique en douze tomes »@fr
2<http://data.bnf.fr/ark:/12148/cb12545196g#about>« The Hobbit »@en1937
3<http://data.bnf.fr/ark:/12148/cb167043914#about>« On fairy-stories »@en1939« Texte d’une conférence tenue en 1939, remanié et publié en 1947 dans le volume « Essays presented to Charles Williams » puis en 1964 dans « Tree and leaf » »@fr
4<http://data.bnf.fr/ark:/12148/cb11939715m#about>« The Lord of the rings »@en1954« Épopée mythologique en trois parties : The fellowship of the ring, The two towers, The return of the king »@fr
5<http://data.bnf.fr/ark:/12148/cb11957451k#about>« The silmarillion »@en1977« Récit utopique publié de manière posthume »@fr
5 œuvres originales de Tolkien référencées dans Data

Q34.2 Lister les œuvres originales de J.R.R. Tolkien référencées dans Data, ainsi que les diverses éditions : Lien

Les propriétés de l’ontologie « rdarelationships » permettent d’aisément naviguer entre les niveaux Œuvre, Expression et Manifestation pour y récupérer les informations qui nous intéressent. Les renseignements sur les éditions sont présentes au niveau Manifestion, auquel on se rend avec « rdarelationships:workManifested ». Parmi les résultats d’une liste de 94 textes, un texte non traduit et non publié en France; celui sur la conférence donnée en 1939 sur les histoires de fées.

# Tolkien dans Data, œuvres originales, œuvres publiées
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
PREFIX bnf-onto: <http://data.bnf.fr/ontology/bnf-onto/>
PREFIX rdarelationships: <http://rdvocab.info/RDARelationshipsWEMI/>
PREFIX schemaorg: <http://schema.org/>
SELECT *
WHERE {
  ?workUri dcterms:creator/foaf:name "John Ronald Reuel Tolkien".
  OPTIONAL {?workUri dcterms:title ?titreOrig.}
  OPTIONAL {?workUri dcterms:date ?dateOrig.}
  OPTIONAL {?workUri dcterms:description ?descriptionOrig.}
  OPTIONAL {?workUri bnf-onto:subject ?sujetBnf.}
  OPTIONAL {
    ?manifestationUri rdarelationships:workManifested ?workUri.
    ?manifestationUri dcterms:title ?titreEdition.
    ?manifestationUri dcterms:date ?dateEdition.
    ?manifestationUri rdagroup1elements:publishersName ?editeur.
    OPTIONAL {?manifestationUri schemaorg:genre ?genreEdition.}
  }
}
ORDER BY ?dateOrig ?dateEdition

Q34.3 Lister l’ensemble des éditions auxquelles J.R.R. Tolkien a participé de manière directe ou indirecte : Lien

On recherche dans cette requête les éditions auxquelles Tolkien a contribué. On interroge la base au niveau Expression. Les rôles joués par les personnes sont recherchés. Puis on accède successivement au niveau Manifestation avec la propriété « rdarelationships:expressionManifested », et au niveau Œuvre avec « rdarelationships:expressionOfWork ». Les métadonnées pertinentes sont extraites à chacun de ces niveaux. Le total de 353 éditions est obtenu. Les dates des oeuvres originales s’échelonnent de 1350 à 2004.

En effet, Tolkien écrit une introduction, des notes et un glossaire sur l’édition de 1936 d’un roman écrit en anglais moyen daté de 1350 : Sir Gawain and the Green Knight / Sire Gauvain et le Chevalier vert. Il participe aussi en tant qu’éditeur scientifique (<http://data.bnf.fr/vocabulary/roles/r360>) à la collection « Oxford English monographs » publiée à partir de 1940. Ses rôles sont ceux d’auteur (<http://data.bnf.fr/vocabulary/roles/r70>), et d’auteur adapté (<http://data.bnf.fr/vocabulary/roles/r72>) pout tout un ensemble d’items.

# Tolkien dans Data, diverses éditions
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX rdarelationships: <http://rdvocab.info/RDARelationshipsWEMI/>
SELECT *
WHERE {
  ?expressionUri dcterms:contributor/foaf:name "John Ronald Reuel Tolkien".
  ?manifestationUri rdarelationships:expressionManifested ?expressionUri.
  OPTIONAL {?manifestationUri dcterms:title ?titre.}
  OPTIONAL {?manifestationUri dcterms:date ?date.}
  OPTIONAL {?manifestationUri dcterms:description ?description.}
  OPTIONAL {
    ?workUri rdarelationships:expressionOfWork ?expressionUri.
    ?workUri dcterms:title ?titreOrig.
    OPTIONAL {?workUri dcterms:date ?dateOrig.}
    OPTIONAL {?workUri dcterms:creator/foaf:name ?auteurOrig.}
  }
}
ORDER BY ?date

Q34.4 Lister les éditions dérivées de l’œuvre originale « The Hobbit » de J.R.R. Tolkien : Lien

Les diverses éditions tirées du roman original sont cherchées. Dans cette requête, les deux premiers motifs de triplets servent à récupérer l’IRI de l’œuvre originale à partir de son libellé préférentiel en anglais. Nous passons successivement du niveau concept, au niveau œuvre et au niveau manifestation. On obtient au final 33 éditions, parmi lesquelles un spectacle en date de 2004. On remarque que dans le cas des spectacles, la date se montre plus précise et typée.

# Manifestations de "The Hobbit" dans Data
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX rdarelationships: <http://rdvocab.info/RDARelationshipsWEMI/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX dcterms: <http://purl.org/dc/terms/>
SELECT ?titre ?date ?description ?editeur ?manifestationUri
WHERE {
  ?workUriConcept skos:prefLabel "The Hobbit"@en.
  ?workUriConcept foaf:focus ?workUri.
  ?manifestationUri rdarelationships:workManifested ?workUri.
  OPTIONAL {?manifestationUri dcterms:title ?titre.}
  OPTIONAL {?manifestationUri dcterms:date ?date.}
  OPTIONAL {?manifestationUri dcterms:description ?description.}
  OPTIONAL {?manifestationUri dcterms:publisher ?editeur.}
}
ORDER BY ?date
31Bilbo le Hobbit20141 vol. (503 p.)Paris : Hachette , DL 2014<http://data.bnf.fr/ark:/12148/cb44226371k#about>
32Bilbon lo Hòbbit20181 vol. (215 p.)Cressé : Éditions des Régionalismes , impr. 2018<http://data.bnf.fr/ark:/12148/cb45632596j#about>
33« Bilbo le hobbit / adaptation et mise en scène de Francine Llouc »@fr« 2004-01-14 »^^<http://www.w3.org/2001/XMLSchema#date>« Paris (France) : Espace Paris-Plaine – 14-01-2004 »@fr<http://data.bnf.fr/ark:/12148/cb39501667n#about>
3 parmi 33 éditions de « The Hobbit », édition en breton et spectacle de 2014

Q34.5 Lister les œuvres originales dont le titre contient le mot « Hobbit » : Lien

La requête suivante se montre d’exécution relativement lente (7 secondes). La clause FILTER est appliquée à l’ensemble des titres de la base pour rechercher le motif « Hobbit » dans les valeurs de la propriété « dcterms:title ». 9 résultats sont trouvés, parmi lesquels des oeuvres dont le sujet est « The Hobbit », les films de Peter Jackson, un jeu vidéo, une revue sur le thème des jeux de rôles « Le Hobbit fataliste ».

PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
SELECT *
WHERE {
  ?workUri a frbr-rda:Work.
  ?workUri dcterms:title ?titre.
  OPTIONAL {?workUri dcterms:creator/foaf:name ?auteur.}
  OPTIONAL {?workUri dcterms:subject/skos:prefLabel ?sujet.}
  OPTIONAL {?workUri rdagroup1elements:dateOfWork/rdfs:label ?date.}
  FILTER(CONTAINS(?titre, "Hobbit")).
}
LIMIT 10
workUrititreauteursujetdate
1<http://data.bnf.fr/temp-work/c532b0f929e67cebb490913e98061c52/#about>« La quête du sens dans « Bilbo le Hobbit » de J. R. R. Tolkien »@frAlain Tesnière« The Hobbit »@en2007
2<http://data.bnf.fr/temp-work/676aa080be8bf2812d4f48f0375aeb3a/#about>« Promenades au pays des Hobbits, itinéraires à travers la Comté de J.R.R. Tolkien »@frJean-Rodolphe Turlin« The Hobbit »@en2012
3<http://data.bnf.fr/ark:/12148/cb12545196g#about>« The Hobbit »@enJohn Ronald Reuel Tolkien1937
4<http://data.bnf.fr/ark:/12148/cb169690499#about>« Lego the Hobbit (jeu vidéo) »@en2014
4 de 9 résultats

Conclusion

Data référence deux grandes catégories de notices bibliographiques : 1/ des notices du type Œuvre avec page HTML dans Data et dans le Catalogue 2/ des notices d’édition dans lesquelles les propriétés sont réparties en une partie Expression et une partie Manifestation, avec page HTML dans le Catalogue uniquement et notice RDF dans Data. Ces deux catégories peuvent être interrogées à l’aide de SPARQL, éventuellement de manière conjointe. Les information de niveau Item sont contenues dans les bases constitutives : le Catalogue pour les imprimés, Archives et manuscrits pour les documents d’archives, Gallica pour les documents numérisés.

The Hobbit, de J.R.R Tolkien se montre bien présent dans les bases de la BnF. Le roman donne lieu à de multiples adaptations et traductions, preuve d’un intérêt non démenti pour les contes et le fantastique. Parmi les autres documents sur Tolkien, à la BnF et ailleurs, les curieux pourront pousser l’aventure un peu plus loin. Tolkien Estate, la société en charge des droits d’auteur, propose un site trilingue dans lequel plusieurs dessins et peintures signées de Tolkien sont présentées. On note aussi à la BnF les pages web de l’exposition de 2019 : Tolkien, voyage en Terre du Milieu.

Pour les fans, le site Fantasy de la BnF mérite aussi d’être visité. Publié en 2020, il présente le genre littéraire. Les publications qui s’en réclament puisent leur inspiration des légendes arthuriennes, des mythes celtiques, des chansons de geste et sagas nordiques. Plusieurs articles ont pour sujet J.R.R. Tolkien, ses écrits et dessins. Il est même possible de jouer en ligne ! On y apprend le rôle influent dans l’oeuvre et son illustration joué par William Morris (1834-1896), un des artistes et éditeur à l’origine du mouvement graphique et philosophique du XIXème Arts and Crafts.

  • BnF Exposition, Tolkien, voyage en Terre du Milieu, 2019-2020 : Lien
  • BnF Exposition, Fiche iconographique, Tolkien. Voyage en Terre du Milieu, 2019-2020, PDF : Lien
  • BnF Fantasy, Tolkien, un maître de la fantasy, Anne Besson, 2020 : Lien
  • BnF Fantasy, William Morris, l’écrivain aux mille visages, Anne Besson, 2020 : Lien
  • BnF Fantasy, Beowulf, le poème médiéval fondateur de l’épique, William Blanc, 2020 : Lien
  • Le Hobbit, un récit fondateur, John D. Rateliff, Tolkien Estate : Lien
  • Tolkien Studies: An Annual Scholarly Review, Le Hobbit (The Hobbit), Druss, 2020 : Lien
  • O’Brien Browne. A Hobbit on the Somme, 2007, Warfare History Network : Lien
La première édition américaine, avec illustration de l’auteur, Tolkien Library Store, 1938, chez Houghton Mifflin : Lien

Une série d’articles sur SPARQL et Data à la BnF

Tutoriels

  • data.bnf.fr et SPARQL. Partie 1 : les bases constitutives, avec Bach : Lien
  • data.bnf.fr et SPARQL. Partie 2 : des notices d’œuvres, des notices d’éditions, avec le Hobbit de Tolkien
  • data.bnf.fr et SPARQL. Partie 3 : Les Auteurs avec Monsieur de Maupertuis : Lien
  • La BnF et SPARQL. Partie 4 : l’entité Concept, les dictionnaires RAMEAU et l’entité Date : [TODO]

Laisser un commentaire