8 345 mots, temps de lecture 44 minutes
Mise en ligne en 2011, la base sémantique data.bnf.fr (Data) de la BnF propose une interface unique, qui rend possible l’interrogation simultanée du catalogue général catalogue.bnf.fr, de la base Archives et manuscrits archivesetmanuscrits.bnf.fr, et de Gallica gallica.bnf.fr. La recherche d’une variété d’objets physiquement présents dans les rayons de la BnF devient ainsi possible. On trouve dans Data les signalements de livres, de périodiques, de partitions, de documents audios, de films, de jeux vidéo, d’images et de gravures, de cartes. Des pièces d’archives relatives au théâtre et à l’opéra de même que des pièces de musées sont également référencées et visibles pour certaines au format numérique.
Pour comprendre l’organisation des données dans Data, nous devons rendre compte des travaux menés précédemment par l’IFLA (Fédération internationale des associations et institutions de bibliothèques). La structure des données se montre en effet fortement influencée par une série de modèles entité-association. Mis au point entre 1998 et 2016, FRBR (Functional Requirements for Bibliographic Records / Fonctionnalités requises des notices bibliographiques) propose de scinder l’information bibliographique en une suite de quatre entités liées entre elles et nommées Œuvre, Expression, Manifestation, Item. Publié en plusieurs versions de 2010 à 2013, Le modèle FRAD (Functional Requirements for Authority Data) permet la description des auteurs et contributeurs des objets produits. Publié entre 2011 et 2018, FRSAD (Functional Requirements for Subject Authority Data) modélise la descriptions des thèmes et sujets des œuvres.
En première approche, les contenus de Data peuvent être aisément explorés à l’aide du moteur de recherche principal de l’interface, sans connaissance particulière de la structure des données. De moteurs thématiques viennent en effet compléter les capacités du moteur principal. On trouve ainsi dans Data en 2023 : 2 505 283 Auteurs, 1 360 150 Œuvres, 197 494 Thèmes, 119 824 Lieux, 5 385 Dates, 61 818 Spectacles, 367 814 Périodiques. Comparé aux moteurs standards, l’interrogation à l’aide de SPARQL (SPARQL Protocol and RDF Query Language) vient apporter des possibilités supplémentaires. Elle permet l’exploration fine des contenus, l’éventuelle extraction personnalisée des données, l’élaboration de statistiques.
Dans Data, deux types de notices existe :
1/ La notices du type Œuvre. L’œuvre originale est décrite, que celle-ci soit un livre, un périodique, un disque, un spectacle, indépendamment de l’édition. Par exemple, dans « The Hobbit », par J.R.R Tolkien, la version originale textuelle en anglais date de 1937. De multiples sous-notices relient l’œuvre originale aux diverses éditions, en différentes langues. La notice d’œuvre présente dans le Catalogue peut être vue dans Data en HTML ou en RDF / XML. Dans le Catalogue, on accède aux diverses notices liées à l’œuvre en cliquant en bas à droite sur auteur, titre ou sujet. La même notice peut ainsi être visualisée de différentes manières :
- Dans le Catalogue général en HTML : https://catalogue.bnf.fr/ark:/12148/cb12545196g
- Dans Data en HTML : https://data.bnf.fr/ark:/12148/cb12545196g
On remarque au passage la structure des URL, significative de l’affichage.
2/ Les notices d’édition. Celle-ci sont constituées d’un fragment Expression et d’un fragment Manifestation. Un exemple de notice est celle du roman pour la jeunesse « Bilbo le Hobbit ou Histoire d’un aller et retour », traduction par Francis Ledoux, paru en 1969 chez Stock. La notice de cette édition en français peut être vue dans le Catalogue et aussi dans Data, mais alors uniquement en RDF, non en HTML.
- Dans le Catalogue général en HTML : https://catalogue.bnf.fr/ark:/12148/cb33193517n
- Dans Data en XML RDF : https://data.bnf.fr/ark:/12148/cb33193517n
Les successives éditions exemplifient la première édition, considérée comme œuvre originale. La notice d’œuvre permet de formellement lier l’original à la série des éditions parues en diverses langues, supports, formats, adaptations. Un lien relie également l’édition à l’œuvre originale. Mais comment interroger tout cela ?
Dans ce deuxième billet sur Data, les possibilités des moteurs standards sont tout d’abord explorées. Les principales classes et propriétés en relation avec les contenus sont recherchés. Puis de simples comptages sont tout d’abord effectués avec SPARQL. Le modèle de données retenu pour Data est présenté dans son ensemble, puis détaillé en ce qui concerne les descriptions bibliographiques. Le roman « The Hobbit, or There and Back Again » de J.R.R Tolkien sert de fil rouge à ce deuxième tutoriel sur Data.
Plan
- Recherches standards
- 1.1 Le moteur standard
- 1.2 L’index « Œuvres«
- 1.3 Autres moteurs
- L’entité Concept et le modèle FRBR dans Data, étude quantitative
- 2.1 De FRBR à IFLA-LRM
- 2.2 Le modèle de données de Data
- 2.2.1 Notices du type Œuvre
- 2.2.2 Notices des éditions
- 2.2.3 Aspects informatiques
- 2.3 Niveau Œuvre
- 2.4 Niveau Expression
- 2.5 Niveau Manifestation
- Le Hobbit, par Tolkien et par d’autres
- 3.1 Entité Œuvre : « The Hobbit, par John Ronald Reuel Tolkien »
- 3.2 Entités Expression et Manifestation : « J. R. R. Tolkien. Bilbo le Hobbit ou Histoire d’un aller et retour. Traduit de l’anglais par Francis Ledoux »
- 3.3 Entités Œuvre : « The Hobbit (film), réalisé par Peter Jackson »
- 3.4 Requêtes sur Tolkien et le Hobbit
Le numéro de requête indique la localisation dans le plan :
- Q22.1 Compter le nombre d’entités de type Concept, Œuvre, Expression, Manifestation dans Data : Lien
- Q23.1 Niveau Œuvre : Quels sont les effectifs par genre créatif (rdagroup1elements) présents dans Data ? : Lien
- Q23.2 Niveau Œuvre : Répartition par année de première édition des œuvres originales (rdagroup1elements) ? : Lien
- Q23.3 Niveau Œuvre : Quels sont les effectifs par sujet (bnf-onto) des œuvres originales ? : Lien
- Q23.4 Niveau Œuvre : Quels sont les effectifs par sujet (dcterms) des œuvres originales ? : Lien
- Q23.5 Niveau Œuvre : Quels sont les créateurs dont les œuvres sont le plus souvent publiées : Lien
- Q23.6 Niveau Œuvre : Compter les œuvres originales agrégées et agrégeantes : Lien 1, Lien 2
- Q23.7 Niveau Œuvre : Compter le nombre de périodiques : Lien
- Q23.8 Niveau Œuvre : Compter le nombre de spectacles : Lien
- Q24.1 Niveau Expression : Quels sont les effectifs des divers types d’expressions : Lien
- Q24.2 Niveau Expression : Quelles sont les sujets (dcterms) et effectifs des expressions ? : Lien
- Q24.3 Niveau Expression : Quelles sont les langues (dcterms) et effectifs des entités expression ? : Lien
- Q24.4 Niveau Expression : Quelles sont les les effectifs de personnes jouant des rôles particuliers ? : Lien
- Q25.1 Niveau Manifestation : quels sont les éditeurs (rdagroup1elements) les plus présents dans Data ? : Lien
- Q25.2 Niveau Manifestation : quels sont les effectifs par années (dcterms) de publication ? : Lien
- Q25.3 Niveau Manifestation : quels sont les effectifs par lieu de publication (rdagroup1elements) ? : Lien
- Q25.4 Niveau Manifestation : quels sont les genres littéraires pour la jeunesse les plus référencés : Lien
- Q34.1 Lister les œuvres originales de J.R.R. Tolkien présentes dans Data : Lien
- Q34.2 Lister les œuvres originales de J.R.R. Tolkien référencées dans Data, ainsi que les diverses éditions en résultant : Lien
- Q34.3 Lister l’ensemble des éditions auxquelles J.R.R. Tolkien a participé de manière directe ou indirecte : Lien
- Q34.4 Lister les éditions dérivées de l’œuvre originale « The Hobbit » de J.R.R. Tolkien : Lien
- Q34.5 Lister les œuvres originales dont le titre contient le mot « hobbit » : Lien
1. Recherches standards
Tout le monde a en tête cette histoire pour la jeunesse imaginée par J.R.R Tolkien (1892-1973), spécialiste par ailleurs des écrits nordiques danois et britanniques datés des années 1000 environ. En plus d’être romancier à succès, Tolkien fut un grand connaisseur des langues primitives anglaises. Lors de sa carrière universitaire, il a eu l’occasion d’étudier un poème en vers anonyme écrit en vieil anglais, dont la seule copie originale restante est datée du Xe siècle. La légende de Beowulf se trouve localisée à la British Library. En 1936, il donne à la British Academy une désormais fameuse conférence « Beowolf The Monsters and The Critics », éditée maintes fois, rééditée, critiquée.
Apparemment éloigné des préoccupations académiques de l’auteur, écrit pour ses propres enfants d’abord et pour la jeunesse ensuite, le livre The Hobbit, or There and Back Again parait en 1937. Publié chez un éditeur britannique alors peu connu, il rencontre dès le début un vif succès. Il est adapté dès l’année suivante en une version américaine, publiée à New York et illustrée de dessins de l’auteur. Le roman raconte le voyage du « hobbit » Bilbo, entraîné par le magicien Gandalf, dans une quête menée en compagnie de treize nains, en vue de se réapproprier un trésor jalousement gardé par un dragon nommé Smaug. Des trolls, orques, elfes et autres créatures légendaires peuplent le récit.
Depuis lors, l’ouvrage est devenu, considéré comme emblématique d’un genre littéraire nouveau, le Fantasy, dans lequel, se trouvent associés, dans une ambiance médiévale fantastique, des quêtes, des mythes et des phénomènes surnaturels. Quelles traces du « Hobbit » pouvons nous trouver dans les bases de la BnF ? Partons, si vous le voulez bien, à la recherche de la notice originale de l’œuvre de Tolkien, dans le catalogue général et dans Data.

1.1 Le moteur standard
La recherche de « hobbit » dans Data fournit des résultats dont le titre et la classe sont affichés. Un code couleur permet de distinguer parmi les 14 résultats en suggestion des notices de catégorie Spectacle (1), Œuvre (9), Périodique (2), Thème (1) et Auteur (1). Lorsque la requête est lancée, les ressources sont affichées en survol : Lien


La notice de l’œuvre originale « The Hobbit » peut être également plus ou moins facile à trouver à l’aide d’un moteur de recherche du web et d’une requête adaptée.
- Chercher « bilbo le hobbit data.bnf.fr » : sur Google, sur Bing
1.2 Le moteur « Œuvres«
Le terme « hobbit » peut aussi être cherché dans « Œuvres« . Les résultats sont présentés sous forme d’un ensemble de notices liées, sur lequel des filtres localisés à gauche peuvent être utilisés. Neuf œuvres originales, adaptées ou traduites de celle de Tolkien, sont ainsi trouvées : Lien

On peut ensuite accéder à la notice œuvre originale « The Hobbit (1937) » par « John Ronald Reuel Tolkien ». Des informations plus larges sous « Éditions de The Hobbit », de niveau Expression et Manifestation, deviennent ainsi accessibles. Les diverses éditions en français, en anglais, en provençal et breton sont référencées et fournissent un lien vers le Catalogue. On trouve dans « Documents sur » 15 livres dont le sujet est soit le roman original et son écriture, soit son adaptation au cinéma. Les contributeurs aux diverses publications (illustrateur, traducteur, éditeur scientifique) sont mentionnés dans « Auteurs liés ».

1.3 Autres moteurs
Les autres moteurs peuvent être essayés. « Spectacle » permet de retrouver Bilbo le hobbit, un spectacle de marionnettes joué en 2004 à l’Espace Paris-Plaine, avec Francine Llounc en marionettiste, monté par la Compagnie Griffoul.
« Thèmes » se montre aussi pertinent. On obtient ainsi l’entrée du thésaurus RAMEAU « Hobbits (personnages fictifs) ». RAMEAU est un répertoire de concepts, élaboré conjointement par les bibliothèques grand public et de recherche, sous la supervision de la BnF et de l’ABES.
Localisé à Tolbiac, un ouvrage inattendu est découvert : « La sagesse de la Comté [Texte imprimé] : un petit guide pour mener une vie longue et heureuse / The wisdom of the Shire : a short guide to a long and happy life, auteur Noble Smith ; traduit de l’anglais (États-Unis) par Erwann Perchoc », Pocket, 2014. Il y est question de philosophie dans la littérature, de réalisation de soi en quelque sorte.
- Spectacle: Bilbo le hobbit : dans le Catalogue, dans Data en HTML, en RDF
- Hobbits (personnages fictifs), dans Data : Lien
- La sagesse de la Comté : un petit guide pour mener une vie longue et heureuse, Noble Smith, Erwann Perchoc : dans le Catalogue, dans Data en RDF uniquement (notice d’une édition)
I’am in fact a Hobbit (in all but size). I like garden, trees and unmechanized farmlands; I smoke a pipe, and like good plain food (not French), ornamental waistcoats, and mushrooms. I go to bed late and get up late (when possible).
extrait de The Letters of J.R.R. Tolkien, de Tolkien à Deborah Webster,1958, #213
En fait, je suis un Hobbit (en toutes qualités excepté la taille). J’aime les jardins, les arbres et les fermes sans tracteur; je fume la pipe, et j’aime la nourriture simple et saine (pas la nourriture française), les gilets ornementés, et les champignons. Je vais me coucher tard et je me lève tard (lorsque c’est possible).
2. L’entité Concept et le modèle FRBR dans Data
Le modèle de données employé par Data s’inspire en grande partie d’un modèle entité-relation proposé par l’IFLA (Fédération internationale des associations et institutions de bibliothèques).
2.2 Le modèle de données de Data
Le modèle de données de Data montre une parenté certaine avec FRBR, mais aussi d’importantes différences.

Le modèle FRBR original (Œuvre, Expression, Manifestation, Item) se montre partiellement implémenté dans Data. La base sémantique rassemble les données de trois bases distinctes (Catalogue général, Gallica, Archives et manuscrits), nativement structurées à l’aide de modèles distincts (Unimarc, EAC-EAD, Dublin Core). Les informations de niveau Item (localisation dans les rayons, cartons et sur le web, informations sur un exemplaire donné, catalogage des parties composantes des périodiques) sont renseignées au niveau des bases originales uniquement. Les liens vers ces bases (en jaune à droite) sont indiqués en RDF au niveau Manifestation à l’aide des propriétés « rdarelationships:electronicReproduction », de même qu’à l’aide la propriété « rdfs:seeAlso ».
Trônant au centre du schéma, l’entité Concept concerne plusieurs catégories d’objets. Les propriétés de Concept permettent de nommer de manière préférentielle (skos:prefLabel) et alternative (skos:altLabel) les concepts (Personne, Organisation, Œuvre, Manifestation, Spectacle, Périodique, Thème). La flèche réflexive indique qu’un Concept peut se montrer générique. Un concept peut être relié à d’autres concepts à l’aide de relations comme « skos:narrower », « skos:broader », « skos:related ».
2.2.1 Notices du type Œuvre
Les notices Œuvre se montrent constituées dans Data de deux parties identifiées par des fragments différents. Identifiée par un IRI simple, la première rassemble les données du type Concept. L’œuvre originale se trouve ainsi nommée de manière unique dans sa langue originale, à l’aide de « skos:prefLabel ».
Les noms alternatifs éventuellement en plusieurs langues sont référencés, avec « skos:altLabel ». La seconde sous-notice du type Œuvre proprement dit, contient des informations comme le titre original de nouveau, le nom du ou des créateurs, la forme de l’œuvre (texte, musique, œuvre mixte, film, périodique, événement, etc…). Les Œuvres disposent toutes de leur page HTML dans Data.
Une bonne manière de se rendre compte des contenus d’une notice est d’accéder à celle-ci en la visionnant en RDF XML. On remarque le caractère redondant de certaines informations.
- The Hobbit, J.R.R. Tolkien : https://data.bnf.fr/12545196/john_ronald_reuel_tolkien_the_hobbit/rdf.xml


En matière de catalogage, lorsqu’une œuvre originale change de forme (est adaptée en film par exemple), on considère qu’il s’agit d’une nouvelle œuvre originale. Comme précisé dans IFLA-LRM, des œuvres agrégatives rassemblent des groupes de documents, d’objets, de morceaux de musiques ou de films, dont chaque partie peut être distinguée et est elle-même une œuvre. On remarque ainsi que la trilogie cinématographique de Peter Jackson dispose d’une entrée distincte, à laquelle sont liés les produits dérivés de la série.
Les revues et journaux sont considérés comme des sortes d’œuvres périodiques, qui présentent des propriétés particulières, comme la fréquence de diffusion par exemple. Mentionnant volumes et numéros, le catalogage des parties composantes des périodiques (volume, numéro) n’est renseignée de manière détaillée que pour les journaux numérisés. Depuis Gallica, l’accès aux numéros d’un périodique numérisé se fait à l’aide d’un calendrier signalant les dates de parution.
Un autre graphique plus détaillé permet de résumer les propriétés utilisées par les entités (Œuvre, Expression, Manifestation) de Data. Les entités principales (cercles verts ou rouge), leur classe (en valeur de « rdf:type »), leur IRI (avec et sans suffixe), les relations entre entités (flèche et nom de propriété) et les propriétés admettant des valeurs (pavé carré avec nom abrégé de l’ontologie et non de la propriété) sont affichés.
Au niveau Concept en haut à gauche, sont indiqués à l’aide de flèches en vert sombre, propriété « skos:exactMatch ». Parmi ceux-ci, on note Wikidata (la base sémantique de Wikipédia), DBpedia (une autre base sémantique issue de Wikipédia), VIAF (Virtual International Authority File, le fichier d’autorité international de l’OCLC), IdRef (le fichier d’autorité de l’ABES), etc. Un lien vers Wikipédia en français peut être également présent.

2.2.2 Notices des éditions
La notice d’une édition particulière d’une œuvre originale se montre constituée de trois sous-notices. La première contient les informations de niveau Expression qui référence essentiellement les contributeurs à une édition – personne ou organisation – de même que les rôles joués dans le processus éditorial. La seconde sous-notice de niveau Manifestation contient des choses comme le titre propre (titre en une langue donnée), le nom de l’éditeur, l’année d’édition, le lieu d’édition. Les liens vers le catalogue ou bien vers des versions numériques présentes sur Gallica sont renseignés à ce niveau. La notice de niveau concept contient simplement la date de création de la notice de l’édition.
Globalement, les ontologies rdfs, skos, dcterms, foaf, frbr-rda, bibo, rdarelatioships, rdagroup1elements, bnf-onto sont essentiellement utilisée. Conformément au modèle théorique, on distingue les relations entre entités internes à Data (flèche bleue), interne à la BnF (flèche jaune) et externes (flèche verte). Les attributs des diverses entités sont indiqués sous forme de pavés listant les ontologies et propriétés. Ceux-ci sont renseignés sous forme de données alphanumériques standards.
2.2.3 Aspects informatiques
A la BnF, le modèle de donnée de Data est implémenté avec l’application open-source CubicWeb, mise au point par la société Logilab. Une base orientée graphe contient l’information bibliographique au format RDF. L’application (parfois lente pour certaines entrées trop fortement liées, soyez patients !) génère dynamiquement les pages web.
L’interrogation à l’aide de SPARQL est possible et se montre réactive et fiable. L’interface Yasgui de la société Triply est proposée en interface d’interrogation. Une aide bienvenue à la formulation de requêtes est présente. Des exemples de requêtes sont proposés. La base Data se montre asynchrone et est régulièrement générée à partir des données extraites des bases constitutives. Des données globales ou typées sont finalement disponibles en téléchargement.
- Data BnF, Web sémantique et modèle de données, PDF : Lien
- Qu’est-ce que le modèle IFLA LRM ? Transition bibliographique, 2023 : Lien
- CubicWeb – The Semantic Web is a construction game!, Logilab, documentation : Lien
- Yasgui, par Triply : Lien
- Data BnF, Logilab : Lien
- Data, Interface d’interrogation SPARQL : Lien
- Dumps de data.bnf.fr : Lien
De premières requêtes SPARQL sont proposées. Elles permettent de quantifier les données présentes fin 2022 dans Data. Ces chiffres sont amenés à évoluer et les requêtes permettent, si souhaité, de faire une mise à jour.
Q22.1 Compter le nombre d’entités de type Concept, Œuvre, Expression, Manifestation, Année ? Lien
# Effectif des entités de type Œuvre, Expression, Manifestation, Instant (année)
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX owl-time:<http://www.w3.org/TR/owl-time/>
SELECT
# (COUNT (?workUri) AS ?workNb)
# (COUNT (?expressionUri) AS ?expressionNb)
# (COUNT (?manifestationUri) AS ?manifestationNb)
(COUNT (?annee) AS ?anneeNb)
WHERE {
# ?workUri a frbr-rda:Work.
# ?expressionUri a frbr-rda:Expression.
# ?manifestationUri a frbr-rda:Manifestation.
?annee a owl-time:Instant.
}
Type des entités | Effectif | Page web liée dans Data |
Concept | 19 454 701 | 1 571 606 |
Œuvre | 1 779 702 | 61 423 |
Expression | 12 627 236 | 0 |
Manifestation | 12 627 236 | 0 |
Dans Data, la règle « une manifestation = une expression » est observée. On remarque que les entités sont toujours visibles en RDF XML. Seuls les entités de type Concept et de type Œuvre peuvent être visualisées sous forme de page web dans Data. Les entités de type Expression et Manifestation sont visualisées en HTML dans le Catalogue général uniquement.

2.3 Niveau Œuvre
Une publication originale peut se montrer absente des rayons, et cependant identifiée par le travail des catalogueuses et catalogueurs. De plus, un processus semi-automatique de génération des notices de niveau Œuvre est utilisé dans Data. Les triplets sont fabriqués de manière programmée à partir des informations récupérées du catalogue. Pour chaque créateur, les titres de ses publications sont extraites, et regroupées par similarité de manière automatique. Les informations sont ensuite traitées et entrées dans Data. Les fichiers RDF des œuvres originales sont ensuite calculés et les pages HTML générées automatiquement. Les temps de réponse en 2022 se montrent dans certains cas importants et le passage par les moteurs du Catalogue offre alors un recours.
Une requête SPARQL montre que Data référence 1 779 702 œuvres originales en 2023. Une œuvre originale se montre également définie par sa forme. A chaque œuvre originale, une forme particulière est attribuée (texte, musique, mixte, audio et vidéo, etc). Un dictionnaire des formes d’œuvres référence les possibilités. Un code alphabétique sur 2 à 5 caractères référence la liste des genres. Un premier niveau est constitué de 15 formes créatives principales. Des sous-catégories complètent les possibilités. Les « Œuvres textuelles » constituent l’essentiel des effectifs.
- Liste des vocabulaires employés dans Data, et à la BnF : Lien
- Dictionnaire des genres ou formes d’œuvres originales dans Data : Lien
genre ou forme de création principales | code | effectif via page Data | effectif via SPARQL |
Manuscrits et archives | march | 130 542 | |
Non défini | ndef | 2 447 | |
Objets | ob | 147 | |
Œuvres audiovisuelles (y compris radio) | au | 31 810 | |
Œuvres cartographiques | ca | 22 | |
Œuvres chorégraphiques | ch | 1 264 | |
Œuvres de mise en scène | ms | 17 | |
Œuvres des beaux-arts et des arts décoratifs | ba | 2 167 | |
Œuvres iconographiques | ic | 44 322 | |
Œuvres logicielles ou multimédia | lomu | 10 297 | |
Œuvres mixtes | mi | 166 700 | 141 743 |
Œuvres musicales | tum | 183 590 | 183 535 |
Œuvres numismatiques | nu | 3 834 | |
Œuvres textuelles | te | 1 271 304 | 937 242 |
Spectacles | spe | 61 423 |
Avec SPARQL, il est possible de compter les genres créatifs présents dans Data. On se sert d’une agrégation sur la variable ?forme
pour explorer de manière précise les contenus. La base contient en 2022 386 genres créatifs distincts. Les effectifs fournis par les pages HTML associées à la forme créative se montrent supérieurs à ceux trouvés à l’aide de SPARQL. Non négligeable pour les œuvres textuelles, la cause de cette différence serait à élucider…
Q23.1 Niveau Œuvre : Quelles sont les diverses formes d’œuvres (rdagroup1elements) et leur nombre ? : Lien
# Effectif des "formes d'œuvres" dans Data
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
SELECT ?forme (COUNT (?forme) AS ?formeNb)
WHERE {
?workUri a frbr-rda:Work.
?workUri rdagroup1elements:formOfWork ?forme.
}
GROUP BY ?forme ?formeNb
ORDER BY DESC(?formeNb)
forme | Effectif calculé avec SPARQL | |
1 | <http://data.bnf.fr/vocabulary/work-form/te> | « 937242 »^^<http://www.w3.org/2001/XMLSchema#integer> |
2 | <http://data.bnf.fr/vocabulary/work-form/tum> | « 183535 »^^<http://www.w3.org/2001/XMLSchema#integer> |
3 | <http://data.bnf.fr/vocabulary/work-form/mi> | « 141743 »^^<http://www.w3.org/2001/XMLSchema#integer> |
L’année de création d’une œuvre est renseignée dans le champ « rdagroup1elements:dateOfWork ». Les effectifs par année de publication peuvent être calculés.
Q23.2 Niveau Œuvre : Répartition par année de première édition des œuvres originales (rdagroup1elements) ? : Lien
# Année de première édition des entités de type Œuvre
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
SELECT ?annee (COUNT (?annee) AS ?anneeNb)
WHERE {
?workUri a frbr-rda:Work.
?workUri rdagroup1elements:dateOfWork ?annee
}
GROUP BY ?annee ?anneeNb
ORDER BY DESC(?annee)
annee | anneeNb | |
1 | <http://data.bnf.fr/date/2022/> | « 119 »^^<http://www.w3.org/2001/XMLSchema#integer> |
2 | <http://data.bnf.fr/date/2021/> | « 723 »^^<http://www.w3.org/2001/XMLSchema#integer> |
3 | <http://data.bnf.fr/date/2020/> | « 9569 »^^<http://www.w3.org/2001/XMLSchema#integer> |
4 | <http://data.bnf.fr/date/2019/> | « 23585 »^^<http://www.w3.org/2001/XMLSchema#integer> |
Le sujet de l’œuvre est également donné en valeur de la propriété « bnf-onto:subject ». Ce champ admet 62 valeurs différentes; il se montre toutefois rarement renseigné.
Q23.3 Niveau Œuvre : Quels sont les effectifs par sujet (bnf-onto) des œuvres originales ? : Lien
# Sujets Bnf des entités de type Œuvre
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX bnf-onto: <http://data.bnf.fr/ontology/bnf-onto/>
SELECT ?sujetBnf (COUNT (?sujetBnf) AS ?sujetBnfNb)
WHERE {
?workUri a frbr-rda:Work.
?workUri bnf-onto:subject ?sujetBnf
}
GROUP BY ?sujetBnf
ORDER BY DESC(?sujetBnfNb)
sujetBnf | sujetBnfNb | |
1 | Arts graphiques | « 42882 »^^<http://www.w3.org/2001/XMLSchema#integer> |
2 | Audiovisuel | « 29578 »^^<http://www.w3.org/2001/XMLSchema#integer> |
3 | Informatique | « 10020 »^^<http://www.w3.org/2001/XMLSchema#integer> |
4 | Littératures | « 9848 »^^<http://www.w3.org/2001/XMLSchema#integer> |
Q23.4 Niveau Œuvre : Quels sont les effectifs par sujet (dcterms) des œuvres originales ? : Lien
On trouve au total 36 930 sujets d’oeuvres différents. Il peut s’agir d’un code de classement Dewey (61 valeurs possibles), d’une personne (1529 valeurs), d’une organisation (879 valeurs), de concepts divers, parmi lesquels d’autres œuvres originales (33862 valeurs).
# Sujets dcterms des entités de type Œuvre
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
SELECT ?sujet ?sujetNomFamille ?sujetNom ?sujetLabel ?sujetTitre (COUNT (?sujet) AS ?sujetNb)
WHERE {
?workUri a frbr-rda:Work.
?workUri dcterms:subject ?sujet.
# ?sujet a foaf:Person.
OPTIONAL {?sujet foaf:familyName ?sujetNomFamille}
OPTIONAL {?sujet foaf:name ?sujetNom}
OPTIONAL {?sujet skos:prefLabel ?sujetLabel}
OPTIONAL {?sujet dcterms:title ?sujetTitre}
}
GROUP BY ?sujet ?sujetNomFamille ?sujetNom ?sujetLabel ?sujetTitre
ORDER BY DESC(?sujetNb)
Nous pouvons finalement calculer les auteurs dont les œuvres sont les plus fréquemment exprimées. Des compositeurs de musique sont essentiellement trouvés.
Q23.5 Niveau Œuvre : Quels sont les créateurs dont les œuvres sont le plus souvent publiées : Lien
# Fréquence des créateurs pour les entités de type Œuvre
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?createur ?nom (COUNT (?createur) AS ?createurNb)
WHERE {
?workUri a frbr-rda:Work.
OPTIONAL {
?workUri dcterms:creator ?createur.
?createur foaf:name ?nom.
}
}
GROUP BY ?createur ?nom ?createurNb
ORDER BY DESC(?createurNb)
LIMIT 30
createur | nom | createurNb | |
1 | <http://data.bnf.fr/ark:/12148/cb118897907#about> | Johann Sebastian Bach | « 778 »^^<http://www.w3.org/2001/XMLSchema#integer> |
2 | <http://data.bnf.fr/ark:/12148/cb14027233b#about> | Wolfgang Amadeus Mozart | « 615 »^^<http://www.w3.org/2001/XMLSchema#integer> |
3 | <http://data.bnf.fr/ark:/12148/cb13899553z#about> | Franz Schubert | « 578 »^^<http://www.w3.org/2001/XMLSchema#integer> |
4 | <http://data.bnf.fr/ark:/12148/cb12340814p#about> | Roland de Lassus | « 558 »^^<http://www.w3.org/2001/XMLSchema#integer> |
5 | <http://data.bnf.fr/ark:/12148/cb138994541#about> | Domenico Scarlatti | « 531 »^^<http://www.w3.org/2001/XMLSchema#integer> |
Q23.6 Niveau Œuvre : Compter les œuvres originales agrégées et « agrégeantes » : Lien 1, Lien 2
Le nombre de 67 184 œuvres sont « agrégées » par 36 417 œuvres « agrégeantes ». Data utilise deux propriétés de valeur inverse « ore:aggregates » et « ore:isAggregatedBy », définis par l’ontologie ORE Open Repository Exchange (2008). Le terme de « Notice de regroupement » est fréquemment employé pour désigner ces notices bibliographiques spéciales. Le principe constitue l’un des fondements de la transition bibliographique, en matière de pratique de catalogage.
# Œuvres agrégeantes
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX ore: <http://www.openarchives.org/ore/terms/>
SELECT (COUNT (DISTINCT ?workUri) AS ?workUriNb)
WHERE {
?workUri a frbr-rda:Work.
?workUri ore:aggregates ?workUriAggregated.
}
Q23.7 Niveau Œuvre : Compter le nombre de périodiques : Lien
Data référence 364 069 périodiques, caractérisés de manière structurelle par leur double appartenance aux classes « frbr-rda:Work » et « bibo:Periodical ». Des listes de périodiques répondant à divers critères thématiques, de fréquence de parution, de date de publication peuvent être calculées avec SPARQL.
# Œuvres périodiques
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX bibo: <http://purl.org/ontology/bibo/>
SELECT (COUNT (DISTINCT ?workUri) AS ?workUriNb)
WHERE {
?workUri a frbr-rda:Work.
?workUri a bibo:Periodical.
}
Q23.8 Niveau Œuvre : Compter le nombre de spectacles : Lien
La BnF recense également en 2022 61 699 spectacles, du genre théâtral ou chorégraphique essentiellement. Les notices sont caractérisées par leur double appartenance aux classes « frbr-rda:Work » et « dcmitype:Event ».
# Spectacles et autres événements
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX dcmitype: <http://purl.org/dc/dcmitype/>
SELECT (COUNT (DISTINCT ?workUri) AS ?workUriNb)
WHERE {
?workUri a frbr-rda:Work.
?workUri a dcmitype:Event.
}
2.4 Niveau Expression
Plus de douze millions d’expressions (doublées de manifestations) sont référencées dans Data. L’information éditoriale est contenue dans les trois entités Concept, Expression et Manifestation. Ces trois entités apparaissent liées par la structure de leur IRI. Concept est identifié par son IRI simple sans fragment. Le niveau Expression est identifié par l’IRI du Concept suffixé de « #Expression ». Le niveau Manifestation est accessible via l’IRI suffixé du fragment « #about ».
A la différence de la notice Concept de niveau Œuvre, la notice Concept de niveau Expression et Manifestation contient un faible nombre d’informations, essentiellement la date de création de la notice. Les niveaux Expression et Manifestation (les éditions) ne génèrent aucune page HTML dans Data. Seul un fichier au format RDF est fourni en réponse à une requête SPARQL. Des liens vers les pages des bases constitutives (Catalogue, Archives et manuscrits, Gallica) constituent le mode d’accès privilégié pour consulter aisément la notice.
Q24.1 Niveau Expression : Quels sont les effectifs des divers types d’expressions : Lien
Parmi les propriétés au niveau Expression, on remarque à l’aide du schéma et de l’examen d’un fichier RDF, que DCMI Type de Dublin Core est bien renseigné. La propriété « dcterms:type » peut avoir pour valeur « Text », « StillImage », « Sound », etc, ou bien admettre un concept du dictionnaire RAMEAU. L’examen de la liste complète des « types » montre que diverses choses sont ainsi fréquemment notées. Des précisions temporelles comme : « 18e siècle », « 19e siècle », « 2000-…. », etc. Des précisions sur la nature d’un document : « Actes de congrès », « Catalogues d’exposition », « Biographie », « Guides pratiques », « Partitions », « Correspondance », « Dictionnaire », « Encyclopédie », « Manuels d’enseignement supérieur », etc. Des genres musicaux : « Chansons françaises », « Opéras-comiques », « Valses (piano) ».
# Effectif des valeurs de la propriété Dublin Core "type" des entités "Expression"
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
SELECT ?typeDc ?typeDcNom (COUNT(?typeDc) AS ?typeDcNb)
WHERE {
?expressionUri a frbr-rda:Expression.
?expressionUri dcterms:type ?typeDc.
OPTIONAL {?typeDc skos:prefLabel ?typeDcNom.}
}
GROUP BY ?typeDc ?typeDcNb ?typeDcNom
ORDER BY DESC (?typeDcNb)
LIMIT 10
Les sujets des œuvres éditées se montrent renseignés au niveau Expression et il est possible de chercher les sujets les plus souvent renseignés dans Data.
Q24.2 Niveau Expression : Quelles sont les sujets (dcterms) et effectifs des éditions ? : Lien
# Sujets Dublin Core des entités de type Expression
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
SELECT ?sujetDc (COUNT (?sujetDc) AS ?sujetDcNb)
WHERE {
?expressionUri a frbr-rda:Expression.
?expressionUri dcterms:subject/skos:prefLabel ?sujetDc.
}
GROUP BY ?sujetDc ?sujetDcNb
ORDER BY DESC(?sujetDcNb)
LIMIT 20
1 | « France »@fr | « 409 343 »^^<http://www.w3.org/2001/XMLSchema#integer> |
2 | « Histoire »@fr | « 169 488 »^^<http://www.w3.org/2001/XMLSchema#integer> |
3 | « Portraits »@fr | « 103 196 »^^<http://www.w3.org/2001/XMLSchema#integer> |
4 | « Critique et interprétation »@fr | « 86 825 »^^<http://www.w3.org/2001/XMLSchema#integer> |
5 | « 20e siècle »@fr | « 81 187 »^^<http://www.w3.org/2001/XMLSchema#integer> |
Une requête similaire peut être lancée sur les langues, pour lesquelles la norme 639-2 est appliquée :
Q24.3 Niveau Expression : Quelles sont les langues (dcterms) et effectifs des éditions ? : Lien
# Effectif des langues dans les entités "Expression"
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
SELECT ?langue (COUNT(?langue) AS ?langueNb)
WHERE {
?expressionUri a frbr-rda:Expression.
?expressionUri dcterms:language ?langue.
}
GROUP BY ?langue ?langueNb
ORDER BY DESC (?langueNb)
LIMIT 10
- Liste des codes de langues (iso 639-2), code sur trois lettres, à la BnF : Lien
- Liste des codes de langues (iso 639-2), code sur trois lettres, à la LoC : Lien
langue | langueNb | |
1 | <http://id.loc.gov/vocabulary/iso639-2/fre> | « 6 916 627 »^^<http://www.w3.org/2001/XMLSchema#integer> |
2 | <http://id.loc.gov/vocabulary/iso639-2/eng> | « 1 580 823 »^^<http://www.w3.org/2001/XMLSchema#integer> |
3 | <http://id.loc.gov/vocabulary/iso639-2/ger> | « 801 805 »^^<http://www.w3.org/2001/XMLSchema#integer> |
Q24.4 Niveau Expression : Quelles sont les les effectifs de personnes jouant des rôles particuliers ? : Lien
Au-delà du rôle d’auteur, les rôles joués par diverses personnes lors du processus éditorial sont précisés. Parmi les rôles, celui de traducteur, d’illustrateur, de préfacier, d’auteur adapté, de réalisateur, etc. Les rôles joués sont précisés à l’aide de codes référencés dans deux dictionnaires différents. Le premier est celui de la BnF qui contient 525 rôles possibles. Le dictionnaire de la Bibliothèque du Congrès contient 271 rôles. Nous nous intéressons ici à la liste de la Bnf et quelques effectifs peuvent être calculés. La requête suivante se montre assez longue et dure environ 30 secondes. Le nombre de 2 878 898 auteurs distinct est calculé. Comparé à Dublin Core et ses trois simples propriétés « auteur », « contributeur », « éditeur » ces dictionnaires ajoutent d’importantes précisions, de réemploi conseillé lors de la mise au point de bases sémantiques en relation avec les bibliothèques.
- Liste des rôles dans Data d’après la BnF (Dictionnaire Vocabulary) : Lien
- Rôles dans Data, d’après la Bibliothèque du Congrès (Dictionnaire Relators) : Lien
# Effectif de divers rôles joués
PREFIX bnfroles: <http://data.bnf.fr/vocabulary/roles/>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
SELECT
(COUNT(DISTINCT ?r70) AS ?auteurs)
(COUNT(DISTINCT ?r72) AS ?auteursAdaptes)
(COUNT(DISTINCT ?r110) AS ?epistoliers)
(COUNT(DISTINCT ?r150) AS ?cartographes)
(COUNT(DISTINCT ?r360) AS ?editeursSientifiques)
(COUNT(DISTINCT ?r610) AS ?realisateurs)
(COUNT(DISTINCT ?r680) AS ?traducteurs)
WHERE {
?expressionUri a frbr-rda:Expression.
OPTIONAL{?expressionUri bnfroles:r70 ?r70.} #Auteur
OPTIONAL{?expressionUri bnfroles:r72 ?r72.} #Auteur adapté
OPTIONAL{?expressionUri bnfroles:r110 ?r110.} #Auteur de lettres
OPTIONAL{?expressionUri bnfroles:r150 ?r150.} #Auteur de cartes
OPTIONAL{?expressionUri bnfroles:r360 ?r360.} #Editeur scientifique
OPTIONAL{?expressionUri bnfroles:r610 ?r610.} #Réalisateur
OPTIONAL{?expressionUri bnfroles:r680 ?r680.} #Traducteur
}
auteurs | auteursAdaptes | epistoliers | cartographes | editeursSientifiques | realisateurs | traducteurs | |
1 | 2 878 898 | 14 817 | 35 475 | 12 404 | 615 142 | 58 020 | 136 988 |
2.5 Niveau Manifestation
Nous trouvons au niveau Manifestation les nombreuses informations en provenance de l’éditeur. Sont notamment présents et décrits avec Dublin Core le titre propre (dcterms:title), l’année de publication (dcterms:date), la description physique du livre (dcterms:description) ou du disque, le sujet (dcterms:subject), le nom de l’éditeur (dcterms:publisher).
Les contenus de « dcterms:publisher » résultent de l’assemblage du lieu de publication, du nom de l’organisme et de l’année de publication. Par exemple : « Paris : Stock , 1969 ». Les éléments individuels de ce champ composite sont accessibles respectivement sous « rdagroup1elements:placeOfPublication », « rdagroup1elements:publishersName », « dcterms:date ».
A noter également le lien vers le Catalogue et vers les bases constitutives référencé avec « rdfs:seeAlso ». Pour la Littérature Jeunesse, un code de genre peut être spécifié dans « schema:genre ».
Q25.1 Niveau Manifestation : quels sont les éditeurs (rdagroup1elements) les plus présents dans Data ? : Lien
# Lister les éditeurs au niveau Manifestation et les compter
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
SELECT ?editeur (COUNT (?editeur) AS ?editeurNb)
WHERE {
?manifUri a frbr-rda:Manifestation.
?manifUri rdagroup1elements:publishersName ?editeur.
}
GROUP BY ?editeur ?editeurNb
ORDER BY DESC(?editeurNb)
LIMIT 20
editeur | editeurNb | |
1 | [s.n.] | 370 203 |
2 | Hachette | 55 325 |
3 | s.n. | 53 424 |
4 | Springer | 50 281 |
5 | l’Harmattan | 49 081 |
Q25.2 Niveau Manifestation : quels sont les effectifs par année d’édition (dcterms) ? : Lien
# Lister les dates au niveau Manifestation et les compter
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX dcterms: <http://purl.org/dc/terms/>
SELECT ?date (COUNT (?date) AS ?dateNb)
WHERE {
?manifUri a frbr-rda:Manifestation.
?manifUri dcterms:date ?date.
}
GROUP BY ?date ?dateNb
ORDER BY DESC(?dateNb)
LIMIT 20
date | dateNb | |
1 | 2012 | 163 963 |
2 | 2013 | 162 388 |
3 | 2014 | 157 640 |
Il est possible de noter que ce champ admet des valeurs fort variables, parmi lesquelles des dates écrites en chinois (文政7 [1824]) et autres graphies, des durées (1968-2017), etc.
Q25.3 Niveau Manifestation : quels sont les effectifs par lieu de publication (rdagroup1elements) ? : Lien
# Lister les lieux de publication
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
SELECT ?lieuPubli (COUNT (?lieuPubli) AS ?lieuPubliNb)
WHERE {
?manifUri a frbr-rda:Manifestation.
?manifUri rdagroup1elements:placeOfPublication ?lieuPubli.
}
GROUP BY ?lieuPubli ?lieuPubliNb
ORDER BY DESC(?lieuPubliNb)
LIMIT 20
1 | Paris | 3308949 |
2 | [Paris] | 497 522 |
3 | [S.l.] | 394 350 |
4 | London | 163 291 |
5 | New York | 96 022 |
Q25.4 Niveau Manifestation : quels sont les genres littéraires (schemaorg) pour la jeunesse les plus référencés : Lien
# Lister les genres litt. jeunesse au niveau Manifestation et les compter
PREFIX frbr-rda: <http://rdvocab.info/uri/schema/FRBRentitiesRDA/>
PREFIX schemaorg: <http://schema.org/>
SELECT ?genre (COUNT (?genre) AS ?genreNb)
WHERE {
?manifUri a frbr-rda:Manifestation.
?manifUri schemaorg:genre ?genre.
}
GROUP BY ?genre ?genreNb
ORDER BY DESC(?genreNb)
LIMIT 20
genre | genreNb | |
1 | <http://data.bnf.fr/vocabulary/genre-jn/JnAlbum> | 58 005 |
2 | <http://data.bnf.fr/vocabulary/genre-jn/JnRoman> | 47 936 |
3 | <http://data.bnf.fr/vocabulary/genre-jn/JnBDessi> | 34 265 |
- Liste des genres pour les ouvrages jeunesse : Lien
- Liste des genres musicaux : Lien
- Liste des codes de pays, code sur deux lettres : Lien

3. Le Hobbit, par Tolkien et d’autres
Proposé par les étudiants d’Aix-Marseille Université, le schéma suivant propose un récapitulatif de FRBR, appliqué précisément au cas du Hobbit. Un code couleur vient expliciter la nature des différentes notices. En rouge, l’oeuvre originale et première de 1937. En rose les adaptations, considérées comme oeuvres originales également, du fait du changement de la forme de l’oeuvre. En vert et jaune, les éditions en différentes langues, dans lesquelles Expression et Manifestation sont distingués. Les rôles joués par les intervenants (créateur, traducteur, réalisateur) sont indiqués entre parenthèses, en bleu à côté des flèches. Dans les films, Tolkien joue le rôle d’auteur adapté et autorise le lien entre Œuvre originale et Œuvre adaptée (marqué en flèche noire). Simple, n’est-ce pas ?

3.1 Entité Œuvre : « The Hobbit, par John Ronald Reuel Tolkien, 1937, texte en anglais »
Le roman original de Tolkien en anglais se montre physiquement absent des rayons de la BnF. Fruit d’une reconstruction, la notice du roman original est cependant référencée dans Data et dans le Catalogue au format HTML et RDF. Un jeu d’URLs générées automatiquement par l’application permet d’accéder à une variété d’informations, présentées en divers formats :
- URI : http://data.bnf.fr/ark:/12148/cb12545196g
- ARK : http://ark.bnf.fr/ark:/12148/cb12545196g, abrégé : ark:/12148/cb12545196g
- Catalogue : https://calalogue.bnf.fr/ark:/12148/cb12545196g
- Data
- Permalien : https://data.bnf.fr/ark:/12148/cb12545196g
- Page web : https://data.bnf.fr/fr/12545196/john_ronald_reuel_tolkien_the_hobbit/
- Éditions : https://data.bnf.fr/see_all_editions/12545196/page1
- Documents sur : https://data.bnf.fr/see_all_studies_about/12545196/page1
- Thèmes liés : https://data.bnf.fr/see_all_related_themes/12545196/page1
- SPARQL
Une page web sur Tolkien, l’auteur :
- URI de Tolkien : http://data.bnf.fr/ark:/12148/cb11926763j
- Page web : https://data.bnf.fr/fr/11926763/john_ronald_reuel_tolkien/
- Toutes les œuvres : https://data.bnf.fr/see_all_activities/11926763/page1, avec filtres possibles
- Œuvres textuelles : https://data.bnf.fr/documents-by-rdt/11926763/te/page1
- Œuvres audiovisuelles : https://data.bnf.fr/documents-by-rdt/11926763/au/page1
- Toutes les œuvres adaptées : https://data.bnf.fr/see_all_adaptations/11926763/page1
- SPARQL
Le fichier RDF rend bien visible les ontologies et propriétés utilisées. Ces informations se montrent nécessaires à la formulation des requêtes SPARQL. Pour lire plus facilement un fichier RDF, il est possible d’installer l’extension de navigateur « OpenLink Structured Data Sniffer ».
- OpenLink Structured Data Sniffer : Lien
3.2 Entités Expression et Manifestation : « J. R. R. Tolkien. Bilbo le Hobbit ou Histoire d’un aller et retour. Traduit de l’anglais par Francis Ledoux, 1969, texte en français »
Francis Ledoux effectue en 1969 la première traduction du roman. Les renseignements relatifs à une édition particulière donnent lieu à trois sous-entités différentes, de classe respectivement Concept (IRI simple), Expression (IRI suffixé du fragment « #Expression ») et Manifestation (IRI suffixé de « #about »).
La notice Concept d’une édition ne contient que sa date de création. Les renseignements sur le titre, la traduction, l’édition et l’éditeur sont renseignés au niveau Expression et Manifestation. La relation de l’expression vers l’oeuvre originale est donnée par « rdarelationships:expressionOfWork », celle de la manifestation par « rdarelationships:workManifested ». Il faut quitter Data et se rendre dans le Catalogue, pour disposer d’une page web lisible.
- IRI : http://data.bnf.fr/ark:/12148/cb33193517n
- Catalogue : https://catalogue.bnf.fr/ark:/12148/cb33193517n
- Pas de page web dans Data
- RDF XML : https://data.bnf.fr/fr/ark:/12148/cb33193517n
- SPARQL
Le premier traducteur Francis Ledoux (1906-1990), dispose quant à lui d’une page HTML bien renseignée. Les divers rôles joués (traducteur, éditeur scientifique) sont indiquées :
- Page HTML de Ledoux : https://data.bnf.fr/11912047/francis_ledoux/
- Toutes ses œuvres : https://data.bnf.fr/see_all_activities/11912047/page1
- Œuvres textuelles : https://data.bnf.fr/documents-by-rdt/11912047/te/page1
- Toutes les œuvres adaptées : https://data.bnf.fr/see_all_adaptations/11912047/page1
De nombreuses notices éditoriales n’ont pas encore leur équivalent au niveau Œuvre. Ainsi actuellement, le livre Les Aventures de Tom Bombadil, publié en français en 1975 dans une traduction de Jack-Alain Léger (pseudonyme), ne dispose pas de sa notice Œuvre : The Adventures of Tom Bombadil.
3.3 Entités Œuvre : « The Hobbit (film) »

Adapté du texte, le premier film de Peter Jackson est considéré dans Data comme une œuvre originale. La notice RDF précise la forme créative « http://data.bnf.fr/vocabulary/work-form/au » (forme audiovisuelle). Le premier film est tourné en 2011 et sort en salle en France en 2012. Dans Data, une page HTML de type œuvre existe pour la trilogie (œuvre agrégative), de même que pour chacun des films constitutifs.
3.3.1 The Hobbit (film ; série), réalisé par Peter Jackson, 2012, film, Œuvre
La note d’application précise : « À n’utiliser que pour les documents traitant des trois films ». La propriété « ore:aggregates » permet de signaler en RDF XML et SPARQL l’IRI des œuvres agrégées. Des figurines et un livre de croquis préalables à la réalisation sont décrits comme édition dérivée.
- IRI : http://data.bnf.fr/ark:/12148/cb16727977c
- HTML : https://data.bnf.fr/fr/16727977/the_hobbit___film/
- Documents sur : https://data.bnf.fr/see_all_studies_about/16727977/page1
- RDF XML : https://data.bnf.fr/fr/16727977/the_hobbit___film/rdf.xml
- SPARQL
3.3.2 An unexpected journey, réalisé par Peter Jackson, 2012, film, Œuvre
Notice du premier film de la trilogie.
- IRI : http://data.bnf.fr/ark:/12148/cb166457825
- Catalogue : https://catalogue.bnf.fr/ark:/12148/cb166457825
- HTML : https://data.bnf.fr/16645782/the_hobbit__1__an_unexpected_journey___film/
- Détails du contenu
- Documents sur : https://data.bnf.fr/see_all_studies_about/16645782/page1
- RDF XML : https://data.bnf.fr/16645782/the_hobbit__1__an_unexpected_journey___film/rdf.xml
- SPARQL
3.3.3 Pages HTML du réalisateur Peter Jackson
- Page HTML : https://data.bnf.fr/13182829/peter_jackson/
- Toutes ses œuvres : https://data.bnf.fr/see_all_activities/13182829/page1
3.4 Requêtes sur Tolkien et le Hobbit
SPARQL permet d’interroger Data et de configurer à la demande la structure des tableaux affichés en retour d’une requête.
Q34.1 Lister les œuvres originales de J.R.R. Tolkien présentes dans Data : Lien
Cette requête est formulée de manière générique, si bien qu’elle peut être aisément adaptée à n’importe quel auteur (personne ou collectivité) en modifiant le premier motif de triplet dans la partie WHERE, dans lequel il est demandé de trouver les IRI « des oeuvres dont l’auteur est nommé » : « John Ronald Reuel Tolkien », sans spécification de langue. Les autres motifs, souhaités optionnels, permettent l’affichage d’autres champs de la notice de niveau Œuvre.
# Tolkien dans Data, ses oeuvres originales
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
PREFIX bnf-onto: <http://data.bnf.fr/ontology/bnf-onto/>
SELECT *
WHERE {
?workUri dcterms:creator/foaf:name "John Ronald Reuel Tolkien".
OPTIONAL {?workUri dcterms:title ?titre.}
OPTIONAL {?workUri dcterms:date ?date.}
OPTIONAL {?workUri dcterms:description ?description.}
OPTIONAL {?workUri bnf-onto:subject ?sujetBnf.}
}
ORDER BY ?date
workUri | titre | date | description | |
1 | <http://data.bnf.fr/ark:/12148/cb144469423#about> | « The history of Middle-earth »@fr | « Oeuvre fantastique en douze tomes »@fr | |
2 | <http://data.bnf.fr/ark:/12148/cb12545196g#about> | « The Hobbit »@en | 1937 | |
3 | <http://data.bnf.fr/ark:/12148/cb167043914#about> | « On fairy-stories »@en | 1939 | « Texte d’une conférence tenue en 1939, remanié et publié en 1947 dans le volume « Essays presented to Charles Williams » puis en 1964 dans « Tree and leaf » »@fr |
4 | <http://data.bnf.fr/ark:/12148/cb11939715m#about> | « The Lord of the rings »@en | 1954 | « Épopée mythologique en trois parties : The fellowship of the ring, The two towers, The return of the king »@fr |
5 | <http://data.bnf.fr/ark:/12148/cb11957451k#about> | « The silmarillion »@en | 1977 | « Récit utopique publié de manière posthume »@fr |
Q34.2 Lister les œuvres originales de J.R.R. Tolkien référencées dans Data, ainsi que les diverses éditions : Lien
Les propriétés de l’ontologie « rdarelationships » permettent d’aisément naviguer entre les niveaux Œuvre, Expression et Manifestation pour y récupérer les informations qui nous intéressent. Les renseignements sur les éditions sont présentes au niveau Manifestion, auquel on se rend avec « rdarelationships:workManifested ». Parmi les résultats d’une liste de 94 textes, un texte non traduit et non publié en France; celui sur la conférence donnée en 1939 sur les histoires de fées.
# Tolkien dans Data, œuvres originales, œuvres publiées
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
PREFIX bnf-onto: <http://data.bnf.fr/ontology/bnf-onto/>
PREFIX rdarelationships: <http://rdvocab.info/RDARelationshipsWEMI/>
PREFIX schemaorg: <http://schema.org/>
SELECT *
WHERE {
?workUri dcterms:creator/foaf:name "John Ronald Reuel Tolkien".
OPTIONAL {?workUri dcterms:title ?titreOrig.}
OPTIONAL {?workUri dcterms:date ?dateOrig.}
OPTIONAL {?workUri dcterms:description ?descriptionOrig.}
OPTIONAL {?workUri bnf-onto:subject ?sujetBnf.}
OPTIONAL {
?manifestationUri rdarelationships:workManifested ?workUri.
?manifestationUri dcterms:title ?titreEdition.
?manifestationUri dcterms:date ?dateEdition.
?manifestationUri rdagroup1elements:publishersName ?editeur.
OPTIONAL {?manifestationUri schemaorg:genre ?genreEdition.}
}
}
ORDER BY ?dateOrig ?dateEdition

Q34.3 Lister l’ensemble des éditions auxquelles J.R.R. Tolkien a participé de manière directe ou indirecte : Lien
On recherche dans cette requête les éditions auxquelles Tolkien a contribué. On interroge la base au niveau Expression. Les rôles joués par les personnes sont recherchés. Puis on accède successivement au niveau Manifestation avec la propriété « rdarelationships:expressionManifested », et au niveau Œuvre avec « rdarelationships:expressionOfWork ». Les métadonnées pertinentes sont extraites à chacun de ces niveaux. Le total de 353 éditions est obtenu. Les dates des oeuvres originales s’échelonnent de 1350 à 2004.
En effet, Tolkien écrit une introduction, des notes et un glossaire sur l’édition de 1936 d’un roman écrit en anglais moyen daté de 1350 : Sir Gawain and the Green Knight / Sire Gauvain et le Chevalier vert. Il participe aussi en tant qu’éditeur scientifique (<http://data.bnf.fr/vocabulary/roles/r360>) à la collection « Oxford English monographs » publiée à partir de 1940. Ses rôles sont ceux d’auteur (<http://data.bnf.fr/vocabulary/roles/r70>), et d’auteur adapté (<http://data.bnf.fr/vocabulary/roles/r72>) pout tout un ensemble d’items.
# Tolkien dans Data, diverses éditions
PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX rdarelationships: <http://rdvocab.info/RDARelationshipsWEMI/>
SELECT *
WHERE {
?expressionUri dcterms:contributor/foaf:name "John Ronald Reuel Tolkien".
?manifestationUri rdarelationships:expressionManifested ?expressionUri.
OPTIONAL {?manifestationUri dcterms:title ?titre.}
OPTIONAL {?manifestationUri dcterms:date ?date.}
OPTIONAL {?manifestationUri dcterms:description ?description.}
OPTIONAL {
?workUri rdarelationships:expressionOfWork ?expressionUri.
?workUri dcterms:title ?titreOrig.
OPTIONAL {?workUri dcterms:date ?dateOrig.}
OPTIONAL {?workUri dcterms:creator/foaf:name ?auteurOrig.}
}
}
ORDER BY ?date
Q34.4 Lister les éditions dérivées de l’œuvre originale « The Hobbit » de J.R.R. Tolkien : Lien
Les diverses éditions tirées du roman original sont cherchées. Dans cette requête, les deux premiers motifs de triplets servent à récupérer l’IRI de l’œuvre originale à partir de son libellé préférentiel en anglais. Nous passons successivement du niveau concept, au niveau œuvre et au niveau manifestation. On obtient au final 33 éditions, parmi lesquelles un spectacle en date de 2004. On remarque que dans le cas des spectacles, la date se montre plus précise et typée.
# Manifestations de "The Hobbit" dans Data
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX rdarelationships: <http://rdvocab.info/RDARelationshipsWEMI/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX dcterms: <http://purl.org/dc/terms/>
SELECT ?titre ?date ?description ?editeur ?manifestationUri
WHERE {
?workUriConcept skos:prefLabel "The Hobbit"@en.
?workUriConcept foaf:focus ?workUri.
?manifestationUri rdarelationships:workManifested ?workUri.
OPTIONAL {?manifestationUri dcterms:title ?titre.}
OPTIONAL {?manifestationUri dcterms:date ?date.}
OPTIONAL {?manifestationUri dcterms:description ?description.}
OPTIONAL {?manifestationUri dcterms:publisher ?editeur.}
}
ORDER BY ?date
31 | Bilbo le Hobbit | 2014 | 1 vol. (503 p.) | Paris : Hachette , DL 2014 | <http://data.bnf.fr/ark:/12148/cb44226371k#about> |
32 | Bilbon lo Hòbbit | 2018 | 1 vol. (215 p.) | Cressé : Éditions des Régionalismes , impr. 2018 | <http://data.bnf.fr/ark:/12148/cb45632596j#about> |
33 | « Bilbo le hobbit / adaptation et mise en scène de Francine Llouc »@fr | « 2004-01-14 »^^<http://www.w3.org/2001/XMLSchema#date> | « Paris (France) : Espace Paris-Plaine – 14-01-2004 »@fr | <http://data.bnf.fr/ark:/12148/cb39501667n#about> |
Q34.5 Lister les œuvres originales dont le titre contient le mot « Hobbit » : Lien
La requête suivante se montre d’exécution relativement lente (7 secondes). La clause FILTER est appliquée à l’ensemble des titres de la base pour rechercher le motif « Hobbit » dans les valeurs de la propriété « dcterms:title ». 9 résultats sont trouvés, parmi lesquels des oeuvres dont le sujet est « The Hobbit », les films de Peter Jackson, un jeu vidéo, une revue sur le thème des jeux de rôles « Le Hobbit fataliste ».
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX rdagroup1elements: <http://rdvocab.info/Elements/>
SELECT *
WHERE {
?workUri a frbr-rda:Work.
?workUri dcterms:title ?titre.
OPTIONAL {?workUri dcterms:creator/foaf:name ?auteur.}
OPTIONAL {?workUri dcterms:subject/skos:prefLabel ?sujet.}
OPTIONAL {?workUri rdagroup1elements:dateOfWork/rdfs:label ?date.}
FILTER(CONTAINS(?titre, "Hobbit")).
}
LIMIT 10
workUri | titre | auteur | sujet | date | |
1 | <http://data.bnf.fr/temp-work/c532b0f929e67cebb490913e98061c52/#about> | « La quête du sens dans « Bilbo le Hobbit » de J. R. R. Tolkien »@fr | Alain Tesnière | « The Hobbit »@en | 2007 |
2 | <http://data.bnf.fr/temp-work/676aa080be8bf2812d4f48f0375aeb3a/#about> | « Promenades au pays des Hobbits, itinéraires à travers la Comté de J.R.R. Tolkien »@fr | Jean-Rodolphe Turlin | « The Hobbit »@en | 2012 |
3 | <http://data.bnf.fr/ark:/12148/cb12545196g#about> | « The Hobbit »@en | John Ronald Reuel Tolkien | 1937 | |
4 | <http://data.bnf.fr/ark:/12148/cb169690499#about> | « Lego the Hobbit (jeu vidéo) »@en | 2014 |
Conclusion
Data référence deux grandes catégories de notices bibliographiques : 1/ des notices du type Œuvre avec page HTML dans Data et dans le Catalogue 2/ des notices d’édition dans lesquelles les propriétés sont réparties en une partie Expression et une partie Manifestation, avec page HTML dans le Catalogue uniquement et notice RDF dans Data. Ces deux catégories peuvent être interrogées à l’aide de SPARQL, éventuellement de manière conjointe. Les information de niveau Item sont contenues dans les bases constitutives : le Catalogue pour les imprimés, Archives et manuscrits pour les documents d’archives, Gallica pour les documents numérisés.
The Hobbit, de J.R.R Tolkien se montre bien présent dans les bases de la BnF. Le roman donne lieu à de multiples adaptations et traductions, preuve d’un intérêt non démenti pour les contes et le fantastique. Parmi les autres documents sur Tolkien, à la BnF et ailleurs, les curieux pourront pousser l’aventure un peu plus loin. Tolkien Estate, la société en charge des droits d’auteur, propose un site trilingue dans lequel plusieurs dessins et peintures signées de Tolkien sont présentées. On note aussi à la BnF les pages web de l’exposition de 2019 : Tolkien, voyage en Terre du Milieu.
Pour les fans, le site Fantasy de la BnF mérite aussi d’être visité. Publié en 2020, il présente le genre littéraire. Les publications qui s’en réclament puisent leur inspiration des légendes arthuriennes, des mythes celtiques, des chansons de geste et sagas nordiques. Plusieurs articles ont pour sujet J.R.R. Tolkien, ses écrits et dessins. Il est même possible de jouer en ligne ! On y apprend le rôle influent dans l’oeuvre et son illustration joué par William Morris (1834-1896), un des artistes et éditeur à l’origine du mouvement graphique et philosophique du XIXème Arts and Crafts.
- BnF Exposition, Tolkien, voyage en Terre du Milieu, 2019-2020 : Lien
- BnF Exposition, Fiche iconographique, Tolkien. Voyage en Terre du Milieu, 2019-2020, PDF : Lien
- BnF Fantasy, Tolkien, un maître de la fantasy, Anne Besson, 2020 : Lien
- BnF Fantasy, William Morris, l’écrivain aux mille visages, Anne Besson, 2020 : Lien
- BnF Fantasy, Beowulf, le poème médiéval fondateur de l’épique, William Blanc, 2020 : Lien
- Le Hobbit, un récit fondateur, John D. Rateliff, Tolkien Estate : Lien
- Tolkien Studies: An Annual Scholarly Review, Le Hobbit (The Hobbit), Druss, 2020 : Lien
- Sur Tolkiendil : Tolkien de l’homme à l’auteur, 2019
- O’Brien Browne. A Hobbit on the Somme, 2007, Warfare History Network : Lien

Une série d’articles sur SPARQL et Data à la BnF
Tutoriels
- data.bnf.fr et SPARQL. Partie 1 : les bases constitutives, avec Bach : Lien
- data.bnf.fr et SPARQL. Partie 2 : des notices d’œuvres, des notices d’éditions, avec le Hobbit de Tolkien
- data.bnf.fr et SPARQL. Partie 3 : Les Auteurs avec Monsieur de Maupertuis : Lien
- La BnF et SPARQL. Partie 4 : l’entité Concept, les dictionnaires RAMEAU et l’entité Date : [TODO]