Dublin Core simple au LHSP-AHP, mapping MARC 21 et EAD

De AHP numérique

Tutoriels et présentations > Dublin Core simple au LHSP-AHP, mapping MARC 21 et EAD

Dublin Core simple (DC) alias Dublin Core non qualifié est un schéma de métadonnées largement utilisé dans le monde de la recherche, des bibliothèques, des archives et des musées pour décrire des documents numériques ou physiques de toutes sortes : texte, photo, image, son ou vidéo, etc. Proposé par le DCMI (Dublin Core Metadata Initiative) en 1995, le schéma est normalisé ISO 15836 depuis 2003. Il comprend 15 éléments (ou champs) qui peuvent tous être vides ou répétés autant de fois que nécessaire. Sa simplicité et son formalisme souple font de DC un format actuellement incontournable du web, adopté par les archives ouvertes, les bibliothèques et entrepôts institutionnels en accès libre, utilisé par des logiciels comme Omeka, DSpace ou Fedora, ou des moteurs de recherche spécialisés comme Isidore (CNRS) ou Europeana (CEE).

Le tableau suivant décrit Dublin Core et son usage au Laboratoire d'Histoire des Sciences - Archives Henri Poincaré (LHSP-AHP). Il établit aussi un mapping (règle de conversion, passerelle, crosswalk) entre DC, et deux formats d'usage professionnel, MARC 21 et EAD (Encoded Archival Description) largement employés dans les bibliothèques, les archives et les musées. Quelques liens complètent ces informations, en particulier des liens vers la documentation officielle de DC et vers les documentations de MARC 21 et EAD.

Sommaire

Eléments, descriptions et mappings

Conventions :

  1. Nom anglais de l'élément entre parenthèse
  2. Le point-virgule présent dans les exemples marque la répétition d'un même élément.
  3. MARC 21, "$" est utilisé pour spécifier le sous-champ uniquement.
  4. EAD s'exprime en XML
  5. Pour les noms de personnes ou d'organismes, on adopte de manière préférentielle au LHSP-AHP l'autorité IdRef (le référentiel des autorités du Sudoc), ou bien sinon VIAF (le Virtual International Authority File de l'OCLC). Ne pas retenir les autorités de data.bnf.fr ni de dbpedia (Wikipédia), en particulier les noms de personne, qui ne prennent pas la forme internationalement reconnue. Un lien peut cependant être introduit dans le champ "Relation"
Elément (1) Description Note Note LHSP-AHP Exemples (2) MARC 21 (3) EAD (4)
Titre (Title) Un nom donné à la ressource. Le titre est généralement le nom formel sous lequel la ressource est connue. Titre de préférence explicite et unique Problématique constitutionnelle du bicamérisme en Europe 245, 246, Some applications may wish to include 210, 222, 240, 242, 243, and 247. Repeat dc:title for each. <titleproper>,

<unittitle>

Sujet (Subject) Le sujet de la ressource. Généralement, le sujet est exprimé sous forme de mots-clés ou par des indices de classification décrivant un thème de la ressource. La pratique recommandée est d’utiliser un vocabulaire contrôlé ou une classification de référence. Vedette matière, extrait de préférence de IdRef, ou prenant la forme internationale d'un nom de personne ou d'organisme (5). Bicamérisme; Europe; Poincaré, Henri (1854-1912); Bureau des longitudes (France) 050,

060, 080, 082, 600, 610, 611, 630, 650, 653

<subject>,

<controlaccess>

Description (Description) Une présentation du contenu de la ressource. La description peut prendre la forme d’un résumé, d’une table des matières, d’un exposé du contenu en texte libre. Description, résumé, table des matières Le bicamérisme ne peut pas uniquement se définir comme étant un parlement composé de deux chambres. Cette organisation institutionnelle... 500- 599, except 506, 530, 540, 546 <abstract>, <scopecontent>, <bioghist>
Créateur (Creator) Une entité principalement responsable de la création de la ressource. Ce peut être une personne, une organisation ou un service. Généralement, cette entité est désignée par son nom. Les noms de personnes devraient être listés avec le nom de famille en premier et le prénom ensuite. Elle est du type : "Nom, Prénom" suivi éventuellement des dates de naissance et de décès, ainsi que de la fonction. (5) Mossler, Geneviève; Pierré-Caps, Stéphane. Directeur de thèse.; Bureau des longitudes (France), Dickens, Charles (1812-1870). Auteur.; Creator element not used. (contributor instead ?) <author>,

<origination>, <persname>, <corpname>, <famname>, <name>

Source (Source) Une référence à une ressource à partir de laquelle la ressource décrite a été dérivée. La pratique recommandée est d’identifier la ressource mentionnée dans l’élément Source par une dénomination formelle (URI, DOI, PURL) ou un identifiant normalisé (ISBN, ISSN, etc.). idem Note, les protocoles (http, DOI, hdl) et identifiants normalisés sont suivis de ":" sans espace DOI:10.4000/cybergeo.22699; http://cybergeo.revues.org/​22699; ISBN:0385424728; Image dans la page 54 de l'édition de 1922 de Roméo et Juliette 534$t, 786$o$t N/A
Éditeur (Publisher) L'entité responsable de la diffusion de la ressource. Ce peut être une personne, une organisation ou un service. Généralement, cette entité est désignée par son nom. Comme à la BNF, le lieu d'édition peut être précisé entre parenthèses. (5) University of South Where; Funky Websites, Inc.; Carmen Miranda; Crépin-Leblond (Moulins) 260$a$b <publisher>, <repository>
Date (Date) Une date ou une période associée avec un événement dans le cycle de vie de la ressource. La date est généralement associée à la création ou à la mise à disposition de la ressource selon le format AAAA-MM-JJ. Date d'édition d'un document, date d'un évènement. 1998;1998-06;1998-06-25 008/07-10, 260$c$g <publicationstmt>, <date>, <unitdate>
Contributeur (Contributor) Une entité qui a contribué à la création du contenu de la ressource. Ce peut être une personne, une organisation ou un service. Généralement, cette entité est désignée par son nom. Ne pas répéter des éléments qui seraient déjà présents dans Creator. (5) Shakespeare, William; Wen Lee; Téléscope Hubble; Internal Revenue Service. Customer Complaints Unit; Browne, Hablot Knight (1815-1882). Illustrateur; Université de Lorraine 100, 110, 111, 700, 710, 711, 720 idem Creator ? Pas de répétition normalement...
Droits (Rights) Information sur les droits détenus dans et sur la ressource. Ce peut être une mention de copyright ou une référence au service fournissant ces informations. L’absence de cet élément ne présume pas que la ressource est libre de droits. Nom ou URL de la licence Accès réservé aux membres; http://cs-tr.cs.cornell.edu/Dienst/Repository/2.0/Terms; domaine public; http://www.etalab.gouv.fr/pages/licence-ouverte-open-licence-5899923.html 506, 540 <accessrestrict>,

<userestrict>

Relation (Relation) Une ressource dérivée. La pratique recommandée est d’identifier la ressource apparentée par une dénomination formelle (URI) ou un identifiant normalisé. Relations décrites : "est une partie de", "est une version de", "a le format", "est référencé par" ou bien "référence", etc... Dans la pratique figurent dans ce champ des données fortement liées, présentes sur le web, provenant du Sudoc, de Wikipédia, de IdRef, YouTube, etc. ISBN:0385424728; DOI:10.4000/cybergeo.22699; http://cybergeo.revues.org/​22699; Fleur de vertu / François de Rohan, archevêque de Lyon, manuscrit réalisé pour l’auteur en 1530; La pièce de Bernard Shaw « Pygmalion »; http://www.sudoc.fr/147774683; 530, 760-787$o$t <otherfindaid>, <relatedmaterial>
Format (Format) Le format de fichier, le type de support ou les dimensions de la ressource. Le format inclut généralement le type de médium ou les dimensions de la ressource (taille, durée). On peut préciser le logiciel ou le matériel nécessaire pour utiliser la ressource. La pratique recommandée est d’utiliser un vocabulaire. http://www.iana.org/assignments/media-types/media-types.xhtml L'élément Format sert aussi, dans le cas d'une ressource numérisée, à décrire la ressource originelle (nombre de pages, dimensions, etc.). Le type IANA reste en anglais. Décrire au plus précis, par ex :image/jpeg. text; audio; video; image; application; application/pdf; image/jpeg; image/png; 1 vol. (95 p.) 340, 856$q <physdesc>, <extent>
Langue (Language) Langue de la ressource. La pratique recommandée est d’utiliser un code de langue (norme ISO 639). norme ISO 639, sur 2 (ISO 639) ou 3 caractères (ISO 639-2b) selon les entrepôts Langue codée sur 2 lettres (ISO 639-1) fr; en; de; en-US; Principalement en anglais, avec quelques passages en français. 008/35-37, 041$a$b$d$e$f$g$h$j, 546 <language>, <archdesc> with LANGMATERIAL attribute
Type (Type) La nature ou le genre de la ressource. Généralement, le type correspond à des catégories, des fonctions, des genres ou des niveaux d’agrégation de contenu. La pratique recommandée est d’utiliser le vocabulaire contrôlé DCMIType (Text, Image, Collection, Dataset, Event, Interactive Resource, Moving Image, Physical Object, Service, Software, Sound, Still Image). Noter que les facsimiles ou images des textes sont toujours du genre Text. Les types sont notés en français. Utilisation d'un Dictionnaire des types composé d'une traduction du DCMIType auquel sont ajoutés les types de documents de Zotero. Texte; Lettre; Audio; Émission de radio; Baladodiffusion (Podcast) Leader06, Leader07, 655, See Appendix 2 for Leader-Type rules. <archdesc> with LEVEL attribute
Identifiant (Identifier) Une référence non ambiguë à la ressource dans un contexte donné. La pratique recommandée est d’identifier la ressource par une dénomination formelle (URI, DOI, PURL, handle) ou un identifiant normalisé (ISBN, ISSN, etc.). Idem Relation ISBN:0385424728; DOI:10.4000/cybergeo.22699; http://cybergeo.revues.org/​22699 020$a, 022$a, 024$a, 856$u <eadid>, <unitid> with COUNTRYCODE and REPOSITORYCODE attributes
Couverture (Coverage) La portée spatiale ou temporelle de la ressource, ou la juridiction pour laquelle la ressource est pertinente. Généralement cet élément correspond à une localisation dans l’espace (nom de lieu ou coordonnées géographiques), une période de temps (nom de période, date ou intervalle de dates), une juridiction (nom d’une entité administrative). Trouver dans IdRef pour les lieux (5) 1995-1996; Boston, MA; 17ème siècle; Le nord de l'état de New York; Nancy (Meurthe-et-Moselle) 651, 662, 751, 752 <geogname> (spatial), <unitdate> (temporal)

Les éléments Dublin Core, tableau horizontal

Pour servir de modèle dans un tableau EXEL par exemple.

Titre Sujet Description Créateur Source Éditeur Date Contributeur Droits Relation Format Langue Type Identifiant Couverture
Un nom donné à la ressource. Le sujet de la ressource. Une présentation du contenu de la ressource. Une entité principalement responsable de la création de la ressource. Une référence à une ressource à partir de laquelle la ressource décrite a été dérivée. L'entité responsable de la diffusion de la ressource. Une date ou une période associée avec un événement dans le cycle de vie de la ressource. Une entité qui a contribué à la création du contenu de la ressource. Information sur les droits détenus dans et sur la ressource. Une ressource dérivée. Le format de fichier, le type de support ou les dimensions de la ressource. Langue de la ressource. La nature ou le genre de la ressource. Une référence non ambiguë à la ressource dans un contexte donné. La portée spatiale ou temporelle de la ressource, ou la juridiction pour laquelle la ressource est pertinente.

Quelques liens

Dublin Core

MARC 21

EAD

Contact

pierre.couchet(at)univ-lorraine.fr, ce texte est disponible sous licence CreativeCommons-BY-NC-SA