Métadonnées pour éditer une correspondance, vers l’ontologie Lettre

[en cours d’élaboration…] Deux possibilités existent pour éditer un corpus de correspondance. Avec l’édition papier, tout est classé, analysé et ne bougera plus jusqu’à la prochaine – et hypothétique – édition. L’édition numérique rend possible l’ajout de nouveaux documents mais reste pauvrement prise en considération en France pour évaluer les carrières. Le format électronique est à juste titre considéré comme fragile. Pour Richard Walter et les membres du Consortium Cahier, un corpus numérique de correspondance ne devrait sans doute jamais être considéré comme complet et définitif. L’incertitude est présente et des documents fantômes ou insoupçonnés peuvent réapparaitre. Des lettres absentes du corpus peuvent avoir existé, et soit guider des explorations du Sherlock Holmes qui dort chez l’historien, soit ressurgir au hasard des recherches faites par d’autres personnes.

Ceci étant précisé, il convient de définir le niveau de traitement que vous souhaitez apporter à votre corpus de correspondances. Celui-ci peut aller de la plus élémentaire transcription sous traitement de texte ou LaTex, au plus exigeant format TEI. Ces saisies peuvent être complétés d’un apparat critique et d’une publication papier. Parce que les lettres sont le signe de relations humaines multiples, des corpus d’une même époque s’avèrent fréquemment interconnectés. Le respect de quelques normes est susceptible de présenter des avantages. Des échanges et des interrogations croisées deviennent possibles.

Parmi les normes actuellement peu nombreuses, le format de la TEI (Text Encoding Initiative) CMIF (Correspondance Metadata Interchange Format) dédié à la description et à la transcription des lettres émerge depuis 2015. Des formats de dates tels que ISO 8601 ou bien EDTF méritent d’être cités. Un premier moteur de recherche correspSearch donne accès à plusieurs dizaines de milliers de lettres en langue allemande.

Une première partie de ce billet décrit ce format CMIF et offre des liens vers des ressources. Une deuxième partie propose des exemples de notices annotées en TEI CMIF. Schema.org créé par Bing, Google et Yahoo spécifie les classes Message, EmailMessage, Manuscript. Des propriétés permettent l’indexation de préférence en JSON-LD des items du type message physique ou bien électronique. Une théorie des ontologies susceptibles de décrire les messages et correspondances quelque soit leur nature est finalement ébauchée en dernière partie. Basée sur le web de données de Tim Berners-Lee et sur le schéma de métadonnées Dublin Core, elle a pour ambition de permettre indépendamment de CMIF la description de toute lettre ou de tout message. Des relations de ce format avec CMIF sont établies.

1. Spécifications TEI CMIF <correspDesc> et bibliographie

  • Spécifications en-tête : 2 The TEI Header > 2.4 The Profile Description > 2.4.6 Correspondence Description <CorrespDesc> : Lien
  • Spécifications corps du texte : 4 Default Text Structure > 4.2.2 Openers and Closers, salutations : Lien
  • Site TEI : TEI Correspondence SIG GitHub, Special Interest Group Correspondence of the Text Encoding Initiative (TEI); Peter Stadler, Marcel Illetschko, and Sabine Seifert; CMIF, encoding-correspondence, LOD, correspDesc
  • Text Encoding Initiative (TEI) Correspondence Special Interest Group (SIG) : Lien
  • TEI Correspondence SIG Wiki : Lien
  • TEI-CORRESP-SIG@LISTSERV.BROWN.EDU : Lien
  • Zotero Groups : Encoding Correspondance, Stefan Dumont : Lien
  • L’édition numérique de correspondances; Guide méthodologique; Consortium Cahier, Huma-Num, Richard Walter et al., 2018 : Lien
  • Towards a Model for Encoding Correspondence in the TEI: Developing and Implementing <correspDesc>, 2016, Peter Stadler, Marcel Illetschko and Sabine Seifert : Lien
  • Perspectives of the further development of the Correspondence Metadata Interchange Format (CMIF), 2015, Stefan Dumont : Lien
  • correspSearch – Connecting Scholarly Editions of Letters, 2015, Stefan Dumont : Lien
  • Moteur correspSearch (Stefan Dumont), plus de 50000 lettres publiées par 46 institutions académiques allemandes : Lien

2. Exemples

2.1 En-tête TEI (correspDesc), avec 2 actions (correspAction : sent, received), un contexte (correspContext : prev), une note (note : mentionned), (note : previous, next)

<correspDesc ref="">
 <correspAction type="sent">
  <persName>Adelbert von Chamisso</persName>
  <placeName>Vertus</placeName>
  <date when="1807-01-29"/>
 </correspAction>
 <correspAction type="received">
  <persName>Louis de La Foye</persName>
  <placeName>Caen</placeName>
  <date notBefore="1807-01-29" notAfter="1808">unknown</date>
 </correspAction>
 <correspContext>
  <ref type="prev" target="#CLF0102">
   Previous letter of 
   <persName>Chamisso</persName> to 
   <persName>de La Foye</persName>: 
   <date when="1807-01-16">16 January 1807</date>
  </ref>
 </correspContext>
 <note type="mentioned">
    <persName ref="http://viaf.org/viaf/24602065">Johann Wolfgang von  Goethe</persName>
    <placeName ref="http://www.geonames.org/2874225">Mainz</placeName>
    <bibl ref="http://viaf.org/viaf/186077286">Die Leiden des jungen Werthers</bibl>
    <name ref="urn:lsid:ipni.org:names:164558-3:1.1">Kalanchoe pinnata</name>
    <event from="1793-04-14" to="1793-07-23">Belagerung von Mainz</event>
 </note>
</correspDesc>

2.2 Corps de lettre en CMIF

<div type="letter" n="14">
 <head>Letter XIV: Miss Clarissa Harlowe to Miss Howe</head>
 <opener>
  <dateline>Thursday evening, March 2.</dateline>
 </opener>
 <p>On Hannah's depositing my long letter ...</p>
 <p>An interruption obliges me to conclude myself
   in some hurry, as well as fright, what I must ever be,</p>
 <closer>
  <salute>Yours more than my own,</salute>
  <signed>Clarissa Harlowe</signed>
 </closer>
</div>

2.3 Lettres complètes en CMIF

  • Carl Maria von Weber an Johann Gänsbacher in Hagensdorf; Darmstadt, Montag, 24. September 1810 : Site Weber, HTML, TEI
  • Anders Sandøe Ørsted Kurze Biographie an August Wilhelm von Schlegel : Site Schlegel , HTML, TEI

3. Schema.org : CreativeWork, Messages, Manuscript

Les classes Message et Manuscript héritent de certaines propriétés de CreativeWork et de Thing. Parmi les propriétés qui retiennent l’attention….

4. Vers une théorie de la correspondance, l’ontologie Lettre

Sortes de communications interpersonnelles, le message papier et le message électronique présentent des différences en matière de rapidité de transport et de possibilités de copie. De nombreuses similitudes existent également si bien qu’une même information peut être transmise par télégraphe, par messagerie, par SMS ou bien au moyen d’une lettre papier traditionnelle. Un même jeu de métadonnées peut décrire une bonne partie des caractéristiques de ces objets. L’ambition de cette théorie qui se concrétisera peut être un jour est de se montrer aussi générale que possible, tout en fournissant des exemples concrets. L’ontologie Lettre repend en grande partie et étend l’ontologie BIBO. Elle est construite pour modéliser tout corpus de correspondance papier ou électronique édité dans un cadre académique.

4.1 Classes de l’ontologie Lettre

Les corpus sont constitués d’items qui peuvent être assimilés à un document. Un item appartient à une seule classe. Des propriétés rendent possible la description des items ainsi catégorisés. Les classes de l’ontologie Lettre peuvent être distinguées :

  1. Agent (notice d’autorité)
    • Personne (auteur, destinataire, conférencier)
    • Groupe (famille, cercle, groupe de travail),
    • Organisme (association, académie, entreprise, administration)
  2. Document
    • Lettre
      • Lettre papier
        • Lettre papier numérisée
    • Message
      • Message papier (note, télégraphe, télétype, fax)
      • Message électronique
        • Courrier électronique (e-mail)
        • Message sur une liste de diffusion
      • Message téléphonique (SMS, MMS)
      • Graffiti (message textuel sur mur)
    • Transcription (word, latex, TEI)
      • Corps du message
    • Traduction
    • Annotation
    • Livre
      • Correspondance publiée
      • Biographie
    • Collection
      • Journal
      • MultiVolumeBook
      • Collection de lettres et correspondances
      • Liste de diffusion
  3. Événement
    • Colloque
    • Conférence
    • Atelier

4.2 Propriétés de Personne (auteur ou destinataire de la correspondance, auteur d’une transcription, traduction, article, livre, conférence, atelier)

  • identifiants (VIAF, IdRef)
  • nom, prénom (dc:title)
  • membre de (dc:memberOf) – lien vers 4.3, 4.4
  • date (dc:date)
  • sujet (dc:subject)

4.3 Propriétés de Groupe (groupe d’auteurs et groupe destinataire d’une lettre, transcripteurs, traducteurs et auteurs de l’édition)

  • identifiant (VIAF, IdRef)
  • nom du groupe (dc:title)
  • type (dc:type)
  • date (dc:date)
  • membre (foaf:member)
  • sujet (dc:subject)

4.4 Propriétés d’Organisme (dont l’auteur, le destinataire ou le groupe d’édition sont membres)

  • identifiant (VIAF, IdRef)
  • nom (dc:title)
  • type (dc:type)
  • date (dc:date)
  • sujet (dc:subject)

4.5 Propriétés de Lettre papier numérisée

  • Identifiant (dc:identifier)
  • Titre de la lettre, donné par l’éditeur de la correspondance (dc:title)
  • Type (dc:type)
    • Lettre, Télégramme, Carte postale,
    • Graffiti
    • Courrier électronique
    • SMS
    • Message sur un réseau social (facebook, twitter)
    • Message sur une liste de diffusion
  • Description : Description physique et intellectuelle du document, support et plis, manuscrit, tapuscrit, nombre de pièces attachées, sommaire (dc:description)
  • Auteur (dc:creator)
  • Langue (dc:language)
  • Date d’écriture (dc:date)
  • Destinataire (bibo:recipient, dcterms:audience)
  • Sujet (dc:subject)
  • Personnes citées
  • Nombre de pages
  • Incipit (lettre:incipit)
  • Lieu d’écriture
  • Date d’expédition
  • Lieu d’expédition
  • Date de réception
  • Lieu de réception
  • Destinataire secondaire, copie carbone
  • Destinataire caché, copie masquée
  • Lettre ou message précédent
  • Lettre ou message suivant
  • Lieu d’archive
  • Support (papier, papyrus, tablette d’argile, post-it, mur?, téléphone, électronique)

4.6 Propriétés de Transcription

La transcription d’une correspondance papier, papyrus, tablette d’argile peut être faite en respectant le format TEI et les balises décrites dans TEI CMIF letter. En-tête du document (header) :

  • Identifiant du document transcrit (dc:identifier)
  • Identifiant de la transcription, version
  • Transcripteur (dc:creator)
  • Bibliographie
  • Langue
  • Alphabet
  • Type de transcription (word, LaTex, TEI)

4.7 Corps du message

Voir TEI CMIF.

  • Identifiant (dc:identifier)
  • Date
  • Salutations
  • Corps du texte
  • Illustration
  • Fichier attaché (lien 4.7)
  • Sommaire

1 Star2 Stars3 Stars4 Stars5 Stars (Pas encore noté)
Loading...

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *