Optimisation du référencement des sites webs des archives, bibliothèques et librairies

L’optimisation du référencement des sites webs repose sur le signalement des pages publiées à l’aide de mots-clés (tags) appropriés. Il s’agit de fournir aux robots d’indexation des renseignements sur les contenus du site et des pages qui le constitue.

Une stratégie globale d’optimisation du référencement se montre vivement conseillée car plusieurs choses entrent en jeu. L’URL de la page à référencer doit lorsque cela est possible contenir des mots significatifs des contenus. Les balises <title> et <meta> de l’en-tête HTML de même que les contenus des titres <h1>, <h2> sont pris en considération. Un fichier sitemap.xml peut être également présent à la racine du site. Il indiquera aux moteurs les pages du site à indexer en priorité.

D’autres renseignements peuvent être contenus dans les balises <meta> de l’en-tête HTML. Des ontologies comme Twitter Cards, Open Graph de Facebook, Dublin Core, et d’autres encore se montrent adaptées pour cela. L’ontologie Schema mise de son côté sur l’ajout d’information significativees des contenus dans une balise <script> localisée dans le corps du texte et rédigées en JSON. Documentée sur schema.org, le vocabulaire permet une description aussi détaillée que souhaité d’une grande variété de pages.

Tout comme une organisation à activités commerciale, les archives, les bibliothèques, l’édition, les libraires en ligne et les archives ouvertes se montrent particulièrement concernées par le référencement. Plus de 200 critères sont pris en compte par Google pour positionner de manière avantageuse les résultats d’une requête.

Le moteur Google Scholar entend fournir un accès optimisé aux documents localisés dans les entrepôts institutionnels ouverts tels qu’arXiv, HAL en France, ou bien motorisés par DSpace. Le moteur préconise l’usage des formats Highwire Press (ex: citation_title), Eprints (ex: eprints.title), BE Press (ex: bepress_citation_title) ou bien PRISM tags (ex: prism.title) dans les balises <meta>. L’usage de Dublin Core (ex: DC.title) n’est souhaité qu’en dernier lieu car des champs comme le titre du journal, le volume ou le numéro se montrent indexés de manière ambigue à l’aide de ce vocabulaire.

Ce billet présente tout d’abord le vocabulaire Schema et fournit des exemples d’indexation en JSON-LD de pages susceptibles d’être présentes dans les sites des archives et des bibliothèques. Les solutions mises en place par différents acteurs de l’édition numérique et physique, du commerce des livres et des archives académiques ouvertes sont ensuite examinées. Alors que les moteurs de recherche dictent leurs règles, quelles méthodes se montrent gagnantes dans cette invisible du lecteur humain mais pourtant primordiale course à la visibilité ?

  1. Schema et les documents d’archives
  2. Une bibliothèque avec Schema
  3. Les archives ouvertes
  4. Stratégies de référencement de 5 acteurs académiques
    • 4.1 Les éditions Kimé
    • 4.2 La plateforme Cairn
    • 4.3 La plateforme OpenEdition
    • 4.4 La société Amazon
    • 4.5 Un article sur HAL
  5. Résultat des courses

1. Schema et les documents d’archives

Le vocabulaire Schema peut être encodé (sérialisé) de plusieurs manières dans les pages html d’un site web. La documentation de Schema fournit des exemples avec RDFa, Microdonnées et JSON-LD. Les différents types possibles d’objets (les classes) à décrire s’inscrivent dans une hiérarchie nommée tree / arbre. L’ontologie Schema est déclarée en JSON-LD dans la balise @context, le type (la classe) est spécifié en valeur de @type, de même que l’identifiant en valeur de @id.

Avec Schema, la première lettre du nom de la classe est écrite en majuscule selon la notation CamelCase. Une page décrivant une organisation à vocation achivistique sera du type ArchiveOrganization. Le nom de la propriété est écrit en minuscule – address par exemple. Une propriété peut être renseignée soit par une valeur soit par un objet de classe hiérarchiquement inférieure à l’objet courant.

1.1 Signalement d’une collection d’archives

Une organisation à activité archivistique se trouve décrite par la classe ArchiveOrganization. La propriété spécifique admise de ce type est archiveHeld. L’exemple repris de la documentation officielle montre comment le fonds “Ronnie Barker” localisé dans les collections “V&A and Performance” peut être signalé. On remarque que la nature du contenu d’archiveHeld est du type ArchiveComponent, deuxième classe spécifiquement dédié à la description archivistique.

<script type="application/ld+json">
{
  "@context": "http://schema.org",
  "@id": "https://archiveshub.jisc.ac.uk/search/locations/eae30daa-1bf9-33d9-bf1c-7aeb220d2e76",
  "@type": "ArchiveOrganization",
  "name": "V&A Theatre and Performance Collections",
  "url": "http://www.vam.ac.uk/content/articles/t/archives-theatre-performance/",
  "address": "Blythe House23 Blythe Road, London W14 0QX, England",
  "description": "The V&A's Theatre & Performance Archives are the national collection of performing arts.",
  "archiveHeld": {
      "@type": "ArchiveComponent",
      "@id": "GB 71 THM/407",
      "name": "Ronnie Barker Collection",
      "url" : "https://archiveshub.jisc.ac.uk/data/gb71-thm/407"
  }
}
</script>

1.2 Un fonds d’archives

Un fonds d’archives peut être signalé par son appartenance simultanée aux deux classes ArchiveComponent et Collection. Analogue à l’élément Dublin Core temporal coverage, la propriété schema temporalCoverage est renseignée avec la norme ISO 8601. Une barre oblique indique la durée. La propriété holdingArchive mentionne l’URL des archives qui gèrent le fonds, hasPart (repris de Dublin Core) indique un document élément du fonds :

<script type="application/ld+json">
{
  "@context": "http://schema.org",
  "@id": "https://archiveshub.jisc.ac.uk/data/gb71-thm/407",
  "@type": ["Collection","ArchiveComponent"],
  "identifier": "GB 71 THM/407/8",
  "name": "Ronnie Barker Collection",
  "about": ["Comedy","Ronnie Barker"],
  "creator": {
         "@type": "Person",
         "name": "Ronnie Barker",
         "sameAs": "http://viaf.org/viaf/2676198"
  },
  "description": "The collection consists of memorabilia material collected by Ronnie Barker to document his career.",
  "inLanguage": "EN",
  "temporalCoverage": "1929/2005",
  "itemLocation": "https://archiveshub.jisc.ac.uk/search/locations/eae30daa-1bf9-33d9-bf1c-7aeb220d2e76",
  "holdingArchive": "https://archiveshub.jisc.ac.uk/search/locations/eae30daa-1bf9-33d9-bf1c-7aeb220d2e76",
  "hasPart": "https://archiveshub.jisc.ac.uk/data/gb71-thm/407/thm/407/8"
}
</script>

1.3 Les documents d’archives

Un document d’archives peut être indexé avec ArchiveComponent. La classe secondaire MediaObject (AudioObject, ImageObject, VideoObject, etc.) ou bien des classes de CreativeWorks (3DModel, Course, Manuscript, Map, Message, etc.) – des catégories d’œuvres – rendent possible une description complémentaire :

<!-- A sound recording held in an archive -->
<script type="application/ld+json">
{
  "@context": "http://schema.org",
  "@id": "https://archiveshub.jisc.ac.uk/data/gb71-thm/407/thm/407/8/3",
  "@type": ["AudioObject","ArchiveComponent"],
  "identifier": "GB 71 THM/407/8/3",
  "name": "Sound Recording of Lines from My Grandafther's Forehead (Radio)",
  "about": "Comedy",
  "description": "Sound recording of the first radio broadcast of Lines from My Grandfather's Forehead by Ronnie Barker and others. Duration: max 90 mins.",
  "inLanguage": "EN",
  "dateCreated": "1971/1972",
  "duration": "PT90M",
  "playerType": "Audio Cassette",
  "itemLocation": "https://archiveshub.jisc.ac.uk/search/locations/eae30daa-1bf9-33d9-bf1c-7aeb220d2e76",
  "isPartOf": "https://archiveshub.jisc.ac.uk/data/gb71-thm/407/thm/407/8"
}
</script>

Signalement d’une lettre tapuscrite de Mitchell au critique littéraire Bricknel. La romancière est l’auteure en 1936 d’Autant en emporte le vent. La propriété hasPart de CreativeWork dont ArchiveComponent hérite permet la description des auteurs. On apprend qu’une version numérique est disponible en accès réservé aux Archives de Stanford (conditionsOfAccess), d’après schema.org : Lien

<!-- ArchiveComponent with restricted access -->
<script type="application/ld+json">
{
  "@context": "http://schema.org/",
  "@type": "ArchiveComponent",
  "url": "https://purl.stanford.edu/bp158wj7223",
  "name": "Margaret Mitchell letter to Herschel Bricknell, 1936 August 22",
  "conditionsOfAccess": "Online content is available for access via the Special Collections Reading Room.",
  "holdingArchive": {
    "@type": "ArchiveOrganization",
    "name": "Stanford Digital Repository",
    "url": "https://purl.stanford.edu/"
  },
  "hasPart": {
    "@type": "Message",
    "sender": {
      "@type": "Person",
      "name": "Mitchell, Margaret, 1900-1949"
    },
    "recipient": {
      "@type": "Person",
      "name": "Bricknell, Herschel"
    },
    "about": {
      "@type": "Book",
      "name": "Gone with the Wind"
    }
  }
}
</script>

Les métadonnées localisées aux archives de Stanford se trouvent en réalité exposées dans un fichier distinct en XML MODS et non en Schema. Ce format initié par la Bibliothèque du Congrès est dédié à l’échange d’informations entre archives et bibliothèques. On apprend ainsi “Typed letter signed (“Margaret”) to the book reviewer and critic Herschel Bricknell, about Gone with the Wind. Dictated to her husband John who has added his signed autograph proscript.” et encore “Stanford holds the digital version only“.

  • Fichier MODS au Congrès : Lien

2. Une bibliothèque avec Schema

Le cas de la bibliothèque est à priori fort distinct de celui des archives. Les documents sont produits en série et référencés de manière internationale à l’aide du dépôt légal et de code dédiés à l’identification. Prenons des exemples en français créés pour l’occasion et regardons si vous le voulez bien comment pourraient être signalés quelques objets des bibliothèques en vue d’une démarche de SEO. Une bibliothèque scientifique est ici décrite sommairement en français avec la classe Library :

<script type="application/ld+json">
{
  "@context": [
    "http://schema.org",
    {"@language": "fr"}
  ],
  "@type": "Library",
  "name": "Bibliothèque des Archives Henri Poincaré",
  "url": "https://poincare.univ-lorraine.fr/fr/la-bibliotheque",
  "parentOrganization": "Archives Henri Poincaré - PReST",
  "address": "91 avenue de la Libération - BP 454. F-54001 NANCY Cedex",
  "sameAs": [
    "https://viaf.org/viaf/157114050",
    "https://www.idref.fr/035115734"
  ],
  "description": "Bibliothèque de l'Université de Lorraine spécialisée en histoire des sciences et philosophie"
}
</script>

La classe Periodical permet le signalement de “Philosophia Scientiae“. Le nom de l’éditeur est ici détaillé :

<script type="application/ld+json">
{
  "@context": [
    "http://schema.org",
    {"@language": "fr"}
  ],
  "@type": "Periodical",
  "@id": "http://www.sudoc.fr/040549771",
  "name": "Philosophia Scientiae",
  "url": "https://journals.openedition.org/philosophiascientiae/",
  "issn": ["1544-4554", "0163-9374"],
  "editor": "Manuel Rebuschi",
  "publisher": {
         "@type": "Organization",
         "@id": "https://catalogue.bnf.fr/ark:/12148/cb13168282n",
         "name": "Kimé éditions",
         "location": "Paris, FR"
  },
  "description": "Revue périodique éditée par les AHP-PReST dont les thématiques portent sur la philosophie et l'histoire des sciences",
  "about": ["Philosophie", "Histoire des sciences"],
  "inLanguage": ["FR", "EN", "GE"]   
}
</script>

La propriété hasPart permet de signaler les thèmes des numéros 1 et 2 du volume 23. Analogue à la propriété Dublin Core du même nom, hasPart permet le signalement de listes d’objets dont le statut montre la même relation sémantique d’appartenance. L’exemple ici montré est adapté de la documentation originale.

<script type="application/ld+json">
{
  "@context": "http://schema.org",
  "@type": "Periodical",
  "issn": ["1544-4554", "0163-9374"],
  "name": "Philosophia Scientiae",
  "publisher": "Kimé éditions",
  "hasPart": {
    "@id": "vol-23",
    "@type": "PublicationVolume",
    "volumeNumber": "23",
    "hasPart": [
      {
        "@id": "23-1",
        "@type": "PublicationIssue",
        "issueNumber": "1",
        "name": "Y a-t-il encore de la place en bas ? Le paysage contemporain des nanosciences et des nanotechnologies",
        "datePublished": "2019-03-15"
      },
      {
        "@id": "23-2",
        "@type": "PublicationIssue",
        "issueNumber": "2",
        "name": "Expérimentation dans les sciences de la nature/ Expérimentation dans les sciences humaines et sociales",
        "datePublished": "2019-06-14"
      }
    ]
  }
}
</script>

Un article de Philosophia Scientiae signalé avec ScholarlyArticle, une des classes de la hiérarchie d’Article :

<script type="application/ld+json">
{
  "@context": "http://schema.org",
  "@type": "ScholarlyArticle",
  "datePublished": "2020",
  "headline": "Y a-t-il encore de la place en bas ? Le paysage contemporain des nanosciences et des nanotechnologies",
  "name": "Introduction. Nanotechnoscience: The End of the Beginning",
  "description": "Is there still room at the bottom? The question providing the theme for the present issue of Philosophia Scientiæ is, of course, adapted from Richard Feynman’s well-known speech at the 1959 meeting of the American Physical Society.",
  "sameAs": "https://doi.org/10.1080/01639374.2012.682254",
  "about": ["Nanotechnologie"],
  "pageStart": "5",
  "pageEnd": "17",
  "author": ["Bensaude-Vincent, Bernadette", "Simon, Jonathan"],
  "isPartOf": {
        "@type": "PublicationVolume",
        "@id": "vol-23",
        "volumeNumber": "23"
  },
  "publisher": {
        "@type": "Organization",
        "name": "Kimé éditions"
  }
}
</script>

Des manières différentes d’écrire la même chose sont possibles avec schema. Alf Eaton propose dans un exemple hautement détaillé. Article, revue, contributeurs, auteurs et affiliations sont décrits en un assemblage de graphes réunis par la balise @graph. Ce formalisme est retenu par l’éditeur Kimé comme nous allons le voir.

3. Les archives ouvertes

Cependant Google Scholar lui-même ne conseille ni schema ni Dublin Core car ces vocabulaires ne se montrent pas pleinement standardisés ou adaptés pour signaler des documents académiques. Les conseils aux webmestres sont de se servir des formats Highwire Press (ex: citation_title), Eprints (ex: eprints.title), BE Press (ex: bepress_citation_title) et PRISM tags (ex: prism.title).

  • Les codes Schema sont ici vérifié avec le validateur Google
  • Alf Eaton, 2015, JSON-LD representation of a scholarly article : Lien
  • P. Couchet, 2020, L’ontologie Schema, une brève description : Lien
  • Google Scholar, Inclusion Guidelines for Webmasters : Lien
  • Invisible institutional repositories: addressing the low indexing ratios of IRs in Google Scholar (Highwire Press) : Lien

Métadonnée Highwire Press

  • citation_title
  • citation_author
  • citation_author_institution
  • citation_author_orcid
  • citation_author_email
  • citation_authors
  • citation_journal_title
  • citation_journal_abbrev
  • citation_conference_title
  • citation_publisher
  • citation_issue
  • citation_volume
  • citation_doi
  • citation_id
  • citation_id_from_sass_path
  • citation_collection_id
  • citation_pmid
  • citation_mjid
  • citation_firstpage
  • citation_lastpage
  • citation_date
  • citation_year
  • citation_publication_date
  • citation_online_date
  • citation_price
  • citation_abstract_html_url
  • citation_abstract_pdf_url
  • citation_fulltext_html_url
  • citation_public_url
  • citation_pdf_url
  • citation_fulltext_world_readable
  • citation_isbn
  • citation_issn
  • citation_language
  • citation_keywords
  • citation_dissertation_institution
  • citation_technical_report_institution
  • citation_technical_report_number
  • citation_section
  • citation_reference

Exemple d’encodage optimisé pour Google Scholar

<meta name="citation_title" content="The testis isoform of the phosphorylase kinase catalytic subunit (PhK-T) plays a critical role in regulation of glycogen mobilization in developing lung">
<meta name="citation_author" content="Liu, Li">
<meta name="citation_author" content="Rannels, Stephen R.">
<meta name="citation_author" content="Falconieri, Mary">
<meta name="citation_author" content="Phillips, Karen S.">
<meta name="citation_author" content="Wolpert, Ellen B.">
<meta name="citation_author" content="Weaver, Timothy E.">
<meta name="citation_publication_date" content="1996/05/17">
<meta name="citation_journal_title" content="Journal of Biological Chemistry">
<meta name="citation_volume" content="271">
<meta name="citation_issue" content="20">
<meta name="citation_firstpage" content="11761">
<meta name="citation_lastpage" content="11766">
<meta name="citation_pdf_url" content="http://www.example.com/content/271/20/11761.full.pdf">

4. Stratégies de référencement de 5 acteurs académiques

Nous allons regarder dans cette partie comment quatre acteurs de l’édition et de la vente en lignes signalent le même numéro spécial de la revue scientifique Philosophia scientiae 23-1 sur les nanotechnologies. Cette revue créée aux Archives Henri Poincaré se trouve en effet diffusée sur une variété de plateformes. Le code source des différents acteurs est étudié et comparé.

4.1 Les éditions Kimé

Les éditeurs, les plateformes spécialisées dans la diffusion des contenus sur le web, de même que les libraires peuvent attendre de l’adoption de Schema une forte visibilité chez Google et Bing. l’éditeur parisien Kimé se sert effectivement de cette ontologie. Une suite de trois objets se trouve décrite à l’aide de la balise @graph. Le premier objet est le fil d’Ariane BreadcrumbList signalant la hiérarchie des pages du site. Le deuxième est le Cahier 23-1 du type Product dont les articles sont grossièrement détaillés à l’aide de description. Une offre commerciale à 24 euros conclut le signalement :

<script type="application/ld+json">
{
  "@context":"https://schema.org/",
  "@graph":
  [
    {
      "@context":"https://schema.org/",
      "@type":"BreadcrumbList",
      "itemListElement":
      [
        {
          "@type":"ListItem",
          "position":"1",
          "item":{
            "name":"Accueil",
            "@id":"https://www.editionskime.fr"
          }
        },
        {
          "@type":"ListItem",
          "position":"2",
          "item":{
            "name":"Publications",
            "@id":"https://www.editionskime.fr/publications/"
          }
        },
        {
          "@type":"ListItem",
          "position":"3",
          "item":{
            "name":"Revues",
            "@id":"https://www.editionskime.fr/rubrique/revues/"
          }
        },
        {
          "@type":"ListItem",
          "position":"4",
          "item":{
            "name":"Philosophia scientiae. Archives Henri Poincar\u00e9",
            "@id":"https://www.editionskime.fr/rubrique/revues/philosophia-scientiae-archives-henri-poincare/"
          }
        },
        {
          "@type":"ListItem",
          "position":"5",
          "item":{
            "name":"Vol. 23 Cahier 1"
          }
        }
      ]
    },
    {
      "@context":"https://schema.org/",
      "@type":"Product",
      "@id":"https://www.editionskime.fr/publications/vol-23-cahier-1/",
      "name":"Vol. 23 Cahier 1",
      "image":"https://www.editionskime.fr/wp-content/uploads/2019/03/site.jpg",
      "description":"Y a-t-il encore de la place en bas ? Bernadette BENSAUDE-VINCENT & Jonathan SIMON Introduction. Nanotechnoscience: The end of the beginning Thierno GU\u00c8YE Les nanotechnologies, par-del\u00e0 l\u2019\u00ab ind\u00e9finissabilt\u00e9 \u00bb Gry OFTEDAL The Role of \u201cMissile\u201d and \u201cTargeting\u201d Metaphors in Nanomedicine Louis UJ\u00c9DA Nanotechnology and Synthetic Biology: The Ambiguity of the Nano-Bio Convergence Sacha LOEVE Quoi de neuf chez les mol\u00e9cules-machines ? L\u2019incroyable aventure des nanovoitures Alfred NORDMANN NanoTechnoScience for Philosophers of Science Xavier GUCHET & C\u00e9cile LEGALLAIS Nanotechnologies et ing\u00e9nierie du foie bioartificiel. Une autre id\u00e9e de la \u00ab convergence technologique \u00bb Chris TOUMEY Lessons from the Land of Atoms and Molecules Christian JOACHIM Mettre cette mol\u00e9cule au travail ? Christophe VIEU & Bernadette BENSAUDE-VINCENT Interview de Christophe VIEU Varia Laura FONTANELLA Axioms as Definitions: Revisiting Poincar\u00e9 and Hilbert Juliano C. S. NEVES Nietzsche for Physicists",
     "sku":"23efd3cc3d36-1-2-1-1-1-1-1-1-2-1-1-1-1-1-1-1-1-2-1-1-1-1-1",
      "offers":
      [
        {
          "@type":"Offer",
          "price":"24.00",
          "priceCurrency":"EUR",
          "availability":"https://schema.org/InStock",
          "url":"https://www.editionskime.fr/publications/vol-23-cahier-1/",
          "seller":{
            "@type":"Organization",
            "name":"\u00c9ditions Kim\u00e9",
            "url":"https:\/\/www.editionskime.fr"
          }
        }
      ]
    }
  ]
}
</script>

4.2 La plateforme Cairn

La plateforme Cairn diffuse sur le web de manière payante les numéros récents et anciens de Philosophia Scientiae. Les vocabulaires WebTrends, OpenGraph de Facebook et Twitter Cards sont employés dans les balises <meta> de l’en-tête. La balise og:type vient préciser la classe article pour Facebook. La description est ensuite détaillée à l’aide de six autres champs. La balise twitter:card indique la classe summary : revue de sommaire pour Twitter. Les champs twitter:site, twitter:title, twitter:description et twitter:image apportent une description complémentaire.

<meta name="apple-mobile-web-app-title" content="Cairn.info"> 
<!-- HEADER metadata starts here --> 
<!-- WEBTRENDS metadata starts here --> 
<meta name="DCSext.pn_type" content="Revues"> 
<meta name="WT.pn_sku" content="SCIE"> 
<meta name="DCSext.ID_editeur" content="KIME"> 
<meta name="DCSext.editeur" content="Editions Kimé"> 
<meta name="DCSext.pn_grID" content="SCIE"> 
<meta name="DCSext.pn_gr" content="Philosophia Scientiae"> 
<meta name="DCSext.pn_nID" content="SCIE_231"> 
<meta name="DCSext.pn_ntit" content="Y a-t-il encore de la place en bas ?"> 
<meta name="DCSext.annee_tomaison" content="2019"> 
<meta name="DCSext.comm_rev" content="payante"> 
<meta name="DCSext.cleo" content="Affiliée au Cléo"> 
<meta name="DCSext.ct_disc1" content="philosophie"> 
<meta name="DCSext.ct_disc2" content=""> 
<meta name="DCSext.annee_mise_en_ligne" content="2019-03"> 
<meta name="DCSext.art_p1" content=""> 
<meta name="DCSext.doc_nb_pages" content="210"> 
<meta name="DCSext.discipline" content="philosophie"> 
<meta name="ORA.z_cairndomain" content="www.cairn.info"> 
<meta name="DCSext.protocole_http" content="http"> 
<meta name="dcsipa" content="1"> 
<meta name="DCSext.pg_type" content="Catalogue"> 
<meta name="WT.cg_n" content="numéro de revue"> 
<meta name="DCSext.cnx_institution" content="b2b not connected"> 
<meta name="DCSext.cnx_moncairn" content="b2c not connected"> 
<meta name="DCSext.cairn_guest" content="202003111583914342717"> 
<!-- WEBTRENDS metadata ends here --> 
<!-- OPENGRAPH metadata starts here --> 
<meta name="og:url" content="https://www.cairn.info/revue-philosophia-scientiae-2019-1.htm"> 
<meta name="og:locale" content="fr_FR"> 
<meta name="og:site_name" content="Cairn.info"> 
<meta name="fb:app_id" content="351493225269499"> 
<meta name="og:title" content="Philosophia Scientiæ 2019/1 (23-1)"> 
<meta name="og:type" content="article"> 
<meta name="og:image" content="https://www.cairn.info/vign_rev/SCIE/SCIE_231.jpg"> 
<meta name="og:description" content="Y a-t-il encore de la place en bas ?"> 
<!-- OPENGRAPH metadata ends here --> 
<!-- TWITTER CARDS metadata starts here --> 
<meta name="twitter:card" content="summary"> 
<meta name="twitter:site" content="@cairn.info"> 
<meta name="twitter:title" content="Philosophia Scientiæ 2019/1 (23-1)"> 
<meta name="twitter:description" content="Y a-t-il encore de la place en bas ?"> 
<meta name="twitter:image" content="https://www.cairn.info/vign_rev/SCIE/SCIE_231.jpg"> 
<!-- TWITTER CARDS metadata ends here --> 
<!-- GS metadata starts here --> 
<meta name="citation_issn" content="1281-2463"> 
<!-- GS metadata ends here --> 
<!-- HEADER metadata ends here -->

4.3 La plateforme OpenEdition

OpenEdition diffuse gratuitement sur le web Philosophia Scientiae à l’issue d’une barrière mobile de 3 ans. L’ontologie schema n’est pas utilisée mais les champs Dublin Core (DC) sont remplis avec rigueur. En particulier la classe DC.type renseigne la classe Text définie dans le vocabulaire contrôlé DCMI Type. Le DOI sert d’identifiant. Les formats des réseaux sociaux (og, twitter) complètent la description :

<meta name="DC.type" content="Text" />
<meta name="DC.format" content="text/html" />
<meta name="DC.identifier" scheme="URI" content="http://journals.openedition.org/philosophiascientiae/1693" />
<meta name="DC.identifier" scheme="ISSN" content="1775-4283" />
<meta name="DC.title" content="23-1 | 2019 Y a-t-il encore de la place en bas ?" />
<meta name="DC.publisher" content="Université Nancy 2" />
<meta name="DC.language" scheme="RFC3066" content="fr" />
<meta name="DC.identifier" scheme="DOI" content="10.4000/philosophiascientiae.1693" />
<meta name="citation_authors" content="no author" />
<meta name="twitter:card" content="summary" />
<meta name="twitter:site" content="@OpenEditionActu" />
<meta property="og:url" content="http://journals.openedition.org/philosophiascientiae/1693" />
<meta property="og:type" content="article" />
<meta property="og:title" content="23-1 | 2019 Y a-t-il encore de la place en bas ? " />
<meta property="og:description" content="Philosophia Scientiæ est une revue scientifique à comité de lecture qui publie des travaux en épistémologie, en histoire et en philosophie des sciences. Elle accueille notamment des études traitant..." />
<meta property="og:image" content="http://journals.openedition.org/philosophiascientiae/docannexe/file/1873/philosophia_23_1_couverture-small500.png" />

4.4 La société Amazon

Chaque référence d’Amazon est identifiée dans son URL par son numéro ASIN (Amazon Standard Identification Number). Dans le cas d’un livre ou d’un périodique, l’ASIN correspond à l’ISBN-10. Amazon n’utilise pas schema et renseigne simplement les balises “description”, “title” et “keywords” de l’en-tête telles que définies dans HTML. Amazon n’utilise aucune ontologie.

<meta name="title" content="Amazon.fr - Philosophia scientiae vol. 23/1: Y a-t-il encore de la place en bas ? Le paysage contemporain des nanosciences et des nanotechnologies - Collectif, Collectif, Simon, Jonathan, Bensaude-Vincent, Bernadette - Livres" />
<meta name="description" content="Noté /5: Achetez Philosophia scientiae vol. 23/1: Y a-t-il encore de la place en bas ? Le paysage contemporain des nanosciences et des nanotechnologies de Collectif, Collectif, Simon, Jonathan, Bensaude-Vincent, Bernadette: ISBN: 9782841749324 sur amazon.fr, des millions de livres livrés chez vous en 1 jour" />
<meta name="keywords" content="Collectif, Collectif, Simon, Jonathan, Bensaude-Vincent, Bernadette,Philosophia scientiae vol. 23/1: Y a-t-il encore de la place en bas ? Le paysage contemporain des nanosciences et des nanotechnologies,Kimé,2841749320,Sociologie des sciences,Sociologie des sciences,Sociologie des sciences" />

4.5 Un article sur HAL

Les archives ouvertes des universités et du CNRS HAL viennent en complément de la publication dans des revues à comité de lecture apporter une visibilité aux travaux de chercheurs de toutes disciplines. Les articles scientifiques peuvent y être déposés avant publication (preprint) ou après. L’archive fournit alors lorsque cela est possible un accès ouvert au texte intégral. HAL mixte dans ses métadonnées les vocabulaires Dublic Core et OpenGraph de Facebook.

<meta name="DC.language" content="fr" />
<meta name="DC.type" content="journal" />
<meta property="og:type" content="journal" />
<meta name="citation_title" content="Quoi de neuf chez les molécules-machines ? L’incroyable aventure des nanovoitures" />
<meta name="DC.title" content="Quoi de neuf chez les molécules-machines ? L’incroyable aventure des nanovoitures" />
<meta property="og:title" content="Quoi de neuf chez les molécules-machines ? L’incroyable aventure des nanovoitures" />
<meta name="DC.identifier" content="https://halshs.archives-ouvertes.fr/halshs-02013178" />
<meta name="DC.identifier" content="halshs-02013178" />
<meta property="og:url" content="https://halshs.archives-ouvertes.fr/halshs-02013178" />
<meta name="citation_author" content="Sacha Loeve" />
<meta name="citation_author_institution" content="Institut de recherches philosophiques de Lyon" />
<meta name="DC.creator" content="Sacha Loeve" />
<meta name="citation_abstract" content="Cet article s’intéresse à l’évolution récente d’une thématique particulière des nanosciences et nanotechnologies, les nanomachines moléculaires, au prisme d’un événement singulier dont la préparation a mobilisé les efforts des chercheurs avec une intensité particulière : la première course internationale de nanovoitures en avril 2017. Il retrace la genèse de ces objets, explique les motifs de l’organisation de la course, en raconte quelques épisodes et s’interroge sur la signification de cet événement : a-t-on affaire à un processus de &quot;gamification&quot; d’une technoscience en mal de légitimité socioéconomique et de pertinence scientifique ? Il montre qu’autre chose est en jeu, qui n’exclut pas la production de connaissances mais l’inscrit dans une nouvelle manière – technophanique – de réaliser des expériences." />
<meta name="DC.description" content="Cet article s’intéresse à l’évolution récente d’une thématique particulière des nanosciences et nanotechnologies, les nanomachines moléculaires, au prisme d’un événement singulier dont la préparation a mobilisé les efforts des chercheurs avec une intensité particulière : la première course internationale de nanovoitures en avril 2017. Il retrace la genèse de ces objets, explique les motifs de l’organisation de la course, en raconte quelques épisodes et s’interroge sur la signification de cet événement : a-t-on affaire à un processus de &quot;gamification&quot; d’une technoscience en mal de légitimité socioéconomique et de pertinence scientifique ? Il montre qu’autre chose est en jeu, qui n’exclut pas la production de connaissances mais l’inscrit dans une nouvelle manière – technophanique – de réaliser des expériences." />
<meta name="description" content="Cet article s’intéresse à l’évolution récente d’une thématique particulière des nanosciences et nanotechnologies, les nanomachines moléculaires, au prisme d’un événement singulier dont la préparation a mobilisé les efforts des chercheurs avec une intensité particulière : la première course internationale de nanovoitures en avril 2017. Il retrace la genèse de ces objets, explique les motifs de l’organisation de la course, en raconte quelques épisodes et s’interroge sur la signification de cet événement : a-t-on affaire à un processus de &quot;gamification&quot; d’une technoscience en mal de légitimité socioéconomique et de pertinence scientifique ? Il montre qu’autre chose est en jeu, qui n’exclut pas la production de connaissances mais l’inscrit dans une nouvelle manière – technophanique – de réaliser des expériences." />
<meta property="og:description" content="Cet article s’intéresse à l’évolution récente d’une thématique particulière des nanosciences et nanotechnologies, les nanomachines moléculaires, au prisme d’un événement singulier dont la préparation a mobilisé les efforts des chercheurs avec une intensité particulière : la première course internationale de nanovoitures en avril 2017. Il retrace la genèse de ces objets, explique les motifs de l’organisation de la course, en raconte quelques épisodes et s’interroge sur la signification de cet événement : a-t-on affaire à un processus de &quot;gamification&quot; d’une technoscience en mal de légitimité socioéconomique et de pertinence scientifique ? Il montre qu’autre chose est en jeu, qui n’exclut pas la production de connaissances mais l’inscrit dans une nouvelle manière – technophanique – de réaliser des expériences." />
<meta name="citation_online_date" content="2019/02/10" />
<meta name="citation_publication_date" content="2019/02/18" />
<meta name="DC.date" content="2019/02/18" />
<meta name="DC.issued" content="2019/02/18" />
<meta name="citation_firstpage" content="73-98" />
<meta name="citation_issue" content="23-1" />
<meta name="DC.citation.issue" content="23-1" />
<meta name="citation_journal_title" content="Philosophia Scientiae" />
<meta name="DC.relation.ispartof" content="Philosophia Scientiae" />
<meta name="citation_doi" content="10.4000/philosophiascientiae.1763" />

4. Résultat des courses

Il est maintenant possible d’observer le référencement obtenu pour le volume 23-1 de la revue Philosophia Scientiae. La requête posée sur plusieurs moteurs de recherche est simplement “Philosophia Scientiae 23-1“. On a les résultats suivants :

  • Google (92,3 %) : Lien; 1/ OpenEdition, 2/ Archives Henri Poincaré, 3/ Cairn, 4/ Amazon, 5/ Editions Kimé (schema)
  • Bing (3,7 %) : Lien; 1/ OpenEdition, 2/ Amazon, 3/ Culture Leclerc, 4/ Cairn, 5/ Archives Henri Poincaré, 6/ Librairie Eyrolles
  • Yahoo (1,4 %) : Lien; 1/ OpenEdition, 2/ Culture Leclerc, 3/ Cairn, 4/ Archives Henri Poincaré, 5/ Librairie Eyrolles
  • Ecosia (1,2 %) : Lien; 1/ OpenEdition, 2/ Cairn, 3/ Amazon, 4/ Culture Leclerc
  • Qwant (0,8 %) : Lien; 1/ OpenEdition, 2/ Cairn, 3/ Amazon, 4/ Culture Leclerc
  • DuckDuckGo (0,4 %) : Lien; 1/ OpenEdition, 2/ Cairn, 3/ BobLane

Entre parenthèses les parts de marché des moteurs. OpenEdition et Cairn arrivent régulièrement bien classés avec des stratégies de référencement basées sur Dublin Core, twitter et Facebook. Google donne une forte valeur aux liens entrants et sortants et prend également en compte schema. Des acteurs inattendus s’invitent dans les résultats comme par exemple Culture Leclerc bien classé avec certains moteurs comme Bing ou Yahoo dans le domaine du référencement d’un périodique académique.

Les cinq différentes versions du même article chez Google Scholar

Conclusion

Quelles actions entreprendre pour qu’un site soit correctement référencé ? Les contenus de l’élément <title> du site s’avère particulièrement importants de même que ceux des balises <meta description> et <meta keywords> comme le montre l’indexation partiquée chez Amazon. Les balises <meta author ou copyright> semblent plus rarement utilisées.

Les éléments Facebook, Twitter, BE Press et finalement Dublin Core représentent placées également dans l’en-tête HTML se montrent également utilisées par une variété d’acteurs. Le vocabulaire BE Press intéresse spécifiquement les publications des archives ouvertes pour lesquelles la visibilité sur Google Scholar se montre importante.

Formalisé en JSON LD dans le corps du texte, Schema apporte avec sa hiérarchie de classes une réflexion sur la possibilité d’exposer aux moteurs de fort nombreuses connaissances factuelles y compris celles des archives, des billets de blog et autres documents non académiques.

Liens supplémentaires

  • Descriptive Metadata for Web Archiving – OCLC. Recommendations of the OCLC Research Library Partnership Web Archiving Metadata Working Group, J. Dooley, K. Bowers, 2018, PDF : Lien
  • The State of Schema.org: What are the biggest challenges surrounding Schema markup?, R. Sentance, 2017 : Lien
  • Dublin Core Metadata Generator, plugin pour WordPress : Lien
  • 10 Best Schema Markup Plugins For WordPress, I. Rayhan, 2020 : Lien
  • Optimisation pour les moteurs de recherche, Wikipedia : Lien
  • Métadonnées de la page Wikipédia sur “Eudoxe de Cnide” à destination des robots d’indexation avec “Structured Data Linter” : Lien
1 Star2 Stars3 Stars4 Stars5 Stars (Pas encore noté)
Loading...

Laisser un commentaire