IdRef

Entrepôt OAI et Sitemap IdRef

L'entrepôt OAI-PMH et le protocole Sitemap sont conçus pour une optimisation des usages des données IdRef et une exploitation fine d'e ces données par les moteurs de recherche

Les informations utiles pour la récupération et la réutilisation des données d'autorités  sont disponibles ci-dessous.

L'entrepôt OAI-PMH IdRef

L'entrepôt OAI-PMH IdRef met à la disposition de la communauté les métadonnées des référentiels d’autorités exposés par IdRef.

Neufs sets sont proposés, soit un set par type d’autorité : https://www.idref.fr/OAI/oai.jsp?verb=ListSets

  • Personne
  • Collectivité
  • Famille
  • Nom commun
  • Nom géographique
  • Auteur / Titre
  • Titre uniforme
  • Nom de marque
  • Bibliothèque

Bien que les données soient disponibles au format Dublin Core, le format à privilégier reste MarcXML : https://www.idref.fr/OAI/oai.jsp?verb=ListMetadataFormats

Le Sitemap IdRef

Afin de rendre IdRef compréhensible par les robots d'indexation et permettre aux moteurs de recherche de pratiquer l'indexation automatique, IdRef est à la disposition des webmaster selon le protocole Sitemap (Plan de Site). 

Le Sitemap IdRef est constitué d'un fichier texte répertoriant l'ensemble des URL des notices d'autorité, enrichies d'informations complémentaires, du type :

  • date de dernière modification
  • fréquence de mise à jour
  • importance par rapport aux autres adresses du Sitemap

Ces informations optimisent les performances des moteurs de recherche qui peuvent ainsi explorer le site plus intelligemment.

Les URL proposées sont construites selon 2 formats de données :

Au 11/10/2016, les notices "Personnes" sont accessibles par Sitemap.

Cette fonctionnalité pourra être élargie aux autres types de notices d'autorité (Collectivités, Famille, Titres, Noms géographiques...)

Aperçu du fonctionnement

Quand un robot d'indexation pointe sur IdRef, il trouve le code suivant :

                          <sitemap>

                          <loc>http://www.sudoc.fr/noticesbiblio/autorites/xml/sitemap_detail_0.txt</loc>

                         <lastmod>2014-11-25T18:23:17+00:00</lastmod>

                          </sitemap>

L'adresse incluse dans la balise <loc> lui donne accès à un lot d'URL de notices d'autorités, signalées comme suit :

                           <url>

                            <loc>https://www.idref.fr/160173728.xml</loc>

                           <lastmod>2012-04-06</lastmod>

                           <changefreq>monthly</changefreq>

                           <priority>0.5</priority>

                           </url>

Le moteur de recherche trouve donc l'URL pérenne de la notice ainsi que les informations de mises à jour.

Remonter