IdRef

Entrepôt OAI et Sitemap IdRef

L'entrepôt OAI-PMH et le protocole Sitemap sont conçus pour une optimisation des usages des données IdRef et une exploitation fine de ces données par les moteurs de recherche

Les informations utiles pour la récupération et la réutilisation des données d'autorités sont disponibles ci-dessous.

Entrepôt OAI-PMH IdRef

Les métadonnées des référentiels d’autorités exposés par IdRef sont à la disposition de la communauté via l'entrepôt OAI-PMH IdRef

9 sets de données sont proposés (soit 1 set par type d’autorité) : https://www.idref.fr/OAI/oai.jsp?verb=ListSets

  • Personne
  • Collectivité
  • Famille
  • Nom commun
  • Nom géographique
  • Auteur / Titre
  • Titre uniforme
  • Nom de marque
  • Bibliothèque

Bien que les données soient aussi disponibles au format Dublin Core, le format à privilégier reste MarcXML : https://www.idref.fr/OAI/oai.jsp?verb=ListMetadataFormats

Sitemap IdRef

Afin de rendre IdRef compréhensible par les robots d'indexation et permettre aux moteurs de recherche de pratiquer l'indexation automatique, IdRef est à la disposition des webmaster selon le protocole Sitemap (Plan de Site). 

Le Sitemap IdRef est constitué d'un fichier texte répertoriant l'ensemble des URL des notices d'autorité, enrichies d'informations complémentaires, du type :

  • date de dernière modification
  • fréquence de mise à jour
  • importance par rapport aux autres adresses du Sitemap

Ces informations optimisent les performances des moteurs de recherche qui peuvent ainsi explorer le site plus intelligemment.

Les URLs proposées sont construites selon 2 formats de données :

Au 11/10/2016, les notices "Personnes" sont accessibles par Sitemap.

Cette fonctionnalité pourra être élargie aux autres types de notices d'autorité (Collectivités, Famille, Titres, Noms géographiques...)

Aperçu du fonctionnement

Quand un robot d'indexation pointe sur IdRef, il trouve le code suivant :

                          <sitemap>

                          <loc>http://www.sudoc.fr/noticesbiblio/autorites/xml/sitemap_detail_0.txt</loc>

                         <lastmod>2014-11-25T18:23:17+00:00</lastmod>

                          </sitemap>

L'adresse incluse dans la balise <loc> lui donne accès à un lot d'URLs de notices d'autorités, signalées comme suit :

                           <url>

                            <loc>https://www.idref.fr/160173728.xml</loc>

                           <lastmod>2012-04-06</lastmod>

                           <changefreq>monthly</changefreq>

                           <priority>0.5</priority>

                           </url>

Le moteur de recherche trouve donc l'URL pérenne de la notice ainsi que les informations de mises à jour.

Remonter